Introdução
Com a evolução tecnológica, vem ocorrendo um aumento muito rápido na quantidade de imagens em formato digital geradas na área de radiologia. Todos os dias são gerados alguns gigabytes de imagens, o que representa um grande volume de informação. Porém, não se pode fazer uso desta informação, a menos que ela esteja organizada de forma a possibilitar a busca e recuperação dos dados apropriadamente. Os primeiros sistemas de recuperação de imagens datam do final da década de 70, sendo baseados no uso de texto para descrição do conteúdo pictórico.1 Nestes sistemas o usuário faz inicialmente a descrição textual das imagens e então utiliza um sistema de gerenciamento de base de dados (Database Managment System – DBMS) para fazer a indexação e recuperação das imagens a partir de palavras chaves. Porém, existem três grandes dificuldades neste tipo de sistema, a saber, o grande volume de trabalho manual necessário para fazer as anotações, as diferenças na interpretação do conteúdo das imagens e a inconsistência na definição das palavras-chaves entre diferentes usuários.1,2 Com o crescimento do volume da base de dados, o sistema baseado em palavras chaves tende a se tornar inviável.
Para superar as dificuldades apresentadas pelos sistemas baseados em anotações textuais, um mecanismo alternativo, chamado recuperação de imagem baseada em conteúdo (contente-based image retrieval – CBIR), foi proposto no início da década de 90.1 Em paralelo com o uso de palavras chaves manualmente inseridas, os sistemas CBIR utilizam o conteúdo visual das imagens, como atributos de cores, textura e forma, como índice para o arquivamento das imagens. Isto diminuiu bastante as limitações dos sistemas baseados somente em palavras-chaves, uma vez que o processo de extração de atributos pode ser feito de forma automatizada e a representação da imagem baseada em suas próprias características é sempre consistente. Neste caso, a recuperação é feita através do casamento (matching) dos atributos de uma imagem de busca (query image) com os das imagens existentes na base de dados. Embora proveniente da área de visão computacional, o processo de extração de atributos nos sistemas CBIR possui por objetivo final a indexação e recuperação de imagens para inspeção visual humana. Porém, os humanos geralmente não pensam em termos de atributos de baixo-nível, ou seja, as buscas são tipicamente definidas de forma semântica (por exemplo, me mostre uma imagem de por do sol) e não em baixo-nível (por exemplo, me mostre uma imagem com predominância de vermelho e laranja).2 Como resultado deste processo, existe um "gap" semântico entre os atributos automaticamente extraídos e os conceitos de alto nível que direcionam as buscas. Este "gap" é tanto maior quanto mais genéricos forem os atributos utilizados na caracterização das imagens. Pesquisas recentes no campo da percepção humana do conteúdo de imagens têm ressaltado a importância do uso da descrição semântica para uma recuperação eficiente.3
Basicamente existem duas formas de se abordar o problema do "gap" semântico. Uma é tentar decodificar a percepção humana através do uso de mecanismos de avaliação de respostas relevantes, tentando-se definir uma correlação entre a similaridade de imagens baseada nos atributos computacionais e a similaridade de imagens baseada na inspeção visual. Este processo terá maior chance de sucesso se forem utilizados grandes volumes de dados, previamente categorizados dentro de domínios específicos de conhecimento.1,3 A segunda forma de abordar o problema é tentar agrupar as imagens em categorias significativas. É reconhecido que uma categorização adequada das imagens melhora bastante o desempenho dos sistemas CBIR, através da filtragem de classes irrelevantes.2 Neste caso, o problema principal é que somente atributos de baixo-nível podem ser realmente extraídos das imagens e o desafio, então, consiste em agrupar as imagens segundo um significado semântico a partir dos atributos visuais de baixo nível. Uma forma de abordar este problema é utilizar um sistema de indexação hierárquica,2 definindo-se para cada nível um domínio de conhecimento mais específico e caminhando-se do uso de atributos mais genéricos para atributos mais domínio-dependentes, reduzindo-se assim o "gap" semântico.
As imagens mamográficas representam um domínio de conhecimento de grande interesse para aplicação de métodos de recuperação de imagem baseada em conteúdo devido ao potencial de auxílio ao diagnóstico do câncer de mama,4 bem como pela especificidade dos conhecimentos envolvidos e pela descrição semântica bem estabelecida através de padrões. Neste contexto, este artigo apresenta uma pesquisa voltada para a utilização de atributos de textura para superar o "gap" semântico existente entre a percepção visual humana e características extraídas automaticamente de mamogramas digitalizados, buscando sua correlação com o Breast Imaging Reporting and Data Systems (BI-RADS) do Colégio Americano de Radiologia (ACR).
Materiais e métodos
Foram selecionados, junto ao serviço de Radiodiagnóstico do Hospital das Clinicas da Faculdade de Medicina de Ribeirão Preto (HCFMRP) da Universidade de São Paulo (USP) – Brasil, 136 casos clínicos consecutivos (de 05/03/98 até 23/03/98) contendo lesões mamográficas associadas, dos quais 13 foram aleatoriamente separados para teste do sistema. Cada caso é composto por uma vista Crânio Caudal (CC) e uma vista Médio Lateral Oblíqua (MLO) das mamas direita e esquerda. Os filmes foram digitalizados com um digitalizador Vidar modelo DiagnosticPro, com resolução espacial de 300 dpi (0.084 mm pixel) e 12 bits de quantização (4096 níveis de cinza). Um médico radiologista do HCFMRP classificou todos os casos segundo o padrão BIRADS e também identificou nos filmes originais as regiões de interesse (Regions of Interest - ROIs) contendo as lesões. Foram utilizados 14 atributos de textura para caracterização e indexação das ROIs, cujos valores normalizados foram armazenados e relacionados com o exame cadastrado da paciente, suas imagens e laudos.4 A Tabela 1 apresenta um exemplo de quantificação dos atributos de textura para um conjunto de imagens sintetizadas.5
As consultas são realizadas com a entrada de uma ROI no sistema, o qual calcula e normaliza os atributos de textura e realiza a busca no banco de dados por imagens com atributos semelhantes, dentro de um grau de aproximação previamente estabelecido. As imagens recuperadas são então apresentadas ao médico que pode compará-las, verificar os diagnósticos dos casos recuperados e a classificação no BI-RADS. O sistema foi avaliado a partir da quantificação da resposta subjetiva de um radiologista, o qual classificou o grau de similaridade entre as imagens com notas de 1 a 5 (Tabela 2).
Para cada consulta foi calculado o valor de Precisão (Equação 1), sendo consideradas relevantes as imagens cuja similaridade com a imagem de busca recebeu nota maior ou igual a 3. Foi verificada também a correlação com as categorias no BI-RADS, sendo consideradas similares imagens recuperadas da mesma categoria ou uma acima ou uma abaixo em relação à categoria da imagem de busca.
Resultados
Os resultados obtidos (Tabela 3) forneceram valores de Precisão entre 22% e 100% para a comparação entre as ROIs e Precisão entre 25% e 100% para a correlação com a classificação no BI-RADS. A Figura 1 apresenta as imagens e os valores de similaridade de uma consulta (caso teste 40).
Conclusão
Sob um ponto de vista metodológico, a pesquisa desenvolvida associa técnicas apropriadas para análise do problema, sendo uma contribuição importante no sentido de superação do "gap" semântico na recuperação de imagens mamográficas.
Os resultados mostraram uma grande variação no valor obtido para a Precisão em cada uma das consultas, incluindo desde valores muito baixos até valores bastante altos. Uma variação semelhante também pôde se notada no número total de imagens recuperadas. Acredita-se que a grande variação tanto nos valores de Precisão, como também no número total de imagens recuperadas por consulta, seja um indicativo de que as imagens utilizadas não representaram, numericamente, de forma adequada todos os tipos de lesões existentes no banco. Mas, um aspecto fundamental que deve ser destacado, é que todas as consultas realizadas resultaram em pelo menos uma imagem considerada relevante.
De modo geral os resultados obtidos com o nosso sistema CBIR indicam a potencialidade da utilização do esquema proposto para o auxílio aos radiologistas, particularmente devido à possibilidade de formulação de consultas baseadas na descrição gráfica da imagem. A recuperação de imagens baseada em suas próprias informações pictóricas propicia um potencial de auxílio maior ao diagnóstico, possibilitando não somente a recuperação de casos de pacientes com exames por imagem e diagnósticos semelhantes, mas também de casos de pacientes com imagens semelhantes e diagnósticos diferentes. Essa capacidade pode fornecer informações fundamentais para o ensino, pesquisa e melhoria nos processos de interpretação de imagens.