
Técnicas Reconocimiento de Formas Aplicadas al Diagnóstico de Cáncer Asistido por Ordenador
Rafael Llobet Azpitarte
Investigador del Instituto Tecnológico de Informática. Universidad Politécnica de Valencia
Juan Carlos Pérez Cortés
PhD. Director científico-técnico del Instituto Tecnológico de Informática.
Universidad Politécnica de Valencia
Roberto Paredes Palacios
PhD. Investigador del Instituto Tecnológico de Informática. Universidad Politécnica de Valencia.
Resumen
Uno de los campos en los que el procesado digital de imágenes está aportando una inestimable ayuda es el caso del análisis de imágenes médicas. Dado que la responsabilidad asociada a las tareas en este campo es muy alta, las aplicaciones que actualmente se diseñan siguen una línea de ayuda al profesional que desempeña estos trabajos, y no de sustitución del mismo. En este artículo se explican los fundamentos básicos del Reconocimiento de Formas, y cómo esta disciplina puede ser aplicada en el diseño de sistemas de ayuda al diagnóstico asistido por ordenador.
1. Introducción
Uno de los mayores problemas en la detección de lesiones en imágenes médicas viene dado por la subjetividad con que el experto humano analiza dichas imágenes. En muchos casos, la experiencia del profesional encargado de interpretar la imagen, es un factor determinante en el diagnóstico final. Normalmente se requiere una curva de aprendizaje larga para que estos profesionales alcancen unos niveles altos de fiabilidad. Sin embargo, aun en los casos en los que el profesional tiene un grado elevado de experiencia, en muchos tipos de imágenes la detección de lesiones y, en consecuencia, la diagnosis, resulta una tarea complicada. Las causas de esta dificultad en la diagnosis suelen deberse a:
- Escasa calidad de la imagen.
- Ocultación de objetos debido al paso de 3D a 2D.
- Lesiones difícilmente visibles al ojo humano debido a su reducido tamaño (microtexturas).
- Subjetividad en la interpretación.
- Cansancio y falta de concentración.
- Inexistencia de una búsqueda sistemática y exhaustiva.
Algunos estudios han demostrado que la habilidad para localizar patrones en una imagen que tienen cierta similitud con el fondo de la misma requiere una búsqueda sistemática por toda la imagen(18). Sin embargo, otros estudios que han analizado el movimiento del ojo durante el análisis de una mamografía, han demostrado que el modo en que el radiólogo explora la imagen dista mucho de ser sistemático(4). Como consecuencia de todas estas dificultades, los tests de imagen utilizados actualmente en la diagnosis precoz de cáncer pueden tener serias limitaciones en cuanto a capacidad diagnóstica se refiere. Ello se traduce en un importante número de pacientes a los que no se les detecta el cáncer tras la realización de varios tests (falsos negativos), así como en otra gran cantidad de pacientes que, no padeciendo la enfermedad, son sometidos a una serie de biopsias por existir una sospecha alta de presencia de cáncer (falsos positivos).
Por citar algunos ejemplos, estudios retrospectivos han demostrado que en los programas actuales de screening de cáncer de mama, entre un 10% y un 25% de los tumores pasan inadvertidos a los ojos del radiólogo(17, 19). Otros estudios confirman estos mismos datos al estimar que la sensibilidad alcanzada en la detección de tumores mediante la inspección visual de la mamografía por parte de un radiólogo no supera el 75%(1). El caso de la diagnosis de cáncer de próstata mediante biopsia ecodirigida no es muy distinto. Algunos estudios han concluido que incluso utilizando la cantidad aconsejada de 12 punciones, aproximadamente el 10% de los tumores no se detecta debido a que ninguna de estas punciones alcanza el lugar exacto donde se localiza el cáncer(16, 2).
A la vista de estos resultados, parece evidente la importancia de concentrar esfuerzos en la búsqueda de nuevas técnicas que permitan mejorar la diagnosis a partir de la imagen médica. En este sentido, los sistemas de Diagnóstico Asistido por Ordenador o Computer-Aided Diagnosis (CAD) pueden ser de gran ayuda a la hora de interpretar este tipo de imágenes.
2. Diagnóstico asistido por ordenador
En los últimos años se han publicado gran cantidad de trabajos orientados a la detección de lesiones en imágenes médicas, normalmente con el objetivo de elaborar un mejor diagnóstico a partir de las mismas. En este sentido, las técnicas de diagnóstico asistido por ordenador tratan de caracterizar y detectar patrones normales y anormales dentro de la imagen, con el fin de mejorar la precisión y consistencia diagnóstica obtenida por los expertos humanos.
Una vez digitalizada la imagen, es posible analizarla de modo distinto a como lo haría un observador humano, aplicando técnicas de visión por computador y reconocimiento de formas. Los sistemas de CAD analizan la imagen con el propósito de detectar regiones de interés y caracterizarlas cuantitativamente. Debe quedar claro que el objetivo final de estos sistemas no es el de realizar un diagnóstico de modo completamente automático, sin la intervención de un humano, sino ayudar al profesional para mejorar su rendimiento diagnóstico, dirigiendo la atención del mismo hacia las zonas de la imagen más sospechosas de contener alguna anomalía.
En la Figura 1 se muestra de manera muy simplificada esta idea. Habitualmente, el experto humano trata de elaborar un diagnóstico a partir, entre otros tests, de una imagen médica que, dependiendo de las circunstancias, puede ser una radiografía, ecografía, resonancia magnética nuclear (RMN) o tomografía axial computerizada (TAC), por citar algunos ejemplos.

Figura 1: Diagnóstico con y sin la ayuda de un sistema de CAD. El objetivo final de un sistema de CAD es mejorar el rendimiento diagnóstico del experto humano encargado de interpretar la imagen médica, lo cual puede medirse mediante los valores de sensibilidad (S) y especificidad (E) conseguidos.
Un modo habitual de evaluar la precisión diagnóstica consiste en medir los valores de sensibilidad y especificidad conseguidos. Cuando se cuenta con la ayuda de un sistema de diagnóstico asistido por ordenador (CAD), la imagen médica original es transformada en una segunda imagen en la que, mediante algún tipo de marcado, se resaltan las zonas sospechosas de contener alguna anomalía. Si el experto humano trabaja con esta imagen modificada, posiblemente elabore un diagnóstico distinto del que haría con la imagen original y, por tanto, los valores de sensibilidad y especificidad en este caso (S2, E2), serán distintos a los que se lograrían sin el uso del sistema de CAD (S1, E1). Lógicamente, el sistema de CAD será de utilidad si se consigue mejorar(S2, E2) respecto de (S1, E1).
Según lo expuesto, el conocimiento aportado por el sistema de CAD se combina de algún modo con el propio conocimiento del experto humano para elaborar un diagnóstico final. La utilidad del sistema de CAD dependerá, en gran medida, de la capacidad que tenga éste de encontrar características en la imagen relacionadas con la enfermedad(o con la ausencia de la misma) que el experto humano no sea capaz de detectar concierta facilidad. Otras utilidades de los sistemas de CAD son su uso como herramienta de auto evaluación y reciclaje para radiólogos con diversos grados de experiencia, y de aprendizaje para residentes en periodo de formación.
Los sistemas de CAD se han aplicado en gran cantidad de disciplinas dentro del campo médico, entre las que cabe destacar la mamografía(9, 8), radiología de tórax, radiología vascular, radiología ósea, radiología digestiva, ecografía (mama(14, 5), hígado(6, 7), tiroides, ojo, corazón, próstata(12, 11, 10)) y las aplicaciones a imágenes 3D(15, 3).
Las técnicas de visión por computador y de reconocimiento de formas pueden ser de gran utilidad a la hora de desarrollar un sistema de ayuda al diagnóstico. En las siguientes secciones se da una breve introducción al reconocimiento de formas, y se explica cómo aprovechar los conocimientos que nos brinda esta disciplina para diseñar este tipo de sistemas.
3. Reconocimiento de formas
El reconocimiento de formas (RF) es una disciplina que estudia cómo construir sistemas automáticos, capaces de emular aspectos perceptivos propios del comportamiento humano. Las técnicas de RF se aplican a tareas tan diversas como reconocimiento de texto impreso y manuscrito, reconocimiento del habla, seguridad (reconocimiento de huellas dactilares, rostros, firmas... ), inspección industrial, o procesado de señales médicas (electrocardiogramas, radiografías, ecografías...) por citar sólo algunos ejemplos. El término reconocer equivale a clasificar en C clases o categorías los distintos objetos observados. Por ejemplo, dada una imagen médica, podría pedirse a un sistema de RF que clasifique cada uno de sus píxeles en las clases tejido-sano o tejido-canceroso. Existen diversos enfoques a la hora de diseñar un sistema de RF:
- La aproximación deductiva intenta abordar racionalmente el problema planteado, esto es, comprender su naturaleza y buscar la forma de resolverlo a partir de unas ideas lógicas que lo justifiquen, o bien intentar comprender la sistemática usada por los humanos en el reconocimiento de formas para poder aplicarla al reconocimiento automático.
- La aproximación inductiva, por contra, se aplica típicamente en aquellos problemas en los que el ser humano es capaz de reconocer ciertas formas, aunque desconoce cómo lo hace. Esta metodología requiere del uso de un conjunto demuestras de aprendizaje, que son utilizadas para crear un modelo. Posteriormente, un clasificador usará este modelo para identificar (clasificar) objetos no vistos durante la etapa de aprendizaje. La aproximación inductiva lleva asociada implícitamente el concepto de aprendizaje.
En la Figura 2 se muestra el esquema de un sistema de RF inductivo. El sistema puede trabajar en modo aprendizaje o en modo clasificación. En ambos casos se comienza con la adquisición de un objeto del mundo real (por ejemplo, captura de una imagen o de un sonido). A continuación se realiza un preproceso cuyo objetivo es realzar y acondicionar los objetos de interés. Seguidamente, en la etapa de obtención de características se realizan ciertas medidas sobre el objeto que se desea analizar. La idea es obtener una serie de valores numéricos o símbolos (vector de características)representativos del objeto. Esta etapa es crucial, ya que dependiendo del tipo de características con las que trabajemos, será más o menos viable discriminar entre objetos de distintas clases. Finalmente, dependiendo de si se trabaja en modo aprendizaje o en modo clasificación, estas características se utilizarán bien para aprender (entrenar)un modelo, bien para clasificar el objeto en una de las C posibles clases, teniendo en cuenta el modelo aprendido.

Figura 2: Modelo de sistema de reconocimiento de formas.
Dentro del modelo inductivo existen, a su vez, distintas aproximaciones a la hora de diseñar el modelo que representa los objetos de nuestro problema. Nos centraremos en la aproximación estadística, también llamada geométrica, en la que un objeto se representa en forma de n características o medidas, conocidas como vector de características. Estos vectores pueden verse como un punto en un espacio de n dimensiones. El objetivo es escoger aquellas características que permitan distribuir los vectores de características (puntos) de manera que las distintas clases o categorías ocupen regiones en el espacio n-dimensional lo más compactas y disjuntas posible. Con ello, se establecen unas fronteras de decisión en el espacio de características que tratan de separarlos vectores de cada clase. Estas fronteras de decisión se determinan a partir de las distribuciones de probabilidad de los vectores de características de cada clase, obtenidos de las muestras de aprendizaje.
En la Figura 3 se muestra un ejemplo con la distribución de los vectores de características de dos clases (tejido-sano y tejido-canceroso) obtenidos de un conjunto de muestras de aprendizaje. Cada clase se representa mediante vectores que contienen dos características (f1y f2). Cada punto de la gráfica representa, por tanto, un vector de características. Durante la etapa de clasificación, ante una muestra desconocida (muestra de test), ésta se clasificará en una clase u otra en función de la posición que ocupe.
Figura 3: Ejemplo de distribución de probabilidades de las clases tejido-sano y tejido-canceroso en un espacio de características de 2 dimensiones.
Además de asignar una etiqueta de clase a la muestra de test, es habitual calcularla fiabilidad de que realmente la muestra pertenezca a la clase asignada. Lógicamente, cuanto más cerca esté la muestra de test de la frontera de decisión que separa cada una de las clases, mayor incertidumbre habrá en el proceso de clasificación.
Existen multitud de técnicas estadísticas para definir las fronteras de decisión y realizar la clasificación, cuya descripción escapa al ámbito de este artículo. A modo de resumen podemos decir que la aproximación estadística requiere que los objetos de nuestro problema se representen mediante un conjunto de valores numéricos denominado vector de características. Durante la fase de aprendizaje estos vectores de características se utilizan para estimar las distribuciones de probabilidad de cada clase. Posteriormente, en la fase de clasificación, ante la observación de un nuevo objeto no visto durante el aprendizaje, se determina la clase a la que pertenece en función de la posición que ocupe en el espacio su vector de características.
4. Diseño de un sistema de CAD mediante técnicas de RF
A continuación se explicarán algunas técnicas básicas para desarrollar un sistema de CAD con los conceptos de RF vistos en la sección anterior. Para ello seguiremos las etapas básicas subyacentes a todo sistema de RF mostradas en la Figura 2.
4.1. Adquisición
En muchos casos la información de partida se presenta en forma de señal analógica, la cual es necesario digitalizar para que pueda ser tratada por un ordenador. Supondremos que partimos de un conjunto de cierto tipo de imágenes médicas en escala de grises. Tras la digitalización, cada imagen puede representarse como una matriz de números enteros, donde cada elemento (i, j) de la matriz almacena un valor numérico que representa la intensidad de gris que tiene el píxel (i, j) en la imagen.
4.2. Preproceso
Dependiendo de las condiciones en las que se realiza la adquisición de la imagen médica, las características del equipo utilizado y las características físicas del propio paciente, las imágenes obtenidas pueden presentar variaciones significativas en cuanto a brillo y contraste. Esta situación dificulta el proceso, ya que cuanta mayor variación haya en los elementos de entrada, más complejo resultará el modelo a aprender y más difícil será, por tanto, el proceso de clasificación. Dicho de otro modo, interesará que todos los objetos de una misma clase tengan una apariencia lo más parecida posible, para facilitar la búsqueda de características comunes a todos ellos.
Una técnica para abordar este problema consiste en normalizar los valores de gris a nivel local, de modo que la media sea 0 y la desviación típica 1. En la Figura 4 se muestra un ejemplo de 3 imágenes generadas artificialmente a partir de una misma imagen, en las que se ha modificado la intensidad, y esas mismas imágenes tras su normalización.
Figura 4: Ejemplo de 3 imágenes con los niveles de gris alterados de manera artificial (arriba) y las mismas imágenes normalizadas (abajo).
4.3. Extracción de características
La extracción de características es, básicamente, un proceso de extracción de la información útil contenida en la señal a tratar (las imágenes, en nuestro caso).
Para modelar las dos clases de nuestro problema (lesión y tejido sano), se obtienen los vectores de características de cada píxel de la imagen mediante una ventana de características, tal y como se muestra en la Figura 5. Si se trabaja en modo aprendizaje, a estos vectores de características se les asocia una etiqueta de clase, correspondiente ala clase de tejido que representan. Para obtener el vector de características de un píxel cualquiera de la imagen, la ventana de características wc se centra en dicho píxel. A continuación se normaliza dicha ventana de características, tal y como de ha explicado anteriormente, y se aplica algún algoritmo de extracción de características para obtener el vector de características.

Figura 5: Esquema de extracción de características. Una ventana local w se desliza a lo largo de la imagen original I, obteniéndose, para cada posible posición de w en I, un vector de características v a partir de los píxeles contenidos en w. Mediante el uso de PCA es posible transformar w en otro vector de menor dimensión.
Existen multitud de algoritmos de extracción de características. El método más sencillo consiste en utilizar directamente como características los niveles de gris contenidos en la ventana wc.. Si definimos ésta de tamaño Twc, lógicamente nuestro vector de características tendrá una dimensión de Twc2. Debe tenerse en cuenta que trabajar en espacios de características de muy alta dimensionalidad puede degradar las prestaciones del clasificador(13). Una forma de reducir el número de características consiste en realizar una transformación mediante Análisis de Componentes Principales (PCA).
4.4. Clasificación
Una vez entrenado el modelo, ante una nueva imagen se obtienen las características de cada uno de sus píxeles exactamente igual a como se hace durante el aprendizaje. A continuación, las características obtenidas de cada uno de estos píxeles deben clasificarse para poder establecer el nivel de sospecha correspondiente. Al igual que ocurre con la fase de extracción de características, existen multitud de algoritmos de clasificación. Uno de los más sencillos, a la vez que eficiente, es el conocido como k-vecinos más próximos. Para ello se busca, entre las muestras de entrenamiento, las k más próximas a la muestra de test que se desea clasificar, y se contabiliza cuántas de ellas pertenecen a una y otra clase. Aquella clase que obtenga un mayor número de “votos” se ofrece como hipótesis de salida.
5. Conclusiones
Los sistemas de CAD pueden ser una herramienta de gran utilidad a la hora de establecer un diagnóstico a partir de una imagen médica. En este artículo se han explicado técnicas básicas de RF orientadas al diseño de este tipo de sistemas. Para ello se han revisado algunos conceptos básicos de las etapas de adquisición, preproceso, obtención de características y clasificación. Debe decirse, sin embargo, que la implementación de un sistema real del que se esperen unas prestaciones competitivas, requerirá el uso de técnicas de cierta complejidad, cuya explicación escapa al ámbito de este artículo.
6. Referencias Bibliográficas
-
- H.D. Cheng, X.J. Shi, R. Min, et al. Approaches for automated detection and classification of masses in mammograms. Pattern Recognition, page in press.,2005.
- B. Djavan, A.R. Zlotta, et al. Is one set of sextant biopsies enough to rule out prostate cancer? influence of transition and total prostate volumes on prostate cancer yield. Eoropean Urology, 38(2):218.224, 2000.
- W.R. Fair, H. Tsai, et al. Advanced 2d and 3d ultrasonic imaging in diagnosis of prostate cancer. In AUA TAM, Dallas, 1999.
- E.A. Krupinski. Visual scanning patterns of radiologists searching mammograms. Academic Radiology, 3(2):137.144, 1996.
- W.J. Kuo, R.F. Chang, , W.K. Moon, et al. Computer-aided diagnosis of breast tumors with different us systems. Academic Radiology, 9(7):793.799, 2002.
- G. Layer, I. Zuna, et al. Computerized ultrasound b-scan texture analysis of experimental fatty liver disease: influence of total lipid content and fat deposit distribution. Ultrasonic Imaging, 12(3):171.188, 1990.
- G. Layer, I. Zuna, et al. Computerized ultrasound b-scan texture analysis of experimental diffuse parenchymal liver disease: correlation with histopathology and tissue composition. Journal of Clinical Ultrasound, 19(4):193.201, 1991.
- R. Llobet, R. Paredes, and J.C. Perez-Cortes. Comparison of feature extraction methods for breast cancer detection. In Iberian Conference on Pattern Recognition and Image Analysis, volume 3523 of Lecture Notes in Computer Science, pages 495.502. Springer-Verlag, Estoril (Portugal), June 2005.
- R. Llobet and J. C. Perez-Cortes. Breast cancer detection in digitized mammograms using non-parametric methods. In Proceedings of the 2nd International Conference on Advances in Biomedical Signal and Information Processing(MEDSIP), volume 1, pages 281.287, Sliema, Malta, 2004.
- R. Llobet, J.C. Perez-Cortes, A.H. Toselli, and A. Juan. Computer-aided detection of prostate cancer. International Journal of Medical Informatics, page in press.,2006.
- R. Llobet, A.H. Toselli, J.C. Perez-Cortes, and A. Juan. Computer-aided prostate cancer detection in ultrasonographic images. In Proceedings of the 1st Iberian Conference on Pattern Recognition and Image Analysis (IbPRIA), volume 1, pages411.419, Puerto de Andratx (Mallorca, Spain), 2003.
- J. C. Perez-Cortes, A. Juan, and E. Vallada. Textural analysis of prostate cancer in transrectal ultrasound images. In Proc. of Biosignal 2002, pages 283.285, Brno(Czech Republic), June 2002.
- S. Raudys. On dimensionality, sample size, and classification error of non parametric linear classification algorithms. IEEE Trans. on Pattern Analysis and Machine Intelligence, 19(6):667.671, 1997.
- T.J. Rissanen, H.P. Makarainen, et al. Mammography and ultrasound in the diagnosis of contra lateral breast cancer. Acta Radiol., 36:358.366, 1995.
- R.A. Robb. Three-dimensional visualization and analysis in prostate cancer. Drugs of Today, 38(3):153.165, 2002.
- C.S. Stewart, B.C. Leibovich, et al. Prostate cancer diagnosis using a saturation needle biopsy technique after previous negative sextant biopsies. The Journal ofUrology, 166:86.91, 2001.
- G.M. te Brake and N. Karssemeijer. Automated detection of breast carcinomas that were not detected in a screening program. Radiology, 207:465.471, 1998.
- A. Treisman. Pre-attentive processing in vision. Computer Vision, Graphics and Image Processing, 31:156.177, 1985.
- M. Wallis, M. Walsh, et al. A review of false negative mammography in a symptomatic population. Clin Radiol, 44:13.15, 1991.