A un paso del diagnóstico de enfermedades por inteligencia artificial

El médico Enrique Poblet y el catedrático José Manuel García Carrasco, esta semana. / E. B.
El médico Enrique Poblet y el catedrático José Manuel García Carrasco, esta semana. / E. B.

Un grupo de científicos aplica de forma experimental en el Reina Sofía técnicas conocidas como 'aprendizaje profundo'

Hasta la fecha el diagnóstico de determinadas enfermedades depende de la realización de una biopsia, que consiste en la obtención de tejido del paciente para un diagnóstico de precisión. Este diagnóstico se realiza mediante visualización de las muestras en el microscopio y su interpretación por el médico patólogo. Ahora, un grupo de científicos de la Región de Murcia pretende aplicar técnicas de inteligencia artificial, concretamente técnicas las conocidas como 'Deep Learning' o 'aprendizaje profundo', para el diagnóstico.

«Actualmente podemos digitalizar las imágenes que vemos en el microscopio para analizarlas en el ordenador. Nos proponemos comparar los diagnósticos que venimos realizando actualmente con los que podría realizar una máquina mediante las técnicas mencionadas», en palabras de Enrique Poblet, médico del Hospital Reina Sofía y catedrático del área de Anatomía Patológica de la Universidad de Murcia.

En relación a las ventajas que esto puede ofrecer con respecto a los métodos actuales, Poblet señala que «en un futuro próximo nos podremos beneficiar de análisis cuantitativos y morfológicos muy útiles para la rapidez y eficacia del diagnóstico final. En un futuro remoto es posible imaginar que el ordenador pueda establecer parámetros de diagnóstico precisos y rápidos, no sometidos a variables que puedan influir en los diagnósticos realizados por médicos».

En concreto, este equipo se ha centrado en el cáncer de próstata por su elevada frecuencia -el cáncer de próstata es el primer cáncer en frecuencia en los hombres en el mundo occidental- y porque las características de las biopsias que se obtienen en este cáncer son, en opinión de los investigadores, especialmente aptas para su estandarización y aplicación de técnicas de inteligencia artificial.

El sistema se está probando en el Hospital Reina Sofia de Murcia pero por el momento se trata de algo experimental. «De momento solo hemos establecido que la técnica es viable utilizando los recursos de los que disponemos en el hospital en unión con los que aporta la Facultad de Informática de la UMU. Para aplicar las técnicas de 'Deep Learning' es necesario 'enseñar a la máquina' mostrándole una gran cantidad de casos resueltos. Estamos comprobando que los ordenadores son capaces de aprender y están alcanzando un grado significativo de concordancia», según el catedrático.

En ciencia, hablar de tiempos es complicado porque depende no solo del desarrollo tecnológico sino, sobre todo, de la capacidad de adaptación del ser humano, en este caso de los médicos patólogos, en aceptar y comprobar que una nueva técnica puede ser fiable. En el campo de la salud no se pueden aceptar nuevas propuestas hasta haber pasado múltiples y muy exhaustivos controles, por lo que determinar cuándo estará disponible su trabajo para ser usado de modo habitual es imposible.

Por el momento, están comprobando que el tejido obtenido en las biopsias no solo es válido para el diagnóstico de certeza, sino que nos indica también cuál puede ser el pronóstico y la respuesta al tratamiento de determinados tumores. Advierte Enrique Poblet que «en este campo, que conduce a una medicina personalizada basada en las características del tumor de cada enfermo individual, es donde el uso de los ordenadores puede tener una especial relevancia».

Informática

También juega un papel destacado en este proyecto el grupo de Investigación de Arquitectura y Computación Paralela de la Universidad de Murcia, que dirige el catedrático José Manuel García Carrasco, desde el que se ha desarrollado una Red Neuronal Artificial para detectar el cáncer de próstata en imágenes médicas obtenidas a partir de biopsias.

Las redes neuronales artificiales están formadas por unidades básicas llamadas neuronas (perceptrones), las cuales imitan el comportamiento de las neuronas humanas, teniendo un conjunto de entradas que simulan las dendritas, una salida que simula el axón, y una unidad funcional que simula el procesamiento de la neurona. Por sí solas las neuronas no son capaces de solucionar problemas complejos, por lo que para ello se agrupan en capas. Estas capas conectan sus salidas con las entradas de la siguiente capa para construir una red neuronal. Al unir tres o más capas, se forman las redes neuronales profundas, que son capaces de representar cualquier tipo de función matemática, aunque tienen un elevado coste computacional (es decir, el tiempo de ejecución del algoritmo en un ordenador es muy alto).

En las redes neuronales, la fase que más tiempo de cómputo consume es la fase de entrenamiento, la cual realiza una búsqueda heurística para solucionar un problema de optimización matemática. Es muy habitual usar un algoritmo de aprendizaje supervisado conocido como SDG (Stochastic Gradient Descendent o Gradiente Descendiente Estocástico), cuyo funcionamiento es obtener un mínimo global comparando la salida obtenida con lo que se espera obtener, y realizar toda una serie de iteraciones para minimizar dicho error. El rendimiento de un modelo de red neuronal se mide o bien usando el porcentaje de acierto de la red (accuracy), o bien mediante el error acumulado (loss).

Dentro de las diversas aplicaciones disponibles (frameworks), la herramienta elegida ha sido MXNet, que está bajo el proyecto Apache Incubator. Otras posibles aplicaciones también conocidas son TensorFlow, Keras o Theano.

«Hemos prestado atención de manera especial al preprocesado de las imágenes de entrada. Las imágenes de entrada son obtenidas de las biopsias, que son escaneadas con múltiples aumentos y almacenadas en un fichero (con un formato tiff) para su procesamiento. Posteriormente, hemos extraído la capa de 20 aumentos (en este caso en un formato de fichero jpeg). Estas imágenes tienen dimensiones cercanas a los 5 GigaPíxeles, por lo que requieren de algún tipo de procesado para ser manejables. En este trabajo hemos optado por cortar la imagen en cuadrados (tiles) de tamaño 128x128 píxeles, pues este procedimiento ya se ha aplicado con éxito en la detección del cáncer de mama», detalla Carrasco.

Posteriormente, los tiles fueron etiquetados como imagen sana o imagen con cáncer por medio de comparar la imagen original con la imagen troceada. En el estudio han usado 10 imágenes diferentes, de las que una vez troceadas se ha generado un conjunto de imágenes para entrenamiento y otro diferente para validación. Hemos establecido un 80% de datos para el entrenamiento y un 20% para la validación. Por otro lado, la red neuronal artificial se entrena con las imágenes de entrenamiento. Esta es la fase más costosa de cómputo en el ordenador y sirve para ajustar los diversos parámetros que tiene dicha red neuronal. Una vez entrenada y obtenido un acierto superior al 90%, se procede a evaluar dicha red con nuevas imágenes del conjunto de validación.

Finalmente, se ha realizado un proceso que permite reconstruir la imagen de la biopsia, dejando marcadas aquellas zonas con una alta probabilidad de contener cáncer.

Además, pueden presumir de que en el trabajo realizado se ha conseguido obtener un 78,1% de aciertos (accuracy) en la fase de validación y dicho porcentaje podría ser incrementado en un futuro.

«Con respecto a los tiempos de cómputo necesarios -apunta Carrasco- la etapa de preprocesamiento tuvo una duración cercana a las 4 horas, generando la base de datos que se usó para el entrenamiento de la red. Propiamente, el entrenamiento que sirve para configurar la red neuronal tiene una duración cercana a las 2 horas. Una vez generado el modelo de red neuronal artificial, la predicción real lleva tiempos cercanos a 2 minutos (casi tiempo real). Por último, la reconstrucción de la imagen para marcar las zonas de cáncer tuvo una duración cercana a los 20 minutos. Estos tiempos fueron tomados en un ordenador que tenemos en el laboratorio de investigación que está equipado con un procesador Intel Xeon y una tarjeta gráfica Nvidia Pascal».

Modelo de red neuronal

Con respecto al trabajo realizado y los siguientes pasos, el catedrático del área de Arquitectura y Tecnología de Computadores destaca que «lo más significativo ha sido conseguir generar una metodología para obtener un modelo de red neuronal artificial que permita detectar el cáncer de próstata a partir de imágenes escaneadas procedentes de biopsias, y que tenga la suficiente precisión como para ser usado de primer diagnóstico (screening) en situaciones reales».

«Como planes de futuro cercanos, queremos aumentar el número de imágenes consideradas en el entrenamiento de la red, lo que nos permitirá afinar el modelo y mejorar la tasa de aciertos. Otro de los objetivos es reducir los tiempos de ejecución, tanto de la etapa de entrenamiento como sobre todo de la etapa de validación, pues ello permitirá a medio plazo incorporar este proceso dentro del diagnóstico clínico de los hospitales».

No obstante, asegura que es necesario que la cantidad de falsos negativos sea nula; es decir, que para poder incorporar estas técnicas al diagnóstico clínico se debe asegurar que nunca va a ser inferido o predicho como sano una imagen que contenga una muestra con cáncer.

Clínicamente, la gran ayuda de estas técnicas viene de poder revisar todas las biopsias y encontrar las que tengan cáncer (aunque en algunas se pueda equivocar, lo que sería un falso positivo). Todas aquellas muestras 'positivas' serían posteriormente revisadas por un médico especialista que confirmaría el diagnóstico y eliminaría los errores encontrados. Pero si no se puede asegurar que no hay falsos negativos, el especialista debería revisar todas las imágenes y entonces la aportación de esta técnica tendría un impacto reducido.

Contenido Patrocinado

Fotos

Vídeos