La “oreja de silicio”: un estudio coordinado desde la UFV muestra cómo la IA podría descifrar los tumores

Un estudio coordinado por la Universidad Francisco de Vitoria ha trazado el primer mapa completo de esta nueva disciplina mediante una revisión sistemática de las herramientas de inteligencia artificial más prometedoras. Su análisis ordena lo que ya se ha logrado y abre la puerta a diagnósticos más rápidos, baratos y personalizados al identificar áreas clave de mejora en estos modelos.

Inteligencia Artificial para descifrar la “sopa” celular

Cada año se diagnostican casi 300 mil casos de cáncer en España. En muchos de ellos, conocer exactamente qué tipos de células forman el tumor es clave para elegir el tratamiento más adecuado.

Hasta ahora, esa información solo podía obtenerse con técnicas muy precisas, como el análisis célula a célula, que, aunque muy potentes, son lentas y caras (hasta 2.250 dólares por muestra). Otra opción son los cortes histológicos, que requieren muestras frescas y especialistas entrenados para analizarlas al microscopio.

Frente a eso, existe una técnica más rápida y barata llamada bulk RNA-seq, que permite leer todos los genes activos en una muestra. Su problema es que ofrece una media global de toda la mezcla, sin poder identificar qué tipo de célula expresó cada gen. Es como analizar una sopa sin saber qué ingredientes lleva.

Descifrar esa mezcla y entender qué células la componen se ha convertido en uno de los grandes retos de la medicina personalizada.

Un paladar digital para los tejidos: qué es la deconvolución con IA

En lugar de separar cada célula, la deconvolución utiliza algoritmos para analizar la mezcla y deducir, como un sumiller que distingue sabores en una mezcla, qué proporciones de cada tipo celular contiene.

La idea de descifrar qué células hay dentro de un tejido sin separarlas físicamente lleva años dando vueltas en el mundo de la bioinformática. Pero la llegada del deep learning, un tipo de inteligencia artificial capaz de detectar patrones muy sutiles en grandes volúmenes de datos, lo está cambiando todo.

Estas redes neuronales, con nombres tan técnicos como MLP, autoencoders o redes generativas, aprenden a partir de ejemplos en los que sí se conoce qué células había. Una vez entrenadas, pueden analizar muestras nuevas y estimar su composición celular exacta sin necesidad de separar físicamente las células ni intervenir el tejido.

El resultado es una especie de radiografía digital que puede revelar, por ejemplo, cuántas células inmunes hay infiltradas en un melanoma, qué tan puro es un tumor cerebral, o cuántos macrófagos están atacando un riñón inflamado. Todo eso, solo a partir de datos moleculares, sin necesidad de abrir una sola célula.

El mapa del conocimiento: la revisión pionera de la UFV

Con tantos modelos y metodologías diferentes, Alba Lomas, investigadora predoctoral del Centro de Estudios e Innovación en Gestión del Conocimiento (CEIEC) de la Universidad Francisco de Vitoria, junto con el director del centro, José M. Sánchez Velázquez, y el director del grupo de Oncología Molecular del Hospital 12 de octubre y profesor del Grado en Biotecnología de la UFV, Víctor Sánchez-Arévalo, han llevado a cabo un estudio sistemático para poner un poco de orden. Aplicaron la guía PRISMA, estándar oro en revisiones sistemáticas, y rastrearon seis bases bibliográficas.

De 171 artículos iniciales, solo 13 superaron los filtros de rigor: uso de deep learning, datos reales de RNA-seq y revisión por pares. La “selección natural” dejó modelos que abarcan desde sangre periférica a cerebro, páncreas o tumores sólidos, y que emplean desde redes densas clásicas hasta híbridos con atención y convolución.

“Queríamos ofrecer una visión clara de hacia dónde va este campo y cuáles son sus límites actuales”, señala Alba Lomas, coautora del estudio.

Lo que encontró el algoritmo: tendencias y lagunas

El reinado de las redes densas queda claro en la mayoría de los modelos, que recurren a arquitecturas sencillas pero eficaces como las redes neuronales multicapa (MLP), capaces de detectar relaciones complejas sin requerir una potencia de cálculo desorbitada.

Sin embargo, ya empiezan a ganar terreno otros enfoques más sofisticados, como los autoencoders, que comprimen la información para detectar estructuras ocultas, o las redes generativas (GANs), que permiten crear datos sintéticos y mejorar el entrenamiento en casos con pocas muestras disponibles.

Sorprendentemente, los famosos transformers -que han revolucionado el procesamiento del lenguaje y la visión artificial- aún no se han aplicado en este ámbito, aunque los expertos creen que podrían marcar un antes y un después cuando lo hagan.

Los datos son el eje de todo. Todos los modelos analizados utilizan perfiles de expresión génica obtenidos mediante bulk RNA-seq, pero diez de ellos necesitan además datos de célula única para generar mezclas sintéticas, conocidas como “pseudobulks”, que sirven para entrenar al algoritmo. La mayoría de estos estudios se centran en muestras humanas, especialmente de sangre o tejidos tumorales, mientras que los experimentos en modelos animales, como el ratón, son todavía minoría.

La falta de un estándar común aparece como uno de los mayores obstáculos. Cada grupo de investigación utiliza su propia forma de procesar los datos: algunos filtran genes, otros aplican normalizaciones distintas, y cada uno evalúa la precisión de su modelo con métricas diferentes. Esto dificulta la comparación entre herramientas y complica su adopción en entornos clínicos.

“Si queremos que estas herramientas lleguen al hospital, necesitamos que hablen un idioma común. No basta con que un modelo funcione: hay que saber compararlo y confiar en cómo llega a sus conclusiones”, afirma Lomas.

¿Y ahora qué? Hacia diagnósticos rápidos y asequibles

Los autores del estudio imaginan un futuro próximo en el que el patólogo, además del informe histológico tradicional, reciba también un panel digital que indique, por ejemplo: “70 % células tumorales, 15 % linfocitos T, 10 % macrófagos, 5 % fibroblastos”.

Todo ello generado en cuestión de minutos a partir de un análisis convencional de secuenciación de ARN, una técnica que ya se utiliza en muchos centros.

Esto abriría la puerta a diagnósticos más rápidos, personalizados y asequibles. Por ejemplo, permitiría seleccionar mejor las terapias inmunológicas, sabiendo cuántas defensas naturales hay que activar en el entorno tumoral. También podría monitorizar recaídas con una simple extracción de sangre, si se adaptan los modelos a biopsias líquidas. Y, además, ayudaría a reducir costes al evitar pruebas más complejas o invasivas.

Para hacer realidad este escenario, el equipo del CEIEC está trabajando en dos frentes fundamentales. Por un lado, buscan crear conjuntos de datos de entrenamiento abiertos y robustos, que sirvan como referencia para desarrollar y comparar modelos. Y por otro, quieren desarrollar modelos más explicables, conocidos como ‘cajas negras transparentes’, que no solo den un resultado, sino que expliquen cómo lo han obtenido.

“Nuestro siguiente reto es asegurar que estos modelos puedan usarse con confianza en entornos reales, con datos compartidos y validaciones clínicas”, apunta José M. Sánchez Velázquez, director del CEIEC.

Escuchar los tejidos antes de cortar: la revolución silenciosa de la IA en medicina

Igual que AlphaFold transformó la biología estructural sin necesidad de cristalizar proteínas, la deconvolución basada en inteligencia artificial promete cambiar el diagnóstico de tejidos, sin necesidad de bisturí, microscopio ni separación física de células, es decir, evitando procedimientos invasivos o complejos.

El estudio llevado a cabo por el equipo del CEIEC de la UFV traza el primer mapa completo de esta nueva disciplina: una revisión sistemática que ordena lo que ya se ha logrado y señala lo que aún falta por construir.

Los investigadores reclaman más datos compartidos, métricas comunes que permitan comparar modelos, y algoritmos que no solo acierten, sino que expliquen sus decisiones con transparencia.

Si la comunidad científica supera esos retos, los médicos pronto podrán “escuchar” la composición celular de un tumor en la propia consulta, a partir de una muestra estándar de ARN, y decidir el tratamiento más eficaz sin tener que abrir al paciente.

Una revolución silenciosa, sí. Pero con el potencial de cambiar para siempre cómo entendemos -y combatimos- las enfermedades desde dentro.

Consentimiento de Cookies con Real Cookie Banner