Un estudio muestra que una herramienta basada en IA puede determinar el riesgo de que una mujer desarrolle cáncer de mama en los próximos cuatro años
Un algoritmo de inteligencia artificial (IA) es capaz de estimar el riesgo de una mujer de desarrollar cáncer de mama en los próximos cuatro años, según afirma un estudio publicado en The Lancet Digital Health. La herramienta identificó a las mujeres con alto riesgo de desarrollar cáncer de mama y casi una de cada diez de las que obtuvieron una puntuación en el 2 % superior según el algoritmo fueron diagnosticadas en un plazo de cuatro años, a pesar de haber recibido el alta médica. La herramienta utilizó mamografías de casi 400.000 mujeres y luego se probó con datos de casi 96.000 mujeres de Australia. Los resultados se confirmaron en una población sueca de más de 4.500 mujeres.
Ignacio Miranda - IA cáncer mama
Ignacio Miranda Gómez
Responsable de la Unidad de Diagnóstico por Imagen de Mama en el International Breast Cancer Center (IBCC) y en el Centro Médico Teknon de Barcelona
Se trata de un estudio de cohorte poblacional, con una cohorte de entrenamiento muy amplia (~397.000 mujeres) y una cohorte de validación independiente (~96.000 mujeres). A posteriori, se realizó una validación externa, en una población diferente, en Suecia (~4.500 mujeres).
El tamaño de la cohorte de entrenamiento es enorme y esto favorece estimaciones estables, facilita una calibración poblacional robusta y permite una reducción del riesgo de sobreajuste (overfitting) que ocurre cuando un modelo memoriza los datos de entrenamiento con demasiada precisión, incluyendo las anomalías en lugar de aprender los patrones generales. Como consecuencia, el modelo funciona extremadamente bien con los datos que ya conoce, pero no logra generalizar o realizar predicciones precisas con nuevos datos.
Todo lo anterior es una gran fortaleza frente a muchos estudios de IA con muestras pequeñas.
El estudio parte de un algoritmo de detección por IA (BRAIx AI Reader) y lo transforma en una puntuación de riesgo calibrada poblacionalmente (BRAIx risk score) con dos objetivos fundamentales:
- Riesgo de cáncer en el cribado actual.
- Predicción de riesgo de cáncer en los cuatro años posteriores.
El estudio no usa la IA solo para detectar cáncer, sino que la convierte en una herramienta de estratificación de riesgo poblacional. Esto tiene implicaciones prácticas importantes para la implementación de un cribado personalizado, un uso racional de pruebas de mayor coste como la mamografía con contraste o resonancia magnética y una potencial reducción del sobrediagnóstico.
Creo que la nota de prensa transmite los puntos clave del estudio. Únicamente hay que aclarar que en el momento que se compara el riesgo (puntuación del 2 %) con pacientes portadoras de mutaciones BRCA1/2 estamos hablando de riesgo en esos cuatro años en concreto (de manera independiente). No equivale necesariamente al riesgo vitalicio ni al riesgo acumulado de portadoras de mutaciones genéticas.
El estudio es de buena calidad metodológica. Utiliza una cohorte muy grande para entrenamiento (~397 000 mujeres), una cohorte de validación independiente en Australia (~96 000) y una validación externa en Suecia (~4 500), lo cual reduce el riesgo de sobreajuste y mejora la generalización. Los análisis estadísticos son rigurosos (modelos univariantes y multivariantes, AUC, odds ratios, análisis de umbrales y evaluación de factores concurrentes). Las conclusiones (que la puntuación BRAIx predice con precisión el cáncer actual y el riesgo a cuatro años y que supera a factores tradicionales como la densidad mamaria o los antecedentes familiares) están respaldadas por datos estadísticamente significativos y consistentes tanto en el conjunto australiano como en el sueco.
Este estudio representa un avance respecto a la evidencia previa. Investigaciones anteriores habían explorado algoritmos de IA para detectar cáncer en imágenes, pero presentaban limitaciones como combinar detecciones actuales con predicción futura sin ajustar por factores como edad, antecedentes familiares o densidad mamaria. El BRAIx no solo detecta, sino que transforma la puntuación de un algoritmo de detección en un score de riesgo intermedio (hasta cuatro años), algo que estudios anteriores no habían demostrado con tanta fuerza. Además, supera a otros predictores como los scores poligénicos y la clasificación de densidad mamaria en términos de capacidad predictiva.
Los autores han considerado varios factores de confusión:
- Ajustaron sus modelos a múltiples variables como edad, densidad mamaria, antecedentes familiares, país de nacimiento.
- Analizaron el efecto independiente de cada factor vía modelos multivariantes y evaluaron cambios en los coeficientes para determinar su inferencia causal (determinar la relación causa-efecto entre variables).
- Comprobaron cómo el score BRAIx absorbe gran parte de la información predictiva de factores tradicionales como la densidad mamaria o la historia familiar.
En cuanto a limitaciones:
- Seguimiento limitado a cuatro años: no se sabe cómo se comporta el score en periodos más largos.
- Posible sesgo por pérdidas de seguimiento: mujeres que no regresan al programa o que se diagnostican fuera del sistema podrían sesgar los resultados.
- Generalización: aunque hay validación externa en Suecia, hace falta estudiar poblaciones más diversas (otros países, etnias, sistemas de salud). No hay evaluación de impacto clínico real: el estudio no mide si usar este score reduce mortalidad, mejora decisiones médicas o cambia tasas de biopsias o intervenciones.
Las implicaciones potenciales son muy relevantes, aunque todavía no inmediatas.
El score BRAIx podría permitir cribado personalizado en lugar del enfoque único actual:
- Mujeres con alto riesgo podrían recibir seguimiento más estricto o pruebas adicionales (MRI, mamografía con contraste).
- Mujeres con bajo riesgo podrían espaciar sus controles.
Esto podría traducirse en:
- Mejor detección temprana.
- Menor número de falsos positivos y falsos negativos.
- Optimización de recursos sanitarios.
- Posible ahorro de costes.
- Menor ansiedad para las pacientes.
Pero antes de implementarlo en práctica clínica general, se requieren estudios prospectivos que evalúen impacto real en resultados relevantes (como mortalidad, calidad de vida, coste-efectividad, resultados clínicos).
- Artículo de investigación
- Revisado por pares
- Estudio observacional
- Humanos
Frazer et al.
- Artículo de investigación
- Revisado por pares
- Estudio observacional
- Humanos