¿Puede la IA superar a los médicos en el diagnóstico médico? Un nuevo estudio explora el potencial y los peligros

6

En el ambiente de alto riesgo de una sala de emergencias, el error más peligroso que puede cometer un médico no es elegir el tratamiento equivocado, sino no identificar el diagnóstico correcto en primer lugar. Un estudio reciente sugiere que una nueva generación de inteligencia artificial pronto podría convertirse en una salvaguardia vital contra estos descuidos críticos.

El auge de los modelos de “razonamiento”

El campo de la medicina está en la cúspide de un cambio tecnológico impulsado por modelos de lenguajes grandes (LLM) avanzados. A diferencia de iteraciones anteriores de IA, los nuevos “modelos de razonamiento”, como la vista previa o1 de OpenAI, están diseñados para procesar problemas complejos a través de una lógica secuencial paso a paso.

Este salto tecnológico está satisfaciendo una demanda significativa de la comunidad médica. Según una encuesta realizada a más de 2000 médicos, 1 de cada 5 médicos y enfermeras en todo el mundo ya utiliza la IA para buscar una segunda opinión sobre casos complejos, y más de la mitad expresa su deseo de integrarla aún más en su práctica.

El estudio: IA versus médicos humanos

Un estudio dirigido por el científico de datos biomédicos de la Universidad de Harvard, Arjun Manrai, publicado en Science, probó las capacidades de diagnóstico del modelo o1-preview frente a médicos humanos. Los investigadores utilizaron dos conjuntos de datos distintos:
1. Conjuntos de síntomas de formación médica clásica.
2. Datos del mundo real de 76 pacientes tratados en una sala de emergencias de Boston.

Los resultados fueron sorprendentes: El modelo de razonamiento de IA superó tanto a los médicos humanos como al software de diagnóstico especializado, identificando correctamente el diagnóstico (o una alternativa de alta precisión) en casi el 80 % de los casos.

Un ejemplo notable proporcionado por el coautor Adam Rodman involucró a un paciente trasplantado inmunodeprimido que presentaba síntomas respiratorios habituales. Si bien los médicos humanos podrían haber pasado por alto la gravedad de la situación, el modelo de IA señaló la sospecha de una infección carnívora potencialmente mortal mucho antes que el equipo humano.

El contraargumento: lógica versus matices

A pesar de estas impresionantes cifras, la comunidad científica se mantiene cautelosa. Los críticos sostienen que existe una diferencia fundamental entre “razonamiento computacional” y “razonamiento clínico”.

“Cuando decimos razonamiento clínico, no significa lo mismo que razonamiento moral”, advierte Arya Rao, investigadora de la Facultad de Medicina de Harvard.

El equipo de Rao realizó recientemente un estudio separado que evaluó 21 modelos de IA y descubrió una debilidad persistente: la incapacidad de manejar la incertidumbre. Si bien los modelos de razonamiento destacan por seguir un camino lógico hacia una conclusión, a menudo tienen dificultades con los matices necesarios cuando son posibles múltiples diagnósticos.

Los principales riesgos identificados incluyen:
Razonamiento “frágil”: La IA tiende a sacar conclusiones demasiado rápido.
Falta de matices: Los modelos tienen dificultades cuando deben sopesar varias posibilidades inciertas simultáneamente.
Ausencia de juicio humano: La IA carece del razonamiento moral y contextual esencial para la atención compleja de pacientes.

El futuro: asistente, no reemplazo

El consenso entre los investigadores no es que la IA deba reemplazar a los médicos, sino más bien servir como una poderosa extensión del diagnóstico. El objetivo es utilizar la IA para captar lo que el ojo humano podría pasar por alto, proporcionando una “red de seguridad” para los médicos.

A medida que la tecnología madura, la atención se centra en si la IA puede diagnosticar a cómo puede integrarse de forma segura en los flujos de trabajo clínicos. Si se gestiona correctamente, esta tecnología podría servir como un “gran nivelador”, proporcionando apoyo de diagnóstico de alto nivel a regiones con acceso limitado a atención médica especializada.


Conclusión
Si bien los modelos de razonamiento de IA han demostrado una capacidad superior para identificar diagnósticos correctos en estudios controlados, todavía luchan con los matices y la incertidumbre inherentes a la medicina humana. La próxima frontera de la IA médica se encuentra en los ensayos clínicos destinados a integrar estas herramientas como asistentes confiables en lugar de tomadores de decisiones autónomos.