Preguntar síntomas a la IA puede ayudar, pero un nuevo estudio advierte sobre errores peligrosos

Un estudio halló que la IA responde consultas médicas con casi 76% de precisión, pero todavía comete errores que pueden ser relevantes para los pacientes.

Persona usa una laptop con un asistente de inteligencia artificial en pantalla, en una imagen ilustrativa sobre consultas médicas hechas a chatbots.
Las respuestas fueron menos confiables en medicina interna, neurología y dermatología, áreas donde los investigadores detectaron menor validez y mayor riesgo de daño.

Cada vez más personas consultan a la inteligencia artificial antes de llamar al médico. Describen un dolor, preguntan por un síntoma, piden orientación sobre un medicamento o buscan saber si deberían preocuparse. La práctica se volvió tan común que los investigadores ya intentan medir qué tan confiables son estas respuestas.

Un nuevo estudio dirigido por investigadores de la Universidad Estatal de Pensilvania encontró que los asistentes de inteligencia artificial respondieron consultas médicas cotidianas con una precisión cercana al 76%. El dato parece alentador, pero tiene un costado delicado: la tasa de errores superó el 20%, aproximadamente el doble que la de médicos humanos, según los autores del trabajo.

Qué evaluó el estudio

Los investigadores organizaron una competencia llamada Diagnose-a-thon, en la que 34 participantes enviaron 212 preguntas y respuestas generadas por IA sobre problemas de salud reales e imaginarios. Las consultas fueron redactadas desde la perspectiva de pacientes y médicos.

Los participantes pudieron usar distintos modelos, entre ellos ChatGPT-4o, ChatGPT-3.5, Gemini-1.5 Pro y Llama3-8b. Luego, nueve médicos certificados evaluaron la precisión de las respuestas y su posible riesgo para los pacientes.

En qué temas falló más la IA

El desempeño no fue igual en todas las áreas. Según el estudio, los modelos obtuvieron mejores resultados en consultas de obstetricia y ginecología, y otorrinolaringología.

En cambio, las respuestas fueron menos confiables en medicina interna, neurología y dermatología, áreas donde los investigadores detectaron menor validez y mayor riesgo de daño.

Cuándo puede ser útil y cuándo no

La IA puede servir para ordenar preguntas, entender términos médicos o prepararse mejor para una consulta. Pero no debería usarse para confirmar diagnósticos, decidir tratamientos, suspender medicamentos o ignorar síntomas graves.

Los especialistas advierten que estas herramientas pueden ser más útiles en manos de profesionales de la salud que de pacientes sin entrenamiento médico, porque un médico puede detectar matices, errores o señales de alarma que el modelo podría pasar por alto.

La regla clave antes de confiar en una respuesta

Si la consulta involucra dolor fuerte, dificultad para respirar, síntomas neurológicos, sangrado, fiebre persistente, dolor de pecho, embarazo, medicamentos o enfermedades crónicas, la respuesta de una IA nunca debería reemplazar la atención médica.

El mensaje del estudio no es que la IA sea inútil. Es más simple: puede orientar, pero todavía se equivoca lo suficiente como para que usarla como médico personal sea riesgoso.

magnifiermenu