EDUCACIÓN

Estudio revela la fiabilidad de la IA en consultas médicas

- Facebook
- Twitter
- Whatsapp
- Telegram
- Email

Redacción | Viernes 19 de junio de 2026

Un estudio conjunto de la URJC y otras universidades evalúa la fiabilidad de modelos de IA como ChatGPT y Gemini en consultas médicas, revelando su utilidad y variabilidad en respuestas.

Un reciente estudio realizado por la Universidad Rey Juan Carlos (URJC), en colaboración con el King’s College London y Solent University London, ha explorado la efectividad de los modelos de lenguaje como ChatGPT y Gemini en la respuesta a consultas médicas, específicamente sobre temas como la epidural. Los hallazgos sugieren que, aunque la inteligencia artificial (IA) puede ser una herramienta útil para proporcionar información adicional, su fiabilidad varía y siempre debe ser contrastada con un profesional de la salud.

Claves de la noticia

1. Eficiencia variable de los modelos

ChatGPT mostró el mejor rendimiento general en las respuestas, seguido por Gemini, aunque otros modelos también lograron resultados competitivos.

2. Importancia del contexto y formulación

La calidad de las respuestas depende de la complejidad de las preguntas y cómo estas son formuladas, lo que afecta su utilidad para los pacientes.

3. Influencia del idioma

El análisis reveló que el idioma impacta significativamente en la calidad de las respuestas, siendo el español un área donde algunos modelos mejoran su desempeño.

La influencia de la IA en las decisiones médicas

En el ámbito cotidiano de las consultas médicas, es común que los pacientes tengan dudas originadas por información obtenida a través de redes sociales o herramientas basadas en IA. Muchos expresan inquietudes sobre procedimientos como la epidural, llegando incluso a rechazarlos debido a temores infundados.

El equipo investigador se enfocó en evaluar cuán confiables eran las respuestas ofrecidas por diferentes modelos de lenguaje respecto a este tema. Según los resultados publicados en la revista Artificial Intelligence in Medicine, ChatGPT se destacó como el modelo más eficaz para responder a preguntas relacionadas con la epidural. Sin embargo, se observó que otros modelos como OpenChat y Phi-3 también presentaron resultados comparables, lo que subraya que no solo el tamaño del modelo es determinante, sino también la calidad de los datos utilizados para su entrenamiento.

Metodología del estudio y resultados clave

Para llevar a cabo esta investigación, se formularon diez preguntas sobre epidurales dirigidas a distintos LLMs (modelos de lenguaje grande), cada una variando en su redacción. Este enfoque buscaba evaluar cómo estos sistemas podían interpretar y responder a diferentes formulaciones lingüísticas, utilizando un lenguaje sencillo que podría emplear cualquier paciente sin conocimientos técnicos previos.

Los modelos evaluados incluyeron ChatGPT, Gemini, OpenChat y versiones especializadas como MedLlama y Meditron. La evaluación se llevó a cabo mediante métricas centradas en aspectos como fiabilidad, sensibilidad y empatía. Al final del proceso, más de 2.400 respuestas fueron revisadas manualmente por expertos para determinar cuáles eran aceptables.

Los resultados ofrecen una perspectiva alentadora sobre el desarrollo futuro de sistemas de IA más eficientes en el campo médico; sin embargo, enfatizan que deben ser utilizados bajo supervisión médica para evitar confusiones o decisiones erróneas por parte del paciente.

Análisis del impacto del idioma en las respuestas generadas por IA

El estudio también examinó cómo el idioma influye en la capacidad de los LLMs para ofrecer respuestas adecuadas. Se descubrió que muchos modelos presentaban dificultades independientemente de su tamaño al abordar tareas específicas en diferentes idiomas. Curiosamente, ChatGPT mostró una mejora notable al responder en español.

En conclusión, los mejores desempeños fueron observados nuevamente en ChatGPT y Gemini tanto en inglés como en español, destacando así la importancia no solo del modelo utilizado sino también del contexto lingüístico al interactuar con estas tecnologías emergentes.

TEMAS RELACIONADOS:

Inteligencia Artificial

ChatGPT

Investigación Médica

Salud

Noticias relacionadas

Mostrar comentarios +

IR A VERSIÓN COMPLETA

Política de privacidad y cookies | Aviso Legal

https://www.cronicamadrid.com/

EDUCACIÓN

Estudio revela la fiabilidad de la IA en consultas médicas

Claves de la noticia

1. Eficiencia variable de los modelos

2. Importancia del contexto y formulación

3. Influencia del idioma

La influencia de la IA en las decisiones médicas

Metodología del estudio y resultados clave

TEMAS RELACIONADOS:

Noticias relacionadas

Sistema de IA automatiza la codificación de informes médicos

Visita de la ministra de Trabajo al ISCIII para abordar formación en salud laboral

La URJC destaca en el ranking mundial de Medicina

Listas de espera en Madrid caen a niveles récord, casi tres veces inferiores a la media nacional en cirugía

Familiares y tutores legales podrán acceder a la información médica de usuarios con Tarjeta Sanitaria Virtual delegada en Madrid

Mostrar comentarios +