La keynote inaugural del Google I/O 2023 estuvo plagada de anuncios sobre inteligencia artificial. En especial, de aquellos vinculados a PaLM 2, su nuevo modelo de lenguaje masivo. Allí pudimos dar un breve vistazo a Med-PaLM 2, un chatbot a lo Bard o ChatGPT pero específicamente aplicado a la medicina. Y la compañía ahora ha comenzado a probarlo en distintos hospitales de Estados Unidos.
Según reporta The Wall Street Journal, Google está poniendo a prueba a Med-PaLM 2 en múltiples servicios de sanidad, incluida la reconocida Clínica Mayo. Allí, la plataforma se utiliza para responder consultas médicas, y también se aplica a labores más tediosas, como organizar información de salud o resumir documentación.
Google afirma que no obtiene acceso a la información personal ni a los registros médicos de los clientes que ya están probando Med-PaLM 2. Esto se debe a que los datos se encriptan para que no puedan ser accesibles por la firma californiana, lo que también previene que se los utilice para entrenar al chatbot de IA.
De todos modos, que la plataforma basada en la misma tecnología de Bard ya se pruebe en hospitales, no significa que su lanzamiento masivo esté a la vuelta de la esquina. Los de Sundar Pichai por lo pronto se han negado a mencionar cuándo podría habilitarse Med-PaLM 2 a más centros de salud.
Med-PaLM 2 quiere elevar el listón de la IA generativa aplicada a la medicina
Cuando Google dio una muestra de las capacidades de Med-PaLM 2, se pudo ver cómo el chatbot interpretaba una lesión a partir de la imagen de una radiografía. Esto dejó en claro que los de Mountain View pretenden que su IA se convierta, tarde o temprano, en una suerte de asistente virtual para los doctores. No obstante, es probable que todavía falten varios años para que eso suceda.
Las respuestas que Med-PaLM 2 está dando a los clientes que lo están probando se encuentran bajo revisión permanente de médicos reales. Y si bien la tecnología de Google ya ha demostrado su valía, ofreciendo devoluciones de calidad en la mayoría de los puntos de evaluación, no puede escapar del fantasma de otras aplicaciones basadas en inteligencia artificial: las alucinaciones.
¿Esto qué significa? Que así como ChatGPT o Bard pueden inventarse respuestas en segundos cuando se les pregunta algo sobre lo que no están entrenados, el chatbot médico de Google puede hacer algo parecido. Expertos han encontrado imprecisiones y contenidos irrelevantes en los diagnósticos, al compararlos con los ofrecidos por médicos reales en la misma situación.
Investigadores de Google manifestaron que todavía no han podido desarrollar un método para evaluar las falencias en los resultados de Med-PaLM 2. Así que no esperes que el chatbot comience a ser implementado como una herramienta infalible para diagnósticos complejos en el corto plazo. La IA ha entregado resultados iniciales muy interesantes, pero todavía está lejos de alcanzar un nivel de fiabilidad digno de una película de ciencia ficción.
Y lo último no sorprende. Cuando Google reveló los planes para Med-PaLM 2, alertó que todavía tenía mucho que aprender sobre cómo aplicarlo al ámbito de la medicina:
"El impresionante rendimiento de Med-PaLM 2 en preguntas de estilo de examen médico es un avance prometedor, pero debemos aprender cómo se puede aprovechar para beneficiar a los trabajadores de la salud, investigadores, administradores y pacientes. En la construcción de Med-PaLM 2, nos hemos centrado en la seguridad, la equidad y las evaluaciones de sesgo injusto. Nuestro acceso limitado para clientes selectos de Google Cloud será un paso importante para promover estos esfuerzos, aportando experiencia adicional en todo el ecosistema de ciencias biológicas y atención médica".
Google.