No solo es en la computación, el internet de las cosas o las redes sociales. Los alcances del aprendizaje automático también están logrando avances en áreas científicas. Tal es el caso del desarrollo de fármacos.

Hoy en día, el desarrollo de nuevas moléculas para crear medicamentos se lleva a cabo de forma manual. El proceso se realiza tanto para crear un nuevo medicamento como para mejorar uno ya existente. Los químicos seleccionan una molécula "líder", de la cual conocen su potencial para combatir una enfermedad en específico, y le hacen ajustes manuales para potenciar sus efectos. A menudo, esto toma bastante tiempo y no siempre logra los resultados esperados. Hasta ahora.

Para optimizar este proceso, investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) y del Departamento de Ingeniería Eléctrica y Ciencias de la Computación (EECS), ambos del Instituto Tecnológico de Massachusetts (MIT), han logrado automatizar el proceso de diseño de medicamentos a través del aprendizaje automático, lo que ha conllevado a mejores resultados en el diseño de fármacos.

El modelo que desarrollaron selecciona a los mejores "candidatos" de moléculas con base en las propiedades deseadas para el fármaco y modifica la estructura molecular para lograr la mayor potencia posible a la vez que son aún químicamente válidas. Según ha explicado Rob Matheson en un post publicado este 6 de julio en el sitio de noticias del MIT:

El modelo básicamente toma como datos de la estructura molecular de entrada y crea directamente gráficos moleculares: representaciones detalladas de una estructura molecular, con nodos que representan átomos y aristas que representan enlaces. Desglosa esos gráficos en grupos más pequeños de grupos funcionales válidos que utiliza como 'bloques de construcción' que lo ayudan a reconstruir con mayor precisión y modificar mejor las moléculas.

El modelo

Los investigadores entrenaron a su modelo de aprendizaje automático con base en 250.000 gráficas moleculares, que son imágenes detalladas de la estructura de una molécula. Después, hicieron que el modelo generara moléculas, encontrara las mejores moléculas base y diseñara nuevas con propiedades mejoradas.

Según sus hallazgos, el modelo completó estas tareas de forma aún más efectiva que otros sistemas diseñados para automatizar el proceso de diseño de medicamentos. El equipo afirma que todas las moléculas nuevas que creó fueron válidas. En comparación, señalan, otros modelos solo tienen una tasa de validez de un 43.5 por ciento.

Por otro lado, también fue capaz de encontrar la mejor molécula base o líder que otros sistemas similares. De acuerdo con los investigadores del MIT, la mejor molécula "candidata" que generó su modelo obtuvo un 30 por ciento más de las propiedades deseadas, que sea altamente soluble y fácilmente sintetizable, que la mejor opción hallada por otros sistemas más tradicionales.

Finalmente, destacan que al pedirle al modelo que modificara 800 moléculas para mejorarlas pero que mantuviera una estructura similar a la de la molécula principal, alrededor del 80 por ciento de las veces creó nuevas moléculas estructuradas de manera similar que puntuaron más alto para esas dos propiedades que hicieron las moléculas originales.

El futuro

Esta investigación fue llevaba a cabo como parte del Consorcio de Aprendizaje Automático para el Descubrimiento y Síntesis de Fármacos, que realiza el MIT junto con otro compañías farmacéuticas. El modelo será presentado la próxima semana en la Conferencia Internacional de Aprendizaje Automático 2018 que se lleva a cabo este mes de julio en Estocolmo, Suecia.

Wengong Jin, estudiante de doctorado en CSAIL y autor principal del estudio sobre este modelo, señaló:

La motivación detrás de esto era reemplazar el proceso ineficiente de modificación humana de diseñar moléculas con iteración automática y asegurar la validez de las moléculas que generamos

En adelante, el equipo de investigación se dedicará a probar el modelo en otras propiedades farmacéuticas para que sea capaz de funcionar con cantidades limitadas de datos de capacitación.