Las proteínas son moléculas indispensables para la vida. La información que contiene nuestro ADN se traduce en las células a través de una serie de mecanismos que llevan a la síntesis de proteínas con un abanico inmenso de funciones. Estas están compuestas por unos “ladrillitos” llamados aminoácidos, que se agrupan hasta formar cadenas que se pliegan para dar lugar al resultado definitivo. Y es ahí donde radica la importancia de su buen funcionamiento: en el plegamiento de las proteínas.

Para que puedan desarrollar su función deben estar bien plegadas. Si pierden esta estructura tridimensional pasan a estar desnaturalizadas y pierden su eficacia. Por eso, teniendo en cuenta la importancia que tienen muchas proteínas en el avance de diferentes enfermedades, desde el cáncer hasta el alzhéimer, así como en el desarrollo de fármacos para tratarlas, comprender cómo ocurre esto es vital. Y no es una tarea fácil. De hecho, los científicos llevan casi medio siglo intentando comprenderlo. Pero el problema podría estar muy cerca de solucionarse, gracias a los algoritmos de inteligencia artificial desarrollados por el laboratorio de investigación británico DeepMind, perteneciente a Google.

El misterio del plegamiento de proteínas

En 1972, durante su discurso de aceptación del Premio Nobel, el químico Christian Anfinsen recordó la importancia de no concebir las proteínas solo como cadenas de aminoácidos. Sin su forma tridimensional, no son nada. Por eso, es importante que los científicos sean capaces de predecir cómo ocurre.

Tres años antes, el biólogo molecular Cyrus Levinthal había avisado que enumerar todas las configuraciones posibles de una proteína podría llevar más años que la edad del universo. Lógicamente, no disponemos de ese tiempo. Pero cuando la proteína en cuestión es necesaria para comprender cómo se extiende por el cerebro la enfermedad de Alzheimer, tampoco disponemos de mucho menos. Se necesitaba un mecanismo que permitiera una predicción rápida. Por eso, con el avance de las técnicas computacionales y la inteligencia artificial, se supo que la clave debía residir en ellas. Otros científicos ya habían señalado que podría haber una correlación entre la propia secuencia de aminoácidos de cada proteína y la forma en la que se pliega. Pero era necesario determinarla.

Y eso es lo que ha conseguido DeepMind, con su algoritmo de plegamiento de proteínas AlphaFold.

Solucionando un problema de 50 años

Ya en enero de 2020, los científicos de DeepMind publicaron en Nature un estudio en el que mostraban cómo puede ayudar la inteligencia artificial a predecir el plegamiento de proteínas.

Este se basa en el entrenamiento de redes neuronales para determinar qué aminoácidos están en contacto. Para entenderlo, podemos imaginar una proteína como una cuerda formada por varios nudos, en la que cada nudo es un aminoácido. Cuando la cuerda se pliega, puede hacerlo de muchísimas formas, pero solo habrá una correcta, en la que unos aminoácidos concretos entrarán en contacto con otros.

Mediante la comparación con secuencias homólogas, estos científicos capacitaron su algoritmo para predecir la estructura tridimensional de una secuencia solicitada de aminoácidos. Pero aún quedaba la prueba de la verdad.

Evaluación crítica de la predicción de la estructura de proteínas

Desde que Anfinsen y Levinthal señalaron la importancia de predecir el plegamiento de las proteínas, muchos científicos han intentado desarrollar mecanismos capaces de hacerlo.

Con el fin de comprobar si alguno de estos funcionaba, en 1994 se fundó la Evaluación crítica de la predicción de la estructura de proteínas (CASP por sus siglas en inglés). En esta inspección bienal, los investigadores detrás de estos algoritmos pueden ponerlos a prueba. Para ello, se utilizan secuencias de proteínas cuya estructura se ha determinado experimentalmente en el laboratorio mediante técnicas como la cristalografía de rayos X o la resonancia magnética nuclear. Los científicos cuyos modelos se analizan no conocen estas estructuras, por lo que utilizan sus algoritmos y luego comparan los resultados.

El nivel de parecido se evalúa mediante una puntuación del 0 al 100, llamada GDT, con la que se indica el porcentaje de residuos de aminoácidos que se encuentran en una distancia umbral de la posición correcta. Una GDT de 90 ya se considera competitiva. Y la de AlphaFold ha sido de 92’4 de media. Incluso para las proteínas más difíciles alcanzaron una GDT de 87.

¿Por qué no se analiza siempre el plegamiento de proteínas experimentalmente?

Viendo que en la CASP ya conocen el plegamiento de las proteínas que se analizan, cabe plantearse por qué no se utilizan siempre los métodos experimentales. No obstante, esto a veces no es posible.

Para empezar, hacerlo mediante inteligencia artificial puede ser mucho más barato y rápido. Pero eso no es todo. Según explican los científicos de DeepMind en un comunicado, algunas proteínas, como las de membrana, son difíciles de cristalizar. Este es un paso intermedio necesario para realizar muchas de las técnicas experimentales. Por eso, sería muy tedioso y a veces incluso imposible.

En definitiva, lo que han conseguido estos científicos puede poner solución a un problema de medio siglo de antigüedad. Aquel científico que leía su discurso en 1972 sabía que algún día alguien lo lograría. Han sido necesarios muchos años, pero finalmente parecen haberlo conseguido.