Este artículo se publicó hace más de 1 año
Inteligencia artificial y proteínas: el mapa del tesoro de AlphaFold

Acaba de publicarse la base de datos con las predicciones de las estructuras 3D de casi todas las proteínas catalogadas. El impacto en biología es incalculable, desde el desarrollo de una vacuna contra la malaria, la comprensión de la enfermedad de Parkinson, la salud de las abejas melíferas o la lucha contra la contaminación de plásticos.  

28/07/2022 - 17:37 CEST
 
proteina

Q8I3H7 es una proteína que puede proteger al parásito de la malaria contra el ataque del sistema inmunitario. DeepMind, EMBL

DeepMind y el Instituto Europeo de Bioinformática del EMBL (EMBL-EBI) acaban de poner a disposición de la comunidad científica, de forma gratuita y abierta, las predicciones basadas en Inteligencia Artificial (IA) de las estructuras tridimensionales de casi todas las proteínas catalogadas conocidas por la ciencia, a través de la base de datos de estructuras proteicas AlphaFold 

Las proteínas son los componentes básicos de la vida. Son la maquinaria de las células, desempeñan muchas funciones en el cuerpo y son muy necesarias para la regulación de tejidos y órganos. Su forma está estrechamente vinculada a su función. Poder tener una predicción de la estructura de una proteína en 3D permite comprender mejor lo que hace y cómo funciona.  

La biología estructural, que, entre otras cosas, se encarga de estudiar la estructura de las proteínas, es fundamental para entender cómo funcionan los componentes de la célula y tiene relevancia para prácticamente todas las áreas de investigación de las ciencias de la vida. Por eso se trata de un verdadero hito que pone una herramienta de gran valor en manos de todos los investigadores, de forma totalmente abierta, ayudándoles a ampliar el conocimiento y a afrontar los retos mundiales.  

Las proteínas son la maquinaria de las células y su forma está estrechamente vinculada a su función. Poder tener una predicción de la estructura en 3D permite comprender mejor lo que hace y cómo funciona

Durante los últimos meses, el equipo del Banco de Datos de Proteínas en Europa (PDBe por sus siglas en inglés) del EMBL-EBI y DeepMind han trabajado frenéticamente para multiplicar por 200 el tamaño de la base de datos, pasando de cerca de un millón a más de 200 millones de estructuras, que abarcan casi todos los organismos de la Tierra cuyo genoma ha sido secuenciado.

La ampliación de la base de datos incluye estructuras predichas para la más amplia gama de especies, incluyendo plantas, bacterias, animales y otros organismos. Esto abre nuevas vías de investigación en las ciencias de la vida que tendrán un impacto en los desafíos globales, desde el desarrollo de una vacuna eficaz contra la malaria, la comprensión de la enfermedad de Parkinson, mejorar la salud de las abejas melíferas o la lucha contra la contaminación de plásticos 

Aunque estas predicciones no son el tesoro en sí, sí representan el mapa que nos puede conducir a él

Aunque se trata de predicciones y algunas pueden contener errores, la base de datos permitirá a los científicos diseñar experimentos y comprobar hipótesis basadas en estas estructuras, facilitando enormemente su trabajo. Por analogía, podríamos decir que, aunque estas predicciones no son el tesoro en sí, sí representan el mapa que nos puede conducir a él.

El trabajo y las oportunidades que se abren para la comunidad científica son enormes, el impacto en todas las áreas de la biología es incalculable. Esta versión de la base de datos también dará un paso más para abrir nuevas vías de investigación en la bioinformática y el análisis computacional, permitiendo a los investigadores detectar potencialmente patrones y tendencias en la base de datos que nos permitan entender los principios fundamentales que determinan el plegamiento de las proteínas 

José Antonio Márquez es director de la Plataforma de Cristalografía del Laboratorio Europeo de Biología Molecular (EMBL), en Grenoble.
Las 5W +1
Publica
FAQ
Contacto