DeepMind y el Instituto Europeo de Bioinformática del EMBL (EMBL-EBI) acaban de poner a disposición de la comunidad científica, de forma gratuita y abierta, las predicciones basadas en Inteligencia Artificial (IA) de las estructuras tridimensionales de casi todas las proteínas catalogadas conocidas por la ciencia, a través de la base de datos de estructuras proteicas AlphaFold.
Las proteínas son los componentes básicos de la vida. Son la maquinaria de las células, desempeñan muchas funciones en el cuerpo y son muy necesarias para la regulación de tejidos y órganos. Su forma está estrechamente vinculada a su función. Poder tener una predicción de la estructura de una proteína en 3D permite comprender mejor lo que hace y cómo funciona.
La biología estructural, que, entre otras cosas, se encarga de estudiar la estructura de las proteínas, es fundamental para entender cómo funcionan los componentes de la célula y tiene relevancia para prácticamente todas las áreas de investigación de las ciencias de la vida. Por eso se trata de un verdadero hito que pone una herramienta de gran valor en manos de todos los investigadores, de forma totalmente abierta, ayudándoles a ampliar el conocimiento y a afrontar los retos mundiales.
Las proteínas son la maquinaria de las células y su forma está estrechamente vinculada a su función. Poder tener una predicción de la estructura en 3D permite comprender mejor lo que hace y cómo funciona
Durante los últimos meses, el equipo del Banco de Datos de Proteínas en Europa (PDBe por sus siglas en inglés) del EMBL-EBI y DeepMind han trabajado frenéticamente para multiplicar por 200 el tamaño de la base de datos, pasando de cerca de un millón a más de 200 millones de estructuras, que abarcan casi todos los organismos de la Tierra cuyo genoma ha sido secuenciado.
La ampliación de la base de datos incluye estructuras predichas para la más amplia gama de especies, incluyendo plantas, bacterias, animales y otros organismos. Esto abre nuevas vías de investigación en las ciencias de la vida que tendrán un impacto en los desafíos globales, desde el desarrollo de una vacuna eficaz contra la malaria, la comprensión de la enfermedad de Parkinson, mejorar la salud de las abejas melíferas o la lucha contra la contaminación de plásticos.
Aunque estas predicciones no son el tesoro en sí, sí representan el mapa que nos puede conducir a él
Aunque se trata de predicciones y algunas pueden contener errores, la base de datos permitirá a los científicos diseñar experimentos y comprobar hipótesis basadas en estas estructuras, facilitando enormemente su trabajo. Por analogía, podríamos decir que, aunque estas predicciones no son el tesoro en sí, sí representan el mapa que nos puede conducir a él.
El trabajo y las oportunidades que se abren para la comunidad científica son enormes, el impacto en todas las áreas de la biología es incalculable. Esta versión de la base de datos también dará un paso más para abrir nuevas vías de investigación en la bioinformática y el análisis computacional, permitiendo a los investigadores detectar potencialmente patrones y tendencias en la base de datos que nos permitan entender los principios fundamentales que determinan el plegamiento de las proteínas.