Autor/es reacciones

Alfonso Valencia

Profesor ICREA y director de Ciencias de la Vida en el Centro Nacional de Supercomputación de Barcelona​ (BSC)

Este trabajo representa una nueva tendencia en el desarrollo de herramientas predictivas. Tradicionalmente se recopilan datos existentes, como información sobre proteínas que se sabe que forman agregados, y luego se diseña un método computacional para analizarlos. Aquí se invierte el proceso: primero se crea un sistema experimental robusto, rápido y económico para generar datos artificiales a gran escala, datos más amplios y variados que los disponibles en la naturaleza y, por tanto, potencialmente mejores para entrenar un sistema con mejores capacidades predictivas.   

En esta publicación, investigadores del CRG e IBEC han diseñado un ensayo a gran escala que mide la agregación de proteínas mediante la tasa de crecimiento de células que expresan fragmentos de ADN aleatorios de longitud definida. Una red neuronal entrenada con estos datos clasifica con precisión los fragmentos que promueven la agregación, superando a métodos anteriores basados en datos de proteínas reales. La aparente paradoja es que una gran cantidad de datos artificiales pueda ser más útil que una pequeña cantidad de datos "de alta calidad". Como precedente, el grupo de Oded Regev, trabajando en un área específica de genómica, diseñó un sistema capaz generar y evaluar cientos de miles de secuencias artificiales para entrenar su nuevo predictor.   

En términos generales, esta publicación avanza en la comprensión de la agregación de proteínas, un tema con importantes implicaciones biomédicas (enfermedades neurodegenerativas) y biotecnológicas (producción industrial de proteínas). Utilizando tecnología de interpretación de los resultados de redes neuronales, el estudio sugiere una nueva versión de los patrones de secuencia que favorecen la agregación, lo que puede contribuir a comprender cómo las mutaciones y los factores externos influyen en el proceso de agregación e indicar como controlarlo. 

ES