Maite Martín
Catedrática del departamento de Informática de la Universidad de Jaén e investigadora del grupo de investigación SINAI (Sistemas INteligentes de Acceso a la Información)
El artículo presenta un modelo de traducción automática multimodal y multilingüe llamado SEAMLESSM4T, desarrollado para superar las limitaciones actuales en la traducción de texto y habla, incluyendo traducciones entre lenguajes de pocos recursos. Este modelo unificado permite realizar tareas como traducción de habla a habla, habla a texto, texto a texto y texto a habla, con soporte para hasta 101 idiomas de origen y hasta 36 idiomas de destino en modalidades de habla.
Desde mi punto de vista, uno de los aspectos más destacados del modelo es su enfoque en estudiar e incorporar idiomas con pocos recursos, como el maltés y el suajili, que han sido históricamente excluidos de los avances tecnológicos en traducción automática. Estos idiomas, al carecer de grandes volúmenes de datos etiquetados y recursos específicos, suelen quedar rezagados en el desarrollo de herramientas lingüísticas avanzadas. Sin embargo, el trabajo realizado aborda esta brecha mediante la creación de un corpus masivo de datos de habla y texto alineados. Este corpus combina datos etiquetados manualmente con recursos generados automáticamente, lo que permite ampliar significativamente el alcance y la precisión del modelo en lenguas menos representadas. Este esfuerzo no solo mejora la accesibilidad de las tecnologías de traducción para estas comunidades, sino que también marca un avance en la inclusión lingüística al democratizar el acceso a herramientas avanzadas de comunicación.
Otro aspecto igualmente relevante del trabajo es la decisión de poner estos datos y herramientas a disposición de la comunidad científica para uso no comercial. Este enfoque fomenta la investigación colaborativa, al permitir que otros desarrolladores e investigadores utilicen estos recursos para seguir avanzando en la traducción automática, especialmente en contextos multilingües y multimodales. La publicación de estos recursos no solo consolida el modelo como un referente en innovación tecnológica, sino que también impulsa el desarrollo de soluciones más inclusivas y equitativas, sentando las bases para un ecosistema de investigación más abierto y dinámico.
El modelo, sin embargo, también enfrenta limitaciones importantes. Aunque mejora la precisión en la traducción de lenguajes con pocos recursos, los resultados aún son inferiores a los obtenidos con idiomas de alta disponibilidad. Además, aspectos como la interacción en tiempo real, la expresividad de la voz traducida y la mitigación de sesgos de género y toxicidad siguen siendo desafíos abiertos. Estas limitaciones sugieren que, aunque SEAMLESSM4T supone un avance significativo, todavía queda trabajo por hacer para optimizar su implementación en escenarios prácticos.