El proyecto científico ‘TeresIA',desarrollado por el Consejo Superior de Investigaciones Científicas (CSIC) para generar un portal de acceso a terminología en español de alcance panhispánico aplicando herramientas novedosas de inteligencia artificial. ha sido presentado este lunes en Bruselas. El objetivo de TeresIA' es facilitar las traducciones y redacciones de textos.
El proyecto ha sido financiado por la Secretaría de Estado de Digitalización e Inteligencia Artificial del Ministerio de Transformación Digital con 1,4 millones procedentes del Plan de Recuperación, Transformación y Resiliencia y está enmarcado en el Proyecto Estratégico (PERTE) de la Nueva Economía de la Lengua.
TeresIA se convertirá en una herramienta de gran utilidad para traductores e intérpretes del y al español y permitirá crear un metabuscador para terminologías en español –con vocabulario de todo el espectro panhispánico– como respuesta a la dispersión de las terminologías procedentes de ámbitos especializados (jurídico, médico, y otros).
También pondrá a disposición de organismos e instituciones un portal de tecnologías de inteligencia artificial que permitirán validar nuevas terminologías que se irán incorporando al metabuscador y garantizar su interoperabilidad. Además, TeresIA creará un corpus de literatura científica en español; diseñará una metodología de extracción de información aplicando técnicas de inteligencia artificial (IA) y Procesamiento del Lenguaje Natural (PLN) para extraer términos, mostrarlos en su contexto, validarlos, sancionarlos, transformarlos a formatos de la web de datos y hacerlos visibles y recuperables en distintos entornos, incluido el metabuscador.
El proyecto se ha presentado este lunes en la delegación del CSIC en Bruselas con la asistencia de la Comisionada del PERTE Nueva Economía de la Lengua, Cristina Gallach, y la investigadora que dirige el proyecto, Elea Giménez Toledo, científica titular del Grupo de Investigación sobre el Libro Académico del Instituto de Filosofía del CSIC y coordinadora de la plataforma ES CIENCIA.
El acto se enmarca en la Presidencia española del Consejo de la UE. “Al trabajar con estándares tecnológicos, las palabras de la ciencia en español se conectarán con las palabras de la ciencia en otros idiomas. De este modo, se multiplican las posibilidades de recuperar y descubrir contenidos científicos en distintos idiomas. Además, se preserva la riqueza terminológica de cada lengua, se favorecen las traducciones especializadas (tanto la humanas como las automáticas), se entrenan algoritmos, y se mejora la enseñanza del español de especialidades, entre otras aplicaciones”, detalla Giménez Toledo.
“Ese carácter multilingüe de TeresIA es compartido desde el PERTE de la Nueva Economía de la Lengua, donde apoyamos el español y las lenguas cooficiales para que ganen terreno en el ámbito digital, tecnológico, cultural, de la enseñanza, entre otros. Si no lo hacemos, no seremos capaces de garantizar su supervivencia en el futuro. Por ello, es necesario que desde el PERTE –gracias a los fondos NextGeneration del Plan de Recuperación– apoyemos iniciativas como TeresIA”, ha señalado la comisionada Gallach.
Colaboración interinstitucional
El proyecto se desarrollará conjuntamente por un consorcio conformado por siete instituciones: la Plataforma Temática Interdisciplinar (PTI) ES CIENCIA, del CSIC; el Instituto Cervantes; el Centro Nacional de Supercomputación (BSC); el Grupo de Ingeniería Ontológica de la Universidad Politécnica de la Asociación Española de Terminología (AETER) y la Real Academia de Ingeniería (RAI), que contarán con el apoyo del Departamento de Lengua Española de la Dirección General de Traducción de la Comisión Europea.
La idea inicial de TeresIA surgió hace más de quince años, pero no había podido desarrollarse hasta el momento. La colaboración interinstitucional, los procesos innovadores introducidos en el proyecto, la visión política para apoyarlo y la oportunidad de los fondos europeos NextGeneration del Plan de Recuperación, han hecho que, finalmente, pueda ejecutarse.
El nombre del proyecto reconoce el destacado trabajo de la lingüista y filóloga Teresa Cabré en el campo de la terminología.