El Gobierno de España ha presentado ALIA, un ambicioso proyecto que establece la primera infraestructura pública de inteligencia artificial (IA) en castellano y lenguas cooficiales. Impulsado por la Secretaría de Estado de Digitalización e Inteligencia Artificial y desarrollado por el Barcelona Supercomputing Center (BSC-CNS), ALIA busca reforzar la soberanía tecnológica del país y de Europa en el ámbito de la IA.

ALIA es una iniciativa pionera en la Unión Europea, con el objetivo de garantizar el acceso a modelos de IA de código abierto en castellano, catalán, euskera y gallego. Este enfoque responde a la necesidad de fortalecer la presencia de estas lenguas en la revolución tecnológica global y asegurar que los avances en IA sean inclusivos y accesibles para toda la sociedad.

Logotipo de ALIA con letras estilizadas en colores oscuros, verde, rosa y rojo, representando la diversidad y tecnología del proyecto.

La plataforma cuenta con una financiación 100% pública y está alineada con el Reglamento Europeo de IA, lo que garantiza transparencia, fiabilidad e innovación abierta. De esta manera, el proyecto beneficiará tanto a ciudadanos, administraciones públicas, universidades y empresas, facilitando el desarrollo de soluciones tecnológicas avanzadas en distintos sectores.

El entrenamiento y despliegue de los modelos de IA de ALIA requiere una gran capacidad de procesamiento, para lo cual se ha recurrido a MareNostrum 5, uno de los superordenadores más potentes del mundo, ubicado en el BSC-CNS. Este sistema permite procesar miles de millones de palabras en múltiples idiomas, asegurando el desarrollo de modelos de lenguaje de alta precisión.

ALIA ofrece una familia de modelos de lenguaje abiertos y multimodales que incluyen texto, voz e imagen. Entre los modelos disponibles destacan:

  • ALIA-40B: Modelo generativo multilingüe con 40.000 millones de parámetros.
  • Salamandra-7B y 2B (y sus versiones instruidas): Modelos entrenados en 35 idiomas europeos con miles de millones de tokens.
  • SalamandraTA-2B: Modelo de traducción automática para más de 30 idiomas.

Estos modelos están disponibles a través de ALIA Kit, un espacio que centraliza herramientas de IA en castellano y lenguas cooficiales, incluyendo modelos, metodologías, documentación y conjuntos de datos.

Además de los modelos de generación de texto, ALIA también incorpora sistemas de traducción automática neuronal, diseñados específicamente para preservar y potenciar la diversidad lingüística de España. Entre ellos se encuentran:

  • Modelos de traducción como Plume256k, Plume128k y Plume32k, enfocados en la lengua catalana.
  • Modelos específicos para traducción entre lenguas cooficiales como aina-translator-gl-ca (gallego-catalán), eu-ca (vasco-catalán), es-ast (español-asturiano), es-an (español-aragonés) y es-oc (español-aranés).

Además, el proyecto se apoya en bases de datos masivas como CATalog, que contiene más de 17.450 millones de palabras, así como en corpus paralelos de traducción automática que incluyen millones de frases en combinaciones como catalán-gallego, catalán-euskera o español-aragonés.

ALIA no solo fortalece la inteligencia artificial en español y lenguas cooficiales, sino que también representa un avance clave en la Estrategia Nacional de Inteligencia Artificial 2024 y en los objetivos de la Década Digital de la Unión Europea. Con su enfoque en la transparencia, accesibilidad e innovación, este proyecto posiciona a España en la vanguardia del desarrollo de IA pública y multilingüe en Europa.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí