InicioInternacionalesEspaña lanza ALIA, su primera IA pública para impulsar la investigación y...

España lanza ALIA, su primera IA pública para impulsar la investigación y la innovación

El presidente del Gobierno, Pedro Sánchez, ha anunciado este lunes el lanzamiento de los primeros modelos de lenguaje de ALIA, una iniciativa que comenzó en 2019 y que en 2025 comienza a materializarse. Esta iniciativa busca promover el desarrollo de la inteligencia artificial (IA), poniendo a disposición de todos recursos en español y lenguas cooficiales (catalán, valenciano, euskera y gallego).

Un paso hacia la democratización de la IA
El objetivo de ALIA es que los usuarios individuales y las empresas puedan utilizar estos recursos para investigar o desarrollar productos propios de IA. Además, la tecnología de ALIA será implementada en organismos públicos. Por ejemplo, se ha activado con dos proyectos piloto: un chatbot interno para la Agencia Tributaria y una solución para medicina de atención primaria que ayudará en el diagnóstico precoz de insuficiencias cardíacas.

ALIA ya está disponible para todos
ALIA se refiere a una serie de recursos de IA financiados con fondos públicos y verificados por la Agencia Española de Supervisión de la Inteligencia Artificial (AESIA). Los modelos de lenguaje han sido entrenados utilizando la infraestructura del Barcelona Supercomputing Center, especialmente el supercomputador MareNostrum 5, que ha estado en funcionamiento desde 2023 con una inversión superior a los 200 millones de euros.

Modelos de IA disponibles para su descarga
Actualmente, se han publicado cinco modelos bajo la licencia Apache 2.0 en plataformas como Hugging Face y GitHub. Esto permite a los interesados descargar los modelos y adaptarlos a sus necesidades. Sin embargo, se requiere un conocimiento técnico para ponerlos en funcionamiento. Los modelos disponibles son:

  • ALIA-40B: un modelo de lenguaje grande con 40 mil millones de parámetros entrenado con 9,2 billones de tokens. Comprende 36 idiomas.
  • Salamandra-7B: modelo de 7 mil millones de parámetros con 7,8 billones de tokens, capaz de comprender 36 idiomas.
  • Salamandra-7B-Instruct: un modelo entrenado con 276 mil instrucciones en inglés, castellano y catalán.
  • Salamandra-2B: modelo de 2 mil millones de parámetros con 7,8 billones de tokens, cubriendo 35 idiomas.
  • Salamandra-2B-Instruct: entrenado con 276 mil instrucciones en inglés, castellano y catalán.

Transparencia en el entrenamiento de los modelos
Una de las grandes preguntas en el mundo de la IA es con qué datos han sido entrenados los modelos. En el caso de ALIA, se ha prometido transparencia. El modelo ALIA-40B, por ejemplo, ha sido entrenado utilizando diversas fuentes de datos, como Common Crawl, GitHub, Wikimedia (que incluye Wikipedia, Wikilibros, Wikinoticias, Wikiquote, Wikisource, y Wikivoyage) y EurLex, entre otros.

(Xataka)