Nueva iniciativa de investigación tiene como objetivo construir un gran modelo de IA de lenguaje para el sudeste de Asia

Una nueva iniciativa de investigación busca construir un gran modelo de inteligencia artificial de lenguaje para el sudeste de Asia

Globo del Sudeste Asiático

Se está llevando a cabo una nueva iniciativa de investigación para construir un modelo de lenguaje amplio (LLM) que se ajuste mejor a la demografía de las naciones del sudeste asiático.

Denominada “Programa Nacional de LLM Multimodal”, la iniciativa está liderada por Singapur en un intento de desarrollar un modelo de lenguaje amplio de inteligencia artificial (IA) que respalde la diversidad cultural y lingüística de la región.

También: La ética de la IA generativa: cómo podemos aprovechar esta poderosa tecnología

Tres agencias gubernamentales, la Autoridad de Desarrollo de Medios de Infocomunicación (IMDA), IA Singapur (AISG) y la Agencia de Ciencia, Tecnología e Investigación (A*STAR), han colaborado para lanzar el programa de investigación, con fondos por valor de SG$70 millones (52,48 millones de dólares) de la Fundación Nacional de Investigación.

“A medida que la tecnología evoluciona rápidamente, existe la necesidad estratégica de desarrollar capacidades soberanas en LLM”, dijeron las agencias en un comunicado conjunto. “Singapur y las culturas, valores y normas locales y regionales de la región difieren de las de los países occidentales, de donde provienen la mayoría de los modelos de lenguaje amplio”.

Subrayaron la importancia de desarrollar LLM multimodales y localizados para el sudeste asiático, incluido Singapur, que comprendan el contexto y los valores relacionados con las diversas culturas y lenguajes de la región. Estas variabilidades pueden incluir, por ejemplo, el cambio de idiomas en la población multilingüe de Singapur.

También: Una pregunta espinosa: ¿quién es dueño del código, las imágenes y las narrativas generadas por la IA?

La iniciativa de investigación aprovechará los recursos informáticos de alto rendimiento del Centro Nacional de Supercomputación de Singapur y buscará desarrollar las capacidades de investigación e ingeniería del país en LLM multimodales.

“Este esfuerzo nacional destaca el compromiso de Singapur de convertirse en un centro mundial de IA”, dijo Ong Chen Hui, director ejecutivo adjunto de IMDA. “El lenguaje es un habilitador esencial para la colaboración. Al invertir en talento y en modelos de IA de lenguaje amplio para idiomas regionales, queremos fomentar la colaboración industrial a través de las fronteras y impulsar la próxima ola de innovación en IA en el sudeste asiático”.

La iniciativa se basará en los esfuerzos actuales de SEA-LION (Southeast Asian Languages in One Network) de AISG, que es un LLM de código abierto que la agencia gubernamental dijo que está diseñado para ser más pequeño, flexible y rápido en comparación con los LLM del mercado actual. SEA-LION actualmente se ejecuta en dos modelos base: un modelo de tres mil millones de parámetros y un modelo de siete mil millones de parámetros.

Al explicar la importancia del modelo de código abierto, AISG dijo: “Los LLM existentes muestran un fuerte sesgo en términos de valores culturales, creencias políticas y actitudes sociales. Esto se debe a los datos de entrenamiento, especialmente aquellos recopilados de Internet, que a menudo tienen un origen desproporcionadamente grande basado en la cultura WEIRD. WEIRD se refiere a sociedades occidentales, educadas, industrializadas, ricas y democráticas. Las personas de origen no occidental son menos propensas a ser alfabetizadas, a usar Internet y a que sus resultados sean fácilmente accesibles”.

También: 7 consejos avanzados para escribir indicaciones de ChatGPT que necesitas conocer

SEA-LION tiene como objetivo establecer LLM que representen mejor a las poblaciones “no occidentales”. Sus datos de entrenamiento constan de 981 mil millones de tokens de lenguaje, que AISG define como fragmentos de palabras creadas al descomponer el texto durante el proceso de tokenización. Estos fragmentos incluyen 623 mil millones de tokens en inglés, 128 mil millones de tokens del sudeste asiático y 91 mil millones de tokens en chino.

Los esfuerzos para construir LLMs localizados son parte de la última estrategia de IA de Singapur, que busca impulsar su ambición de convertirse en un centro de desarrollo global de soluciones de IA para 2030. Estos esfuerzos incluyen planes para triplicar el número de profesionales de IA en el país a 15,000 en los próximos tres a cinco años y brindar un ecosistema que respalde la gobernabilidad, pruebas y evaluación de referencia, junto con directrices sobre ética y seguridad de IA.

Al señalar que el mundo se dirige hacia un territorio desconocido con los últimos avances en IA, el viceprimer ministro de Singapur, Lawrence Wong, dijo en el lanzamiento de la estrategia nacional de IA: “Hasta ahora, la IA se ha centrado principalmente en el reconocimiento de patrones. Pero en el futuro, tendremos sistemas de IA con agencia y capacidad transaccional. Tendremos máquinas con habilidades cognitivas similares a las humanas y capacidad para la autoconciencia y la toma de decisiones independiente”.

Con el potencial de cambiar significativamente la vida humana e impactar a las sociedades, el desarrollo y la adopción responsable de la IA deben ser guiados de manera más deliberada, señaló Wong.