Singapur lidera iniciativa para desarrollar modelo de lenguaje multimodal para el sudeste asiático

Singapur invierte $52 millones en desarrollar un modelo de lenguaje único diferente al de las naciones occidentales.

Proyecto de investigación construye un gran modelo de IA de lenguaje para el sudeste asiático

🌐 Globo del Sudeste Asiático 🌐

Se está llevando a cabo una nueva iniciativa de investigación para construir un gran modelo de lenguaje (LLM, por sus siglas en inglés) que se ajuste mejor a la demografía de las naciones del sudeste asiático.

Presentando el Programa Nacional de LLM Multimodal

Denominada el Programa Nacional de LLM Multimodal, esta emocionante iniciativa está liderada por Singapur y tiene como objetivo desarrollar un modelo de lenguaje artificial (IA) grande que apoye la diversidad cultural y lingüística de la región. 🇸🇬

Tres agencias gubernamentales: la Autoridad de Desarrollo de Infocomunicaciones y Medios (IMDA), AI Singapore (AISG) y la Agencia de Ciencia, Tecnología e Investigación (A*STAR), han colaborado para lanzar el programa de investigación, con una financiación de SG$70 millones ($52.48 millones) de la Fundación Nacional de Investigación.

Por qué el Sudeste Asiático necesita modelos de lenguaje localizados

“A medida que la tecnología evoluciona rápidamente, existe una necesidad estratégica de desarrollar capacidades soberanas en LLMs”, afirmaron las agencias en un comunicado conjunto. “Singapur y las culturas, valores y normas locales y regionales de la región difieren de las de los países occidentales, de donde provienen la mayoría de los grandes modelos de lenguaje”.

Para comprender verdaderamente el contexto y los valores relacionados con las diversas culturas e idiomas de la región, es crucial desarrollar LLMs multimodales y localizados para el sudeste asiático. Esto incluye abordar los desafíos del cambio de contexto entre los idiomas en la población multilingüe de Singapur.

Desarrollando capacidades de investigación e ingeniería

La iniciativa de investigación aprovechará los recursos de computación de alto rendimiento del Centro Nacional de Supercomputación de Singapur y se centrará en desarrollar las capacidades de investigación e ingeniería del país en LLMs multimodales. El compromiso de Singapur de convertirse en un centro mundial de IA es evidente, con Ong Chen Hui, director ejecutivo asistente de IMDA en el grupo de tecnología empresarial, afirmando: “El lenguaje es un habilitador esencial para la colaboración. Al invertir en talento y modelos de IA de gran lenguaje para idiomas regionales, queremos fomentar la colaboración de la industria a través de las fronteras y impulsar la próxima ola de innovación en IA en el sudeste asiático”.

SEA-LION: Un paso hacia una mayor localización

La iniciativa se basará en los esfuerzos actuales de AISG en Southeast Asian Languages in One Network (SEA-LION), un LLM de código abierto diseñado para ser más pequeño, flexible y rápido en comparación con los LLMs actualmente presentes en el mercado. SEA-LION se basa en dos modelos principales: un modelo de tres mil millones de parámetros y un modelo de siete mil millones de parámetros.

Al crear LLMs que representen mejor a las poblaciones “no WEIRD” (no occidentales, educadas, industrializadas, ricas, democráticas), SEA-LION tiene como objetivo contrarrestar los sesgos que se encuentran en los modelos existentes. Con sus datos de entrenamiento que consisten en 981 mil millones de tokens de lenguaje, SEA-LION tiene el potencial de cerrar la brecha y proporcionar una representación más precisa de los idiomas y culturas del sudeste asiático.

La ambiciosa estrategia de IA de Singapur

Los esfuerzos para construir LLMs localizados se alinean con la estrategia de IA de Singapur, que tiene como objetivo establecer al país como un centro global de desarrollo de soluciones de IA para el año 2030. Esta estrategia integral incluye planes para triplicar el número de profesionales en IA en el país a 15,000 en los próximos tres a cinco años, junto con iniciativas centradas en la gobernanza, pruebas, referencia y pautas de ética y seguridad de la IA.

El Viceprimer Ministro de Singapur, Lawrence Wong, hizo hincapié en la importancia del desarrollo y adopción responsable de la IA en su declaración en el lanzamiento de la estrategia nacional de IA. A medida que la IA avanza, destacó la posibilidad de máquinas con habilidades cognitivas similares a las humanas, autoconciencia y toma de decisiones independiente. Por lo tanto, es crucial guiar el desarrollo y la adopción de la IA de manera deliberada.

Preguntas y respuestas: ¿qué más quieren saber los lectores?

P: ¿Qué es un gran modelo de lenguaje (LLM)? R: Un gran modelo de lenguaje es un sistema de IA capaz de generar texto similar al humano, responder preguntas y comprender el contexto del lenguaje. Utiliza una gran cantidad de datos para aprender y replicar patrones de lenguaje similares a los humanos.

P: ¿Cómo muestran sesgos los modelos de lenguaje existentes? R: Los modelos de lenguaje existentes a menudo muestran sesgos debido a los datos de entrenamiento que utilizan, que son obtenidos con frecuencia de Internet. Estos datos tienden a tener un origen occidental, educado, industrializado, rico y democrático (WEIRD), creando sesgos en valores culturales, creencias políticas y actitudes sociales. Las personas de origen no WEIRD tienen menos representación en estos modelos.

P: ¿Cuáles son los beneficios de construir modelos de lenguaje localizados? R: Construir modelos de lenguaje localizados permite una mejor comprensión de los matices, contexto cultural y valores específicos de una región en particular. Al abordar los sesgos y limitaciones de los modelos existentes, los modelos localizados brindan representaciones más precisas y permiten avances en las aplicaciones de IA para los idiomas regionales.

P: ¿Cómo contribuye SEA-LION a la localización del lenguaje? R: SEA-LION es un LLM de código abierto diseñado específicamente para representar a poblaciones no-WEIRD. Al aprovechar sus datos de entrenamiento, que incluyen tokens de lenguaje de Asia Sudoriental y regiones de habla china, SEA-LION tiene como objetivo proporcionar un modelo de lenguaje más inclusivo y completo para las culturas del sudeste asiático.

P: ¿Cuáles son las implicaciones a largo plazo de la estrategia de IA de Singapur? R: La estrategia de IA de Singapur tiene como objetivo posicionar al país como líder mundial en el desarrollo de IA. Al fomentar la colaboración de la industria, aumentar el número de profesionales de IA y centrarse en la gobernanza y la ética, Singapur tiene como objetivo impulsar la innovación, el crecimiento económico y el progreso social en el campo de la IA.

En conclusión

El Programa Nacional LLM Multimodal liderado por Singapur demuestra un compromiso con el desarrollo de modelos de lenguaje de IA que representen mejor las culturas y los idiomas del sudeste asiático. Al abordar los sesgos, los contextos específicos del lenguaje y los valores locales, estos modelos localizados allanarán el camino para avances en las aplicaciones de IA y fomentarán la innovación en la región. La ambiciosa estrategia de IA de Singapur posiciona al país como líder mundial en el desarrollo de IA, enfatizando la importancia de la adopción responsable de la IA y la necesidad de abrazar el poder transformador de la IA.


Referencias:
1. TomTom y Microsoft lanzan asistente de conducción de IA 2. La ética de la IA generativa: cómo podemos aprovechar esta poderosa tecnología 3. DALL·E 3: Cómo ChatGPT puede leer y modificar imágenes, ven a ver 4. Una pregunta espinosa: ¿quién es dueño del código, las imágenes y las narrativas generadas por la IA? 5. Propietario de CBS Paramount National Amusements dice que fue hackeado 6. OpenAI lanza parche de fuga de datos de ChatGPT: problema completamente solucionado 7. 7 consejos avanzados para escribir solicitudes en ChatGPT que necesitas saber


¿Encontraste este artículo fascinante? ¡Comparte tus pensamientos en los comentarios y no olvides difundir la palabra compartiendo este artículo en tus plataformas de redes sociales favoritas! 🚀😄