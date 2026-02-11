Este martes 10 de febrero se lanzó Latam-GPT, el primer Gran Modelo de Lenguaje abierto de la región, diseñado con identidad propia desde y para América Latina y el Caribe, fruto de un trabajo coordinado por el Centro Nacional de Inteligencia Artificial (CENIA) en colaboración con diversas entidades regionales.

Latam-GPT representa un avance relevante para la región al proponer un modelo de Inteligencia Artificial (IA) construido con idiomas, datos y contextos propios de América Latina y el Caribe, desarrollado por talento regional para la región.

A diferencia de los modelos entrenados principalmente con información en inglés y marcos culturales del Norte Global, Latam-GPT comprende los matices culturales, lingüísticos y los contextos históricos y políticos latinoamericanos.

Este modelo, desarrollado por investigadores, científicos y profesionales de la región, posiciona a América Latina no solo como usuaria de tecnología de vanguardia, sino como protagonista en su creación, fortaleciendo la capacidad regional para innovar con identidad propia.

Rafael Mattje AWS, líder de Tecnología de Amazon Web Services para el Cono Sur de América Latina. Crédito: LatamGPT | Impremedia

Primer Gran Modelo de Lenguaje abierto de Latinoamérica

El desarrollo del primer Gran Modelo de Lenguaje abierto de la región fue liderado por el Centro Nacional de Inteligencia Artificial con la colaboración del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de Chile, el Banco de Desarrollo de América Latina y el Caribe (CAF), Amazon Web Services (AWS) y el centro tecnológico Data Observatory, además de la colaboración de diversos Estados de la región y alianzas desde la academia, organismos internacionales, y líderes tecnológicos.

El hito tecnológico contó con la presencia del Presidente de Chile, Gabriel Boric; el ministro de Ciencia chileno, Aldo Valle; el director CENIA, Álvaro Soto; el Especialista Principal de Ciudades Inteligentes y Desarrollo Digital del Banco de Desarrollo de América Latina y el Caribe, Marcelo Facchina; el líder de Tecnología de Amazon Web Services para el Cono Sur de América Latina, Rafael Mattje; y el director ejecutivo del Data Observatory, Rodrigo Roa.

A diferencia de las soluciones comerciales cerradas, Latam-GPT fue concebido como un bien público orientado a democratizar el acceso a esta tecnología y habilitar su uso en ámbitos estratégicos como educación, gestión pública e innovación productiva. Ello, gracias a su diseño de código abierto, que permitiría a universidades, gobiernos, startups y diversas comunidades, desarrollar soluciones propias sobre una base común, transparente y trazable.

El foco está en soluciones de IA que comprendan los contextos y nuances culturales, lingüísticos e históricos de América Latina. Crédito: Shutterstock

“Eso que se expresa en manifestaciones culturales de esas características también es necesario que, en estos tiempos, tenga una expresión en el lenguaje. Y el lenguaje de hoy día nos guste o no nos guste está muy determinado por la inteligencia artificial. Entonces, no tenemos que temerle, no tenemos que verla sólo como amenaza, tenemos que verla como oportunidad y eso es lo que está haciendo LATAM-GPT hoy día”, sostuvo Boric.

“Latam-GPT permite que América Latina se suba a la revolución de la IA como actor, desarrollando tecnología propia y demostrando lo que se es posible cuando la región trabaja unida”, comentó Álvaro Soto, director de CENIA.

“Latam-GPT demuestra que la colaboración regional liderada por el talento calificado de CENIA, apoyada en infraestructura tecnológica de clase mundial, puede convertir una visión en impacto real. Desde AWS, aportamos lo más avanzado en tecnología de nube e IA para apoyar el entrenamiento del modelo —una de las fases más críticas para este tipo de proyecto—, optimizando la infraestructura y reduciendo el tiempo de entrenamiento en un 64%, de 25 a 9 días”, sostuvo Rafael Mattje, Líder de Tecnología de Amazon Web Services para el Cono Sur de América Latina.

“Este proyecto establece un marco replicable para que gobiernos, universidades y empresas desarrollen soluciones de IA que comprendan los contextos y nuances culturales, lingüísticos e históricos de América Latina. Estamos comprometidos con democratizar el acceso a capacidades avanzadas de IA y seguiremos contribuyendo para que el talento latinoamericano construya el futuro de la tecnología”, concluyó.

En un contexto global en el que la inteligencia artificial está redefiniendo la productividad, la competitividad y el funcionamiento de las economías y sociedades, América Latina y el Caribe enfrentan el desafío de construir capacidades propias para participar plenamente en esta transformación.

“En ese marco, Latam-GPT representa un paso concreto hacia una mayor soberanía tecnológica y cultural y una oportunidad para que América Latina y el Caribe se posicionen como actores activos en la economía digital del futuro”, afirmó Sergio Díaz-Granados, Presidente Ejecutivo de CAF.

“Latam-GPT marca un hito en la soberanía digital de América Latina y demuestra que sí podemos ser protagonistas del desarrollo tecnológico. Como Data Observatory nos enorgullece haber aportado nuestra infraestructura en la nube, capacidad de procesamiento de datos y la experiencia de nuestro equipo para operar esta tecnología con eficiencia”, comentó Rodrigo Roa, Director Ejecutivo de Data Observatory.

Idiomas y datos locales

La construcción de Latam-GPT responde a una brecha histórica en el desarrollo de modelos de lenguaje a nivel global, ya que, según estimaciones basadas en repositorios abiertos como Common Crawl, los datos en español y portugués representan -respectivamente- apenas cerca del 4% y el 2% del total utilizado para entrenar este tipo de sistemas.

Esta subrepresentación implicó que las realidades latinoamericanas no fueran consideradas de manera adecuada ni en el diseño ni en el entrenamiento inicial de gran parte de los modelos disponibles hoy, quedando incorporadas, en muchos casos, a través de ajustes posteriores y mecanismos de corrección, y no como parte constitutiva de su arquitectura.

Frente a este escenario, Latam-GPT fue entrenado desde su origen para comprender las variantes del español y el portugués, así como las historias, memorias e identidades culturales de la región. Esto permitió procesar, generar y analizar idiomas de manera situada y contextualizada, con potencial aplicación en investigación, gestión pública y desarrollo tecnológico.

Una colaboración regional sin precedentes liderada por talento latinoamericano

Para llegar a la creación de un modelo 1.0 de Latam-GPT, el proceso consideró la recolección y curaduría de datos, además de un periodo de pre-training y post-training.

Cabe mencionar que el modelo se desarrolló sobre una arquitectura base Llama 3.1 – 70 mil millones de parámetros, complementada con un corpus regional -un conjunto organizado de textos y contenidos con los que se entrena un modelo de lenguaje y que le permite comprender el contexto cultural e identitario de la región- obtenido bajo permisos. Ello, además de benchmarks adaptados al contexto latinoamericano y una documentación rigurosa en materia ética y de gobernanza.

La construcción de Latam-GPT fue posible gracias a una colaboración inédita entre instituciones públicas, académicas y tecnológicas de la región, articulando a más de 100 profesionales y más de 60 instituciones de 15 países, que aportaron datos, conocimiento y experiencia técnica.

En total, se reunieron más de 300 mil millones de tokens de texto plano, equivalentes a alrededor de 230 mil millones de palabras, obtenidos bajo permisos y licencias explícitas, curados de tal manera de asegurar la anonimización de datos y eliminar elementos tóxicos (como noticias falsas o discriminación, por ejemplo).

Gracias a ese proceso, el modelo cuenta con un dataset de alta calidad en áreas como humanidades y ciencias sociales, educación, ciencias de la salud, políticas públicas, economía, medioambiente, artes y pueblos indígenas.

Impulso a la innovación

Latam-GPT nace con una convicción estratégica: poner la Inteligencia Artificial al servicio de las personas, propósito que requiere dominar la tecnología, comprender sus impactos y definir reglas claras para un diseño responsable.

Uno de los objetivos centrales del proyecto es fortalecer las capacidades técnicas de América Latina para liderar sus propios procesos de innovación.

Para el director de CENIA, “Latam-GPT no es un fin en sí mismo, sino una base tecnológica abierta que permite desarrollar modelos derivados y aplicaciones adaptadas a distintos contextos regionales, apoyadas por herramientas y materiales que facilitan su uso y evolución. De este modo, la región no es solo usuaria de IA, sino que puede crear soluciones propias a partir de capacidades compartidas”.

Con un impacto proyectado que podría mejorar la productividad de hasta el 50% de la fuerza laboral latinoamericana, Latam-GPT queda a disposición de gobiernos, universidades y emprendedores como una plataforma abierta para el desarrollo de soluciones éticas, transparentes y alineadas con las necesidades de la región.

