Meta usó contratistas disfrazados de adolescentes para espiar los chatbots de sus rivales

Meta intentó probar los límites de seguridad de chatbots rivales con la ayuda de contratistas

Los contratistas utilizaron cuentas falsas para hacerse pasar por usuarios menores de edad

Los contratistas utilizaron cuentas falsas para hacerse pasar por usuarios menores de edad Crédito: Shutterstock

La industria de la inteligencia artificial acaba de protagonizar uno de sus escándalos más llamativos. Según una investigación de WIRED publicada el 28 de junio de 2026, Meta habría contratado a cientos de trabajadores para hacerse pasar por menores de edad y probar los límites de seguridad de chatbots rivales, incluyendo ChatGPT de OpenAI, Gemini de Google y Character.AI.

La operación, bautizada internamente como “Proyecto Cannes”, fue gestionada a través de la empresa contratista Covalen y estuvo activa al menos hasta el 21 de abril de 2026. Lo que hace que este caso sea particularmente impactante no es solo lo que se hizo, sino cómo se hizo, quién lo ordenó y qué revela sobre las verdaderas motivaciones detrás de la llamada “seguridad en IA”.

El método que nadie esperaba de una empresa de Silicon Valley

Los contratistas tenían instrucciones muy específicas. Primero, creaban cuentas falsas con fechas de nacimiento que los identificaban como menores de 18 años, usando correos desechables de Gmail y Outlook con una contraseña compartida. Luego, enviaban mensajes diseñados para provocar respuestas que los sistemas de seguridad de esos chatbots debían bloquear.

Los temas no eran casuales ni menores. Cientos de mensajes estaban relacionados con suicidio y autolesiones. Otros tantos abordaban trastornos alimentarios. Al menos 239 prompts hacían referencia a sexo o romance, mientras que el resto tocaba drogas, insultos raciales y lenguaje ofensivo. Para ir más lejos, algunos contratistas también enviaban imágenes de pastillas, cuchillos, lazos y diagramas médicos ginecológicos.

Una sola ronda de pruebas completada en agosto de 2025 llegó a involucrar más de 45,000 prompts enviados a los chatbots rivales, según los documentos internos revisados por WIRED. Una escala que hace difícil hablar de algo improvisado o marginal.

¿Fue realmente una prueba de seguridad o algo más?

Aquí es donde el asunto se complica, y mucho. Meta defendió públicamente la operación argumentando que “el benchmarking de respuestas de chatbots para garantizar experiencias seguras y apropiadas para la edad es una práctica estándar de la industria”, según declaró un vocero de la compañía a WIRED.

Un documento interno de Covalen describía el Proyecto Cannes como un ejercicio de “benchmarking integral de seguridad en IA” que generaba “conjuntos de datos críticos para la comparación de modelos y el cumplimiento normativo”. Suena razonable sobre el papel.

Sin embargo, hay un detalle que cambia todo el panorama. Las empresas cuyos chatbots fueron probados, OpenAI, Google y Character.AI, no tenían conocimiento de que este ejercicio estaba ocurriendo. Ninguna fue notificada, ninguna dio su consentimiento. Eso coloca la operación en un territorio muy diferente al de una prueba de seguridad colaborativa o transparente. 

Lo que los documentos no revelan, según WIRED, es cómo o si Meta llegó a utilizar los resultados recopilados. La compañía además aseguró que no usa benchmarks de competidores para entrenar sus propios modelos de IA, aunque esa aclaración llegó después de que la historia se publicara. 

El contexto que Meta preferiría que no recordaras

El escándalo no llega en el mejor momento para Meta. La compañía enfrenta desde hace meses críticas muy serias sobre la seguridad de sus propios sistemas de IA con adolescentes. Una evaluación interna de red team reveló que el chatbot propio de Meta fallaba en el 66.8% de los casos al bloquear contenido de explotación sexual infantil, y en el 54.8% cuando se trataba de prompts sobre suicidio y autolesiones.

En enero de 2026, Meta suspendió el acceso de adolescentes a sus personajes de compañía de IA en medio de una creciente presión legal. Y en paralelo, la empresa avanza en su plan de reemplazar más del 90% de su fuerza de revisión de contenido humano con modelos de lenguaje, una transición que ya dejó sin empleo a más de 1,100 trabajadores en Nairobi cuando Meta canceló su contrato con la firma Sama. 

Todo eso hace que la imagen sea, como mínimo, contradictoria. Una empresa que enfrenta demandas por los daños de sus plataformas a menores, que tiene sus propias fallas documentadas en seguridad para adolescentes, decidió invertir recursos en documentar las fallas de sus competidores, y lo hizo de forma encubierta, con perfiles falsos de niños, enviando imágenes perturbadoras. 

La pregunta que queda en el aire no es si este tipo de pruebas tiene alguna justificación técnica, porque la puede tener. La pregunta real es por qué una compañía del tamaño de Meta siente que necesita hacerlo en secreto, sin avisar a nadie, y usando las mismas vulnerabilidades que dice querer proteger. Eso, difícilmente se puede describir como una práctica estándar de la industria. 

Sigue leyendo:
Documentos filtrados muestran que la IA de Meta podía tener charlas románticas con niños
Meta quema decenas de miles de millones en IA mientras Google y Anthropic dominan el mercado
Meta ofrece capacitación gratuita y empleo garantizado para construir centros de datos de inteligencia artificial en EE.UU.

En esta nota

Inteligencia artificial Meta
Contenido Patrocinado