Adiós al “scraping”: Wikipedia formaliza pactos con empresas de IA y esto es lo que viene
Wikipedia cerró acuerdos con las principales compañías de IA para que puedan extraer información de sus servidores de forma más rápida y segura
El acuerdo permite que las compañías de IA tengan acceso al contenido de Wikipedia de forma legal sin necesidad de hacer scraping Crédito: Shutterstock
Wikipedia (a través de la Wikimedia Foundation) anunció un acuerdo de colaboración con varias de las compañías más grandes del ecosistema de IA —incluyendo Amazon, Meta, Microsoft y Perplexity— para que usen Wikimedia Enterprise, su producto comercial pensado para reutilizar el contenido de Wikipedia a gran escala de forma ordenada y sostenible.
En pocas palabras: si las IA y los servicios de “respuestas rápidas” se alimentan de Wikipedia, ahora existe un camino más formal para hacerlo, con acceso diseñado para alto volumen y con un modelo que ayuda a financiar el proyecto.
Qué se anunció y con quiénes
El anuncio llega en el marco del 25º aniversario de Wikipedia, y lo más relevante es que la fundación confirmó públicamente por primera vez varias alianzas que se venían construyendo durante el último año. Entre los nombres destacados están Amazon, Meta, Microsoft, Mistral AI y Perplexity, que pasan a ser “clientes” de Wikimedia Enterprise, el producto que facilita la reutilización y distribución del contenido de Wikipedia (y de otros proyectos Wikimedia) para usos empresariales.
Además, se menciona que Google ya tenía una alianza previa anunciada en 2022, y que otros acuerdos también forman parte de este paquete, como Ecosia, Pleias y ProRata (mencionados antes), junto con Nomic y Reef Media. El punto clave aquí es que Wikipedia no solo está “dejando que la usen”, sino creando un esquema para que ese uso masivo sea más estructurado, más rápido y más sostenible en un contexto donde la IA está copiando, resumiendo y redistribuyendo conocimiento a escala.
Alcance del acuerdo: Wikimedia Enterprise y la “Wikipedia a escala IA”
El corazón del acuerdo es Wikimedia Enterprise: un servicio creado por la fundación para permitir la reutilización del contenido de Wikipedia de manera comercial, con acceso optimizado para empresas que necesitan volumen y velocidad (dos cosas que el scraping clásico o el acceso informal no siempre resuelven bien). Dicho de forma simple: si una compañía entrena modelos, construye buscadores o lanza chatbots que responden preguntas con base en Wikipedia, este producto ofrece un canal más directo para obtener esa información con el “ritmo” que demandan sus sistemas.
Pero el alcance no es solo técnico; también es estratégico. La nota explica que estos acuerdos le dan a Wikipedia otra vía para sostenerse en una era donde gran parte de su contenido está siendo reutilizado por modelos de IA y por servicios que entregan respuestas al instante. Y ese detalle importa mucho: Wikipedia no es un “dataset gratis que vive en el aire”, es una infraestructura de conocimiento mantenida por personas, con costos reales (tecnología, operación, comunidad), y con un volumen gigantesco de uso.
Para ponerlo en contexto, la fundación recuerda que Wikipedia está entre los 10 sitios más visitados del mundo, con más de 65 millones de artículos en más de 300 idiomas y cerca de 15,000 millones de visualizaciones al mes. En la práctica, eso significa que el contenido que alimenta a medio internet también está alimentando a la IA, y ahora se está formalizando cómo se “sirve” ese contenido cuando se usa a escala industrial.
Sigue leyendo:
• Republicanos investigan a Wikipedia por permitir la manipulación de información en algunos artículos
• La IA está devorando Wikipedia y eso no son buenas noticias para los usuarios
• Wikipedia estrena nuevo modo oscuro