En la era en la que la IA generativa está absorbiendo datos abiertos a toda velocidad, Wikipedia ha decidido formalizar la relación de «ser tomado sin permiso» en un acuerdo comercial: desde Microsoft, Google y Amazon hasta las nuevas empresas de IA, ahora todos deben acceder a Wikipedia mediante licencias de contenido y servicios de pago.
(Contexto previo: ¿Grok reemplazará a Wikipedia? Elon Musk revela que xAI está desarrollando «Grokipedia»: una mejora significativa respecto a Wikipedia)
(Información adicional: V神 evalúa por primera vez los LLM: Grok esencialmente salva la plataforma X «ayuda a la difusión de la verdad», pero todavía tiene muchas alucinaciones)
Índice del artículo
La Fundación Wikimedia celebra el 25 aniversario de la creación de Wikipedia, lanzando una serie de actividades y actualizaciones tecnológicas, y también enviando una señal clara al exterior: la mayor enciclopedia en línea del mundo no es solo una base de conocimientos «gratuita para usar», sino una infraestructura clave que ha firmado acuerdos de licencia de contenido con varias gigantes de la IA y que ha entrado formalmente en negociaciones comerciales.
Actualmente, Wikipedia cuenta con más de 65 millones de artículos, cubre más de 300 idiomas y recibe cerca de 15 mil millones de visitas mensuales. Es el único de los diez sitios web con mayor tráfico operado por una organización sin fines de lucro, y también uno de los conjuntos de datos abiertos de alta calidad más importantes para los grandes modelos de lenguaje.
En los últimos años, con el auge de la IA generativa, la dependencia de las empresas tecnológicas en el contenido de Wikipedia ha crecido rápidamente. Para responder a esta demanda y mantener la sostenibilidad financiera, Wikimedia ha desarrollado Wikimedia Enterprise, un producto comercial dedicado a la reutilización y distribución a gran escala de contenido.
En su declaración más reciente, la fundación reveló que empresas como Ecosia, Microsoft, Mistral AI, Perplexity, Pleias, ProRata, entre otras, se han unido como nuevos socios, sumándose a los gigantes tecnológicos originales como Amazon, Google y Meta.
Esto significa que las empresas que anteriormente solían acceder directamente al contenido de Wikipedia para resultados de búsqueda o entrenamiento de IA ahora lo hacen mediante «colaboraciones de licencia», en las que Wikimedia Enterprise proporciona API o flujos de datos según las necesidades de latencia, estabilidad y formato de datos de las empresas, que a su vez pagan a la fundación Wikimedia para sostener sus operaciones sin fines de lucro y sus inversiones en infraestructura.
En su comunicado, la fundación enfatizó que Wikipedia ha sido evaluada por múltiples partes como uno de los conjuntos de datos abiertos de «máxima calidad» para el entrenamiento de grandes modelos de lenguaje. La razón radica en que su contenido es editado y mantenido por aproximadamente 250,000 voluntarios activos, siguiendo estrictos estándares de neutralidad, verificabilidad y fuentes confiables, y ha pasado por largos historiales de versiones y revisiones comunitarias. Estos son activos estructurales que los desarrolladores de modelos difícilmente pueden reconstruir por sí mismos.
Para las empresas de IA, acceder al contenido de Wikipedia no solo implica cuestiones legales y éticas de licenciamiento, sino también la calidad de las salidas del modelo y su capacidad para comprender los hechos; para la fundación Wikimedia, se trata de transformar el tráfico que antes se obtenía pasivamente en una fuente de ingresos predecible, que permita mantener los servidores, la comunidad multilingüe y la inversión en desarrollo tecnológico a largo plazo.
Curiosamente, aunque Wikimedia ha llegado a acuerdos de licencia con varias gigantes de la IA, en su estrategia de IA interna sigue reiterando que «las personas tienen prioridad»: el papel de la IA es asistir a los voluntarios, no reemplazarlos.
La fundación planea usar IA para detectar ediciones dañinas, marcar artículos potencialmente problemáticos, ayudar en traducciones y descubrimiento de contenido, permitiendo que los editores puedan concentrarse en interpretar las fuentes, redactar y gestionar la comunidad.
La directora ejecutiva Maryana Iskander afirmó que el valor central de Wikipedia radica en la producción de conocimiento «impulsada por humanos». Incluso en la era de la IA, la plataforma mantendrá su estructura gobernada por una comunidad global de voluntarios; las herramientas de IA solo serán un apoyo para reducir las barreras de participación, no el motor principal de las decisiones de contenido.