في عصر الذكاء الاصطناعي التوليدي الذي يستهلك بشكل جنوني البيانات المفتوحة، اختارت ويكيبيديا تحويل علاقة “الاستيلاء المجاني” إلى اتفاقية تجارية رسمياً: من مايكروسوفت، جوجل، أمازون إلى شركات الذكاء الاصطناعي الناشئة، يجب الآن على الجميع الوصول إلى محتوى ويكيبيديا من خلال ترخيص المحتوى وخدمات الدفع.
(ملخص سابق: هل ستستبدل Grok ويكيبيديا؟ ماسك يكشف أن xAI تطور “Grokipedia”: تحسينات هائلة على ويكيبيديا)
(إضافة خلفية: أول تقييم من V神 لنموذج اللغة الكبير: Grok في جوهره ينقذ منصة X “يساعد في نشر الحقيقة”، لكنه لا يخلو من العديد من الأوهام)
فهرس المقال
تحتفل مؤسسة ويكيميديا بالذكرى الخامسة والعشرين لإنشاء ويكيبيديا، وتطلق سلسلة من الأنشطة والتحديثات التقنية، مع إرسال إشارة واضحة للخارج، حيث أن أكبر موسوعة على الإنترنت ليست مجرد “مخزن معرفي مجاني”، بل هي بنية تحتية أساسية للتفاوض التجاري مع العديد من عمالقة الذكاء الاصطناعي، وتوقيع اتفاقيات ترخيص المحتوى.
تملك ويكيبيديا حالياً أكثر من 65 مليون مقال، وتغطي أكثر من 300 لغة، ويبلغ عدد زياراتها الشهرية حوالي 15 مليار مرة، وهي المنصة الوحيدة من بين أكبر عشرة مواقع من حيث الحركة التي تديرها منظمة غير ربحية، كما أنها واحدة من أهم مجموعات البيانات المفتوحة عالية الجودة لنماذج اللغة الكبيرة.
في السنوات الأخيرة، مع بروز الذكاء الاصطناعي التوليدي، زاد اعتماد شركات التكنولوجيا على محتوى ويكيبيديا بسرعة. للرد على هذا الطلب والحفاظ على الاستدامة المالية، طورت ويكيميديا منتجها التجاري Wikimedia Enterprise، الذي يوفر خدمات إعادة استخدام وتوزيع المحتوى على نطاق واسع.
كشف البيان الأخير للمؤسسة أن شركات مثل Ecosia، مايكروسوفت، Mistral AI، Perplexity، Pleias، ProRata أصبحت شركاء جدد، وانضمت إلى عمالقة التكنولوجيا السابقين مثل أمازون، جوجل، ميتا.
وهذا يعني أن الشركات التي كانت تعتمد سابقاً على جمع محتوى ويكيبيديا مباشرة لاستخدامه في نتائج البحث أو تدريب نماذج الذكاء الاصطناعي، بدأت الآن في الوصول إلى البيانات عبر “شراكة ترخيص”، حيث توفر Wikimedia Enterprise واجهات برمجة التطبيقات أو تدفقات البيانات وفقاً لمتطلبات الشركات من حيث التأخير، والاستقرار، وتنسيق البيانات، مقابل دفع الشركات رسومًا تُعَادُ بها إلى مؤسسة ويكيميديا، لدعم العمليات غير الربحية والاستثمار في البنية التحتية.
أكدت ويكيميديا في بيانها أن ويكيبيديا تعتبر واحدة من “أعلى مجموعات البيانات المفتوحة جودة” لتدريب نماذج اللغة الكبيرة، وذلك لأنها تحتوي على محتوى من حوالي 250 ألف متطوع نشط يحررون ويصونون المحتوى، مع الالتزام بمعايير الحيادية، والتحقق، والمصادر الموثوقة، وخضعوا لمراجعات طويلة الأمد من قبل المجتمع، وهذه الأصول الهيكلية يصعب على مطوري النماذج إعادة بنائها بأنفسهم.
بالنسبة لشركات الذكاء الاصطناعي، فإن الحصول على محتوى ويكيبيديا لا يقتصر على الشرعية والأخلاق، بل يؤثر أيضاً على جودة مخرجات النموذج وقدرته على السيطرة على الحقائق؛ أما بالنسبة لويكيميديا، فهي تحول حركة المرور التي كانت تُجمع بشكل سلبي إلى مصدر دخل متوقع، لدعم استدامة الخوادم، والمجتمعات متعددة اللغات، والاستثمار في التطوير التقني.
من المثير للاهتمام، أنه على الرغم من توقيع اتفاقيات ترخيص المحتوى مع العديد من عمالقة الذكاء الاصطناعي، فإن ويكيميديا لا تزال تؤكد في استراتيجيتها الخاصة بالذكاء الاصطناعي على “الأولوية للبشر”، حيث يكون دور الذكاء الاصطناعي هو مساعدة المتطوعين في التحرير، وليس استبدالهم.
تخطط المؤسسة لاستخدام الذكاء الاصطناعي في اكتشاف التعديلات التخريبية، ووضع علامات على المقالات التي قد تكون بها مشكلات، والمساعدة في الترجمة واكتشاف المحتوى، بحيث يمكن للمحررين التركيز على تفسير المصادر، والكتابة، وإدارة المجتمع.
قالت المديرة التنفيذية ماريانا إسكندر إن القيمة الأساسية لويكيبيديا تكمن في “إنتاج المعرفة بقيادة البشر”، وحتى في عصر الذكاء الاصطناعي، ستظل المنصة تحت إدارة مجتمع المتطوعين العالمي، وأن أدوات الذكاء الاصطناعي مجرد مساعدة تقلل من حاجز المشاركة، وليست الجهة التي تتخذ قرارات المحتوى.