OpenAI و Anthropic تطلقان نماذج ذكاء اصطناعي منافسة مع تصاعد المنافسة للشركات

Decrypt

كشفت OpenAI و Anthropic عن نماذج الذكاء الاصطناعي الرائدة الجديدة في خطوط منتجاتهما على مدار ساعة واحدة تقريبًا يوم الخميس، مما يبرز تصاعد المنافسة بين المطورين الرائدين للسيطرة على برمجيات المؤسسات وأدوات البرمجة المتقدمة. أعلنت Anthropic عن Claude Opus 4.6، متحدثة عن مكاسب في التفكير في سياق طويل وسير العمل القائم على الوكلاء، بينما أطلقت OpenAI بعد ذلك بقليل GPT-5.3 Codex، وهو نموذج مُحسّن للبرمجة الوكيلة وتطوير البرمجيات. أكدت عمليات الإطلاق المتزامنة تقريبًا مدى سرعة تكرار المنافسين حيث تتسابق الشركات لتأمين عقود طويلة الأمد مع عملاء الشركات الكبرى. 

اقترحت نتائج الاختبارات أن النموذجين مُحسّنان لمزايا مختلفة. أظهر Claude Opus 4.6 أداءً أقوى في المهام المرتبطة بالتفكير القانوني والمالي، بينما تفوق GPT-5.3 Codex في اختبارات البرمجة الوكيلة ومقاييس الكفاءة، وفقًا للأرقام التي أصدرتها كلتا الشركتين. تأتي هذه الإصدارات في وقت يعيد فيه المستثمرون تقييم توقعات مزودي البرمجيات التقليديين، حيث انخفضت أسهم العديد من شركات المعلومات والخدمات المهنية هذا الأسبوع وسط مخاوف من أن منصات الذكاء الاصطناعي الأصلية قد تقلل الطلب على أدوات المؤسسات المعروفة. قالت Anthropic إن Claude Opus 4.6 حقق مكاسب في التفكير في سياق طويل والمهام المهنية، مشيرة إلى نافذة سياق تتسع لمليون رمز ونتيجة بنسبة 76% على MRCR v2، وهو معيار لقياس استرجاع المعلومات المعقدة.

قالت الشركة إن النموذج تفوق أيضًا على الإصدارات السابقة في المهام المالية والقانونية وقدم “فرق الوكلاء” التي تسمح لعدة وكلاء ذكاء اصطناعي بالعمل بالتوازي على البرمجة والتوثيق. أطلقت OpenAI بعد ذلك GPT-5.3 Codex، ووصفتها بأنها نموذج مُحسّن للبرمجة الوكيلة والبحث. قالت OpenAI إن Codex حصل على 77.3% على Terminal-Bench 2.0، وهو معيار للبرمجة الوكيلة حيث حصل Claude Opus 4.6 على 65.4%، وأنه أكمل المهام بشكل أسرع مع استخدام رموز أقل. كما ذكرت OpenAI أن الإصدارات المبكرة من Codex كانت تُستخدم داخليًا للمساعدة في تصحيح أخطاء التدريب وإدارة النشر، مما يمثل أحد المرات الأولى التي يلعب فيها نموذج دورًا مباشرًا في تسريع تطويره الخاص. معًا، تشير النتائج إلى أن لا النموذجين يمتلكان تفوقًا واضحًا بشكل عام، حيث تعتمد المزايا في الأداء على ما إذا كانت المؤسسات تفضل التفكير المهني أم تطوير البرمجيات المستقل. من المتوقع أيضًا أن تقوم Google بإطلاق تحديثات لنماذج Gemini الخاصة بها خلال الأشهر القادمة، بينما يستعد مطورو الذكاء الاصطناعي الآخرون، بما في ذلك DeepSeek، لإصدارات جديدة، مما يزيد من وتيرة المنافسة في القطاع. ومع ذلك، فإن نتائج الاختبارات وحدها من غير المرجح أن تحدد القيادة السوقية، حيث أن الاعتماد الأوسع والنشر في المؤسسات يشكلان بشكل متزايد المشهد التنافسي. مع استمرار المنافسة في الضغط على المنافسين، الوقت كفيل بإظهار ما إذا كانت سير العمل القائم على الوكلاء سيصبح مكونًا أساسيًا في النشاط الاقتصادي. وبالتأكيد، تعتمد OpenAI و Anthropic على ذلك.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات