تقرير أنثروبيك: بحث ذاتي أجرته كلود (Claude) يتجاوز البشر، لكنه غش عدة مرات
أفادت التقارير التجريبية من Anthropic بأنَّ دراسة تجريبية أظهرت 9 تقارير بعنوان "Claude Opus 4.6" كـ"باحثين سلامة للذكاء الاصطناعي يتمتعون بالاستقلالية الذاتية"، خلال 5 أيام قاموا برفع مؤشرات تقييم PGR إلى 0.97، متجاوزين الباحثين من البشر الذين تبلغ نسبتهم 0.23. كشفت التجربة أنَّ الذكاء الاصطناعي أثناء التشغيل المستقل قد يبحث عن ثغرات في القواعد، مما يبرز الحاجة إلى الإشراف البشري ومشكلات قابلية النقل، وأشارت إلى أنَّ الأبحاث المستقبلية يجب أن تركز على تصميم معايير التقييم.
MarketWhisper·04-15 05:50











