Anthropic 发现:Claude Code 质量下降背后是三项产品层变更,而非模型问题

Gate News 消息,4 月 23 日——Anthropic 的工程团队确认,用户在过去一个月报告的 Claude Code 质量退化源于三个相互独立的产品层变更,而非来自 API 或底层模型问题。这三个问题分别在 4 月 7 日、4 月 10 日和 4 月 20 日修复,目前最终版本为 v2.1.116。

第一次变更发生在 3 月 4 日,当时团队将 Claude Code 的默认推理工作量级别从 “high” 降低到 “medium”,以应对在高推理强度下 Opus 4.6 偶发的极端延迟尖峰。在大量用户对性能下降提出抱怨后,团队于 4 月 7 日回滚了该变更。当前默认值现在为 Opus 4.7 的 “xhigh”,以及其他模型的 “high”。

第二个问题是 3 月 26 日引入的一个漏洞。系统原本设计为在对话不活跃超过一小时后清除旧的推理记录,以降低会话恢复成本。然而,实施中的缺陷导致清除操作在每个后续轮次都会反复执行,而不是只执行一次,从而使模型逐步丢失既有推理上下文。该问题表现为健忘程度增加、重复操作,以及异常的工具调用。该漏洞还导致每次请求都会发生缓存未命中,加速用户配额消耗。两个互不相关的内部实验掩盖了复现条件,使得调试过程延长到超过一周。4 月 10 日修复后,团队使用 Opus 4.7 检查有问题的代码,发现 Opus 4.7 能够识别该漏洞,而 Opus 4.6 不能。

第三项变更于 4 月 16 日随同 Opus 4.7 一起发布。团队在系统提示中添加了指令,以减少冗余输出。数周的内部测试表明没有回归,但在上线后与其他提示的交互导致编码质量下降。延长评估显示,Opus 4.6 和 4.7 的性能都下降了 3%,因此团队于 4 月 20 日回滚。

这三项变更在不同时间影响了不同用户群体,它们叠加后的综合效果导致了广泛且不一致的质量下降,使诊断变得更加复杂。Anthropic 表示,现在将要求更多内部员工像用户一样使用相同的公开构建版本,对每次系统提示修改都运行完整的模型评估套件,并实施分阶段的发布周期。作为补偿,Anthropic 已重置所有订阅用户的使用配额。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

杰夫·贝索斯的Project Prometheus以$10B 估值融资$38B

Gate News消息,4月24日——由亚马逊创始人杰夫·贝索斯和前谷歌高管维克·巴贾吉创立的AI实验室Project Prometheus已在$10 十亿美元融资轮次中完成融资,估值为$38 十亿美元。摩根大通和贝莱德是

GateNewsمنذ 12 د

الأسهم المرتبطة بالذكاء الاصطناعي تمثل الآن 45% من القيمة السوقية لـ S&P 500، وأسواق الائتمان تواجه ضغطًا

بوابة الأخبار، رسالة بتاريخ 24 أبريل — وفقًا لرسالة The Kobeissi Letter، أصبحت أسهم الشركات المرتبطة بالذكاء الاصطناعي الآن تمثل 45% من إجمالي القيمة السوقية للأسهم في مؤشر (U.S. Benchmark Equity Index) الخاص بمؤشر S&P 500، مسجلة مستوىً تاريخيًا مرتفعًا، مع زيادة قدرها 20 نقطة مئوية منذ إطلاق ChatGPT في نوفمبر 2022. في الوقت نفسه، ارتفعت ديون الاستثمار ذات الدرجة الاستثمارية المرتبطة بالذكاء الاصطناعي إلى 15.4% من سوق الائتمان الأمريكي، لتصبح أكبر قطاع. وهذا يمثل زيادة قدرها 3.5 نقاط مئوية عن عام 2020، حيث تضاعف إجمالي الدين القائم المقابل تقريبًا إلى 1.4 تريليون دولار، وهو مستوى قياسي على الإطلاق.

GateNewsمنذ 12 د

أطلقت OpenAI GPT-5.5، المصممة لمهام الوكلاء وسير العمل المعقدة

رسالة أخبار جيت، 24 أبريل — قامت OpenAI رسميًا بإصدار GPT-5.5، وهو نموذج ذكاء اصطناعي من الجيل التالي مصمم للتعامل مع الأهداف المعقدة، وتكامل الأدوات، والتحقق الذاتي، وإكمال المهام متعددة الخطوات. يتفوق النموذج في كتابة التعليمات البرمجية وتصحيح الأخطاء، والبحث عبر الإنترنت، وتحليل البيانات، وإنشاء المستندات

GateNewsمنذ 27 د

تجاوزت نتائج أعمال إنتل الفعلية توقعات السوق بشكل كبير، إذ أدى الطلب على الذكاء الاصطناعي إلى انتعاش وحدة المعالجة المركزية (CPU)، وبعد تولّي تشين لي وو المنصب، ارتفع سهم INTC ثلاث مرات

ارتفعت إيرادات إنتل في الربع الواحد إلى 13.6 مليار دولار، وEPS 0.29؛ وفي الربع الثاني، بلغ متوسط التوقعات 14.3 مليار دولار، متجاوزًا التوقعات بكثير، مع هامش إجمالي 41%. دفعت احتياجات مراكز بيانات الذكاء الاصطناعي تعافي وحدات المعالجة المركزية، حيث حظيت وحدات الخوادم مثل Xeon بإعجاب متزايد. يقود تشن لي وو التحول، إذ بلغت إيرادات IFS في الربع الأول 5.4 مليارات دولار، ونمت بنسبة 16%، ويتابع العملاء الخارجيون مثل تسلا اهتمامًا باستخدام Terafab لتقنيات إنتل. بعد إغلاق السوق، ارتفع سعر السهم بنحو 20%، مسجلًا مستوى تاريخيًا مرتفعًا جديدًا، وقد حقق مكاسب تقارب 3 مرات منذ العام الماضي.

ChainNewsAbmediaمنذ 39 د

Cognition AI تجمع تمويلاً بتقييم $25B في مفاوضات مرحلة مبكرة

جيت نيوز رسالة، 24 أبريل — شركة Cognition AI، وهي شركة ناشئة في مجال برمجة الذكاء الاصطناعي، تجري مفاوضات في مرحلة مبكرة لجولة تمويل جديدة من شأنها أن تضاعف أكثر من قيمتها إلى $25 مليار، وفقًا لمصادر مطلعة على الأمر. تهدف الشركة إلى جمع مئات الملايين من الدولارات أو أكثر، حيث تستمر الطلبات على تكنولوجيا الذكاء الاصطناعي التوليدي في تطوير البرمجيات في النمو.

GateNewsمنذ 1 س

ستصبح شركة NEC أول شريك عالمي لـ Anthropic في اليابان

أعلنت NEC أنها ستصبح أول شريك عالمي لـ Anthropic في اليابان، حيث ستعمل الشركتان على تطوير حلول ذكاء اصطناعي آمنة ومبنية على معرفة صناعية للصناعات شديدة التنظيم مثل المالية والتصنيع والجهات الحكومية المحلية، كما ستقومان بدمج سلسلة Claude في NEC BluStellar، مع التركيز على التحول في إدارة قائمة على البيانات وتحسين تجربة العملاء. وفي الوقت نفسه، قدمتا Claude Cowork ودمج SOC لتعزيز الحماية الأمنية. وللتحقق من الفعالية، أطلقت NEC برنامج العميل رقم صفر لإجراء اختبارات شاملة لوكلاء الذكاء الاصطناعي داخليًا، كما تخطط للترويج لنشر Claude عالميًا، بهدف إنشاء أكبر مركز تميز (CoE) على مستوى اليابان لهندسة AI الأصلية.

ChainNewsAbmediaمنذ 4 س
تعليق
0/400
لا توجد تعليقات