ゲートニュース(4月23日)— アンソロピックのエンジニアリングチームは、過去1か月間にユーザーから報告されたClaude Codeの品質低下は、APIや基盤となるモデルの問題ではなく、3つの独立したプロダクト層の変更に起因することを確認した。3つの問題はそれぞれ4月7日、4月10日、そして4月20日に修正され、最終版は現在v2.1.116となっている。
最初の変更は3月4日に発生した。チームは、推論の強度が高いOpus 4.6で、ときおり極端なレイテンシのスパイクが発生するのを抑えるため、Claude Codeのデフォルトの推論エフォートレベルを「high」から「medium」に引き下げた。パフォーマンス低下に関する広範なユーザーの不満を受けて、チームは4月7日にこの変更を元に戻した。現在のデフォルトは、Opus 4.7は「xhigh」、その他のモデルは「high」となっている。
2つ目の問題は3月26日に導入されたバグだった。システムは、会話が1時間以上非アクティブになると古い推論レコードを消去して、セッション復旧コストを下げるよう設計されていた。しかし実装上の欠陥により、消去がその後のすべてのターンで繰り返し実行される一方で、1回だけ実行されるべきところが、そのためにモデルが以前の推論コンテキストを段階的に失っていく原因になった。これは、忘れっぽさの増加、繰り返し操作、異常なツール呼び出しとして現れた。このバグはまた、すべてのリクエストでキャッシュミスを発生させ、ユーザーの利用クォータ消費を加速させた。再現条件を覆い隠す、互いに関係のない2つの社内実験が行われたため、デバッグが1週間以上に及んだ。4月10日に修正した後、チームはOpus 4.7を使って問題のあるコードをレビューし、Opus 4.7ならバグを特定できる一方でOpus 4.6ではできないことを確認した。
3つ目の変更は、Opus 4.7とともに4月16日にリリースされた。チームは冗長な出力を減らすために、システムプロンプトに指示を追加した。数週間にわたる社内テストでは回帰は見られなかったが、リリース後に他のプロンプトとのやり取りを行うと、コーディング品質が低下した。拡張評価では、Opus 4.6と4.7の両方でパフォーマンスが3%低下していることが判明し、4月20日にロールバックが行われた。
これら3つの変更は、異なる時期に異なるユーザーグループに影響し、その組み合わせによって広範で一貫性のない品質低下が生まれ、診断を難しくした。アンソロピックは今後、ユーザーと同じ公開ビルドバージョンを使うために、より多くの社内従業員を必要とし、すべてのシステムプロンプト変更について完全なモデル評価スイートを実行し、段階的ロールアウトの期間を設けると述べた。補償として、アンソロピックはすべてのサブスクリプションユーザーの利用クォータをリセットした。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
ジェフ・ベゾスの「プロジェクト・プロメテウス」が$10B の$38B 評価額で資金調達
ゲートニュース 4月24日 — アマゾン創業者のジェフ・ベゾスと、元グーグル幹部のヴィク・バジャジによって設立されたAIラボ「プロジェクト・プロメテウス」が、$10 billionの資金調達ラウンドを$38 billionの評価額でクローズしました。JPMorgan Chaseとブラックロックは
GateNews12分前
AI関連株がS&P 500の時価総額の45%を占めるように、クレジット市場は圧力に直面
Gate Newsメッセージ、4月24日 — The Kobeissi Letterによると、AI関連株は現在、S&P 500 (U.S.ベンチマーク株式指数)の総時価総額の45%を占めており、過去最高を記録し、2022年11月のChatGPTのローンチ以来20パーセントポイント増加しています。
同時に、AI関連の投資適格債が15.4%まで上昇し、米国のクレジット市場で最大のセクターになりました。これは2020年から3.5パーセントポイントの増加に相当し、対応する発行残高はほぼ倍増して$1.4兆に達しており、史上最高です。
GateNews12分前
OpenAI、エージェント業務と複雑なワークフロー向けにGPT-5.5を発表
Gate Newsのニュース、4月24日――OpenAIは公式にGPT-5.5をリリースしました。複雑な目的の達成、ツール統合、自己検証、多段階のタスク完了に対応する次世代AIモデルです。このモデルはコードの作成とデバッグ、オンライン調査、データ分析、ドキュメント作成、そしてツールをまたいだ連携に優れています。
GateNews27分前
インテルの業績予想が市場予想を上回り、AI需要がCPUの反転を後押し。陳立武が就任後、INTCは3倍に上昇
インテルは1四半期の売上が136億ドル、EPSは0.29。第2四半期のガイダンスでは中央値が143億ドルで、予想を大幅に上回り、粗利率は41%。AIデータセンター需要がCPUの転機を後押しし、Xeonなどのサーバーが注目を集める。陳立武が率いる転換は進行中で、IFSの第1四半期売上は54億ドル、成長は16%で、テスラなどの外部顧客がTerafabの使用するインテル技術に関心を示している。時間外の株価は約20%上昇し、史上最高値を更新。昨年以降で見ると、すでに約3倍に上昇している。
ChainNewsAbmedia39分前
Cognition AI、$25B のバリュエーションでの資金調達を初期段階の交渉で実施
ゲート・ニュース 4月24日 — AIコーディングのスタートアップであるCognition AIは、関係者によると、$25 ビリオンに企業価値をより大きく上回る水準へと引き上げる新たな資金調達ラウンドについて、初期段階の交渉を行っている。 同社は、ソフトウェア開発における生成AI技術への需要が引き続き拡大する中で、数億ドル規模、あるいはそれ以上の資金調達を目指している
GateNews1時間前
NEC株式会社がAnthropicの日本における最初のグローバル・パートナーになります
NECは、日本におけるAnthropicの初のグローバル・パートナーになることを発表しました。双方は、金融、製造、地方自治体などの高度に規制された業界向けに、安全で産業知識を備えたAIソリューションを開発し、またClaudeシリーズをNEC BluStellarに統合します。データ駆動型のマネジメントと顧客体験の変革に焦点を当てると同時に、Claude CoworkとSOCの統合を導入し、サイバーセキュリティ防御を強化します。効果を検証するために、NECは「ゼロ号顧客計画」を立ち上げ、社内でAIエージェントを全面的にテストし、さらに全世界でClaudeの導入を推進する計画です。日本最大規模のAIネイティブ・エンジニアCoEを構築します。
ChainNewsAbmedia4時間前