"OPUS"検索結果
本日
01:13

Anthropic、サイバーセキュリティのセーフガードを備えたClaude Opus 4.7をリリース

AnthropicのClaude Opus 4.7は4月17日に発表され、高リスクのリクエストに対するセーフガードによってサイバーセキュリティを強化します。コーディングと画像処理のパフォーマンスは向上しますが、限定リリースのMythos Previewよりは能力が劣ります。このリリースからのフィードバックは、今後のモデル開発の指針となります。
もっと
09:51
1

マスク:Grokは依然としてClaude Opus 4.6に追いつこうとしており、5月に接近し、6月に追い抜く見込みです

マスク氏はXプラットフォーム上で、xAIのGrokモデルがAnthropicのClaude Opus 4.6に追いつこうとしており、5月には同水準に接近し、6月には上回る可能性があると述べた。彼は、AI分野においてこの時期の差は大きいと語った。Claude Opus 4.6はAnthropicのフラグシップAIモデルで、Claude 4シリーズの最強版にあたる。
もっと
02:14

マスク氏がGrok 4.2のパラメータ数を明かし、外部ではClaude Opusがさらに5兆パラメータに達するとの推測が出ている

マスクはXプラットフォーム上で、Grok 4.2のパラメータ数が0.5兆であることを確認した。推計によれば、Claude Opusは約5兆、Sonnetは1兆だという。Anthropicはモデルのパラメータ数を公開していないものの、これらの数字はマスクの発言に基づいている。同時に、SpaceX AIのColossus 2スーパーコンピュータは、最大規模の10兆パラメータのモデルを学習中であり、競争上の重要な鍵となるだろう。
もっと
01:39

VVV(ベネチア)24時間ポンプ 19.99%

Gate ニュース メッセージ。4月10日。Gateの相場情報によると、発稿時点でVVV(Venice)は8.03ドルで取引されており、過去24時間でポンプ(上涨)19.99%、最高値は8.00ドル、最低値は6.64ドルまで下落しており、過去24時間の取引高は83.36百万ドルとなっています。現在の時価総額は約3.64億ドルです。 Veniceはプライバシーに重点を置いた人工知能プラットフォームで、対話の生成や画像の作成などのサービスを提供していますが、ユーザーデータは保存しません。ユーザーは、Claude Opus、GPT-5.2、Flux 2 など業界をリードするAIモデルを含むサービスに対して、プライベートまたは匿名でアクセスでき、さらに完全にプライベートなデータ保護を享受できます――すべてのAIプロンプトはユーザーのデバイス上に保持され、サーバーには保存されません。加えて、Veniceはプラットフォーム上での
もっと
VVV4.02%
RENDER-0.04%
IOTA6.87%
12:36

智プランが公式発表:GLM-5.1をリリース。コーディング能力は前世代を大きく上回り、GLM Coding Planの全ユーザーに向けて提供を開始

智谱はGLM-5.1を発表し、すべてのGLM Coding Planユーザーが利用可能になりました。 コーディング能力テストでは、GLM-5.1が45.3点を獲得し、前世代の35.4点を大きく上回り、Claude Opus 4.6に近いスコアを示し、明らかな進歩を示しています。
もっと
11:51

速度制限以外にも障害がある:Claudeは2週間で累計25件のサービス停止、3つのプロダクトラインで重大なダウンが発生し、Opus 4.6が深刻な被害を受けた。

最近、AnthropicのClaudeサービスで重大なダウンが発生し、3つの主要製品ラインに影響が出ました。報告によれば、3月13日から27日の間に約25件の障害が発生し、最高のエラー率はログインシステムの問題が頻発しました。正常稼働率は約99%を維持していますが、サービスの需要とキャパシティの圧力が明らかに増加しています。
もっと
05:07

20B小モデルの検索能力がGPT-5とOpusに追いつく:ベクトルデータベースChromaがオープンソースエージェント検索モデルContext-1

オープンソースベクターデータベースChromaは、マルチターン検索用の200億パラメータのインテリジェント検索モデルであるContext-1をリリースしました。このモデルは自己編集コンテキスト技術を採用し、強化学習とカリキュラムメカニズムを通じてマルチタスクでトレーニングされており、特にウェブ、金融、法律の分野で優れたパフォーマンスを示し、メールの分野でも異分野の検索能力を発揮しています。
もっと
04:50

Anthropicが次世代モデル「Claude Mythos」を意図せずに漏洩:Opusを超える新たなレベル、ネットワークセキュリティ能力は「すべての既存のAIを遥かに上回る」

Anthropic is testing a new model called "Claude Mythos," which shows significant improvements in areas such as programming, reasoning, and cybersecurity. Leaked drafts indicate that Mythos represents a new level of model architecture, surpassing the existing Opus series, and possesses leading cybersecurity capabilities. The leak originated from a misconfiguration in the content management system, resulting in the exposure of unreleased assets, and Anthropic stated that it will adopt a more cautious release strategy.
もっと
06:07

中国モデルが前回のSWE-rebenchで全て上位10に入らず「スコア稼ぎ」と嘲笑されたが、今回は4席を占めた

SWE-rebenchは リアルタイム ソフトウェア エンジニアリング タスク ベンチマーク テストであり、最新のランキング更新ではデモンストレーションと操作の制限が廃止され、補助的な評価タスクが追加されました。Claude Opus 4.6は65.3%で第1位にランクインし、GLM-5は62.8%で第3位となり、4つの中国のモデルがトップ10に入り、中国のモデルの進歩を示しています。
もっと
05:55

SWE-rebench 最新榜单:中国 AI 模型占前十四席,GLM-5 排名第三 (This text is already in Chinese/Japanese context. Since the instruction asks to translate to Japanese and this appears to be a Chinese title/headline, here is the Japanese translation:) SWE-rebench 最新ランキング:中国のAIモデルがトップ14を独占、GLM-5が3位にランクイン

3月23日、SWE-rebench ベンチマークテストが最新ランキングを発表し、Claude Opus 4.6 が第1位となりました。今回の更新ではサンプルデモンストレーションとステップ数の制限が廃止され、補助的な評価タスクが追加されました。GLM-5 はオープンソースモデルの中で第3位にランクインし、中国のモデルが合わせて4席を占めています。
もっと