百度のERNIE 5 AIモデルがランキング上昇—OpenAIのGPT 5.1を凌駕する数学の天才

Decrypt

2026-01-15 20:41:03

要約

百度の新しいERNIE 5.0は、LMArenaのテキストリーダーボードで1,460ポイントを獲得し、世界第8位にランクイン、トップ10に入った唯一の中国モデルとなった。GPT-5.1を上回り、数学タスクでは#2の座を獲得。
ERNIEのv4バージョンは2年前にリリースされた。
強力な企業採用が、国内競争激しい中での百度の消費者向けAIの後退を相殺している。

中国のテック大手百度は、最先端のAIモデルを更新したばかりで、その性能はかなり良好のようだ。同社のERNIE-5.0-0110は、LMArenaのテキストリーダーボードで1460ポイントを獲得し、世界第8位に入り、プラットフォームのトップ10に入った唯一の中国モデルとなった。OpenAIのGPT-5.1-HighやGoogleのGemini-2.5-Proよりも上位に位置している。ERNIE v4.0は2023年にリリースされた。 ERNIE 5.0はまた、数学的推論においても世界第2位を獲得し、未公開のGPT-5.2-Highに次いでいる。中国のモデルが複雑な論理タスクでほぼすべての公開されている西洋のシステムを上回ることは、AIの能力ギャップの大きな変化、あるいはその縮小を示している。

そうだ、数学で世界第2位にいるERNIEは今や全く異なる会話に入っている。

— Muhammad Ayan (@socialwithaayan) 2026年1月15日

百度のXでの発表によると、ERNIE 5.0は正式にプレビュー段階を終了したとのこと。モデルはまた、クリエイティブライティング、指示に従う能力、コーディングにおいても競争力のあるパフォーマンスを示し、科学、ビジネス・ファイナンス、ヘルスケアなど複数の職種カテゴリでトップ10に入った。

🚨速報：@Baidu_incのERNIE-5.0-0110はLMArenaで素晴らしい結果を出した。これはテストやプレビューではない。

最新のランキングでは、モデルはテキストベンチマークで1460点を獲得し、中国モデルの中で1位、世界トップ10に入りました。唯一の中国… pic.twitter.com/9iBVzDcqgq

— Doreen (@dee_naliaks) 2026年1月15日

これらの結果の背後にある技術的アーキテクチャは、中国が重視する効率性に焦点を当てている。ERNIE 5.0は、約2兆パラメータのミクスチャー・オブ・エキスパート（Mixture-of-Experts）アーキテクチャを採用し、推論ごとにエキスパートのごく一部、正確には(わずか3%)だけを活性化させることで、計算効率を高めている。他のスパースフロンティアモデルと同様に、この設計は密なシステムと比較してクエリごとの計算量を削減するが、追加のエンジニアリングの複雑さも伴う。百度はまた、ERNIE 5.0はテキスト、画像、音声、動画をネイティブに学習しており、マルチモーダルモジュールを言語中心のコアに後付けしたのではないと述べている。これにより、ERNIEはネイティブな「オムニモーダル」AIモデルとなっている。

この復活は、百度がどれだけ落ち込んでいたかを考えると注目に値する。11月には、ERNIE 5.0のプレビュー版はLMArenaで24位にまで落ちていた。国内のAI市場は、ByteDanceのDoubaoが月間アクティブユーザー1億1000万人を占め、DeepSeekのコスト効率の良いモデルが価格戦争を引き起こし、百度は昨年4月に有料サブスクリプションモデルを完全に放棄せざるを得なかった。しかし、消費者向けの苦戦は、百度の企業向けの勢いを止めていない。ERNIEは現在、中国全土のスマートシティ指令センターを支え、すべての重要な中国系銀行にサービスを提供し、1日あたり165億のAPI呼び出しを処理している。このB2Bの強固な拠点は、激しい消費者競争から百度を守りつつ、モデル開発の資金を継続させている。 LLMの純粋なパワーだけでなく、ERNIEチャットボットのUIは非常に使いやすく、ユーザーのニーズに合わせた結果を得られるように事前にカスタマイズされた機能が充実している。例えば、複雑なプロンプトを使わずに、書く、読む、画像編集、一般用途のセクションに分かれている。基本モデルは同じだが、システムプロンプトのバリエーションや調整により、各タスクがより簡単に行える。

興味深いことに、最新バージョンにはウェブ検索機能が搭載されておらず、完全にオフラインで動作する。ただし、ユーザーは以前のErnie 4.5に切り替えて、ウェブ検索機能付きの最新情報を得ることもできる。反応はさまざまで、一部のユーザーはモデルのパフォーマンスやベンチマークの詳細な解説を待っている状態であり、同社は近く公開すると約束している。また、ERNIE 5.0は特定のベンチマークでGPT-5やGemini 2.5と同等だが、多くの西洋の研究所はすでにGPT-5.2やGemini 3に移行しているため、これは追いつきの段階であり、飛躍的な進歩ではないことも考慮すべきだ。ユーザーはernie.baidu.comで無料でモデルを試すことができる。

原文表示

免責事項：このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

0/400

コメントなし