中国のテック大手百度は、最先端のAIモデルを更新したばかりで、その性能はかなり良好のようだ。 同社のERNIE-5.0-0110は、LMArenaのテキストリーダーボードで1460ポイントを獲得し、世界第8位に入り、プラットフォームのトップ10に入った唯一の中国モデルとなった。OpenAIのGPT-5.1-HighやGoogleのGemini-2.5-Proよりも上位に位置している。ERNIE v4.0は2023年にリリースされた。 ERNIE 5.0はまた、数学的推論においても世界第2位を獲得し、未公開のGPT-5.2-Highに次いでいる。中国のモデルが複雑な論理タスクでほぼすべての公開されている西洋のシステムを上回ることは、AIの能力ギャップの大きな変化、あるいはその縮小を示している。
そうだ、数学で世界第2位にいるERNIEは今や全く異なる会話に入っている。
— Muhammad Ayan (@socialwithaayan) 2026年1月15日
百度のXでの発表によると、ERNIE 5.0は正式にプレビュー段階を終了したとのこと。モデルはまた、クリエイティブライティング、指示に従う能力、コーディングにおいても競争力のあるパフォーマンスを示し、科学、ビジネス・ファイナンス、ヘルスケアなど複数の職種カテゴリでトップ10に入った。
🚨速報:@Baidu_incのERNIE-5.0-0110はLMArenaで素晴らしい結果を出した。これはテストやプレビューではない。
最新のランキングでは、モデルはテキストベンチマークで1460点を獲得し、中国モデルの中で1位、世界トップ10に入りました。唯一の中国… pic.twitter.com/9iBVzDcqgq
— Doreen (@dee_naliaks) 2026年1月15日
これらの結果の背後にある技術的アーキテクチャは、中国が重視する効率性に焦点を当てている。ERNIE 5.0は、約2兆パラメータのミクスチャー・オブ・エキスパート(Mixture-of-Experts)アーキテクチャを採用し、推論ごとにエキスパートのごく一部、正確には(わずか3%)だけを活性化させることで、計算効率を高めている。 他のスパースフロンティアモデルと同様に、この設計は密なシステムと比較してクエリごとの計算量を削減するが、追加のエンジニアリングの複雑さも伴う。百度はまた、ERNIE 5.0はテキスト、画像、音声、動画をネイティブに学習しており、マルチモーダルモジュールを言語中心のコアに後付けしたのではないと述べている。これにより、ERNIEはネイティブな「オムニモーダル」AIモデルとなっている。
この復活は、百度がどれだけ落ち込んでいたかを考えると注目に値する。11月には、ERNIE 5.0のプレビュー版はLMArenaで24位にまで落ちていた。国内のAI市場は、ByteDanceのDoubaoが月間アクティブユーザー1億1000万人を占め、DeepSeekのコスト効率の良いモデルが価格戦争を引き起こし、百度は昨年4月に有料サブスクリプションモデルを完全に放棄せざるを得なかった。 しかし、消費者向けの苦戦は、百度の企業向けの勢いを止めていない。ERNIEは現在、中国全土のスマートシティ指令センターを支え、すべての重要な中国系銀行にサービスを提供し、1日あたり165億のAPI呼び出しを処理している。このB2Bの強固な拠点は、激しい消費者競争から百度を守りつつ、モデル開発の資金を継続させている。 LLMの純粋なパワーだけでなく、ERNIEチャットボットのUIは非常に使いやすく、ユーザーのニーズに合わせた結果を得られるように事前にカスタマイズされた機能が充実している。例えば、複雑なプロンプトを使わずに、書く、読む、画像編集、一般用途のセクションに分かれている。基本モデルは同じだが、システムプロンプトのバリエーションや調整により、各タスクがより簡単に行える。
興味深いことに、最新バージョンにはウェブ検索機能が搭載されておらず、完全にオフラインで動作する。ただし、ユーザーは以前のErnie 4.5に切り替えて、ウェブ検索機能付きの最新情報を得ることもできる。 反応はさまざまで、一部のユーザーはモデルのパフォーマンスやベンチマークの詳細な解説を待っている状態であり、同社は近く公開すると約束している。また、ERNIE 5.0は特定のベンチマークでGPT-5やGemini 2.5と同等だが、多くの西洋の研究所はすでにGPT-5.2やGemini 3に移行しているため、これは追いつきの段階であり、飛躍的な進歩ではないことも考慮すべきだ。 ユーザーはernie.baidu.comで無料でモデルを試すことができる。