XiaomiはMiMo-V2.5-Proが「一般的なエージェント能力、複雑なソフトウェアエンジニアリング、長期的なタスクにおいてMiMo-V2-Proから大きく進歩した」と主張し、Claude Opus 4.6やGPT-5.4とほぼ同等のコーディングやエージェントベンチマークに匹敵すると述べている。数字もそれを裏付けており、難解な推論タスクではまだ差が見られる。
ベースモデルとプロモデルは異なる目的で設計されている。MiMo-V2.5-Proは重役モデルだ。Xiaomiは、「1,000以上のツール呼び出しを自律的に完了できる、専門家が数日かかる作業もこなす」と述べている。これは複雑な多段階の自動化ワークフローを実行する開発者向けだ。1秒あたり60〜80トークンで動作し、コストは100万トークンあたり入力$1.00 / 出力$3.00。
MiMo-V2.5は日常用のバージョン。より高速で(100〜150トークン/秒)、より安価で($0.40入力 / $2.00出力)、Pro専用の層が省略した画像、音声、動画もサポートする。両モデルとも1Mトークンのコンテキストウィンドウを持ち、1つの会話で約75万語を保持できる。
SWE-bench Proというコーディングベンチマークでは、実際のスタートアップコードのバグ修正を行い、100点満点中57.2%のタスクを解決。これは上位に近く、平均モデルは約25%だ。同様にτ3-benchやClawEvalでも、Claude Opus 4.6やGPT-5.4に数ポイント差で接近している。ただし、Humanity’s Last Examのような大学院レベルの問題群では、MiMoは48.0%、GPT-5.4は58.7%と、10ポイントの差があり、埋めにくい差となっている。
シャオミの新しいMiMo 2.5 Pro AIは、見て、聞いて、行動できる—すべてを一つのモデルで
要約
Xiaomiはまた新しいAIモデルファミリーをリリースした。再び。 数週間前、同社はMiMo-V2-Proをリリースした—これは1兆パラメータのモデルで、Xiaomiがその正体を明かす前に「Hunter Alpha」という別名でOpenRouter上で静かに流通していた。突然、匿名からトップクラスへと変貌を遂げた。私たちも試してみて、その性能に驚いた。 今度はXiaomiがMiMo-V2.5とMiMo-V2.5-Proを発表した。これらは、前世代にはなかったもの—目、耳、動画処理能力を一つのパッケージにまとめた二モデルのファミリーだ。さらに、近い将来モデルのオープンソース化も計画している。
V2-Proはテキストとコードのみだった。マルチモーダル機能は兄弟モデルのMiMo-V2-Omniに存在したが、こちらは別製品でベンチマークスコアも低かった。MiMo-V2.5はこれらを一つにまとめ、より高速で高性能、画像、動画、音声の理解も最初から内蔵している。 これは一般ユーザーにとって重要な意味を持つ。例えば、冷蔵庫の写真をアップロードして夕食レシピを提案させたり、動画チュートリアルを入力してステップごとの要約を得たり、会議を録音してアクションアイテムを抽出したり、すべてを一つの場所で行える。別々のツールやモデル、異なる価格設定を気にする必要はない。
XiaomiはMiMo-V2.5-Proが「一般的なエージェント能力、複雑なソフトウェアエンジニアリング、長期的なタスクにおいてMiMo-V2-Proから大きく進歩した」と主張し、Claude Opus 4.6やGPT-5.4とほぼ同等のコーディングやエージェントベンチマークに匹敵すると述べている。数字もそれを裏付けており、難解な推論タスクではまだ差が見られる。
ベースモデルとプロモデルは異なる目的で設計されている。MiMo-V2.5-Proは重役モデルだ。Xiaomiは、「1,000以上のツール呼び出しを自律的に完了できる、専門家が数日かかる作業もこなす」と述べている。これは複雑な多段階の自動化ワークフローを実行する開発者向けだ。1秒あたり60〜80トークンで動作し、コストは100万トークンあたり入力$1.00 / 出力$3.00。 MiMo-V2.5は日常用のバージョン。より高速で(100〜150トークン/秒)、より安価で($0.40入力 / $2.00出力)、Pro専用の層が省略した画像、音声、動画もサポートする。両モデルとも1Mトークンのコンテキストウィンドウを持ち、1つの会話で約75万語を保持できる。 SWE-bench Proというコーディングベンチマークでは、実際のスタートアップコードのバグ修正を行い、100点満点中57.2%のタスクを解決。これは上位に近く、平均モデルは約25%だ。同様にτ3-benchやClawEvalでも、Claude Opus 4.6やGPT-5.4に数ポイント差で接近している。ただし、Humanity’s Last Examのような大学院レベルの問題群では、MiMoは48.0%、GPT-5.4は58.7%と、10ポイントの差があり、埋めにくい差となっている。
本当に際立つのはトークン効率性だ。Xiaomiは、MiMo-V2.5-Proが同等のベンチマークスコアでKimi K2.6より42%少ないトークンを使用し、MiMo-V2.5はMuse Sparkのほぼ半分のトークンで同様の結果を出すと述べている。これを大規模に運用する開発者にとっては、実質的にコスト削減につながる。
マルチモーダルタスクでは、MiMo-V2.5のスコアはGPT-5.4やGemini 3.1 Proと同等、Opus 4.6の基準にもかなり近い結果を示している。
2025年12月以降、Xiaomiは3つの主要モデルリリースを完了した。最初に効率的なMiMo-V2-Flashをリリースし、その後3月にV2-Pro/Omni/TTSのトリオを発表、そして今日V2.5シリーズを公開した。同社は今後3年間で少なくとも87億ドルのAI投資を約束し、V2-Proのリリース翌日にCEOの雷軍が発表した—このリリースペースからも予算が既に動いていることがわかる。
コンテキストも速度の説明に役立つ。Digital Appliedによると、4月初旬時点で、XiaomiのモデルはOpenRouterの全トラフィックの約21%を占めており、過去7日間で42%以上増加している。以前のモデルが世界最大のAIルーティングプラットフォームの中で最も競争力のあるモデルの一つになった今、リソースとプレッシャーの両方が反復を加速させている。
これはおそらく、エージェントAIツールのHermesのブームとXiaomiとの提携によるもので、ユーザーは限定期間中にMiMo v2 Proを無料で利用できた。その期間はすでに終了しているが、その盛り上がりがXiaomiを競争の場に引き込んだ。
今後Hermesを無料で使いたい人は、Nous APIを使った新しいStep 3.5フラッシュを試すか、OpenRouterの無料モデルを利用して制限付きで試せる。 トークンプランの料金も刷新された。MiMo-V2.5は1倍クレジット、MiMo-V2.5-Proは2倍クレジットで動作。Xiaomiは、長文分析のための1百万トークンのコンテキストウィンドウ使用に追加の倍率を課さなくなったため、コストが明らかに安くなった。既存ユーザーには、ローンチボーナスとしてクレジットのリセットも提供される。 XiaomiはこのモデルをAIスタジオで提供していると述べている。リリース直後にアクセスを試みたが、うまくいかなかった。ただし、Xiaomi MiMo API経由ではすでに公開されており、多くの開発者が実際に利用している場所だ。 同社は次世代のトレーニングも進めており、「より深い推論、より緊密なツール統合、より豊かな実世界の基盤づくり」を目指している。Xiaomiの動きの速さを考えると、その発表は思ったよりも近いかもしれない。