先ほど、国産の動画モデルが世界ランキングでトップになった!GoogleのVeoに教訓を与え、さらにお金も稼いだ。

国産の動画生成モデルが、初めて世界のトップに立った。

つい先ほど、第三者機関Artificial Analysisの最新ランキングで、SkyReels V4が「**テキストから生成する動画(音声含む)」」の世界一位を獲得した!

それは、GoogleのVeo 3.1を上回り、Kling 3.0を超えた。

さらに重要なのは、このランキングはメーカー自身の自己採点ではなく、多数の実ユーザーによるブラインド評価結果に基づいていることだ。

これにより、最も難しく、かつ最も価値のある「文章から動画+音声」分野で、国産モデルが最前線に立ったことを示している。

2月27日にSkyReels V4のプレビューが初公開されたときは、すでに世界第2位だった。

わずか1ヶ月足らずで、SkyReels V4はさらに前進し、ついに1位に躍り出た。

SkyReels V4は単に性能が向上しただけでなく、世界の動画モデルのランキングを書き換え始めている。

これは中国のAIGC動画技術が正式に世界をリードし始めた証だ。

2026年の中関村フォーラムでは、SkyReels-V4が正式に重厚にリリースされ、APIも公開(skyreels.ai)されている。

リンク:

他のモダリティでも、SkyReels V4は優れたパフォーマンスを見せ、「テキストから動画(音声なし)」では第2位にランクインしている。

データだけを語るよりも、実力を直接見た方が早い。次に、世界一の動画AIがどれほど凄いのか、じっくり見てみよう。

実証:AI短編ドラマの王者

昆仑万維の天工AIにとって、SkyReelsは完全なマルチモーダル動画生成システムへの転換を始めており、テキスト、画像、動画、音声入力をサポートしている。

これは、世界初のマルチモーダル入力、音声と映像の共同生成、統一された生成・修復・編集タスクを扱う動画基盤モデルだ。

以下の6つの方向性での実測結果は、それぞれがこのモデルの恐るべき能力を示している。

AI短編ドラマ生成:2枚の画像+1段の台詞だけで、映画館クラスの短編ドラマを直出。

ただ画像2枚と台詞を書き込むだけ。

するとSkyReels-V4は、1080p、32FPS、15秒の動画を直接吐き出す。

映像の質感、キャラクターの表情、口の動きの同期もほとんどAIらしさがない。

東洋顔、西洋顔問わず、自然さは極めて高い。

雷鳴が轟き、荒野に砂塵が舞う中、関羽と秦琼が壮大な決闘を繰り広げる——

シンプルな文字から、完全な動画+音声まで、ゼロからでも気軽に映画レベルのコンテンツを創作でき、「何を撮りたいか、何でも撮れる」状態だ。

しかも、AIらしさはほとんど感じられない。

さらに重要なのは、「先に映像を出してから音声を貼り付ける」方式ではなく、SkyReels-V4は映像と音声を同時に処理するよう設計されている点だ。

複数フレームの参考:9枚の画像を使い、キャラクターとストーリーの一貫性を徹底的に保持。

今回のSkyReels-V4の最も重いアップグレードの一つは多フレーム参考だ。

最大9枚のキーフレームを入力でき、それらをもとに中間の動きやカット、トランジションを補完する。

これは非常に重要で、実用性も高い。

以前のAI短編ドラマ制作では、最も失敗しやすいポイントは二つだった。

  • 一秒前と後で顔が変わる(顔の差し替え);
  • 同じシーン内で、突然別の世界に飛んでしまう。

SkyReels-V4の最も実用的な進歩は、これらの問題を見事に解決し、「間違いなくAI漫劇の王者」となった。


例示プロンプト:「@画像-1の光背を背負った青年が絶えず前進し、途中で何度か角を曲がる。カメラは追跡し、その後@画像-2に切り替わり、青年は上半身裸でさらに前進し、急に方向転換。次に@画像-3に切り替わり、驚いた表情を見せる。最後に@画像-4に切り替わり、彼は右に回転させ、濃煙が画面を覆う。」

この動画コントロール能力は、まさに圧巻だ。

スタイルも完全に統一されており、こうした漫劇にはAIらしさが皆無だ。

また、こちらの「ノー顔男」そっくりのモンスターアニメも。

@画像-1のアニメシナリオに沿って、上から下へ、左から右へ自然に展開し、アニメ短編を生成。

戦闘シーンは非常に滑らかで、クローズアップの切り替えも合理的。

この幻想的なスタイルのアニメもお手の物だ。

SkyReels-V4の音声と映像の同期生成能力のおかげで、キャラクターのセリフと口の動きの一致ももはや難しくない。

ワンストップの動画編集**、口だけで動画をカットできる。**

さらに凄いのは、動画を生成するだけでなく、直接修正もできる点だ。 これこそ後編集の神ツール。

次の3つの作業を任せられる。

第一:映像に何かを追加。

キャラに帽子をかぶせたり、部屋に花を置いたり、新しいキャラクターを既存のシーンに挿入したり。

例:@画像_1の青いリブニットのビーニー帽を、@動画_1の中央のダンサーの頭に追加。

一言で、帽子を女の子の頭に載せるだけ。

しかも、角度ごとに完璧に合っている。

これは驚異的だ。

第二:キャラクターの動作を変更。

新たに加えたキャラも、元のキャラと一緒に踊らせたり、動作を再バインドしたり。

例:@画像_1のカラフルなファーコスチュームキャラを、@動画_1の都市ダンスシーンに追加し、ダンサーの隣のダンスフロアに配置。キャラはダンサーの動きを模倣し、遊び心のある誇張されたダンススタイルを取る。

ただキャラを追加するだけでなく、元のキャラと一緒に踊らせることもできる。

この動画生成の理解力は、まさに圧巻だ。

第三:直接クリーニング。

字幕除去、水印除去、ロゴ除去、通行人や動物の削除、不要な干渉物の一掃。

このような、モデルが動画を深く理解した上での編集能力は、まさに最強だ。


従来はPremiereやAfter Effects、各種AIツールを何度も行き来しながら作業していたものが、今やSkyReels-V4一つで完結できる。

言い換えれば、動画生成、要素の挿入、キャラクター編集、映像のクリーニングが、すべて一つの汎用編集フレームに収束している。

今回の大きな突破は、動画生成、補完、延長、編集を一つのインターフェースに統合し、文章から動画、画像から動画、動画の延長、最初と最後のフレーム間の補間、局所・全体の編集を同じ処理フレームに落とし込んだことだ。

技術的な突破:なぜSeedance 2.0に対抗できるのか?

効果を見た後、SkyReels-V4の背後にある技術の凄さを掘り下げてみよう。

先月、SkyReels V4プレビューが世界の現役モデルランキング第2位に登場したとき、詳細な分析記事を書いた——Seedance2.0の爆発後、また中国の黒馬がAAランキングの頂点に立った!AIらしさは消えた。

わずか1ヶ月足らずで、プレビュー版の世界2位からアップグレード版で1位に躍り出た——このスピードは、ゲーム界では「チート」と呼ばれ、AI界では「SkyReels-V4」と称される。

SkyReels-V4の今回の前進は、小さな修正や補強だけによるものではない。

主に二つの動画AIの老問題を解決した。

第一の問題は、「映像は美しいが、論理的に通らない」。

例えば、水が天に向かって流れたり、コップが空中に浮かんでいたり、これはアニメではなく、キャラクターの動きが不自然になる。

この問題を解決するために、SkyReels-V4は訓練時に、「似ている・似ていない」だけでなく、「正しい・正しくない」も判断するようになった。

要するに、モデルにより厳格な評価システムを追加したのだ。

  • 画面は美しく、動きは合理的、音声も口の動きとリズムに合っていること。
  • どこかがおかしければ、何度もやり直して練習させる。

この過程は論文では「全モダリティ強化学習」と呼ばれる。

また、チームは段階的なコース強化学習メカニズムを導入し、解像度や時間、タスクの複雑さ、データの難易度の3つの重要な次元を軸に、モデルが簡単なタスクから徐々に難しいタスクへと進むことで、高難度の生成シナリオのコントロール能力を継続的に向上させている。

これを理解すれば、以前は先生が「答案の見た目の良さ」だけを見ていたのに対し、今は「論理、動き、表現」も同時に見ている状態だ。

以前は試験の点数だけを気にしていたが、今は学習過程も見て、指導方法を改善している。

第二の問題は、「キャラクターが記憶できない」。

いくつかのキーフレームを与えれば、中間の動作やシーンを補完できる。九枚のストーリー画像を入力すれば、キャラクターの顔や衣装、シーンのスタイルをできるだけ一貫させて保持できる。

これはAI短編ドラマにとって非常に重要だ。

以前は、キャラクターが一会ごとに変わるのが最も違和感を生んだ。

AIで短編ドラマを作ると、第一話の男キャラは尖った顎だったのに、第二話では丸い顔になり、観客はすぐに違和感を覚えた。

しかし、九宮格の参考を使えば、キャラクターの一貫性とシーンの連続性が保たれ、AI短編ドラマは「見て楽しむ」から「真剣に追う」レベルに進化した。

この二つの能力により、動画生成の一貫性とコントロール性は業界トップレベルに達し、SkyReels-V4は単なる「動画生成ツール」から、「短編ドラマの工業化生産エンジン」へと進化を遂げた。

SkyReels-V4の技術レポートも公開済みだ。


技術レポート:

実践に直面した検証 中国製Netflixが登場

本当に注目すべきは、ランキングだけではなく、このモデル群がすでに実ビジネスに組み込まれて動いていることだ。

DramaWave:昆仑万維のAI版Netflix。

SkyReels-V4の技術は、昆仑万維の短編ドラマプラットフォーム「DramaWave」を直接支えている。

2026年1月時点で、DramaWaveとFreeReelsを核とした昆仑の短編ドラマプラットフォームの月間アクティブユーザー(MAU)は8000万人を突破し、年間収益(ARR)は4.8億ドル超、月間売上は4000万ドルに達している。

これは単なるPPTの数字ではなく、実ユーザーがAI制作コンテンツに対して実際に課金して視聴している証拠だ。

最近、DramaWaveは「百万ドル・劇启AI」創作支援プログラムを開始し、世界中の優秀なクリエイターを募集している。昆仑万維が新たに自社開発したAI短編ドラマエージェントツール「SkyAnime」も同時リリースされ、クリエイターの創作効率を多方面から支援している。

DramaWaveのAIドラマモジュールは既に千本近くの作品を配信し、月産能力は30本超。

例として、自作AI短編ドラマ『掠夺词条!我转职为亡灵天灾』は、SkyAnimeツールを用いて制作され、コストは2万ドル未満。公開後、1日の投資額は10万ドル超に達し、総再生回数は数百万回にのぼる。

これは「技術→製品→商業化」の完璧なループ検証だ。


「断片生成」から工業化全工程動画生産へと進化。

SkyReels-V4の意義は、「美しい動画を生成できる」だけにとどまらない。

AI短編ドラマ産業にとって、最も核心的な課題は「キャラクターの一貫性」だ。

従来のAI生成短編では、キャラを変えると「顔が変わる」ため、観客は入り込めなかった。

SkyReels-V4の九宮格参考能力により、キャラクターは作品全体を通じて一貫し、品質も「真剣に観られる」レベルに到達した。

これはAI映像産業全体にとって、質的飛躍だ。

ゲーム・音楽・コンテンツエコシステムにおいて、統一動画生成基盤を提供。

注目すべきは、SkyReels-V4は孤立した製品ではなく、他の技術とも連携している点だ。

昆仑万維のAI音楽創作プラットフォーム「Mureka」もその一つ。O1モデルは世界初の思考連鎖(CoT)技術を導入した音楽推論大規模モデルで、V8バージョンは音色、演奏技法、感情表現を次々に突破し、世界100か国以上のユーザーに利用されている。

SkyReels-V4の映像能力とMurekaの音楽能力が融合し、映像から音声、音楽から人声までの全連鎖的創作ループを形成。

一つの企業が、世界トップクラスの動画大規模モデルと音楽大規模モデルを同時に持つのは、世界的にも稀有だ。

ブランド側は一言で完全な動画広告を生成でき、独立したミュージシャンは楽曲を高品質なMVに変換でき、教育機関はコースを自動的に解説・伴奏・動的映像付きの教材動画に変換できる——これらは夢物語ではなく、すでに現実に起きていることだ。

All in AGI

昆仑天工の動画大規模モデル分野の発展軌跡を振り返ると、SkyReels-V4の台頭は偶然ではなく、綿密に戦略的に仕掛けられた爆発的な進化だとわかる。

  • **2025年2月、**SkyReels-V1をオープンソース化——中国初のAI短編ドラマ向け動画生成モデル。千万規模の映像データで訓練され、33種類の微表情と400以上の動作組み合わせをサポート。
  • **2025年4月、**SkyReels-V2をリリース——拡散強制(Diffusion Forcing)フレームワークを用いた、無限長映画生成モデル。
  • **2026年1月、**SkyReels-V3をオープンソース化——1〜4枚の参考画像入力に対応し、多主体動画生成を実現。
  • **2026年2月、**SkyReels-V4プレビュー公開——Artificial Analysisの世界ランキング第2位。
  • **2026年3月、**SkyReels-V4が正式に世界一位に。

V1からV4まで、単なるパラメータ追加ではなく、それぞれの世代で重要な短所を補ってきた。

平均して3〜4ヶ月ごとに大きなアップグレードを重ねるこのペースは、世界のAI動画分野ではほぼ類を見ない。

この絶え間ない革新のリズムに、MurekaのAI音楽分野でのリーディング、Skyworkシリーズの大規模言語モデルとマルチモーダル推論の突破、DramaWave短編プラットフォームの商業化展開が加わり、昆仑万維は「計算能力—モデル—応用」を網羅する完全なAIエコシステムを構築しつつある。

これこそ、2023年初に「All in AGIとAIGC」戦略を確立して以来、最も説得力のある成果だ。

AI動画創作の「大一統」時代の到来

2026年春を振り返ると、AI動画生成分野はこの一年で劇的な変化を経験した。

Soraの最初の波から始まり、Veo、Kling、Seedanceなどのモデルが競い合い、SkyReels-V4が「全モダリティ参考+音声映像共同生成+統一タスクフレーム+全モダリティ強化学習」の四位一体能力で世界を制覇しつつある——私たちは新時代の幕開けを目の当たりにしている。

この時代において、動画制作はもはや専門チームだけの特権ではなく、創造力のある誰もが触れられる表現手段となる。

SkyReels-V4が示す技術の方向性——一つのモデル、一回の操作で、文章から音声映像の完成品まで全工程を完結させる——こそ、その未来への最も明確な道筋だ。

昆仑万維は技術レポートで、今後の三つの方向性を示している:より長い動画(30秒以上)の生成能力拡張、リアルタイムインタラクティブ編集機能の強化、モデルAPIの公開と他のクリエイティブツールエコシステムとの連携拡大。

これらの各方向は、AI動画制作とプロの映像制作の距離をさらに縮めることになる。

AI動画の競争はまだ終わらない。しかし、SkyReels-V4は世界一の成績で、次のことを証明した。

この分野において、中国の昆仑万維の声は、世界中が聞く価値があるだけでなく、すでに世界の頂点に立っている。

この記事の出典:新智元

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン