OpenAIは次世代画像モデルgpt-image-2をテスト、複雑なチャートとリアリズムに焦点を当てる

ドンチャビーティングによる監視によると、OpenAIの次世代画像生成モデルが間もなくリリースされる予定で、いくつかのChatGPTユーザーの間でテストされており、サードパーティのリストにはコードネームgpt-image-2として掲載されている。モデルは今後数週間以内に正式にリリースされる見込みだ。インサイダーは二つの重要な改善点を挙げた。第一に、複雑なチャートの作成能力が大幅に向上した。例えば、ホワイトボード上の特定の場所に付箋やテキストを正確に配置できるようになり、以前のモデルでは困難だった作業だ。第二に、出力に「AI感」がなくなった。以前は過剰に完璧な照明や肌を滑らかにした顔が欠点として指摘されていたが、それらが改善された。新モデルはOpenAIのユーザー成長への圧力によって推進されている。ChatGPTの週次アクティブユーザー数は最近、約9億2000万人で停滞しており、2025年末までに10億人に到達する目標を逃している。サム・アルトマンは昨年、「コードレッド」を発令し、Googleの画像モデルNano Bananaの人気に触発されて、画像生成の改善を「コードレッド」イニシアチブの一つとして優先した。OpenAIは2025年前半の「ジブリの瞬間」を再現することを目指しており、その時期には何百万人ものユーザーがChatGPTに殺到し、自分や友人の写真をジブリ風の画像に変換していた。強化されたテキストレンダリング能力により、画像は広告や教育用チャートにもより信頼性高く使用できるようになった。これは、最近プログラミングモデルで収益を上回ったAnthropicと差別化を図る一つの方向性である。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン