"AUDIO"検索結果
2025-12-16
08:41

Mirelo completes $41 million seed funding round, led jointly by a16z and Index Ventures, focusing on AI video and audio generation

AI動画音声スタートアップのMireloは、千万ドルのシードラウンド資金調達を完了したことを発表しました。今回の資金調達は、Andreessen Horowitz(a16z)とIndex Venturesが共同リードし、Atlantic.vcとTriplePoint Capitalが追投しました。本ラウンドの資金は、動画とゲーム音声生成モデルの研究開発を加速し、製品とチームの規模拡大に充てられます。 Mireloチームは、同社が音声創作への熱意と業界の現状に対する反省から誕生したことを述べています。生成AIによる動画制作コストの大幅な低下とコンテンツ規模の急速な拡大を背景に、長い間無視されてきた音声は、創造的なプロセスにおける重要なボトルネックとなっています。現行の動画モデルはデフォルトの音声を内蔵し始めていますが、感情表現、叙事的な緊張感、創作のコントロールにおいて、依然としてプロフェッショナルなニーズを満たすことは難しいです。
もっと
20:01

データ:複数のトークンが急騰後に下落、AVAは12%以上下落

ChainCatcher のメッセージによると、Binance の現物データが示すように、市場に大幅な変動が発生しています。複数のトークンが「急騰急落」の状態にあり、その中で AVA は 24 時間で 12.81% 下落し、続いて AUDIO は 7.7% 下落しました。さらに、ADX、LRC、AI、GPS も「急騰急落」の状態にあり、下落幅はそれぞれ 6.2%、7.8%、6.5%、10.32% です。その他のトークン INIT も同様に「急騰急落」の状態にあり、下落幅は 7.2% です。
もっと
AVA-1.2%
ADX2.25%
LRC1.26%
06:18

Kimiは新しい汎用オーディオ基盤モデルKimi-Audioを発表しました

Jin10データ4月26日、今日、Kimiは新しいオープンソースプロジェクト——新しい汎用オーディオ基盤モデルKimi-Audioを発表しました。紹介によると、このモデルは音声認識、音声理解、音声からテキストへの変換、音声対話など多様なタスクをサポートしています。
もっと
03:22

Alibaba Tongyiのオープンソースオーディオ言語モデルであるQwen2-AudioがACL 2024に選ばれました

金十データ8月13日のニュースによると、アリババは通義大モデルを引き続きオープンソース化し、Qwen2シリーズオープンソースファミリーに音声言語モデルQwen2-Audioを追加しました。Qwen2-Audioはテキスト入力なしで直接音声での質問応答が可能で、ユーザーの音声信号(会話、自然音、音楽など)を理解し分析します。このモデルは複数の権威ある評価で以前の最高モデルを大幅に上回っています。通義チームはさらに新しいオーディオ理解モデルのベンチマークテストを同時に発表し、関連論文は今週開催されている国際会議ACL2024に採択されました。
03:40

アリババが音声言語モデル「Qwen-Audio」を発表

Pinwan氏によると、Arxivのページには、Alibabaが最近Qwen-Audioという音声言語モデルをリリースしたことが示されている。 このモデルは、音声言語の事前学習を拡張して、30以上のタスクと、人間の声、自然の音、音楽、歌などのさまざまな音声タイプをカバーすることで、普遍的な音声理解を実現するように設計されています。 調査によると、Qwen-Audioは、タスク固有の微調整を必要とせずに、幅広いベンチマークタスクで大幅なパフォーマンスを達成しています。
もっと
05:16

タイム誌は「2023年のベストインベンション」のリストを発表し、GPT-4、Dall-E 3などが選ばれました

10月24日、タイム誌は、私たちの生活を変える200のイノベーションを含む「ベストインベンション2023」リストを発表しました。 その中から、AdobeのPhotoshopのGenerative ExpandとGenerative Fill、OpenAIのGPT-4とDall-E 3、Runway Gen-2、Meta SeamlessM4T、Stable Audioなど、AIの分野で合計14のプロジェクトが選ばれました。
もっと