Google 发布 Gemini 3.1 Flash TTS:增强情感表达与多说话人能力

Gate News 消息,4 月 17 日——Google 于 4 月 15 日公布 Gemini 3.1 Flash TTS,这是一款先进的文本转语音模型,具备增强的情感表达与控制特性。新模型将通过开发者 API、企业 Vertex AI 以及协作工具逐步推出。

该模型的核心能力包括基于自然语言的音频标签,用于加快微调速度、控制语调与情感;另配备“导演模式”,可用于指定场景与角色身份,以生成更细腻的语音输出。多说话人功能可实现同时生成对话内容,使对话流程更自然,适用于播客、有声内容以及 AI 助手。该模型支持 70 多种语言和方言,体现了地区口音与表达方式,为全球本地化语音体验提供支持。

Google 强调性能与成本效率,在盲测的人类评估基准上取得了高分,同时通过其 Flash 架构降低了计算成本——该架构面向大规模企业采用进行了设计。生成的音频包含 SynthID 水印,用于识别 AI 生成内容并打击不实信息。

此举体现了语音交互领域竞争的进一步加剧。OpenAI 正将实时语音能力与对话式 AI 结合,以实现类似人类的交互,而 Meta 则在具有语音驱动的社交体验方面扩大对 AI 角色的投入。行业观察者指出,尽管高水平的表演和创意工作目前仍可能由人类主导,但重复性与大规模生产市场可能会在配音、广告和有声读物等领域逐步迎来 AI 采用。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Anthropic 武器级网络安全模型 Mythos 遭未授权访问:他们是如何做到的?

彭博报道,一私人论坛群组通过 Anthropic 第三方承包商的合法授权,未授权访问 Mythos。Mythos 为企业用的防御型 AI,仅开放给经过严格审核的大型机构。该群组利用对模型 URL 的掌握推测系统位置进入,并提供截图示范,称仍在使用但无恶意。Anthropic 正在调查,初步认定为权限滥用而非外部入侵。此事显示将高敏感模型交由第三方管控的风险,需提升治理韧性与信任机制。

鏈新聞abmedia9 分钟前

慢雾首席信息安全官(CISO)发出警示:ShinyHunters 声称入侵 Anthropic 内部系统

根据慢雾(SlowMist)首席信息安全长 23pds 于 4 月 23 日在 X 平台发布的警示,黑客组织 ShinyHunters 声称已入侵与 Anthropic Mythos 模型相关的内部系统,并公开分享用户管理面板、AI 实验仪表板及模型性能与成本分析等截图佐证,但 Anthropic 官方尚未发表声明。

Market Whisper11 分钟前

Chrome 变“AI 同事”:Auto Browse 自动化网页任务、企业版月费 6 美元

Chrome 企业推出基于 Gemini 的 Auto Browse 和 Chrome Skills,使浏览器能够自动执行多步骤任务,但需要用户点击确认;可保存/分享 AI 工作流,并与 Gmail、日历、Drive 集成,包含 DLP 管控,每月 6 美元,定位为把浏览器变成 AI 同事。

鏈新聞abmedia45 分钟前

OpenAI 推出 ChatGPT Workspace Agents:Codex 驱动、团队共享、Slack 集成

OpenAI于4月22日在ChatGPT Business/Enterprise/Edu/Teachers推出WorkspaceAgents,由Codex驱动、云端长时、团队共享且可离线执行,能在Slack主动回应与开票、执行多步工作流,并支持排程。研究预览免费到5月6日,之后采用credit-based计费,价格待公布。与GoogleGeminiEnterpriseAgentPlatform、AnthropicClaudeCowork同场竞争,三家聚焦企业级代理但定位各有不同。

鏈新聞abmedia47 分钟前

Google Cloud Next 2026:推出 Gemini 企业代理平台,7.5 亿美元助顾问落地

Google Cloud 在 Cloud Next 2026 公布 Gemini 企业代理平台,整合模型选择、代理构建、DevOps、编排与企业安全管控,并推出 7.5 亿美元基金以协助 McKinsey、Accenture、Deloitte 部署企业代理。平台搭配 Ironwood TPU、A2A 与 MCP,打造自家全栈与顾问通路,对抗 OpenAI Operator 与 Anthropic Claude 企业版。

鏈新聞abmedia48 分钟前

Google 扩展 Wiz 云安全至 AWS、Azure 和 Google Cloud

Google 宣布了新的安全功能,以及其在收购以色列云安全公司 Wiz 后,将其在美国$32 十亿美元规模内更深度集成到 Google Cloud 和竞争对手平台的相关计划,具体将在其 Cloud Next '26 活动中展示。该公司以预览模式推出了面向安全运营的三个 AI 代理,旨在为

Crypto Frontier58 分钟前
评论
0/400
暂无评论