币界网消息,Grok推出声音克隆功能,用户只需录制一分钟的声音即可生成自己的AI声线。该功能允许用户在xai控制台录制声音,生成voice\_id,并接入Grok的TTS或voice agent API,适用于客服、内容创作、游戏角色和有声书旁白等场景。用户需朗读验证短句,系统通过STT实时转写并比对录音特征,确认说话人后才生成声线,以防止克隆他人声音。目前,custom voices功能仅在美国开放,伊利诺伊州除外,控制台最多可免费创建30个自定义声音,API创建能力仅对企业团队开放。自定义声音不额外收费,但调用语音API按量计费:实时为$3.00/小时,文本转语音为$4.20/百万字符。
Grok上线声音克隆:录一分钟,就能做自己的AI声线
币界网消息,Grok推出声音克隆功能,用户只需录制一分钟的声音即可生成自己的AI声线。该功能允许用户在xai控制台录制声音,生成voice_id,并接入Grok的TTS或voice agent API,适用于客服、内容创作、游戏角色和有声书旁白等场景。用户需朗读验证短句,系统通过STT实时转写并比对录音特征,确认说话人后才生成声线,以防止克隆他人声音。目前,custom voices功能仅在美国开放,伊利诺伊州除外,控制台最多可免费创建30个自定义声音,API创建能力仅对企业团队开放。自定义声音不额外收费,但调用语音API按量计费:实时为$3.00/小时,文本转语音为$4.20/百万字符。