币界網消息,Grok推出聲音克隆功能,使用者只需錄製一分鐘的聲音即可生成自己的AI聲線。該功能允許用戶在xai控制台錄製聲音,生成voice\_id,並接入Grok的TTS或voice agent API,適用於客服、內容創作、遊戲角色和有聲書旁白等場景。用戶需朗讀驗證短句,系統通過STT實時轉寫並比對錄音特徵,確認說話人後才生成聲線,以防止克隆他人聲音。目前,custom voices功能僅在美國開放,伊利諾伊州除外,控制台最多可免費創建30個自訂聲音,API創建能力僅對企業團隊開放。自訂聲音不額外收費,但調用語音API按量計費:實時為$3.00/小時,文本轉語音為$4.20/百萬字符。
Grok 上線聲音克隆:錄一分鐘,就能做自己的 AI 聲線
币界網消息,Grok推出聲音克隆功能,使用者只需錄製一分鐘的聲音即可生成自己的AI聲線。該功能允許用戶在xai控制台錄製聲音,生成voice_id,並接入Grok的TTS或voice agent API,適用於客服、內容創作、遊戲角色和有聲書旁白等場景。用戶需朗讀驗證短句,系統通過STT實時轉寫並比對錄音特徵,確認說話人後才生成聲線,以防止克隆他人聲音。目前,custom voices功能僅在美國開放,伊利諾伊州除外,控制台最多可免費創建30個自訂聲音,API創建能力僅對企業團隊開放。自訂聲音不額外收費,但調用語音API按量計費:實時為$3.00/小時,文本轉語音為$4.20/百萬字符。