Grok lança som de clonagem: grave um minuto e crie sua própria voz AI

robot
Geração de resumo em curso

De acordo com o monitoramento Beating, a xAI lançou o Grok Custom Voices e a Voice Library.
Os usuários podem gravar uma amostra de voz no console da xAI, gerar seu próprio voice_id, e depois integrar com o Grok TTS ou Voice Agent API, para cenários como atendimento ao cliente, criação de conteúdo, personagens de jogos, narração de audiolivros, entre outros.

Essa funcionalidade não permite simplesmente fazer o upload de um áudio para clonagem.
Os usuários precisam ler uma frase de validação, o sistema fará uma transcrição em tempo real usando STT, e comparará as características vocais da gravação de validação com a gravação completa, confirmando que são da mesma pessoa antes de gerar a voz.
A xAI afirma que isso ajuda a evitar o uso de gravações prontas para clonar a voz de terceiros.

Atualmente, os Custom Voices estão disponíveis apenas nos Estados Unidos, exceto em Illinois.
O console permite criar até 30 vozes personalizadas gratuitamente, e a capacidade de criação via API é disponibilizada apenas para equipes Enterprise.
As vozes personalizadas em si não têm custo adicional, mas o uso da API de voz ainda é cobrado por volume: Realtime por $3,00/hora, Text to Speech por $4,20/milhão de caracteres.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar