A xAI lançou no dia 2 de maio, no blog oficial, o recurso Grok Custom Voices. Com ele, os usuários só precisam gravar cerca de 1 minuto de voz natural no painel da xAI; o sistema processa tudo em até 2 minutos e gera um modelo de voz personalizado, que pode ser usado tanto para TTS quanto para a Voice Agent API. Junto com o lançamento, também chegaram o modelo Grok 4.3 e a interface do Voice Library, que reúne todos os recursos de voz.
Custom Voices foi projetado com um mecanismo de autenticação de identidade em duas etapas, para impedir clonagem da voz de outras pessoas.
Funcionalidade: 1 minuto de gravação, 2 minutos de geração, integração com TTS e Voice Agent API
O usuário grava cerca de 1 minuto de voz natural no painel da xAI e, em seguida, o fluxo de bastidores conclui, em sequência: (1) autenticação de identidade, (2) processamento de voz, (3) geração do modelo. No total, em até 2 minutos, já é possível obter um modelo de voz utilizável. O Custom Voices herda todos os recursos do TTS, incluindo speech tags (etiquetas de voz), saída multilíngue e streaming via REST e WebSocket; ele pode ser combinado diretamente com os endpoints de TTS da xAI ou com a Voice Agent API para conversas em tempo real com agentes.
O Voice Library lançado em paralelo é uma interface unificada para gerenciar recursos de voz dentro do painel da xAI, permitindo navegar, visualizar e gerenciar todas as vozes criadas pelos usuários e as vozes pré-construídas, evitando dispersão em várias interfaces. A biblioteca de vozes pré-construídas oferece mais de 80 vozes e suporte a 28 idiomas.
Autenticação de identidade em duas etapas: impedir clonagem de voz de terceiros
Antes da geração da voz, o Custom Voices configura duas etapas de autenticação: primeiro, o usuário lê uma frase de verificação e o sistema transcreve a fala em tempo real; segundo, o sistema calcula separadamente o speaker embedding (vetor de características do falante) a partir da frase de verificação e do áudio completo gravado, comparando se ambos pertencem à mesma pessoa. Apenas se as duas etapas forem aprovadas, o processo de geração do modelo de voz é iniciado.
A xAI afirma claramente: os usuários não conseguem clonar a voz usando arquivos de gravação existentes, nem cloná-la a partir da voz de outra pessoa. Esse desenho elimina o cenário de “pegar gravações de palestras públicas de outra pessoa e copiar”, restringindo o escopo de clonagem à única entrada de “gravação imediata feita pelo próprio usuário”. Para observadores atentos ao tema do uso indevido de geração de voz por IA (como fraudes telefônicas e dublagem não autorizada), esse mecanismo é uma resposta concreta da xAI às preocupações de falsificação.
Próximas observações: sincronia com Grok 4.3, ritmo de expansão do Voice Library
O Custom Voices e o modelo Grok 4.3 foram lançados no mesmo dia, e a xAI vinculou “upgrade do modelo + integração completa das ferramentas de voz” ao mesmo anúncio. O próximo ponto de observação é o ritmo de ampliação da biblioteca de vozes pré-construídas do Voice Library, saindo de 80 vozes para além disso, e se o mapa de 28 idiomas consegue ampliar ainda mais a cobertura de línguas menores, como o chinês tradicional. Outro ponto é a publicação de casos concretos de adoção da Voice Agent API, especialmente exemplos de integração em cenários como automação de atendimento ao cliente, gravação de podcasts e serviços multilíngues.
Este artigo “xAI Grok lança Custom Voices: clonagem em 2 minutos, autenticação de identidade em duas etapas” apareceu pela primeira vez em 鏈新聞 ABMedia.
Related Articles
Roblox lança software de IA para desafiar Unity e Epic Games
Marinha dos EUA assina contrato de quase US$ 100 milhões de IA com a Domino Data Lab para detecção de minas no Estreito de Ormuz
OpenAI Codex versão desktop ganha recurso de “animal de estimação”: 3 estados de prompt, incubação com base no idioma de uso
MoonPay Lança o Cartão MoonAgents, uma Mastercard Virtual para Agentes de IA, na sexta-feira
Análise do GEPA do Berkeley: a IA aprende novas tarefas sem atualizar pesos, com 35 vezes menos custo de treinamento do que o RL
OpenAI Lança Codex Pets, Companheiro Virtual com IA e Geração Personalizada