XAI Grok lança vozes personalizadas: clonagem de 2 minutos e verificação de identidade em duas etapas

ChainNewsAbmedia

A xAI lançou no dia 2 de maio, no blog oficial, o recurso Grok Custom Voices. Com ele, os usuários só precisam gravar cerca de 1 minuto de voz natural no painel da xAI; o sistema processa tudo em até 2 minutos e gera um modelo de voz personalizado, que pode ser usado tanto para TTS quanto para a Voice Agent API. Junto com o lançamento, também chegaram o modelo Grok 4.3 e a interface do Voice Library, que reúne todos os recursos de voz.

Custom Voices foi projetado com um mecanismo de autenticação de identidade em duas etapas, para impedir clonagem da voz de outras pessoas.

Funcionalidade: 1 minuto de gravação, 2 minutos de geração, integração com TTS e Voice Agent API

O usuário grava cerca de 1 minuto de voz natural no painel da xAI e, em seguida, o fluxo de bastidores conclui, em sequência: (1) autenticação de identidade, (2) processamento de voz, (3) geração do modelo. No total, em até 2 minutos, já é possível obter um modelo de voz utilizável. O Custom Voices herda todos os recursos do TTS, incluindo speech tags (etiquetas de voz), saída multilíngue e streaming via REST e WebSocket; ele pode ser combinado diretamente com os endpoints de TTS da xAI ou com a Voice Agent API para conversas em tempo real com agentes.

O Voice Library lançado em paralelo é uma interface unificada para gerenciar recursos de voz dentro do painel da xAI, permitindo navegar, visualizar e gerenciar todas as vozes criadas pelos usuários e as vozes pré-construídas, evitando dispersão em várias interfaces. A biblioteca de vozes pré-construídas oferece mais de 80 vozes e suporte a 28 idiomas.

Autenticação de identidade em duas etapas: impedir clonagem de voz de terceiros

Antes da geração da voz, o Custom Voices configura duas etapas de autenticação: primeiro, o usuário lê uma frase de verificação e o sistema transcreve a fala em tempo real; segundo, o sistema calcula separadamente o speaker embedding (vetor de características do falante) a partir da frase de verificação e do áudio completo gravado, comparando se ambos pertencem à mesma pessoa. Apenas se as duas etapas forem aprovadas, o processo de geração do modelo de voz é iniciado.

A xAI afirma claramente: os usuários não conseguem clonar a voz usando arquivos de gravação existentes, nem cloná-la a partir da voz de outra pessoa. Esse desenho elimina o cenário de “pegar gravações de palestras públicas de outra pessoa e copiar”, restringindo o escopo de clonagem à única entrada de “gravação imediata feita pelo próprio usuário”. Para observadores atentos ao tema do uso indevido de geração de voz por IA (como fraudes telefônicas e dublagem não autorizada), esse mecanismo é uma resposta concreta da xAI às preocupações de falsificação.

Próximas observações: sincronia com Grok 4.3, ritmo de expansão do Voice Library

O Custom Voices e o modelo Grok 4.3 foram lançados no mesmo dia, e a xAI vinculou “upgrade do modelo + integração completa das ferramentas de voz” ao mesmo anúncio. O próximo ponto de observação é o ritmo de ampliação da biblioteca de vozes pré-construídas do Voice Library, saindo de 80 vozes para além disso, e se o mapa de 28 idiomas consegue ampliar ainda mais a cobertura de línguas menores, como o chinês tradicional. Outro ponto é a publicação de casos concretos de adoção da Voice Agent API, especialmente exemplos de integração em cenários como automação de atendimento ao cliente, gravação de podcasts e serviços multilíngues.

Este artigo “xAI Grok lança Custom Voices: clonagem em 2 minutos, autenticação de identidade em duas etapas” apareceu pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Roblox lança software de IA para desafiar Unity e Epic Games

De acordo com a Bloomberg, a Roblox está lançando um novo software de IA para competir com a Unity Technologies e a Epic Games, cujos motores dominam o desenvolvimento de jogos com grandes orçamentos. O CEO Dave Baszucki afirmou que a ferramenta tem como objetivo ajudar os criadores a construir jogos multiplayer com gráficos fotorrealistas de forma mais fácil, impulsionada por ar

GateNews2h atrás

Marinha dos EUA assina contrato de quase US$ 100 milhões de IA com a Domino Data Lab para detecção de minas no Estreito de Ormuz

De acordo com a Agência de Notícias Xinhua, o Comando de Sistemas de Guerra de Informação da Marinha dos EUA assinou recentemente um contrato com a empresa de IA Domino Data Lab, com sede em San Francisco, para adquirir e implantar soluções de software de aprendizado de máquina. O contrato, avaliado em quase US$ 100 milhões se for totalmente executado, tem como objetivo a

GateNews4h atrás

OpenAI Codex versão desktop ganha recurso de “animal de estimação”: 3 estados de prompt, incubação com base no idioma de uso

A versão de desktop do OpenAI Codex lançou recentemente a funcionalidade “Pets”, permitindo que desenvolvedores acompanhem em tempo real o status das tarefas do Codex durante a codificação por meio de um personagem animado em forma de pop-up. De acordo com a documentação oficial da OpenAI, o overlay de pets alterna com base no status atual do Codex em 3

ChainNewsAbmedia7h atrás

MoonPay Lança o Cartão MoonAgents, uma Mastercard Virtual para Agentes de IA, na sexta-feira

De acordo com a The Block, a MoonPay lançou a MoonAgents Card, um cartão de débito virtual Mastercard, na sexta-feira. O cartão foi projetado tanto para agentes de IA quanto para usuários, convertendo stablecoins em moeda fiduciária no momento do pagamento e permitindo gastos em qualquer comerciante online global que aceite Mastercard. O cartão i

GateNews17h atrás

Análise do GEPA do Berkeley: a IA aprende novas tarefas sem atualizar pesos, com 35 vezes menos custo de treinamento do que o RL

GEPA é um novo método de treinamento de IA proposto pela equipe da UC Berkeley: não atualiza os pesos, não exige GPU e usa a reflexão para fazer o LLM ler registros completos das tarefas e reescrever os prompts, em vez de apenas fornecer feedback por pontuação. Em seis tarefas, a média de vitória contra GRPO foi de 6%, com máximo de 20%; os rollouts de treinamento foram reduzidos em 35 vezes. Com integração ao DSPy, o Full Program Adapter melhora significativamente o trabalho em matemática e fluxos de trabalho multimodais, com 93% de precisão. O código é de código aberto, e os autores incluem Matei Zaharia, entre outros.

ChainNewsAbmedia05-02 05:48

OpenAI Lança Codex Pets, Companheiro Virtual com IA e Geração Personalizada

De acordo com Beating, a OpenAI adicionou um novo recurso “Codex Pets” ao aplicativo de desktop do Codex, permitindo que os usuários criem e interajam com um companheiro virtual animado. Os usuários podem ativar um pet digitando /pet no editor. O recurso funciona como um indicador de status de agente, exibindo um

GateNews05-02 04:53
Comentário
0/400
Sem comentários