XAI Grok ajoute des Custom Voices : clonage en 2 minutes, vérification d’identité en deux étapes

ChainNewsAbmedia

xAI a lancé le 2 mai sur son blog officiel la fonctionnalité Grok Custom Voices. Les utilisateurs n’ont qu’à enregistrer environ 1 minute de voix naturelle dans la console xAI ; le système traite le tout en moins de 2 minutes et produit un modèle vocal sur mesure utilisable pour l’API TTS et l’API Voice Agent. Le lancement s’accompagne également du modèle Grok 4.3, ainsi que de l’interface Voice Library qui regroupe l’ensemble des ressources vocales. Custom Voices intègre en outre un mécanisme d’authentification d’identité en deux étapes, conçu pour empêcher le clonage de la voix d’autrui.

Fonctionnalité : 1 minute d’enregistrement, 2 minutes de génération, intégration TTS et Voice Agent API

Les utilisateurs enregistrent environ 1 minute de voix naturelle dans la console xAI, puis le traitement côté serveur s’enchaîne comme suit : (1) authentification, (2) traitement audio, (3) génération du modèle. En tout, en moins de 2 minutes, il est possible d’obtenir un modèle vocal exploitable. Custom Voices reprend toutes les capacités de TTS, y compris les speech tags (étiquettes vocales), la sortie multilingue, ainsi que le streaming via REST et WebSocket ; il peut être directement combiné avec les points de terminaison TTS de xAI ou l’API Voice Agent pour dialoguer en temps réel avec des agents.

La Voice Library lancée en parallèle est une interface de la console xAI permettant de gérer de manière unifiée les ressources vocales : elle est consultable, permet un aperçu et la gestion des voix créées par les utilisateurs comme des voix préconstruites, évitant d’avoir à se disperser sur plusieurs interfaces. La bibliothèque de voix préconstruites propose plus de 80 voix et prend en charge 28 langues.

Authentification d’identité en deux étapes : empêcher le clonage de la voix d’autrui

Avant la génération vocale, Custom Voices met en place deux barrières d’authentification : d’abord, l’utilisateur lit à voix haute une phrase de vérification et le système transcrit immédiatement la séquence audio ; ensuite, à partir de la phrase de vérification et de l’enregistrement complet, le système calcule séparément les speaker embedding (vecteurs de caractéristiques du locuteur) et compare s’il s’agit de la même personne. Ce n’est qu’après le passage des deux étapes que l’on entre dans le processus de génération du modèle vocal.

xAI affirme clairement : les utilisateurs ne peuvent pas cloner une voix à partir de fichiers d’enregistrement existants, ni cloner la voix d’une autre personne. Cette conception écarte le scénario consistant à « copier directement » des enregistrements d’exposés publics d’autrui, et limite le clonage à un unique point d’entrée : « un enregistrement en temps réel par l’utilisateur lui-même ». Pour les observateurs attentifs aux dérives de la génération de voix par l’IA (par exemple les arnaques téléphoniques, le doublage non autorisé), ce mécanisme constitue une réponse concrète de xAI aux enjeux de prévention de la contrefaçon.

Observations à venir : rythme d’expansion de la Voice Library en même temps que Grok 4.3

Custom Voices et le modèle Grok 4.3 sont lancés le même jour ; xAI associe « mise à niveau du modèle + extension complète des outils vocaux » à la même vague d’annonce. Le prochain point d’observation est le rythme d’expansion de la bibliothèque de voix préconstruites de Voice Library, passant de 80 voix vers davantage, ainsi que la capacité à couvrir encore plus de petites langues, comme le chinois traditionnel ; autre point d’observation : les cas d’adoption concrets de l’API Voice Agent publiés au détail, notamment des exemples d’intégration pour l’automatisation du service client, la production de podcasts, ou encore le support client multilingue.

Cet article xAI Grok lance Custom Voices : clonage en 2 minutes, authentification d’identité en deux étapes apparaît pour la première fois sur 鏈新聞 ABMedia.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Roblox lance un logiciel d’IA pour défier Unity et Epic Games

D’après Bloomberg, Roblox lance de nouveaux logiciels d’IA pour concurrencer Unity Technologies et Epic Games, dont les moteurs dominent le développement de jeux à gros budgets. Le PDG Dave Baszucki a déclaré que l’outil vise à aider les créateurs à construire plus facilement des jeux multijoueurs avec des graphismes photoréalistes, alimenté par ar

GateNewsIl y a 1h

La marine américaine signe un contrat d’environ 100 millions de dollars avec Domino Data Lab pour la détection de mines dans le détroit d’Hormuz

Selon l’Agence de presse Xinhua, la commande des systèmes de guerre de l’information de l’U.S. Navy a récemment signé un contrat avec la société d’IA Domino Data Lab, basée à San Francisco, afin d’acquérir et de déployer des solutions logicielles d’apprentissage automatique. Le contrat, d’une valeur proche de 100 millions de dollars s’il est entièrement exécuté, vise à

GateNewsIl y a 3h

La version de bureau de Codex d’OpenAI ajoute une fonction “animal de compagnie” : 3 états de notification, éclosion selon la langue utilisée

La version bureau de OpenAI Codex a récemment mis en ligne la fonctionnalité « Animaux de compagnie » (Pets), permettant aux développeurs de suivre en temps réel l’état des tâches de Codex pendant qu’ils codent grâce à des personnages animés flottants. D’après la documentation officielle d’OpenAI, l’overlay des animaux de compagnie bascule en fonction de l’état actuel de Codex 3

ChainNewsAbmediaIl y a 7h

MoonPay lance la carte MoonAgents, une Mastercard virtuelle pour les agents d’IA, vendredi

Selon The Block, MoonPay a lancé MoonAgents Card, une carte de débit Mastercard virtuelle, vendredi. La carte est conçue à la fois pour les agents IA et pour les utilisateurs, convertissant des stablecoins en monnaie fiduciaire au moment du paiement et permettant de dépenser chez n’importe quel commerçant en ligne à l’échelle mondiale qui accepte Mastercard. La carte i

GateNewsIl y a 17h

Analyse de Berkeley GEPA : l’IA peut apprendre de nouvelles tâches sans mettre à jour les poids, avec 35 fois moins de coûts d’entraînement que le RL

GEPA est une nouvelle méthode d’entraînement de l’IA proposée par l’équipe de l’Université de Californie à Berkeley : elle n’actualise pas les poids, ne nécessite pas de GPU, et s’appuie sur le fait que l’LLM de réflexion lit l’intégralité des journaux de tâches puis réécrit les prompts, plutôt que de simplement donner un retour selon un score. En moyenne, sur six tâches, GEPA obtient une victoire supérieure de 6% et jusqu’à 20% ; la formation des rollouts est réduite de 35 fois. Son intégration à DSPy via Full Program Adapter améliore nettement les tâches mathématiques et les workflows multi-modaux, avec 93% de précision. Le code est open source, et les auteurs incluent notamment Matei Zaharia.

ChainNewsAbmedia05-02 05:48

OpenAI lance Codex Pets, un compagnon virtuel IA avec génération sur mesure

D'après Beating, OpenAI a ajouté une nouvelle fonctionnalité « Codex Pets » à l’application de bureau Codex, permettant aux utilisateurs de faire apparaître et d’interagir avec un compagnon virtuel animé. Les utilisateurs peuvent activer un animal en tapant /pet dans l’éditeur. La fonctionnalité fonctionne comme un indicateur d’état d’agent, affichant un

GateNews05-02 04:53
Commentaire
0/400
Aucun commentaire