xAI 2 мая на официальном блогe представила функцию Grok Custom Voices. Пользователям достаточно записать в консоли xAI около 1 минуты естественного голоса: система завершит обработку примерно за 2 минуты и выдаст персонализированную голосовую модель, которую можно использовать для TTS и Voice Agent API. Параллельно были запущены модель Grok 4.3 и интерфейс Voice Library, который агрегирует все голосовые ресурсы. Custom Voices также включает механизм двухэтапной проверки личности, чтобы предотвратить клонирование чужих голосов.
Функция: запись 1 минута, генерация 2 минуты, интеграция TTS и Voice Agent API
Пользователи записывают в консоли xAI около 1 минуты естественной речи, а затем в фоновом процессе по очереди выполняются: (1) проверка личности, (2) обработка голоса, (3) выпуск модели. В течение общих 2 минут пользователь получает готовую голосовую модель. Custom Voices наследует все возможности TTS: speech tags (голосовые теги), многоязычный вывод, а также REST и WebSocket-стриминг; её можно напрямую использовать с TTS-эндпоинтом xAI или Voice Agent API для интерактивного диалога с агентом.
Одновременно вышел Voice Library — интерфейс в консоли xAI для единого управления голосовыми ресурсами: он позволяет просматривать, предварительно прослушивать и администрировать все голоса, созданные пользователями, а также предварительно подготовленные, чтобы не приходилось распределять ресурсы по разным интерфейсам. Предзагруженная голосовая библиотека предлагает более 80 голосов и поддерживает 28 языков.
Двухэтапная проверка личности: предотвращение клонирования чужих голосов
Перед генерацией голоса в Custom Voices предусмотрены два этапа проверки личности: сначала пользователь зачитывает проверочную фразу, а система в режиме реального времени расшифровывает этот фрагмент; затем система отдельно рассчитывает speaker embedding (вектор признаков говорящего) по проверочной фразе и по полному аудиозаписанному материалу и сравнивает, принадлежат ли они одному и тому же человеку. Только после прохождения обоих этапов запускаться будет процесс выпуска голосовой модели.
xAI однозначно заявляет: пользователи не могут клонировать голос с помощью уже существующих записей и не могут клонировать чужие голоса. Эта конструкция исключает сценарий «получить запись чужого публичного выступления и просто скопировать её», ограничивая клонирование рамками «пользователь сам записывает голос в реальном времени» — то есть одним входным каналом. Для наблюдателей, которые следят за темами злоупотреблений генерацией AI-голоса (например, телефонное мошенничество, озвучка без разрешения), это решение — конкретный ответ xAI на проблему подделок.
Дальнейшее наблюдение: синхронный релиз с Grok 4.3, расширение темпа Voice Library
Custom Voices и Grok 4.3 вышли в один день; xAI привязала «обновление модели + полное раскрытие линейки голосовых инструментов» к той же волне анонсов. Следующая точка наблюдения — темп расширения предзагруженной голосовой библиотеки Voice Library с отметки 80 голосов и сможет ли карта из 28 языков дополнительно охватить такие малые языки, как традиционный китайский. Ещё одна точка наблюдения — будут ли опубликованы конкретные примеры внедрения Voice Agent API, особенно интеграции для сценариев автоматизации колл-центров, записи podcast и многоязычного обслуживания клиентов.
Эта статья xAI Grok представила Custom Voices: клонирование за 2 минуты, двухэтапная проверка личности впервые появилась на Chain News ABMedia.
Связанные статьи
ВМС США заключают контракт с Domino Data Lab почти на 100 миллионов долларов на использование ИИ для обнаружения мин в проливе Ормуз
Настольная версия OpenAI Codex получает функцию с «питомцем»: 3 подсказки статуса, вывод по языку использования
MoonPay запускает MoonAgents Card — виртуальную Mastercard для AI-агентов — в пятницу
Разбор Berkeley GEPA: ИИ может научиться новым задачам без обновления весов, при этом затраты на обучение в 35 раз ниже, чем у RL
OpenAI запускает Codex Pets — AI-ориентированного виртуального компаньона с пользовательской генерацией
MoonPay запускает карту MoonAgents для AI-агентов в сети Mastercard