Grok Ra mắt Công nghệ Nhân bản Giọng nói: Ghi âm Một Phút để Tạo Giọng AI của Chính Bạn

Theo giám sát của Beating, xAI đã ra mắt Giọng Nói Tùy Chỉnh Grok và Thư Viện Giọng Nói. Người dùng có thể ghi lại một đoạn giọng nói của họ trong bảng điều khiển xAI để tạo ra voice_id của riêng họ, sau đó có thể tích hợp với API Grok TTS hoặc Voice Agent cho các ứng dụng như nhân viên dịch vụ khách hàng, sáng tạo nội dung, nhân vật trong trò chơi và kể chuyện sách nói. Tính năng này không đơn thuần là tải lên âm thanh để sao chép. Người dùng phải đọc và xác minh các câu ngắn, với hệ thống thực hiện chuyển đổi giọng nói theo thời gian thực bằng STT và so sánh đặc điểm của người nói trong bản ghi xác minh với bản ghi đầy đủ để xác nhận họ là cùng một người trước khi tạo giọng nói. xAI tuyên bố rằng điều này ngăn chặn việc sao chép giọng nói của người khác bằng các bản ghi có sẵn. Hiện tại, Giọng Nói Tùy Chỉnh chỉ có sẵn tại Hoa Kỳ, ngoại trừ Illinois. Bảng điều khiển cho phép tạo miễn phí tối đa 30 giọng nói tùy chỉnh, trong khi khả năng tạo API chỉ dành cho các nhóm Doanh nghiệp. Không tính phí bổ sung cho các giọng nói tùy chỉnh, nhưng việc sử dụng API giọng nói được tính phí theo mức sử dụng: Thời gian thực là 3,00 đô la/giờ và Chuyển đổi văn bản thành giọng nói là 4,20 đô la trên triệu ký tự.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim