🚨 ĐANG NÓNG: OpenAI đã xuất bản một bài báo chứng minh rằng ChatGPT luôn luôn phát minh ra những điều.



Không phải đôi khi. Không phải trước bản cập nhật tiếp theo. Luôn luôn. Họ đã chứng minh điều đó bằng toán học.

Ngay cả với dữ liệu huấn luyện hoàn hảo và sức mạnh tính toán không giới hạn, các mô hình AI luôn tự tin nói những điều hoàn toàn sai lệch. Đây không phải là một lỗi mà họ đang cố gắng sửa chữa. Điều này giải thích cách các hệ thống này hoạt động ở cấp độ cơ bản.

Và các số liệu của chính họ thật sự khắc nghiệt. Mô hình lý luận o1 của OpenAI bị ảo tưởng trong 16% các trường hợp. Mô hình mới của họ O3? 33 phần trăm. Mô hình mới o4-mini? 48 phần trăm. Gần một nửa số thông tin do mô hình mới nhất của họ cung cấp có thể là giả mạo. Các mô hình "thông minh hơn" thực ra ngày càng tệ hơn trong việc nói sự thật.

Đây là lý do tại sao điều này không thể sửa chữa. Các mô hình ngôn ngữ hoạt động bằng cách dự đoán từ tiếp theo dựa trên xác suất. Khi gặp tình huống không chắc chắn, chúng không dừng lại. Chúng không báo hiệu điều đó. Chúng giả định. Và chúng phỏng đoán với sự tự tin tuyệt đối, vì chính xác đó là mục đích của việc huấn luyện chúng.

Các nhà nghiên cứu đã xem xét 10 tiêu chí hàng đầu về trí tuệ nhân tạo được sử dụng để đo lường chất lượng của các mô hình này. 9 trên 10 điểm cùng một điểm cho việc nói "tôi không biết" như khi đưa ra một câu trả lời hoàn toàn sai: không điểm nào. Toàn bộ hệ thống kiểm tra thực sự trừng phạt sự trung thực và thưởng cho sự phỏng đoán.

Vì vậy, AI đã học được chiến lược tối ưu: luôn đoán. Không bao giờ thừa nhận sự không chắc chắn. Nó trông tự tin ngay cả khi bạn đang bịa đặt.

Giải pháp được OpenAI đề xuất là gì? Yêu cầu ChatGPT nói "Tôi không biết" khi không chắc chắn. Các tính toán của chính họ cho thấy điều đó sẽ có nghĩa là khoảng 30% câu hỏi của bạn sẽ không có câu trả lời. Hãy tưởng tượng hỏi ChatGPT ba lần trên mười và nhận được "Tôi không đủ tự tin để trả lời". Người dùng sẽ rời đi trong đêm. Vì vậy, có một cách sửa lỗi, nhưng nó sẽ giết chết sản phẩm.

Đây không chỉ là vấn đề của OpenAI. DeepMind và Đại học Tsinghua cũng đã đi đến cùng một kết luận một cách độc lập. Ba trong số các phòng thí nghiệm AI hàng đầu thế giới, hoạt động riêng biệt, đều đồng ý: điều này là vĩnh viễn.

Mỗi lần ChatGPT đưa ra câu trả lời, hãy tự hỏi: đó là thật hay chỉ là một giả định tự tin?

Đây là câu trả lời của Come-from-Beyond 👇
Họ bắt đầu hiểu lý do tại sao

#QUBIC #Aigarth .* đã đặt khả năng nói "Tôi không biết" vào trung tâm các mối quan tâm của mình

$QUBIC
QUBIC2,63%
Xem bản gốc
post-image
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.39KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.42KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:0
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Ghim