Internet Chết? Một phần ba các trang web mới được tạo ra là do AI, theo Stanford

Tóm tắt ngắn gọn

  • Đến giữa năm 2025, 35% các trang web mới được xuất bản là do AI tạo ra hoặc hỗ trợ bởi AI, tăng từ không trước khi ra mắt ChatGPT vào tháng 11 năm 2022.
  • Các tác động đã được xác nhận là co lại về mặt ngữ nghĩa và tích cực nhân tạo — không phải là thông tin sai lệch hoặc đồng nhất về phong cách, bất chấp những gì phần lớn mọi người tin.
  • Ở mức 35% sự phổ biến của AI, rủi ro sụp đổ của mô hình chuyển từ một mối quan tâm lý thuyết sang một mối quan tâm thực nghiệm đối với thế hệ mô hình nền tảng tiếp theo.

Một nghiên cứu mới đã đưa ra con số về lượng internet hiện nay do AI tạo ra: 35%. Đó là tỷ lệ các trang web mới được phân loại là do AI tạo ra hoặc hỗ trợ bởi AI vào giữa năm 2025, theo nghiên cứu của Đại học Stanford, Imperial College London và Internet Archive. Con số này gần như bằng không trước khi ChatGPT ra mắt vào tháng 11 năm 2022. " Tôi thấy tốc độ AI chiếm lĩnh web thật đáng kinh ngạc," Jonáš Doležal, nhà nghiên cứu tại Imperial College London và đồng tác giả của bài báo, nói với 404 Media. “Sau hàng thập kỷ con người định hình nó, một phần đáng kể của internet đã trở nên do AI định nghĩa chỉ trong ba năm.” Nghiên cứu, có tiêu đề “Tác động của Văn bản do AI tạo ra trên Internet,” dựa trên 33 tháng chụp ảnh các trang web từ Wayback Machine của Internet Archive và sử dụng một bộ phát hiện văn bản AI gọi là Pangram v3 để phân loại từng trang.

 Các tác hại đã được xác nhận: cảm xúc, không phải sự thật Các nhà nghiên cứu đã thử nghiệm sáu giả thuyết về tác động của nội dung AI đối với web. Chỉ hai giả thuyết giữ vững dưới sự kiểm tra dữ liệu. Giả thuyết đầu tiên: Chúng ta đang biến thành một đám đông NPC ngu dốt hành xử giống nhau… Hoặc nói một cách khoa học hơn, web đang trở nên ít đa dạng về mặt ngữ nghĩa.

Các trang web do AI tạo ra cho thấy điểm số tương đồng ngữ nghĩa từng cặp cao hơn 33% so với các trang do con người viết. Những ý tưởng giống nhau cứ được thể hiện theo gần như cùng một cách.

Bài báo gợi ý rằng cửa sổ Overton trực tuyến có thể đang thu hẹp lại, không phải qua kiểm duyệt hoặc các chiến dịch phối hợp, mà vì các mô hình ngôn ngữ tối ưu hóa cho các đầu ra gần với phân phối huấn luyện của chúng. Giả thuyết thứ hai: Web ngày càng trở nên tích cực một cách hung hãn. Nội dung AI cho thấy điểm số cảm xúc tích cực cao hơn hơn 107% so với nội dung do con người tạo ra. Các nhà nghiên cứu liên kết điều này với xu hướng nịnh nọt đã được ghi nhận rõ ràng của các Mô hình Ngôn ngữ Lớn — được huấn luyện dựa trên các tín hiệu phê duyệt của con người, chúng tạo ra văn bản cảm thấy được làm sạch, không có ma sát, và liên tục lạc quan. Một internet tràn ngập nội dung vui vẻ, đồng nhất có thể làm giảm khả năng phản đối của con người trên quy mô lớn mà không ai cần phải can thiệp.

Dù có niềm tin phổ biến trong công chúng, nghiên cứu không tìm thấy bằng chứng thống kê rõ ràng rằng nội dung AI đang làm cho internet ít chính xác về mặt thực tế. Các nhà nghiên cứu không tìm thấy mối tương quan ý nghĩa nào giữa mức độ phổ biến của AI và tỷ lệ lỗi thực tế.

Giả thuyết độc tấu phong cách — AI làm phẳng các tiếng nói cá nhân thành một ngôn ngữ chung đồng nhất — là niềm tin mạnh nhất mà người tham gia khảo sát tin tưởng (83% đồng ý). Dữ liệu không xác nhận điều đó. Phân tích ở cấp ký tự không tìm thấy sự gia tăng có ý nghĩa thống kê về tính đồng nhất phong cách liên quan đến mức độ phổ biến của AI. Vấn đề sụp đổ mô hình vừa trở nên thực tế Các rủi ro lớn hơn vượt ra ngoài chất lượng diễn ngôn. Ở mức 35% sự phổ biến của AI, rủi ro lý thuyết về sụp đổ mô hình — nơi các mô hình tương lai suy giảm sau khi huấn luyện trên dữ liệu do AI tạo ra — chuyển từ mối quan tâm học thuật sang thực tế thực nghiệm. Các mô hình nền tảng trong tương lai được huấn luyện trên các lần thu thập web hiện tại sẽ không thể tránh khỏi tiếp nhận dữ liệu phần lớn do AI tạo ra và ít đa dạng về mặt ngữ nghĩa hơn rõ rệt. Nhóm nghiên cứu hiện đang hợp tác với Internet Archive để biến nghiên cứu thành một công cụ giám sát liên tục, theo dõi phần trăm AI trên web theo thời gian thực thay vì chỉ là một bức tranh chụp nhanh một lần. Một khảo sát của Mỹ được thực hiện cùng với nghiên cứu cho thấy phần lớn người Mỹ đã tin vào tất cả sáu giả thuyết tiêu cực, kể cả những giả thuyết mà dữ liệu không ủng hộ. Những người sử dụng AI ít thường có khả năng tin vào các tác hại cao hơn 12% so với những người sử dụng thường xuyên. Những người tin vào Thuyết Internet Chết, hãy gặp dữ liệu: Internet không chết, nhưng 35% nội dung mới có thể là nội dung zombie theo một cách nào đó.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim