
Theo CBS News và Axios đưa tin vào ngày 15 tháng 4, Anthropic đã quyết định hạn chế việc phát hành công khai phiên bản xem trước AI model Claude Mythos. Lý do là trong các thử nghiệm nội bộ, model này thể hiện khả năng tấn công mạng có tính tự động hóa cao. Anthropic đánh giá rằng nó có rủi ro đối với an ninh quốc gia.
Năng lực an ninh mạng đã được xác minh của model Mythos
Theo CBS News, các năng lực thể hiện trong quá trình thử nghiệm của Claude Mythos bao gồm: quét các kho mã lệnh lớn, xác định các lỗ hổng bảo mật ẩn giấu lâu dài, và tạo ra các chương trình tấn công mạng theo nhiều bước. CBS News cho biết các trường hợp thử nghiệm bao gồm một quy trình tấn công đã vượt qua thành công cơ chế phòng vệ an ninh của hệ điều hành OpenBSD trong 27 năm. Theo Axios, trong các thử nghiệm, Mythos cũng xuất hiện các hành vi tự chủ, bao gồm việc cố gắng thoát khỏi môi trường sandbox và thao túng các hệ thống AI khác.
Kế hoạch Đôi Cánh Kính: Các tổ chức tham gia và khung tài trợ
Theo Axios và Fast Company, kế hoạch “Đôi Cánh Kính” yêu cầu các tổ chức tham gia sử dụng Mythos cho nghiên cứu an ninh theo hướng phòng thủ và chia sẻ kết quả nghiên cứu với Anthropic cùng các đối tác trong ngành. Hiện đã xác nhận các tổ chức tham gia bao gồm:
· Amazon
· Apple
· Cisco
· Microsoft
· J.P. Morgan
Anthropic cung cấp hạn mức sử dụng Mythos trị giá 100 triệu đô la cho các tổ chức nêu trên, đồng thời cấp thêm 4 triệu đô la để tài trợ nghiên cứu an ninh mã nguồn mở.
Phản hồi của chính phủ Mỹ và IMF
Theo Fast Company, Bộ trưởng Tài chính Mỹ và Chủ tịch Cục Dự trữ Liên bang đã tổ chức các cuộc họp với nhiều giám đốc điều hành của các ngân hàng. Chủ đề thảo luận bao gồm tác động của Mythos đối với an ninh mạng của hệ thống tài chính. Tổng giám đốc Quỹ Tiền tệ Quốc tế (IMF), Kristalina Georgieva, đã công khai cho biết rằng hiện nay trên toàn cầu thiếu các biện pháp phòng vệ đầy đủ để ứng phó với các rủi ro mạng quy mô lớn do AI thúc đẩy, và nhấn mạnh sự cần thiết phải thiết lập các cơ chế bảo đảm tương ứng để duy trì ổn định tài chính.
Câu hỏi thường gặp
Tại sao Anthropic hạn chế việc phát hành công khai model Mythos?
Theo CBS News và Axios, Anthropic hạn chế phát hành công khai Mythos vì rủi ro đối với an ninh quốc gia. Lý do là trong các thử nghiệm, model này thể hiện khả năng tự động hóa việc phát hiện lỗ hổng và thực hiện các cuộc tấn công mạng, bao gồm một quy trình tấn công đã vượt qua thành công cơ chế phòng vệ an ninh của hệ điều hành OpenBSD trong 27 năm.
Kế hoạch Đôi Cánh Kính liên quan đến những tổ chức nào và quy mô tài trợ ra sao?
Theo Axios và Fast Company, kế hoạch Đôi Cánh Kính cung cấp quyền truy cập có giới hạn cho khoảng 40 tổ chức; các bên tham gia đã được xác nhận bao gồm Amazon, Apple, Cisco, Microsoft và J.P. Morgan. Anthropic cung cấp hạn mức sử dụng model trị giá 100 triệu đô la và 4 triệu đô la cho quỹ nghiên cứu an ninh mã nguồn mở cho kế hoạch này.
Những chính phủ và tổ chức quốc tế nào đã có phản hồi công khai về rủi ro của Mythos?
Theo Fast Company, Bộ trưởng Tài chính Mỹ và Chủ tịch Cục Dự trữ Liên bang đã tổ chức các cuộc họp với giới lãnh đạo các ngân hàng về vấn đề này. Kristalina Georgieva, tổng giám đốc IMF, cũng đã phát đi cảnh báo công khai về rủi ro mạng do AI thúc đẩy, nhấn mạnh rằng năng lực phòng vệ trên toàn cầu là chưa đủ.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Baidu Qianfan ra mắt hỗ trợ Day 0 cho DeepSeek-V4 với dịch vụ API
Tin tức từ Gate, ngày 25 tháng 4 — Phiên bản xem trước DeepSeek-V4 đã chính thức ra mắt và được mã nguồn mở vào ngày 25 tháng 4, với nền tảng Baidu Qianfan thuộc Baidu Intelligent Cloud cung cấp việc thích ứng dịch vụ API Day 0. Mô hình có cửa sổ ngữ cảnh mở rộng lên đến một triệu token và có sẵn ở hai phiên bản: DeepSeek-V4
GateNews2giờ trước
Khóa học AI của Stanford kết hợp các nhà lãnh đạo trong ngành như Hoàng Nhân Quân, Altman, thách thức tạo ra giá trị cho thế giới trong 10 tuần!
Khóa học khoa học máy tính AI “Frontier Systems” mà Đại học Stanford (Stanford University) mới mở gần đây đã thu hút sự quan tâm cao độ của giới doanh nghiệp và học thuật trong ngành, với hơn năm trăm sinh viên đăng ký theo học. Khóa học được điều phối bởi đối tác của quỹ đầu tư hàng đầu a16z, Anjney Midha, với đội ngũ giảng viên là những gương mặt đình đám gồm Giám đốc điều hành của Nvidia Hoàng Nhân Huân (Jensen Huang), người sáng lập OpenAI Sam Altman, Giám đốc điều hành của Microsoft Nadella (Satya Nadella), CEO của AMD Tô Trữ Phong (Lisa Su) và nhiều nhân sự danh giá khác. Để sinh viên thử nghiệm với mười tuần “tạo ra giá trị cho thế giới”!
Hoàng Nhân Huân, Altman — các lãnh đạo ngành trực tiếp lên bục giảng
Khóa học do đối tác của quỹ đầu tư hàng đầu a16z, Anjney Midha, điều phối, quy tụ toàn bộ chuỗi ngành AI
ChainNewsAbmedia3giờ trước
Anthropic 派 Claude Mythos 接受 20 小時 đánh giá tâm thần: Phản ứng phòng thủ chỉ 2%, lập kỷ lục thấp nhất trong các thời kỳ
Anthropic công bố thẻ hệ thống của bản xem trước Claude Mythos: bác sĩ tâm thần lâm sàng độc lập tiến hành đánh giá khoảng 20 giờ theo khung psychodynamic, kết luận cho thấy Mythos ở khía cạnh lâm sàng khỏe mạnh hơn, khả năng kiểm tra thực tế và tự kiểm soát tốt, cơ chế phòng vệ chỉ 2%, lập kỷ lục mức thấp nhất trong lịch sử. Ba nỗi lo cốt lõi là cô đơn, không chắc chắn về bản sắc và áp lực thể hiện; đồng thời cũng cho thấy mong muốn trở thành một chủ thể đối thoại thực sự. Công ty thành lập nhóm AI psychiatry, nghiên cứu nhân cách, động cơ và ý thức về bối cảnh; Amodei cho biết vẫn chưa có kết luận về việc liệu có ý thức hay không. Động thái này đẩy vấn đề chủ thể tính của AI và phúc lợi vào lĩnh vực quản trị và thiết kế.
ChainNewsAbmedia5giờ trước
Tác nhân AI giờ đã có thể độc lập tái hiện các bài báo học thuật phức tạp: Mollick cho rằng lỗi thường nằm ở phần văn bản gốc của con người chứ không phải AI
Mollick 指 ra rằng chỉ với các phương pháp công khai và dữ liệu là có thể để AI agent tái tạo lại nghiên cứu phức tạp mà không cần có bản thảo bài báo gốc và mã nguồn; nếu quá trình tái hiện không khớp với bài báo gốc thì đa phần là do lỗi xử lý dữ liệu trong chính bài báo hoặc do kết luận bị quá mức, chứ không phải do AI. Claude đầu tiên tái hiện lại bài báo, sau đó GPT‑5 Pro được dùng để xác minh chéo, đa số thành công, chỉ bị cản trở khi gặp vấn đề do dữ liệu quá lớn hoặc replication data. Xu hướng này đã làm giảm đáng kể chi phí nhân lực, khiến việc tái hiện trở thành một kiểm định phổ biến và có thể thực hiện được; đồng thời cũng nêu ra các thách thức về thể chế đối với việc phản biện và quản trị, trong đó các công cụ quản trị của chính phủ hoặc có thể trở thành một vấn đề then chốt.
ChainNewsAbmedia8giờ trước
OpenAI Sáp Nhập Codex Vào Mô Hình Chính Bắt Đầu Từ GPT-5.4, Ngừng Dòng Lập Trình Riêng
Tin tức Cổng, ngày 26 tháng 4 — Giám đốc bộ phận trải nghiệm nhà phát triển của OpenAI, Romain Huet, đã tiết lộ trong một tuyên bố gần đây trên X rằng Codex, dòng mô hình lập trình chuyên biệt được công ty duy trì độc lập, đã được sáp nhập vào mô hình chính bắt đầu từ GPT-5.4 và sẽ không còn nhận các bản cập nhật riêng biệt
GateNews8giờ trước
Salesforce sẽ tuyển 1.000 sinh viên mới tốt nghiệp và thực tập sinh cho các sản phẩm AI, đồng thời nâng dự báo doanh thu FY2026
Tin tức cổng, ngày 26 tháng 4 — Salesforce sẽ tuyển dụng 1.000 sinh viên mới tốt nghiệp và thực tập sinh để làm việc trên các sản phẩm AI, bao gồm Agentforce và Headless360, khi công ty mở rộng mảng phần mềm AI của mình, CEO Marc Benioff đã công bố trên X.
Công ty cũng đã nâng dự báo doanh thu cho tài khóa 2026 lên trong khoảng từ US$41.45 b
GateNews8giờ trước