Tin cổng, ngày 24 tháng 4 — DeepSeek đã phát hành loạt mô hình mã nguồn mở V4 theo Giấy phép MIT, với trọng số hiện đã có trên Hugging Face và ModelScope. Loạt này bao gồm hai mô hình (MoE) dạng mixture-of-experts: V4-Pro với 1,6 nghìn tỷ tham số tổng và 49 tỷ tham số được kích hoạt mỗi token, và V4-Flash với 284 tỷ tham số tổng và 13 tỷ tham số được kích hoạt mỗi token. Cả hai đều hỗ trợ cửa sổ ngữ cảnh 1 triệu token.
Kiến trúc có ba nâng cấp chính: một cơ chế attention lai kết hợp attention thưa nén (CSA) và attention nén mạnh (HCA), giúp giảm đáng kể chi phí phát sinh cho ngữ cảnh dài—FLOPs suy luận của V4-Pro cho ngữ cảnh 1M chỉ bằng 27% của V3.2, và bộ nhớ đệm KV (VRAM) để lưu thông tin lịch sử trong quá trình suy luận( chỉ bằng 10% của V3.2; các siêu liên kết ràng buộc đa tạp )mHC( thay thế các kết nối residual truyền thống để tăng cường độ ổn định lan truyền tín hiệu giữa các lớp; và bộ tối ưu hóa Muon để hội tụ huấn luyện nhanh hơn. Tiền huấn luyện sử dụng hơn 32 nghìn tỷ token dữ liệu.
Hậu huấn luyện áp dụng phương pháp hai giai đoạn: đầu tiên huấn luyện các chuyên gia theo miền thông qua supervised fine-tuning )SFT( và học tăng cường GRPO, sau đó hợp nhất chúng thành một mô hình thông qua chưng cất trực tuyến. V4-Pro-Max )highest inference mode tuyên bố là mô hình mã nguồn mở mạnh nhất với các bộ đánh giá mã hóa hàng đầu và khoảng cách thu hẹp đáng kể so với các mô hình “biên” mã nguồn đóng về các tác vụ suy luận và tác nhân. V4-Flash-Max đạt hiệu năng suy luận tầm Pro với đủ ngân sách tính toán nhưng bị giới hạn bởi quy mô tham số đối với kiến thức thuần túy và các tác vụ tác nhân phức tạp. Trọng số được lưu ở độ chính xác kết hợp FP4+FP8.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Vương quốc Anh xem xét AI của Anthropic để củng cố an ninh mạng ngân hàng
Vương quốc Anh đang khám phá một bước đi lớn trong an ninh mạng tài chính bằng cách hợp tác với công ty AI Anthropic. Các cuộc thảo luận ban đầu cho thấy chính phủ có thể triển khai mô hình Claude Mythos tiên tiến của Anthropic trên các ngân hàng và tổ chức tài chính. Động thái này nhằm cải thiện khả năng phòng thủ trước các mối đe dọa mạng lưới tấn công
CryptometerIo1phút trước
Văn phòng Sở hữu trí tuệ của Trung Quốc bổ sung AI, chất bán dẫn và giao diện não–máy tính vào chương trình bảo hộ nhanh
Tin cổng, ngày 24 tháng 4 — Cục Sở hữu Trí tuệ Quốc gia Trung Quốc đã công bố vào ngày 24 tháng 4 rằng họ sẽ thiết lập cơ chế bảo hộ toàn diện quyền sở hữu trí tuệ cho các công nghệ mới nổi thông qua cải cách thể chế, dịch vụ được nâng cao và mở rộng ứng dụng. Cơ quan này sẽ
GateNews8phút trước
Hải quân chỉ ra rằng Chính phủ Hoa Kỳ vận hành một node Bitcoin mà không khai thác
Một đô đốc cấp cao đã cho biết rằng Chính phủ Hoa Kỳ đang tích cực vận hành một nút trên mạng Bitcoin trong khi cố ý tránh tham gia vào các hoạt động khai thác. Thông tin tiết lộ cho thấy rằng các cơ quan chức năng đang đảm nhận vai trò can dự hơn trong cơ sở hạ tầng blockchain để giám sát và
CryptoFrontier24phút trước
Doanh thu Q1 của Tesla tăng 16% lên 22,4B USD; Dự kiến ra mắt robot hình người vào giữa năm 2026
Tin tức cổng, ngày 24 tháng 4 — Tesla đã báo cáo doanh thu quý 1 đạt 22,4 tỷ USD vào ngày 23 tháng 4, tương đương mức tăng 16% so với cùng kỳ năm trước. Tổng số xe giao toàn cầu của công ty vượt 358.000 chiếc, trong khi sản lượng đạt hơn 408.000 chiếc.
Nhà máy Gigafactory Thượng Hải của Tesla đã giao 213.000 xe trong quý, tăng 23,5% so với cùng kỳ năm ngoái. Công ty cũng đã mở rộng mạng lưới sạc, bổ sung 2.200 trạm Supercharger trên toàn cầu và mở rộng phạm vi phủ sóng trên khắp các thủ phủ cấp tỉnh của Trung Quốc cùng hầu hết các thành phố cấp địa khu.
Tesla dự kiến sẽ ra mắt robot hình người thế hệ thứ ba của mình, Optimus, vào giữa năm 2026 và sẽ bắt đầu chuẩn bị một nhà máy robot quy mô lớn trong quý 2. CEO Elon Musk cho biết Optimus có thể tạo ra hơn UStrillion doanh thu trong dài hạn. Công ty dự kiến sẽ chi hơn USbillion vào năm 2026—nhiều hơn gấp đôi dự báo trước đó—để tài trợ cho robot hình người, xe tự hành và phát triển AI.
Khi áp lực thuế quan gia tăng, Tesla đang tận dụng cơ sở ở Thượng Hải như một trung tâm xuất khẩu toàn cầu để phục vụ các thị trường ngoài Mỹ và tránh tác động của thuế quan. Nhà máy Thượng Hải cũng sản xuất các sản phẩm lưu trữ năng lượng, góp phần hỗ trợ kế hoạch mở rộng của Tesla ra ngoài lĩnh vực sản xuất ô tô.
GateNews24phút trước
Lợi nhuận quý 1 của SK Hynix tăng gấp năm lần lên mức kỷ lục nhờ bùng nổ AI, thúc đẩy thưởng nhân viên lên tới 878K USD
Tin cổng Gate News, ngày 24 tháng 4 — SK Hynix báo cáo lợi nhuận hoạt động theo quý tăng gấp năm lần lên mức kỷ lục 37,61 nghìn tỷ won ($32,4 tỷ) vào ngày 23 tháng 4, nhờ nhu cầu tăng vọt từ trí tuệ nhân tạo và các trung tâm dữ liệu. Khoản lợi nhuận khổng lồ này đang thúc đẩy các khoản thưởng cho nhân viên ở mức chưa từng có, theo đánh giá của các nhà phân tích có thể lên tới $878.000 cho mỗi nhân viên vào năm 2027 nếu các dự báo lợi nhuận hiện tại vẫn được giữ vững,
GateNews1giờ trước
Kiến trúc DeepSeek V4 được xác minh: trúng 3/4 dự đoán, vắng mặt mô-đun Engram
Tin cổng thông tin, ngày 24 tháng 4 — DeepSeek đã phát hành hôm nay thẻ mô hình V4, xác nhận các dự đoán kiến trúc trước đó được đưa ra thông qua phân tích thư viện kernel TileKernels được phát hành ngày hôm qua (April 23). Theo giám sát của Beating, ba thành phần cốt lõi đã được xác nhận: mHC
GateNews1giờ trước