Hugging Face phát hành mã nguồn mở ml-intern, một tác nhân AI cho nghiên cứu ML tự chủ

Tin từ Gate News, ngày 22 tháng 4 — Hugging Face đã phát hành mã nguồn mở ml-intern, một tác nhân nghiên cứu ML có thể tự động hoàn thành toàn bộ quy trình gồm đọc bài báo, tổ chức tập dữ liệu, khởi chạy huấn luyện GPU, đánh giá kết quả và lặp lại để cải tiến. Dự án được xây dựng trên framework smolagents của Hugging Face và cung cấp cả giao diện dòng lệnh (CLI) lẫn giao diện dựa trên web, với mã nguồn được công khai trên GitHub.

Bộ công cụ của ml-intern được thiết kế xoay quanh hệ sinh thái Hugging Face. Nó truy xuất các bài báo từ arXiv và HF Papers đồng thời lần theo chuỗi trích dẫn để đọc sâu hơn; duyệt tập dữ liệu trên HF Hub, xác thực chất lượng và định dạng lại dữ liệu để huấn luyện; và khi không có tài nguyên GPU cục bộ, nó gọi HF Jobs để khởi chạy các tác vụ huấn luyện trên đám mây. Sau khi quá trình huấn luyện hoàn tất, tác nhân tự động đọc các đầu ra đánh giá, chẩn đoán nguyên nhân thất bại và chạy lại các thí nghiệm. Theo mặc định, nó sử dụng Claude Sonnet 4.5 để điều khiển vòng lặp ra quyết định, với tối đa 300 lần lặp cho mỗi lần chạy và nén ngữ cảnh tự động khi vượt quá 170k token.

Hugging Face đã trình diễn ba trường hợp sử dụng. Trong một tác vụ suy luận khoa học, tác nhân xác định các tập dữ liệu OpenScience và NemoTron-CrossThink từ chuỗi trích dẫn, lọc bảy biến thể từ ARC, SciQ và MMLU theo mức độ khó, rồi chạy 12 vòng tinh chỉnh giám sát trên Qwen3-1.7B, giúp cải thiện điểm GPQA từ 10% lên 32% trong dưới 10 giờ. Với một ứng dụng y tế, tác nhân kết luận rằng các tập dữ liệu hiện có là chưa đủ, viết các script để tạo ra 1.100 mẫu dữ liệu tổng hợp, và mở rộng chúng gấp 50 lần để huấn luyện, vượt hiệu năng Codex thêm 60% trên HealthBench. Trong một bối cảnh toán học cạnh tranh, tác nhân đã viết script huấn luyện GRPO và khởi chạy huấn luyện trên các GPU A100 thông qua HF Spaces, sau đó tiến hành các nghiên cứu ablation sau khi quan sát hiện tượng sụp đổ phần thưởng.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Mở OpenAI ChatGPT Workspace Agents: Được điều khiển bởi Codex, chia sẻ trong nhóm, tích hợp Slack

OpenAI vào ngày 22 tháng 4 đã ra mắt Workspace Agents trên ChatGPT Business/Enterprise/Edu/Teachers, được cung cấp bởi Codex, chạy dài hạn trên đám mây, được dùng chung trong nhóm và có thể thực thi ngoại tuyến. Chúng có thể chủ động phản hồi và tạo hóa đơn trên Slack, thực hiện các quy trình làm việc đa bước và hỗ trợ lập lịch. Bản nghiên cứu xem trước miễn phí đến ngày 6 tháng 5; sau đó sẽ áp dụng tính phí theo credit, giá cả sẽ được công bố sau. Cạnh tranh cùng với GoogleGeminiEnterpriseAgentPlatform và AnthropicClaudeCowork, cả ba đều tập trung vào các tác nhân cấp doanh nghiệp nhưng định vị của từng bên là khác nhau.

ChainNewsAbmedia47phút trước

Google Cloud Next 2026: Ra mắt Nền tảng đại lý doanh nghiệp Gemini, 750 triệu USD hỗ trợ các công ty tư vấn triển khai

Google Cloud tại Cloud Next 2026 đã công bố Nền tảng tác nhân doanh nghiệp Gemini Enterprise Agent Platform, tích hợp lựa chọn mô hình, xây dựng tác nhân, DevOps, điều phối và kiểm soát an ninh cho doanh nghiệp, đồng thời ra mắt quỹ 750 triệu USD để hỗ trợ McKinsey, Accenture, Deloitte triển khai các tác nhân doanh nghiệp. Nền tảng kết hợp Ironwood TPU, A2A và MCP, xây dựng hệ sinh thái toàn ngăn của riêng mình cùng kênh dành cho tư vấn, nhằm đối đầu với OpenAI Operator và phiên bản doanh nghiệp của Anthropic Claude.

ChainNewsAbmedia49phút trước

Google mở rộng Wiz Cloud Security trên AWS, Azure và Google Cloud

Google đã công bố các tính năng bảo mật mới và mức độ tích hợp sâu hơn của Wiz, công ty bảo mật đám mây của Israel mà họ đã mua lại với giá US$32 billion, trên Google Cloud và các nền tảng đối thủ tại sự kiện Cloud Next '26. Công ty đã giới thiệu ba tác nhân AI cho Hoạt động An ninh ở chế độ xem trước, được thiết kế cho

CryptoFrontier58phút trước

Tác nhân Khám phá Lỗ hổng AI của 360 Tìm thấy Gần 1.000 Khai thác Zero-Day, Cạnh tranh với Mythos

360 Digital Security 的 tác nhân AI được điều khiển bởi AI tuyên bố đã phát hiện khoảng 1.000 lỗ hổng mới, bao gồm trong Office và OpenClaw; AI giờ là cốt lõi của việc phát hiện và chuẩn bị chuỗi khai thác, sánh ngang Mythos. Tóm tắt: Một báo cáo được Bloomberg trích dẫn ghi nhận rằng 360 Digital Security Group’s AI-driven Vulnerability Discovery Agent đã xác định gần 1.000 lỗ hổng phần mềm trước đây chưa được biết đến trong những tháng gần đây, bao gồm trong Microsoft Office và framework OpenClaw. Công ty cho biết AI đã trở thành động cơ cốt lõi của việc phát hiện lỗ hổng và đã công bố một công cụ AI để tăng tốc việc xây dựng chuỗi khai thác. Benincasa mô tả 360 là đối thủ cạnh tranh của Mythos của Anthropic, dựa trên phần đánh giá của Natto Thoughts về các thông báo ngôn ngữ Trung Quốc của công ty.

GateNews12giờ trước

Aethir Claw V1 ra mắt: Triển khai tác nhân AI mà không cần mã trong dưới năm phút

Bản tin Gate News, ngày 22 tháng 4 — Aethir, nhà cung cấp cơ sở hạ tầng điện toán đám mây GPU phi tập trung, hôm nay đã ra mắt phiên bản 1.0 của Aethir Claw, nền tảng lưu trữ tác nhân AI của mình. Nền tảng cho phép người dùng không có nền tảng kỹ thuật triển khai và cấu hình các tác nhân AI hoàn toàn trong trình duyệt của họ trong dưới năm

GateNews13giờ trước

Google ra mắt công cụ tác nhân AI để giúp doanh nghiệp tự động hóa tác vụ

Google tiết lộ các công cụ để xây dựng tác nhân AI nhằm tự động hóa tác vụ, theo dõi tiến độ và quản lý quy trình làm việc thông qua hộp thư đến riêng cho tác nhân, kèm các cập nhật từ Workspace và tầm nhìn về các tác nhân AI đang thay đổi thói quen làm việc hằng ngày của nhân viên. Trừu tượng: Google đã công bố các công cụ để tạo tác nhân AI cho tự động hóa tác vụ, theo dõi tiến độ của chúng và tối ưu hóa quy trình làm việc, báo hiệu các cập nhật từ Workspace và một tương lai nơi các tác nhân AI biến đổi công việc hằng ngày.

GateNews14giờ trước
Bình luận
0/400
Không có bình luận