Tin cổng Gate News, ngày 22 tháng 4 — Google Research đã phát hành ReasoningBank, một khung bộ nhớ tác nhân cho phép các tác nhân điều khiển bởi mô hình ngôn ngữ lớn liên tục học hỏi sau khi triển khai. Khung này trích xuất các chiến lược suy luận phổ quát từ cả kinh nghiệm nhiệm vụ thành công và thất bại, lưu chúng vào một ngân hàng bộ nhớ để tra cứu và thực thi trên các nhiệm vụ tương tự trong tương lai. Bài báo liên quan được công bố tại ICLR, và mã nguồn đã được mở trên GitHub.
ReasoningBank cải tiến dựa trên hai cách tiếp cận hiện có: Synapse, ghi lại toàn bộ quỹ đạo hành động nhưng có khả năng chuyển giao hạn chế do mức độ chi tiết quá nhỏ, và Agent Workflow Memory, chỉ học từ các trường hợp thành công. ReasoningBank thực hiện hai thay đổi then chốt: lưu “các mẫu suy luận” thay vì “chuỗi hành động,” với mỗi bộ nhớ chứa các trường có cấu trúc cho tiêu đề, mô tả và nội dung; và đưa các quỹ đạo thất bại vào quá trình học. Khung sử dụng một mô hình để tự đánh giá các quỹ đạo thực thi, biến các trải nghiệm thất bại thành các quy tắc tránh bẫy. Ví dụ, quy tắc “nhấp vào nút Tải thêm khi thấy” phát triển thành “xác minh trước mã định danh của trang hiện tại, tránh các vòng lặp cuộn vô tận, rồi sau đó nhấp tải thêm.”
Bài báo cũng giới thiệu Memory-aware Test-time Scaling (MaTTS), phân bổ thêm năng lực tính toán trong quá trình suy luận để khám phá nhiều quỹ đạo và lưu kết quả vào ngân hàng bộ nhớ. Mở rộng song song chạy nhiều quỹ đạo riêng biệt cho cùng một nhiệm vụ, tinh chỉnh các chiến lược mạnh mẽ hơn thông qua so sánh tự thân; mở rộng tuần tự tinh chỉnh lặp một quỹ đạo duy nhất, lưu suy luận trung gian vào bộ nhớ.
Trong các tác vụ trình duyệt WebArena và các tác vụ mã hóa SWE-Bench-Verified sử dụng Gemini 2.5 Flash làm tác nhân ReAct, ReasoningBank đạt tỷ lệ thành công cao hơn 8,3% trên WebArena và cao hơn 4,6% trên SWE-Bench-Verified so với một chuẩn không có bộ nhớ, đồng thời giảm trung bình số bước trên mỗi tác vụ khoảng 3. Việc thêm MaTTS với mở rộng song song (k=5) tiếp tục cải thiện tỷ lệ thành công trên WebArena thêm 3 điểm phần trăm và giảm số bước thêm 0,4.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Tác nhân Khám phá Lỗ hổng AI của 360 Tìm thấy Gần 1.000 Khai thác Zero-Day, Cạnh tranh với Mythos
360 Digital Security 的 tác nhân AI được điều khiển bởi AI tuyên bố đã phát hiện khoảng 1.000 lỗ hổng mới, bao gồm trong Office và OpenClaw; AI giờ là cốt lõi của việc phát hiện và chuẩn bị chuỗi khai thác, sánh ngang Mythos.
Tóm tắt: Một báo cáo được Bloomberg trích dẫn ghi nhận rằng 360 Digital Security Group’s AI-driven Vulnerability Discovery Agent đã xác định gần 1.000 lỗ hổng phần mềm trước đây chưa được biết đến trong những tháng gần đây, bao gồm trong Microsoft Office và framework OpenClaw. Công ty cho biết AI đã trở thành động cơ cốt lõi của việc phát hiện lỗ hổng và đã công bố một công cụ AI để tăng tốc việc xây dựng chuỗi khai thác. Benincasa mô tả 360 là đối thủ cạnh tranh của Mythos của Anthropic, dựa trên phần đánh giá của Natto Thoughts về các thông báo ngôn ngữ Trung Quốc của công ty.
GateNews6giờ trước
Aethir Claw V1 ra mắt: Triển khai tác nhân AI mà không cần mã trong dưới năm phút
Bản tin Gate News, ngày 22 tháng 4 — Aethir, nhà cung cấp cơ sở hạ tầng điện toán đám mây GPU phi tập trung, hôm nay đã ra mắt phiên bản 1.0 của Aethir Claw, nền tảng lưu trữ tác nhân AI của mình. Nền tảng cho phép người dùng không có nền tảng kỹ thuật triển khai và cấu hình các tác nhân AI hoàn toàn trong trình duyệt của họ trong dưới năm
GateNews8giờ trước
Google ra mắt công cụ tác nhân AI để giúp doanh nghiệp tự động hóa tác vụ
Google tiết lộ các công cụ để xây dựng tác nhân AI nhằm tự động hóa tác vụ, theo dõi tiến độ và quản lý quy trình làm việc thông qua hộp thư đến riêng cho tác nhân, kèm các cập nhật từ Workspace và tầm nhìn về các tác nhân AI đang thay đổi thói quen làm việc hằng ngày của nhân viên.
Trừu tượng: Google đã công bố các công cụ để tạo tác nhân AI cho tự động hóa tác vụ, theo dõi tiến độ của chúng và tối ưu hóa quy trình làm việc, báo hiệu các cập nhật từ Workspace và một tương lai nơi các tác nhân AI biến đổi công việc hằng ngày.
GateNews9giờ trước
Microsoft Ra Mắt Hạ Tầng Thương Mại Cho Tác Nhân AI: Thị Trường Dành Cho Nhà Xuất Bản, Giao Thức Cho Thương Nhân và Công Cụ Quảng Cáo
Tin tức từ Gate, ngày 22 tháng 4 — Phó chủ tịch phụ trách thương mại hóa AI của Microsoft Tim Frank đã công bố một loạt cập nhật hạ tầng thương mại nhằm phục vụ kỷ nguyên “web tác nhân”, giúp các nhà xuất bản, thương nhân và nhà quảng cáo vẫn có thể được phát hiện và giao dịch khi các tác nhân AI đưa ra quyết định mua sắm thay mặt người dùng trên
GateNews11giờ trước
NeoCognition Huy động $40M vốn hạt giống cho các tác nhân AI học ngay khi làm việc
Tin tức từ Gate, ngày 22 tháng 4 — Phòng thí nghiệm nghiên cứu AI NeoCognition thông báo hoàn tất một vòng gọi vốn hạt giống $40 triệu, xuất phát chế độ ẩn. Được thành lập bởi Phó giáo sư Đại học Bang Ohio Yu Su, cùng với Xiang Deng và Yu Gu, công ty có trụ sở tại Palo Alto, California. Vòng gọi vốn này
GateNews12giờ trước
PicWe Ra Mắt Ví Tác Nhân AI với Quản Lý Khóa Trên Thiết Bị
PicWe thông báo ra mắt bản beta công khai của PicWe Wallet, một ví khóa cục bộ trên thiết bị được hỗ trợ bởi tác nhân AI, không có cụm khôi phục. Ví hỗ trợ tài sản đa chuỗi, giao dịch hoán đổi (swap), tự động hóa có thể truy cập bằng AI và nhằm thống nhất hạ tầng RWA.
PicWe đã ra mắt bản beta công khai của PicWe Wallet, một ví được bật tác nhân AI (AI Agent) lưu trữ khóa ngay trên thiết bị, loại bỏ cụm khôi phục và giữ các thao tác quan trọng ở cục bộ. Bản beta hỗ trợ quản lý tài sản đa chuỗi, giao dịch hoán đổi và phí dựa trên stablecoin, đồng thời cho phép các tương tác AI có thể lập trình. Các sáng kiến PicWe rộng hơn định vị nền tảng như một hạ tầng thống nhất cho tài sản thế giới thực, cho phép phát hành, lưu thông, thanh toán, thanh toán xuyên biên giới, token hóa và phối hợp chuỗi cung ứng cho các trường hợp sử dụng ở doanh nghiệp.
GateNews12giờ trước