Gate 新聞訊息,4 月 22 日 — Google Research 發布 ReasoningBank:一種代理記憶框架,可讓由大型語言模型驅動的代理在部署後持續學習。該框架從成功與失敗的任務經驗中提取通用推理策略,並將其存入記憶庫,以便在未來相似任務中進行檢索與執行。相關論文已發表於 ICLR,程式碼也已在 GitHub 上開源。
ReasoningBank 優於兩種既有方法:Synapse 會記錄完整的動作軌跡,但由於粒度較細,因而可遷移性有限;Agent Workflow Memory 只會從成功案例中學習。ReasoningBank 做出兩項關鍵改變:改為存放「推理模式」,而非「動作序列」——每個記憶都包含用於標題、描述與內容的結構化欄位;並將失敗軌跡納入學習。該框架使用模型對執行軌跡進行自我評估,將失敗經驗轉化為防陷阱規則。例如,規則「看到就點擊『載入更多』按鈕」會演變為「先驗證目前頁面識別符,避免無限捲動迴圈,然後再點擊載入更多」。
該論文也提出了具備記憶感知的測試階段縮放 (MaTTS),它會在推論期間配置額外算力,以探索多條軌跡並將發現存入記憶庫。並行擴展會為同一任務生成多條不同的軌跡,透過自我比較來強化更穩健的策略;序列擴展則以迭代方式精煉單一軌跡,並將中間推理存入記憶。
在使用 Gemini 2.5 Flash 作為 ReAct 代理的 WebArena 瀏覽任務與 SWE-Bench-Verified 編碼任務中,ReasoningBank 相較於不使用記憶的基準,WebArena 的成功率提升 8.3%,SWE-Bench-Verified 的成功率提升 4.6%,且每個任務的平均步數降低約 3。將 MaTTS 搭配並行擴展 (k=5) 進一步使 WebArena 的成功率提升 3 個百分點,並使步數再降低 0.4。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
360 AI 漏洞發現代理發現近 1,000 個零日漏洞,與 Mythos 展開競爭
360 Digital Security 以 AI 驅動的代理聲稱已發現約 1,000 個新的漏洞,其中包括 Office 與 OpenClaw;AI 如今已成為發現與利用鏈準備的核心,與 Mythos 不相上下。
摘要:一份被《彭博社》引述的報告指出,360 Digital Security Group 的 AI 驅動漏洞發現代理在近幾個月內已辨識出近 1,000 個先前未知的漏洞,其中包括在 Microsoft Office 與 OpenClaw 框架中。該公司表示,AI 已成為漏洞發現的核心引擎,並宣布了一款 AI 工具以加速利用鏈的構建。Benincasa 依據 Natto Thoughts 對該公司中文公告的審閱,將 360 描述為 Anthropic 的 Mythos 競爭者。
GateNews6小時前
Aethir Claw V1 推出:五分鐘內不寫程式部署 AI 代理
Gate 新聞訊息,4 月 22 日— Aethir,一家去中心化 GPU 雲端基礎設施提供商,今天推出其 AI 代理託管平台 Aethir Claw 的 1.0 版本。該平台讓沒有技術背景的用戶能夠在瀏覽器內於五分鐘內部署並配置 AI 代理
GateNews8小時前
Google 推出 AI 代理工具,協助企業自動化任務
Google 揭示用於打造 AI 代理(agents)的工具,能夠自動化任務、追蹤進度並透過專用代理(agent)收件匣管理工作流程;並透過 Workspace 更新,以及一個 AI 代理將重塑日常員工工作流程的願景。
摘要:Google 公布用於建立 AI 代理(agents)來進行任務自動化、監控其進度並簡化工作流程的工具,預示 Workspace 將更新,並描繪一個 AI 代理改變日常工作的未來。
GateNews9小時前
微軟推出 AI 代理商務基礎設施:出版商市場、商家協議與廣告工具
Gate News 訊息,4 月 22 日——微軟的 AI 變現副總裁 Tim Frank 宣布一系列面向「agentic web」時代的商業基礎設施更新,使出版商、商家和廣告商能在 AI 代理代表使用者做出購買決策時,持續保持可被發現且可被交易。
GateNews11小時前
NeoCognition 以 $40M 種子資金募集推動在職學習的 AI 代理
Gate News 訊息,4 月 22 日—AI 研究實驗室 NeoCognition 宣布完成一輪 $40 百萬種子輪融資,並從保密模式中浮出水面。該公司由俄亥俄州立大學副教授 Yu Su,以及 Xiang Deng 和 Yu Gu 共同創立,總部位於加州帕洛阿爾托。該輪融資
GateNews12小時前
PicWe 推出具備裝置端金鑰管理的 AI 代理錢包
PicWe 宣布推出 PicWe Wallet 的公開測試版,這是一款由 AI 代理驅動、可在裝置端運作的金鑰錢包,且不使用復原助記詞。它支援多鏈資產、代幣交換(swap)、AI 可存取的自動化,並旨在整合 RWA 基礎設施。
PicWe 已推出 PicWe Wallet 的公開測試版;這是一款由 AI 代理(AI Agent)賦能的錢包,會將金鑰儲存在裝置端,取消復原助記詞,並讓關鍵操作保持在本地進行。該測試版支援多鏈資產管理、代幣交換(swaps),以及以穩定幣為基礎的費用支付,同時透過可程式化的 AI 互動來實現更靈活的鏈上操作。更廣泛的 PicWe 方案將該平台定位為真實世界資產(RWA)的統一基礎設施,使發行、流通、結算、跨境付款、代幣化,以及針對企業用例的供應鏈協調得以涵蓋在內。
GateNews12小時前