Berita Gate, 22 April — Google Research merilis ReasoningBank, sebuah kerangka memori agen yang memungkinkan agen yang digerakkan oleh model bahasa besar untuk terus belajar setelah penerapan. Kerangka ini mengekstrak strategi penalaran universal dari pengalaman tugas yang berhasil maupun yang gagal, menyimpannya dalam bank memori untuk diambil dan dieksekusi pada tugas-tugas serupa di masa depan. Makalah terkait dipublikasikan di ICLR, dan kodenya telah dirilis sumber terbukanya di GitHub.

ReasoningBank ditingkatkan dibandingkan dua pendekatan yang sudah ada: Synapse, yang merekam lintasan aksi lengkap tetapi memiliki keterpindahan yang terbatas karena granularitas yang terlalu terperinci, dan Agent Workflow Memory, yang hanya belajar dari kasus yang berhasil. ReasoningBank membuat dua perubahan kunci: menyimpan “pola penalaran” alih-alih “urutan aksi,” dengan setiap memori berisi bidang terstruktur untuk judul, deskripsi, dan konten; serta memasukkan lintasan kegagalan ke dalam pembelajaran. Kerangka ini menggunakan sebuah model untuk menilai sendiri lintasan eksekusi, mengubah pengalaman kegagalan menjadi aturan anti-jebakan. Misalnya, aturan “klik tombol Muat Lebih saat terlihat” berevolusi menjadi “verifikasi terlebih dahulu pengidentifikasi halaman saat ini, hindari loop gulir tak berujung, lalu klik muat lebih.”

Makalah ini juga memperkenalkan Memory-aware Test-time Scaling (MaTTS), yang mengalokasikan komputasi tambahan selama inferensi untuk mengeksplorasi beberapa lintasan dan menyimpan temuan di bank memori. Ekspansi paralel menjalankan beberapa lintasan berbeda untuk tugas yang sama, menyempurnakan strategi yang lebih andal melalui perbandingan diri; ekspansi berurutan menyempurnakan satu lintasan secara iteratif, menyimpan penalaran antara di memori.

Pada tugas browser WebArena dan tugas pengkodean SWE-Bench-Verified menggunakan Gemini 2.5 Flash sebagai agen ReAct, ReasoningBank mencapai tingkat keberhasilan 8,3% lebih tinggi di WebArena dan 4,6% lebih tinggi di SWE-Bench-Verified dibandingkan baseline tanpa memori, dengan mengurangi rata-rata langkah per tugas sekitar 3. Menambahkan MaTTS dengan ekspansi paralel (k=5) selanjutnya meningkatkan tingkat keberhasilan WebArena sebesar 3 poin persentase dan mengurangi langkah sebesar tambahan 0,4.

Lihat Sumber

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Agen Penemuan Kerentanan Berbasis AI 360 Menemukan Hampir 1.000 Eksploitasi Zero-Day, Bersaing dengan Mythos

Agen AI Berita Industri AI

Agen AI yang digerakkan oleh 360 Digital Security mengklaim telah menemukan sekitar 1.000 kerentanan baru, termasuk di Office dan OpenClaw; kini AI menjadi inti untuk penemuan dan persiapan rantai eksploit, menyaingi Mythos. Abstrak: Sebuah laporan yang dikutip Bloomberg mencatat bahwa 360 Digital Security Group’s AI-driven Vulnerability Discovery Agent telah mengidentifikasi hampir 1.000 kerentanan yang sebelumnya tidak dikenal dalam beberapa bulan terakhir, termasuk pada Microsoft Office dan framework OpenClaw. Perusahaan tersebut mengatakan bahwa AI telah menjadi mesin utama untuk penemuan kerentanan dan telah mengumumkan sebuah alat AI untuk mempercepat konstruksi rantai eksploit. Benincasa menggambarkan 360 sebagai pesaing Mythos milik Anthropic, berdasarkan tinjauan Natto Thoughts atas pengumuman berbahasa Mandarin perusahaan tersebut.

GateNews11jam yang lalu

Peluncuran Aethir Claw V1: Terapkan Agen AI Tanpa Kode dalam Kurang dari Lima Menit

Perkembangan Proyek Agen AI AI Tools & Aplikasi

Pesan Gate News, 22 April — Aethir, penyedia infrastruktur cloud GPU terdesentralisasi, meluncurkan versi 1.0 dari Aethir Claw, platform hosting agen AI-nya, hari ini. Platform ini memungkinkan pengguna tanpa latar belakang teknis untuk menerapkan dan mengonfigurasi agen AI sepenuhnya di dalam browser mereka dalam waktu kurang dari lima

GateNews12jam yang lalu

Google Meluncurkan Alat Agen AI untuk Membantu Perusahaan Mengautomasi Tugas

Agen AI Berita Industri AI

Google mengungkapkan alat untuk membangun agen AI guna mengautomasi tugas, melacak kemajuan, dan mengelola alur kerja melalui kotak masuk agen khusus, dengan pembaruan Workspace dan visi bahwa agen AI akan mengubah rutinitas kerja sehari-hari karyawan. Abstrak: Google meluncurkan alat untuk membuat agen AI bagi otomasi tugas, memantau perkembangannya, dan menyederhanakan alur kerja, menandai pembaruan Workspace dan masa depan di mana agen AI mengubah pekerjaan harian.

GateNews13jam yang lalu

Microsoft Meluncurkan Infrastruktur Komersial Agen AI: Marketplace Penerbit, Protokol Pedagang, dan Alat Iklan

Agen AI Berita Industri AI

Gate News message, April 22 — wakil presiden monetisasi AI Microsoft, Tim Frank, mengumumkan rangkaian pembaruan infrastruktur komersial yang ditujukan untuk era "agentic web", yang memungkinkan penerbit, pedagang, dan pengiklan tetap dapat ditemukan dan dapat diperdagangkan saat agen AI membuat keputusan pembelian atas nama pengguna di

GateNews16jam yang lalu

NeoCognition Mengumpulkan $40M dalam Pendanaan Seed untuk Agen AI Pembelajaran On-the-Job

Agen AI Berita Industri AI

Pesan Gate News, 22 April — Lab riset AI NeoCognition mengumumkan penyelesaian putaran seed sebesar $40 juta, muncul dari mode penyamaran. Didirikan oleh Profesor Associate Universitas Negeri Ohio Yu Su, bersama dengan Xiang Deng dan Yu Gu, perusahaan ini berkantor pusat di Palo Alto, California. Putaran tersebut w

GateNews16jam yang lalu

PicWe Meluncurkan Dompet Agen AI dengan Manajemen Kunci di Perangkat

Perkembangan Proyek Agen AI AI Tools & Aplikasi

PicWe mengumumkan beta publik PicWe Wallet, dompet kunci berbasis agen AI yang berjalan di perangkat (on-device) dengan tanpa frasa pemulihan. Dompet ini mendukung aset multi-chain, pertukaran (swap), otomasi yang dapat diakses oleh AI, serta bertujuan untuk menyatukan infrastruktur RWA. PicWe telah meluncurkan beta publik PicWe Wallet, dompet berbasis Agen AI yang menyimpan kunci di perangkat, menghilangkan frasa pemulihan, dan menjaga operasi penting tetap lokal. Beta ini mendukung manajemen aset multi-chain, swap, dan pembayaran biaya berbasis stablecoin sambil memungkinkan interaksi AI yang dapat diprogram. Inisiatif PicWe yang lebih luas memposisikan platform sebagai infrastruktur terpadu untuk aset dunia nyata, memungkinkan penerbitan, peredaran, penyelesaian (settlement), pembayaran lintas batas, tokenisasi, dan koordinasi rantai pasok untuk kasus penggunaan perusahaan.

GateNews17jam yang lalu

Komentar

0/400

Tidak ada komentar