Mensagem da Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória de agente que permite que agentes baseados em modelos de linguagem aprendam continuamente após a implantação. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas quanto de tarefas fracassadas, armazenando-as em um banco de memória para recuperação e execução em tarefas futuras similares. O artigo associado foi publicado no ICLR, e o código foi disponibilizado como open source no GitHub.
O ReasoningBank melhora em relação a duas abordagens existentes: Synapse, que registra trajetórias completas de ação, mas tem transferibilidade limitada devido à granularidade fina, e Agent Workflow Memory, que só aprende com casos bem-sucedidos. O ReasoningBank faz duas mudanças importantes: armazenar “padrões de raciocínio” em vez de “sequências de ação”, com cada memória contendo campos estruturados para título, descrição e conteúdo; e incorporar trajetórias de falha ao aprendizado. O framework usa um modelo para se autoavaliar trajetórias de execução, transformando experiências de falha em regras anti-armadilhas. Por exemplo, a regra “clicar no botão Carregar Mais quando for visto” evolui para “verificar primeiro o identificador da página atual, evitar loops infinitos de rolagem e depois clicar em carregar mais.”
O artigo também introduz Memory-aware Test-time Scaling (MaTTS), que aloca computação adicional durante a inferência para explorar múltiplas trajetórias e armazenar os achados no banco de memória. A expansão em paralelo executa múltiplas trajetórias distintas para a mesma tarefa, refinando estratégias mais robustas por meio de auto comparação; a expansão sequencial refina iterativamente uma única trajetória, armazenando o raciocínio intermediário na memória.
Em tarefas de navegador do WebArena e tarefas de codificação SWE-Bench-Verified usando Gemini 2.5 Flash como agente ReAct, o ReasoningBank alcançou 8,3% a mais na taxa de sucesso no WebArena e 4,6% a mais no SWE-Bench-Verified em comparação com uma linha de base sem memória, reduzindo em aproximadamente 3 o número médio de etapas por tarefa. Adicionar MaTTS com expansão em paralelo (k=5) melhorou ainda mais a taxa de sucesso no WebArena em 3 pontos percentuais e reduziu as etapas em mais 0,4.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Agente de Descoberta de Vulnerabilidades por IA da 360 Encontra Quase 1.000 Exploits de Zero-Day, Competindo com a Mythos
O agente orientado por IA da 360 Digital Security afirma ter encontrado cerca de 1.000 novas vulnerabilidades, incluindo no Office e no OpenClaw; a IA agora é central para a descoberta e a preparação de cadeias de exploração, rivalizando com a Mythos.
Resumo: Um relatório citado pela Bloomberg observa que o Agente de Descoberta de Vulnerabilidades orientado por IA do 360 Digital Security Group identificou quase 1.000 vulnerabilidades previamente desconhecidas nos últimos meses, incluindo no Microsoft Office e no framework OpenClaw. A empresa afirma que a IA se tornou a base central da descoberta de vulnerabilidades e anunciou uma ferramenta de IA para acelerar a construção de cadeias de exploração. Benincasa descreve a 360 como uma concorrente da Mythos, da Anthropic, com base na análise de Natto Thoughts das comunicações da empresa em idioma chinês.
GateNews6h atrás
Aethir Claw V1 é lançado: Implante agentes de IA sem código em menos de cinco minutos
Mensagem do Gate News, 22 de abril — Aethir, uma provedora de infraestrutura de nuvem de GPU descentralizada, lançou hoje a versão 1.0 do Aethir Claw, sua plataforma de hospedagem de agentes de IA. A plataforma permite que usuários sem formação técnica implantem e configurem agentes de IA inteiramente dentro do navegador em menos de cinco
GateNews8h atrás
Google Lança Ferramentas de Agentes de IA para Ajudar Empresas a Automatizar Tarefas
O Google revela ferramentas para criar agentes de IA que automatizam tarefas, acompanham o progresso e gerenciam fluxos de trabalho por meio de caixas de entrada dedicadas a agentes, com atualizações do Workspace e uma visão de que agentes de IA vão transformar as rotinas diárias dos funcionários.
Resumo: O Google revelou ferramentas para criar agentes de IA para automação de tarefas, monitorar seu progresso e agilizar fluxos de trabalho, sinalizando atualizações do Workspace e um futuro em que agentes de IA transformam o trabalho diário.
GateNews9h atrás
Microsoft Revela Infraestrutura de Comércio com Agentes de IA: Marketplace para Publishers, Protocolos para Comerciantes e Ferramentas de Anúncio
Mensagem do Gate News, 22 de abril — o vice-presidente de monetização de IA da Microsoft, Tim Frank, anunciou uma série de atualizações de infraestrutura comercial voltadas para a era do "agentic web", permitindo que publishers, comerciantes e anunciantes permaneçam descobríveis e negociáveis à medida que agentes de IA tomam decisões de compra
GateNews11h atrás
NeoCognition arrecada $40M na captação seed para agentes de IA com aprendizado no trabalho
Mensagem do Gate News, 22 de abril — O laboratório de pesquisa em IA NeoCognition anunciou a conclusão de uma rodada seed de $40 milhões, saindo do modo stealth. Fundada pelo professor associado da Ohio State University, Yu Su, junto com Xiang Deng e Yu Gu, a empresa tem sede em Palo Alto, Califórnia. A rodada w
GateNews12h atrás
PicWe Lança Carteira com Agente de IA com Gerenciamento de Chaves no Dispositivo
PicWe anuncia o beta público do PicWe Wallet, uma carteira de chaves no dispositivo habilitada por agentes de IA, sem frases de recuperação. Ela oferece suporte a ativos multi-chain, swaps, automação acessível por IA e tem como objetivo unificar a infraestrutura de RWA.
A PicWe lançou o beta público do PicWe Wallet, uma carteira com habilitação de Agente de IA que armazena as chaves no dispositivo, elimina frases de recuperação e mantém operações críticas localmente. O beta oferece suporte ao gerenciamento de ativos multi-chain, swaps e ao pagamento de taxas em stablecoins, ao mesmo tempo em que habilita interações programáveis com IA. As iniciativas mais amplas da PicWe posicionam a plataforma como infraestrutura unificada para ativos do mundo real, possibilitando emissão, circulação, liquidação, pagamentos transfronteiriços, tokenização e coordenação da cadeia de suprimentos para casos de uso empresariais.
GateNews12h atrás