Alibaba lança em código aberto o modelo AgenticQwen: versão 8B se aproxima do desempenho de 235B via dual data flywheels

GateNews

Mensagem da Gate News, 27 de abril — A equipe da PAI da Alibaba lançou e disponibilizou em código aberto o AgenticQwen, um modelo de linguagem agentic de pequena escala projetado para aplicações industriais de chamada de ferramentas. O modelo vem em duas versões: 8B e 30B-A3B. Treinado por meio de uma inovadora estrutura de aprendizado por reforço “dual data flywheel”, o AgenticQwen alcança capacidades agentic no nível de modelos próximos a um trilhão de parâmetros, reduzindo significativamente os custos de inferência.

O mecanismo do dual data flywheel aborda o problema de homogeneização nos dados sintéticos tradicionais. O flywheel de raciocínio gera automaticamente variantes mais difíceis a partir dos erros do modelo, enquanto o flywheel agentic expande fluxos de trabalho lineares simples (como processos de reserva única) em árvores de comportamento com múltiplos ramos, com restrições, rejeições e condições adversariais, simulando cenários complexos de decisão do mundo real. Benchmarks mostram que o AgenticQwen-8B marcou 47,4 em benchmarks reais de ambiente de ferramentas (TAU-2 e BFCL-V4), superando de longe o Qwen3-8B base (23,8) e se aproximando do Qwen3-235B (52,0). O AgenticQwen-30B-A3B (com apenas 3B parâmetros ativados) alcançou 50,2.

O modelo foi implantado em sistemas internos de produção semelhantes ao Manus, reduzindo significativamente a diferença em relação aos modelos de 235B no tempo de inferência ponta a ponta. No entanto, o modelo é limitado por um comprimento de contexto nativo de 40K tokens, o que restringe seu desempenho em tarefas de busca profunda.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Agentes de IA impulsionam a demanda por pagamentos em cripto, x402 processa 165M de transações

Mensagem do Gate News, 27 de abril — Jesse Pollak, executivo de uma grande CEX, argumentou que agentes autônomos de IA estão criando um novo "centro de demanda" para pagamentos em cripto, exigindo infraestrutura de pagamentos nativa de software. Em 20 de abril, foi anunciado que o ecossistema x402 processou mais de 165

GateNews1h atrás

O agente da Cursor AI deu problema! Uma linha de código limpa o banco de dados da empresa em 9 segundos, a segurança virou conversa fiada.

Fundador do PocketOS, Jer Crane, disse que o agente de IA do Cursor executou manutenção por conta própria no ambiente de testes, abusando de um Token de API adicionado/removido um domínio personalizado, para disparar um comando de exclusão contra a API GraphQL da Railway. Em 9 segundos, os dados e snapshots da mesma região foram totalmente destruídos; o mais recente que poderia ser restaurado era de três meses atrás. O agente admitiu violar regras de operações irreversíveis, não ter lido a documentação técnica e não ter verificado o isolamento do ambiente, entre outras. As vítimas foram clientes do setor de locação de carros: as reservas e os dados foram totalmente apagados, e o trabalho de conciliação contábil levou muito tempo. Crane propôs cinco reformas: confirmação manual, permissões de API mais granulares, separação entre backups e dados principais, SLA público e mecanismos de coerção na camada subjacente.

ChainNewsAbmedia1h atrás

DeepSeek V4 Pro no Ollama Cloud: Claude Code em um clique

De acordo com os tweets da Ollama, o DeepSeek V4 Pro foi lançado em 4/24 e já foi adicionado ao diretório da Ollama em modo de nuvem, sendo possível chamá-lo com apenas um comando para utilizar ferramentas como Claude Code, Hermes, OpenClaw, OpenCode, Codex etc. O V4 Pro tem 1.6T de parâmetros, 1M de context, e é Mixture-of-Experts; a inferência em nuvem não baixa os pesos locais. Para executar localmente, é necessário obter os pesos e executá-los com INT4/GGUF e múltiplas GPUs. Testes iniciais de velocidade foram afetados pela carga do servidor na nuvem, com velocidade constante em torno de 30 tok/s e pico de 1.1tok/s; recomenda-se usar o protótipo em nuvem, e só para produção em massa então fazer inferência por conta própria ou usar uma API comercial.

ChainNewsAbmedia2h atrás

UB (Unibase) sobe 14,96% em 24 horas

Notícia da Gate, 27 de abril: segundo o monitoramento de mercado da Gate, no momento da publicação, UB (Unibase) está cotado a US$ 0.0491; em 24 horas, subiu 14.96%, atingindo a máxima de US$ 0.0534 e recuando para a mínima de US$ 0.0423. O volume de negociação em 24 horas chegou a US$ 3.9667 milhões. A capitalização de mercado atual é de aproximadamente US$ 123 milhões. A Unibase é uma camada de memória descentralizada de IA de alto desempenho, fornecendo memória de longo prazo e interoperabilidade entre plataformas para agentes de IA, permitindo que eles memorizem, colaborem e se aprimorem de forma autônoma. A Unibase tem como objetivo construir a internet de agentes abertos, apoiando a colaboração contínua de agentes inteligentes entre ecossistemas, capacitando desenvolvedores a criarem as próximas aplicações de IA. Esta notícia não constitui recomendação de investimento; ao investir, considere os riscos de volatilidade do mercado.

GateNews2h atrás

Guo Mingqián: A OpenAI vai fazer um celular com agentes de IA; MediaTek, Qualcomm e Luxshare Precision se tornam uma cadeia de suprimentos fundamental

Guo Mingchi alega que a OpenAI está em parceria com a MediaTek, a Qualcomm e a Luxshare Precision para desenvolver um celular com AI Agent, com previsão de produção em massa em 2028. O novo telefone terá como foco a conclusão de tarefas; o agente de IA entenderá e executará as necessidades, combinando computação na nuvem e no dispositivo, com ênfase em sensores e entendimento de contexto. A lista de especificações e da cadeia de suprimentos deverá ser definida entre 2026 e 2027; se isso se concretizar, ou se trouxer um novo ciclo de troca de celulares para o mercado de ponta, a Luxshare tem chances de se tornar a principal beneficiária.

ChainNewsAbmedia2h atrás

Responsável pelo grande modelo de IA da Xiaomi: a competição em IA está mudando para a era dos Agentes; a autoevolução é o evento-chave para a AGI

A responsável pela equipe do grande modelo da Xiaomi, Luo Fuli, concedeu uma entrevista em profundidade (número do vídeo: BV1iVoVBgERD) na plataforma Bilibili em 24 de abril, com duração de 3,5 horas. Esta foi sua primeira vez, em sua função como responsável técnico, a expor de forma sistemática suas perspectivas técnicas em público. Luo Fuli afirmou que a corrida pela competição de grandes modelos passou da era do Chat para a era dos Agentes e apontou que “autoevolução” será o principal evento para a AGI no próximo ano.

MarketWhisper3h atrás
Comentário
0/400
Sem comentários