Resultados da pesquisa por "MOE"
2026-04-16
02:27

A Meituan lançou um modelo de prova de teoremas com 560 bilhões de parâmetros de código aberto, atingindo uma taxa de sucesso de 97,1% em 72 inferências, superando o estado da arte de código aberto.

A equipa LongCat da Meituan abriu o código do LongCat-Flash-Prover a 21 de março, um modelo MoE com 560 biliões de parâmetros, focado em prova de teoremas de formalização Lean4. O modelo divide-se em três capacidades: formalização automática, geração de esboços e geração de provas completas, combinando ferramentas de raciocínio com o compilador Lean4 para implementar verificação em tempo real. O treino utiliza o Hybrid-Experts Iteration Framework e o algoritmo HisPO para prevenir fraude de recompensas. Os testes de referência mostram que este modelo estabeleceu novos recordes em modelos de pesos de código aberto em formalização automática e prova de teoremas.
Mais
08:53

Rakuten lança modelo Rakuten AI 3.0, ficheiros de configuração revelam arquitetura subjacente como DeepSeek V3

O grupo Rakuten lançou em 17 de março um modelo de IA de alto desempenho chamado Rakuten AI 3.0, com 671 bilhões de parâmetros, otimizado para o língua japonesa, afirmando superar o GPT-4o em várias provas de referência. O modelo é disponibilizado gratuitamente como código aberto sob a licença Apache 2.0, baseado no ajuste do modelo DeepSeek V3, e contou com o suporte de capacidade computacional de treinamento do governo japonês.
Mais
06:55

Mistral AI lança Leanstral: primeiro Agent de código aberto Lean 4, pode gerar automaticamente provas formalizadas

A Mistral AI lançou Leanstral, um agente de código de código aberto especificamente concebido para verificação formal em Lean 4, capaz de gerar código e provas que podem ser automaticamente validadas. O modelo utiliza uma arquitetura MoE esparsa, com desempenho superior ao de outros modelos de topo, e oferece descarregamento gratuito e chamadas de API.
Mais
02:57

Zhipu AI lançou o modelo GLM-5-Turbo, com velocidade aumentada 2-3 vezes e preço da API aumentado 20%

A Zhipu AI lançou o modelo GLM-5-Turbo a 16 de março, como versão otimizada de alta velocidade do GLM-5, personalizada especificamente para cenários de agente OpenClaw. O modelo oferece uma melhoria de velocidade de 2 a 3 vezes, suporta contexto de 200K e saída máxima de 128K, com otimizações na estabilidade de chamadas de ferramentas e outros aspetos. Nos testes de avaliação, apresentou desempenho significativamente superior ao GLM-5, com aumentos simultâneos nos preços da API e lançamento de planos de subscrição para utilizadores individuais.
Mais
01:27

A Nvidia lança o modelo de inteligência artificial de código aberto Nemotron 3 Super de 120B, com aumento de throughput até 5 vezes

A Nvidia lançou a 12 de março o modelo de linguagem de código aberto Nemotron 3 Super, projetado para aplicações multi-agente, com um total de 120 mil milhões de parâmetros, desempenho de inferência significativamente melhorado e suporte a janelas de contexto de até 1 milhão de tokens. Este modelo obteve uma pontuação de 85,6% na avaliação de referência PinchBench, a mais alta na sua categoria, e já está disponível em várias plataformas, suportando múltiplos serviços de nuvem para implantação.
Mais
03:44

O Genius Group processou os executivos da LZGI em 450 milhões de dólares.

Bot de notícias Gate.io, segundo relatos de Wu, a empresa listada na NYSE Genius Group processou os dois executivos da LZGI International, Inc, Peter Ritz e Michael Moe, no Tribunal Distrital do Sul da Flórida. A ação é baseada na Lei Americana de Combate à Fraude e Organizações Corruptas (RICO), com um pedido de indenização de 450 milhões de dólares. Anteriormente, o tribunal de primeira instância de Nova Iorque emitiu uma ordem de restrição contra o Genius Group, proibindo-o de arrecadar fundos através da venda de ações para comprar bitcoins.
Mais
BTC3,35%