Kimi K2 Thinking estabeleceu novos recordes na avaliação de referência de raciocínio, codificação e capacidades de agentes

Dados do Jin10 de 8 de novembro: Segundo o site oficial do Moon’s Dark Side, o Kimi K2 Thinking estabeleceu novos recordes nas avaliações de referência de raciocínio, codificação e capacidades de agentes. O K2 Thinking alcançou uma pontuação SOTA de 44,9% na avaliação de referência HLE, atingiu 60,2% no teste BrowseComp e 71,3% no teste SWE-Bench Verified, demonstrando uma forte capacidade de generalização como um modelo de agente de pensamento de última geração.

Ver original
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários