Kimi K2 Thinking estabeleceu novos recordes na avaliação de referência de raciocínio, codificação e capacidades de agentes

Dados do Jin10 de 8 de novembro: Segundo o site oficial do Moon’s Dark Side, o Kimi K2 Thinking estabeleceu novos recordes nas avaliações de referência de raciocínio, codificação e capacidades de agentes. O K2 Thinking alcançou uma pontuação SOTA de 44,9% na avaliação de referência HLE, atingiu 60,2% no teste BrowseComp e 71,3% no teste SWE-Bench Verified, demonstrando uma forte capacidade de generalização como um modelo de agente de pensamento de última geração.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário