Kimi K2.6 lidera o benchmark de programação do OpenRouter e supera Claude e a série GPT

Mensagem do Gate News, 22 de abril — A Kimi.ai anunciou que seu modelo mais recente, Kimi K2.6, ficou em primeiro lugar no ranking de capacidade de programação do OpenRouter, tornando-se o modelo líder em avaliações voltadas a desenvolvedores.

Os dados do benchmark mostram que o Kimi K2.6 entrega desempenho abrangente superior em tarefas de programação em comparação com modelos convencionais, incluindo Claude, séries GPT e outros modelos de código aberto, refletindo melhorias significativas na geração de código e no tratamento de tarefas de desenvolvimento. Essa conquista marca um marco importante para modelos de IA domésticos em cenários reais de desenvolvimento, reduzindo ainda mais a diferença para modelos internacionalmente líderes.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Modelos de segurança no nível de armamento da Anthropic Mythos sofreram acesso não autorizado: como eles conseguiram fazer isso?

A Bloomberg relata que um grupo privado de fóruns acessou o Mythos sem autorização por meio de uma autorização legal concedida a um terceiro contratante pela Anthropic. O Mythos é uma IA defensiva para empresas, disponível apenas para grandes organizações com verificação rigorosa. O grupo aproveitou o conhecimento sobre a URL do modelo para inferir a localização do sistema e entrou, além de fornecer capturas de tela como demonstração, afirmando que ainda está em uso, mas sem intenção maliciosa. A Anthropic está investigando, e inicialmente considerou como abuso de permissões, e não como uma invasão externa. O caso mostra o risco de entregar modelos altamente sensíveis ao controle de terceiros, sendo necessário aumentar a resiliência da governança e os mecanismos de confiança.

ChainNewsAbmedia9m atrás

Alerta de CISO da Mist Fog: ShinyHunters afirma ter invadido os sistemas internos da Anthropic

De acordo com o alerta publicado em 23 de abril no X pelo CSO da SlowMist, 23pds, a organização de hackers ShinyHunters alega ter comprometido sistemas internos relacionados ao modelo Anthropic Mythos e compartilhou publicamente evidências na forma de capturas de tela, incluindo o painel de gerenciamento de usuários, o painel de experimentos de IA e análises de desempenho e custos do modelo, mas a Anthropic oficial ainda não emitiu uma declaração.

MarketWhisper11m atrás

Chrome se torna “Colega de IA”: automação de tarefas de navegação com Auto Browse, assinatura mensal do plano empresarial de US$ 6

A Chrome Enterprise lançou o Auto Browse com base no Gemini e o Chrome Skills, permitindo que o navegador execute tarefas em várias etapas automaticamente, mas exigindo que o usuário confirme com cliques; é possível salvar/compartilhar fluxos de trabalho de IA e integrá-los ao Gmail, ao Calendário e ao Drive, com controle DLP incluso, custando US$ 6 por mês, com posicionamento de transformar o navegador em um colega de IA.

ChainNewsAbmedia45m atrás

Agentes do ChatGPT Workspace da OpenAI: movidos por Codex, compartilhamento em equipe, integração com o Slack

A OpenAI lançou o Workspace Agents no ChatGPT Business/Enterprise/Edu/Teachers em 22 de abril, impulsionados pelo Codex, com execução em nuvem por longos períodos, compartilhamento em equipe e capacidade de funcionar offline. Eles conseguem responder proativamente no Slack e criar faturas, executar fluxos de trabalho com várias etapas e também oferecer suporte a agendamento. A prévia de pesquisa é gratuita até 6 de maio; depois, será cobrada com base em créditos, com preços a serem divulgados. Eles competem lado a lado com o GoogleGeminiEnterpriseAgentPlatform e o AnthropicClaudeCowork, com as três empresas focando em agentes de nível empresarial, mas com posicionamentos diferentes.

ChainNewsAbmedia47m atrás

Google Cloud Next 2026: lança a plataforma de agentes corporativos Gemini, US$ 750 milhões para ajudar consultorias a colocar soluções em prática

O Google Cloud anunciou na Cloud Next 2026 a plataforma Gemini Enterprise Agent, integrando seleção de modelos, construção de agentes, DevOps, orquestração e controle de segurança corporativa, e lançou um fundo de 750 milhões de dólares para ajudar a McKinsey, Accenture e Deloitte a implantar agentes empresariais. A plataforma, junto com o Ironwood TPU, A2A e MCP, cria um ecossistema completo de ponta a ponta e um canal de consultoria próprio, para enfrentar o OpenAI Operator e o Anthropic Claude na versão empresarial.

ChainNewsAbmedia49m atrás

O Google Expande a Wiz Cloud Security em AWS, Azure e Google Cloud

O Google anunciou novos recursos de segurança e uma integração mais profunda da Wiz, a empresa israelense de segurança na nuvem que adquiriu por US$32 billion, em todo o Google Cloud e em plataformas concorrentes durante o evento Cloud Next '26. A empresa apresentou três agentes de IA para operações de segurança em modo de prévia, projetados para

CryptoFrontier58m atrás
Comentário
0/400
Sem comentários