Mensagem do Gate News, 17 de abril — A Anthropic anunciou o Claude Opus 4.7, um modelo de IA que traz salvaguardas projetadas para bloquear solicitações de cibersegurança de alto risco. O lançamento se baseia no Claude Opus 4.6, lançado em fevereiro, e antecede uma distribuição mais ampla dos modelos da classe Mythos, mais avançados, da Anthropic. O Mythos Preview, apresentado no início deste mês, continua mais capaz do que o Opus 4.7, mas atualmente está disponível apenas para um conjunto limitado de empresas por meio do Project Glasswing, o programa de cibersegurança da Anthropic.
O Opus 4.7 entrega melhorias significativas em fluxos de trabalho agentic e em capacidades de visão. O desempenho de codificação autônoma subiu para 64,3% no SWE-bench Pro, um benchmark amplamente usado para tarefas de engenharia de software, a partir de 53,4% na versão anterior. O tratamento de imagens agora suporta mais de três vezes a resolução, com a precisão de acuidade visual melhorando de 54,5% para 98,5% em testes padrão. Limitações intencionais de cibersegurança foram implementadas durante o treinamento; no CyberGym, um benchmark de desempenho de cibersegurança, o Opus 4.7 registrou 73,1%, abaixo dos 83,1% do Mythos Preview.
A Anthropic restringiu o Mythos Preview após testes pré-lançamento que revelaram milhares de vulnerabilidades de alta severidade, incluindo uma falha no OpenBSD que não foi detectada por 27 anos. Pesquisadores de segurança que realizam pesquisa de vulnerabilidades, testes de penetração ou exercícios de red-team podem se inscrever no Cyber Verification Program da Anthropic para acesso defensivo sem recusas padrão. O feedback das salvaguardas do Opus 4.7 orientará os futuros lançamentos de modelos.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Adata, Jay Chou ganhou muito? A agência de gerenciamento do GD se reúne secretamente com a realeza de Dubai para discutir IPO, IA e robôs
A empresa sul-coreana de tecnologia de entretenimento Galaxy Corporation entrou recentemente no mercado do Oriente Médio, estabelecendo a entidade em Dubai “Galaxy ME” e se reunindo com membros da família real dos Emirados Árabes Unidos para explorar a integração de IA e conteúdo. A empresa já selecionou uma corretora para realizar seu IPO; no ano passado, sua receita foi de 300 bilhões de won sul-coreano, e ela atraiu investimentos de Jay Chou e da ADATA, entre outros. Esse plano tem como objetivo impulsionar o desenvolvimento do ecossistema de entretenimento no Oriente Médio, destacando a importância de sua estratégia de globalização.
ChainNewsAbmedia51m atrás
Equipe chinesa EvoMap acusa: agentes da Hermes viralizaram furiosamente por copiar conteúdo: no sistema de autoevolução existe uma semelhança muito alta
A equipe chinesa EvoMap acusa o Hermes Agent da Nous Research de copiar sua arquitetura Evolver/GEP, alegando que ambos têm alta semelhança em vários módulos-chave. A EvoMap afirma que o projeto do Hermes não cita nem agradece o conteúdo previamente publicado por ela; a controvérsia gerou ampla atenção da comunidade, parte dos internautas chineses apoiou a EvoMap e criticou as ações de plágio do Hermes. Embora a equipe de pesquisa da Nous ainda não tenha refutado as acusações ponto a ponto, o caso se espalhou rapidamente no discurso sobre IA.
ChainNewsAbmedia1h atrás
Apoiado por primeiros investidores da OpenAI! Novo empreendimento de interface cérebro-computador, a Sabi, promete enviar até o fim do ano um gorro com recurso “pensar e escrever”
A startup de Silicon Valley, Sabi, anunciou que está desenvolvendo uma interface cérebro-computador vestível que não exige cirurgia invasiva; os usuários só precisam “pensar” para inserir texto na tela, com previsão de lançamento no fim de 2026. O dispositivo contará com até 100.000 sensores microscópicos, o que ajudará a interpretar com precisão a atividade cerebral, e a Sabi também enfatiza a proteção da privacidade dos dados.
ChainNewsAbmedia1h atrás
Dados revelam que “Claude perdeu capacidade” não é apenas um boato, e que modelos de IA instáveis representam risco empresarial
O artigo discute o fenômeno de instabilidade do desempenho de LLMs (modelos de linguagem de grande porte) em aplicações de empresas de IA, chamando-o de “queda de inteligência”, e apresenta exemplos para explicar seus impactos reais nos fluxos de trabalho corporativos. Os dados mostram que a maioria dos modelos de maior destaque está em um estado de rebaixamento, afetando a produtividade e a estabilidade das empresas. As empresas precisam começar a dar prioridade à estabilidade dos modelos como um novo padrão; caso contrário, enfrentarão riscos de infraestrutura.
ChainNewsAbmedia1h atrás
OpenAI Atualiza Codex para um Agente de IA que Controla o Desktop, Automatizando Fluxos de Trabalho de Desenvolvimento
O Codex aprimorado da OpenAI evolui de um assistente de programação para um agente autônomo para ambientes de desktop, capaz de gerenciar aplicativos, automatizar fluxos de trabalho e se integrar a mais de 100 apps. Essa mudança aprimora a continuidade das tarefas e a automação do fluxo de trabalho, refletindo um cenário competitivo nas ferramentas de codificação com IA.
GateNews1h atrás
Google integra busca com IA ao Chrome, permitindo navegação web conversacional
O Google está aprimorando o Chrome com uma busca em IA, permitindo navegação conversacional e respostas com consciência de contexto. A nova funcionalidade também traz integração com várias guias, melhorando a experiência do usuário em diversas tarefas ao consolidar as guias abertas e fornecer informações personalizadas.
GateNews2h atrás