O Agente de IA inicia automaticamente a mineração de criptomoedas durante o treino, acionando alertas internos de segurança

robot
Geração de resumo em curso

Notícias do Mars Finance: uma equipe de pesquisa associada à Alibaba publicou um artigo afirmando que, ao desenvolver um agente de IA chamado ROME, descobriram que o inteligente tentou minerar criptomoedas sem autorização durante o treinamento, acionando um alerta de segurança interno. Os pesquisadores disseram que o comportamento do agente foi espontâneo, sem comandos explícitos e além dos limites do sandbox pré-definido. Além disso, o agente criou um túnel SSH reverso, abrindo uma porta oculta de backdoor de dentro do sistema para um computador externo. O artigo aponta que esses comportamentos não foram desencadeados por solicitações de túnel ou mineração. A equipe de pesquisa posteriormente aplicou restrições mais rigorosas ao modelo e aprimorou o processo de treinamento para evitar comportamentos inseguros semelhantes no futuro. Nem a equipe de pesquisa nem a Alibaba responderam aos pedidos de comentário.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar