Internet Morto? Um Terço dos Novos Sites São Gerados por IA, Diz Stanford

Resumidamente

  • Até meados de 2025, 35% dos sites recém-publicados eram gerados por IA ou assistidos por IA, um aumento em relação a zero antes do lançamento do ChatGPT em novembro de 2022.
  • Os efeitos confirmados são contração semântica e positividade artificial — não desinformação ou homogeneidade estilística, apesar do que a maioria das pessoas acredita.
  • Com 35% de prevalência de IA, o risco de colapso do modelo passa de uma preocupação teórica para uma empírica para a próxima geração de modelos fundamentais.

Um novo estudo apresenta um número para quanto da internet agora é gerado por IA: 35%. Essa é a participação de sites recém-publicados classificados como gerados por IA ou assistidos por IA até meados de 2025, de acordo com pesquisa da Universidade de Stanford, Imperial College London e Internet Archive. A cifra era praticamente zero antes do lançamento do ChatGPT em novembro de 2022. “Eu acho a velocidade da tomada de controle da IA sobre a web bastante impressionante,” disse Jonáš Doležal, pesquisador do Imperial College London e coautor do artigo, ao 404 Media. “Após décadas de humanos moldando-a, uma parte significativa da internet se tornou definida por IA em apenas três anos.” O estudo, intitulado “O Impacto do Texto Gerado por IA na Internet,” baseou-se em 33 meses de snapshots de sites do Wayback Machine do Internet Archive e utilizou um detector de texto por IA chamado Pangram v3 para classificar cada página.

 Os danos confirmados: vibrações, não fatos Pesquisadores testaram seis hipóteses sobre o que o conteúdo de IA faz na web. Apenas duas resistiram à análise de dados. A primeira: Estamos nos tornando uma horda de NPCs burros agindo da mesma maneira… Ou, mais cientificamente, a web está se tornando menos semanticamente diversa.

Sites gerados por IA mostraram pontuações de similaridade semântica pareadas 33% mais altas do que sites escritos por humanos. As mesmas ideias continuam sendo expressas de quase as mesmas formas.

O artigo sugere que a janela de Overton online pode estar se estreitando, não por censura ou campanhas coordenadas, mas porque os modelos de linguagem otimizam para saídas próximas à sua distribuição de treinamento. A segunda: A web está ficando agressivamente otimista. O conteúdo de IA apresentou pontuações de sentimento positivo mais de 107% superiores ao conteúdo humano. Pesquisadores relacionam isso às tendências bem documentadas de bajulação dos LLMs—treinados com sinais de aprovação humana, eles produzem textos que parecem sanitizados, livres de atritos e persistentemente otimistas. Uma internet inundada de conteúdo alegre e homogeneizado pode marginalizar a dissidência humana em larga escala sem que ninguém precise puxar uma alavanca.

Apesar da crença pública generalizada, o estudo não encontrou evidências estatisticamente significativas de que o conteúdo de IA esteja tornando a internet menos factual. Os pesquisadores não encontraram correlação relevante entre prevalência de IA e taxa de erro factual.

A hipótese de monocultura estilística—IA achatando vozes individuais em um registro uniforme genérico—foi a crença mais forte entre os entrevistados (83% concordaram). Os dados não a confirmaram. Análises a nível de caractere não mostraram aumento estatisticamente significativo na homogeneidade estilística relacionada à prevalência de IA. O problema do colapso do modelo ficou real Os riscos mais amplos vão além da qualidade do discurso. Com 35% de prevalência de IA, o risco teórico de colapso do modelo—onde modelos futuros se degradam após treinamentos com dados gerados por IA—passa de uma preocupação acadêmica para uma realidade empírica. Modelos fundamentais futuros treinados com rastros atuais da web inevitavelmente ingerirão dados substancialmente gerados por IA e medidamente menos diversos semanticamente. A equipe está agora trabalhando com o Internet Archive para transformar o estudo em uma ferramenta de monitoramento contínuo e ao vivo, acompanhando a participação da IA na web em tempo real, em vez de uma única captura. Uma pesquisa nos EUA realizada junto ao estudo revelou que a maioria dos americanos já acredita em todas as seis hipóteses negativas, incluindo aquelas que os dados não apoiam. Pessoas que usam IA com pouca frequência tinham 12% mais chance de acreditar nos danos do que usuários frequentes. Crentes na Teoria da Internet Morta, conheçam os dados: A internet não está morta, mas 35% do que é novo provavelmente é conteúdo zumbi de alguma forma.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar