Análise simples do novo algoritmo de recomendação X: de "coletar dados" a "pontuar"

TechubNews

Escrita por: KarenZ, Foresight News

Maske mudou o sistema de recomendação do Twitter de «regras manuais e maior parte de algoritmos heurísticos» para «predições baseadas em grandes modelos de IA»?

Em 20 de janeiro, o Twitter (X) revelou oficialmente o novo algoritmo de recomendação, ou seja, a lógica por trás da linha do tempo «Para Ti» na página inicial do Twitter.

Simplificando, o algoritmo atual funciona assim: combina «conteúdo de pessoas que você segue» com «conteúdo que pode agradar a você em toda a internet», ordena tudo com base na sua atração, considerando suas ações anteriores no X, como curtidas, comentários, etc., passa por duas filtragens e, por fim, exibe o fluxo de recomendações que você vê.

A seguir, a lógica central explicada de forma simples:

Construção de perfil

O sistema primeiro coleta informações contextuais do usuário para criar um «perfil» para recomendações futuras:

Sequência de comportamento do usuário: registros de interações passadas (curtidas, compartilhamentos, tempo de permanência, etc.).

Características do usuário: lista de seguidores, preferências pessoais, etc.

De onde vêm os conteúdos?

Sempre que você atualiza a linha do tempo «Para Ti», o algoritmo busca conteúdo de dois lugares:

Círculo conhecido (Thunder): tweets de pessoas que você segue.

Círculo de estranhos (Phoenix): pessoas que você não segue, mas que a IA identifica como potencialmente interessantes para você, com base no seu gosto, mesmo que você não siga o autor.

Esses dois conjuntos de conteúdo se misturam, formando os candidatos a tweets.

Completação de dados e filtragem inicial

Depois de coletar milhares de posts, o sistema busca os metadados completos de cada um (informações do autor, arquivos de mídia, texto principal). Esse processo é chamado Hydration. Em seguida, realiza uma limpeza rápida, removendo conteúdo duplicado, posts antigos, posts feitos pelo próprio usuário, conteúdo de autores bloqueados ou palavras-chave bloqueadas.

Essa etapa economiza recursos computacionais e evita que conteúdo inválido entre na fase de pontuação principal.

Como são atribuídas as pontuações?

Essa é a parte mais importante. O modelo Transformer baseado no Phoenix Grok avalia cada uma das postagens restantes após a filtragem, calculando a probabilidade de você realizar várias ações, como curtir, compartilhar, responder, clicar na imagem ou visitar o perfil do autor.

É uma jogada de ganhar pontos e perder pontos:

Itens de pontuação positiva (feedback positivo): IA acha que você provavelmente vai curtir, compartilhar, responder, clicar na imagem ou visitar o perfil.

Itens de pontuação negativa (feedback negativo): IA acha que você pode bloquear o conta, silenciar ou denunciar.

Pontuação final = (probabilidade de curtir × peso) + (probabilidade de responder × peso) - (probabilidade de bloquear × peso)…

Vale destacar que, no novo algoritmo de recomendação, o «Author Diversity Scorer» (avaliador de diversidade de autores) geralmente intervém após a IA calcular a pontuação final. Quando detecta que há várias postagens de um mesmo autor entre os candidatos, essa ferramenta automaticamente «baixa» a pontuação das próximas postagens desse autor, promovendo maior diversidade de autores nas recomendações.

Por fim, as postagens com as maiores pontuações são selecionadas.

Filtragem secundária

O sistema revisa novamente as primeiras postagens com maior pontuação, eliminando conteúdo que viole regras (como spam, conteúdo violento), removendo múltiplas ramificações de um mesmo tópico, e ordena tudo do maior para o menor, formando o fluxo de informações que você vê.

Resumo

O X já eliminou todas as funções de recomendação baseadas em regras manuais e a maior parte dos algoritmos heurísticos. O avanço principal do novo algoritmo está em «permitir que a IA aprenda por conta própria as preferências do usuário», realizando a transição de «ensinar a máquina o que fazer» para «fazer a máquina aprender como fazer».

Primeiro, a recomendação é mais precisa, com «previsões multidimensionais» que atendem melhor às necessidades reais. O novo algoritmo usa o grande modelo Grok para prever várias ações do usuário — não apenas se ele vai curtir ou compartilhar, mas também se vai clicar no link, quanto tempo vai permanecer, se vai seguir o autor, e até prever se vai denunciar ou bloquear. Essa análise detalhada aumenta a compatibilidade entre o conteúdo recomendado e as necessidades subconscientes do usuário.

Em segundo lugar, o mecanismo do algoritmo é relativamente mais justo, podendo quebrar o «monopólio de contas grandes» e dar mais oportunidades a contas novas ou menores: os algoritmos heurísticos antigos tinham um problema fatal: contas grandes, com alta interação histórica, conseguiam alta exposição independentemente do conteúdo, enquanto contas novas, mesmo com conteúdo de qualidade, eram ignoradas por falta de dados. O mecanismo de isolamento de candidatos faz com que cada postagem seja avaliada de forma independente, sem depender de se ela é um sucesso entre outros conteúdos do mesmo lote. Além disso, o «Author Diversity Scorer» também reduz a repetição de postagens do mesmo autor no mesmo lote.

Para a empresa X: essa é uma iniciativa de redução de custos e aumento de eficiência, trocando recursos computacionais por mão de obra, e IA por retenção de usuários. Para os usuários, estamos diante de um «super cérebro» que entende nossos desejos e necessidades. Quanto mais ele nos entender, mais dependentes nos tornaremos, mas também, por entender demais, ficaremos mais presos na «bolha de informação» criada pelos algoritmos e mais suscetíveis a conteúdos emocionalmente carregados.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário