Décryptage simple de l'algorithme de recommandation X : du « collecte de données » au « scoring »

TechubNews

Rédigé par : KarenZ, Foresight News

Elon Musk a-t-il transformé le système de recommandation de Twitter de « règles manuelles et la plupart des algorithmes heuristiques » en « purement basé sur les préférences du grand modèle AI » ?

Le 20 janvier, Twitter (X) a officiellement dévoilé son nouvel algorithme de recommandation, c’est-à-dire la logique derrière la timeline « Pour vous » sur la page d’accueil de Twitter.

En résumé, l’algorithme actuel est : mélanger « le contenu publié par les personnes que vous suivez » et « le contenu susceptible de vous plaire sur l’ensemble du web », puis les classer selon leur attractivité pour vous, basé sur une série d’actions précédentes sur X (likes, commentaires, etc.), après deux filtres, pour finalement générer le flux de recommandations que vous voyez.

Voici la logique centrale traduite en langage simple :

Créer un profil

Le système commence par collecter les informations contextuelles de l’utilisateur pour construire un « profil » :

  • Séquence de comportements utilisateur : historique d’interactions (likes, retweets, temps passé, etc.).
  • Caractéristiques de l’utilisateur : liste de suivi, préférences personnelles, etc.

D’où viennent les contenus ?

Chaque fois que vous actualisez la timeline « Pour vous », l’algorithme va chercher du contenu dans deux endroits :

  • Cercle des connaissances (Thunder) : les tweets des personnes que vous suivez.
  • Cercle des inconnus (Phoenix) : des contenus que vous ne suivez pas, mais que l’IA, selon vos goûts, va repérer dans la masse d’informations pour vous proposer, même si vous ne suivez pas l’auteur.

Ces deux ensembles de contenus seront mélangés, constituant ainsi les tweets candidats.

Complétion des données et filtrage initial

Après avoir récupéré des milliers de tweets, le système va extraire leurs métadonnées complètes (informations sur l’auteur, fichiers médias, texte principal), ce processus s’appelle Hydration. Ensuite, une étape de nettoyage rapide élimine les contenus dupliqués, anciens, ceux postés par l’utilisateur lui-même, les contenus de auteurs bloqués ou mots-clés masqués.

Cette étape vise à économiser des ressources de calcul et à éviter que des contenus non pertinents n’entrent dans la phase de scoring principale.

Comment sont-ils notés ?

C’est la partie la plus critique. Le modèle Transformer basé sur Phoenix Grok analysera chaque tweet candidat restant après filtrage, en calculant la probabilité que vous effectuiez diverses actions dessus. C’est un jeu de points positifs et négatifs :

  • Points positifs (retour positif) : l’IA pense que vous pourriez liker, retweeter, répondre, cliquer sur une image ou visiter le profil.
  • Points négatifs (retour négatif) : l’IA pense que vous pourriez bloquer l’auteur, mettre en sourdine ou signaler le contenu.

Score final = (Probabilité de liker × Poids) + (Probabilité de répondre × Poids) - (Probabilité de bloquer × Poids)…

Il est important de noter que dans le nouveau système de recommandation, le « Author Diversity Scorer » (scoreur de diversité des auteurs) intervient généralement après le calcul du score final par l’IA. Lorsqu’il détecte plusieurs contenus d’un même auteur dans un lot de tweets candidats, cet outil « réduit » automatiquement le score des futurs tweets de cet auteur, pour vous proposer une plus grande diversité d’auteurs.

Enfin, en classant par score, le système sélectionne le lot de tweets avec le score le plus élevé.

Filtrage secondaire

Le système re-vérifie les tweets ayant obtenu les meilleurs scores, en éliminant ceux qui enfreignent les règles (spam, contenu violent), en dédoublant les différentes branches d’un même thread, puis en les classant du plus haut au plus bas, pour former le flux d’informations que vous voyez.

Résumé

X a déjà éliminé dans son système de recommandation toutes les fonctionnalités conçues manuellement et la majorité des algorithmes heuristiques. La principale avancée du nouvel algorithme réside dans « l’apprentissage autonome des préférences utilisateur par l’IA », permettant de passer du « dire à la machine comment faire » au « faire apprendre à la machine comment faire ».

D’abord, la recommandation devient plus précise, avec une « prévision multidimensionnelle » mieux adaptée aux besoins réels. Le nouvel algorithme s’appuie sur le grand modèle Grok pour prédire divers comportements utilisateur — pas seulement si vous allez liker ou retweeter, mais aussi si vous allez cliquer sur un lien, combien de temps vous allez rester, si vous allez suivre l’auteur, voire si vous allez signaler ou bloquer. Cette analyse fine permet d’aligner le contenu recommandé avec les besoins subconscients de l’utilisateur à un niveau sans précédent.

Ensuite, le mécanisme de l’algorithme est relativement plus équitable, pouvant en partie briser la « monopolisation par les gros comptes », en offrant plus d’opportunités aux nouveaux ou petits comptes : l’ancien « algorithme heuristique » avait un problème critique : les gros comptes, grâce à leur forte interaction historique, obtenaient une grande visibilité, même avec un contenu médiocre, tandis que les nouveaux, même avec du contenu de qualité, étaient noyés faute de « données accumulées ». Le mécanisme d’isolation des candidats permet de noter chaque tweet indépendamment, sans dépendre de leur potentiel viral dans un lot. Par ailleurs, le scoreur de diversité des auteurs réduit aussi le phénomène de flood de contenus d’un même auteur dans un même lot.

Pour la société X : c’est une démarche de réduction des coûts et d’augmentation de l’efficacité, en utilisant la puissance de calcul pour remplacer la main-d’œuvre, et l’IA pour améliorer la rétention. Pour l’utilisateur, c’est comme un « super cerveau » qui devine constamment nos préférences. Plus il nous comprend, plus on devient dépendant, mais c’est aussi parce qu’il nous connaît si bien que nous risquons de tomber dans une « chambre d’écho » algorithmique, et de devenir plus vulnérables à la capture par des contenus émotionnels.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire