Dans l’algorithme de recommandation open source de X : quels contenus remportent réellement l’attention ?

2026-01-21 09:12:25
Intermédiaire
Sujets d'actualité
X (anciennement Twitter) a dévoilé le code source de son nouvel algorithme de recommandation, permettant d’explorer en détail la logique de classement des contenus et les mécanismes de pondération des interactions sur la plateforme. Cet article offre une analyse technique sur la façon dont la valeur des "likes" diminue avec le temps, sur la tarification des conversations et sur la pénalisation des retours négatifs au niveau du code. Il expose aussi des stratégies d’optimisation du trafic adaptées aux créateurs.

Le 20 janvier après-midi, X a publié en open source son dernier algorithme de recommandation.

Musk a déclaré : « Nous savons que cet algorithme est limité et nécessite encore des améliorations majeures, mais au moins vous pouvez constater nos efforts d’amélioration en temps réel. Les autres plateformes sociales n’oseraient pas s’y risquer. »

Son propos s’articule autour de deux axes : il reconnaît les faiblesses de l’algorithme et met en avant la transparence comme argument principal.

Il s’agit de la deuxième publication open source de l’algorithme par X. La version 2023 n’avait pas été mise à jour depuis trois ans et n’était plus connectée au système de production. Cette fois, la base de code a été entièrement réécrite. Le modèle central est passé de l’apprentissage automatique classique au Grok transformer. D’après la documentation officielle, « l’ingénierie manuelle des caractéristiques a été totalement supprimée ».

Concrètement, l’algorithme précédent reposait sur l’ajustement manuel de paramètres par des ingénieurs. Désormais, l’IA analyse directement l’historique de vos interactions pour déterminer si votre contenu doit être mis en avant.

Pour les créateurs de contenu, cela implique que les stratégies telles que « horaires optimaux de publication » ou « tags qui font grandir la communauté » pourraient perdre de leur efficacité.

Nous avons également consulté le dépôt GitHub open source et, avec l’aide de l’IA, identifié certaines logiques codées en dur qui méritent d’être examinées.

Mutation de la logique algorithmique : des règles manuelles à l’IA décisionnelle

Commençons par clarifier les différences entre l’ancienne et la nouvelle version afin d’éviter toute confusion dans l’analyse.

En 2023, l’algorithme open source de Twitter, Heavy Ranker, reposait sur l’apprentissage automatique traditionnel. Les ingénieurs définissaient manuellement des centaines de caractéristiques : présence d’images, nombre d’abonnés de l’auteur, ancienneté du post, liens, etc.

Chaque caractéristique se voyait attribuer un poids, ajusté en continu pour optimiser la combinaison.

La nouvelle version, Phoenix, propose une architecture radicalement différente : elle s’appuie sur des modèles d’IA de grande taille. Le cœur du système utilise le Grok transformer, technologie similaire à ChatGPT et Claude.

Le README officiel précise : « Toutes les caractéristiques conçues à la main ont été supprimées. »

Le système basé sur des règles et des caractéristiques extraites manuellement a donc disparu.

Sur quels critères l’algorithme évalue-t-il la qualité du contenu ?

La réponse : votre séquence comportementale. Ce que vous aimez, à qui vous répondez, les posts sur lesquels vous restez plus de deux minutes, les types de comptes que vous bloquez. Phoenix transmet ces comportements au transformer, qui apprend et synthétise les schémas.

Pour illustrer : l’ancien algorithme fonctionnait comme une grille de notation manuelle, attribuant des points pour chaque critère rempli.

Le nouvel algorithme s’apparente à une IA ayant accès à l’ensemble de votre historique de navigation pour anticiper ce que vous souhaitez voir.

Pour les créateurs, deux conséquences :

Premièrement, les tactiques comme « meilleurs horaires de publication » ou « tags stratégiques » ont désormais moins d’importance. Le modèle ne s’appuie plus sur des caractéristiques fixes, mais sur les préférences individuelles de chaque utilisateur.

Deuxièmement, la promotion de votre contenu dépend principalement de « la façon dont les utilisateurs réagissent à votre contenu ». Ces réactions sont quantifiées en 15 types de prédictions comportementales, détaillées ci-après.

L’algorithme prédit 15 types de réactions utilisateur

Lorsqu’il évalue un post, Phoenix anticipe 15 actions possibles de l’utilisateur :

  • Actions positives : aimer, répondre, repartager, repartager avec citation, cliquer sur le post, cliquer sur le profil de l’auteur, regarder plus de la moitié d’une vidéo, agrandir une image, partager, rester un certain temps, suivre l’auteur
  • Actions négatives : sélectionner « pas intéressé », bloquer l’auteur, masquer l’auteur, signaler

Chaque action se voit attribuer une probabilité prédite. Par exemple, le modèle estime à 60% la probabilité que vous aimiez un post et à 5% celle que vous bloquiez l’auteur.

L’algorithme multiplie chaque probabilité par son poids et additionne le tout pour obtenir le score final.

La formule est :

Score final = Σ ( poids × P(action) )

Les actions positives ont des poids positifs ; les négatives, des poids négatifs.

Les posts ayant un score total élevé sont mieux classés ; ceux avec un score faible sont déclassés.

En pratique, la qualité d’un contenu n’est plus déterminée uniquement par ses attributs intrinsèques (même si lisibilité et valeur restent nécessaires pour le partage). Elle dépend surtout « des réactions suscitées ». L’algorithme s’intéresse avant tout au comportement utilisateur.

Selon cette logique, dans certains cas extrêmes, un post de faible qualité qui génère de nombreuses réponses peut obtenir un score supérieur à un post de qualité sans interaction. Cela semble refléter la logique du système.

Cependant, la nouvelle version open source ne révèle pas les poids exacts associés à chaque comportement, contrairement à la version 2023.

Référence ancienne version : un signalement = 738 likes

Examinons les données de 2023. Elles sont datées, mais illustrent la valorisation des différentes actions par l’algorithme.

Le 5 avril 2023, X a publié un tableau de poids sur GitHub.

Voici les chiffres :

Pour résumer :


Source des données : ancienne version GitHub twitter/the-algorithm-ml repository. Cliquez pour voir l’algorithme d’origine.

Quelques chiffres clés :

Premièrement, les likes ont une valeur quasi nulle : poids de 0,5, le plus faible parmi les actions positives. L’algorithme considère qu’un like a peu d’impact.

Deuxièmement, la conversation est essentielle. « Vous répondez et l’auteur répond » a un poids de 75 — soit 150 fois plus qu’un like. L’algorithme privilégie nettement les échanges bidirectionnels.

Troisièmement, les retours négatifs sont fortement pénalisés. Un blocage ou masquage (-74) nécessite 148 likes pour compenser. Un signalement (-369) requiert 738 likes. Ces scores négatifs s’accumulent et affectent la réputation du compte ainsi que la diffusion des futurs posts.

Quatrièmement, le taux de complétion des vidéos est très peu pondéré — seulement 0,005, quasiment négligeable. Cela contraste avec des plateformes comme TikTok, où ce taux est un indicateur clé.

La documentation officielle précise : « Les poids exacts du fichier peuvent être ajustés à tout moment… Nous les ajustons périodiquement pour optimiser les métriques de la plateforme. »

Les poids sont donc modifiables à tout moment — et ils l’ont été.

La nouvelle version ne divulgue pas les valeurs précises, mais la logique reste la même : les actions positives ajoutent des points, les négatives en retirent, et le score final est une somme pondérée.

Les chiffres exacts peuvent varier, mais l’ordre de priorité semble inchangé. Répondre à un commentaire vaut plus que 100 likes. Être bloqué est plus préjudiciable que l’absence d’interaction.

Comment les créateurs peuvent-ils exploiter ces informations ?

Après analyse du code des algorithmes Twitter, voici quelques recommandations pratiques :

1. Répondez à vos commentateurs. Dans le tableau des poids, « l’auteur répond au commentateur » est l’action la mieux notée (+75), soit 150 fois plus qu’un like. Il n’est pas nécessaire de solliciter des commentaires, mais il faut toujours répondre à ceux reçus — même un « merci » est pris en compte.

2. Évitez d’inciter les utilisateurs à vous bloquer. Un blocage demande 148 likes pour compenser. Un contenu polémique peut générer de l’engagement, mais si celui-ci consiste à vous bloquer, la réputation de votre compte en sera durablement affectée, impactant la diffusion de vos futurs posts. La controverse est à manier avec précaution.

3. Placez les liens externes dans les commentaires. L’algorithme cherche à retenir les utilisateurs sur la plateforme. Les liens dans le texte principal sont pénalisés — Musk l’a confirmé publiquement. Pour générer du trafic, mettez le contenu principal dans le post et le lien dans le premier commentaire.

4. Ne spammez pas. Le nouveau code intègre un Author Diversity Scorer, qui pénalise les publications consécutives d’un même auteur. L’objectif est de diversifier les fils utilisateurs ; privilégiez la qualité à la quantité.

6. Il n’y a plus de « meilleur moment pour publier ». L’ancien algorithme utilisait l’heure de publication comme critère manuel, mais Phoenix l’a supprimée. Il ne tient compte que du comportement utilisateur, pas du timing. Les stratégies « mardi à 15h » sont donc obsolètes.

Voilà ce qui ressort du code.

Des règles de bonus et de pénalité figurent dans la documentation publique de X mais ne sont pas incluses dans cette publication open source : la vérification par badge bleu augmente la portée, les posts en majuscules sont pénalisés, et le contenu sensible réduit la portée de 80%. Ces règles ne sont pas open source et ne sont donc pas traitées ici.

Globalement, la publication open source est particulièrement riche.

L’architecture complète du système, la logique de rappel des contenus candidats, le processus de scoring et de classement, ainsi que divers filtres sont inclus. Le code, principalement en Rust et Python, est bien structuré et le README plus détaillé que de nombreux projets commerciaux.

Cependant, certains éléments clés sont absents.

1. Les paramètres de poids ne sont pas publics. Le code explique simplement que « les actions positives ajoutent des points, les négatives en retirent », mais sans préciser la valeur d’un like ou d’un blocage. La version 2023 donnait au moins les chiffres ; cette fois, seul le cadre de la formule est disponible.

2. Les poids du modèle ne sont pas publics. Phoenix utilise le Grok transformer, mais les paramètres du modèle ne sont pas inclus. On peut voir comment le modèle est appelé, mais pas son fonctionnement interne.

3. Les données d’entraînement ne sont pas publiques. On ignore quelles données ont servi à entraîner le modèle, comment le comportement utilisateur a été échantillonné ou comment les échantillons positifs et négatifs ont été constitués.

En résumé, cette publication open source indique « nous utilisons des sommes pondérées pour calculer les scores » sans révéler les poids ; elle mentionne « nous utilisons des transformers pour prédire les probabilités comportementales » sans détailler leur structure interne.

À titre de comparaison, TikTok et Instagram n’ont rien publié de comparable. La publication open source de X est effectivement plus complète que celle des autres grandes plateformes, mais elle n’est pas totalement transparente.

Cela ne remet pas en cause l’intérêt de l’open source. Pour les créateurs et chercheurs, accéder au code est préférable à l’absence totale d’information.

Déclaration :

  1. Ce contenu est repris de [TechFlow], avec droits d’auteur détenus par l’auteur original [David]. Pour toute question concernant cette reprise, veuillez contacter l’équipe Gate Learn, qui traitera votre demande rapidement selon les procédures applicables.
  2. Avertissement : Les opinions exprimées dans cet article sont celles de l’auteur et ne constituent pas un conseil en investissement.
  3. Les versions traduites de cet article sont réalisées par l’équipe Gate Learn. Sauf mention explicite de Gate, il est interdit de copier, distribuer ou plagier ce contenu traduit.

Partager

Calendrier Crypto
Déblocage des Jetons
Wormhole déverrouillera 1 280 000 000 de jetons W le 3 avril, ce qui constitue environ 28,39 % de l'offre actuellement en circulation.
W
-7.32%
2026-04-02
Déverrouillage des Jetons
Le réseau Pyth déverrouillera 2 130 000 000 de tokens PYTH le 19 mai, ce qui représente environ 36,96 % de l'offre actuellement en circulation.
PYTH
2.25%
2026-05-18
Déverrouillage des Jetons
Pump.fun débloquera 82 500 000 000 de tokens PUMP le 12 juillet, ce qui constitue environ 23,31 % de l'offre actuellement en circulation.
PUMP
-3.37%
2026-07-11
Déverrouillage des Jetons
Succinct déverrouillera 208 330 000 jetons PROVE le 5 août, ce qui représente environ 104,17 % de l'offre actuellement en circulation.
PROVE
2026-08-04
sign up guide logosign up guide logo
sign up guide content imgsign up guide content img
Sign Up

Articles Connexes

Comment trouver de nouvelles memecoins avant qu'elles ne deviennent virales
Intermédiaire

Comment trouver de nouvelles memecoins avant qu'elles ne deviennent virales

Apprenez à repérer les premières opportunités d'investissement avant qu'un memecoin ne devienne viral. Cet article couvre les stratégies utilisant les plateformes de lancement, les outils de suivi et les tendances des médias sociaux tout en mettant l'accent sur la gestion des risques pour vous aider à rester en avance sur le marché de la cryptographie.
2025-02-07 03:57:12
XRP Surge, A Review of 9 Projects with Related Ecosystems
Débutant

XRP Surge, A Review of 9 Projects with Related Ecosystems

La hausse massive de XRP de Ripple se poursuit, avec les jetons des projets de l'écosystème XRP connaissant une croissance rapide. Cet article met en évidence certains des principaux projets au sein de l'écosystème XRP.
2024-12-09 04:14:24
Tous les Crypto ETF américains que vous devez connaître en 2025
Intermédiaire

Tous les Crypto ETF américains que vous devez connaître en 2025

En 2025, les ETF cryptos se sont étendus à des actifs alternatifs tels que Solana, XRP et DOGE, avec des sociétés de gestion d'actifs grand public se précipitant pour soumettre des demandes. Cet article fournit une analyse détaillée de l'état actuel des demandes d'ETF, de la probabilité d'approbation et de leur impact potentiel, décrivant la voie clé pour que les actifs cryptos s'intègrent dans le système financier traditionnel.
2025-04-18 06:43:49
La Hausse et les Perspectives des Cryptomonnaies d'IA de Nouvelle Génération
Intermédiaire

La Hausse et les Perspectives des Cryptomonnaies d'IA de Nouvelle Génération

Les agents d'IA sont prêts à apporter de l'innovation et de la croissance à l'espace crypto. Cet article explore les tendances clés, y compris l'évolution des agents d'IA multimodaux basés sur le texte, la hausse des agents de trading autonomes comme AIXBT et le potentiel de l'intelligence collective. Il examine également les modèles économiques qui génèrent la capture de valeur des jetons et le développement futur des cadres Crypto+IA.
2024-12-31 16:14:35
Gate Recherche: Sujets Chauds Hebdomadaires(3-10 avril 2025)
Débutant

Gate Recherche: Sujets Chauds Hebdomadaires(3-10 avril 2025)

Recherche Gate : Ce rapport hebdomadaire couvre les principaux développements de l'industrie de la blockchain du 3 au 10 avril 2025. Les points forts comprennent : le lancement imminent du mainnet de Shardeum le 15 avril ; Solana atteignant sa plus haute valeur totale verrouillée (TVL) depuis 2023 avec de solides performances sur le marché DEX ; le lancement officiel du mainnet Lens Chain de Lens Protocol ; le nouveau fonds de 108 millions de dollars de Mantra pour accélérer la tokenisation des actifs du monde réel et le développement de projets DeFi ; le hashrate de Bitcoin dépassant 1 Zetahash pour la première fois, marquant une avancée infrastructurelle de 1000x ; et le lancement de Layer 1 blockchain de Babylon, Babylon Genesis, le 10 avril.
2025-04-11 04:43:00
Recherche Gate : Principaux sujets de la semaine (24-28 février 2025)
Avancé

Recherche Gate : Principaux sujets de la semaine (24-28 février 2025)

Recherche Gate : Ce rapport résume les développements de l'industrie de la blockchain du 24 au 28 février 2025. Pump.fun teste son propre AMM, ce qui fait chuter le prix de RAY ; La TVL de Berachain a dépassé 3,3 milliards de dollars, dépassant Arbitrum et Base pour devenir le 6e plus grand blockchain en termes de TVL ; Le plan de génération de rendement de Polygon a soulevé des préoccupations en matière de sécurité, Aave a suspendu le prêt, ce qui pourrait entraîner des sorties de TVL dépassant 300 millions de dollars ; La mise à niveau de Pectra d'Ethereum a rencontré des obstacles sur le testnet de Holesky, avec des échecs de finalité qui pourraient avoir un impact sur le déploiement sur le mainnet ; La TVL de Sonic a dépassé 600 millions de dollars ; et MetaMask s'est associé à Transak pour étendre les services de conversion fiat en cryptomonnaie et ajouter le support de 10 principales blockchains.
2025-02-28 08:48:40