大白话拆解 X 新推薦アルゴリズム:「データ収集」から「スコア付け」へ

TechubNews

撰文:KarenZ,Foresight News

マスクはTwitterのおすすめシステムを「人工的にルールを積み重ねた大部分のヒューリスティックアルゴリズム」から「純粋にAI大規模モデルの好みで選ぶ方式」に変更したのか?

1月20日、Twitter(X)は正式に新しいおすすめアルゴリズムを公開し、Twitterホームページの「あなたにおすすめ」(For You)タイムラインの背後にあるロジックを明らかにした。

簡単に言えば、現在のアルゴリズムは:「あなたがフォローしている人の投稿」と「全ネットからあなたの好みに合いそうなコンテンツ」を混ぜ合わせ、あなたがX上で行ったいいね、コメントなどの一連のアクションに基づいて、あなたへの魅力度順に並べ替え、二度のフィルタリングを経て、最終的にあなたがスクロールする推奨情報の流れになる。

以下は白紙の言葉で翻訳したコアロジック:

プロフィール作成

システムはまずユーザーのコンテキスト情報を収集し、後続の推薦のために「プロフィール」を作成する:

ユーザー行動シーケンス:過去のインタラクション記録(いいね、リツイート、滞在時間など)。

ユーザー特徴:フォローリスト、個人の好み設定など。

コンテンツはどこから?

「あなたにおすすめ」タイムラインをリフレッシュするたびに、アルゴリズムは以下の二つの場所からコンテンツを探す:

知人圈(Thunder):あなたがフォローしている人のツイート。

見知らぬ人圈(Phoenix):あなたがフォローしていなくても、AIがあなたの好みに基づいて、広大な人海の中からあなたが興味を持ちそうな投稿(作者をフォローしていなくても)を抽出する。

これら二つのコンテンツは混ざり合い、候補ツイートとなる。

データ補完と初期フィルタリング

何千何万もの投稿を抽出した後、システムは投稿の完全なメタデータ(作者情報、メディアファイル、コアテキスト)を取得する。このプロセスはHydrationと呼ばれる。その後、素早く洗浄を行い、重複コンテンツ、古い投稿、ユーザー自身が投稿したもの、ブロックした作者の内容やキーワードを含む内容を除外する。

このステップは計算リソースを節約し、無効なコンテンツがコアのスコアリング段階に入るのを防ぐためだ。

どうやってスコアリングする?

これは最も重要な部分だ。Phoenix GrokのTransformerモデルに基づき、フィルタリング後に残った候補投稿一つ一つに対して、あなたがそれに対して行うさまざまなアクションの確率を計算する。これは加点と減点のゲームだ:

加点項(正のフィードバック):AIはあなたがいいね、リツイート、返信、画像クリック、またはプロフィール閲覧をする可能性を予測。

減点項(負のフィードバック):AIはあなたが作者をブロック、Mute、報告する可能性を予測。

最終スコア = (いいね確率 × 重み) + (返信確率 × 重み) - (ブロック確率 × 重み)…

注目すべきは、新しい推薦アルゴリズムではAuthor Diversity Scorer(作者多様性スコアラー)が通常、AIが最終スコアを計算した後に介入することだ。候補投稿の中に同じ作者の複数の投稿があると検出された場合、このツールは自動的にその作者の後続投稿のスコアを「低く」調整し、あなたが見る作者の多様性を高める。

最後に、スコア順に並べ替え、最もスコアの高い投稿群を選ぶ。

二次フィルタリング

システムはスコアが最も高い上位の投稿を再度チェックし、違反(スパム、暴力的内容など)を除外し、同じスレッドの複数の分岐を重複排除し、最終的にスコアの高い順に並べてあなたが見る情報の流れにする。

まとめ

Xはすでに推奨システムからすべての人工的に設計された機能と大部分のヒューリスティックアルゴリズムを排除している。新しいアルゴリズムの核心的進歩は、「AIにユーザの好みを自主的に学習させる」ことにあり、「機械に何をすべきかを教える」から「機械に自分で学ばせる」へと跨ることだ。

まず、より正確な推薦、「多次元予測」が実際のニーズにより合致する。新しいアルゴリズムはGrok大モデルにより、多様なユーザー行動を予測する——「いいね/リツイートするかどうか」だけでなく、「リンクをクリックするか」「滞在時間はどうか」「作者をフォローするか」「報告/ブロックするか」まで予測する。この詳細な判断により、推奨コンテンツとユーザーの潜在意識的なニーズとの適合度はかつてない高さに達している。

次に、アルゴリズムの仕組みは比較的公平になりつつあり、「大号の独占」を打破し、新規アカウントや小規模アカウントにより多くの機会を与える。過去のヒューリスティックアルゴリズムには致命的な問題があった:大号は過去の高いインタラクション量により、何を投稿しても高い露出を得られるが、新規アカウントはコンテンツの質が良くても「データ蓄積がない」ため埋もれてしまう。候補の隔離メカニズムは、各投稿を独立してスコアリングし、「同じバッチの他のコンテンツがバズるかどうか」とは無関係だ。同時に、Author Diversity Scorerは同一作者の同一バッチ内の後続投稿のスパム行為も抑制する。

X社にとって:これはコスト削減と効率向上の施策であり、計算力を人手に換え、AIを用いてリテンションを高めるものだ。ユーザーにとっては、常に人の心を読む「スーパー脳」と対話しているようなものだ。私たちをより理解すればするほど、私たちは離れられなくなるが、同時に、あまりに私たちを理解しすぎるため、私たちはアルゴリズムに編み込まれた「情報の繭房」に深く入り込み、感情的なコンテンツの正確な捕獲対象になりやすくなる。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし