Bên trong thuật toán đề xuất mã nguồn mở của X: Loại nội dung nào thực sự giành được sự chú ý?

2026-01-21 09:12:25
Trung cấp
Chủ đề Hot
X (trước đây gọi là Twitter) đã công bố mã nguồn của thuật toán đề xuất mới nhất, lần đầu tiên cung cấp cái nhìn toàn diện về cách nền tảng này xếp hạng nội dung và cơ chế tính trọng số cho các loại tương tác. Bài viết này phân tích chi tiết về mặt kỹ thuật cách giá trị của lượt thích bị giảm dần theo thời gian, cách nền tảng định giá các cuộc trò chuyện, cũng như cách phản hồi tiêu cực bị xử phạt trực tiếp ở cấp độ mã nguồn. Ngoài ra, bài viết còn trình bày các chiến lược tối ưu hóa lưu lượng truy cập thực tiễn dành cho nhà sáng tạo nội dung.

Chiều ngày 20 tháng 1, X đã công khai mã nguồn thuật toán đề xuất mới nhất của mình.

Musk nhận xét: “Chúng tôi biết thuật toán này còn hạn chế và cần cải tiến lớn, nhưng ít nhất bạn có thể thấy chúng tôi đang nỗ lực nâng cấp nó theo thời gian thực. Những nền tảng mạng xã hội khác sẽ không dám làm điều này.”

Ý kiến của ông có hai điểm. Thứ nhất, ông thừa nhận hạn chế của thuật toán. Thứ hai, ông lấy tính minh bạch làm lợi thế nổi bật.

Đây là lần thứ hai X mở mã nguồn thuật toán. Phiên bản năm 2023 đã ba năm không cập nhật và không còn liên kết với hệ thống vận hành. Lần này, toàn bộ mã nguồn được viết lại hoàn toàn. Mô hình cốt lõi chuyển từ học máy truyền thống sang bộ biến đổi Grok. Theo mô tả chính thức, “đặc trưng thủ công đã bị loại bỏ hoàn toàn.”

Nói ngắn gọn: thuật toán trước đây dựa vào kỹ sư tự chỉnh tham số. Hiện tại, AI trực tiếp phân tích lịch sử tương tác của bạn để quyết định có đề xuất nội dung hay không.

Đối với người sáng tạo nội dung, điều này đồng nghĩa các chiến lược như “thời điểm đăng bài tối ưu” hoặc “thẻ tăng người theo dõi” có thể không còn hiệu quả.

Chúng tôi cũng đã kiểm tra kho mã nguồn mở trên GitHub và với trợ giúp của AI, phát hiện một số logic mã cứng trong mã nguồn đáng chú ý.

Chuyển dịch logic thuật toán: Từ quy tắc thủ công sang đánh giá dựa trên AI

Đầu tiên, cần làm rõ sự khác biệt giữa phiên bản cũ và mới để tránh nhầm lẫn khi thảo luận tiếp theo.

Năm 2023, thuật toán mã nguồn mở của Twitter có tên Heavy Ranker. Đây là học máy truyền thống. Kỹ sư tự định nghĩa hàng trăm đặc trưng: bài đăng có ảnh không, số người theo dõi tác giả, thời gian đăng, có chứa liên kết không, v.v.

Mỗi đặc trưng được gán trọng số và liên tục điều chỉnh để tìm ra tổ hợp hiệu quả nhất.

Bản mã nguồn mở mới có tên Phoenix. Kiến trúc hoàn toàn khác biệt—có thể hiểu là thuật toán dựa nhiều hơn vào các mô hình AI lớn. Lõi sử dụng bộ biến đổi Grok, cùng loại công nghệ với ChatGPT và Claude.

Tài liệu README chính thức ghi rõ: “Chúng tôi đã loại bỏ hoàn toàn mọi đặc trưng do con người xây dựng.”

Hệ thống dựa trên quy tắc thủ công, trích xuất đặc trưng nội dung bằng tay đã bị loại bỏ hoàn toàn.

Vậy, thuật toán dựa vào đâu để đánh giá nội dung tốt?

Câu trả lời: chuỗi hành vi của bạn. Bạn thích gì, trả lời ai, dừng lại ở bài đăng nào hơn hai phút, đã chặn loại tài khoản nào. Phoenix đưa các hành vi này vào bộ biến đổi để mô hình học và tổng hợp quy luật.

Để hình dung: thuật toán cũ như một bảng điểm thủ công, mỗi tiêu chí đạt được cộng điểm.

Thuật toán mới như một AI có quyền truy cập toàn bộ lịch sử duyệt nội dung của bạn, dự đoán bạn sẽ muốn xem gì tiếp theo.

Với người sáng tạo, điều này mang lại hai ý nghĩa:

Thứ nhất, các chiến thuật như “giờ đăng bài tốt nhất” hoặc “thẻ vàng” không còn nhiều giá trị. Mô hình không xét đặc trưng cố định, mà tập trung vào sở thích cá nhân của từng người dùng.

Thứ hai, việc nội dung được đề xuất phụ thuộc nhiều hơn vào “cách người dùng phản ứng với nội dung của bạn”. Những phản ứng này được lượng hóa thành 15 loại hành vi dự đoán, sẽ trình bày chi tiết ở phần tiếp theo.

Thuật toán dự đoán 15 loại phản ứng của người dùng

Khi Phoenix đánh giá một bài đăng để đề xuất, nó dự đoán 15 hành động có thể xảy ra của người dùng:

  • Hành động tích cực: thích, trả lời, đăng lại, trích dẫn đăng lại, nhấp vào bài đăng, nhấp vào hồ sơ tác giả, xem hơn nửa video, mở rộng hình ảnh, chia sẻ, dừng lại đủ thời gian, theo dõi tác giả
  • Hành động tiêu cực: chọn “không quan tâm”, chặn tác giả, tắt tiếng tác giả, báo cáo

Mỗi hành động có một xác suất dự đoán. Ví dụ, mô hình có thể dự đoán khả năng bạn thích một bài đăng là 60% và khả năng bạn chặn tác giả là 5%.

Thuật toán nhân mỗi xác suất với trọng số tương ứng, sau đó cộng lại để ra điểm cuối cùng.

Công thức:

Điểm số cuối = Σ ( trọng số × P(hành động) )

Hành động tích cực có trọng số dương; hành động tiêu cực có trọng số âm.

Bài đăng có tổng điểm cao sẽ được xếp hạng cao hơn; bài có điểm thấp bị đẩy xuống.

Thực tế, việc nội dung “tốt” không còn do chất lượng nội tại quyết định (dù khả năng đọc và giá trị vẫn là điều kiện cần để chia sẻ). Thay vào đó, nó được quyết định bởi “phản ứng mà nội dung tạo ra”. Thuật toán không quan tâm bản thân nội dung, mà quan tâm hành vi người dùng.

Theo logic này, trong trường hợp cực đoan, một bài đăng chất lượng thấp nhưng có nhiều lượt trả lời vẫn có thể đạt điểm cao hơn bài đăng chất lượng cao nhưng không ai tương tác. Đây có thể là logic nền tảng của hệ thống.

Tuy nhiên, thuật toán mã nguồn mở mới không công bố trọng số cụ thể cho từng hành vi, nhưng phiên bản năm 2023 đã từng làm điều này.

Tham chiếu phiên bản cũ: Một báo cáo = 738 lượt thích

Hãy xem bộ dữ liệu năm 2023. Tuy đã cũ, nhưng nó minh họa cách thuật toán đánh giá các hành động khác nhau.

Ngày 5 tháng 4 năm 2023, X công khai một bộ dữ liệu trọng số trên GitHub.

Dưới đây là các con số:

Nói một cách dễ hiểu:


Nguồn dữ liệu: Phiên bản cũ kho GitHub twitter/the-algorithm-ml. Nhấn để xem thuật toán gốc.

Một số con số nổi bật:

Thứ nhất, lượt thích gần như không có giá trị. Trọng số chỉ là 0,5—thấp nhất trong các hành động tích cực. Thuật toán coi lượt thích gần như vô nghĩa.

Thứ hai, hội thoại là yếu tố quan trọng. “Bạn trả lời và tác giả trả lời lại” có trọng số 75—cao gấp 150 lần lượt thích. Thuật toán đánh giá cao hội thoại hai chiều hơn lượt thích đơn thuần.

Thứ ba, phản hồi tiêu cực bị trừ điểm rất mạnh. Một lượt chặn hoặc tắt tiếng (-74) cần 148 lượt thích để bù lại. Một lượt báo cáo (-369) cần đến 738 lượt thích. Các điểm trừ này tích lũy vào uy tín tài khoản, ảnh hưởng đến phân phối bài đăng sau này.

Thứ tư, tỷ lệ hoàn thành video có trọng số cực thấp—chỉ 0,005, gần như không đáng kể. Điều này trái ngược với các nền tảng như TikTok, nơi tỷ lệ hoàn thành là chỉ số then chốt.

Tài liệu chính thức cũng nêu: “Các trọng số trong file có thể được điều chỉnh bất cứ lúc nào… Chúng tôi thường xuyên điều chỉnh trọng số để tối ưu hóa các chỉ số nền tảng.”

Các trọng số có thể thay đổi bất kỳ lúc nào—và thực tế đã thay đổi.

Phiên bản mới không công bố giá trị cụ thể, nhưng khung logic trong README vẫn giữ nguyên: hành động tích cực cộng điểm, hành động tiêu cực trừ điểm, điểm cuối là tổng trọng số.

Các con số cụ thể có thể thay đổi, nhưng thứ tự tương đối có thể không đổi. Trả lời bình luận của người khác giá trị hơn 100 lượt thích. Bị chặn còn tệ hơn không được tương tác.

Người sáng tạo nên làm gì với thông tin này?

Sau khi xem xét cả mã thuật toán mới và cũ của Twitter, dưới đây là một số gợi ý thực tế:

1. Hãy trả lời bình luận của người khác. Trong bảng trọng số, “tác giả trả lời người bình luận” là hành động được cộng điểm cao nhất (+75), cao gấp 150 lần lượt thích. Bạn không cần kêu gọi bình luận, nhưng hãy phản hồi nếu có ai đó bình luận—chỉ một lời cảm ơn cũng được thuật toán ghi nhận.

2. Tránh khiến người dùng muốn chặn bạn. Một lượt chặn cần 148 lượt thích để bù lại. Nội dung gây tranh cãi có thể tăng tương tác, nhưng nếu tương tác đó là “người này phiền quá, chặn thôi”, uy tín tài khoản sẽ giảm lâu dài, ảnh hưởng đến toàn bộ bài viết sau này. Tranh cãi là con dao hai lưỡi—hãy cân nhắc kỹ trước khi khiêu khích.

3. Đặt liên kết ngoài vào bình luận. Thuật toán không muốn người dùng rời nền tảng. Nếu bạn để liên kết trong nội dung chính sẽ bị trừ điểm—Musk đã xác nhận công khai điều này. Nếu muốn kéo traffic, hãy để nội dung chính trong bài đăng và link ở bình luận đầu tiên.

4. Đừng spam. Mã mới có bộ chấm điểm đa dạng tác giả, sẽ phạt khi cùng một tác giả đăng liên tiếp nhiều bài. Mục đích là đa dạng hóa nội dung trên bảng tin, nên đăng một bài chất lượng còn hơn mười bài liền nhau.

6. Không còn “khung giờ vàng đăng bài”. Thuật toán cũ dùng “thời gian đăng” làm đặc trưng thủ công, nhưng Phoenix đã loại bỏ hoàn toàn. Phoenix chỉ xét hành vi người dùng, không quan tâm thời điểm đăng. Vì vậy, các chiến lược kiểu “thứ ba lúc 3 giờ chiều” ngày càng kém hiệu quả.

Đây là những gì có thể rút ra từ mã nguồn.

Bên cạnh đó, còn có các quy tắc thưởng/phạt trong tài liệu công khai của X nhưng không xuất hiện trong bản mã nguồn mở này: tài khoản tích xanh được tăng phạm vi tiếp cận, bài đăng toàn chữ in hoa bị phạt, nội dung nhạy cảm bị giảm 80% phạm vi tiếp cận. Các quy tắc này không được mã nguồn mở, nên không bàn đến ở đây.

Tổng thể, lần công khai mã nguồn này khá toàn diện.

Toàn bộ kiến trúc hệ thống, logic truy xuất nội dung ứng viên, quy trình chấm điểm và xếp hạng, cùng nhiều bộ lọc đều được công khai. Mã nguồn chủ yếu viết bằng Rust và Python, cấu trúc rõ ràng, README còn chi tiết hơn nhiều dự án thương mại.

Tuy nhiên, vẫn thiếu một số thành phần then chốt.

1. Trọng số không công khai. Mã chỉ giải thích “hành động tích cực cộng điểm, hành động tiêu cực trừ điểm”, nhưng không nêu cụ thể một lượt thích hay chặn được tính bao nhiêu. Phiên bản 2023 còn công bố số liệu; lần này chỉ có khung công thức.

2. Trọng số mô hình không công khai. Phoenix dùng bộ biến đổi Grok, nhưng tham số mô hình không được đính kèm. Bạn chỉ thấy cách gọi mô hình, không biết bên trong hoạt động ra sao.

3. Dữ liệu huấn luyện không công khai. Không rõ dữ liệu nào được dùng để huấn luyện mô hình, hành vi nào được lấy mẫu, hoặc cách xây dựng mẫu tích cực và tiêu cực.

Nói cách khác, lần công khai này cho biết “chúng tôi dùng tổng trọng số để tính điểm”, nhưng không tiết lộ trọng số thực tế; cho biết “chúng tôi dùng transformer để dự đoán xác suất hành vi”, nhưng không cho biết transformer bên trong như thế nào.

So với TikTok và Instagram, hai nền tảng này thậm chí còn chưa công khai đến mức này. Việc công khai mã nguồn của X rõ ràng toàn diện hơn các nền tảng lớn khác, nhưng vẫn chưa hoàn toàn minh bạch.

Tuy vậy, mã nguồn mở vẫn rất giá trị. Với người sáng tạo và nhà nghiên cứu, được đọc mã còn tốt hơn là không có gì để tham khảo.

Tuyên bố:

  1. Bài viết này được đăng lại từ [TechFlow], bản quyền thuộc về tác giả gốc [David]. Nếu bạn có bất kỳ thắc mắc nào về việc đăng lại này, vui lòng liên hệ đội ngũ Gate Learn, đội ngũ sẽ xử lý kịp thời theo quy trình liên quan.
  2. Miễn trừ trách nhiệm: Quan điểm và ý kiến trong bài viết này hoàn toàn thuộc về tác giả, không phải lời khuyên đầu tư.
  3. Các phiên bản ngôn ngữ khác của bài viết này do đội ngũ Gate Learn dịch. Nếu không có đề cập rõ ràng đến Gate, vui lòng không sao chép, phân phối hoặc đạo văn bản dịch.

Mời người khác bỏ phiếu

Lịch Tiền điện tử
Mở khóa Token
Wormhole sẽ mở khóa 1.280.000.000 W token vào ngày 3 tháng 4, chiếm khoảng 28,39% nguồn cung đang lưu hành hiện tại.
W
-7.32%
2026-04-02
Mở Khóa Token
Mạng lưới Pyth sẽ mở khóa 2.130.000.000 token PYTH vào ngày 19 tháng 5, chiếm khoảng 36,96% tổng nguồn cung hiện đang lưu hành.
PYTH
2.25%
2026-05-18
Mở khóa Token
Pump.fun sẽ mở khóa 82.500.000.000 token PUMP vào ngày 12 tháng 7, chiếm khoảng 23,31% tổng nguồn cung đang lưu hành.
PUMP
-3.37%
2026-07-11
Mở khóa Token
Succinct sẽ mở khóa 208,330,000 PROVE token vào ngày 5 tháng 8, chiếm khoảng 104,17% tổng cung đang lưu hành.
PROVE
2026-08-04
sign up guide logosign up guide logo
sign up guide content imgsign up guide content img
Sign Up

Bài viết liên quan

Sự Bùng Nổ của XRP, Một Đánh Giá về 9 Dự Án liên quan đến Hệ Sinh Thái
Người mới bắt đầu

Sự Bùng Nổ của XRP, Một Đánh Giá về 9 Dự Án liên quan đến Hệ Sinh Thái

XRP của Ripple tiếp tục trải qua sự tăng mạnh, với các token từ các dự án trong hệ sinh thái XRP đang có sự phát triển nhanh chóng. Bài viết này nhấn mạnh một số dự án quan trọng trong hệ sinh thái XRP.
2024-12-09 04:20:00
Tăng lên và Triển vọng của Tiền điện tử AI Thế hệ tiếp theo
Trung cấp

Tăng lên và Triển vọng của Tiền điện tử AI Thế hệ tiếp theo

Các AI Agents đang sẵn sàng mang đến sự đổi mới và tăng trưởng cho không gian tiền điện tử. Bài viết này khám phá các xu hướng quan trọng, bao gồm sự tiến hóa từ các AI Agents dựa trên văn bản thành đa phương thức, sự tăng lên của các trading agents tự động như AIXBT và tiềm năng của swarm intelligence. Nó cũng xem xét các mô hình kinh tế thúc đẩy việc thu giữ giá trị token và sự phát triển tương lai của các khung Crypto+AI.
2024-12-31 16:23:11
Làm thế nào để tìm thấy memecoins mới trước khi chúng trở nên phổ biến
Trung cấp

Làm thế nào để tìm thấy memecoins mới trước khi chúng trở nên phổ biến

Học cách nhận biết cơ hội đầu tư sớm trước khi một memecoin trở nên phổ biến. Bài viết này bao gồm các chiến lược sử dụng các nền tảng Launchpad, các công cụ theo dõi và xu hướng trên mạng xã hội, đồng thời nhấn mạnh quản lý rủi ro để giúp bạn tiến bộ trong thị trường tiền điện tử.
2025-02-07 04:03:07
Trò chơi dòng chuyện: giao dịch tiếp theo là gì?
Trung cấp

Trò chơi dòng chuyện: giao dịch tiếp theo là gì?

Từ những lời hứa về độc lập tài chính dựa trên trí tuệ nhân tạo đến tính tiện ích thực tế của DeFAI, không gian phản ánh sự chuyển đổi rộng lớn của thị trường từ sự hoang tưởng sang tính khả dụng.
2025-02-08 06:20:50
Pump.fun ra mắt AMM Pool riêng của mình? Rõ ràng ý đồ lấy lời Raydium
Người mới bắt đầu

Pump.fun ra mắt AMM Pool riêng của mình? Rõ ràng ý đồ lấy lời Raydium

Raydium đóng vai trò then chốt như là "trung tâm thanh khoản" của Solana. Tuy nhiên, bước đi mới nhất của Pump.fun đang làm đảo lộn tình hình: không chỉ cung cấp lưu lượng giao dịch cho Raydium mà hiện đang cố gắng kiểm soát thanh khoản chính mình.
2025-02-26 09:33:29
Mọi ETF Crypto của Mỹ mà bạn cần biết vào năm 2025
Trung cấp

Mọi ETF Crypto của Mỹ mà bạn cần biết vào năm 2025

Vào năm 2025, các quỹ ETF tiền điện tử đã mở rộng sang tài sản thay thế như Solana, XRP và DOGE, với các công ty quản lý tài sản chính thống đua nhau nộp đơn. Bài viết này cung cấp một phân tích chi tiết về tình hình hiện tại của các đơn đăng ký ETF, khả năng được phê duyệt và tác động tiềm năng của chúng, chỉ ra con đường chính cho các tài sản tiền điện tử tích hợp vào hệ thống tài chính truyền thống.
2025-04-18 06:49:41