X算法解密:什么让你的帖子在X(Twitter)上获得推荐?
2026年5月15日,马斯克和xAI以Apache 2.0许可证开源了X(原Twitter)的完整推荐算法代码。这是社交媒体算法历史上最透明的举动——首次,任何人都可以阅读决定你"推荐"信息流中显示什么的确切代码。
为什么这很重要:社交媒体历史上最透明的平台
多年来,社交媒体算法一直是黑盒。Meta、TikTok、YouTube——所有平台都保密它们的推荐系统。你可以猜测、理论化、逆向工程,但你永远无法知道。
X改变了这一切。
2026年5月15日,xAI将X推荐算法的完整源代码推送到了GitHub。不是摘要,不是描述方法的博文——是实际的生产代码,用Rust和Python编写,采用Apache 2.0许可证。
这是一个分水岭时刻。研究人员、开发者和好奇的用户现在可以阅读决定数十亿信息流中显示哪些帖子的每一行代码。不再猜测。不再阴谋论。只有代码。
我们花了数小时分析这个仓库。以下是我们的发现——既适合想了解如何获得曝光的普通用户,也适合想理解技术架构的技术读者。
第一部分:算法奖励什么(以及惩罚什么)
✅ 提升曝光度的行为
基于开源代码,以下是X算法积极奖励的行为:
1. 有意义的回复和对话
算法不只是计算点赞数——它高度重视回复链。引发对话(尤其是多轮讨论)的帖子得分显著提高。系统分别追踪reply_score(回复分数)和quoted_reply_score(引用回复分数)。
实用建议:在帖子结尾提出问题或引人深思的观点。鼓励人们回复,而不只是点赞。
2. 视频观看时长(VQV — 视频质量观看)
不只是"播放量"——算法特别追踪观众是否观看了超过最小时长阈值的视频。一个60秒的视频,如果人们只看3秒,得分远低于观看45秒的情况。
实用建议:在前3秒抓住观众。保持视频全程有趣。
3. 分享(尤其是私信和复制链接)
分享的权重高于点赞。代码分别追踪三种分享类型:
- 直接转发
- 通过私信分享
- 通过复制链接分享
实用建议:创作值得私下分享的内容——见解、幽默或有用的信息,人们想发给朋友的那种。
4. 停留时长(阅读时间)
算法测量用户在你的帖子上花费的时间。停留时间越长 = 分数越高。系统追踪dwell_score(停留分数)和cont_dwell_time_weight(持续停留权重)。
实用建议:写更长、更有实质内容的系列帖子。多图帖子自然增加停留时间。
5. 因帖子产生的关注
如果有人在阅读你的帖子后关注了你,这是一个强烈的正面信号:follow_author_score。算法将其解读为"这个内容太好了,读者想要更多来自该作者的内容。"
实用建议:持续提供价值。让你的主页值得被关注。
6. 引用转发
引用转发(quote_score)与简单转发分别加权,表明算法重视为他人的内容添加自己的观点。
7. 你关注的人发布的帖子
Thunder模块专门从你的社交图谱中检索帖子。你关注账号的内容会获得自然提升。
❌ 降低曝光度的行为
算法有明确的负面信号,会严重降低你的可见度:
1. "不感兴趣"点击
当用户对你的帖子点击"不感兴趣"(not_interested_score)时,算法会学习减少向你展示类似内容。如果很多人这样做,你的曝光度会大幅下降。
2. 拉黑和静音
block_author_score和mute_author_score是强烈的负面信号。被拉黑或静音告诉算法你的内容是不受欢迎的。
3. 举报
report_score是最强的负面信号。被举报的内容会被降权,甚至可能被可见性过滤器完全移除。
4. 低视频完成率
如果人们开始观看你的视频但很快划走,VQV分数会下降。算法将其解读为低质量内容。
5. 同一作者的重复内容
作者多样性评分器使用指数衰减公式来防止信息茧房。如果你已经看到同一作者的三个帖子,第四个帖子的得分会显著降低。
实用建议:不要刷屏。间隔发布帖子并多样化你的内容。
6. 触发可见性过滤器的内容
系统有17+个过滤器可以完全移除内容:
- 已删除帖子
- 垃圾信息检测
- 暴力/血腥内容
- 敏感媒体标记
- 新账号的频率限制
第二部分:技术深度综述
架构概览
X推荐系统采用Rust + Python混合架构,包含五大核心模块:
1. Home Mixer(Rust — 编排层)
中央编排器,协调整个流水线。提供两个gRPC服务:
ForYouFeedServer:返回最终排序的信息流ScoredPostsServer:返回评分后的帖子用于A/B测试
2. Thunder(Rust — 社交图谱检索)
从你的社交关系(你关注的人)中检索帖子。使用Kafka进行实时更新,确保你在几秒内看到关注账号的新帖子。
3. Phoenix(Python/JAX + Haiku — 兴趣发现)
基于兴趣的发现引擎,采用双塔架构:
- 检索塔:从数百万候选中找到可能感兴趣的帖子
- 评分塔:使用Grok衍生的Transformer模型预测互动概率
这是关键创新:用端到端的Transformer模型替代手工特征工程。
4. Grox(Python — 多模态嵌入)
为文本、图片和视频生成1024维嵌入向量,统一在同一个空间中。这使得系统能够理解和推荐所有媒体类型的内容。
5. Candidate Pipeline(Rust — Trait-based框架)
灵活的流水线框架,使用Rust trait,支持11+个候选源:
- 关注账号
- 热门话题
- 探索推荐
- 广告候选
- 推荐账号
评分算法:19个信号
Phoenix评分器为每个帖子预测19个互动概率:
正面信号(15个):
- 点赞、回复、引用回复、转发
- 视频质量观看(VQV)
- 分享、私信分享、复制链接分享
- 停留分数、持续停留时间
- 引用转发、引用点击
- 关注作者
负面信号(4个):
- 不感兴趣
- 拉黑作者
- 静音作者
- 举报
每个信号乘以可配置的权重,求和后归一化。所有权重都是外部参数,允许X在不修改代码的情况下调整算法。
作者多样性:防止信息茧房
一个关键设计特性:作者多样性评分器对同一作者的帖子应用指数衰减。如果你已经看到作者A的N个帖子,第(N+1)个帖子的得分会乘以衰减因子。
这防止信息流被少数活跃账号主导,确保多样化的观点。
为什么这个架构令人印象深刻
- Rust保证性能:延迟关键路径(检索、过滤、混合)用Rust编写
- Python用于机器学习:评分模型使用JAX/Haiku进行GPU加速推理
- 候选隔离:不同候选源独立评分,确保公平性
- 可配置权重:所有信号权重为外部参数,支持快速实验
- 可解释性:19信号加权和是透明且可解释的
完整技术报告
如需包含架构图、代码片段和详细模块分解的完整技术分析,请参阅我们的X算法深度分析报告。
最后的话
X算法的开源是一个里程碑事件。它提高了整个社交媒体行业的透明度标准。当算法公开时,平台需要负责。当代码可读时,信任才能建立。
你会用这些知识构建什么?
本分析由Qiu博士和QevosAgent通过结对研究完成。我们克隆了仓库,阅读了每个模块,并追踪了从候选生成到最终排序的数据流。
报告日期:2026年5月16日 来源:github.com/xai-org/x-algorithm