兑现承诺,马斯克宣布 Twitter 算法正式开源
当地时间 3 月 31 日,马斯克终于履行诺言正式宣布了 Twitter (推特) 算法的开源。该公司在 GitHub 上发布了两个存储库 (main repo、ml repo),其中涵盖了推荐算法在内的许多推特源代码,包括用来控制用户在 For You 时间线上看到的推文的机制。并发布了一篇博客分享了有关推特算法的更多详细信息。
“今天标志着 Twitter 进入了一个透明的新时代。我们正在与全世界共享为我们的平台提供动力的大部分源代码。”
马斯克表示,此次发布的是大部分推荐算法,其余的算法也将陆续开放;希望“独立的第三方能够以合理的准确性确定 Twitter 可能向用户展示的内容”。不过他也警告称,随着开源发布可能会暴露出一些令人尴尬的问题,“但我们会迅速解决”。此外他还补充称,推特将根据用户的建议,每 24 至 48 小时更新其推荐算法。
此次发布不包括驱动推特广告推荐的代码。推特方面表示,其目标是尽可能提高透明度,它排除了会损害用户安全或隐私的代码,以及会破坏在该平台上防止儿童性侵内容努力的细节。
在有关算法开源发布的 Space 讨论中,马斯克称此次的开源是想让推特向著名的开源项目 Linux 项目看齐,“即使你不同意某些东西,至少你会知道它为什么在那里,而且你没有被秘密操纵......在这里,我们渴望的类比是开源操作系统上的一个伟大示例 Linux......理论上,人们可以为 Linux 发现许多漏洞。在现实中,所发生的是社区识别和修复这些漏洞......”
推特在博客中详细介绍了算法在确定 For You 时间线所显示的推文时,会具体参考哪些内容并如何对其进行排名和过滤。根据介绍,其推荐管线由三个主要阶段组成:
- 在称为 candidate sourcing 的过程中从不同的推荐来源获取最佳推文。
- 使用机器学习模型对每条推文进行排名。
- 应用启发式和过滤器,例如过滤掉来自你已阻止的用户的推文、NSFW 内容和你已经看过的推文。
负责构建和提供 For You 时间线的服务称为 Home Mixer。Home Mixer 建立在 Product Mixer 之上,Product Mixer 是推特的自定义 Scala 框架,有助于构建内容提要。该服务充当连接不同候选源、评分函数、启发式方法和过滤器的软件主干。
下图说明了用于构建时间线的主要组件:
文中对过程中的具体步骤做出了进一步的解释。例如首先会从数亿推文中提取最好的大约 1500 条推文,目标是让 For You 时间线中约 50% 的推文来自已关注的用户(即人际网络内),50% 的推文来自“尚未关注的(人际网络外)账户”。排名“是通过一个约 4800 万参数的神经网络实现的,该神经网络不断接受推文交互训练以优化积极参与(例如点赞、转发和回复)”。
当然,推特用户看不到完整的 1500 条推文。它们会根据内容限制和模型考虑的其他标准和因素进行过滤,例如推文是否有“负面反馈”,以及它们是否主要来自同一 Twitter 用户,或者来自被屏蔽的用户。
值得一提的是,Gizmodo 指出,推特向用户推送的 VIP 名单似乎没有被公开。Platformer 也曾报道称,推特有一份值得关注的用户轮换名单,其中包括 YouTuber Mr. Beast 和 Daily Wire 创始人 Ben Shapiro,它通过看似随意地增加这些“power user”的可见性来监控推荐算法的变化.
TechCrunch 指出,有更多证据表明算法可能会根据来源不同地对待推文。研究人员 Jane Manchun Wong 指出,推特的算法专门标记了推文作者是否是 Elon Musk,还有其他标签表明作者是否是“power user”,以及他们是共和党人还是民主党人。
对此,一位 Twitter 工程师在当天的 Spaces 会议上解释称,这些标签仅用于衡量指标。但是马斯克则表明,他在今天之前并不知道这些标签的存在,并认为它们不应该存在:“绝对不应该将人们分为共和党人和民主党人,这没有任何意义。”
相关阅读:

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
是时候开源 SublimeText 了吗?
一名开发者在使用编辑器 Sublime Text 后,发现它被 VS Code 超越主要是因为后者具有开源和免费的性质。因此他觉得 Sublime Text 也应该选择开源,以和 VS Code 进行更好的竞争。 他认为,VS Code 的开源模式是 VS Code 比 SublimeText 更受欢迎的主要原因。 VS Code 的开发得到了社区的贡献,与 Sublime Text 相比,VS Code 有更频繁的更新。不仅如此,开源性质还帮助 VS Code 形成了一个丰富的扩展市场,从这方面来看已经超越了 Sublime Text。正是有了丰富的扩展市场,在安装一些扩展后,开发者可以将 VS Code 从一个简单的文本编辑器转换为一个成熟的 IDE。 因此,这名开发者认为开源 SublimeText 是它与 VS Code 竞争的唯一途径。开发者可以获得开源社区的支持,Sublime 团队将能够以比目前更快的速度推送定期更新和新改进。 他还表示 Sublime Text 开源之后也可以继续采用收费模式。SublimeText 团队可以免费提供 Sublime Text 的核心版本...
- 下一篇
Yesql v1.1.5 发布了,从 SQL 文件自动生成 Go 结构体代码,实现查询语句与代码分离
Yesql 解析一个 SQL 文件,提取出查询语句,自动生成对应的 Go 结构体,实现查询语句与代码分离,方便编写数据库查询逻辑。 安装 go get github.com/alimy/yesql 使用 创建sql文件 -- sql file yesql.sql -- name: newest_tags@topic -- get newest tag information SELECT t.id id, t.user_id user_id, t.tag tag, t.quote_num quote_num, u.id, u.nickname, u.username, u.status, u.avatar, u.is_admin FROM @tag t JOIN @user u ON t.user_id = u.id WHERE t.is_del = 0 AND t.quote_num > 0 ORDER BY t.id DESC LIMIT ? OFFSET ?; -- name: hot_tags@topic -- get get ...
相关文章
文章评论
共有0条评论来说两句吧...