非内积级联学习-低调大师

非内积级联学习

2024-01-30 376

1.首页推荐非内积召回现状

非内积召回源是目前首页推荐最重要的召回源之一。同时非内积相比于向量化召回最终仅将user和item匹配程度表征为embeding内积，非内积召回仅保留item embedding，不构造user显式表征，而是通过一个打分网络计算用户-商品匹配程度，极大的提升了模型精准度的上限，有很大优化空间。

• 模型：采用dot-product attention对用户行为和目标商品进行交互，结合用户画像、原始商品表征生成打分

• 索引与检索：

◦ 索引：离线模型训练完成后，对 item embedding 基于l2距离构造hnsw索引

◦ 检索：线上召回时，实时根据用户请求，在hnsw索引中逐层向下进行beam-search寻找最优结果

▪ 多样性保证：在最后一层检索过程中，进行类目维度多样性剪枝

• 样本

◦ 正样本：首页点击和订单作为正样本，

◦ 负样本：全站点击随机负采样 + 底池均匀负采样

• 特征：用户点击序列、用户画像特征、商品侧特征等

• 学习目标：对正负样本采用sampled softmax loss建模为多分类问题

2.非内积召回优化-级联学习与负样本扩充

非内积召回模型整体有更好的拟合能力，但目前方案中原有训练样本相对较为简单，并且负样本量级较少，阻碍了非内积召回能力的发挥。为提升召回与后续链路一致性，现加入曝光未点击、精排top打分样本进行级联学习。学习目标从原有的点击正样本和随机负采样多分类问题从升级为包含点击、曝光未点击、精排序样本、随机负采样之间的精细化序关系融合；同时扩充负样本量级，提升模型打分精准性。

2.1 相关工作

2.1.1 级联学习相关工作

级联学习旨在引入多种推荐系统链路中样本，采用排序学习方式拟合真实系统分布。京东搜索多目标实践引入订单、点击、曝光样本之间的级联[1]，有效提升大盘效果。list-MLE[2]是广泛应用的学习排序方法，将list内样本给出预测分数，优化预测分数分布和真实排序一致。plist_MLE[3]解决了连续多目标优化问题，使用线性标量化策略将其转换为一个单目标优化问题。

2.1.2 负样本扩充相关工作

batch内负样本扩充主要分为inbatch、crossbatch两种方式。CBNS[4]采用crossbatch，既维护一个队列，存储之前batch的embedding，在每次迭代后，把当前batch的embedding和采样概率存入队列中，并将最早的embedding出队，在计算sampled softmax的时候可以用到batch内的和队列中的负样本。SBC[5]采用inbatch方式，随机采样同一个batchsize中的样本作为负样本。MNS[6]在采样时，使用了混合负采样，应用多种采样生产负样本。

2.2 级联学习与负样本扩充优化点

加入曝光未点击、精排top打分样本进行级联学习；同时扩充负样本量级，提升模型打分精准性。

2.2.1 级联学习

• 样本优化：

◦ 加入曝光未点击样本、精排序样本。点击正样本：曝光未点击=1：4；将每个正样本对应的请求精排序分段采样，分段为精排打分序1-10、11-50、51-100、101-200、201-400、401-900，每个分段采样4条。

• 学习目标优化：

1. 原始学习目标：正样本和负采样多分类问题

2. 升级后学习目标：点击正样本、曝光未点击、精排序样本、随机负采样之间的精细化序关系融合：

1. 点击正样本>曝光未点击>随机负采样

2. 点击正样本>精排序top>精排序middle>精排序tail>随机负采样

新增曝光未点击精细化学习	新增精排序关系精细化学习
参考工作：京东搜索多目标召回模型实践 [1]	参考工作：Position-Aware ListMLE: A Sequential Learning Process for Ranking [3]

2.2.2 负样本扩充

之前的非内积优化实验及参考工作[4,5,6]验证扩充负样本可提升模型精准性。模型训练过程中，随机采样同一个batch中的样本作为负样本[6]可大幅扩充负样本个数。

优化点：负样本个数由百级别扩充至千级别。

3.离线&线上实验

通过离线消融实验验证各优化点对模型打分精准性提升。

3.1 离线实验

实验 vs base	点击hitrate@50	点击hitrate@100	点击hitrate@1200	订单hitrate@50	订单hitrate@100	订单hitrate@1200
消融实验-仅扩充负样本	+18.2%	+27.1%	+9.2%	+9.1%	+13.9%	+1.1%
扩充负样本+只加曝光未点击	+20.3%	+30.0%	+12.5%	+16.8%	+18.6%	+18.2%
扩充负样本+完整级联学习	+65.7%	+56.6%	+12.1%	+67.3%	+54.9%	+26.7%

离线实验结论：

1. 多组消融实验验证了加入曝光未点击、精排样本的完整级联学习引入能带来离线明显受益，尤其在订单维度。

3.2 线上实验

大盘指标：外页uctr +0.02%（0.8），引商点击 +0.53%， uctr含内页 +0.14%，外页ucvr+4.93%（0.00），含内页ucvr+4.17%（0.00），外页推荐用户转化率 +4.64%（0.00），含内页推荐用户转化率 +3.67%（0.00）

召回源指标：非内积召回线上召回源曝光相对+25%，ctr持平、cvr相对+4%

4.总结与思考

1. 精排top打分样本、曝光未点击样本引入+级联学习可大幅提升离线hitrate指标，线上召回源曝光大幅增长（+25%），ctr持平、cvr显著提升。

2. 负样本扩充实验中，随着负样本扩充hitrate增长。后续将继续摸底负采样扩量上限。

5.参考文献

[1] 京东搜索多目标召回模型实践

[2] Listwise approach to learning to rank: theory and algorithm

[3] Position-Aware ListMLE: A Sequential Learning Process for Ranking

[4] Cross-Batch Negative Sampling for Training Two-Tower Recommenders

[5] Sampling-bias-corrected neural modeling for large corpus item recommendations

[6] Mixed Negative Sampling for Learning Two-tower Neural Networks in Recommendations

作者：京东零售张树旺

来源：京东云开发者社区转载请注明来源

微信关注我们

原文链接：https://my.oschina.net/u/4090830/blog/10984684

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Databend 开源周报第 130 期

Databend 是一款现代云数仓。专为弹性和高效设计，为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务：https://app.databend.cn 。 What's On In Databend 探索 Databend 本周新进展，遇到更贴近你心意的 Databend 。支持 CREATE OR REPLACE DATABASE CREATE OR REPLACE DATABASE 是一个语法糖，可以合并原本的： DROP DATABASE IF EXISTS ... CREATE DATABASE ... 对 CREATE OR REPLACE TABLE 的支持也在积极推进中。如果您想了解更多信息，欢迎联系 Databend 团队，或查看下面列出的资源。 PR #14449 | feat: add create or replace database support Issue #14229 | tracking: CREATE OR REPLACE Code Corner 一起来探索 Databend 和周边生态中的代码片段或项目。使用 SQL 预测鸢尾花分类...

2024-01-29

396

本篇文章，主要介绍应用如何正确使用日志系统，帮助用户从依赖、输出、清理、问题排查、报警等各方面全面掌握。可观测性可观察性不单是一套理论框架，而且并不强制具体的技术规格。其核心在于鼓励团队内化可观察性的理念，并确保由研发人员构建的应用程序具备可观察性。在学术领域中，尽管“可观测性”这一术语是近年来从控制理论中引进的新词，但实际上，它在计算机科学领域已有深厚的实践基础。学者们通常会把可观测性细化为三个更具体的研究方向：事件日志、链路追踪和聚合度量。这三个领域虽然各有侧重点，但并非完全孤立，它们之间存在着天然的交集与互补性。日志(Logging），展现的是应用运行而产生的事件或者程序在执行的过程中间产生的一些日志，可以详细解释系统的运行状态，但是存储和查询需要消耗大量的资源。所以往往使用过滤器减少数据量。度量(Metrics)，是一种聚合数值，存储空间很小，可以观察系统的状态和趋势，但对于问题定位缺乏细节展示。这个时候使用等高线指标等多维数据结构来增强对于细节的表现力。例如统计一个服务的 TBS 的正确率、成功率、流量等，这是常见的针对单个指标或者某一个数据库的。追踪(Tracin...

2024-01-29

353

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

非内积级联学习

1.首页推荐非内积召回现状