Yandex 发布全球最大开源音乐推荐数据集 Yambda
Yandex 发布开源音乐推荐数据集 Yambda,包含近 50 亿次匿名用户与流媒体平台 Yandex Music 音轨的互动数据。
Yandex 表示,该数据集来自旗下流媒体音乐服务的 My Wave 推荐系统,所有用户和跟踪数据都使用数字标识符匿名化处理:
- 包含了跨度 10 个月、47.9 亿次匿名用户交互,拥有来自 100 万用户的数据和 939 万个曲目的匿名描述符
- 包括隐式交互(侦听)和显式交互(喜欢、不喜欢和删除)两种反馈类型,并提供 50 亿、5 亿和 5000 万三种数据集大小,
相比现有的 Spotify Million Playlists、Netflix Prize dataset 等数据集,Yambda 在数据规模和时效性方面都更为出色。
Yambda 可作为通用基准用于电子商务、社交网络和短视频平台的推荐系统测试,现已在 Hugging Face 上提供:

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
阶跃星辰 C 端产品“冒泡鸭”停运,业务重心转向终端 Agent
根据《智能涌现》的独家报道,大模型“六小虎”之一的阶跃星辰近半年在其 C 端应用布局上进行了一系列调整: 2024 年 12 月,角色扮演类 Agent 产品「冒泡鸭」停止大范围投入,团队合并至对话产品「跃问」(现更名为「阶跃 AI」),目前仅留部分员工运维。 针对上述信息,阶跃星辰回复称,早期团队基于当时的模型能力进行了一些产品探索;2025 年,随着多模态和推理能力的成熟,团队对产品进行收敛,聚焦 Agent 方向。 公司方面还表示,「跃问」改名为「阶跃 AI」,意味着它从 Chat 类的产品到 Agent 能力的转变。 而据阶跃星辰员工透露,经过一年以来的探索,团队现在在产品布局上学到的深刻一课是:不要在已有头部玩家的领域,参与竞争。 报道指出,2025 年以来,阶跃星辰的战略,也是将资源从短板,集中到长板业务上:重心从 C 端,转移到模型研发和 ToB/G 上。
- 下一篇
腾讯开源跨平台框架 ovCompose,助力全端应用开发
近日,腾讯开源平台正式推出了由腾讯视频团队主导开发的跨平台框架 ovCompose。该框架基于 Compose Multiplatform 生态构建,旨在解决 JetBrains Compose Multiplatform 当前不支持鸿蒙系统的问题,并改善 iOS 平台上布局受限的情况,从而帮助开发者更高效地打造全平台应用。 在腾讯大前端 Oteam 的推动下,腾讯视频团队还推出了 KuiklyBase,涵盖 Kotlin/Native 对鸿蒙系统的适配、组件生态建设、编译流程优化、堆栈还原以及工具链完善等多个方面。这一系列技术方案有效提升了 Kotlin Multiplatform(KMP)开发者在鸿蒙平台上的开发效率。目前,ovCompose 与 KuiklyBase 已在 GitHub 上开源发布。 现阶段,ovCompose 已在腾讯视频的鸿蒙平台全面应用,成为首个实现全跨端覆盖的 App。而 KuiklyBase 的核心能力也已在包括腾讯视频、QQ浏览器、腾讯体育在内的十余款 App 中落地使用。 通过采用一套代码覆盖 Android、iOS 与鸿蒙三大平台的开发模式,业务开...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS关闭SELinux安全模块
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS7,CentOS8安装Elasticsearch6.8.6