首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/u/4585873/blog/5395812

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Flink 在字节跳动数据流的实践

本文是字节跳动数据平台开发套件团队在1月9日Flink Forward Asia 2021: Flink Forward 峰会上的演讲分享,将着重分享Flink在字节跳动数据流的实践。 字节跳动数据流的业务背景 数据流处理的主要是埋点日志。埋点,也叫Event Tracking,是数据和业务之间的桥梁,是数据分析、推荐、运营的基石。 用户在使用App、小程序、Web等各种线上应用时产生的行为,主要通过埋点的形式进行采集上报,按不同的来源分为客户端埋点、Web端埋点、服务端埋点。 不同来源的埋点都通过数据流的日志采集服务接收到MQ,然后经过一系列的Flink实时ETL对埋点进行数据标准化、数据清洗、实时风控反作弊等处理,最终分发到下游,主要的下游包括ABTest、推荐、行为分析系统、实时数仓、离线数仓。 所以,如果用一句话来概括数据流主要业务,其实就是埋点的收集、清洗、分发。 目前在字节跳动,清洗和分发环节是基于Flink搭建的。 01 - 数据流业务规模 业务数量:在 字节跳动,包括抖音、今日头条、西瓜视频、番茄小说在内的3000多个大大小小的APP和服务都接入了数据流。 数据流峰值流...

飞桨图神经网络PGL助力国民级音乐App,创新迭代千亿级推荐系统

每当夜深人静时,你打开网易云音乐,或听歌刷乐评,或看直播闲聊,享受着以心交心的放松愉悦。在这背后,有一群技术人员苦思冥想地探索着,只为让“云村”越来越懂你。 “不同于一般的聊天文本或图片,音乐本身是跨域数据,具备若干特征,数据维度非常多。而1.8亿月活海量用户的音乐相关数据,带来的计算量、推荐量、参数规模都巨大无比。”网易云音乐机器学习平台技术团队意识到,在这样复杂问题面前,传统机器学习方法渐渐无力招架。 此外,云音乐的直播业务兴起,商业化表现良好,团队的担子更重了,“直播行为与音乐行为差异甚大,这意味着计算量与难度进一步增加。”压力之下,该团队将目光瞄向“图神经网络”,并最终选择应用百度飞桨PGL图神经网络技术来迭代升级云音乐的推荐系统。 推荐系统为何 需要图神经网络? 作为全球知名音乐社区,网易云音乐在繁荣发展的同时,其推荐系统面临三大难题:囊括音乐、歌单、Mlog、直播、云圈、动态等的多域数据;海量用户产出的超大规模数据;超30万音乐人发布歌曲,超28亿用户产生歌单,27%用户交流/生产内容构成的动态数据标签。 传统的机器学习方法需要严格制定一套规范来提取样本,逐项指定样本...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册