什么是视频向量化?本文带你了解基于DeepWalk的视频推荐

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud




作者介绍:Kamil Sindi、Nir Yungster,数据科学家

695e0d9d82dde2eab2ce5afc67089f7cb0049c37

Linkedin:https://www.linkedin.com/in/kamilsindi/zh-cn

fc3754d0f31e932909cbd9a3ea9796512ff6bb46

Linkedin:https://www.linkedin.com/in/nir-yungster-b5367b37/zh-cn


JW Player为视频发布商提供的核心服务之一是可提供更高参与度,观看时间和观看者保留率的重要推荐 对于使用此服务的数千个发布商,这直接转化为增加的广告费用,因此是我们的数据科学团队的算法改进的主要焦点。

由于我们没有收到观众的明确反馈关于他们是否喜欢一段内容或他们喜欢的程度,因此我们的工作依赖于构建隐式信号,并使用它们将用户和媒体相互关联。 通常,我们通过媒体被共同观看(即由同一观看者观看)推断媒体之间的关联。合理的下一步是使用关联规则挖掘(Association Rule Mining)这样的信号转化为“喜欢X也喜欢Y”的人的推荐,或者使用一种协同过滤方法与潜在的代表观众和视频生成个性化推荐

我们可以将参数超出查看行为的参数无缝集成到我们的推荐引擎(如视频和用户元数据)中,并且它提供了一个灵活的平台,可以适应我们服务的广泛发布商。 另外,这种移位还给予我们克服许多推荐算法的缺点的机会:即在近似实时地以在线方式更新表示的同时学习内容之间的非对称关联(例如在情景视频的情况下)的缺点。

为此,由Bryan Perozzi等人开发的称为DeepWalk的算法通过学习图中的节点的向量表示来实现上述目标。 在我们的例子中的节点是单独的视频,们之间通过共边看频率和近因加权。然而,没有限制要求图形是对称的,事实上,我们通过使边缘定向来保持共同观察行为的连续性 换句话说,如果观看者观看媒体A,接着观看媒体B,则我们将从节点A向节点B添加定向权重,而不是相反。

DeepWalk通过以预定数量的步骤从每个节点随机游走来学习这些表。它巧妙地将每次运行作为一个可以送入一个单词表示算法“句子”,如由Mikolov等人开发Word2Vec。

DeepWalk作者有一个很好的Python实现,但不幸的是,它有点过时(2014年),不容易使用在线学习。为了帮助大家,我们开发了一个基于Cython的DeepWalk实现,具有以下功能:

•关联图表示为存储器效率的稀疏矩阵。 使用稀疏矩阵具有两个优点:.我们可以基于时间衰减不断地更新权重。.我们可以使用存储器视图在Cython中进行随机游走,比在Python中的数量级更快。

•该模型可以在线训练,很大程度上得益于GENSIM近期发布的允许在线学习Word2vec。

我们在GitHub上以jwalk开源实现。随着复制deepwalk这个最初的目标,我们最终希望添加其他超级参数来控制如何实现运行Ad2a Grover等人的Node2Vec类似的方式


数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

以上为译文

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《Vectorizing Videos: Leveraging DeepWalk for Video Recommendations》,作者:Kamil Sindi & Nir Yungster,译者:tiamo_zn

文章为简译,更为详细的内容,请查看原文


优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/69263

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
优质分享Android(本站安卓app)

优质分享Android(本站安卓app)

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat7、8、9(Java Web服务器)

Apache Tomcat7、8、9(Java Web服务器)

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse(集成开发环境)

Eclipse(集成开发环境)

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。