屠龙少年变成恶龙?聊聊推荐系统与信息茧房
大家好,今天和大家聊聊推荐系统中的信息茧房。
说到信息茧房大家都很有危机感,之前在知乎当中还有人提问,如何对抗推荐系统,避免陷入信息茧房当中。那么究竟什么是信息茧房,它又是怎么出现的呢?我们的未来真的会被推荐系统操控接触不到外界的新事物吗?
在回答这些问题之前,我们先来信息茧房出现的原因。
马太效应与信息茧房
圣经马太福音当中有一句著名的话“凡有的还要加倍给他叫他多余,没有的,连他所有的也要夺回来”。类似的道理,在道德经当中也有出现。道德经当中说,“天之道损有余而补不足,人之道则不然,损不足而奉有余。”
这里面的道理虽然复杂,但是直观上并不难理解。越是富有的人拥有的资源越多,那么赚钱的能力也就越强,自然就会变得更加富有。越是贫穷的,赚钱的手段越少,那么自然越贫穷。在推荐系统领域也是一样的,越多人浏览的商品说明人气高,人气高的商品往往销量、评价以及各方面数据也就越好。这些指标越好的商品越容易被推荐系统选中,从而获得更多的曝光,从而陷入一个正向循环。而那些人气低的商品则对应地陷入负向循环,人气越来越低,直到最后销声匿迹。
这样会导致一个什么后果呢?会导致推荐系统运转到后来,推荐出来的都是高人气的商品,我们翻来翻去看到的商品或者是内容都是类似的。
举个简单的例子,有一段时间里B站推送了很多小姐姐,点开看基本都是一个美女封面。道理也很简单,美女养眼,吸引人,那么推来推去都是这类的视频。
这个问题并不是没有解决方案,比较好的解决方案就是个性化,也就是所谓的千人千面。说白了,就是把我们的喜好考虑进去,根据我们之前的行为推送和我们喜好比较相关的内容。现在几乎主流的推荐系统都是这么做的,淘宝、抖音莫不如此。比如我现在打开B站基本上都能说得出来每一个视频的推荐原因。
个性化的效果非常好,有了个性化之后,推荐内容的点击率大大提升,要比纯内容的点击率高上接近一倍。你想,对于公司而言,只需要招一批人,加上采购一批机器,就可以让整个公司的订单量接近翻番,这么好的事情,是不会有人不干的。
个性化虽然效果好,但是也不是全无问题,它最大的问题就是所谓的信息茧房。信息茧房的意思和马太效应差不多,意思是个性化到最后,我们看到的都是我们感兴趣的内容。我们登陆互联网,并没有拓展我们的眼界,恰恰相反,反而阻碍了我们了解更大的世界。就好像被一个看不见摸不着的信息茧包裹在了其中,不知不觉成了井底之蛙。
奇怪的悖论
上面这一大段的推论都没有任何问题,也非常符合我们的认知以及实际系统的运转规律。但是这其中有一个点非常非常奇怪,奇怪得好似一个悖论。
这个点就是推荐系统的使命与现状,你们知道为什么要有推荐系统吗?按照我们现在的理解,好像推荐系统就是为了构造信息茧房,通过大数据限制人们思想而产生的。其实恰恰相反,推荐系统的产生的使命其实就是为了反对信息茧房,反对信息闭塞。
这里面的道理也非常容易想明白,因为用户的时间是有限的,而平台的内容对于每一个用户来说几乎是无限的。比如现在的淘宝可能有上亿甚至数十亿商品,对于单个的用户来说,甚至可以说是他一辈子什么也不干一直浏览商品也不可能把这些商品全部都浏览一遍。对于用户来说,他们能够看到的商品永远只是非常小的一部分。
我们再把眼光放大一点,不仅是对于单个用户如此,对于全体用户也是一样的。整个平台用户有过浏览的商品其实也只是一小部分,有统计说这个数字可能在10%以下。这种情况的一个后果是会导致老的商品由于先发优势垄断市场,而后发的商品没有一点点机会。就好像古时候闭塞的社会一样,平民的孩子永远不可能成为精英,这是一样的道理。
正是为了解决这个问题,人们才造出了推荐系统。希望能够有一个系统能够高效地找出一些优质的但是冷门的商品,给予这样的商品机会,让喜欢它的用户能够看到它,这样可以尽可能地减少新老商品之间的流量差异。可以理解成把头部商品的流量切出一部分来给到其他优质的商品,让更多的商品得到曝光。
我们做自媒体的人常常会比较各个平台发展的难度,现在公认B站和头条都是新手比较友好的平台。这里的新手友好,其实就体现在平台对于刚起步的作者的流量扶持。一个马太效应越严重的平台,从零做起的难度就越大。而反之,说明推荐系统的效果越好,即使是数据不那么出色的内容也可以找到合适的用户推荐。
想到这里就会发现,其实这也不是什么悖论。推荐系统的使命是反抗垄断,但最终还是会产生马太效应。这并非推荐系统不给力,而是马太效应实在是太过强大。推荐系统并不足以抵消它的影响,所能做的就只有从海量的内容当中,尽可能筛选出优质的内容给予更多的机会。
对抗信息茧房
对于我们用户而言,我们上网很多时候是为了获取更多的信息,看到我们之前没看到的世界,而不是仅仅看那些我们喜欢看的。目前的状况就是各个平台的个性化做得越来越好,我们以后都会处于这样的信息茧房当中,这种情况下,我们应该怎么办呢?
很遗憾的是,关于这个问题个人和行业都没有什么很好的办法。
对于行业来说,目前还没有比个性化更好的推荐方案。因为对于大多数平台来说内容是否优质都是相对的,这就导致了几乎不论什么样的内容都有一个特定的小众的适应人群。而公司和平台追求点击率或者是业绩,那么自然不会采用那些效果不好的推荐方案。
以个人来说,我们明明喜欢看各种动漫以及各样的小姐姐,那么推荐系统投其所好给我们推荐的自然也是相关的内容。总不可能为了打破所谓的信息茧房我们非逼着自己去看我们不爱看的东西吧?即使我们真的这样做了,所谓地欺骗了系统,之后给我们推荐其他的内容了,难道就不是另外的一种信息茧房吗?而且还是我们不爱看的茧房。
从我个人角度出发,我觉得这不是一个大问题。原因有两点,第一点是推荐系统其实并不只会投其所好,我们也都知道即使我们爱看小姐姐,如果看到满屏的小姐姐还是会心生抵触的。所以现在的推荐系统除了会考虑点击率之外,推荐内容的一个多样性和丰富性也是一个重要指标。另外一点是,对于我们个人而言,互联网只是我们获取信息的工具,并不承担拓展我们世界观和眼界的重任。我们想要做到这点,需要我们自己去努力成为一个眼界开阔,爱好广泛的人。一个思想封闭的人,即使给他推送很多有内涵有价值的内容,他可能还是只会点开自己关注的那一亩三分地。
现在有一些地方过度强调“信息茧房”这个概念,把这些平台描述成了一个黑暗的操纵人心者,这些其实都是行外人的过度臆想和猜测。平台和公司追求的是业绩和利益,并没有操纵人心这样无聊且不赚钱的黑暗诉求,所以这样的观点是站不住脚的,大家也不必担心,一笑置之便是。
本文转载自微信公众号「TechFlow」,可以通过以下二维码关注。转载本文请联系TechFlow公众号。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
大数据时代,一次对个人信息保护的积极回应
个人信息保护法是我国立法对大数据时代个人信息、数据安全等问题所作的积极回应。该法通过后,将在数据安全领域具有基础性的法律地位,必将加快我国数据监管与保障法律体系的建设进程。 人类社会已经从工业社会转向信息社会,作为社会发展的基本资源,信息的创新、共享、传播和创造性使用,将大幅度地提高知识生产率和生产力水平。在互联网经济时代,数据是新的生产要素,是基础性资源和战略性资源,也是重要生产力。同时,在现代信息社会,对个人信息享有独立利益的主体日益多元。信息业者在个人信息的收集与处理中可获得巨大的商业利益,而国家同时也是个人信息最大的收集、处理、储存和利用者。因此,在个人信息保护与利用方面,需要平衡个人信息权利、信息业者对个人信息利用的利益、国家管理以及公共利益等之间的关系,构建政府、信息处理者以及信息主体之间共生共存的关系。 个人信息保护法草案共计八章七十条,构建了权责明确、保护有效、利用规范的制度规则;同时,草案也注重促进依法合理有效利用个人信息数据,推动数字经济发展行稳致远,在保护个人信息方面具有诸多亮点,具体而言: 丰富完善了个人对其信息所享有的权利 草案规定:“个人信息是以电子或者其他...
- 下一篇
IBM混合云平台:不确定环境中的“确定”因素
2020年,对任何企业都是极富挑战性的一年。从年初开始逐渐蔓延的新冠疫情,在过去的整整半年时间里,持续对企业的生存提出巨大的挑战。 随着时间线的推演,由疫情引发的各种不确定因素,造成了全球经济发展的放缓,企业不得不面对业务连续性被打断,业务从缓增长到步入衰退期的困境,当不确定性这种“非常态”,慢慢变成一种“新常态”,如何在危机中创造机会,并重归增长通道就成为此刻企业最关心的课题。 北大学者陈春花在《危机自救:企业逆境生存之道》当中写道,企业需要通过快速应变的措施实现自救,通过强化自身的“免疫系统”以持续应对变化,来获得长久发展。而首先要做到的是极速调整认知,先做到接受危机和挑战,并以最大的定力去接纳变化,与变化共生,并由此走上“变革之路”。 如 IBM 副总裁、大中华区云计算与认知软件事业部总经理缪可延所说,“疫情刚开始的时候企业关注的是业务连续性,经济放缓以后则开始考虑成本优化,而到了衰退期,企业就必须要确保业务的弹性能够支撑业务的回暖。” IBM 副总裁、大中华区云计算与认知软件事业部总经理缪可延 很明显,从建立对危机的认知,到适应变化,再到系统性的对未来业务反转的思考,这一系列的...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Hadoop3单机部署,实现最简伪集群
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS关闭SELinux安全模块
- CentOS7设置SWAP分区,小内存服务器的救世主
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- 设置Eclipse缩进为4个空格,增强代码规范
- Docker快速安装Oracle11G,搭建oracle11g学习环境