程序员的一个爬虫,把估值175亿的马蜂窝给捅了
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》
10月21日,一篇名为《估值175亿的马蜂窝,竟是一座僵尸和水军构成的鬼城?》火了!直指旅游网站马蜂窝大量内容和评论涉嫌造假。
事情是这样的:
某数据团队的几个同学回国参加创业大赛,吃外卖拉了肚子,就在平台写了一段差评,结果反而被污蔑诋毁。
碰巧这个团队在美国学的都是数据分析,一怒之下决定训练一个模型,用于筛选餐饮评论的水军,恰巧马蜂窝成了他们的练手对象,没想到不爬则矣,一爬把马蜂窝给捅了!
这篇文章中表示:“在马蜂窝网站上,发现了7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评,1221万条酒店点评,占到官网声称总点评数的85%。”
文章中还列举了几项抄袭石锤:
还有的抄袭账号自相矛盾,性别忽男忽女,甚至有些直接调用Google翻译接口
马蜂窝回应
22日早上,马蜂窝也随即发布了声明,表示会对涉嫌虚假的信息,进行查处。
另据***消息,针对自媒体报道的马蜂窝数据造假一事,马蜂窝已向北京市朝阳区人民法院提起诉讼,称乎睿数据侵犯名誉权,目前已获立案。
23日,马蜂窝CEO陈罡也针对此事作出回应:马蜂窝在餐饮等点评数据方面存在部分问题,但远没有外界所表述的那么夸大。目前已经重新梳理工作流程,堵住漏洞。
网友怎么说?
目前,这件事已经在各大论坛都议论纷纷:
这件事总算让我见识到程序员的厉害之处了:
‘水军’和‘爬虫’一直都存在于互联网行业,因为流量和数据对于一个互联网企业不可或缺,关于数据纠纷问题在互联网更是屡见不鲜,目前此事真相还未明了,我们暂时不予置评。
但通过这件事情告诉我们,惹谁也别惹程序员!尤其是有正义感又闲的技术宅。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
容器是否取代了虚拟机,这四大理由是否打动你?
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 随着容器的不断发展,你可能经常会听到“容器是否正在取代虚拟机”的问题。许多Docker Enterprise的客户都在虚拟化基础架构上运行其容器,而其他客户则在裸机上运行它们。Docker为IT和运营商提供了运行应用程序的选择:虚拟机,裸机或云端。那么,在当下虚拟机和容器之间关系到底如何? 1. 容器比虚拟机更敏捷 在容器成熟的阶段,容器毫无疑问地为开发人员和运营人员提供了更大的灵活性。容器快速部署,提供不可变的基础架构,并解决古老的“works on my machine”问题。它们还取代了传统的修补过程,使企业能够更快地响应问题并使应用程序更易于维护。 2. 容器适合混合和多云环境 一旦容器化,应用程序就可以部署在任何基础架构上,虚拟机、裸机以及运行不同虚拟机管理程序的各种公有云。许多企业首先在其虚拟化基础架构上运行容器,然后更容易迁移到云而无需更改代码。 3. 将容器与现有IT流程集成 大多数企业都有一个成熟的虚拟化环境,其中包括围绕备份,监控和自动化的工具,以及围绕它构建的人员和流程。通过在虚拟化基础架构上...
- 下一篇
程序员面试时这样介绍自己的项目经验,成功率能达到98.99%
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 假如去面试要问10个问题,那么至少5个问题会根据你所介绍的项目背景来问。 面试时7份靠能力,3份靠技能,而刚开始时的介绍项目又是技能中的重中之重,决定一次面试的成败,那么面试时如果介绍自己的项目呢? 1、在面试前准备项目描述 别害怕,因为面试官什么都不知道,面试官是人,不是神,拿到你的简历的时候,是没法核实你的项目细节的。更何况,你做的项目是以月为单位算的,而面试官最多用30分钟来从你的简历上了解你的项目经验,所以你对项目的熟悉程度要远远超过面试官,所以你一点也不用紧张。 如果你的工作经验比面试官还丰富的话,甚至还可以控制整个面试流程。 既然面试官无法了解你的底细,那么他们怎么来验证你的项目经验和技术?下面总结了一些常用的提问方式。 2、准备项目的各种细节 一般来说,在面试前,大家应当准备项目描述的说辞,自信些,因为这部分你说了算,流利些,因为你经过充分准备后,可以知道你要说些什么。一旦让面试官感觉你都说不上来,那么可信度就很低了。 不少人是拘泥于“项目里做了什么业务,以及代码实现的细节”,这就相当于把后继提问权直...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS8编译安装MySQL8.0.19
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,CentOS8安装Elasticsearch6.8.6