大数据与互联网的关系
大数据的专家维克托·迈尔-舍恩伯互联网移动通信、物联网的发展,数据不断爆炸式的增长,人类进入了大数据时代。作为继云计算,IT产业的又一次新技术、颠覆性革命,无论是芝麻开门般的财富奇迹,还是对人们生活的影响。大数据不断地被提及,更是成为了影响当今世界创新的重要知识点。
什么是大数据?
曾在《大数据时代》一书中提到,以前人们使用的大多是抽样数据,而大数据则包含了所有数据。另外,大数据关注效率,而不是精准度,关注关联性,而不是因果关系。以前的大多数数据被称为结构化数据,比如“你几岁?我15岁”,而“我今天说了什么话?我今天吃了什么东西?”这些数据则被称为非结构化数据,主要指一些描述性的数据。随着互联网的发展,这些非结构化数据被收集并存放起来,对于这些数据加以分析利用,便构成了大数据的应用,这也是大数据不同于之前数据的最为重要的一点。
大数据到底有多大?
大数据所涉及的数据量非常大,而且正变得越来越大。自人类有文字记载到2012年为止,古今中外所有人类出版的资料,共计数据200PB。而在互联网发展的短短十几年里,数据量就已经步入了EB、ZB时代。以1号店为例,1号店一年产生的数据约为20个PB。这20个PB只是有过数据储存的这部分,不是1号店产生的全部数据。这些数据相当于有人类文字记载到2012年止所有数据的十分之一,而且,这只是1号店一家公司所产生的数据量。数据量正以惊人的速度爆炸并发展,是随着互联网的应用而产生的爆发式增长。
备注:单位从小到大排序:Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB 进率1024
1Byte = 8 Bit
1KB = 1,024 Bytes
1MB = 1,024 B = 1,048,576 Bytes
1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes
1TB=2的40次方Byte=1099511627776 Byte
1PB=2的50次方Byte=1125899906842624Byte
1EB=2的60次方Byte= 1152921504606846976 Byte
1ZB=2的70次方Byte= 1180591620717411303424 Byte
1YB=2的80次方Byte= 1208925819614629174706176 Byte
1DB=2的90次方Byte= 1237940039285380274899124224 Byte
1NB=2的100次方Byte= 1267650600228229401496703205376 Byte
这么多数据从哪儿来?
以一位浏览了1号店网页的顾客为例,他从哪里来?在1号店网站浏览了哪些页面?看过哪些商品?涉及的品类有多少?是否使用了搜索功能?还是只是随便浏览?这些看似不经意的数据都会储存在1号店的大数据平台。为什么数据越来越多?就是因为人们无时无刻不产生数据。比如上海科普大讲坛邀请1号店CTO韩军在1点45分进行了关于大数据的演讲,这个时间点便产生了一些数据。还有大家无时无刻不使用的移动设备,也会不断产生数据。每个人都在不断地产生各式各样的数据,这就使得数据越来越多,无所不在。
大数据是如何应用的?
以一个怀孕的女性为例,她的消费行为可能会在怀孕的前四周或者前五周突然发生变化,比如在她网购时,原来喜欢买甜食,现在则偏好酸的食物,这些信息就会被 纳入企业数据库,并被记录下来。随后,公司会为这位孕妇推送与怀孕相关的产品优惠券,这就是典型的大数据应用。亚马逊有一个非常神奇的大数据应用,叫做 “未购买先发货”。亚马逊作为全球最大的电子商务网站,对于大数据有着许多应用。比如,亚马逊会根据消费者在网站上的消费行为,预测顾客下个礼拜的需求, 如牙膏、薯片、大米、酱油等。亚马逊会自动生成订单,将这些商品送到顾客家中。顾客作为消费者主体,在根本没有意识到自己需要这些东西的时候,商品就已经 送到手中。以实际应用效果来看,绝大多数消费者认为“未购买先发货”的预测较为准确,会愉快地签收订单。
大数据下的个人隐私?
现代人使用智能手机时,商家会将信息存在云端备份,这些数据的存在,不可避免地会引发隐私问题。美国曾有预测学家说过,在未来十年或二十年,现在人们认为 非常重要的隐私,会慢慢转变为每个人都乐于将数据共享,这也将成为社会发展的一个过程。大数据下的信息处理,可以将人们在图书馆借书的信息和网上购物的信 息产生交集,比如在人们在图书馆借阅了健康类书籍后,在网上买披萨时,会为顾客推荐更健康的披萨。当数据产生关联后,也就产生了价值。在大数据下,隐私与 便利永远存在矛盾,可谓没有绝对的隐私。在这个数据化生存的时代,数据跟隐私是相对的。隐私和便利之间,也在慢慢寻求平衡。
电商对于大数据有着怎样的应用?
对电商来说卖什么产品?以什么价格销售?如何防止价格设置出错?应该卖什么商品?什么商品好卖?什么商品不好卖?都需要运用大数据。定价对于电商领域的竞争而言非常重要。比如,在大数据的应用下,1号店设计了名为“智能价格”的应用。每天会自动在网站上搜索大量的产品价格,然后根据搜取的价格信息,对价格进行自动调整,以保证1号店的产品价格处于可竞争性的地位。在各大电商齐打价格战的“双十一”,1号 店的价格系统对于部分热销商品,每隔一两分钟就会对其他电商的商品价格进行扫描比对,实时推动价格变动。在电商的运营中,销量、价格和库存有着密不可分的 关系,库存又和备货有着重要关系,这些都需要非常强大的销售预测系统进行支撑。还有许多诸如此类的大数据应用不胜枚举,大数据的应用对于电商打价格战,提 高毛利,更好地服务消费者都有着巨大帮助。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
大数据企业应用格局:三足鼎立却又共陷迷城
随着信息技术的发展,“大数据”一词已经变得炙手可热。任何人群、任何行业似乎都开始步入大数据的行列,各行各业都视“大数据”为自身发展的一个新的契机甚至是转折点,众人面对大数据的海洋纷纷一拥而上投入大数据的怀抱。然而,在互联网时代,又有多少企业是真正了解和正确使用大数据?更多的国内企业似身处迷城的人们,貌似看到了走出困境的希望,却一直在数据的迷城中转圈,直至迷失自己。 以“大数据”为噱头,盲目豪赌 王健林宣布豪赌50亿元,指望借助大数据将万达电商打造成新的帝国;美的空调扬言要斥资150亿元,基于云、大数据和物联网技术打造智能家居业务;康师傅也希望耗费巨资构建大数据平台实现集团食品业务的升级。无论是传统大型企业还是新兴的中小企业,都纷纷竖起了“大数据”的大旗“揭竿而起”。然而,这一系列喧嚣的背后,却是大数据应用的落后。除了互联网公司出于自身特质具有立足于数据价值运营的思维和技术,更多的中国传统企业在数据的运用方面可谓一塌糊涂。恰如国外的《经济学人》声称:中国的企业目前远没有实现网络化和数字化,更没有参与云计算和大数据分析等趋势。国内的这些打着“大数据”旗号的企业,看似是在寻找“新的春天”...
- 下一篇
BlueMix与商业智能BI(开篇:前言)
前言 智慧医疗英文简称WIT120,是最近兴起的专有医疗名词,通过打造健康档案区域医疗信息平台,利用最先进的物联网技术,实现患者与医务人员、医疗机构、医疗设备之间的互动,逐步达到信息化。 在这个过程中,医疗设备所产生的数据将会是非常庞大的,我们常见的包括血压、血氧数据,体温、流量、鼾声、心率、通气、BMP信息等,除此以外,某些设备自身的信息量也非常重要,包括压力、开关机时间、延时时间、断电报警、模式、设备ID等,这些信息通过物联网方式(当然也有其他方式)传输到数据中心,经由大数据分析平台最终形成统一的分析报告,提供医生、专家乃至病患者进行分析和查看。 本次博文将尝试使用Bluemix作为整体平台,在平台上部署信息采集应用、数据库应用以及分析应用,最终达到模拟分析的目的。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS8安装Docker,最新的服务器搭配容器使用
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2全家桶,快速入门学习开发网站教程
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Windows10,CentOS7,CentOS8安装Nodejs环境