试读《大数据日知录:架构与算法》有感
活动地址:http://blog.csdn.net/blogdevteam/article/details/39894901。
其实“大数据”这个词在我的脑海中还没有一个比较确切的定义,几年前我接触了一个名词“海量数据”,它主要是指在数据库中如何处理优化查询海量数据的SQL,或者使用NoSQL(Not only SQL)进行处理,进而进行数据分析、数据挖掘等,从大量无规律的数据中提取出有价值的信息,总之海量数据是与数据库紧密关联的。而这两年兴起了“大数据”浪潮,我认为“海量数据”强调的是数据量的大小,而大数据则不仅仅是数据量的大小,还指数据本身的大小。用《大数据时代》中的4V特点来概括大数据就是:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。
大数据的应用场景
大数据时代已经来临,比如淘宝网的日交易记录、用户浏览商品的记录就是大数据的典型应用场景,根据这些“数据”能够推断出用户购买商品的习惯、用户喜欢什么样的商品,进而更加准确的推荐一些商品给用户,以此提高交易额和交易量。再比如微信的应用,6亿多用户本身就是“大数据”,再加上6亿多用户彼此之间的关系,更是形成了一张巨大的社交网络。如何为这6亿用户提供高质量的实时通信交流、如何提供精确的搜索,都是大数据应用领域需要研究的课题。
pagerank 排名算法
pagerank即搜索引擎是根据什么样的规则、应用什么样的算法来对网页进行关联度筛选的,正好试读部分提供了这部分的内容。以前曾经写过简单的网页爬虫程序,抓取指定网站的页面的新闻等。原理很简单,就是通过请求网站获取返回的html进行分析,用正则筛选出包含关键字的页面的href和标题,然后存入数据库中。而通过试读部分我了解到,pagerank即网页的页面等级基于两个假设:数量假设、质量假设。pagerank算法刚开始赋予每个网页相同的重要性得分,通过迭代递归计算来更新每个页面节点的pagerank得分,直到得分稳定为止。
TAO图数据库
我还关注到了试读当中介绍的Facebook的TAO这个跨数据中心分布式图数据库。它由分布在多个数据中心的数千台服务器构成,为了能够实时响应应用请求,系统架构更重视可用性和低延时,尤其是对读操作做了很多优化。
通过主cache和从cache的二级缓存机制,降低缓存之间的耦合,同时系统也易于扩展。
未来大数据将会在各个领域不断发展和演变,并深刻的影响人类的生活。它涉及到的新技术、新架构非常繁杂,包括分布式、机器学习、数据挖掘等各个技术方向,并作为移动互联网、云计算、物联网等应用领域的核心支撑。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
傅盛读书笔记:下一个Moonshot是什么?
猎豹移动CEO 傅盛 九月底,我有幸在硅谷拜访了苹果前CEO斯卡利。老人如今已经75岁高龄,但看起来仍充满活力。他花了一上午的时间跟我们沟通,非常谦和、平等、坦诚,给我留下了很深的印象。末了,给我们介绍了这本新书《Moonshot!》。目前还没有中文版,我只能用自己蹩脚的英文粗略翻译为《狂潮》:( 书中分析了他对未来商业的理解和预测,很多观点跟猎豹所坚持的理念不谋而合,如用户体验至上等等。 这里我先把其中一小部分的读书笔记分享给大家: 1、下一次浪潮的经济力量将由传统生产制造转变为以消费者为中心。 2、未来最有力的成功模式包含两个元素:一,超出用户想象的体验;二,具有颠覆性的价格。 3、全球经济因亚洲的参与,使得全世界工业品降到以前不可想象的毁灭性价格。 4、历史上任何一次技术推动,本质都是人类不断消除信息差的过程。 5、全球化是一个巨大的未来。它是人类思想和信息整合的一次大变革,是消除世界边界的一个标志性事件。 6、不同领域和行业之间的跨界融合,会产生不可想象的创新。 7、整个世界规则已发生改变——“用户优先”成为第一原则。 8、用户变得越来越聪明——这是移动互联网带来的最大改变。他...
- 下一篇
物联网实验4 alljoyn物联网实验之手机局域网控制设备
AllJoyn开源物联网协议框架,官方描述是一个能够使连接设备之间进行互操作的通用软件框架和系统服务核心集,也是一个跨制造商来创建动态近端网络的软件应用。高通已经将该项目捐赠给了一个名为“AllSeen联盟”的组织,该组织由Linux基金会监督,这是迄今为止推动家庭和工业物联网应用与创新的最广泛的跨行业联盟(更多资料了解www.allseen.org)。 Alljoyn包含core核心部分和service服务框架部分,service是基于core之上的,对于core和service本教程分别有一个实例进行讲解。 3.4.1 core部分实验 硬件清单 (1) Triton(嵌入式设备) (2) Micro USB线 (3) 无线热点(即无线路由器) 软件工具 Arduino IDE 软件 操作步骤 1. 从Android/test_APP路径下拷贝MyAlljoyn.apk安装到手机,并运行; 2. 这时手机界面会有一个进度条提示Finding Led Service.Please wait...,即等待设备端加入链接。 3. 将Alljoyn库并拷贝到Arduino库目录下 4.从A...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Hadoop3单机部署,实现最简伪集群
- CentOS7,CentOS8安装Elasticsearch6.8.6
- 2048小游戏-低调大师作品
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS7设置SWAP分区,小内存服务器的救世主