首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/207869

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hadoop Streaming

本文讲的是 Hadoop Streaming,【IT168 资讯】Hadoop streaming是Hadoop的一个工具, 它帮助用户创建和运行一类特殊的map/reduce作业, 这些特殊的map/reduce作业是由一些可执行文件或脚本文件充当mapper或者reducer。例如: $HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hadoop-streaming.jar \ -input myInputDirs \ -output myOutputDir \ -mapper /bin/cat \ -reducer /bin/wc Streaming工作原理 在上面的例子里,mapper和reducer都是可执行文件,它们从标准输入读入数据(一行一行读),并把计算结果发给标准输出。Streaming工具会创建一个Map/Reduce作业,并把它发送给合适的集群,同时监视这个作业的整个执行过程。 如果一个可执行文件被用于mapper,则在mapper初始化时,每一个mapper任务会把这个可执行文件作为一个单独的进程启动。 mapper任务运行时,它...

IDC:大数据行业应用在路上

ZDNET至顶网CIO与应用频道 06月30日 评论分析(文/王聪彬):大数据这个比云计算更为容易理解和落地的技术仿佛在一夜之间席卷了中国,大数据预测世界杯、大数据解读综艺节目等等都出现在了我们的视野里。这也正是由于数据量的不断增长以及数据价值没有得到更高的利用造成了这一现象的出现,到2020年有价值的数据将会增长25倍,大数据蕴含的机会也将被不断的挖掘,尤其一些传统行业用户会更多的利用其进行业务拓展和创新。 IDC中国高级研究经理潘永花 大数据技术、应用、服务新趋势 大数据经历了2013年的起步年,到2014年已经逐渐进入落地年。而对于2014年大数据的进一步发展,IDC中国高级研究经理潘永花也指出了其在技术、应用、服务角度的新趋势。 技术:Hadoop的技术应用会越来越深,但其并不能完全代替传统数据库技术,因为两者的应用场景有很大差异,形成共存的状态;物联网会成为大数据快速发展的关键驱动因素,其中除了个人的可穿戴设备外还有行业性应用,像智能电网、智慧交通产生的数据;数据安全和隐私管理技术会面临挑战;数据可视化技术会快速发展,并且出现更多的新兴公司。 应用:以客户为中心的大数据应用将...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。