【使用linux 并发命令parallel 加快处理文本文件】-原来是坑爹啊。
1,看到oschina 上面的一篇文章
如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等
http://www.oschina.net/news/45477/use-cpu-cores-linux-commands
系统使用的是Redhat 5
parallel的官网:
http://www.gnu.org/software/parallel/
需要使用opensuse的源进行安装
http://software.opensuse.org/download.html?project=home%3Atange&package=parallel
对于 CentOS CentOS-6,请以 根用户 root 运行下面命令:
cd /etc/yum.repos.d/ wget http://download.opensuse.org/repositories/home:tange/CentOS_CentOS-6/home:tange.repo yum install parallel
对于 CentOS CentOS-5,请以 根用户 root 运行下面命令:
cd /etc/yum.repos.d/ wget http://download.opensuse.org/repositories/home:tange/CentOS_CentOS-5/home:tange.repo yum install parallel
经测试wc -l 命令 发现在cpu数量是4的时候并没有提高计算时间,反而慢了。
计算1G文件行数,用wc-l花费 1s而使用 parallel后花费 10s
对于200MB的文件也是10倍的关系。
总结:
理论和实际使用还是有差别啊。在4cup的机器上面测试一点 优势也没有啊。
基本上要慢个 10倍以上啊。看来要处理大文件,还是hadoop比较靠谱啊。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Hadoop五分钟入门指南
《Hadoop五分钟入门指南》 原文见: http://blog.josedacruz.com/2013/12/09/hadoop-in-5-minutes-for-beginners/#.Uqhs3_Q6Cjt 如果你有大量的数据(TB级),而且这些数据到处分散,且有些数据是结构化的,有些数据不是。你想查询这些数据,你或许在想,“我需要力量来组织和查询这些数据”。是的,你需要Hadoop。 一、什么是Hadoop? Apache Hadoop软件库是一个框架,它可以对大数据集使用简单的编程模型做跨集群的分布式处理。Hadoop在设计上可以从单服务器节点扩展到成千上万的服务器节点,每个节点都能提供本地计算和存储。 HDFS——分布式文件系统,MapReduce模式的实现。 HDFS是一个文件系统,分布在系统中的所有机器上,但是你只能把它视为单个的文件系统,因为它是分布式的、跨主机的。那么,我的本地文件系统是怎样的?HDFS工作于本地文件系统之上。 MapReduce是一个模式,处理大数据集(当然你也可以用于处理小数据集,因为MapReduce只是一个模式,而不是产品,它可以使用任意编程...
- 下一篇
ElasticSearch查询 第一篇:搜索API
《ElasticSearch查询》目录导航: ElasticSearch查询 第一篇:搜索API ElasticSearch查询 第二篇:文档更新 ElasticSearch查询 第三篇:词条查询 ElasticSearch查询 第四篇:匹配查询(Match) ElasticSearch查询 第五篇:布尔查询 不同于SQL语言,对ElasticSearch引擎发送的查询请求,有两种方式:第一种方式是使用RESTful 风格的API请求对数据进行搜索或更新,这意味着,必须使用搜索API向ElasticSearch引擎发起搜索请求;第二种方式是使用Qeury DSL,将查询语言封装成JSON结构,在JSON结构中,封装查询请求的参数,作为请求主体(Request Body),发送给ElasticSearch引擎处理。 DSL是领域专用语言(Domain-SpecificLanguage)的首字母缩写,是一种通用的大数据查询语言,用于实现海量数据的检索分析。 本系列是ElasticSearch的入门文章,用于介绍搜索API的使用方法,只求快速入门,想要深入了解,最好的文档永远是官方手册。 ...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7设置SWAP分区,小内存服务器的救世主
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS8编译安装MySQL8.0.19
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长