搜索[系统]结果-低调大师优秀个人博客

关于CentOS 6下Hadoop占用系统态CPU高的处理办法

关于CentOS 6下Hadoop占用系统态CPU高的处理办法一次不经意发现Hadoop的系统态CPU使用率很高，然后百度一下居然是个已知问题。

2017-05-01

《Hive编程指南》一1.2 Hadoop生态系统中的Hive

1.2 Hadoop生态系统中的Hive WordCount算法，和基于Hadoop实现的大多数算法一样，有那么点复杂。

2017-05-01

《深入解析Android 5.0系统》——第6章，第6.1节原子操作

本节书摘来自异步社区《深入解析Android 5.0系统》一书中的第6章，第6.1节原子操作，作者刘超，更多章节内容可以访问云栖社区“异步社区”公众号查看 6.1 原子操作深入解析Android 5.0

2017-05-01

《Android 网络开发与应用实战详解》——2.3节Android系统架构

本节书摘来自异步社区《Android 网络开发与应用实战详解》一书中的第2章，第2.3节Android系统架构，作者王东华，更多章节内容可以访问云栖社区“异步社区”公众号查看 2.3 Android系统架构

2017-05-01

Android驱动之 Linux Input子系统之TP——A/B(Slot)协议【转】

在Input子系统中，它扮演的就是这两个角色。它产生于这样一个背景：如果从Device获取的当前数据与上一个数据相同，我们有必要再上报当前数据吗？

2017-04-24

Android如何预置apk,jar,lib等任意文件到系统中

ep : 我手上有个libapp.so , fuse.bin , busybox，我需要将这三个文件在编译的时候自动拷贝到out目录下编译完成以后，.so文件会被预置到Andorid系统的根目录下的system

2017-04-13

Android弹幕实现：基于B站弹幕开源系统（5）-抽象和复用

Android弹幕实现：基于B站弹幕开源系统（5）-抽象和复用改造和整理了附录1,2,3,4的代码工程，出于未来可二次复用和定制的原则，我把这些代码共享到github上，链接地址：https:/

2017-04-05

微软宣布开源Git虚拟文件系统GVFS：性能大提升

【大咖・来了第7期】10月24日晚8点观看《智能导购对话机器人实践》 Git是一个被广泛使用的版本控制系统，但在规模扩展上有些不尽如人意。

2017-02-06

详谈阿里云CDN的进化——构建智能化的视频系统

阿里云 CDN 是阿里云飞天生态系统基于阿里巴巴优质网络基础设施向用户提供的互联网内容投递服务，提供低成本、高性能、可扩展的 CDN 服务，将海量内容高效投递给互联网终端消费用户。

2016-11-15

变而不变：我看分布式系统发展和阿里实践

但是落盘大大降低了系统的性能，如果只是简单用network的方式来Shuffle数据，则不能容错。

2016-11-09

机器人操作系统（ROS）教程4：ROS的框架【转】

首先，ROS的系统代码分为两部分：main和universe。1.main：是ROS的核心部分，它提供了一基本的工具，以及整个ROS的核心部分的程序编写。

2016-11-08

Android高级第十一讲之不同系统间的区别

Android系统不断的升级，从基础到中级再到高级，逐步升级是软件工程敏捷开发的一个重点，在每个版本中升级不同功能，以满足越来越丰富的用户需求，作为一名开发者，熟悉各个版本之间的异同，有助于做产品适配、

2016-11-06

实战Puppet 集中配置管理系统(2)——apache与nginx模块配置

上次实验内容：实战Puppet 集中配置管理系统(1)——认证与资源定义本次实验内容： 1.建立节点文件 2.编写apache模块 3.编写nginx模块 4.模板应用(添加虚拟主机配置) 1.

2016-11-01

在线教育业务系统云上高可用部署架构设计

众所周知，云平台是一个及其复杂的综合系统，内外部的一些偶然因素可能导致其发生局部的故障，如果用户在高可用方面考虑的不够周全，云平台局部故障可能会对业务系统产生重要影响，造成用户的体验下降甚至用户流失。

2016-10-27

CentOS64位6.5下部署Zabbix2.2.6监控系统

系统环境： [root@it3246~]#cat/etc/redhat-release CentOSrelease6.5(Final) 软件环境LAMP： 1.在已有的LAMP或者LNMP的基础上安装zabbix

2016-10-27

《hadoop进阶》基于hadoop和hive的微博热词跟踪系统

换工作等等），导致现在才写完，算是一篇迟到了二个月的文章，实在是不好意思，曾经也想过不写了，但是后来还是坚持了下来，只想分享给大家整片博客分为这几个部分： 1：微博热词跟踪系统概述

2016-09-23

转载请注明出处：@http://blog.csdn.net/gamer_gyt，Thinkagmer 撰写博主微博：http://weibo.com/234654758（欢迎互撩） Github：https://github.com/thinkgamer ===================================================================================== 写在前边的话：之前做的hadoop集群，组合了hive，hbase，sqoop，spark等开源工具，现在要对他们做一个Web的可视化操作，由于本小白只懂如何使用python做一个交互的web应用，所以这里就选择了Python的Django Django教程参考：Django从manage.py shell 到项目部署 hadoop集群操作请参考：三台PC服务器部署高可用hadoop集群言归正传：使用python操作hdfs本身并不难，只不过是把对应的shell 功能“翻译”成高级语言，网上大部分使用的是 pyhdfs：官方文档 hdfs：官方文档 libhdfs（比较狗血）我这里选用的是hdfs，下边的实例都是基于hdfs包进行的 1：安装由于我的是windows环境（linux其实也一样），只要有pip或者setup_install安装起来都是很方便的 pip install hdfs 2：Client——创建集群连接 >>> from hdfs import * >>> client = Client("http://127.0.0.1:50070") 其他参数说明： classhdfs.client.Client(url,root=None,proxy=None,timeout=None,session=None) url：ip：端口 root：制定的hdfs根目录 proxy：制定登陆的用户身份 timeout：设置的超时时间 seesion：requests.Session instance, used to emit all requests.（不是太懂，应该四用户发出请求）这里我们着重看一下proxy这个，首先我们指定root用户连接 >>> client = Client("http://127.0.0.1:50070",root="/",timeout=100,session=False) >>> client.list("/") [u'hbase'] 看起来一切正常的样子，接下来我们指定一个别的用户，比如说gamer再看 >>> client = Client("http://127.0.0.1:50070",root="/",proxy="gamer",timeout=100,session=False) >>> client.list("/") Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/local/lib/python2.7/dist-packages/hdfs/client.py", line 893, in list statuses = self._list_status(hdfs_path).json()['FileStatuses']['FileStatus'] File "/usr/local/lib/python2.7/dist-packages/hdfs/client.py", line 92, in api_handler **self.kwargs File "/usr/local/lib/python2.7/dist-packages/hdfs/client.py", line 181, in _request return _on_error(response) File "/usr/local/lib/python2.7/dist-packages/hdfs/client.py", line 44, in _on_error raise HdfsError(message) hdfs.util.HdfsError: Failed to obtain user group information: org.apache.hadoop.security.authorize.AuthorizationException: User: dr.who is not allowed to impersonate gamer 这时候就抛出异常了 3：dir——查看支持的方法 >>> dir(client) ['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__registry__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', '_append', '_create', '_delete', '_get_content_summary', '_get_file_checksum', '_get_file_status', '_get_home_directory', '_list_status', '_mkdirs', '_open', '_proxy', '_rename', '_request', '_session', '_set_owner', '_set_permission', '_set_replication', '_set_times', '_timeout', 'checksum', 'content', 'delete', 'download', 'from_options', 'list', 'makedirs', 'parts', 'read', 'rename', 'resolve', 'root', 'set_owner', 'set_permission', 'set_replication', 'set_times', 'status', 'upload', 'url', 'walk', 'write'] 4：status——获取路径的具体信息 >>> client.status("/") {'accessTime': 0, 'pathSuffix': '', 'group': 'supergroup', 'type': 'DIRECTORY', 'owner': 'root', 'childrenNum': 4, 'blockSize': 0, 'fileId': 16385, 'length': 0, 'replication': 0, 'storagePolicy': 0, 'modificationTime': 1473023149031, 'permission': '777'} 其他参数：status(hdfs_path,strict=True) hdfs_path：就是hdfs路径 strict：设置为True时，如果hdfs_path路径不存在就会抛出异常，如果设置为False，如果路径为不存在，则返回None >>> client = Client("http://127.0.0.1:50070",root="/",timeout=100,session=False) >>> client.status("/gamer",strict=True) Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/local/lib/python2.7/dist-packages/hdfs/client.py", line 277, in status res = self._get_file_status(hdfs_path, strict=strict) File "/usr/local/lib/python2.7/dist-packages/hdfs/client.py", line 92, in api_handler **self.kwargs File "/usr/local/lib/python2.7/dist-packages/hdfs/client.py", line 181, in _request return _on_error(response) File "/usr/local/lib/python2.7/dist-packages/hdfs/client.py", line 44, in _on_error raise HdfsError(message) hdfs.util.HdfsError: File does not exist: /gamer >>> client.status("/gamer",strict=False) >>> 从例子中可以看出，当设置为false时，路径不存在，什么也不输出 5：list——获取指定路径的子目录信息 >>> client.list("/") ['file', 'gyt', 'hbase', 'tmp'] 其他参数：list(hdfs_path,status=False) status：为True时，也返回子目录的状态信息，默认为Flase >>> client.list("/") [u'hbase'] >>> client.list("/",status=False) [u'hbase'] >>> client.list("/",status=True) [(u'hbase', {u'group': u'supergroup', u'permission': u'755', u'blockSize': 0, u'accessTime': 0, u'pathSuffix': u'hbase', u'modificationTime': 1472986624167, u'replication': 0, u'length': 0, u'childrenNum': 7, u'owner': u'root', u'storagePolicy': 0, u'type': u'DIRECTORY', u'fileId': 16386})] >>> 6：makedirs——创建目录 >>> client.makedirs("/test") >>> client.list("/") ['file', 'gyt', 'hbase', 'test', 'tmp'] >>> client.status("/test") {'accessTime': 0, 'pathSuffix': '', 'group': 'supergroup', 'type': 'DIRECTORY', 'owner': 'dr.who', 'childrenNum': 0, 'blockSize': 0, 'fileId': 16493, 'length': 0, 'replication': 0, 'storagePolicy': 0, 'modificationTime': 1473096896947, 'permission': '755'} 其他参数：makedirs(hdfs_path,permission=None) permission：设置权限 >>> client.makedirs("/test",permission=777) >>> client.status("/test") {u'group': u'supergroup', u'permission': u'777', u'blockSize': 0, u'accessTime': 0, u'pathSuffix': u'', u'modificationTime': 1473175557340, u'replication': 0, u'length': 0, u'childrenNum': 0, u'owner': u'dr.who', u'storagePolicy': 0, u'type': u'DIRECTORY', u'fileId': 16437} 可以看出该文件夹的权限是777 7：rename—重命名 >>> client.rename("/test","/new_name") >>> client.list("/") ['file', 'gyt', 'hbase', 'new_name', 'tmp'] 格式说明：rename(hdfs_path, local_path） 8：delete—删除 >>> client.list("/") ['file', 'gyt', 'hbase', 'new_name', 'tmp'] >>> client.delete("/new_name") True >>> client.list("/") ['file', 'gyt', 'hbase', 'tmp'] 其他参数：delete(hdfs_path,recursive=False) recursive：删除文件和其子目录，设置为False如果不存在，则会抛出异常，默认为False >>> client.delete("/test",recursive=True) True >>> client.delete("/test",recursive=True) False >>> client.delete("/test") False 9：upload——上传数据 =======================分割线========================== 为什么这里需要分割线？因为在做web平台可视化操作hdfs的时候遇到了问题！错误如下： requests.exceptions.ConnectionError: HTTPConnectionPool(host='slaver1', port=50075): Max retries exceeded with url: /webhdfs/v1/thinkgamer/name.txt?op=OPEN&namenoderpcaddress=master&offset=0 (Caused by NewConnectionError ('<requests.packages.urllib3.connection.HTTPConnection object at 0x00000000043A3FD0>: Failed to establish a new connection: [Errno 11004] getaddrinfo failed',)) 对错误的理解：看其大意是Http连接太多，没有及时关闭，导致错误（PS：网上对hdfs操作的资料比较少，大部分都只停留在基础语法层面，但对于错误的记录及解决办法少之又少）解决办法：暂无由于我是在windows上操作集群的，而我的集群是在服务器上部署的，所以我考虑是否在服务器上尝试下载和上传数据，果断ok >>> client.list("/") [u'hbase', u'test'] >>> client.upload("/test","/opt/bigdata/hadoop/NOTICE.txt") '/test/NOTICE.txt' >>> client.list("/") [u'hbase', u'test'] >>> client.list("/test") [u'NOTICE.txt'] 其他参数： upload ( hdfs_path , local_path , overwrite=False , n_threads=1 , temp_dir=None , chunk_size=65536,progress=None,cleanup=True,**kwargs) overwrite：是否是覆盖性上传文件 n_threads：启动的线程数目 temp_dir：当overwrite=true时，远程文件一旦存在，则会在上传完之后进行交换 chunk_size：文件上传的大小区间 progress：回调函数来跟踪进度，为每一chunk_size字节。它将传递两个参数，文件上传的路径和传输的字节数。一旦完成，-1将作为第二个参数 cleanup：如果在上传任何文件时发生错误，则删除该文件 10：download——下载 >>> client.download("/test/NOTICE.txt","/home") '/home/NOTICE.txt' >>> import os >>> os.system("ls /home") lost+found NOTICE.txt thinkgamer 0 >>> 其他参数： download ( hdfs_path , local_path , overwrite=False , n_threads=1 , temp_dir=None , **kwargs ) 参考上传 upload 11：read——读取文件同样在windows客户端上执行依旧报错，在hadoop的节点服务器上执行 >>> with client.read("/test/NOTICE.txt") as reader: ... print reader.read() ... This product includes software developed by The Apache Software Foundation (http://www.apache.org/). >>> 其他参数： read ( *args , **kwds ) hdfs_path：hdfs路径 offset：设置开始的字节位置 length：读取的长度（字节为单位） buffer_size：用于传输数据的字节的缓冲区的大小。默认值设置在HDFS配置。 encoding：制定编码 chunk_size：如果设置为正数，上下文管理器将返回一个发生器产生的每一chunk_size字节而不是一个类似文件的对象 delimiter：如果设置，上下文管理器将返回一个发生器产生每次遇到分隔符。此参数要求指定的编码。 progress：回调函数来跟踪进度，为每一chunk_size字节（不可用，如果块大小不是指定）。它将传递两个参数，文件上传的路径和传输的字节数。称为一次与- 1作为第二个参数。附：在对文件操作时，可能会提示错误 hdfs.util.HdfsError: Permission denied: user=dr.who, access=WRITE, inode="/test":root:supergroup:drwxr-xr-x 解决办法是：在配置文件hdfs-site.xml中加入 <property> <name>dfs.permissions</name> <value>false</value> </property> 重启集群即可基本常用的功能也就这些了，如果需要一些特殊的功能，可以自己执行help(client.method)进行查看

2016-09-06

精选列表

关于CentOS 6下Hadoop占用系统态CPU高的处理办法

《Hive编程指南》一1.2 Hadoop生态系统中的Hive

《深入解析Android 5.0系统》——第6章，第6.1节原子操作

《Android 网络开发与应用实战详解》——2.3节Android系统架构

Android驱动之 Linux Input子系统之TP——A/B(Slot)协议【转】

Android如何预置apk,jar,lib等任意文件到系统中

Android弹幕实现：基于B站弹幕开源系统（5）-抽象和复用

微软宣布开源Git虚拟文件系统GVFS：性能大提升

详谈阿里云CDN的进化——构建智能化的视频系统

变而不变：我看分布式系统发展和阿里实践

机器人操作系统（ROS）教程4：ROS的框架【转】

Android高级第十一讲之不同系统间的区别

实战Puppet 集中配置管理系统(2)——apache与nginx模块配置

在线教育业务系统云上高可用部署架构设计

CentOS64位6.5下部署Zabbix2.2.6监控系统

《hadoop进阶》基于hadoop和hive的微博热词跟踪系统

使用python的hdfs包操作分布式文件系统（HDFS）

Android源码剖析之Framework层升级版（窗口、系统启动）

欺壹世充电系列之[Svn集中式版本管理系统]

SparkContext的初始化（季篇）——测量系统、ContextCleaner等组件介绍

资源下载

Spring

Rocky Linux

Sublime Text

WebStorm

欢迎您来访！