首页 文章 精选 留言 我的

精选列表

搜索[分布式调度],共10000篇文章
优秀的个人博客,低调大师

分布式监控系统 WGCLOUD v3.3.2 发布,新增 web 版 ssh 工具、堡垒机能力

WGCLOUD,server端基于springboot开发,agent端使用go编写。支持高并发高性能,核心模块包括:主机监控,ES集群管理,CPU监控,CPU温度监控,内存监控,数据监控,docker监控,网络流量监控,服务接口心跳检测,应用进程管理,磁盘IO监控,系统负载监控,端口监控,大屏可视化,日志文件监控,硬盘smart健康检测,web版ssh工具,堡垒机,监控告警信息(默认邮件,支持钉钉微信集成)推送。 码云源码下载:https://gitee.com/wanghouhou/wgcloud GITHUB源码下载:https://github.com/tianshiyeben/wgcloud 安装包下载:http://www.wgstart.com WGCLOUD-v3.3.2更新说明,2021-04-29: WGCLOUD-v3.3.2更新说明,2021-04-29发布 1.新增,web shh终端,相当于堡垒机(跳板机),在浏览器即可通过ssh连接到主机,进行shell指令执行。在浏览器远程连接windows,需要在windows安装远程连接服务,如:Myrtille工具、Remote desktop web connection工具 2.新增,大屏展板是否开启配置项,在/server/config/application.yml配置选项dapingView,之前版本和公众看板共用配置项dashView 3.新增,DOCKER下线告警配置项,之前版本和进程下线告警共用配置项appDownWarnMail 4.新增,主机的上行带宽速率和下行带宽速率告警 5.新增,主机的网络传输丢包数量指标图表 6.新增,数据开放接口:获取主机cpu状态数据、获取主机系统负载数据、获取主机内存状态数据、获取主机磁盘容量数据、获取主机磁盘io数据、获取主机cpu温度数据、获取主机上下行带宽数据 7.新增,日志文件监控扫描间隔可配置,之前版本默认10分钟扫描一次日志文件,在agent/config/application.properties下配置 8.优化,agent采用新版本golang v1.15.11编译打包(之前使用v1.13.8),优化提升agent性能 9.优化,agent引入自动清理日志文件机制,节省磁盘空间,可在agent/config/application.properties配置日志文件保留天数 10.优化,图表渲染速度、显示及配色 11.优化,改造优化大屏展示 12.优化,对下线的进程、端口、docker、主机信息不再自动删除(之前版本会和历史数据一起清除),用户可以手动删除。但是监控指标的历史数据依然自动清除 13.bug,修复未登录时跳转到404页面,会显示导航菜单的问题 14.底层架构重构、性能优化、UI整体优化 15.历史版本升级请点击,历史版本升级说明

优秀的个人博客,低调大师

分布式图数据库 Nebula Graph v2.0.1 发布,优化了服务性能

Nebula Graph v2.0.1 主要优化服务性能,修复了一些已知 bug。 Improvements 优化了StorageClient,提高了服务性能,pr 参见:#4681 增加 HTTPGetFlags接口对无符号整型的支持,pr 参见:#469 增加对 Raft Listener 和 Storage Service IP/Port 的冲突检查,pr 参见:#875、#468 Bugfix 修复了GO在特殊场景下未返回起点属性的问题,pr 参见:#859 修复了以某些方式启动服务时,因logs目录不存在导致启动失败的问题,pr 参见:#873、#403 修复了FIND SHORTEST PATH xxx UPTO N STEPS当 N 为奇数步时,返回了 N+1 步路径的问题,pr 参见:#912 修复了使用其它语句的输出作为DELETE语句的输入时,返回SementicError的问题,pr 参见:#9171 修复了聚合函数的默认返回值与 openCypher 不一致的问题,pr 参见:#901、#480 修复了集群模式下,GetNeighborsIter接口返回部分结果的问题,pr 参见:#922 修复了MATCH语句中,对聚合函数过滤时 graphd 会 crash 的问题,pr 参见:#919 修复了MATCH无法查询 id 为负数的点的问题,pr 参见:#932 修复了在SHOW CREATE TAG/EDGE INDEX <index_name>中指定TAG或EDGE无效的问题,pr 参见:#933、#426 修复了在某些情况下REBUILD INDEX失败却返回成功的问题,pr 参见:#405 修复了重建索引过程中,某些情况下可能导致正在插入的数据索引更新失败的问题,pr 参见:#408 修复了当substr()或substring()函数中任一参数为NULL时,graphd 会 crash 的问题,pr 参见:#491 最后是 Nebula 的 GitHub 地址,欢迎大家试用,有什么问题可以向我们提 issue。GitHub 地址:https://github.com/vesoft-inc/nebula-graph;

优秀的个人博客,低调大师

深入浅出:Hadoop的start-balancer.sh与hdfs balancer分布式数据均衡

Hadoop的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况,比如集群中添加新的数据节点。当HDFS出现不平衡状况的时候,将引发很多问题,比如:1、MR程序无法很好地利用本地计算的优势2、机器之间无法达到更好的网络带宽使用率,机器磁盘无法利用等等。可见,保证HDFS中的数据平衡是非常重要的。在Hadoop中,包含一个Balancer程序,通过运行这个程序,可以使得HDFS集群达到一个平衡的状态,使用这个程序的命令如下: $HADOOP_HOME/bin/start-balancer.sh –t 10% 这个命令中-t参数后面跟的是HDFS达到平衡状态的磁盘使用率偏差值。如果机器与机器之间磁盘使用率偏差小于10%,那么我们就认为HDFS集群已经达到了平衡的状态。Hadoop的开发人员在开发Balancer程序的时候,遵循了以下几点原则:1.在执行数据重分布的过程中,必须保证数据不能出现丢失,不能改变数据的备份数,不能改变每一个rack中所具备的block数量。(这个原则导致了不同rack机柜之间的数据是不能移动的)2.系统管理员可以通过一条命令启动数据重分布程序或者停止数据重分布程序。3.Block在移动的过程中,不能暂用过多的资源,如网络带宽。4.数据重分布程序在执行的过程中,不能影响name node的正常工作。 集群执行balancer依旧不平衡的原因基于这些基本点,目前Hadoop数据重分布程序实现的逻辑流程如下图所示: Name Node <------------------------------->Rebalancing Server<-------------------------------->Proxy source data node /| /|\ | | | | +----------------------------------->destination data node<---------------------------------------+ Rebalance程序作为一个独立的进程与name node进行分开执行。1 Rebalance Server从Name Node中获取所有的Data Node情况:每一个Data Node磁盘使用情况。2 Rebalance Server计算哪些机器需要将数据移动,哪些机器可以接受移动的数据。并且从Name Node中获取需要移动的数据分布情况。3 Rebalance Server计算出来可以将哪一台机器的block移动到另一台机器中去。4,5,6 需要移动block的机器将数据移动的目的机器上去,同时删除自己机器上的block数据。7 Rebalance Server获取到本次数据移动的执行结果,并继续执行这个过程,一直没有数据可以移动或者HDFS集群以及达到了平衡的标准为止。 Hadoop现有的这种Balancer程序工作的方式在绝大多数情况中都是非常适合的。现在我们设想这样一种情况:1 数据是3份备份。2 HDFS由2个rack(机柜)组成。3 2个rack中的机器磁盘配置不同,第一个rack(机柜)中每一台机器的磁盘空间为1TB,第二个rack(机柜)中每一台机器的磁盘空间为10TB。4 现在大多数数据的2份备份都存储在第一个rack(机柜)中。在这样的一种情况下,HDFS级群中的数据肯定是不平衡的。现在我们运行Balancer程序,但是会发现运行结束以后,整个HDFS集群中的数据依旧不平衡:rack1中的磁盘剩余空间远远小于rack2。这是因为Balance程序的开发原则1导致的。简单的说,就是在执行Balancer程序的时候,不会将数据中一个rack(机柜)移动到另一个rack中(机柜),所以就导致了Balancer程序永远无法平衡HDFS集群的情况。针对于这种情况,可以采取2中方案:1 继续使用现有的Balancer程序,但是修改rack中的机器分布。将磁盘空间小的机器分叉到不同的rack中去。2 修改Balancer程序,允许改变每一个rack中所具备的block数量,将磁盘空间告急的rack中存放的block数量减少,或者将其移动到其他磁盘空间富余的rack中去。(不推荐) 1.传输带宽对hdfs负载设置均衡,因为默认的数据传输带宽比较低,可以设置为64M,即hdfs dfsadmin -setBalancerBandwidth 67108864即可 [root@sht-sgmhadoopnn-01 ~# cd /hadoop/hadoop-2.7.2/bin [root@sht-sgmhadoopdn-01 bin# ./hdfs dfsadmin -setBalancerBandwidth 67108864 Balancer bandwidth is set to 67108864 for sht-sgmhadoopnn-01/172.16.101.55:8020 Balancer bandwidth is set to 67108864 for sht-sgmhadoopnn-02/172.16.101.56:8020 2.节点存储使用率偏差默认balancer的threshold为10%,即各个节点存储使用率偏差不超过10%,我们可将其设置为5%;然后启动Balancer,sbin/start-balancer.sh -threshold 5,等待集群自均衡完成即可 [root@sht-sgmhadoopdn-01 bin# cd ../sbin starting balancer, logging to /hadoop/hadoop-2.7.2/logs/hadoop-root-balancer-sht-sgmhadoopnn-01.telenav.cn.out [root@sht-sgmhadoopnn-01 sbin# ./start-balancer.sh -threshold 5 starting balancer, logging to /hadoop/hadoop-2.7.2/logs/hadoop-root-balancer-sht-sgmhadoopnn-01.telenav.cn.out 运行这个命令start-balancer.sh -threshold 5和使用hdfs balancer -threshold 5是一样的 Usage: hdfs balancer [root@sht-sgmhadoopnn-01 bin# ./hdfs balancer -threshold 5 16/03/05 18:57:33 INFO balancer.Balancer: Using a threshold of 1.0 16/03/05 18:57:33 INFO balancer.Balancer: namenodes = [hdfs://mycluster 16/03/05 18:57:33 INFO balancer.Balancer: parameters = Balancer.Parameters[BalancingPolicy.Node, threshold=1.0, max idle iteration = 5, number of nodes to be excluded = 0, number of nodes to be included = 0 Time Stamp Iteration# Bytes Already Moved Bytes Left To Move Bytes Being Moved 16/03/05 18:57:34 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 16/03/05 18:57:35 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.58:50010 16/03/05 18:57:35 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.60:50010 16/03/05 18:57:35 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.66:50010 16/03/05 18:57:35 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.59:50010 16/03/05 18:57:35 INFO balancer.Balancer: 0 over-utilized: [ 16/03/05 18:57:35 INFO balancer.Balancer: 0 underutilized: [ The cluster is balanced. Exiting... Mar 5, 2016 6:57:35 PM 0 0 B 0 B -1 B Mar 5, 2016 6:57:35 PM Balancing took 2.66 seconds 1).为什么我执行该命令hdfs balancer -threshold 5平衡数据命令没有反应呢?5表示5%, 群总存储使用率: 1.74%sht-sgmhadoopdn-01: 1.74%sht-sgmhadoopdn-02: 1.74%sht-sgmhadoopdn-03: 1.74%sht-sgmhadoopdn-04: 0%执行-threshold 5, 表示每一个 datanode 存储使用率和集群总存储使用率的差值都应该小于这个阀值5%;假如超过5%,会执行数据平衡操作。 B. 2).怎样判断执行命令是否会生效,数据平衡操作? if (群总存储使用率 — 每一台datanode 存储使用率) > -threshold 5 #会执行数据平衡 else #该命令不生效 end ifC. 3).the threshold range of [1.0, 100.0],所以最小只能设置 -threshold 1 D. 4).balance命令可以执行早namenode或者datanode节点上 执行命令hdfs balancer -threshold 2点击(此处)折叠或打开 [root@sht-sgmhadoopnn-01 hadoop# hdfs balancer -threshold 2……………..……………..16/03/08 16:08:09 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.59:5001016/03/08 16:08:09 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.58:5001016/03/08 16:08:09 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.66:5001016/03/08 16:08:09 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.60:5001016/03/08 16:08:09 INFO balancer.Balancer: 0 over-utilized: [16/03/08 16:08:09 INFO balancer.Balancer: 0 underutilized: [The cluster is balanced. Exiting...Mar 8, 2016 4:08:09 PM 1 382.22 MB 0 B -1 BMar 8, 2016 4:08:09 PM Balancing took 6.7001 minutes 新增数据节点的411.7M,偏差小于2%。 start-balancer.sh和stop-balancer.sh的源码解析: [root@sht-sgmhadoopnn-01 sbin]# more start-balancer.sh !/usr/bin/env bash bin=dirname "${BASH_SOURCE-$0}"bin=cd "$bin"; pwdDEFAULT_LIBEXEC_DIR="$bin"/../libexecHADOOP_LIBEXEC_DIR=${HADOOP_LIBEXEC_DIR:-$DEFAULT_LIBEXEC_DIR}. $HADOOP_LIBEXEC_DIR/hdfs-config.sh Start balancer daemon. "$HADOOP_PREFIX"/sbin/hadoop-daemon.sh --config $HADOOP_CONF_DIR --script "$bin"/hdfs start balancer $@解析:start-balancer.sh脚本其实最终还是调用hdfs start balancer $@ 命令,对于 $@ 是指shell脚本运行的传递的参数列表,一般参数为-threshold 5 [root@sht-sgmhadoopnn-01 sbin# more stop-balancer.sh !/usr/bin/env bash bin=dirname "${BASH_SOURCE-$0}"bin=cd "$bin"; pwdDEFAULT_LIBEXEC_DIR="$bin"/../libexecHADOOP_LIBEXEC_DIR=${HADOOP_LIBEXEC_DIR:-$DEFAULT_LIBEXEC_DIR}. $HADOOP_LIBEXEC_DIR/hdfs-config.sh Stop balancer daemon. Run this on the machine where the balancer is running "$HADOOP_PREFIX"/sbin/hadoop-daemon.sh --config $HADOOP_CONF_DIR --script "$bin"/hdfs stop balancer解析:stop-balancer.sh脚本其实最终还是调用hdfs stop balancer命令[root@sht-sgmhadoopnn-01 sbin# 注意事项:由于历史原因,hadoop集群中的机器的磁盘空间的大小各不相同,而HDFS在进行写入操作时,并没有考虑到这种情况,所以随着数据量的逐渐增加,磁盘较小的datanode机器上的磁盘空间很快将被写满,从而触发了报警。此时,不得不手工执行start-balancer.sh来进行balance操作,即使将dfs.balance.bandwidthPerSec 参数设置为10M/s,整个集群达到平衡也需要很长的时间,所以写了个crontab来每天凌晨来执行start-balancer.sh,由于此时集群不平衡的状态还没有那么严重,所以start-balancer.sh很快执行结束了。另外需要注意的地方是,由于HDFS需要启动单独的Rebalance Server来执行Rebalance操作,所以尽量不要在NameNode上执行start-balancer.sh,而是找一台比较空闲的机器。理论参考:http://www.aboutyun.com/thread-7354-1-1.html

优秀的个人博客,低调大师

19、 Python快速开发分布式搜索引擎Scrapy精讲—css选择器

css选择器 1、 2、 3、 ::attr()获取元素属性,css选择器 ::text获取标签文本 举例: extract_first('')获取过滤后的数据,返回字符串,有一个默认参数,也就是如果没有数据默认是什么,一般我们设置为空字符串 extract()获取过滤后的数据,返回字符串列表 #-*-coding:utf-8-*- importscrapy classPachSpider(scrapy.Spider): name='pach' allowed_domains=['blog.jobbole.com'] start_urls=['http://blog.jobbole.com/all-posts/'] defparse(self,response): asd=response.css('.archive-title::text').extract()#这里也可以用extract_first('')获取返回字符串 #print(asd) foriinasd: print(i) 【转载自:http://www.lqkweb.com】

资源下载

更多资源
Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源,继承了IntelliJ IDEA强大的JS部分的功能。

用户登录
用户注册