搜索[分布式调度]结果-低调大师优秀个人博客

精选列表

搜索[分布式调度]，共10000篇文章

小白一看就会的 Spring Cloud Sleuth：分布式请求链路跟踪建议收藏！

更多Java相关资料可以关注公众号【Java大蜗牛】发送：6 Spring Cloud Sleuth：分布式请求链路跟踪 Spring Cloud Sleuth 简介给服务添加请求链路跟踪整合Zipkin

2021-06-21

分布式监控系统 WGCLOUD v3.3.2 发布，新增 web 版 ssh 工具、堡垒机能力

WGCLOUD，server端基于springboot开发，agent端使用go编写。支持高并发高性能，核心模块包括：主机监控，ES集群管理，CPU监控，CPU温度监控，内存监控，数据监控，docker监控，网络流量监控，服务接口心跳检测，应用进程管理，磁盘IO监控，系统负载监控，端口监控，大屏可视化，日志文件监控，硬盘smart健康检测，web版ssh工具，堡垒机，监控告警信息（默认邮件，支持钉钉微信集成）推送。码云源码下载：https://gitee.com/wanghouhou/wgcloud GITHUB源码下载：https://github.com/tianshiyeben/wgcloud 安装包下载：http://www.wgstart.com WGCLOUD-v3.3.2更新说明，2021-04-29： WGCLOUD-v3.3.2更新说明，2021-04-29发布 1.新增，web shh终端，相当于堡垒机（跳板机），在浏览器即可通过ssh连接到主机，进行shell指令执行。在浏览器远程连接windows，需要在windows安装远程连接服务，如：Myrtille工具、Remote desktop web connection工具 2.新增，大屏展板是否开启配置项，在/server/config/application.yml配置选项dapingView，之前版本和公众看板共用配置项dashView 3.新增，DOCKER下线告警配置项，之前版本和进程下线告警共用配置项appDownWarnMail 4.新增，主机的上行带宽速率和下行带宽速率告警 5.新增，主机的网络传输丢包数量指标图表 6.新增，数据开放接口：获取主机cpu状态数据、获取主机系统负载数据、获取主机内存状态数据、获取主机磁盘容量数据、获取主机磁盘io数据、获取主机cpu温度数据、获取主机上下行带宽数据 7.新增，日志文件监控扫描间隔可配置，之前版本默认10分钟扫描一次日志文件，在agent/config/application.properties下配置 8.优化，agent采用新版本golang v1.15.11编译打包（之前使用v1.13.8），优化提升agent性能 9.优化，agent引入自动清理日志文件机制，节省磁盘空间，可在agent/config/application.properties配置日志文件保留天数 10.优化，图表渲染速度、显示及配色 11.优化，改造优化大屏展示 12.优化，对下线的进程、端口、docker、主机信息不再自动删除（之前版本会和历史数据一起清除），用户可以手动删除。但是监控指标的历史数据依然自动清除 13.bug，修复未登录时跳转到404页面，会显示导航菜单的问题 14.底层架构重构、性能优化、UI整体优化 15.历史版本升级请点击，历史版本升级说明

2021-04-29

分布式图数据库 Nebula Graph v2.0.1 发布，优化了服务性能

Nebula Graph v2.0.1 主要优化服务性能，修复了一些已知 bug。 Improvements 优化了StorageClient，提高了服务性能，pr 参见：#4681 增加 HTTPGetFlags接口对无符号整型的支持，pr 参见：#469 增加对 Raft Listener 和 Storage Service IP/Port 的冲突检查，pr 参见：#875、#468 Bugfix 修复了GO在特殊场景下未返回起点属性的问题，pr 参见：#859 修复了以某些方式启动服务时，因logs目录不存在导致启动失败的问题，pr 参见：#873、#403 修复了FIND SHORTEST PATH xxx UPTO N STEPS当 N 为奇数步时，返回了 N+1 步路径的问题，pr 参见：#912 修复了使用其它语句的输出作为DELETE语句的输入时，返回SementicError的问题，pr 参见：#9171 修复了聚合函数的默认返回值与 openCypher 不一致的问题，pr 参见：#901、#480 修复了集群模式下，GetNeighborsIter接口返回部分结果的问题，pr 参见：#922 修复了MATCH语句中，对聚合函数过滤时 graphd 会 crash 的问题，pr 参见：#919 修复了MATCH无法查询 id 为负数的点的问题，pr 参见：#932 修复了在SHOW CREATE TAG/EDGE INDEX <index_name>中指定TAG或EDGE无效的问题，pr 参见：#933、#426 修复了在某些情况下REBUILD INDEX失败却返回成功的问题，pr 参见：#405 修复了重建索引过程中，某些情况下可能导致正在插入的数据索引更新失败的问题，pr 参见：#408 修复了当substr()或substring()函数中任一参数为NULL时，graphd 会 crash 的问题，pr 参见：#491 最后是 Nebula 的 GitHub 地址，欢迎大家试用，有什么问题可以向我们提 issue。GitHub 地址：https://github.com/vesoft-inc/nebula-graph；

2021-04-15

Spring Cloud Nacos实现分布式环境下的配置管理和服务注册发现

本文主要面向Spring Cloud的使用者，通过两个示例来介绍如何使用 Nacos 来实现分布式环境下的配置管理和服务注册发现。

2021-04-15

云原生的弹性 AI 训练系列之一：基于 AllReduce 的弹性分布式训练实践

分布式的训练可以借助不同主机上的硬件资源进行训练加速，大大提高训练速度。 Horovod 是一款基于 AllReduce 的分布式训练框架。

2021-03-16

面试被问分布式事务（2PC、3PC、TCC），这样解释没毛病！

说了一些没用的，脑子里总想起这个事，不说不痛快，大家姑且就当笑话听吧，下边我们进入正题引言前两天有个学弟公众号留言，说让讲讲分布式事务，面试就挂在这个问题上。

2021-03-03

【史上最全】Hadoop 核心 - HDFS 分布式文件系统详解(上万字建议收藏)

，在我们实际工作中，用到的最多的就是HDFS(分布式文件系统)以及LocalFileSystem(本地文件系统)了。

2021-02-08

国产开源数据库：腾讯云TBase在分布式HTAP领域的探索与实践

导语 |TBase 是腾讯TEG数据平台团队在开源 PostgreSQL 的基础上研发的企业级分布式 HTAP 数据库系统，可在同一数据库集群中同时为客户提供强一致高并发的分布式在线事务能力以及高性能的数据在线分析能力

2020-11-23

【高并发】如何实现亿级流量下的分布式限流？这些算法你必须掌握！！

自开源半年多以来，已成功为十几家中小型企业提供了精准定时调度方案，经受住了生产环境的考验。

2020-07-29

阿里云发布分布式数据库PolarDB-X，应对海量数据管理

阿里云的分布式数据库PolarDB-X也是其中之一。

2020-06-17

分布式链路日志 minbox-logging v1.0.5 版本发布，修复部分问题

MinBox Logging MinBoxLogging是一款分布式、零侵入式的链路日志分析框架，支持SpringCloud微服务架构下配置使用，内部封装了RestTemplate、OpenFeign两种方式透传链路信息

2020-06-17

go-fastdfs 分布式文件系统 v1.3.9 发布，修复禁用组同步失败

go-fastdfs 是一个基于 http 协议的分布式文件系统，它基于大道至简的设计理念，一切从简设计，使得它的运维及扩展变得更加简单，它具有高性能、高可靠、无中心、免维护等优点。

2020-05-15

Jboot v3.1.9 发布，分布式事务 Seata 升级到最新版本

二：新增门户网关 Jboot v3.1.0 还新增了门户网关，网关支持了 host、path、query等不同的条件配置，性能极高，同时支持基于 Sentinel 下的分布式限流、自定义网关拦截器等等功能

2020-04-27

十行代码让你的单机“影分身”，分布式训练速度快到飞起

工程师：“担心啥，哥有的是办法救你，就这招吧——分布式训练之参数服务器！” 计算机：“分布式训练？参数服务器？真的很好用吗？”

2020-04-02

OceanBase 学院正式上线，快来开启你的分布式数据库学习之旅吧！

OceanBase自2017年底正式对外商业化以来，我们已面向开发者和社区用户输出了几十场不同规模的技术分享，同时已助力数十家企业开启了分布式数据库的转型之旅。

2020-03-25

阿里云服务网格ASM之扩展能力(4)：在ASM中实现分布式跟踪

请求头阿里云服务网格ASM之扩展能力(2)：在ASM中支持自定义外部授权阿里云服务网格ASM之扩展能力(3)：在ASM中使用开放策略代理OPA 阿里云服务网格ASM之扩展能力(4)：在ASM中实现分布式跟踪

2020-03-09

深入浅出：Hadoop的start-balancer.sh与hdfs balancer分布式数据均衡

Hadoop的HDFS集群非常容易出现机器与机器之间磁盘利用率不平衡的情况，比如集群中添加新的数据节点。当HDFS出现不平衡状况的时候，将引发很多问题，比如：1、MR程序无法很好地利用本地计算的优势2、机器之间无法达到更好的网络带宽使用率，机器磁盘无法利用等等。可见，保证HDFS中的数据平衡是非常重要的。在Hadoop中，包含一个Balancer程序，通过运行这个程序，可以使得HDFS集群达到一个平衡的状态，使用这个程序的命令如下： $HADOOP_HOME/bin/start-balancer.sh –t 10% 这个命令中-t参数后面跟的是HDFS达到平衡状态的磁盘使用率偏差值。如果机器与机器之间磁盘使用率偏差小于10%，那么我们就认为HDFS集群已经达到了平衡的状态。Hadoop的开发人员在开发Balancer程序的时候，遵循了以下几点原则：1.在执行数据重分布的过程中，必须保证数据不能出现丢失，不能改变数据的备份数，不能改变每一个rack中所具备的block数量。（这个原则导致了不同rack机柜之间的数据是不能移动的）2.系统管理员可以通过一条命令启动数据重分布程序或者停止数据重分布程序。3.Block在移动的过程中，不能暂用过多的资源，如网络带宽。4.数据重分布程序在执行的过程中，不能影响name node的正常工作。集群执行balancer依旧不平衡的原因基于这些基本点，目前Hadoop数据重分布程序实现的逻辑流程如下图所示： Name Node <------------------------------->Rebalancing Server<-------------------------------->Proxy source data node /| /|\ | | | | +----------------------------------->destination data node<---------------------------------------+ Rebalance程序作为一个独立的进程与name node进行分开执行。1 Rebalance Server从Name Node中获取所有的Data Node情况：每一个Data Node磁盘使用情况。2 Rebalance Server计算哪些机器需要将数据移动，哪些机器可以接受移动的数据。并且从Name Node中获取需要移动的数据分布情况。3 Rebalance Server计算出来可以将哪一台机器的block移动到另一台机器中去。4,5,6 需要移动block的机器将数据移动的目的机器上去，同时删除自己机器上的block数据。7 Rebalance Server获取到本次数据移动的执行结果，并继续执行这个过程，一直没有数据可以移动或者HDFS集群以及达到了平衡的标准为止。 Hadoop现有的这种Balancer程序工作的方式在绝大多数情况中都是非常适合的。现在我们设想这样一种情况：1 数据是3份备份。2 HDFS由2个rack（机柜）组成。3 2个rack中的机器磁盘配置不同，第一个rack（机柜）中每一台机器的磁盘空间为1TB，第二个rack（机柜）中每一台机器的磁盘空间为10TB。4 现在大多数数据的2份备份都存储在第一个rack（机柜）中。在这样的一种情况下，HDFS级群中的数据肯定是不平衡的。现在我们运行Balancer程序，但是会发现运行结束以后，整个HDFS集群中的数据依旧不平衡：rack1中的磁盘剩余空间远远小于rack2。这是因为Balance程序的开发原则1导致的。简单的说，就是在执行Balancer程序的时候，不会将数据中一个rack（机柜）移动到另一个rack中（机柜），所以就导致了Balancer程序永远无法平衡HDFS集群的情况。针对于这种情况，可以采取2中方案：1 继续使用现有的Balancer程序，但是修改rack中的机器分布。将磁盘空间小的机器分叉到不同的rack中去。2 修改Balancer程序，允许改变每一个rack中所具备的block数量，将磁盘空间告急的rack中存放的block数量减少，或者将其移动到其他磁盘空间富余的rack中去。（不推荐） 1.传输带宽对hdfs负载设置均衡，因为默认的数据传输带宽比较低，可以设置为64M，即hdfs dfsadmin -setBalancerBandwidth 67108864即可 [root@sht-sgmhadoopnn-01 ~# cd /hadoop/hadoop-2.7.2/bin [root@sht-sgmhadoopdn-01 bin# ./hdfs dfsadmin -setBalancerBandwidth 67108864 Balancer bandwidth is set to 67108864 for sht-sgmhadoopnn-01/172.16.101.55:8020 Balancer bandwidth is set to 67108864 for sht-sgmhadoopnn-02/172.16.101.56:8020 2.节点存储使用率偏差默认balancer的threshold为10%，即各个节点存储使用率偏差不超过10%，我们可将其设置为5%;然后启动Balancer,sbin/start-balancer.sh -threshold 5，等待集群自均衡完成即可 [root@sht-sgmhadoopdn-01 bin# cd ../sbin starting balancer, logging to /hadoop/hadoop-2.7.2/logs/hadoop-root-balancer-sht-sgmhadoopnn-01.telenav.cn.out [root@sht-sgmhadoopnn-01 sbin# ./start-balancer.sh -threshold 5 starting balancer, logging to /hadoop/hadoop-2.7.2/logs/hadoop-root-balancer-sht-sgmhadoopnn-01.telenav.cn.out 运行这个命令start-balancer.sh -threshold 5和使用hdfs balancer -threshold 5是一样的 Usage: hdfs balancer [root@sht-sgmhadoopnn-01 bin# ./hdfs balancer -threshold 5 16/03/05 18:57:33 INFO balancer.Balancer: Using a threshold of 1.0 16/03/05 18:57:33 INFO balancer.Balancer: namenodes = [hdfs://mycluster 16/03/05 18:57:33 INFO balancer.Balancer: parameters = Balancer.Parameters[BalancingPolicy.Node, threshold=1.0, max idle iteration = 5, number of nodes to be excluded = 0, number of nodes to be included = 0 Time Stamp Iteration# Bytes Already Moved Bytes Left To Move Bytes Being Moved 16/03/05 18:57:34 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 16/03/05 18:57:35 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.58:50010 16/03/05 18:57:35 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.60:50010 16/03/05 18:57:35 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.66:50010 16/03/05 18:57:35 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.59:50010 16/03/05 18:57:35 INFO balancer.Balancer: 0 over-utilized: [ 16/03/05 18:57:35 INFO balancer.Balancer: 0 underutilized: [ The cluster is balanced. Exiting... Mar 5, 2016 6:57:35 PM 0 0 B 0 B -1 B Mar 5, 2016 6:57:35 PM Balancing took 2.66 seconds 1).为什么我执行该命令hdfs balancer -threshold 5平衡数据命令没有反应呢？5表示5%，群总存储使用率: 1.74%sht-sgmhadoopdn-01: 1.74%sht-sgmhadoopdn-02: 1.74%sht-sgmhadoopdn-03: 1.74%sht-sgmhadoopdn-04: 0%执行-threshold 5, 表示每一个 datanode 存储使用率和集群总存储使用率的差值都应该小于这个阀值5%；假如超过5%，会执行数据平衡操作。 B. 2).怎样判断执行命令是否会生效，数据平衡操作？ if (群总存储使用率 — 每一台datanode 存储使用率) > -threshold 5 #会执行数据平衡 else #该命令不生效 end ifC. 3).the threshold range of [1.0, 100.0],所以最小只能设置 -threshold 1 D. 4).balance命令可以执行早namenode或者datanode节点上执行命令hdfs balancer -threshold 2点击(此处)折叠或打开 [root@sht-sgmhadoopnn-01 hadoop# hdfs balancer -threshold 2……………..……………..16/03/08 16:08:09 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.59:5001016/03/08 16:08:09 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.58:5001016/03/08 16:08:09 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.66:5001016/03/08 16:08:09 INFO net.NetworkTopology: Adding a new node: /default-rack/172.16.101.60:5001016/03/08 16:08:09 INFO balancer.Balancer: 0 over-utilized: [16/03/08 16:08:09 INFO balancer.Balancer: 0 underutilized: [The cluster is balanced. Exiting...Mar 8, 2016 4:08:09 PM 1 382.22 MB 0 B -1 BMar 8, 2016 4:08:09 PM Balancing took 6.7001 minutes 新增数据节点的411.7M,偏差小于2%。 start-balancer.sh和stop-balancer.sh的源码解析： [root@sht-sgmhadoopnn-01 sbin]# more start-balancer.sh !/usr/bin/env bash bin=dirname "${BASH_SOURCE-$0}"bin=cd "$bin"; pwdDEFAULT_LIBEXEC_DIR="$bin"/../libexecHADOOP_LIBEXEC_DIR=${HADOOP_LIBEXEC_DIR:-$DEFAULT_LIBEXEC_DIR}. $HADOOP_LIBEXEC_DIR/hdfs-config.sh Start balancer daemon. "$HADOOP_PREFIX"/sbin/hadoop-daemon.sh --config $HADOOP_CONF_DIR --script "$bin"/hdfs start balancer $@解析：start-balancer.sh脚本其实最终还是调用hdfs start balancer $@ 命令,对于 $@ 是指shell脚本运行的传递的参数列表，一般参数为-threshold 5 [root@sht-sgmhadoopnn-01 sbin# more stop-balancer.sh !/usr/bin/env bash bin=dirname "${BASH_SOURCE-$0}"bin=cd "$bin"; pwdDEFAULT_LIBEXEC_DIR="$bin"/../libexecHADOOP_LIBEXEC_DIR=${HADOOP_LIBEXEC_DIR:-$DEFAULT_LIBEXEC_DIR}. $HADOOP_LIBEXEC_DIR/hdfs-config.sh Stop balancer daemon. Run this on the machine where the balancer is running "$HADOOP_PREFIX"/sbin/hadoop-daemon.sh --config $HADOOP_CONF_DIR --script "$bin"/hdfs stop balancer解析：stop-balancer.sh脚本其实最终还是调用hdfs stop balancer命令[root@sht-sgmhadoopnn-01 sbin# 注意事项：由于历史原因，hadoop集群中的机器的磁盘空间的大小各不相同，而HDFS在进行写入操作时，并没有考虑到这种情况，所以随着数据量的逐渐增加，磁盘较小的datanode机器上的磁盘空间很快将被写满，从而触发了报警。此时，不得不手工执行start-balancer.sh来进行balance操作，即使将dfs.balance.bandwidthPerSec 参数设置为10M/s，整个集群达到平衡也需要很长的时间，所以写了个crontab来每天凌晨来执行start-balancer.sh，由于此时集群不平衡的状态还没有那么严重，所以start-balancer.sh很快执行结束了。另外需要注意的地方是，由于HDFS需要启动单独的Rebalance Server来执行Rebalance操作，所以尽量不要在NameNode上执行start-balancer.sh，而是找一台比较空闲的机器。理论参考：http://www.aboutyun.com/thread-7354-1-1.html

2019-09-28

19、 Python快速开发分布式搜索引擎Scrapy精讲—css选择器

css选择器 1、 2、 3、 ::attr()获取元素属性，css选择器 ::text获取标签文本举例： extract_first('')获取过滤后的数据，返回字符串，有一个默认参数，也就是如果没有数据默认是什么，一般我们设置为空字符串 extract()获取过滤后的数据，返回字符串列表 #-*-coding:utf-8-*- importscrapy classPachSpider(scrapy.Spider): name='pach' allowed_domains=['blog.jobbole.com'] start_urls=['http://blog.jobbole.com/all-posts/'] defparse(self,response): asd=response.css('.archive-title::text').extract()#这里也可以用extract_first('')获取返回字符串 #print(asd) foriinasd: print(i) 【转载自：http://www.lqkweb.com】

2019-07-04

网商银行×OceanBase：首家云上银行的分布式数据库应用实践

本文将带读者深入了解网商银行在金融级分布式数据库 OceanBase 上的应用实践。

2019-06-10

阿里开源分布式事务框架seata实践(原fescar) springboot +durid+mybitas+自有rpc框架

官方文档地址https://github.com/seata/seata/wiki/Home_Chinese 1 由于系统演进，大佬觉得需要做微服务，脑子一拍开始对原来的系统进行微服务改造，在改造过程中，分布式事务不可避免

2019-05-29

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。