生产事故（MongoDB数据分布不均解决方案）-低调大师

生产事故（MongoDB数据分布不均解决方案）

2019-11-29 636

事故集合：

可以很明显可以看到我们这个集合的数据严重分布不均匀。

一共有8个分片，面对这个情况我首先想到的是手动拆分数据块，但这不是解决此问题的根本办法。

    造成此次生产事故的首要原因就是片键选择上的问题，由于片键选择失误，在数据量级不大的时候数据看起来还是很健康的，但随着数据量的暴涨，问题就慢慢浮出了水面，我们使用的组合片键并不是无规律的，片键内容是线性增长的，这就导致了数据的不正常聚集。由于数据分布不均匀，我们有两个分片的磁盘使用率接近80%，数据还在持续增长，这个问题必须尽快解决。

涉及到此次事故的集合一共有三个，总数据量加起来接近30T，数据总量300亿左右。

下面是我解决此问题的解决方案：

方案一：

第一步：创建一个新的分片表，片键我选择_id做hashed分片，并提前分好了数据块，降低在恢复期间频繁切割数据造成的服务器压力。

sh.shardCollection("loan_his.collection",{_id:"hashed"},false,{numInitialChunks:1024})

第二步：单独连接各个分片将8个分片的数据全量备份：

nohup mongodump -u loan_his -p loan_his --authenticationDatabase loan_his  -h ${replset} --db loan_his --collection ${collectionName} --query '{"txdt": { $lte: "2019-07-09"} }' -o ${bak_dir} &>>  ${log} &

你可能会问为什么不连接mongos,因为我在连接mongos做数据备份时出现了以下异常：

2019-07-08T16:10:03.886+0800	Failed: error writing data for collection `loan_his.ods_cus_trad` to disk: error reading collection: operation was interrupted

可能是因为集合内的数据坏块吧，此异常信息是我备份了将近70%的数据后突然抛出的异常信息。

除了这个原因，单独备份各个分片的数据后你能够自由控制恢复数据的时间窗口，不会因为恢复单个数据文件时间较长，突发意外情况导致恢复中断从头再来的窘境。能够根据服务器的状态避开高峰期来进行数据恢复。

备份期间我发现了有时候备份出来的总文档数和 db.collection.getShardDistribution() 查看的文档数不一致，我还以为是备份期间出了问题，但我删除当前备份文件后重新备份出来的文档数还是和之前一样。目前不知道是怎么回事，怀疑是坏的数据块引发的我问题，备份出来的数据一般会比原数据量多几万条数据，有时候会少一些。

第三步：恢复数据：

 mongorestore -u loan_his -p loan_his --authenticationDatabase loan_his -h 10.0.156.9:27017 --db loan_his  --collection  ${collectionName_two}  /mongodb/${collectionName}/replset_sh2/loan_his/${collectionName}.bson  &>>  ${log}

在恢复数据前千万要记得不要创建索引！否则性能极差，速度非常非常慢！在使用mongodump工具备份时，在数据文件的同级目录下会有一个 XXXXX.metadata.json 索引文件，默认会在数据恢复完毕后执行创建索引的操作。

此处有坑需要注意：因为备份出来的数据是由原表备份出来的，那这个索引文件也是原表的索引，由于原表我使用的是组合片键做的分片，所以在原表内会存在一个由片键组成的组合索引，并且不是后台创建的组合索引！！！这意味着如果你使用此索引文件来给新表创建索引，会造成这个集群处于阻塞状态，无法响应任何操作！！直至索引创建完毕。所以你可以将这个索引文件备份到其它目录以作参考，然后将原文件删除就可以了，恢复数据时不会有其它的问题。

如果恢复期间出现了意外情况导致恢复失败，比如节点宕机什么的，不需要担心，重新执行恢复程序，数据文件不会重复增加，因为备份出来的数据文件包含mongodb自带的 Objectld对象_id ,导入时，如果已存在此ID,将不会插入数据。注意：在不同集合是允许出现相同ID的，所以在使用方案二恢复数据时，新产生的数据不能通过新表A备份出来汇入新表C，需要通过原始数据文件重新导入。

第四步：创建索引：

待所有数据恢复完毕后再创建索引，一定要记得后台创建！！！你也可以将索引拆分，一个一个的来。如果觉得此操作对业务影响较大，请看本文最后的解决方案。

mongo 10.0.156.2:27017/loan_his -uloan_his -ploan_his -eval 'db.getSiblingDB("loan_his").runCommand({createIndexes: "collection",indexes: [{"v":2,"key":{"_id":1},"name":"_id_","ns":"loan_his.collection"},{"v":2,"key":{"opnode":1.0,"txdt":1.0,"acct":1.0,"crdno":1.0},"name":"opnode_1_txdt_1_acct_1_crdno_1","ns":"loan_his.collection"},{"v":2,"key":{"txdt":1.0,"opnode":1.0,"acct":1.0,"crdno":1.0,"pbknum":1.0},"name":"txdt_1_opnode_1_acct_1_crdno_1_pbknum_1","ns":"loan_his.collection","background":true},{"v":2,"key":{"acct":1.0,"txdt":1.0,"opnode":1.0},"name":"acct_1_txdt_1_opnode_1","ns":"loan_his.collection","background":true},{"v":2,"key":{"crdno":1.0,"txdt":1.0,"opnode":1.0},"name":"crdno_1_txdt_1_opnode_1","ns":"loan_his.collection","background":true},{"v":2,"key":{"pbknum":1.0,"txdt":1.0,"opnode":1.0},"name":"pbknum_1_txdt_1_opnode_1","ns":"loan_his.collection","background":true}]})'

停止失控索引：

一旦你触发一个索引，简单的重启服务并不能解决这个问题，因为MongoDB会继续重启前的建索引的工作。如果之前你运行后台建索引任务，在服务重启后它会变成前台运行的任务。在这种情况下，重启会让问题变得更糟糕。MongoDB提供了选项“noIndexBuildRetry”，它会指示MongoDB重启后不再继续没建完的索引。如果不小心在前台创建了索引导致集群不可用，可以使用--noIndexBuildRetry 参数重启各个分片来停止索引的创建过程，只用重启主节点就可以了。如果是在后台创建索引，重启时记得加上--noIndexBuildRetry，否则重启后创建索引的线程会重新被唤醒，并由后台创建变为前台创建，导致整个集群不可用。

mongod -f $CONFIGFILE --noIndexBuildRetry

此方案迁移期间不用通知业务系统做变更，把数据迁移完毕后，通知业务系统将表名变更，弊端就是在你迁移的过程中数据还是会持续增长的，问题分片的磁盘容量会越来越少。

方案二：

为了避免在迁移期间数据仍在增长，导致数据还没迁移完毕磁盘就爆满的情况，可以选择停止往旧表B内写入数据，创建一个健康的新表A，新的数据往新表A内写，具体的查询方案需要应用系统的配合。然后将旧表B的数据迁移至新表C中，最终将新表A的数据汇入新表C , 完成数据迁移。此次迁移数据耗时共9个月！！！片键一定要慎重选择，因为我们使用的MongoDB是3.4.7版本的，不支持修改片键，最新版本支持片键的修改。

接下来介绍数据量较大时如何构建索引--减少业务最少影响

在数据量较大或请求量较大,直接建立索引对性能有显著影响时,可以利用复制集(数据量较大时一般为线上环境,使用复制集为必然选择或者使用分片.)中部分机器宕机不影响复制集工作的特性,继而建立索引。

(1)首先把 secondary server 停止，再注释 --replSet 参数，并且更改 MongoDB port 之后重新启动 MongoDB，这时候 MongoDB 将进入 standalone 模式；

(2).在 standalone 模式下运行命令 ensureIndex 建立索引，使用 foreground 方式运行也可以，建议使用background方式运行；

(3)建立索引完毕之后关闭 secondary server 按正常方式启动;

4.根据上述 1~3 的步骤轮流为 secondary 建立索引，最后把 primary server 临时转换为 secondary server，同样按 1~3 的方法建立索引，再把其转换为 primary server。

日志内容大致如下：

2019-09-24T18:51:39.003+0800 I -        [conn33]   Index Build: 838416900/876543270 95%
2019-09-24T20:10:08.360+0800 I INDEX    [conn33] 	 done building bottom layer, going to commit
2019-09-24T20:10:26.001+0800 I -        [conn33]   Index: (2/3) BTree Bottom Up Progress: 11684400/876543270 1%
done building bottom layer, going to commit

微信关注我们

原文链接：https://my.oschina.net/u/3953038/blog/3135284

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

联想持续推动“全球化+中国特色”战略落地，携手VMware助力中国企业智能化转型

【51CTO.com原创稿件】今年初，联想提出了以智能物联网Smart IoT、智能基础架构Smart Infrastructure和行业智能Smart Verticals三个维度组成的“3S”战略，进而成长为 “端-边-云-网”智能计算架构的开创者，通过为客户提供更好的技术、产品和解决方案，满足企业对新技术、新方案的需求，更好的帮助客户完成智能化转型。在本月召开的第五届联想创新科技大会(Lenovo Tech World 2019)上，联想企业业务集团首次公开亮相，并在智能基础架构领域打造了鲜明的联想企业业务品牌形象，致力于成为中国最顶尖的算力提供商，并以端到端的解决方案全面助力中国客户智能化转型。作为中国企业可信赖的数字化转型服务供应商，联想企业业务集团为了更好地服务于中国客户，还积极与业界厂商合作，共同推进智能化变革。在Lenovo Tech World 2019论坛上，联想企业业务集团就宣布了多项合作成果，这其中就包括与VMware的合作。在上周举行的vFORUM 2019上，联想正式与VMware签署战略合作备忘录，双方将加强在超融合架构、虚拟化软件以及联想混合云服务等方面...

2019-11-28

818

近期，由葡萄城推出的ComponentOne .NET开发控件集正式发布最新版本！ ComponentOne 是一套专注于企业 .NET开发、支持 .NET Core 平台，并完美集成于 Visual Studio 的第三方控件集，包含 300 多种 .NET 控件种类，提供表格数据处理、数据可视化、报表、日程安排、输入和编辑等七大功能。本次新版本有一项令无数开发者感到兴奋的新特性： ComponentOne加入了全新的UI控件——Blazor UI。 Blazor是什么？它是一项将C＃和 .NET都放入浏览器的Microsoft技术。使用Blazor，开发人员可以在服务器和客户端上直接使用C＃编码，构建丰富的Web应用程序。Blazor使用WebAssembly来工作，WebAssembly是一种高性能的管道，可以将代码预编译为紧凑的二进制格式。最重要的是，每个主流浏览器（包括移动版本）都支持WebAssembly。而在ComponentOne 中加入 Blazor UI控件，意味着C＃开发者可以不再过多依赖于HTML、JavaScript和CSS，直接构建出更高性能的移动互联网...

2019-11-29

661

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。