搜索[服务]结果-低调大师优秀个人博客

精选列表

搜索[服务]，共10000篇文章

Windows Azure Pack与VMware VRA 对比(二)安装VRA IaaS服务器

IaaS服务器主要提供web portal 的访问，工作流的处理等。这个服务要装在Windows server 2012 R2服务器上，前提条件比较多，安装过程中容易失败。

2017-01-12

Docker在云平台上的最佳实践：当容器服务遇到深度学习

阿里云容器服务阿里云容器服务底层为容器层，不存在公有云专有云分隔，相当于无边界计算，可以在任何环境下部署；阿里云在调度上进行了扩展，在阿里云不同地区部署容器服务时，可以根据高可用性把同样两个前端Web

2017-01-03

Centos7+Nginx+Keepalived实现Apache服务的高可用&负载均衡

实现WEB服务的高可用负载均衡服务，终于在2017年的第一天前完成了，所以在此分享给有需要的朋友；说到负载均衡，其实在linux下有很多服务可以实现，比如nginx、haproxy、lvs等服务，当前我们在前面的文章有介绍过了

2016-12-31

价格战之后，云计算市场将迎来云服务生态竞争

在12月的云栖大会广东分会上，阿里云宣布了2016年以来第18次降价：新用户华南区云服务器优惠至7折，中国各大区云数据库全系调价，平均降幅20%，云服务器独享实例最高降幅30%，并推出“免费套餐”计划，

2016-12-27

【阿里云网站日志分析实践】通过Log Service日志服务导入MaxCompute分析

免费开通大数据服务：https://www.aliyun.com/product/odps 日志服务收集的日志除了可以被实时查询外，还可以把日志数据投递到大数据计算服务MaxCompute（原ODPS）

2016-12-20

备份部分mysql表并上传至指定ftp服务器目录中

防伪码：忘情公子著前几天领导安排了一个任务，让写一个脚本备份某mysql数据库中的部分表，并要将备份好的文件上传至某ftp服务器中，于是就有了以下的脚本 #!

2016-12-15

使用E-MapReduce服务处理阿里云文件存储（NAS）的数据

简介文件存储是阿里云今年新推出的存储服务，因为它提供标准的文件访问协议，用户无需对现有应用做任何修改，即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布式文件系统。

2016-12-11

盘点:阿里云云服务器的优势表现在哪些方面

阿里云：云服务器的优势 1.安全稳定，数据可靠在无地震等重大自然灾害下，云服务器数据可靠性可达99.999%，让您的数据安全无忧！

2016-12-04

阿里云宣布CDN服务支持HTTP/2 访问速度最高可提升68%

在杭州云栖大会上，阿里云宣布极速CDN 6.0服务正式支持HTTP/2，访问速度最高可提升68%。一次向企业提供淘宝级的网络分发能力的同时，又能满足安全，可靠，高性能的海量需求。

2016-10-13

Skype For Business 2015实战系列16：安装并配置监控存档服务器

Skype For Business 2015实战系列16：安装并配置监控存档服务器前面的博文中为大家介绍了SFB2015的前段池、OWAS以及持久聊天服务器的部署。

2016-10-12

高性能Web服务之Httpd+Tomcat实现负债均衡反向代理实现

下面通过以下架构部署httpd+tomcat实现方向代理: 反向代理系统架构规划如下: 服务器角色服务器IP httpd eth0:172.16.100.1/16 eth1:192.168.56.10

2016-10-07

hbase源码系列（十二）Get、Scan在服务端是如何处理？

继上一篇讲了Put和Delete之后，这一篇我们讲Get和Scan, 因为我发现这两个操作几乎是一样的过程，就像之前的Put和Delete一样，上一篇我本来只打算写Put的，结果发现Delete也可以走这个过程，所以就一起写了。 Get 我们打开HRegionServer找到get方法。Get的方法处理分两种，设置了ClosestRowBefore和没有设置的，一般来讲，我们都是知道了明确的rowkey，不太会设置这个参数，它默认是false的。 if (get.hasClosestRowBefore() && get.getClosestRowBefore()) { byte[] row = get.getRow().toByteArray(); byte[] family = get.getColumn(0).getFamily().toByteArray(); r = region.getClosestRowBefore(row, family); } else { Get clientGet = ProtobufUtil.toGet(get); if (existence == null) { r = region.get(clientGet); } } 所以我们走的是HRegion的get方法，杀过去。 public Result get(final Get get) throws IOException { checkRow(get.getRow(), "Get"); // 检查列族，以下省略代码一百字 List<Cell> results = get(get, true); return Result.create(results, get.isCheckExistenceOnly() ? !results.isEmpty() : null); } 先检查get的row是否在这个region里面，然后检查列族，如果没有的话，它会根据表定义给补全的，然后它转身又进入了另外一个get方法，真是狠心啊！ List<Cell> results = new ArrayList<Cell>(); Scan scan = new Scan(get); RegionScanner scanner = null; try { scanner = getScanner(scan); scanner.next(results); } finally { if (scanner != null) scanner.close(); } 从上面可以看得出来，为什么我要把get和Scanner一起讲了吧，因为get也是一种特殊的Scan的方法，它只寻找一个row的数据。 Scan 下面开始讲Scan，在《HTable探秘》里面有个细节不知道注意到没，在查询之前，它要先OpenScanner获得要给ScannerId，这个OpenScanner其实也调用了scan方法，但是它过去不是干活的，而是先过去注册一个Scanner，订个租约，然后再把这个返回的ScannerId再次发送一个scan请求，这次才开始调用开始扫描。扫描的时候，走的是这一段： if (!done) { long maxResultSize = scanner.getMaxResultSize(); if (maxResultSize <= 0) { maxResultSize = maxScannerResultSize; } List<Cell> values = new ArrayList<Cell>(); MultiVersionConsistencyControl.setThreadReadPoint(scanner.getMvccReadPoint()); region.startRegionOperation(Operation.SCAN); try { int i = 0; synchronized(scanner) { for (; i < rows && currentScanResultSize < maxResultSize; i++) { // 它用的是这个nextRaw方法 boolean moreRows = scanner.nextRaw(values); if (!values.isEmpty()) { results.add(Result.create(values)); } if (!moreRows) { break; } values.clear(); } } } finally { region.closeRegionOperation(); } } // 没找到设置moreResults为false，找到了把结果添加到builder里面去 if (scanner.isFilterDone() && results.isEmpty()) { moreResults = false; results = null; } else { addResults(builder, results, controller); } } } 这里面有controller和result，这块的话，我求证了一下RpcServer那块，如果Rpc传输的时候使用了codec来压缩的话，就用controller返回结果，否则用response返回。这块就不管了不是重点，下面我们看一下RegionScanner。 RegionScanner详解与代码拆分我们冲过去看RegionScannerImpl吧，它在HRegion里面，我们直接去看nextRaw方法就可以了，get方法的那个next方法也是调用了nextRaw方法。 if (outResults.isEmpty()) { // 把结果存到outResults当中 returnResult = nextInternal(outResults, limit); } else { List<Cell> tmpList = new ArrayList<Cell>(); returnResult = nextInternal(tmpList, limit); outResults.addAll(tmpList); } 去nextInternal方法吧，这方法真大，尼玛，我要歇菜了，我们进入下一个阶段吧。 /** 把查询出来的结果保存到results当中 */ private boolean nextInternal(List<Cell> results, int limit) throws IOException { while (true) { //从storeHeap里面取出一个来 KeyValue current = this.storeHeap.peek(); byte[] currentRow = null; int offset = 0; short length = 0; if (current != null) { currentRow = current.getBuffer(); offset = current.getRowOffset(); length = current.getRowLength(); } //检查一下到这个row是否应该停止了 boolean stopRow = isStopRow(currentRow, offset, length); if (joinedContinuationRow == null) { // 如果要停止了，就用filter的filterRowCells过滤一下results. if (stopRow) { if (filter != null && filter.hasFilterRow()) { //使用filter过滤掉一些cells filter.filterRowCells(results); } return false; } // 如果有filter的话，过滤通过 if (filterRowKey(currentRow, offset, length)) { boolean moreRows = nextRow(currentRow, offset, length); if (!moreRows) return false; results.clear(); continue; } //把结果保存到results当中 KeyValue nextKv = populateResult(results, this.storeHeap, limit, currentRow, offset, length); // Ok, we are good, let's try to get some results from the main heap. // 在populateResult找到了足够limit数量的 if (nextKv == KV_LIMIT) { if (this.filter != null && filter.hasFilterRow()) { throw new IncompatibleFilterException( "Filter whose hasFilterRow() returns true is incompatible with scan with limit!"); } return true; // We hit the limit. } stopRow = nextKv == null || isStopRow(nextKv.getBuffer(), nextKv.getRowOffset(), nextKv.getRowLength()); // save that the row was empty before filters applied to it. final boolean isEmptyRow = results.isEmpty(); // We have the part of the row necessary for filtering (all of it, usually). // First filter with the filterRow(List). 过滤一下刚才找出来的 if (filter != null && filter.hasFilterRow()) { filter.filterRowCells(results); } //如果result的空的，啥也没找到，这是。。。悲剧啊 if (isEmptyRow) { boolean moreRows = nextRow(currentRow, offset, length); if (!moreRows) return false; results.clear(); // This row was totally filtered out, if this is NOT the last row, // we should continue on. Otherwise, nothing else to do. if (!stopRow) continue; return false; } // Ok, we are done with storeHeap for this row. // Now we may need to fetch additional, non-essential data into row. // These values are not needed for filter to work, so we postpone their // fetch to (possibly) reduce amount of data loads from disk. if (this.joinedHeap != null) { KeyValue nextJoinedKv = joinedHeap.peek(); // If joinedHeap is pointing to some other row, try to seek to a correct one. boolean mayHaveData = (nextJoinedKv != null && nextJoinedKv.matchingRow(currentRow, offset, length)) || (this.joinedHeap.requestSeek(KeyValue.createFirstOnRow(currentRow, offset, length), true, true) && joinedHeap.peek() != null && joinedHeap.peek().matchingRow(currentRow, offset, length)); if (mayHaveData) { joinedContinuationRow = current; populateFromJoinedHeap(results, limit); } } } else { // Populating from the joined heap was stopped by limits, populate some more. populateFromJoinedHeap(results, limit); } // We may have just called populateFromJoinedMap and hit the limits. If that is // the case, we need to call it again on the next next() invocation. if (joinedContinuationRow != null) { return true; } // Finally, we are done with both joinedHeap and storeHeap. // Double check to prevent empty rows from appearing in result. It could be // the case when SingleColumnValueExcludeFilter is used. if (results.isEmpty()) { boolean moreRows = nextRow(currentRow, offset, length); if (!moreRows) return false; if (!stopRow) continue; } // We are done. Return the result. return !stopRow; } } 上面那段代码真的很长很臭，尼玛。。被我折叠起来了，有兴趣的看一眼就行，我们先分解开来看吧，这里面有两个Heap，一个是storeHeap，一个是JoinedHeap，他们啥时候用呢？看一下它的构造方法吧。 for (Map.Entry<byte[], NavigableSet<byte[]>> entry : scan.getFamilyMap().entrySet()) { //遍历列族和列的映射关系，设置store相关的内容 Store store = stores.get(entry.getKey()); KeyValueScanner scanner = store.getScanner(scan, entry.getValue()); if (this.filter == null || !scan.doLoadColumnFamiliesOnDemand() || this.filter.isFamilyEssential(entry.getKey())) { scanners.add(scanner); } else { joinedScanners.add(scanner); } } this.storeHeap = new KeyValueHeap(scanners, comparator); if (!joinedScanners.isEmpty()) { this.joinedHeap = new KeyValueHeap(joinedScanners, comparator); } } 如果joinedScanners不空的话，就new一个joinedHeap出来，但是我们看看它的成立条件，有点儿难吧。 1、filter不为null 2、scan设置了doLoadColumnFamiliesOnDemand为true 3、设置了的filter的isFamilyEssential方法返回false，这个估计得自己写一个，因为我刚才去看了几个filter的这个方法默认都是用的FilterBase的方法返回false。好的，到这里我们有可以把上面那段代码砍掉很大一部分了，它的成立条件比较困难，所以很难出现了，那我们就挑重点的storeHeap来讲吧，我们先看着这三行。 Store store = stores.get(entry.getKey()); KeyValueScanner scanner = store.getScanner(scan, entry.getValue()); this.storeHeap = new KeyValueHeap(scanners, comparator); 通过列族获得相应的Store，然后通过getScanner返回scanner加到KeyValueHeap当中，我们应该去刺探一下HStore的getScanner方法，它new了一个StoreScanner返回，继续看StoreScanner。 public StoreScanner(Store store, ScanInfo scanInfo, Scan scan, final NavigableSet<byte[]> columns) throws IOException { matcher = new ScanQueryMatcher(scan, scanInfo, columns, ScanType.USER_SCAN, Long.MAX_VALUE, HConstants.LATEST_TIMESTAMP, oldestUnexpiredTS); // 返回MemStore、所有StoreFile的Scanner. List<KeyValueScanner> scanners = getScannersNoCompaction(); //explicitColumnQuery:是否过滤列族 lazySeekEnabledGlobally默认是true 如果文件数量超过1个，isParallelSeekEnabled就是true if (explicitColumnQuery && lazySeekEnabledGlobally) { for (KeyValueScanner scanner : scanners) { scanner.requestSeek(matcher.getStartKey(), false, true); } } else { if (!isParallelSeekEnabled) { for (KeyValueScanner scanner : scanners) { scanner.seek(matcher.getStartKey()); } } else { //一般走这里，并行查 parallelSeek(scanners, matcher.getStartKey()); } } // 一个堆里面包括了两个scanner，MemStore、StoreFile的Scanner heap = new KeyValueHeap(scanners, store.getComparator()); this.store.addChangedReaderObserver(this); } 对上面的代码，我们再慢慢来分解。 1、先new了一个ScanQueryMatcher，它是一个用来过滤的类，传参数的时候，需要传递scan和oldestUnexpiredTS进去，oldestUnexpiredTS是个参数，是（当前时间-列族的生存周期），小于这个时间戳的kv视为已经过期了，在它初始化的时候，我们注意一下它的startKey和stopRow，这个startKey要注意，它可不是我们设置的那个startRow，而是用这个startRow来new了一个DeleteFamily类型的KeyValue。 this.stopRow = scan.getStopRow(); this.startKey = KeyValue.createFirstDeleteFamilyOnRow(scan.getStartRow()) 2、接着我们看getScannersNoCompaction这个方法，它这里是返回了两个Scanner，MemStoreScanner和所有StoreFile的Scanner，在从StoreHeap中peak出来一个kv的时候，是从他们当中交替取出kv来的，StoreHeap从它的名字上面来看像是用了堆排序的算法，它的peek方法和next方法真有点儿复杂，下一章讲MemStore的时候再讲吧。 //获取所有的storefile，默认的实现没有用上startRow和stopRow storeFilesToScan = this.storeEngine.getStoreFileManager().getFilesForScanOrGet(isGet, startRow, stopRow); memStoreScanners = this.memstore.getScanners(); 默认的getStoreFileManager的getFilesForScanOrGet是返回了所有的StoreFile的Scanner，而不是通过startRow和stopRow做过滤，它的注释里面给出的解释，里面的files默认是按照seq id来排序的，而不是startKey，需要优化的可以从这里下手。 3、然后就开始先seek一下，而不是全表扫啊！ //过滤列族的情况 scanner.requestSeek(matcher.getStartKey(), false, true); //一般走这里，并行查 parallelSeek(scanners, matcher.getStartKey()); scanner.requestSeek不是所有情况都要seek，是查询Delete的时候，如果查询的kv的时间戳比文件的最大时间戳小，就seek到上次未查询到的kv；它这里可能会用上DeleteFamily删除真个family这种情况。 parallelSeek就是开多线程去调用Scanner的seek方法, MemStore的seek很简单，因为它的kv集合是一个排序好的集合，HFile的seek比较复杂，下面我用一个图来表达吧。在搜索HFile的时候，key先从一级索引找，通过它定位到细的二级索引，然后再定位到具体的block上面，到了HFileBlock之后，就不是seek了，就是遍历，遍历没什么好说的，不熟悉的朋友建议先回去看看《StoreFile存储格式》。注意哦，这个key就是我们的startKey哦，所以大家知道为什么要在scan的时候要设置StartKey了吗？ nextInternal的流程通过前面的分析，我们可以把nextInternal分解与拆分、抹去一些不必要的代码，我发现代码还是很难懂，所以我画了一个过程图出来代替那段代码。特别注意事项： 1、这个图是被我处理过的简化之后的图，还有在放弃该row的kv们之后并非都要进行是StopRow的判断，只是为了合并这个流程，我加上去的isStopRow的判断，但并不影响整个流程。 2、！isStopRow代表返回代码的(!isStopRow)的意思, 根据isStopRow的当前值来返回true或者false 3、true意味着退出，并且还有结果，false意味着退出，没有结果。诶，看到这里，还是没看到它是怎么用ScanQueryMatcher去过滤被删除的kv们啊，好，接下来我们重点考察这个问题。 ScanQueryMatcher如何过滤已经被删除的KeyValue 这个过程屏蔽在了filterRow之后通过的把该row的kv接到结果集的这一步里面去了。它在里面不停的调用KeyValueHeap的next方法，match的调用正好在这个方法。我们现在就去追踪这遗失的部分。我们直接去看它的match方法就好了，别的不用看了，它处理的情况好多好多，尼玛，这是要死人的节奏啊。 ScanQueryMatcher是用来处理一行数据之间的版本问题的，在每遇到一个新的row的时候，它都会先被设置matcher.setRow(row, offset, length)。 if (limit < 0 || matcher.row == null || !Bytes.equals(row, offset, length, matcher.row, matcher.rowOffset, matcher.rowLength)) { this.countPerRow = 0; matcher.setRow(row, offset, length); } 上面这段代码在StoreScanner的next方法里面，每当一行结束之后，都会调用这个方法。在讲match方法之前，我先讲一下rowkey的排序规则，rowkey 正序->family 正序->qualifier 正序->ts 降序->type 降序，那么对于同一个行、列族、列的数据，时间越近的排在前面，类型越大的排在前面，比如Delete就在Put前面，下面是它的类型表。 //search用 Minimum((byte)0), Put((byte)4), Delete((byte)8), DeleteFamilyVersion((byte)10), DeleteColumn((byte)12), DeleteFamily((byte)14), //search用 Maximum((byte)255); 为什么这里先KeyValue的排序规则呢，这当然有关系了，这关系着扫描的时候，谁先谁后的问题，如果时间戳小的在前面，下面这个过滤就不生效了。下面我们看看它的match方法的检查规则。 1、和当前行比较 //和当前的行进行比较，只有相等才继续，大于当前的行就要跳到下一行，小于说明有问题，停止 int ret = this.rowComparator.compareRows(row, this.rowOffset, this.rowLength, bytes, offset, rowLength); if (ret <= -1) { return MatchCode.DONE; } else if (ret >= 1) { return MatchCode.SEEK_NEXT_ROW; } 2、检查是否所有列都查过了 //所有的列都扫描过来 if (this.columns.done()) { stickyNextRow = true; return MatchCode.SEEK_NEXT_ROW; } 3、检查列的时间戳是否过期 long timestamp = kv.getTimestamp(); // 检查列的时间是否过期 if (columns.isDone(timestamp)) { return columns.getNextRowOrNextColumn(bytes, offset, qualLength); } 4a、如果是Delete的类型，加到ScanDeleteTraker。 if (kv.isDelete()) { this.deletes.add(bytes, offset, qualLength, timestamp, type); } 4b、如果不是，如果ScanDeleteTraker里面有Delete，就要让它经历ScanDeleteTraker的检验了（进宫前先验一下身） DeleteResult deleteResult = deletes.isDeleted(bytes, offset, qualLength, timestamp); switch (deleteResult) { case FAMILY_DELETED: case COLUMN_DELETED: return columns.getNextRowOrNextColumn(bytes, offset, qualLength); case VERSION_DELETED: case FAMILY_VERSION_DELETED: return MatchCode.SKIP; case NOT_DELETED: break; default: throw new RuntimeException("UNEXPECTED"); } 这里就要说一下刚才那几个Delete的了： 1）DeleteFamily是最凶狠的，生命周期也长，整个列族全删，基本上会一直存在 2）DeleteColum只删掉一个列，出现这个列的都会被干掉 3）DeleteFamilyVersion没遇到过 4）Delete最差劲儿了，只能删除指定时间戳的，时间戳一定要对哦，否则一旦发现不对的，这个Delete就失效了，可以说，生命周期只有一次，下面是源代码。 public DeleteResult isDeleted(byte [] buffer, int qualifierOffset, int qualifierLength, long timestamp) { //时间戳小于删除列族的时间戳，说明这个列族被删掉是后来的事情 if (hasFamilyStamp && timestamp <= familyStamp) { return DeleteResult.FAMILY_DELETED; } //检查时间戳 if (familyVersionStamps.contains(Long.valueOf(timestamp))) { return DeleteResult.FAMILY_VERSION_DELETED; } if (deleteBuffer != null) { int ret = Bytes.compareTo(deleteBuffer, deleteOffset, deleteLength, buffer, qualifierOffset, qualifierLength); if (ret == 0) { if (deleteType == KeyValue.Type.DeleteColumn.getCode()) { return DeleteResult.COLUMN_DELETED; } // 坑爹的Delete它只删除相同时间戳的，遇到不想的它就pass了 if (timestamp == deleteTimestamp) { return DeleteResult.VERSION_DELETED; } //时间戳不对，这个Delete失效了 deleteBuffer = null; } else if(ret < 0){ // row比当前的大，这个Delete也失效了 deleteBuffer = null; } else { throw new IllegalStateException(...); } } return DeleteResult.NOT_DELETED;上一章说过，Delete new出来之后什么都不设置，就是DeleteFamily级别的选手，所以在它之后的会全部被干掉，所以你们懂的，我们也会用DeleteColum来删除某一列数据，只要时间戳在它之前的kv就会被干掉，删某个指定版本的少，因为你得知道具体的时间戳，否则你删不了。例子详解DeleteFamily 假设我们有这些数据 KeyValue [] kvs1 = new KeyValue[] { KeyValueTestUtil.create("R1", "cf", "a", now, KeyValue.Type.Put, "dont-care"), KeyValueTestUtil.create("R1", "cf", "a", now, KeyValue.Type.DeleteFamily, "dont-care"), KeyValueTestUtil.create("R1", "cf", "a", now-500, KeyValue.Type.Put, "dont-care"), KeyValueTestUtil.create("R1", "cf", "a", now+500, KeyValue.Type.Put, "dont-care"), KeyValueTestUtil.create("R1", "cf", "a", now, KeyValue.Type.Put, "dont-care"), KeyValueTestUtil.create("R2", "cf", "z", now, KeyValue.Type.Put, "dont-care") }; Scan的参数是这些。 Scan scanSpec = new Scan(Bytes.toBytes("R1")); scanSpec.setMaxVersions(3); scanSpec.setBatch(10); StoreScanner scan = new StoreScanner(scanSpec, scanInfo, scanType, getCols("a","z"), scanners); 然后，我们先将他们排好序，是这样的。 R1/cf:a/1400602376242(now+500)/Put/vlen=9/mvcc=0, R1/cf:a/1400602375742(now)/DeleteFamily/vlen=9/mvcc=0, R2/cf:z/1400602375742(now)/Put/vlen=9/mvcc=0 所以到最后，黄色的三行会被删除，只剩下第一行和最后一行，但是最后一行也会被排除掉，因为它已经换行了，不是同一个行的，不在这一轮进行比较，返回MatchCode.DONE。 ---->回到前面是match过程 5、检查时间戳，即设置给Scan的时间戳，这个估计一般很少设置，时间戳过期，就返回下一个MatchCode.SEEK_NEXT_ROW。 6、检查列是否是Scan里面设置的需要查询的列。 7、检查列的版本，Scan设置的MaxVersion，超过了这个version就要赶紧闪人了哈，返回MatchCode.SEEK_NEXT_COL。对于match的结果，有几个常见的： 1、MatchCode.INCLUDE_AND_SEEK_NEXT_COL 包括当前这个，跳到下一列，会引发StoreScanner的reseek方法。 2、MatchCode.SKIP 忽略掉，继续调用next方法。 3、MatchCode.SEEK_NEXT_ROW 不包括当前这个，继续调用next方法。 4、MatchCode.SEEK_NEXT_COL 不包括它，跳过下一列，会引发StoreScanner的reseek方法。 5、MatchCode.DONE rowkey变了，要留到下次进行比较了讲到这里基本算结束了。关于测试呵呵，有兴趣测试的童鞋可以打开下hbase源码，找到TestStoreScanner这个类自己调试看下结果。

2016-09-10

hbase源码系列（十一）Put、Delete在服务端是如何处理？

在讲完之后HFile和HLog之后，今天我想分享是Put在Region Server经历些了什么？相信前面看了《HTable探秘》的朋友都会有印象，没看过的建议回去先看看，Put是通过MultiServerCallable来提交的多个Put，好，我们就先去这个类吧，在call方法里面，我们找到了这句。 responseProto = getStub().multi(controller, requestProto); 它调用了Region Server的multi方法。好，我们立即杀到HRegionServer去，搜索找到multi这个方法。 public MultiResponse multi(final RpcController rpcc, final MultiRequest request) throws ServiceException { // RpcController是属于后门的，这样返回的数据就不用序列化了 PayloadCarryingRpcController controller = (PayloadCarryingRpcController)rpcc; CellScanner cellScanner = controller != null? controller.cellScanner(): null; if (controller != null) controller.setCellScanner(null); List<CellScannable> cellsToReturn = null; MultiResponse.Builder responseBuilder = MultiResponse.newBuilder(); //取出来所有的Action for (RegionAction regionAction : request.getRegionActionList()) { this.requestCount.add(regionAction.getActionCount()); RegionActionResult.Builder regionActionResultBuilder = RegionActionResult.newBuilder(); HRegion region; try { //获取对应的HRegion region = getRegion(regionAction.getRegion()); } catch (IOException e) { responseBuilder.addRegionActionResult(regionActionResultBuilder.build()); continue; // 报告这个action有错 } if (regionAction.hasAtomic() && regionAction.getAtomic()) { try { //如果是原子操作，就走原子操作的通道 mutateRows(region, regionAction.getActionList(), cellScanner); } catch (IOException e) { regionActionResultBuilder.setException(ResponseConverter.buildException(e)); } } else { // 非原子性提交，把错误内部处理了 cellsToReturn = doNonAtomicRegionMutation(region, regionAction, cellScanner, regionActionResultBuilder, cellsToReturn); } responseBuilder.addRegionActionResult(regionActionResultBuilder.build()); } // 如果需要返回数据的话，就new一个createCellScanner扔回去 if (cellsToReturn != null && !cellsToReturn.isEmpty() && controller != null) { controller.setCellScanner(CellUtil.createCellScanner(cellsToReturn)); } return responseBuilder.build(); }这个方法里面还包括了PayloadCarryingRpcController和CellScanner可以看得出来它不只是被Put来用的，但是这些我们不管我们只看Put如何处理就行了。 1、取出来所有的action（Put），这里主要是put，因为我们调用客户端就是这么调用的，其实别的类型也可以支持，获取他们对应的region。 2、根据action的原子性来判断走哪个方法，原子性操作走mutateRows，非原子性操作走doNonAtomicRegionMutation方法，我查了一下这个Atomic到底是怎么回事，我搜索了一下代码，发现在调用HTable的mutateRow方法的时候，它设置了Atomic为true，这个是应该是支持一行数据的原子性的，有这个需求的童鞋可以尝试用这个方法，也是可以提交多个，包括Put、Delete操作。 regionMutationBuilder.setAtomic(true); getStub().multi(null, request); 我们先看doNonAtomicRegionMutation，这是我们常用的方式。 List<ClientProtos.Action> mutations = null; for (ClientProtos.Action action: actions.getActionList()) { ClientProtos.ResultOrException.Builder resultOrExceptionBuilder = null; try { Result r = null; if (action.hasGet()) { Get get = ProtobufUtil.toGet(action.getGet()); r = region.get(get); } else if (action.hasMutation()) { MutationType type = action.getMutation().getMutateType(); if (type != MutationType.PUT && type != MutationType.DELETE && mutations != null && !mutations.isEmpty()) { // 如果这个操作不是Put或者Delete的话，就一下子把前面的活都先干了？ doBatchOp(builder, region, mutations, cellScanner); mutations.clear(); } switch (type) { case APPEND: r = append(region, action.getMutation(), cellScanner); break; case INCREMENT: r = increment(region, action.getMutation(), cellScanner); break; case PUT: case DELETE: // 前面的那些，我们都用得少，或者是不用，不用管它们，看这里就行 if (mutations == null) { mutations = new ArrayList<ClientProtos.Action>(actions.getActionCount()); } mutations.add(action); break; default: throw new DoNotRetryIOException("Unsupported mutate type: " + type.name()); } } else { throw new HBaseIOException("Unexpected Action type"); } if (r != null) { ClientProtos.Result pbResult = null; if (isClientCellBlockSupport()) { pbResult = ProtobufUtil.toResultNoData(r); // if (cellsToReturn == null) cellsToReturn = new ArrayList<CellScannable>(); cellsToReturn.add(r); } else { pbResult = ProtobufUtil.toResult(r); } //把result编译成Protobuf码，返回 resultOrExceptionBuilder = ClientProtos.ResultOrException.newBuilder().setResult(pbResult); } } catch (IOException ie) { resultOrExceptionBuilder = ResultOrException.newBuilder(). setException(ResponseConverter.buildException(ie)); } if (resultOrExceptionBuilder != null) { // Propagate index. resultOrExceptionBuilder.setIndex(action.getIndex()); builder.addResultOrException(resultOrExceptionBuilder.build()); } } //进行批量操作 if (mutations != null && !mutations.isEmpty()) { doBatchOp(builder, region, mutations, cellScanner); } return cellsToReturn; 这里面代码很多，也适配了很多种类型，是个大而全的方法，但是我们这里用到的只是把Put、Delete等的类型转换添加到mutations的列表里，然后走下面这个批量操作。此外get的批量操作也是走的这个方法，里面它走的是HRegion.get的方法返回一个Result。 doBatchOp(builder, region, mutations, cellScanner);doBatchOp里面的代码我就不贴了，老帖代码就没意思了。 1、还是得把Put、Delete给转换类型，这里的批量操作只支持全是Delete或者全是Put。 2、用HRegion.batchMutate方法来执行操作，返回OperationStatus数组，记录每个action的状态，是成功，还是失败，或者是别的状态。在batchMutate里面首先就是检查是否是只读状态，然后检查是否是Meta Region的，是不执行MemStore检查了，因为MemStore的堆内存超过了阻塞队列的MemStore大小，就会报错误，太恶劣了。。。没catch的哦。 long addedSize = doMiniBatchMutation(batchOp, isReplay); //MemStore的大小到了阀值，就要flush到文件了 if (isFlushSize(newSize)) { requestFlush(); } doMiniBatchMutation就是我们的终极boss了，是个很长很臭的类，贴代码都不能一下子全贴。 1、实例化几个重要的类，后面具体会用到 //日志，isInReplay是否支持重做，这里是false WALEdit walEdit = new WALEdit(isInReplay); //控制多版本的MemStore flush的结果，每次flush的w都是一样的，就好像同一批号的食品 MultiVersionConsistencyControl.WriteEntry w = null; long txid = 0; //日志同步是否成功 boolean walSyncSuccessful = false; boolean locked = false; 2、检查Put和Delete里面的列族是否和Region持有的列族的定义相同，有时候我们在Delete的时候是不填列族的，这里它给这个缺的列族来一个KeyValue.Type.DeleteFamily，删除列族的类型。 3、给Row加锁，先计算hash值做key，如果该key没上过锁，就上一把锁，然后计算出来要写的action有多少个，记录到numReadyToWrite。 4、更新时间戳，把该action里面的所有的kv的时间戳更新为最新的时间戳，它这里也会把之前的没运行的也一起更新。 5、给该region加锁，这个时间点之后，就不允许读了，等待时间需要根据numReadyToWrite的数量来计算。 //加锁，现在要上锁了，这段时间内不允许读 lock(this.updatesLock.readLock(), numReadyToWrite); locked = true; //等待时间 final long waitTime = Math.min(maxBusyWaitDuration, busyWaitDuration * Math.min(numReadyToWrite, maxBusyWaitMultiplier)); if (!lock.tryLock(waitTime, TimeUnit.MILLISECONDS)) { throw new RegionTooBusyException( "failed to get a lock in " + waitTime + "ms"); } 6、上锁之后，下面就是重头戏了，也就是Put、Delete等的重点。给这些写入memstore的数据创建一个批次号。 //为这次添加进MemStore的数据添加一个批次号 w = mvcc.beginMemstoreInsert(); //这是批次号的计算方式，nextWriteNumber就等于memstore的写的次数+1 public WriteEntry beginMemstoreInsert() { synchronized (writeQueue) { long nextWriteNumber = ++memstoreWrite; WriteEntry e = new WriteEntry(nextWriteNumber); writeQueue.add(e); return e; } } 7、把kv们写入到memstore当中，然后计算出来一个添加数据之后的新的MemStore的大小addedSize。 //把kv们写入memstore long addedSize = 0; for (int i = firstIndex; i < lastIndexExclusive; i++) { if (batchOp.retCodeDetails[i].getOperationStatusCode() != OperationStatusCode.NOT_RUN) { continue; } addedSize += applyFamilyMapToMemstore(familyMaps[i], w); } 这个添加到MemStore里面也没啥神秘的，因为MemStore里面有两个kv的集合，它只是把kv添加到集合里面去，看下面的代码就知道了。 private long applyFamilyMapToMemstore(Map<byte[], List<Cell>> familyMap, MultiVersionConsistencyControl.WriteEntry localizedWriteEntry) { long size = 0;try {for (Map.Entry<byte[], List<Cell>> e : familyMap.entrySet()) { byte[] family = e.getKey(); List<Cell> cells = e.getValue(); //把kv添加到memstore当中 Store store = getStore(family); for (Cell cell: cells) { KeyValue kv = KeyValueUtil.ensureKeyValue(cell); kv.setMvccVersion(localizedWriteEntry.getWriteNumber()); size += store.add(kv); } } } return size; } 注意这一句话kv.setMvccVersion(localizedWriteEntry.getWriteNumber()); 后面会用到的。 8、把kv添加到日志当中，标志状态为成功，如果是用户设置了不写入日志的，它就不写入日志了。 Durability durability = Durability.USE_DEFAULT; for (int i = firstIndex; i < lastIndexExclusive; i++) { // 跳过状态不对的 if (batchOp.retCodeDetails[i].getOperationStatusCode() != OperationStatusCode.NOT_RUN) { continue; } //标志状态为成功 batchOp.retCodeDetails[i] = OperationStatus.SUCCESS; Mutation m = batchOp.operations[i]; //获取自定义的日志同步方式 Durability tmpDur = getEffectiveDurability(m.getDurability()); if (tmpDur.ordinal() > durability.ordinal()) { durability = tmpDur; } if (tmpDur == Durability.SKIP_WAL) { //记录日志的kv的大小，但是不写入到日志当中 recordMutationWithoutWal(m.getFamilyCellMap()); continue; } //把列族里面的kv全部添加到walEdit当中 addFamilyMapToWALEdit(familyMaps[i], walEdit); } 9、先异步添加日志，这里为什么是异步的，因为之前给上锁了，暂时不能读了，如果这里调用的是同步的方法，后果自己想象下。 Mutation mutation = batchOp.operations[firstIndex]; if (walEdit.size() > 0) { //异步添加日志 txid = this.log.appendNoSync(this.getRegionInfo(), this.htableDescriptor.getTableName(), walEdit, mutation.getClusterIds(), now, this.htableDescriptor); } 10、释放之前创建的锁。 //释放相关的锁 if (locked) { this.updatesLock.readLock().unlock(); locked = false; } releaseRowLocks(acquiredRowLocks); 11、同步日志。 if (walEdit.size() > 0) { syncOrDefer(txid, durability); } walSyncSuccessful = true; 12、结束该批次的操作。 if (w != null) { mvcc.completeMemstoreInsert(w); w = null; } 到这里其实就是结束了。但是如果添加到了MemStore里面了，但是日志没有同步成功呢？ finally { if (!walSyncSuccessful) { //如果日志没有成功， rollbackMemstore(batchOp, familyMaps, firstIndex, lastIndexExclusive); } ...... } 一路跟踪代码下去，跟踪到代码在MemStore的rollback方法里面。 KeyValue found = this.snapshot.get(kv); if (found != null && found.getMvccVersion() == kv.getMvccVersion()) { this.snapshot.remove(kv); } // 比较一下mvcc，相同就删除. found = this.kvset.get(kv); if (found != null && found.getMvccVersion() == kv.getMvccVersion()) { removeFromKVSet(kv); long s = heapSizeChange(kv, true); this.size.addAndGet(-s); } 比较了MvccVersion，发现是同一批次的，就干掉了。过程写得比较凌乱了，把之前的总结一下吧： 1、做准备工作，实例化变量 2、检查Put和Delete里面的列族是否和Region持有的列族的定义相同。 3、给Row加锁，先计算hash值做key，如果该key没上过锁，就上一把锁，然后计算出来要写的action有多少个，记录到numReadyToWrite。 4、更新时间戳，把该action里面的所有的kv的时间戳更新为最新的时间戳，它这里也会把之前的没运行的也一起更新。 5、给该region加锁，这个时间点之后，就不允许读了，等待时间需要根据numReadyToWrite的数量来计算。 6、上锁之后，下面就是重头戏了，也就是Put、Delete等的重点。给这些写入memstore的数据创建一个批次号。 7、把kv们写入到memstore当中，然后计算出来一个添加数据之后的新的MemStore的大小addedSize。 8、把kv添加到日志当中，标志状态为成功，如果是用户设置了不写入日志的，它就不写入日志了。 9、先异步添加日志。 10、释放之前创建的锁。 11、同步日志。 12、结束该批次的操作。 Final、同步日志没成功的，最后根据批次回滚MemStore中的操作。上面的过程适用于Put和Delete的批量操作，但是这里总感觉很好奇，就这样结束了，Put和Delete操作就没区别吗，那它怎么删除数据的？返回在第4步更新时间戳的时候，发现了一些猫腻，Delete的情况执行了prepareDeleteTimestamps方法，看看吧。 void prepareDeleteTimestamps(Map<byte[], List<Cell>> familyMap, byte[] byteNow) throws IOException { for (Map.Entry<byte[], List<Cell>> e : familyMap.entrySet()) { byte[] family = e.getKey(); List<Cell> cells = e.getValue(); //列和count的映射 Map<byte[], Integer> kvCount = new TreeMap<byte[], Integer>(Bytes.BYTES_COMPARATOR); for (Cell cell: cells) { KeyValue kv = KeyValueUtil.ensureKeyValue(cell); // 如果是时间戳是最新的话就执行下面这些操作 if (kv.isLatestTimestamp() && kv.isDeleteType()) { //new一个Get从Store里面去搜索 } else { kv.updateLatestStamp(byteNow); } } } } 看来一下代码，这里是上来先判断是否是最新的时间戳，我就回去看来一下Delete的构造函数，尼玛。。。 public Delete(byte [] row) { this(row, HConstants.LATEST_TIMESTAMP); } public Delete(byte [] row, long timestamp) { this(row, 0, row.length, timestamp); } 只传了rowkey进去的，它就是最新的。。然后看了一下注释，凡是在这个时间点之前的所有版本的所有列，我们都要删除。好吧，我们很无奈的宣布，我们只能走kv.isLatestTimestamp() && kv.isDeleteType()，下面是没放出来的代码。 byte[] qual = kv.getQualifier(); if (qual == null) qual = HConstants.EMPTY_BYTE_ARRAY; //想到相同列的每次+1 Integer count = kvCount.get(qual); if (count == null) { kvCount.put(qual, 1); } else { kvCount.put(qual, count + 1); } //更新之后把最新的count数量 count = kvCount.get(qual); Get get = new Get(kv.getRow()); get.setMaxVersions(count); get.addColumn(family, qual); //从store当中取出相应的result来 List<Cell> result = get(get, false); if (result.size() < count) { // Nothing to delete 数量不够。。更新最新的时间戳为现在的时间 kv.updateLatestStamp(byteNow); continue; } //数量超过了也不行 if (result.size() > count) { throw new RuntimeException("Unexpected size: " + result.size()); } //取最后一个的时间戳 KeyValue getkv = KeyValueUtil.ensureKeyValue(result.get(count - 1)); //更新kv的时间戳为getkv的时间戳 Bytes.putBytes(kv.getBuffer(), kv.getTimestampOffset(), getkv.getBuffer(), getkv.getTimestampOffset(), Bytes.SIZEOF_LONG); 这里又干了一个Get操作，把列族的多个版本的内容取出来，如果数量不符合预期也会有问题，但是这后面操作的中心思想就是：（a）按照预期来说，取出来的少了，就设置删除的时间戳为现在; （b）取出来的多了，就报错; （c）刚好的,就把Delete的时间戳设置为最大的那个的时间戳，但即便是这样也没有删除数据。回到这里我又想起来，只有在Compaction之后，hbase的文件才会变小，难道是在那个时候删除的？那在删除之前，我们进行Get或者Scan操作的时候，会不会读到这些没有被删除的数据呢？好，让我们拭目以待。

2016-09-10

为Windows Server 2012 R2指定授权服务器

为Windows Server 2012 R2指定授权服务器在Windows Server 2008 R2的终端服务中，可以手动指定授权服务器，而在Windows Server 2012 R2中，默认只能通过

2016-09-02

阿里云系列——2.服务器购买（详细步骤）---2015-11.12

如果还想优惠===>阿里云9折推荐码：AQAKK8，第一次购买云服务器或云数据库可享受原价9折优惠，可多人使用。

2016-05-08

xen虚拟化/阿里云服务器时间跑快怎么办

配置了ntp服务也依旧会产生时钟漂移，可以按照如下方法修复：打开grub，添加clock=tsccount选项 1 sed-i"s/ide0=noprobe/ide0=noprobe clock=tsccount

2016-04-06

在阿里云容器服务上创建Spring Boot应用之压测篇

上一篇文章“在阿里云容器服务上创建第一个Spring Boot应用”，讲述了如何通过Maven的Docker plugin上传镜像到阿里云的容器Hub，并通过阿里云的容器服务快速在云环境创建应用。

2016-02-01

当Docker遇到数据库：在阿里云容器服务中使用RDS

Docker与持久化服务最近一段时间以来，微服务架构和Docker成为了技术社区的“网红”。

2016-01-17

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

精选列表

Windows Azure Pack与VMware VRA 对比(二)安装VRA IaaS服务器

Docker在云平台上的最佳实践：当容器服务遇到深度学习

Centos7+Nginx+Keepalived实现Apache服务的高可用&负载均衡

价格战之后，云计算市场将迎来云服务生态竞争

centos7的ip地址.网关,DNS设置和服务的控制

【阿里云网站日志分析实践】通过Log Service日志服务导入MaxCompute分析

备份部分mysql表并上传至指定ftp服务器目录中

阿里云湖北区域服务提供商：阿里云CDN功能介绍

使用E-MapReduce服务处理阿里云文件存储（NAS）的数据

盘点:阿里云云服务器的优势表现在哪些方面

阿里云宣布CDN服务支持HTTP/2 访问速度最高可提升68%

Skype For Business 2015实战系列16：安装并配置监控存档服务器

高性能Web服务之Httpd+Tomcat实现负债均衡反向代理实现

hbase源码系列（十二）Get、Scan在服务端是如何处理？

hbase源码系列（十一）Put、Delete在服务端是如何处理？

为Windows Server 2012 R2指定授权服务器

阿里云系列——2.服务器购买（详细步骤）---2015-11.12

xen虚拟化/阿里云服务器时间跑快怎么办

在阿里云容器服务上创建Spring Boot应用之压测篇

当Docker遇到数据库：在阿里云容器服务中使用RDS

资源下载

Nacos

Spring

Sublime Text

WebStorm

欢迎您来访！

精选列表

Windows Azure Pack与VMware VRA 对比(二)安装VRA IaaS服务器

Docker在云平台上的最佳实践： 当容器服务遇到深度学习

Centos7+Nginx+Keepalived实现Apache服务的高可用&负载均衡

价格战之后，云计算市场将迎来云服务生态竞争

centos7的ip地址.网关,DNS设置和服务的控制

【阿里云网站日志分析实践】通过Log Service日志服务导入MaxCompute分析

备份部分mysql表并上传至指定ftp服务器目录中

阿里云湖北区域服务提供商：阿里云CDN功能介绍

使用E-MapReduce服务处理阿里云文件存储（NAS）的数据

盘点:阿里云云服务器的优势表现在哪些方面

阿里云宣布CDN服务支持HTTP/2 访问速度最高可提升68%

Skype For Business 2015实战系列16：安装并配置监控存档服务器

高性能Web服务之Httpd+Tomcat实现负债均衡反向代理实现

hbase源码系列（十二）Get、Scan在服务端是如何处理？

hbase源码系列（十一）Put、Delete在服务端是如何处理？

为Windows Server 2012 R2指定授权服务器

阿里云系列——2.服务器购买（详细步骤）---2015-11.12

xen虚拟化/阿里云服务器 时间跑快怎么办

在阿里云容器服务上创建Spring Boot应用之压测篇

当Docker遇到数据库：在阿里云容器服务中使用RDS

资源下载

Nacos

Spring

Sublime Text

WebStorm

欢迎您来访！

Docker在云平台上的最佳实践：当容器服务遇到深度学习

xen虚拟化/阿里云服务器时间跑快怎么办