搜索[分布式锁]结果-低调大师优秀个人博客

精选列表

搜索[分布式锁]，共10000篇文章

白话SpringCloud | 第八章：分布式配置中心的服务化及动态刷新

前言上一章节，简单介绍了分布式配置中心Spring Cloud Config的使用。同时，我们也遗漏了一些问题，比如如何配置实时生效，当服务端地址变更或者集群部署时，如何指定服务端地址？

2018-10-11

阿里云金融级分布式架构助力南京银行打造国内首家云上新金融

2018飞天技术汇，阿里云金融业务事业部高级专家石大伟带来题为阿里云金融级分布式架构的演讲。

2018-07-16

LC3|视角开源大数据生态下的高性能分布式文件系统

背景介绍盘古是阿里云自主研发的高可靠、高可用、高性能分布式文件系统，距今已经有将近10年的历史。

2018-07-09

引言为什么写这篇文章？首先，缓存由于其高并发和高性能的特性，已经在项目中被广泛使用。在读取缓存方面，大家没啥疑问，都是按照下图的流程来进行业务操作。但是在更新缓存方面，对于更新完数据库，是更新缓存呢，还是删除缓存。又或者是先删除缓存，再更新数据库，其实大家存在很大的争议。目前没有一篇全面的博客，对这几种方案进行解析。于是博主战战兢兢，顶着被大家喷的风险，写了这篇文章。文章结构本文由以下三个部分组成1、讲解缓存更新策略2、对每种策略进行缺点分析3、针对缺点给出改进方案正文先做一个说明，从理论上来说，给缓存设置过期时间，是保证最终一致性的解决方案。这种方案下，我们可以对存入缓存的数据设置过期时间，所有的写操作以数据库为准，对缓存操作只是尽最大努力即可。也就是说如果数据库写成功，缓存更新失败，那么只要到达过期时间，则后面的读请求自然会从数据库中读取新值然后回填缓存。因此，接下来讨论的思路不依赖于给缓存设置过期时间这个方案。在这里，我们讨论三种更新策略：先更新数据库，再更新缓存先删除缓存，再更新数据库先更新数据库，再删除缓存应该没人问我，为什么没有先更新缓存，再更新数据库这种策略。 (1)先更新数据库，再更新缓存这套方案，大家是普遍反对的。为什么呢？有如下两点原因。原因一（线程安全角度同时有请求A和请求B进行更新操作，那么会出现（1）线程A更新了数据库（2）线程B更新了数据库（3）线程B更新了缓存（4）线程A更新了缓存这就出现请求A更新缓存应该比请求B更新缓存早才对，但是因为网络等原因，B却比A更早更新了缓存。这就导致了脏数据，因此不考虑。原因二（业务场景角度）有如下两点：（1）如果你是一个写数据库场景比较多，而读数据场景比较少的业务需求，采用这种方案就会导致，数据压根还没读到，缓存就被频繁的更新，浪费性能。（2）如果你写入数据库的值，并不是直接写入缓存的，而是要经过一系列复杂的计算再写入缓存。那么，每次写入数据库后，都再次计算写入缓存的值，无疑是浪费性能的。显然，删除缓存更为适合。接下来讨论的就是争议最大的，先删缓存，再更新数据库。还是先更新数据库，再删缓存的问题。 (2)先删缓存，再更新数据库该方案会导致不一致的原因是。同时有一个请求A进行更新操作，另一个请求B进行查询操作。那么会出现如下情形:（1）请求A进行写操作，删除缓存（2）请求B查询发现缓存不存在（3）请求B去数据库查询得到旧值（4）请求B将旧值写入缓存（5）请求A将新值写入数据库上述情况就会导致不一致的情形出现。而且，如果不采用给缓存设置过期时间策略，该数据永远都是脏数据。那么，如何解决呢？采用延时双删策略伪代码如下 public void write(String key,Object data){ redis.delKey(key); db.updateData(data); Thread.sleep(1000); redis.delKey(key); } 转化为中文描述就是（1）先淘汰缓存（2）再写数据库（这两步和原来一样）（3）休眠1秒，再次淘汰缓存这么做，可以将1秒内所造成的缓存脏数据，再次删除。那么，这个1秒怎么确定的，具体该休眠多久呢？针对上面的情形，读者应该自行评估自己的项目的读数据业务逻辑的耗时。然后写数据的休眠时间则在读数据业务逻辑的耗时基础上，加几百ms即可。这么做的目的，就是确保读请求结束，写请求可以删除读请求造成的缓存脏数据。如果你用了mysql的读写分离架构怎么办？ok，在这种情况下，造成数据不一致的原因如下，还是两个请求，一个请求A进行更新操作，另一个请求B进行查询操作。（1）请求A进行写操作，删除缓存（2）请求A将数据写入数据库了，（3）请求B查询缓存发现，缓存没有值（4）请求B去从库查询，这时，还没有完成主从同步，因此查询到的是旧值（5）请求B将旧值写入缓存（6）数据库完成主从同步，从库变为新值上述情形，就是数据不一致的原因。还是使用双删延时策略。只是，睡眠时间修改为在主从同步的延时时间基础上，加几百ms。采用这种同步淘汰策略，吞吐量降低怎么办？ok，那就将第二次删除作为异步的。自己起一个线程，异步删除。这样，写的请求就不用沉睡一段时间后了，再返回。这么做，加大吞吐量。第二次删除,如果删除失败怎么办？这是个非常好的问题，因为第二次删除失败，就会出现如下情形。还是有两个请求，一个请求A进行更新操作，另一个请求B进行查询操作，为了方便，假设是单库：（1）请求A进行写操作，删除缓存（2）请求B查询发现缓存不存在（3）请求B去数据库查询得到旧值（4）请求B将旧值写入缓存（5）请求A将新值写入数据库（6）请求A试图去删除请求B写入对缓存值，结果失败了。ok,这也就是说。如果第二次删除缓存失败，会再次出现缓存和数据库不一致的问题。如何解决呢？具体解决方案，且看博主对第(3)种更新策略的解析。 (3)先更新数据库，再删缓存首先，先说一下。老外提出了一个缓存更新套路，名为《Cache-Aside pattern》。其中就指出失效：应用程序先从cache取数据，没有得到，则从数据库中取数据，成功后，放到缓存中。命中：应用程序从cache中取数据，取到后返回。更新：先把数据存到数据库中，成功后，再让缓存失效。另外，知名社交网站facebook也在论文《Scaling Memcache at Facebook》中提出，他们用的也是先更新数据库，再删缓存的策略。这种情况不存在并发问题么？不是的。假设这会有两个请求，一个请求A做查询操作，一个请求B做更新操作，那么会有如下情形产生（1）缓存刚好失效（2）请求A查询数据库，得一个旧值（3）请求B将新值写入数据库（4）请求B删除缓存（5）请求A将查到的旧值写入缓存ok，如果发生上述情况，确实是会发生脏数据。然而，发生这种情况的概率又有多少呢？发生上述情况有一个先天性条件，就是步骤（3）的写数据库操作比步骤（2）的读数据库操作耗时更短，才有可能使得步骤（4）先于步骤（5）。可是，大家想想，数据库的读操作的速度远快于写操作的（不然做读写分离干嘛，做读写分离的意义就是因为读操作比较快，耗资源少），因此步骤（3）耗时比步骤（2）更短，这一情形很难出现。假设，有人非要抬杠，有强迫症，一定要解决怎么办？如何解决上述并发问题？首先，给缓存设有效时间是一种方案。其次，采用策略（2）里给出的异步延时删除策略，保证读请求完成以后，再进行删除操作。还有其他造成不一致的原因么？有的，这也是缓存更新策略（2）和缓存更新策略（3）都存在的一个问题，如果删缓存失败了怎么办，那不是会有不一致的情况出现么。比如一个写数据请求，然后写入数据库了，删缓存失败了，这会就出现不一致的情况了。这也是缓存更新策略（2）里留下的最后一个疑问。如何解决？提供一个保障的重试机制即可，这里给出两套方案。方案一：如下图所示流程如下所示（1）更新数据库数据；（2）缓存因为种种问题删除失败（3）将需要删除的key发送至消息队列（4）自己消费消息，获得需要删除的key（5）继续重试删除操作，直到成功然而，该方案有一个缺点，对业务线代码造成大量的侵入。于是有了方案二，在方案二中，启动一个订阅程序去订阅数据库的binlog，获得需要操作的数据。在应用程序中，另起一段程序，获得这个订阅程序传来的信息，进行删除缓存操作。方案二：流程如下图所示：（1）更新数据库数据（2）数据库会将操作信息写入binlog日志当中（3）订阅程序提取出所需要的数据以及key（4）另起一段非业务代码，获得该信息（5）尝试删除缓存操作，发现删除失败（6）将这些信息发送至消息队列（7）重新从消息队列中获得该数据，重试操作。备注说明：上述的订阅binlog程序在mysql中有现成的中间件叫canal，可以完成订阅binlog日志的功能。至于oracle中，博主目前不知道有没有现成中间件可以使用。另外，重试机制，博主是采用的是消息队列的方式。如果对一致性要求不是很高，直接在程序中另起一个线程，每隔一段时间去重试即可，这些大家可以灵活自由发挥，只是提供一个思路。总结本文其实是对目前互联网中已有的一致性方案，进行了一个总结。对于先删缓存，再更新数据库的更新策略，还有方案提出维护一个内存队列的方式，博主看了一下，觉得实现异常复杂，没有必要，因此没有必要在文中给出。最后，希望大家有所收获。参考文献 1、主从DB与cache一致性2、缓存更新的套路

2018-06-15

90后实习生，是如何成长为阿里云分布式NoSQL领域专家

从5年前第一次进入阿里云实习到如今，我一直都在表格存储TableStore团队，参与分布式NoSQL的研发等工作。另外，我也是一名93年出生的90后，一度是团队内最年轻的人，直到最近一年才开始被打破。

2018-05-01

分布式系统开发工具包 —— 基于Kryo的Java对象序列化

Kryo是用于Java语言的一个快速和高效的对象图序列化框架。Kryo项目的目的是快速、高效、方便地使用API。当需要持久化对象的时候，不论是持久化到文件、数据库还是网络，都可以使用Kryo。目前Kryo已经到了4.0.1版本以上了。本文的介绍适用于V2.0+以上版本。安装Kryo 一般适用maven来Kryo包。使用官方版的Kryo的话可以引用下述配置代码 <dependency> <groupId>com.esotericsoftware</groupId> <artifactId>kryo</artifactId> <version>4.0.1</version> </dependency> 如果你已经在你的classpath下有了不同版本的asm了的话，上述依赖可能会碰到问题。这时你可以使用kyro-shaded jar包，它自身包含了它所需版本的asm，并且是位于在不同包里的。 <dependency> <groupId>com.esotericsoftware</groupId> <artifactId>kryo-shaded</artifactId> <version>4.0.1</version> </dependency> 如果你想试用最新的特性 <repository> <id>sonatype-snapshots</id> <name>sonatype snapshots repo</name> <url>https://oss.sonatype.org/content/repositories/snapshots</url> </repository> <dependency> <groupId>com.esotericsoftware</groupId> <artifactId>kryo</artifactId> <version>4.0.1-SNAPSHOT</version> </dependency> 开始使用Kryo库 import com.esotericsoftware.kryo.Kryo; import com.esotericsoftware.kryo.io.Output; import com.esotericsoftware.kryo.io.Input; // ... Kryo kryo = new Kryo(); // ... Output output = new Output(new FileOutputStream("file.bin")); SomeClass someObject = ... kryo.writeObject(output, someObject); output.close(); // ... Input input = new Input(new FileInputStream("file.bin")); SomeClass someObject = kryo.readObject(input, SomeClass.class); input.close(); Kryo类编排序列化，Output和Input类处理缓存字节和刷新到流中。参考连接： Kryo官网用于网络的Kryo Kryo为什么比Hessian快原文发布于：http://www.yesdata.net/2018/03/17/kyro/

2018-03-16

记一种分布式超大规模数据的实时快速排序算法

引言对数据进行处理的同学，经常会遇到排序需求，无论是内存数据还是磁盘数据。对于单点的数据，我们的处理比较简单，比如： select field_a from table_b order by field_a limit 100, 10; db.collection_b.find().sort({"field_a":1}).skip(100).limit(10); 存储服务的处理流程一般可抽象如下：信息爆炸的时代，数据早已不是单点所能承载的了，数据一般分布在大量节点上，假设某库中的数据均匀地分布在以下的所有节点上。这时sort, limit的一般方法是选择一个中间节点或者中间件来做合并处理：一般处理流程的动态表示如下: 我们将过程抽象，流程简化如下：注意第三步在数据节点中的查询结果范围为[0，skip+limit]。当我们想查询[skip

2018-01-09

分布式消息队列中间件系列研究之阿堂教程(基础篇-Local模式)

消息中间件在web分布式架构设计及性能优化方面有着非常重要的地位,目前，在很多大型网门户网站和商业大平台都有及为广泛的应用，如淘宝网，天猫网，京东商城，当当网，及腾讯，Facebook等电商或社交网站,

2017-11-26

CentOS7搭建开源分布式搜索平台ELK实现日志实时搜索并展示图表

一、简介 Elasticsearch是个基于Lucene实现的开源、分布式、restful的全文本搜索引擎，此外他还是一个分布式实时文档存储，其中每个文档的每个filed均是可被索引的数据，且可被搜索，

2017-11-21

Spark入门实战系列--10.分布式内存文件系统Tachyon介绍及安装部署

目前已经使用基于内存计算的分布式计算框架有：Spark、Impala及SAP的HANA等。

2017-11-15

分布式计算框架Mesos最新版本六大新特性揭秘

1、容器的网络隔离 Mesos 0.23 提供支持在容器部署前定义网络的监控和隔离规则。网络隔离避免了单个容器占用太多的端口、太多的带宽，以及造成其他用户数据包明显的延迟。每个运行的容器的网络统计数据可以在 slave 上从 /monitor/statistics.json 文件中读取。网络隔离对运行在 slave 上的多数 tasks 都是透明的(那些绑定到 port 0 和让内核分配给它们对应的端口)。这个特性仅仅是在 Linux 上实现并且需要设置 configure-time flag(配置时间标志位)。请参阅：http://mesos.apache.org/documentation/latest/network-monitoring/ 2、SSL 对通过 libevent 的任何 libprocess 通信提供 SSL 加密支持(目前还是实验性)。对 Mesos master 和它对应的 slaves 及 Frameworks 之间的流量进行加密，防止被窃听和伪造，对于提高信息安全至关重要。这个特性需要 configure-time flag 并且有一些性能的影响。请参阅：http://mesos.apache.org/documentation/latest/mesos-ssl 3、超售尝试在可撤销的资源上启动 tasks/executors，而 Mesos 可以随时撤销任务。重要的任务可以利用这些临时资源来提升性能。为了应对峰值负载以及一些无法预料的负载暴增，高优先级的 2C 服务会置备在大型集群上。因此，大多数时间，资源没有得到充分的利用。超售特性可以利用暂时没有使用的资源来执行一些后台运行的任务，比如后台分析、视频 /图像处理、芯片仿真，以及其他低优先级的工作，当资源被征用，这些任务可以被随时撤销。超售特性增加了两个新的 slave 的模块：资源估算和服务质量(QoS)控制，同时对现有的资源进行分配、资源监视器和 mesos slave 进行了扩展。请参阅：http://mesos.apache.org/documentation/latest/oversubscription/ 4、持久化卷尝试支持 Frameworks 提供创建磁盘持久化卷服务，这使得有状态服务例如 HDFS 以及 Cassandra 可以通过 Mesos 存储相关数据，而不是像之前必须将数据存储在网络挂载的 EBS 卷或者将数据放置在其他位置使得磁盘资源不受管理。详情请参阅：http://mesos.apache.org/documentation/latest/persistent-volume/ 5、动态保留 Framework 可以对特定的 salve 上的动态资源进行预留(实验性支持)。不需要操作者在 slave 启动的时候指定一个固定的、预先计算好的“静态”资源，现在 Framework 可以预留 slave 提供的资源而无需重启 salve。现有的动态预留机制重大改变，这意味着现有的静态预留机制继续全力支持。请参阅：http://mesos.apache.org/documentation/latest/reservation/ 6、缓存抓取 Executor/task 的二进制文件读取器(fetcher)现在支持缓存机制(实验性)。现在可以指示读取器将通过 URI 下载的二进制文件缓存到一个专用的目录，这样后续的下载可以重用。如果对于URI的 “cache” 标志位是 true，缓存读取机制将会生效。如果 URI 是第一次被下载(对于特定用户)，则首先下载到高速缓存中，然后从那里复制到 sandbox 目录。如果相同的 URI 再次被遇到(对于同一个用户!)，而且相应的缓存文件还在缓存中，则不会进行重复下载，此时读取器会直接从高速缓存进行拷贝。请参阅：http://mesos.apache.org/documentation/latest/fetcher/ 本文作者：佚名来源：51CTO

2017-08-01

8月2日云栖精选夜读：微服务架构的分布式事务解决方案

分布式事务是一个绕不过去的挑战！微服务架构本质上就是分布式服务化架构，微服务架构的流行，让分布式事务问题日益突出！

2017-08-01

英特尔开源分布式深度学习库BigDL：支持高性能大数据分析

近日，英特尔开源了一个运行在 Apache Spark 上的分布式深度学习库 BigDL，其可以利用已有的 Spark 集群来运行深度学习计算，并且还能简化从 Hadoop 的大数据集的数据加载。

2017-07-31

晶科能源钱晶：分布式光伏是新工业革命必然选择

“能称之为革命的，必然它将在一定程度上改变了很多产业的生态规则，互联网是一个核心要素，而能真正意义上和互联网结合的最佳能源组合形式是新能源，特别是分布式光伏能源。”

2017-07-02

分布式资本沈波：未来区块链杀手级应用将出现在“+区块链”

会上，分布式资本创始管理人沈波作了《区块链的投资现状与发展趋势》演讲。沈波表示，由于区块链的共识机制和无法篡改两大特点，它在各行各业皆有应用潜力。行业目前处在区块链的启蒙恢复期，正是投资的好时机。

2017-07-02

《Spark大数据分析：核心概念、技术及实践》一1.6 分布式SQL查询引擎

1.6 分布式SQL查询引擎如前所述，SQL是最常用来查询和分析数据的语言之一。它易学且有群众基础（了解SQL的人远比了解编程语言如Java的人多）。基本上，Hive就是因此而诞生。

2017-05-01

《Hadoop实战手册》一第1章 Hadoop分布式文件系统——导入和导出数据

第1章 Hadoop分布式文件系统——导入和导出数据 Hadoop实战手册本章我们将介绍：使用Hadoop shell命令导入和导出数据到HDFS 使用distcp实现集群间数据复制使用Sqoop从

2017-05-01

SAP，Stratasys开始3D打印联合创新实验室的分布式制造计划

SAP，Stratasys开始3D打印联合创新实验室的分布式制造计划 http://mp.weixin.qq.com/s?

2016-12-05

基于hadoop集群的Hive1.2.1、Hbase1.2.2、Zookeeper3.4.8完全分布式安装

写在前边的话： hadoop2.7完全分布式安装请参考：点击阅读，继任该篇博客之后，诞生了下面的这一篇博客基本环境： Hadoop 2.7 Java 1.7.0

2016-07-26

ionet 25.3 发布，纳秒级延迟的分布式 java netty 轻量级网络通信框架

如果是的话，这里向你推荐一个由 java 语言编写的分布式网络编程框架 ionet。 ionet 是一个开源的轻量级基于 Aeron 的分布式网络编程框架，框架能够做到纳秒级别的端到端延迟。

2026-01-29

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

精选列表

白话SpringCloud | 第八章：分布式配置中心的服务化及动态刷新

阿里云金融级分布式架构助力南京银行打造国内首家云上新金融

LC3|视角开源大数据生态下的高性能分布式文件系统

分布式之数据库和缓存双写一致性方案解析

90后实习生，是如何成长为阿里云分布式NoSQL领域专家

分布式系统开发工具包 —— 基于Kryo的Java对象序列化

记一种分布式超大规模数据的实时快速排序算法

分布式消息队列中间件系列研究之阿堂教程(基础篇-Local模式)

CentOS7搭建开源分布式搜索平台ELK实现日志实时搜索并展示图表

Spark入门实战系列--10.分布式内存文件系统Tachyon介绍及安装部署

分布式计算框架Mesos最新版本六大新特性揭秘

8月2日云栖精选夜读：微服务架构的分布式事务解决方案

英特尔开源分布式深度学习库BigDL：支持高性能大数据分析

晶科能源钱晶：分布式光伏是新工业革命必然选择

分布式资本沈波：未来区块链杀手级应用将出现在“+区块链”

《Spark大数据分析：核心概念、技术及实践》一1.6 分布式SQL查询引擎

《Hadoop实战手册》一第1章 Hadoop分布式文件系统——导入和导出数据

SAP，Stratasys开始3D打印联合创新实验室的分布式制造计划

基于hadoop集群的Hive1.2.1、Hbase1.2.2、Zookeeper3.4.8完全分布式安装

ionet 25.3 发布，纳秒级延迟的分布式 java netty 轻量级网络通信框架

资源下载

Mario

Nacos

Spring

WebStorm

欢迎您来访！

精选列表

白话SpringCloud | 第八章：分布式配置中心的服务化及动态刷新

阿里云金融级分布式架构助力南京银行打造国内首家云上新金融

LC3|视角 开源大数据生态下的高性能分布式文件系统

分布式之数据库和缓存双写一致性方案解析

90后实习生，是如何成长为阿里云分布式NoSQL领域专家

分布式系统开发工具包 —— 基于Kryo的Java对象序列化

记一种分布式超大规模数据的实时快速排序算法

分布式消息队列中间件系列研究之阿堂教程(基础篇-Local模式)

CentOS7搭建开源分布式搜索平台ELK实现日志实时搜索并展示图表

Spark入门实战系列--10.分布式内存文件系统Tachyon介绍及安装部署

分布式计算框架Mesos最新版本六大新特性揭秘

8月2日云栖精选夜读：微服务架构的分布式事务解决方案

英特尔开源分布式深度学习库BigDL：支持高性能大数据分析

晶科能源钱晶：分布式光伏是新工业革命必然选择

分布式资本沈波：未来区块链杀手级应用将出现在“+区块链”

《Spark大数据分析：核心概念、技术及实践》一1.6 分布式SQL查询引擎

《Hadoop实战手册》一第1章 Hadoop分布式文件系统——导入和导出数据

SAP，Stratasys开始3D打印联合创新实验室的分布式制造计划

基于hadoop集群的Hive1.2.1、Hbase1.2.2、Zookeeper3.4.8完全分布式安装

ionet 25.3 发布，纳秒级延迟的分布式 java netty 轻量级网络通信框架

资源下载

Mario

Nacos

Spring

WebStorm

欢迎您来访！

LC3|视角开源大数据生态下的高性能分布式文件系统