架构设计 | 分布式业务系统中,全局ID生成策略
一、全局ID简介
在实际的开发中,几乎所有的业务场景产生的数据,都需要一个唯一ID作为核心标识,用来流程化管理。比如常见的:
- 订单:order-id,查订单详情,物流状态等;
- 支付:pay-id,支付状态,基于ID事务管理;
如何生成唯一标识,在普通场景下,一般的方法就可以解决,例如:
import java.util.UUID; public class UuidUtil { public static String getUUid() { UUID uuid = UUID.randomUUID(); return String.valueOf(uuid).replace("-",""); } }
这个方法可以解决绝大部分唯一ID需求的场景业务,但是网上各种UUID重复场景的描述帖,说的好像该API不好用。
絮叨一句
:说一个真实使用的业务场景,大概是半年近3000万的数据流水,用的就是UUID的API,暂时未捕捉到ID重复的问题,仅供参考。
二、雪花算法
1、概念简介
Twitter公司开源的分布式ID生成算法策略,生成的ID遵循时间的顺序。
- 1为位标识,始终为0,不可用;
- 41位时间截,存储时间截的差值(当前时间截-开始时间截);
- 10位的机器标识,10位的长度最多支持部署1024个节点;
- 12位序列,毫秒内的计数,12位的计数顺序号支持每个节点每毫秒产生4096个ID序号;
SnowFlake的优点是,整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分),并且效率较高。
2、编码实现
工具类中很多可以自定义的,比如起始时间,机器ID配置等。
/** * 雪花算法ID生成 */ public class SnowIdWorkerUtil { // 开始时间截 (2020-01-02) private final long timeToCut = 1577894400000L; // 机器ID所占的位数 private final long workerIdBits = 2L; // 数据标识ID所占的位数 private final long dataCenterIdBits = 8L; // 支持的最大机器ID,结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数) private final long maxWorkerId = -1L ^ (-1L << workerIdBits); // 支持的最大数据标识ID,结果是31 private final long maxDataCenterId = -1L ^ (-1L << dataCenterIdBits); // 序列在ID中占的位数 private final long sequenceBits = 12L; // 机器ID向左移12位 private final long workerIdShift = sequenceBits; // 数据标识ID向左移17位(12+5) private final long dataCenterIdShift = sequenceBits + workerIdBits; // 时间截向左移22位(5+5+12) private final long timestampLeftShift = sequenceBits + workerIdBits + dataCenterIdBits; // 生成序列的掩码 private final long sequenceMask = -1L ^ (-1L << sequenceBits); // 工作机器ID(0~31) private long workerId; // 数据中心ID(0~31) private long dataCenterId; // 毫秒内序列(0~4095) private long sequence = 0L; // 上次生成ID的时间截 private long lastTimestamp = -1L; /** * 构造函数 * @param workerId 工作ID (0~31) * @param dataCenterId 数据中心ID (0~31) */ public SnowIdWorkerUtil (long workerId, long dataCenterId) { if (workerId > maxWorkerId || workerId < 0) { throw new IllegalArgumentException("workerId 不符合条件"); } if (dataCenterId > maxDataCenterId || dataCenterId < 0) { throw new IllegalArgumentException("dataCenterId 不符合条件"); } this.workerId = workerId; this.dataCenterId = dataCenterId; } public synchronized String nextIdVar(){ return String.valueOf(nextId()); } /** * 线程安全,获得下一个ID */ private synchronized long nextId() { long timestamp = timeGen(); // 如果当前时间小于上一次ID生成的时间戳,抛出异常 if (timestamp < lastTimestamp) { throw new RuntimeException(String.format( "时间顺序异常,时间差(上次时间-现在)=%d", lastTimestamp - timestamp)); } // 如果是同一时间生成的,则进行毫秒内序列 if (lastTimestamp == timestamp) { sequence = (sequence + 1) & sequenceMask; //毫秒内序列溢出 if (sequence == 0) { //阻塞到下一个毫秒,获得新的时间戳 timestamp = tilNextMillis(lastTimestamp); } } else { // 时间戳改变,毫秒内序列重置 sequence = 0L; } // 上次生成ID的时间截 lastTimestamp = timestamp; // 移位并通过或运算拼到一起组成64位的ID return ((timestamp - timeToCut) << timestampLeftShift) | (dataCenterId << dataCenterIdShift) | (workerId << workerIdShift) | sequence; } /** * 阻塞,获得新的时间戳 */ private long tilNextMillis(long lastTimestamp) { long timestamp = timeGen(); while (timestamp <= lastTimestamp) { timestamp = timeGen(); } return timestamp; } /** * 返回当前时间节点 */ private long timeGen() { return System.currentTimeMillis(); } public static void main(String[] args) { // 参数在实际业务下需要配置管理 SnowIdWorkerUtil idWorker = new SnowIdWorkerUtil(1, 1); for (int i = 0; i < 100; i++) { String id = idWorker.nextIdVar(); System.out.println(id+" "+id.length()+"位"); } } }
三、自定义实现
还有一种常见的实现思路,基于数据库的自增主键ID,不过基于这个原理,却有各种不同的实现策略。
简单表结构:
CREATE TABLE `du_temp_id` ( `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键id', `create_time` datetime DEFAULT NULL COMMENT '创建时间', PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='主键ID临时表';
1、基于主键
这种模式的原理比较单调,向临时表写入一条记录,借助MySQL生成的唯一主键ID,然后拿出来稍微处理一下,作为各种业务场景的唯一ID使用。
@Service public class TempIdServiceImpl implements TempIdService { @Resource private TempIdMapper tempIdMapper ; @Override public List<String> getIdList() { List<String> idList = new ArrayList<>() ; TempIdEntity tempIdEntity = new TempIdEntity (); tempIdEntity.setCreateTime(new Date()); for (int i = 0 ; i < 10 ; i++){ tempIdMapper.insert(tempIdEntity); idList.add(UuidUtil.getNoId(8,Long.parseLong(tempIdEntity.getId().toString()))) ; } return idList ; } }
问题点:如果作为ID生成的临时表所在的MySQL服务宕掉,那可能会影响整个业务流程,造成雪崩效应。
2、高可用集群
单服务如果不能安稳的支撑业务需求,很自然集群模式就该上场了。提供多台MySQL服务[A,B,C],处理策略也不止一种:
- 库设置主键自增策略
例如A库[1,4,7],B库[2,5,8],C库[3,6,9],基于不同自增规则,生成统一的自增唯一标识。
- 生成ID做分库标识
这种先把ID生成,然后不同的数据库生成的ID给一个不同的标识,例如UIDA,UIDB,UIDC。
@Service public class TempIdServiceImpl implements TempIdService { @Resource private TempIdMapper tempIdMapper ; @Override public List<String> getRouteIdList() { List<String> idList = new ArrayList<>() ; TempIdEntity tempIdEntity = new TempIdEntity (); tempIdEntity.setCreateTime(new Date()); for (int i = 0 ; i < 2 ; i++){ tempIdMapper.insertA(tempIdEntity); idList.add(UuidUtil.getRouteId("UID-A",10, Long.parseLong(tempIdEntity.getId().toString()))) ; tempIdMapper.insertB(tempIdEntity); idList.add(UuidUtil.getRouteId("UID-B",10, Long.parseLong(tempIdEntity.getId().toString()))) ; tempIdMapper.insertC(tempIdEntity); idList.add(UuidUtil.getRouteId("UID-C",10, Long.parseLong(tempIdEntity.getId().toString()))) ; } return idList ; } }
结果样例:
UID-A00001,UID-B00001,UID-C00001
UID-A00002,UID-B00002,UID-C00002
3、ID样式优化
从数据获取的ID基本是一个自增的整数序列,可以提供一个格式美化工具方法。
public class UuidUtil { private static final String ZERO = "00000000000"; private static final String PREFIX = "UID"; public static String getNoId(int length,Long id){ String idVar = String.valueOf(id) ; if (idVar.length()>length){ return PREFIX+idVar ; } else { int gapLen = length-idVar.length()-PREFIX.length() ; return PREFIX+ZERO.substring(0,gapLen)+idVar ; } } public static String getRouteId(String route,Integer length,Long id){ String idVar = String.valueOf(id) ; if (idVar.length()>length){ return route+idVar ; } else { int gapLen = length-idVar.length()-route.length() ; return route+ZERO.substring(0,gapLen)+idVar ; } } }
基于不同的策略,把ID格式为统一的位数。
4、性能问题
如果在高并发的业务场景下,实时基于MySQL去生成唯一ID容易产生性能瓶颈,当然其他方法也可能产生这个问题。可以在系统空闲时间批量生成一批,放入缓存中,在使用的时候直接从缓存层取出即可。
四、源代码地址
GitHub·地址 https://github.com/cicadasmile/data-manage-parent GitEE·地址 https://gitee.com/cicadasmile/data-manage-parent

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
xmake v2.3.3 发布,新增 iOS/MacOS Framework 和 App 构建支持
xmake是一个基于lua的现代化c/c++构建工具。 这个版本主要是对内置的构建规则做了些扩展,新增了相关规则来实现对iOS/MacOS相关App应用程序项目、Framework和Bundle程序的构建支持。 并且支持App签名,也提供了相关工程模板来快速创建应用程序,另外此版本还对Qt的开发构建也做了不少改进,增加对Qt5.14.0新版本sdk的支持,对android的打包部署支持上也改进了不少。 处理之外,xmake还提供了一个特殊的xmake.cli构建rule,通过集成libxmake engine库,来扩展开发基于xmake引擎的程序,比如:做个定制版的xmake,也可以基于此写点lua脚本程序。 项目源码 官方文档 更新内容 新特性 #727: 支持为android, ios程序生成.so/.dSYM符号文件 #687: 支持编译生成objc/bundle程序 #743: 支持编译生成objc/framework程序 支持编译bundle, framework程序,以及mac, ios应用程序,并新增一些工程模板 支持对ios应用程序打包生成ipa文件,以及代码签名支持 ...
- 下一篇
Elasticsearch-datatran v6.1.0 发布,Elasticsearch 数据同步工具
Elasticsearch 数据同步工具 Elasticsearch-datatran 6.1.0 发布,Elasticsearch-datatran是由bboss开源的一款将各种数据源中的海量数据同步到 Elasticsearch 的高效数据同步工具。 v6.1.0功能改进 如果在程序里面配置的增量字段类型发生改变,要把增量状态表对应的类型调整为最新的字段类型 设置了类型后,就按照类型来,不再按照设置的日期和数字字段名称来区分: 增加setLastValueColumn方法,废弃setDateLastValueColumn和setNumberLastValueColumn两个方法 DB-DB数据同步工具:增加在作业中直接指定sql语句的功能 修复数据同步bug:数据库到数据库跨库同步无效 可以通过ImportBuilder组件设置geoip数据库地址,使用案例: importBuilder.setGeoipDatabase("E:/workspace/hnai/terminal/geolite2/GeoLite2-City.mmdb"); importBuilder.setGe...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7设置SWAP分区,小内存服务器的救世主