拆解雪花算法生成规则 | 京东物流技术团队-低调大师

拆解雪花算法生成规则 | 京东物流技术团队

2023-07-25 873

1 介绍

雪花算法（Snowflake）是一种生成分布式全局唯一ID的算法，生成的ID称为Snowflake IDs或snowflakes。这种算法由Twitter创建，并用于推文的ID。目前仓储平台生成ID是用的雪花算法修改后的版本。

雪花算法几个特性

生成的ID分布式唯一和按照时间递增有序，毫秒数在高位，自增序列在低位，整个ID都是趋势递增的。
不依赖数据库等三方系统，稳定性更高，性能非常高的。
可以根据自身业务特性分配bit位，非常灵活。

2 其他分布式唯一ID生成方案

2.1 数据库生成

以MySQL为例，单库单表，给字段设置auto_increment来生成全局唯一ID
优点:

非常简单，维护成本比较低
ID唯一，单调递增，可以设置固定步长

缺点:

可用性难以保证，每次生成ID都需要访问数据库，瓶颈在于单台MySQL读写性能上，如果数据库挂掉会造成服务不可用，这是一个致命的问题

2.2 UUID

UUID是由一组32位数的16进制数字所构成，故UUID理论上的总数为16^32=2^128，约等于3.4 x 10^38。也就是说若每纳秒产生1兆个UUID，要花100亿年才会将所有UUID用完。UUID的标准型式包含32个16进制数字，以连字号分为五段，形式为8-4-4-4-12的32个字符。示例：550e8400-e29b-41d4-a716-446655440000
优点:

本地生成ID，不需要进行远程调用，没有网络耗时
基本没有性能上限

缺点:

可读性差
长度过长，16字节128位，生成的UUID通常是36位(包含-)，有些场景可能不适用。如果用作数据库主键，在MySQL的InnoDB引擎下长度过长，二级索引(非主键索引)会占用很大的空间。
无法保证趋势递增，在MySQL的InnoDB引擎下，新插入数据会根据主键来寻找合适位置，会导致频繁的移动、分页增加了很多开销。

3 snowflake算法实现细节

3.1拆解64bit位

snowflake生成的id通常是一个64bit数字，java中用long类型。

图1：snowflake算法中的64-bit划分方式

1-bit不用于生成ID(符号位) long 范围[-2^(64-1), 2^(64-1) ] , (64-1)中的1代表的就是符号位
41-bit时间戳(毫秒)可以表示1 x 2^41 / (1000 x 3600 x 24 x 365) = 69年的时间
10-bit可以分别表示1 x 2^10 = 1024台机器,范围[0,1023]
12-bit表示1ms内自动递增的序列号，1 x 2^12 = 4096个范围[0,4095]。单机1ms可以生成4096个不重复的ID

通过上述方式进行生成ID，可以保证1024台机器在任意69年的时间段里不会出现重复的ID，而且单台机器支持一秒能够生成409.6万个ID。
　　这种方式可以支撑大部分业务，如果不满足，可以根据自身业务特点来调整不同命名空间占用的bit数。如果我们有划分IDC的需求，可以将10-bit分5-bit给IDC，分5-bit给工作机器。这样就可以表示32个IDC，每个IDC下可以有32台机器。如果我们的机器位比较特殊，数值相对较大，但是对并发要求不高，还可以将时间位调整为秒级，时间位节省出10-bit留给机器位。

1-bit符号位
31-bit时间戳(秒)1 x 2^31/ (3600 x 24 x 365) = 68年
22-bit机器位运维平台给提供的数值范围 [0,2^22-1]
10-bit序列号范围[0, 2^10 - 1]共1024个

通过上述方式进行生成ID，可以保证4194303台机器在任意68年的时间段里不会出现重复的ID，而且单台机器支持一秒能够生成1024个ID。

3.2 Java实现

public class IdGenerator {
    // 起始时间
    private final long from = 1422720000000L;
    // 机器位所占bit位数
    private final long instanceIdBits = 10L;
    // 序列号所占bit位数
    private final long sequenceBits = 12L;

    // 机器位左移长度
    private final long instanceIdShift = sequenceBits;
    // 时间位左移长度
    private final long timestampLeftShift = sequenceBits + instanceIdBits;

    // 序号1: 最大机器ID
    private final long maxInstanceId = -1L ^ (-1L << instanceIdBits);
    // 最大序列号
    private final long sequenceMask = -1L ^ (-1L << sequenceBits);

    private long instanceId;
    private long sequence = 0L;
    private long lastTimestamp = -1L;

    public IdGenerator(long instanceId) {
        if (instanceId > maxInstanceId || instanceId < 0) {
            throw new IllegalArgumentException(String.format("instance Id can't be greater than %d or less than 0", maxInstanceId));
        }
        this.instanceId = instanceId;
    }
    //  序号2:
    public synchronized long nextId() {
        long timestamp = timeGen();
        //  序号3:
        if (timestamp < lastTimestamp) {
            throw new RuntimeException(String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
        }
        //  序号4:
        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & sequenceMask;
            if (sequence == 0) {
                timestamp = tilNextSecs(lastTimestamp);
            }
        } else {
            sequence = 0L;
        }

        lastTimestamp = timestamp;
        //  序号5:
        return ((timestamp - from) << timestampLeftShift)  // (当前时间 - 起始时间) 向左移位
                | (instanceId << instanceIdShift)  // 机器位 向左移位
                | sequence; // 序列位
    }

    private long tilNextSecs(long lastTimestamp) {
        long timestamp = timeGen();
        while (timestamp <= lastTimestamp) {
            timestamp = timeGen();
        }
        return timestamp;
    }

    private long timeGen() {
        return System.currentTimeMillis();
    }
}

3.3一些疑问

3.3.1 为什么bit位置只利用了63位？

因为long在java中占8字节，每字节8bit，一共64bit，其中有1个bit位是符号位不能用做生成ID，如果符号位也用来做ID中的1个bit为会导致ID出现负数，影响趋势递增特性。

3.3.2 计算最大机器ID

见代码中注释序号1
maxInstanceId = -1L ^ (-1L<<instanceIdBits)
等价于 maxInstanceId = -1 ^( -1<<10)
① -1二进制

1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111

② -1左移10位 -1<<10 二进制

1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1100 0000 0000

①与②进行异或运算异或运算:同为假，异为真,所以最终结果应该为

0000 0000 0000 0000 0000 0000 0000 00000000 0000 0000 0000 0000 0011 1111 1111

最后:maxInstanceId = 2^10 - 1 = 1023
sequenceMask 计算方法相同，结果为2^12 - 1 = 4095

3.3.3 计算序列号位

见代码中注释序号4

if (lastTimestamp == timestamp) {
    sequence = (sequence + 1) & sequenceMask;
    if (sequence == 0) {
        timestamp = tilNextSecs(lastTimestamp);
    }
} else {
    sequence = 0L;
}

其中这段代码的是计算序列号的代码主要逻辑是，如果上个生成ID的时间位与当前ID的时间位冲突，则会生成一个序列号进行区分，如果序列号用尽，则等待下一个时间点再生成。如果上个生成ID的时间位与当前ID的时间位不冲突，则将序列号设置成0。

sequence = (sequence + 1) & sequenceMask，序列号最大值sequenceMask为4095，等价于如下这种写法。

sequence = (sequence + 1);
if(sequence == 4095){
    sequence = 0;
}

其实这两种写法的结果是一致的，就是对(sequence + 1)进行取余。
这里有个位运算知识点 k % m = k & (m - 1),m需要满足 m = 2^n,sequenceMask = 2^12 - 1。所以刚好可以用与运算进行取余操作，效率杠杠滴。

3.3.4 生成ID

见代码中注释序号5:
　此时我们拿到了时间位(timestamp - from)、机器位(instanceId )、序列号位(sequence),所以就可以计算最终的ID了。

((timestamp - from) << timestampLeftShift)  // (当前时间 - 起始时间) 向左移位
| (instanceId << instanceIdShift)  // 机器位 向左移位
| sequence; // 序列位

①((timestamp - from) << timestampLeftShift) 计算时间位
from是固定的1422720000000, timestampLeftShift = 12 + 10.我们假设timestamp = 1422720000001。也就是from刚刚过去1毫秒。1毫秒也是我们时间位倒数第二小的值，因为0是最小值。时间位取值范围[0, 2^41 - 1],从这也可以看出上边描述时间位时为什么把时间段特意标注了，因为时间位存的不是具体时间，而是以from为起始来算的过去了多少时间。
来看下 1<<22 结果

图2: 时间位移位结果

图2可以看出，时间位向左移位22，位置正好到第一个时间位。

②(instanceId << instanceIdShift) 计算机器位
为了方便计算，这里我们假设instanceId 等于1,机器位取值范围[0,-1]。
那么机器位就是 1 << 12

图3: 机器位移位结果

图3可以看出，机器位左移12位，位置正好到第一个机器位。

③按照 ① | ② | sequence 进行或运算进行生成ID
现在我们有了时间位的值，机器位的值，就只差序列号位的值，序列号是上面3描述代码生成的，范围是[0, 2^12-1]。为了方便计算，我们假设sequence = 1
那么 ID = ① | ② | 1。进行或运算

图4: ID = ① | ② | 1

下图是按照上面逻辑生成的ID

图5: 程序生成结果

3.3.5 注意:雪花算法需要用单例方式生成ID

因为雪花算法会依赖上一次生成的ID的时间来判断是否需要对序列号进行增加的操作，如果不是单例，两个业务用两个对象同时获取ID，则可能会生成相同的ID

4 关于雪花算法的一些思考

机器位怎么取值

主机唯一标识如果运维平台有机器唯一标识，可以在运维平台取。不过需要考虑机器位能否容纳下唯一标识，可能会过长，也需要考虑运维平台的唯一标识未来变化。
可根据ip进行计算如果能保证不同机房的机器ip不重复，可以利用ip来计算机器位，IP最大 255.255.255.255。而（255+255+255+255) < 1024，因此采用IP段数值相加即可生成机器位，不受IP位限制。不过这种方式也不是绝对ok，要根据自身情况在选择，比如10.0.5.2 与 10.0.2.5 计算出来也是相同的。使用这种IP生成机器位的方法,必须保证IP段相加不能重复
通过数据库/redis/zk等进行协调，在应用启动的时候给每个机器分配不会重复的机器位id。

时钟回拨问题

雪花算法强依赖时间，如果时间发生回拨，有可能会生成重复的ID，在我们上面的nextId中我们用当前时间和上一次的时间进行判断，如果当前时间小于上一次的时间那么肯定是发生了回拨，雪花算法的做法是简单的抛出了一个异常。

if (timestamp < lastTimestamp) {
   throw new RuntimeException(String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
}

如果业务的异常容忍度低，这里我们可以对其进行优化,如果时间回拨时间较短，比如配置5ms以内，那么可以直接等待一定的时间，让机器的时间追上来。也可以利用扩展位，将64-bit的机器位或者序列号位预留出2-bit的防止时钟回滚的扩展位。

5 ID逆运算

如果线上出现ID重复，如何进行问题定位？对ID进行逆运算拿到ID的时间位、机器位、序号位。就可以进行下一步分析了。以上述生成的4198401为例

5.1 时间

时间位 = ID / 2^(机器位 + 序列号位) + from
时间位 = 4198401 / 2^(12 + 10) + 1422720000000 = 1422720000001
与上述生成ID时用时间位相符
注意:ID / 2^(机器位 + 序列号位) 是整数

5.2 机器

机器位 = (ID / 2^序列号位 ) % 2^(机器位)
机器位 = (4198401 / 2^12) % 2^10= (1025) % 1024 = 1
与上述生成ID时用机器位数值相符

5.3 序列号

ID % 2^序列号位
序列号 = 4198401 % = 4198401 % 1024 = 1
与上述生成ID时用的序列号数值相符

6 资料

开源代码scala版本：https://github.com/twitter-archive/snowflake

作者：京东物流马红岩

来源：京东云开发者社区自猿其说Tech

微信关注我们

原文链接：https://my.oschina.net/u/4090830/blog/10090581

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

【XL-LightHouse】通用型流式大数据统计平台

概述 XL-LightHouse是针对互联网领域繁杂的数据统计需求而开发的一套集成了数据写入、数据运算、数据存储和数据可视化等一系列功能，支持大数据量，支持高并发的【通用型流式大数据统计平台】。 XL-LightHouse目前已基本涵盖了常见的流式数据统计场景，包括count、sum、max、min、avg、bitcount、topN/lastN等多种运算，支持多维度计算，支持分钟级、小时级、天级多个时间粒度的统计，支持自定义统计周期的配置。 XL-LightHouse内置丰富的转化类函数、支持表达式解析，可以满足各种复杂的条件筛选和逻辑判断。 XL-LightHouse是一套功能完备的流式大数据统计领域的数据治理解决方案，它提供了比较友好和完善的可视化查询功能，并对外提供API查询接口，此外还包括数据指标管理、权限管理、统计限流等多种功能。 XL-LightHouse支持时序性数据的存储和查询。背景以互联网行业来说，在移动互联网发展比较成熟的现在，流量见顶，红利消失，企业竞争日趋惨烈，获取新增用户的成本日益增高。很多企业开始意识到不能一味的通过补贴、价格战、广告投放这种简单粗暴的...

2023-07-25

826

以 ChatGPT 为代表的 AIGC 技术为企业生产带来了巨大的变化，并在企业应用开发领域占据一席之地。AI 大模型凭借其强大的学习能力，可以帮助人们完成各种复杂的任务，例如帮助开发人员编写与调试代码、研究人员快速了解科研领域、营销人员撰写产品描述、设计人员设计新作品等等。许多企业探索如何降低 AI 大模型的使用成本，通过网关进行 AI 大模型的 API 管理成为了很常规的需求。 Higress 如何降低 AI 大模型使用成本？以 OpenAI 为例，OpenAI 的 API 调用并不是基于请求量或者订阅时间来计费，而是基于每个请求的使用量来计费。对于 AI 大模型来说，模型输入与输出的 token 数可以比较好的衡量当前模型进行推理任务的复杂度。因此基于 token 作为请求使用量进行计费是 OpenAPI 的标准计费策略。对于不同的模型 token 的计费标准也不同，越复杂的模型会生成越好的结果，但也会带来更高的计费。OpenAI 通过为用户分发 API 密钥来完成用户的鉴权与收费等功能。对于组织来说，为每位成员申请 AI 大模型的访问权限（API Key）显然是不现实的。分...

2023-07-25

871

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。