`
polim
  • 浏览: 105720 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

分布式全局不重复ID生成算法

阅读更多
在分布式系统中经常会使用到生成全局唯一不重复ID的情况。本篇博客介绍生成的一些方法。

常见的一些方式:

1、通过DB做全局自增操作
优点:简单、高效
缺点:大并发、分布式情况下性能比较低

有些同学可能会说分库、分表的策略去降低DB的瓶颈,单要做到全局不重复需要提前按照一定的区域进行划分。例如:1~10000、10001~20000 等等。但这个灵活度比较低。

针对一些并发比较低的情况也可以使用类似这种方式。但大并发时不建议使用,DB很容易成为瓶颈。

2、获取当前时间纳秒或毫秒数
这种方式需要考虑的是在分布式集群中如果保证唯一性。

3、类似UUID的生成方式
生成的串比较大

//------------------------------------------------------------
综合上述情况我们需要一种在高并发、分布式系统中提供高效生成不重复唯一的一个ID,但要求生成的结果要小
方法1:
private static long INFOID_FLAG = 1260000000000L;
protected static int SERVER_ID = 1;

public synchronized long nextId() throws Exception {
    if(SERVER_ID <= 0)
        throw new Exception("server id is error,please check config file!");
    long infoid = System.currentTimeMillis() - INFOID_FLAG;
    infoid=(infoid<<7)| SERVER_ID;
    Thread.sleep(1);
    return infoid;
}

说明:
SERVER_ID为不同的服务器使用的不同server ID,如果不同的机器使用相同的server ID有可能会生成重复的全局ID

简单的应用在一定的并发情况下使用这种方式已经足够了,简单、高效。但是每秒生成的ID是有限的,因为Thread.sleep(1)会无形中带来一些时间的消耗。

方法2:


/**
* 64位ID (42(毫秒)+5(机器ID)+5(业务编码)+12(重复累加))
* @author Polim
*/
public class IdWorker {
private final static long twepoch = 1288834974657L;
// 机器标识位数
private final static long workerIdBits = 5L;
// 数据中心标识位数
private final static long datacenterIdBits = 5L;
// 机器ID最大值
private final static long maxWorkerId = -1L ^ (-1L << workerIdBits);
// 数据中心ID最大值
private final static long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
// 毫秒内自增位
private final static long sequenceBits = 12L;
// 机器ID偏左移12位
private final static long workerIdShift = sequenceBits;
// 数据中心ID左移17位
private final static long datacenterIdShift = sequenceBits + workerIdBits;
// 时间毫秒左移22位
private final static long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;

private final static long sequenceMask = -1L ^ (-1L << sequenceBits);

private static long lastTimestamp = -1L;

private long sequence = 0L;
private final long workerId;
private final long datacenterId;

public IdWorker(long workerId, long datacenterId) {
if (workerId > maxWorkerId || workerId < 0) {
throw new IllegalArgumentException("worker Id can't be greater than %d or less than 0");
}
if (datacenterId > maxDatacenterId || datacenterId < 0) {
throw new IllegalArgumentException("datacenter Id can't be greater than %d or less than 0");
}
this.workerId = workerId;
this.datacenterId = datacenterId;
}

public synchronized long nextId() {
long timestamp = timeGen();
if (timestamp < lastTimestamp) {
try {
throw new Exception("Clock moved backwards.  Refusing to generate id for "+ (lastTimestamp - timestamp) + " milliseconds");
} catch (Exception e) {
e.printStackTrace();
}
}

if (lastTimestamp == timestamp) {
// 当前毫秒内,则+1
sequence = (sequence + 1) & sequenceMask;
if (sequence == 0) {
// 当前毫秒内计数满了,则等待下一秒
timestamp = tilNextMillis(lastTimestamp);
}
} else {
sequence = 0;
}
lastTimestamp = timestamp;
// ID偏移组合生成最终的ID,并返回ID
long nextId = ((timestamp - twepoch) << timestampLeftShift)
| (datacenterId << datacenterIdShift)
| (workerId << workerIdShift) | sequence;

return nextId;
}

private long tilNextMillis(final long lastTimestamp) {
long timestamp = this.timeGen();
while (timestamp <= lastTimestamp) {
timestamp = this.timeGen();
}
return timestamp;
}

private long timeGen() {
return System.currentTimeMillis();
}
}

这种方式是一种比较高效的方式。也是twitter使用的一种方式。

测试类:----------------------------------------------------------
import java.util.concurrent.BrokenBarrierException;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.CyclicBarrier;
import java.util.concurrent.TimeUnit;

public class IdWorkerTest {
    public static void main(String []args){
        IdWorkerTest test = new IdWorkerTest();
        test.test2();
    }

    public void test2(){
        final IdWorker w = new IdWorker(1,2);
        final CyclicBarrier cdl = new CyclicBarrier(100);

        for(int i = 0; i < 100; i++){
            new Thread(new Runnable() {
                @Override
                public void run() {
                try {
                    cdl.await();
                } catch (InterruptedException e) {
                    e.printStackTrace();
                } catch (BrokenBarrierException e) {
                    e.printStackTrace();
                }
                System.out.println(w.nextId());}
             }).start();
        }
        try {
            TimeUnit.SECONDS.sleep(5);
        } catch (InterruptedException e) {
           e.printStackTrace();
        }

    }
}
分享到:
评论
1 楼 Twinkle-康 2017-05-23  
     

相关推荐

    分布式ID生成策略_snowflake算法

    Snowflake算法是由Twitter开源的一种高效且可扩展的分布式ID生成方案,广泛应用于Java和其他编程语言的系统中。 Snowflake算法的核心思想是将64位的整数划分为不同的部分,分别为: 1. **时间戳**(41位):自定义...

    全局唯一ID生成

    分布式ID生成是解决大型分布式系统中生成不重复ID的关键技术。在单体应用时代,我们可以通过数据库自增ID或时间戳+序列号等方式生成唯一ID。但在分布式环境下,这些方法往往无法满足需求,因为它们可能会导致ID冲突...

    java 分布式 代码生成器 唯一ID

    结合上述信息,"idGenerate"这个文件很可能是包含了一个Java实现的分布式代码生成器项目,可能包含了Snowflake算法或者其他分布式ID生成策略的源代码。通过学习和理解这些代码,我们可以更好地掌握在Java环境中如何...

    分布式唯一ID解决方案-雪花算法.docx

    例如,在选择ID生成算法时,需要考虑到系统的负载和性能要求。此外,在实现ID生成器时,需要考虑到系统的可扩展性和可维护性。 分布式唯一ID解决方案是当前系统业务和数据存储的复杂度提升的必然结果。SnowFlake...

    分布式系统中唯一ID的生成方法共3页.pdf.zip

    分布式系统中的唯一ID生成是构建大规模、高并发应用的关键技术之一。在分布式环境中,由于多台服务器和进程可能同时处理请求,确保每个实体或事件拥有全局唯一的标识符(ID)至关重要,这有助于数据的一致性、跟踪和...

    分布式id公开课.pptx

    分布式ID是现代大规模分布式系统中不可或缺的一个组成部分,它主要用于为分布式环境中的每个实体生成全局唯一且具有特定属性的标识符。以下将详细讲解分布式ID的相关知识点: 1. **UUID(Universally Unique ...

    百度开源的分布式 ID 生成器,太强大了!(csdn)————程序.pdf

    UidGenerator是百度开发的一款分布式ID生成器,它的设计目标是解决在分布式环境下生成全局唯一ID的问题。借鉴了Twitter的Snowflake算法,UidGenerator将生成的ID分为多个部分,包括时间戳、工作节点ID和序列号,确保...

    Go-GolangMysql实现的分布式ID生成服务

    Twitter开源的Snowflake算法是一种常用的分布式ID生成策略,它将ID分为三部分:时间戳(41位)、工作机器ID(10位)和序列号(12位)。通过这种方式,可以保证ID的全局唯一性,并且有序。 #### 3.2 UUID UUID...

    浅谈CAS在分布式ID生成方案上的应用

    这种方案不仅能够有效解决高并发下的ID生成问题,还能保证ID的全局唯一性和连续性,为分布式系统的稳定运行提供了坚实的基础。当然,这种方法也并非完美无缺,例如生成的ID不再是绝对递增的,而是趋势递增的,但这...

    分布式系统ID生成器解决方案.docx

    分布式系统中的ID生成是一个至关重要的任务,特别是在大型的复杂分布式环境中,如美团点评的金融、支付、餐饮等产品。随着数据量的不断增长,数据库的分库分表策略需要一个全局唯一的ID来标识每条记录,传统的数据库...

    分布式id服务-常见组件与中台化-如自增id,分段id,雪花算法等适用于分布式服务的使用场景

    雪花算法SNOWFLAKE ...比如采用UUID.randomUUID()的方式产生唯一且不重复的分布式主键。最终生成一个字符串类型的主键。缺点是生成的主键无序。 【趋势递增】简单说就是在一段时间内,生成的ID是递增的趋势

    分步式主键发生器,适合分布式应用的id唯一性

    在这种环境下,如何保证各个节点生成的主键ID不重复,就显得至关重要。 标题“分步式主键发生器,适合分布式应用的id唯一性”所涉及的知识点主要是分布式系统中的ID生成策略。分布式主键发生器的设计目标是确保在...

    分布式ID生成策略(1)_snowflake算法

    分布式ID生成策略是现代互联网应用中的重要组成部分,尤其是在大数据时代,每个请求、每条记录往往都需要一个全局唯一的标识。Snowflake算法就是一种被广泛使用的分布式ID生成方案,它由Twitter开源,具有时间戳、...

    分布式id方法

    ### 分布式ID生成方法详解 #### 一、需求背景及重要性 在现代软件开发过程中,无论是消息系统、订单管理、论坛应用等场景,都离不开一个关键元素——记录标识,比如`message-id`、`order-id`或`tiezi-id`等。这些...

    分布式ID雪花算法 工具类.rar

    分布式系统,全局唯一ID,高效,永不重复。相比较uuid,雪花id是按照时间有序生成的,方便sql优化

    分布式ID生成器解决方案SnowflakeX.docx

    SnowflakeX在此基础上,引入了时间回拨保护机制,包括应用启动校验、时间打点和ID生成时的时间校验,确保在各种异常情况下仍能生成不重复的ID。实测显示,单台机器通过HTTP API每秒可以获取100万个ID,但在实际应用...

    mist:超高级且不受时间回拨影响的唯一唯一ID生成算法,薄雾算法

    薄雾算法 薄雪花算法是更高的数值上限和连续的使用期限。...数据来源各不相同,且并发极大的情况下难以生成统一的数据编号,同时数据编号又将作为爬虫下游整个互连的溯源依据,在爬虫业务连通中十分重要。

    利用时间生成8位不重复数

    在IT开发领域,生成不重复的编号或标识符是一个常见的需求,特别是在数据库记录、订单号、唯一用户ID等场景。为了满足这一需求,开发者经常利用系统时间作为基础,结合其他算法来生成这样的唯一序列。标题提到的...

    分布式原理源码解析

    例如,Snowflake算法利用时间戳作为主要的排序依据,结合工作节点的ID和自增序列,能够在分布式环境中高效生成不重复的ID。 其次,分布式锁是解决多节点并发控制的关键工具。例如,Redis和ZooKeeper都提供了分布式...

Global site tag (gtag.js) - Google Analytics