作者:七星院长 2021-07-07 07:14:48
开发
前端
分布式 在分布式系统中,经常需要一些全局唯一的ID对数据、消息、http请求等进行唯一标识。那么这个全局唯一ID就叫分布式ID。
成都创新互联是一家专注于成都网站设计、做网站、成都外贸网站建设公司与策划设计,大城网站建设哪家好?成都创新互联做网站,专注于网站建设10多年,网设计领域的专业建站公司;建站业务涵盖:大城等地区。大城做网站价格咨询:18980820575
在分布式系统中,经常需要一些全局唯一的ID对数据、消息、http请求等进行唯一标识。那么这个全局唯一ID就叫分布式ID
1.如果id我们使用的是数据库的自增长类型,在分布式系统中需要分库和分表时,会有两个相同的表,有可能产生主键冲突。
2.电商订单号,采用自增方式,是最简单的生成规则。但是!这种与流水号相同的订单号很容易就被竞争对手看出你公司真实的运营信息。
全局唯一:必须保证ID是全局性唯一的
高性能:高可用低延时,ID生成响应要快,否则会成为业务瓶颈
高可用:100%的可用性是骗人的,但是也要无限接近于100%的可用性
好接入:要秉着拿来即用的设计原则,在系统设计和实现上要尽可能的简单
趋势递增:最好趋势递增,这个要求就得看具体业务场景了,一般不严格要求
安全性:如果ID连续生成,势必会泄露业务信息,甚至可能被猜出,所以需要无规则不规则。
易读性:不要太长,想象一下用户在售后的时候本身就处在一个焦躁的心情中,再让他报/输一个很长的订单号,很容易造成错误率高,这个时候只能烦上加烦。如果订单号实在太长,还有一种办法:断句。
可扩展性:淘宝的订单号在最初的时候也还是12位、14位,现在已经变成16位了,随着一个网站的交易量逐年上升,订单号不可避免的会变长。
注:主流生成ID方案都是基于数据库号段模式和雪花算法
优点:
缺点:
当我们需要一个ID的时候,向表中插入一条记录返回主键ID,但这种方式有一个比较致命的缺点,访问量激增时MySQL本身就是系统的瓶颈,用它来实现分布式服务风险比较大,不推荐!
优点:
实现简单,ID单调自增,数值类型查询速度快
缺点:
DB单点存在宕机风险,无法扛住高并发场景
前边说了单点数据库方式不可取,那对上边的方式做一些高可用优化,换成主从模式集群。害怕一个主节点挂掉没法用,那就做双主模式集群,也就是两个Mysql实例都能单独的生产自增ID。那这样还会有个问题,两个MySQL实例的自增ID都从1开始,会生成重复的ID怎么办?
解决方案:设置起始值和自增步长
MySQL_1 配置:
- set @@auto_increment_offset = 1; -- 起始值
- set @@auto_increment_increment = 2; -- 步长
MySQL_2 配置:
- set @@auto_increment_offset = 2; -- 起始值
- set @@auto_increment_increment = 2; -- 步长
这样两个MySQL实例的自增ID分别就是:
- 1、3、5、7、9
- 2、4、6、8、10
那如果集群后的性能还是扛不住高并发咋办?就要进行MySQL扩容增加节点,这是一个比较麻烦的事。
增加第三台MySQL实例需要人工修改一、二两台MySQL实例的起始值和步长,把第三台机器的ID起始生成位置设定在比现有最大自增ID的位置远一些,但必须在一、二两台MySQL实例ID还没有增长到第三台MySQL实例的起始ID值的时候,否则自增ID就要出现重复了,必要时可能还需要停机修改。
优点:
缺点:
号段模式是当下分布式ID生成器的主流实现方式之一,号段模式可以理解为从数据库批量的获取自增ID,每次从数据库取出一个号段范围,例如 (1,1000] 代表1000个ID,具体的业务服务将本号段,生成1~1000的自增ID并加载到内存。
由于多业务端可能同时操作,所以采用版本号version乐观锁方式更新,这种分布式ID生成方式不强依赖于数据库,不会频繁的访问数据库,对数据库的压力小很多。
利用redis的incr命令实现ID的原子性自增。
- 127.0.0.1:6379> set seq_id 1 // 初始化自增ID为1
- OK
- 127.0.0.1:6379> incr seq_id // 增加1,并返回递增后的数值
- (integer) 2
用redis实现需要注意一点,要考虑到redis持久化的问题。redis有两种持久化方式RDB和AOF
雪花算法(Snowflake)是twitter公司内部分布式项目采用的ID生成算法
Snowflake生成的是Long类型的ID,一个Long类型占8个字节,每个字节占8比特,也就是说一个Long类型占64个比特。Snowflake ID组成结构:正数位(占1比特)+ 时间戳(占41比特)+ 机器ID(占5比特)+ 数据中心(占5比特)+ 自增值(占12比特),总共64比特组成的一个Long类型。
根据这个算法的逻辑,只需要将这个算法用Java语言实现出来,封装为一个工具方法,那么各个业务应用可以直接使用该工具方法来获取分布式ID,只需保证每个业务应用有自己的工作机器id即可,而不需要单独去搭建一个获取分布式ID的应用。
雪花算法目前存在时间回拨问题,而且不同的机器也无法完全保证时间一样,所以可能会出现重复问题。
Leaf由美团开发,支持号段模式和snowflake算法模式,可以切换使用。
当前标题:一篇带你了解什么是分布式ID
网页URL:http://www.csdahua.cn/qtweb/news33/523433.html
网站建设、网络推广公司-快上网,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 快上网