京东技术 www.toutiao.im
背景
JIMDB是京东自主研发的基于Redis的分布式缓存与高速键值存储服务,支持大容量缓存,数据高可用,支持多种I/O策略,故障自动切换,支持动态扩容,目前服务于京东的几乎所有的业务系统,包括很多重要的业务系统,例如, 前台的商品详情页, 交易平台, 广告,搜索, 即时通讯等, 后台的订单履约, 库存管理, 派送和物流……。
Redis完全依赖内存,往往内存不够使用;Redis启动时需要把全部数据加载到内存,在数据量大时启动速度慢;规划总是赶不上业务发展,内存总量不断被突破,不断陷入扩容, 再扩容…的梦魇。有介于此,JIMDB引入RAM + SSD两级存储,在内存中存储热点数据,冷数据被自动交换到磁盘,解决内存不足的问题;启动时并不把所有数据加载入内存,而是在运行时根据需要加载,解决启动速度慢的问题;因为引入了二级存储,存储容量通常比较大,所以不需要频繁的扩容了。
我们选用LevelDB作为持久化存储引擎,LevelDB是Google开源的持久化KV单机数据库,具有很高的随机写,顺序读/写性能,非常适合用于存储小文件,以及一些需要持久化的索引和需要持久化的异步任务,很多开源项目就使用LevelDB作为底层存储引擎,例如:Chromium,淘宝的Tair,SSDB等。
技术方案
同步写or异步写
同步写要求Redis对key每一次修改都需要操作磁盘,尽管LevelDB的写性能很高,但是频繁的操作磁盘对性能影响仍然比较大。最终我们采用了异步写的方式,相比于同步写,异步写可以借助LevelDB提供的批量写功能获得更高的写性能,另外就是减少了操作磁盘的次数,进一步提高了性能。
磁盘内存数据交换
Redis查找一个key,首先会在内存中查找,只有在内存中找不到才会在磁盘中查找,如果仍然没有找到,则表明这个key不存在,如果在磁盘中找到了,会将这对KV添加到Redis的字典以加载到内存。
Redis修改一个key后,我们将这个key标记为dirty key,即将key的副本添加到专门用于保存dirty key的字典dirty dict中,为了节约空间,我们只存储了这个key(value为NULL)。我们在定时任务中周期性执行flush dirty key to disk任务,这个任务会将存储在dirty dict中的key写入磁盘,写磁盘时,我们需要对key的value进行序列化编码成二进制流,当dirty dict中的key都同步到磁盘上后,清空dirty dict。
主从同步
在两级存储场景下,兼容Redis的同步流程,只是数据库快照需要通过遍历磁盘生成,这就要求我们在生成快照之前需要把内存中的dirty key先全部同步到磁盘上。另外slave端接收到快照后,不再加载到内存,而是调用LevelDB写接口加载到磁盘上。
这里需要特别说明的是Redis生成数据库快照时,会单独启动一个后台进程处理,但是LevelDB存储引擎同时只允许一个进程访问,因此我们需要创建一个线程而不是进程去处理快照生成。
集群节点分裂/合并
Jimdb集群节点分裂/合并时,会将指定slot上的KV通过网络直接传输给目标Redis server(不同于Redis主从全量同步,需要生成数据库快照),目标Redis生成数据库快照,然后加载到内存。二级存储模式下,需要扫描磁盘,将指定slot上的KV通过网络传输给目标redis server,扫描之前,须先将内存中的dirty key同步到磁盘上。目标Redis将收到的数据库快照通过LevelDB的写接口加载到磁盘持久化。
遇到的问题与解决方法
在项目实践过程中我们遇到了许多问题,这里详细介绍一下其中核心的几个问题以及我们的解决思路。
内存不足
磁盘的空间一般比内存要大一个数量级,而所有的读写操作都会将磁盘上的数据加载到内存中,这样运行一段时间后就会出现内存不足的情况,虽然Redis对于每一个命令处理之前都会检查内存占用情况,当超过配置的最大内存时会按照配置的淘汰策略部分key,但是这并不能满足我们的需求,因此我们需要在发现内存不足时按照一定的策略淘汰一部分内存中key(dirty key不会被淘汰),以释放宝贵的内存资源。
我们根据当前内存占用率(mem_used/max_mem)所在的区间采用不同的内存淘汰策略:
内存占用率>85%时采用随机淘汰策略,随机淘汰部分key直到内存占用率降到75%以下。
内存占用率>75%时采用LRU淘汰策略,这里参考了Redis的淘汰思路,采用随机采样然后按照LRU淘汰。
不过这两种淘汰策略都可能耗时比较长,如果直接放在原来Redis检查内存占用的地方,势必会影响单次请求的延时,所以我们将上述的淘汰策略放在定时任务中处理,同时原Redis的内存占用检查我们采用快速检查方案,即内存占用率>90%时,随机淘汰几个key。
Key的DB属性存储
Jimdb为了方便集群中key的分裂合并,对Redis进行了改造,划分16384个slot,只使用db 0。这样为了方便从磁盘上遍历指定slot上的key,我们对存储在levelDB中的key按照如下的格式编码:
其中第一个字节flag在后面讲,{slot_id}是slot的ID(0~16383),采用16进制编码成字符串,这样固定占用4个字节,因为只使用db 0,因此db_id不需要存储,后面才是真正的key。这样需要遍历指定的slot中的key时,就可以按照固定的前缀在levelDB中遍历key了(levelDB中存储的KV是按照key的排序存储的,因此固定前缀的key就可以顺序遍历)。
Key过期时间的存储
对于设置了过期时间的key存储时,因为LevelDB可以存储二进制安全的数据,因此我们将过期时间(类型long long)直接拼接到序列化后的value的后面,这样从LevelDB中get到KV后,反序列化value时就可以将过期时间一并解析,如果解析出过期时间,过期时间会添加到Redis的expire dict中。
如果每次定时任务处理中都将所有的dirty key同步到磁盘中,当dirty key较多时,一次处理完会严重影响Redis的性能,因此我们采用时间片的方式缓慢处理,不过这里也做了一点儿优化,就是按照dirty key的数量和当前Redis dict的数量比率,动态调整时间片大小,如果比率较高,说明当前Redis中有很多dirty key需要同步,那么就分配较大的时间片,如果发现这个比率很高,就会强制将所有的dirty key同步到磁盘上,因为如果这中场景下仍然采用时间片方式,有可能造成内存占用率很高,但是因为大量的dirty key存在,使得内存得不到释放,影响Redis server可用性。
另外需要说明的是,当需要生成数据库快照,集群分裂/合并或者Redis server退出时,必须强制将所有的dirty key同步到磁盘以避免数据丢失。
Redis某些动作会触发扫描磁盘,当磁盘上存储的数据量很大时,这样的操作会占用大量的CPU资源,影响Redis对其他客户端的响应,如果这种磁盘扫描耗时很久,会造成集群哨兵系统误报实例死亡,从而触发faileOver流程,因此我们对于磁盘扫描操作,允许扫描期间适当让渡出CPU,即调用aeProcessEvents(),这样Redis可以处理其他的event事件。
当一个key设置了过期时间但只存储在磁盘上,如果这个key已经过期,但是仍然占用磁盘空间,造成磁盘空间的浪费,因此我们需要定期扫描磁盘上存储的设置了过期时间的key,如果发现超时,即时删除以释放磁盘空间。
前面章节中我们提到将key的过期时间拼接到序列化后的value的末尾,如果我们扫描所有的key,通过反序列化其value解析判断是否设置了过期时间,这样显然效率很低,于是我们将所有设置了过期时间的key再单独存储一份{ key,expiretime },上文中提到的key的存储格式中的第一个字节就派上用处了,我们约定”0”表示正常的KV,”1”表示设置过期时间的key,其中只存储过期时间,这样我们直接扫描前缀为”1”的key就可以快速判断其是否已经超时。
我们在定时任务中增加了一个定期扫描过期key的任务,因为这个任务并不是很紧急,因此两次扫描的间隔相对较大(目前是5秒钟扫描一次),每次扫描工作固定的时间片,时间到即退出扫描。
测试结果显示对于20G的过期key(只存储在磁盘中),只需要几分钟就可以全部从磁盘上删除。
性能
因为我们采用异步flush磁盘的方式,大部分操作只需要操作内存就可以完成,性能应该不会下降太多,实际的测试结果表明其性能与JIMDB基本持平,不过TP99(<10ms)略有增加,不过在可接受范围内(业务方要求在20ms内),项目整体上达到设计预期。
综述
两级存储方案极大的扩展了JIMDB的容量,节约了宝贵的内存资源,同时完全兼容Redis通信协议和数据类型,很好的满足了业务方的业务需求。
以上内容为微信公众号IPDCHAT原创,如需转载,请注明出处~
相关推荐
JIMDB是一款兼容Redis协议的内存型K-V存储系统,其设计目标是实现在线弹性伸缩,并且所有数据都存储在内存中,因此它的读写性能非常高,但数据的持久化不是其主要考虑的因素。为了确保高可用性,JIMDB采用了服务器...
JMQ支持消息的持久化、高吞吐量和低延迟,它还提供了消息顺序保证、事务消息、消息过滤等功能,支持不同业务场景下的消息分发需求。通过消息中间件,京东能够实现系统间的解耦,保证了业务的独立性和扩展性。 京东...
【AI】从头到脚详解如何创建部署Azure Web App的OpenAI项目源码
人脸识别项目实战
人工智能-人脸识别代码,采用cnn的架构识别代码
汽车配件制造业企业信息化整体解决方案
短期风速预测模型,IDBO-BiTCN-BiGRU-Multihead-Attention IDBO是,网上复现 评价指标:R方、MAE、MAPE、RMSE 附带测试数据集运行(风速数据) 提示:在MATLAB2024a上测试正常 ,短期风速预测模型; IDBO-BiTCN-BiGRU-Multihead-Attention; 评价指标: R方、MAE、MAPE、RMSE; 复现; 测试数据集; MATLAB 2024a,短期风速预测模型:IDBO-BiTCN-BiGRU-Attention集成模型
手势识别项目实战
在智慧园区建设的浪潮中,一个集高效、安全、便捷于一体的综合解决方案正逐步成为现代园区管理的标配。这一方案旨在解决传统园区面临的智能化水平低、信息孤岛、管理手段落后等痛点,通过信息化平台与智能硬件的深度融合,为园区带来前所未有的变革。 首先,智慧园区综合解决方案以提升园区整体智能化水平为核心,打破了信息孤岛现象。通过构建统一的智能运营中心(IOC),采用1+N模式,即一个智能运营中心集成多个应用系统,实现了园区内各系统的互联互通与数据共享。IOC运营中心如同园区的“智慧大脑”,利用大数据可视化技术,将园区安防、机电设备运行、车辆通行、人员流动、能源能耗等关键信息实时呈现在拼接巨屏上,管理者可直观掌握园区运行状态,实现科学决策。这种“万物互联”的能力不仅消除了系统间的壁垒,还大幅提升了管理效率,让园区管理更加精细化、智能化。 更令人兴奋的是,该方案融入了诸多前沿科技,让智慧园区充满了未来感。例如,利用AI视频分析技术,智慧园区实现了对人脸、车辆、行为的智能识别与追踪,不仅极大提升了安防水平,还能为园区提供精准的人流分析、车辆管理等增值服务。同时,无人机巡查、巡逻机器人等智能设备的加入,让园区安全无死角,管理更轻松。特别是巡逻机器人,不仅能进行360度地面全天候巡检,还能自主绕障、充电,甚至具备火灾预警、空气质量检测等环境感知能力,成为了园区管理的得力助手。此外,通过构建高精度数字孪生系统,将园区现实场景与数字世界完美融合,管理者可借助VR/AR技术进行远程巡检、设备维护等操作,仿佛置身于一个虚拟与现实交织的智慧世界。 最值得关注的是,智慧园区综合解决方案还带来了显著的经济与社会效益。通过优化园区管理流程,实现降本增效。例如,智能库存管理、及时响应采购需求等举措,大幅减少了库存积压与浪费;而设备自动化与远程监控则降低了维修与人力成本。同时,借助大数据分析技术,园区可精准把握产业趋势,优化招商策略,提高入驻企业满意度与营收水平。此外,智慧园区的低碳节能设计,通过能源分析与精细化管理,实现了能耗的显著降低,为园区可持续发展奠定了坚实基础。总之,这一综合解决方案不仅让园区管理变得更加智慧、高效,更为入驻企业与员工带来了更加舒适、便捷的工作与生活环境,是未来园区建设的必然趋势。
相亲交友系统源码 V10.5支持婚恋相亲、媒婆返利、红娘系统、商城系统等等 这款交友系统功能太多了,适合婚恋相亲,还有媒婆婚庆等等支持 PC和 H5还有小程序,可封装红年、APP,里面带安装教程
本资源《单片机也能玩双核之你想不到的C技巧系列——嵌入式实战》涵盖 双核单片机开发、C语言高级技巧、嵌入式系统优化 等核心内容,结合 实战案例与视频教程,帮助开发者深入理解并掌握高效编程技巧。 适用人群: 适合 嵌入式开发工程师、单片机开发者、电子信息相关专业学生,以及希望提升 C语言编程能力 和 嵌入式项目经验 的技术人员。 能学到什么: 双核单片机开发思路,提高并行处理能力。 C语言高级技巧,提升代码优化与执行效率。 嵌入式系统调试方法,掌握实际项目中的调试策略。 实战案例解析,学习如何在实际工程中应用双核技术。 阅读建议: 建议 先学习基础知识,再结合 示例代码与视频教程 进行实操,重点关注 代码优化、调试技巧与双核应用模式,通过实战演练提高嵌入式开发能力。
人脸识别项目源码实战
人脸识别项目源码实战
c语言学习
红外光伏缺陷目标检测模型,YOLOv8模型 基于红外光伏缺陷目标检测数据集训练,做了必要的数据增强处理,以达到缺陷类别间的平衡 可检测大面积热斑,单一热斑,二极管短路和异常低温四类缺陷 测试集指标如图所示 ,核心关键词:红外光伏缺陷目标检测模型; YOLOv8模型; 数据增强处理; 缺陷类别平衡; 大面积热斑; 单一热斑; 二极管短路; 异常低温。,基于YOLOv8的红外光伏缺陷检测模型
基于PLC的自动浇花控制系统 西门子1200PLC博途仿真,提供HMI画面,接线图,IO分配表,演示视频,简单讲解视频 博图15.1及以上版本均可使用 ,核心关键词: PLC自动浇花控制系统; 西门子1200PLC博途仿真; HMI画面; 接线图; IO分配表; 演示视频; 简单讲解视频; 博图15.1及以上版本。,基于PLC的自动浇花系统:西门子1200PLC博途仿真实践教程
在智慧园区建设的浪潮中,一个集高效、安全、便捷于一体的综合解决方案正逐步成为现代园区管理的标配。这一方案旨在解决传统园区面临的智能化水平低、信息孤岛、管理手段落后等痛点,通过信息化平台与智能硬件的深度融合,为园区带来前所未有的变革。 首先,智慧园区综合解决方案以提升园区整体智能化水平为核心,打破了信息孤岛现象。通过构建统一的智能运营中心(IOC),采用1+N模式,即一个智能运营中心集成多个应用系统,实现了园区内各系统的互联互通与数据共享。IOC运营中心如同园区的“智慧大脑”,利用大数据可视化技术,将园区安防、机电设备运行、车辆通行、人员流动、能源能耗等关键信息实时呈现在拼接巨屏上,管理者可直观掌握园区运行状态,实现科学决策。这种“万物互联”的能力不仅消除了系统间的壁垒,还大幅提升了管理效率,让园区管理更加精细化、智能化。 更令人兴奋的是,该方案融入了诸多前沿科技,让智慧园区充满了未来感。例如,利用AI视频分析技术,智慧园区实现了对人脸、车辆、行为的智能识别与追踪,不仅极大提升了安防水平,还能为园区提供精准的人流分析、车辆管理等增值服务。同时,无人机巡查、巡逻机器人等智能设备的加入,让园区安全无死角,管理更轻松。特别是巡逻机器人,不仅能进行360度地面全天候巡检,还能自主绕障、充电,甚至具备火灾预警、空气质量检测等环境感知能力,成为了园区管理的得力助手。此外,通过构建高精度数字孪生系统,将园区现实场景与数字世界完美融合,管理者可借助VR/AR技术进行远程巡检、设备维护等操作,仿佛置身于一个虚拟与现实交织的智慧世界。 最值得关注的是,智慧园区综合解决方案还带来了显著的经济与社会效益。通过优化园区管理流程,实现降本增效。例如,智能库存管理、及时响应采购需求等举措,大幅减少了库存积压与浪费;而设备自动化与远程监控则降低了维修与人力成本。同时,借助大数据分析技术,园区可精准把握产业趋势,优化招商策略,提高入驻企业满意度与营收水平。此外,智慧园区的低碳节能设计,通过能源分析与精细化管理,实现了能耗的显著降低,为园区可持续发展奠定了坚实基础。总之,这一综合解决方案不仅让园区管理变得更加智慧、高效,更为入驻企业与员工带来了更加舒适、便捷的工作与生活环境,是未来园区建设的必然趋势。
大型集团用户画像系统化标准化数字化用户主数据管理项目规划方案
基于STM32的水质 浊度检测仪设计与实现(详细设计说明书+ 10008-基于STM32的水质 浊度检测仪设计与实现(详细设计说明书+原理图PCB工程+源码工程+实物照片) 本次设计是设计一款水质检测设备,实现温度检查、水质检测的功能,将检测到的数据显示到显示器中,并实时记录系统的参数 本次系统需要对温度检测,使用的传感器为DS18B20,通过单总线的方式来完成系统温度检测 使用水质检测模块检查水的质量 通过传感器检测到的数据计算后的值实时刷新到显示器中,主要的功能包括以下几点: ①可以对温度实时检测; ②可以对水质实际值实时检测; ③水质浑浊预警 主要特点: 1.以STM32单片机为核心,配合水质模块; 2.主要完成系统的 功能控制、状态显示、信息检测以及报警硬件组建所单片机和传感器等元器件的选择; 3.完成系统控制的软件设计编程; 4.实现对水质检测、温度检查、预警的功能 内容包含: 1、原理图工程 2、PCB工程 3、源码工程 4、实物照片 5、详细介绍说明书-22531字 6、实物照片 7、浊度传感器资料
人脸识别项目实战