`
ChristmasLin
  • 浏览: 42082 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

消息存储系统

    博客分类:
  • mq
mq 
阅读更多

之前的一个消息系统使用的底层存储是je,java版的bdb(berkeley db),先赞叹一下,这产品的确牛!相关的中文博客(http://www.bdbchina.com/)。但是对于消息系统的存储来说,它有一些特点,用je的btree有些不合适,然后出了问题只能等死或去调一大推不熟悉的源码,还有licence的问题。所以一直在考虑,在空闲时间,根据消息系统的特点写一个存储,msgStore,至少在排错方面不会那么被动。

首先,消息系统的几个特点:

  1. 消息的生命周期非常短,但又需要写文件,就怕那几乎不会出现的jvm崩溃。
  2. 插入和删除非常频繁,几乎没有更新,读取至多一次
  3. 外在表现像一个queue,先进先出,但是也会存在小量的反fifo

那么根据这些特性和一些性能考虑,对msgStore的取舍:

  1. key/value,key为long,value是二维的byte数组,尽量的作为一个独立的模块,和消息的具体格式无关
  2. 参考je的模型,划分多个db,每个kv属于一个db
  3. 提供insert,update,delete,get等常规操作,不提供对不同key的批量操作
  4. move操作,把指定的kv高效的在db间移动,避免delete再insert
  5. ref操作,某个db的kv可被多个db高效的引用
  6. 尽量提高写性能,读性能由使用者考虑,例如通过读缓存,预读等方法
  7. 本身不提供读缓存,只有使用者才最清楚那些数据缓存可以最大的提高性能和什么时刻需要预读,如果是msgStore提供缓存,只能提供byteArray的缓存,还需要一次转换
  8. 提供类似db的本地事务
  9. 支持临时db,重启后该db的所有消息废弃

初步思路:

  1. journal的形式,记录所有的操作,所有的操作都是追加到文件里,避免寻道
  2. 一系列固定大小的文件 page,page个数随着kv的数目而增长或减小
  3. 当page不被引用,可以被删除,page不会被重用
  4. page有编号,编号能反映不同page里面log的先后顺序,编号大的page的log一定发生在page小的log之后
  5. 约束page的顺序的一个好处,在删除废弃的page时,按照从小到大的顺序删除,在这过程故障不会导致数据的不一致。例如insert_kv1[page1],delete_kv1[page2],当page1和page2都废弃,删除page1后失败,重新load时,只能load到delete_kv1,可判断kv1是被删除,之前记录kv1的操作的page被回收
  6. create db,remove db等对db管理的log和kv分别存在不同的page,因为db管理log生存时间可能非常长,放在一起阻止某个page被删除,分为ctrl page和kv page,以后说的page都是kv page。db ctrl的log会非常少
  7. 一个kv不能跨page。为避免浪费page空间,当kv大于一定的阀值认为是blob v,类似db处理blob字段的方法,写成一个单独的文件,page只记载文件路径
  8. 当page的空间使用率低到一定程度进行page合并。每个db的kv先进先出,一般不会出现这种情况,但是因为所有的db的kv都会写到同样的page里(如果每个db各自有自己的page,会引入寻道开销),如果相连的page可以合并,会进行合并,合并后生成新的page。这里的一个约束条件是,只有相连的page才能合并,新page不能破坏page的顺序。为了这点,如果不是合并生成的page,申请时page序号不是递增的,而是有一个跨度,那么合并的新page可使用跨度间的序号。例如page100和page200合并,新page序号是201
  9. 一个写线程,所有的写操作请求都会先提交,不是直接调用io,由写线程来合并请求,进行块写。在writeforce(每次写都需要刷磁盘缓存)这种策略下,提高的性能显著
  10. 多个读线程,同样提交读请求,由读线程进行合并,某些读请求的数据块可能是相连或是在同一个page里,可优化成每次读较大的块,再提取
  11. 支持优雅的关闭模式,拒绝新请求,等待提交的请求完成
  12. key以hashmap组织在内存里,key的内存尽量保持100byte以下,如果是百万级别的数据消耗的内存比较大,可考虑适当的钝化一部分key
  13. 启动时需要读完所有的page,在数据量大时比较耗时。在正常关闭时把所有的key持久化,启动时只需要解析持久化的key即可。对于一个系统来说,正常关闭的次数是远远大于非正常关闭的
  14. 使用checkpoint保证数据的完整性

该文章主要起一个备忘的作用,想到啥再更新。

0
0
分享到:
评论

相关推荐

    Java-美妆神域_3rm1m18i_221-wx.zip

    Java-美妆神域_3rm1m18i_221-wx.zip

    51单片机的温度监测与控制(温控风扇)

    51单片机的温度监测与控制(温控风扇)

    电赛案例,C++简单的智能家居系统,其中包含了温度监测、光照控制和报警系

    电赛案例,C++简单的智能家居系统,其中包含了温度监测、光照控制和报警系统。该系统可以: 监控室内温度:当温度超过设定阈值时,触发警报。 自动调节光照:根据光线传感器的值自动调节LED灯的亮度。 入侵检测:通过红外传感器检测入侵,并触发警报。

    圣诞树 html版 可修改祝福语

    圣诞树 html版 可修改祝福语。 记事本或vscode编辑html文件:ctrl+F寻找”myLabels“关键词,定位到该处即可修改祝福语

    基于python编写的selenium自动化测试框架,采用PO模式,页面元素采用yaml进行管理资料齐全+详细文档+高分项目+源码.zip

    【资源说明】 基于python编写的selenium自动化测试框架,采用PO模式,页面元素采用yaml进行管理资料齐全+详细文档+高分项目+源码.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!

    屏幕截图 2024-12-21 170434.png

    屏幕截图 2024-12-21 170434

    基于SpringBoot的学生信息管理系统源码

    基于SpringBoot的学生信息管理系统(前后端源码+数据库+文档+运行截图) 学生信息管理 班级信息管理 教师信息管理 课程信息管理 选课信息管理 考勤信息管理 请假信息管理 成绩信息管理 基于SpringBoot的学生信息管理系统(前后端源码+数据库+文档+运行截图) 学生信息管理 班级信息管理 教师信息管理 课程信息管理 选课信息管理 考勤信息管理 请假信息管理 成绩信息管理基于SpringBoot的学生信息管理系统(前后端源码+数据库+文档+运行截图) 学生信息管理 班级信息管理 教师信息管理 课程信息管理 选课信息管理 考勤信息管理 请假信息管理 成绩信息管理基于SpringBoot的学生信息管理系统(前后端源码+数据库+文档+运行截图) 学生信息管理 班级信息管理 教师信息管理 课程信息管理 选课信息管理 考勤信息管理 请假信息管理 成绩信息管理基于SpringBoot的学生信息管理系统(前后端源码+数据库+文档+运行截图) 学生信息管理 班级信息管理 教师信息管理 课程信息管理 选课信息管理 考勤信息管理

    径向基函数内核 – 机器学习python案例脚本,内核在将数据转换为更高维空间方面发挥着重要作用

    径向基函数内核 – 机器学习 内核在将数据转换为更高维空间方面发挥着重要作用,使算法能够学习复杂的模式和关系。在众多的内核函数中,径向基函数(RBF)内核作为一种多功能且强大的工具脱颖而出。在本文中,我们深入探讨了RBF内核的复杂性,探讨了它的数学公式、直观理解、实际应用及其在各种机器学习算法中的重要性。

    工具变量-中国省级数字经济发展水平面板数据(2012-2022).xlsx

    详细介绍及样例数据:https://blog.csdn.net/samLi0620/article/details/144636765

    51单片机控制的智能小车.7z

    51单片机控制的智能小车.7z

    基于卷积神经网络的数字手势识别安卓APP,识别数字手势0-10详细文档+全部资料+优秀项目+源码.zip

    【资源说明】 基于卷积神经网络的数字手势识别安卓APP,识别数字手势0-10详细文档+全部资料+优秀项目+源码.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!

    pymssql-2.1.4.dev5-cp37-cp37m-win-amd64.whl pymssql-2.1.4.dev5-cp37-cp37m-win32.whl

    python 使用sqlserver必须要这个问题,没办法,只能满世界的找地方下载,终于让我下载到了,现在分享给大家使用

    四川采矿场生产安全事故管理制度.docx

    四川采矿场生产安全事故管理制度

    简约灰粉共存版_8.0.53.apk

    简约灰粉共存版_8.0.53.apk

    ECharts散点图-全国主要城市空气质量(百度地图).rar

    ECharts散点图-全国主要城市空气质量(百度地图)

    四川采矿场安全检查管理规定.docx

    四川采矿场安全检查管理规定

    JSP基于WEB网上论坛设计与实现(源代码+论文+开题报告+答辩PPT+外文翻译)(2024kt).7z

    1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于计算机科学与技术等相关专业,更为适合;

    空中俯视物体检测9-YOLOv5数据集合集.rar

    空中俯视物体检测9-YOLOv5数据集合集.rar使用YOLO算法从图像中检测对象-V2 2023-05-11 2:51 PM ============================= *与您的团队在计算机视觉项目上合作 *收集和组织图像 *了解和搜索非结构化图像数据 *注释,创建数据集 *导出,训练和部署计算机视觉模型 *使用主动学习随着时间的推移改善数据集 对于最先进的计算机视觉培训笔记本,您可以与此数据集一起使用 该数据集包括1015张图像。 以YOLO V5 PYTORCH格式注释检测对象 - 图像。 将以下预处理应用于每个图像: *像素数据的自动取向(带有Exif-Arientation剥离) *调整大小为640x640(拉伸) 没有应用图像增强技术。

    会使用到的js文件词云图

    词云图

    Python&OpenCV手势识别系统(完整源码&自定义UI操作界面&视频教程)

    Python高分毕设——Python&Opencv手势识别系统(完整源码&自定义UI操作界面&视频教程) Python高分毕设——Python&Opencv手势识别系统(完整源码&自定义UI操作界面&视频教程) 使用了OpenCV的视频采集, 图像色域转换, 颜色通道分割, 高斯滤波, OSTU自动阈值, 凸点检测, 边缘检测, 余弦定理计算手势等功能. 准备工作 安装 Python-OpenCV 库 pip install opencv-python -i https://mirrors.ustc.edu.cn/pypi/web/simple 利用 -i 为pip指令镜像源, 这里使用电子科技大学的源, 速度比官方源更快. 安装 Numpy 科学计算库 pip install numpy -i https://mirrors.ustc.edu.cn/pypi/web/simple 安装 PyAutogui 库 pip install pyautogui -i https://mirrors.ustc.edu.cn/pypi/web/simple 代码实现 import nu

Global site tag (gtag.js) - Google Analytics