天涯新款key-list类型内存数据引擎——Memlink

lylhelin

浏览: 323863 次
性别:
来自: 长沙

最近访客更多访客>>

WangJiaX

java.zhangshuling

fanzhigang0

hellolove

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

2010-12 ( 1)
2010-11 ( 101)
2010-10 ( 24)
更多存档...

博客分类：

数据存储

Redis NoSQL MySQL 设计模式互联网

天涯社区最近开发了一款数据引擎——Memlink ，并将其开源。对于为什么会出现这样一款开源项目、它的能力和市面上的其他款同类型项目相比有怎样的优势，InfoQ中文站特地采访了天涯社区在北京研发中心的技术负责人冯勇先生。

1. 您好，能请您先自我介绍一下吗？您最近在做哪些有趣的事情呢？

大家好！我是天涯技术中心系统平台部负责人冯勇，系统平台部是今年刚组建的部门，旨在优化天涯线上产品的系统架构。天涯是一个有十二年历史的网站，对于一个累积了十二年补丁的系统进行重构、优化，本身就是一件很有趣、很有挑战的事情。

2. 是出于什么初衷，天涯会开发出这样一款数据引擎出来呢？并且最后要开源出来。

近些年，Nosql系统非常流行，也确实对sql系统进行了合理补充，为Web应用提供多种数据解决方案。但是在开源Nosql系统中，key- value系统可选择较多，而key-list/queue系统可选择较少，因此我们开发了memlink来满足我们自己的需要。

在这里，需要强调一些key-list的概念，在实际场景中有大量需要key-list的地方。比如：论坛中的主题列表、回复列表，微博中的用户关注列表、用户feed列表、用户关注feed列表等等。如果使用key-value中的value来存储list（比如：list打包成json放入 value中），其操作性能是非常低效的。

理想的Key-list通常需要如下特点：

list是海量的、且操作性能高效

list是有序的、且可动态调整顺序

至于为什么开源？一方面，我们很多工作都得益于已有的开源系统，所以回馈开源社区是我们应做的义务；另一方面，技术分享也有利于公司本身技术的成长，并吸引更多的技术人才。

3. 能介绍一下Memlink的特性吗？

Memlink是一个高性能、持久化、分布式的Key=>List/Queue数据引擎。正如名称中的Mem所示，所有数据都建构在内存中，保证了系统的高性能，同时使用块链进行内存压缩，使用redo-log技术保证数据的持久化。此外，Memlink还支持主从复制、读写分离、数据项过滤操作等功能。

特点：

内存数据引擎，性能极为高效

List中的Node采用块链组织，精简内存，优化查找效率

Node数据项可自定义Mask表，支持多种过滤操作

支持redo-log，数据持久化，非Cache模式

分布式，主从同步

读写分离，写优先处理。

4. 我们知道市面上还有一些其他基于内存的数据引擎，比如Redis和Scalaris，跟它们相比Memlink解决了什么特别的问题吗？

在设计和开发memlink之前，我们也认真分析对比了Redis。最终没有采用Redis原因有以下四点：

Redis持久化策略(redo-log)不能完全满足线上生产的需求。对于一个成熟的互联网应用应该有足够的容错能力。比如系统统重启、宕机等而不丢失数据。Redis持久化策略一：定时同步磁盘（此期间重启会丢失部分数据）；持久化策略二：不断追加log，这样容易使log膨胀，性能降低。Memlink持久化策略是同时借鉴Redis两种策略，在非创建快照期间追加redo-log，在完成快照后清除redo-log。

Redis主从同步策略不够完善。比如：slaver因为某原因丢失了部分同步数据，则需要重新完全获取一份主节点的所有数据。在大数据量的情况下，不太合适线上生产的需求。

Redis单线程模式，读写没有分离，只能使用单核。Memlink为多线程，充分利用多核，并进行了读写分离，优先保证写。

在内存消耗和性能上Memlink要优于Redis。

Memlink是key=>list/queue引擎，Scalaris是key-value，两者功能出发点上不一样。

5. Memlink在天涯内部的哪些系统中得到了采用？可以提供一下Memlink带来的性能变化的数据吗？

Memlink主要应用于天涯论坛类型产品(论坛、来吧)中。比如论坛的主题列表，当数据达到百万、千万量级，采用Mysql系统进行分页浏览时，基本上不能响应，而Memlink则性能提升了上百倍。具体可见Benchmark 。

6. 能向广大的开发者朋友们介绍一下，如何来选择一款适用自己的NoSQL产品呢？

首先需要确定业务需求，是否需要NoSQL产品。对于大多数百万量级、千万量级的应用，MySQL也能支持。

其次在明确需要NoSQL产品后，应根据业务需求抽象出数据模型，比如：有些数据是需要采用key-value系统存储，有些数据是需要采用key-list系统存储，有些数据是采用文档数据库存储等等。

对于NoSQL产品候选列表的选项，可以从如下维度进行考虑：

系统的容量、性能、软硬件环境是否符合需求？

数据的安全机制如何？各种异常是否会丢失数据？

具备主从复制功能？何种一致性策略？

可扩展性？自动扩展 or 程序进行扩展？

系统的可控性？系统的成熟度、对开发者的支持度、bug谁来修复等等

7. Memlink现在的版本号是多少？未来的发展计划是怎样的？

Memlink现在的版本号为0.2，具备基本key-list/主从复制等功能，目前正在测试中。

在0.3/0.4版本中，Memlink会增加双向队列、用户认证等功能。具体可以见Memlink的RoadMap 。

长远而言，Memlink专注为一个高性能、持久化、分布式的Key=>List/Queue数据引擎，不会增加其他数据存储模型。

更多关于Memlink的信息，请参考Memlink的介绍文档和设计文档。

原文：http://www.infoq.com/cn/news/2010/11/tianya-memlink

分享到：

设计Web应用程序时要注意可伸缩性 | 约束是一种隐蔽的优势

2010-11-26 09:11
浏览 1144
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

电力系统中基于MATLAB的价格型需求响应与电价弹性矩阵优化: 内容概要：本文详细介绍了如何利用MATLAB进行价格型需求响应的研究，特别是电价弹性矩阵的构建与优化。文章首先解释了电价弹性矩阵的概念及其重要性，接着展示了如何通过MATLAB代码实现弹性矩阵的初始化、负荷变化量的计算以及优化方法。文中还讨论了如何通过非线性约束和目标函数最小化峰谷差，确保用户用电舒适度的同时实现负荷的有效调节。此外，文章提供了具体的代码实例，包括原始负荷曲线与优化后负荷曲线的对比图，以及基于历史数据的参数优化方法。适合人群：从事电力系统优化、能源管理及相关领域的研究人员和技术人员。使用场景及目标：适用于希望深入了解并掌握价格型需求响应机制的专业人士，旨在帮助他们更好地理解和应用电价弹性矩阵，优化电力系统的负荷分布，提高能源利用效率。其他说明：文章强调了实际应用中的注意事项，如弹性矩阵的动态校准和用户价格敏感度的滞后效应，提供了实用的技术细节和实践经验。

一级医院医疗信息管理系统安装调试技术服务合同20240801.pdf: 一级医院医疗信息管理系统安装调试技术服务合同20240801.pdf

表5 文献综述.doc: 表5 文献综述.doc

36W低压输入正激电源，正激变压器设计方法步骤及谐振电感的设计方法，主要讲诉了正激电源变压器测的输入输出参数，按输入的条件设计相关的变压器的参数，同时将输出电感的设计方法一并例出，详细的设计步骤: 36W低压输入正激电源变压器电感设计

基于YOLOv8的深度学习课堂行为检测系统源码(含检测图片和视频): 基于YOLOv8的深度学习课堂行为检测系统源码，软件开发环境python3.9，系统界面开发pyqt5。在使用前安装python3.9，并安装软件所需的依赖库，直接运行MainProgram.py文件即可打开程序。模型训练时，将train,val数据集的绝对路径改为自己项目数据集的绝对路径，运行train.py文件即可开始进行模型训练，内含项目文件说明，以及检测图片和视频。

odbc-oracle zabbix模版原版: odbc_oracle zabbix模版原版

基于纳什谈判理论的风光氢多主体能源系统合作运行方法——综合能源交易与优化模型: 内容概要：本文探讨了利用纳什谈判理论来优化风光氢多主体能源系统的合作运行方法。通过MATLAB代码实现了一个复杂的优化模型，解决了风电、光伏和氢能之间的合作问题。文中详细介绍了ADMM（交替方向乘子法）框架的应用，包括联盟效益最大化和收益分配谈判两个子任务。此外，还涉及了加权残差计算、目标函数构造、可视化工具以及多种博弈模式的对比等功能模块。实验结果显示，合作模式下系统总成本显著降低，氢能利用率大幅提升。适合人群：从事能源系统研究的专业人士、对博弈论及其应用感兴趣的学者和技术人员。使用场景及目标：适用于需要优化多主体能源系统合作运行的场合，如工业园区、电网公司等。主要目标是提高能源利用效率，降低成本，增强系统的灵活性和稳定性。其他说明：代码中包含了丰富的可视化工具，能够帮助研究人员更好地理解和展示谈判过程及结果。同时，提供了多种博弈模式的对比功能，便于进行性能评估和方案选择。

C#与Halcon联合编程实现高效视觉几何定位与测量框架: 内容概要：本文详细介绍了如何利用C#与Halcon联合编程构建高效的视觉几何定位与测量框架。主要内容涵盖模板创建与匹配、圆测量、数据持久化以及图像采集等方面的技术细节。首先，通过创建形状模板并进行匹配，实现了工件的精确定位。接着，针对圆形物体的测量，提出了动态ROI绘制、亚像素边缘提取和稳健圆拟合的方法。此外，还讨论了模板管理和图像采集的最佳实践，确保系统的稳定性和高效性。最后，强调了Halcon对象的内存管理和错误处理机制，提供了实用的优化建议。适合人群：具备一定编程基础，尤其是对C#和Halcon有一定了解的研发人员和技术爱好者。使用场景及目标：适用于工业生产线上的自动化检测设备开发，旨在提高工件定位和尺寸测量的精度与效率。主要目标是帮助开发者掌握C#与Halcon联合编程的具体实现方法，从而构建稳定可靠的视觉检测系统。其他说明：文中提供了大量实战代码片段和调试技巧，有助于读者快速理解和应用相关技术。同时，作者分享了许多实际项目中的经验和教训，使读者能够避开常见陷阱，提升开发效率。

QT6 C++视频播放器实现（基于QGraphicsVideo）: QT视频播放器实现（基于QGraphicsView）

评估管线钢环焊缝质量及其对氢脆的敏感性.pptx: 评估管线钢环焊缝质量及其对氢脆的敏感性.pptx

机器学习（预测模型）：专注于 2024 年出现的漏洞（CVE）信息数据集: 该是一个在 Kaggle 上发布的数据集，专注于 2024 年出现的漏洞（CVE）信息。以下是关于该数据集的详细介绍：该数据集收集了 2024 年记录在案的各类漏洞信息，涵盖了漏洞的利用方式（Exploits）、通用漏洞评分系统（CVSS）评分以及受影响的操作系统（OS）。通过整合这些信息，研究人员和安全专家可以全面了解每个漏洞的潜在威胁、影响范围以及可能的攻击途径。数据主要来源于权威的漏洞信息平台，如美国国家漏洞数据库（NVD）等。这些数据经过整理和筛选后被纳入数据集，确保了信息的准确性和可靠性。数据集特点：全面性：涵盖了多种操作系统（如 Windows、Linux、Android 等）的漏洞信息，反映了不同平台的安全状况。实用性：CVSS 评分提供了漏洞严重程度的量化指标，帮助用户快速评估漏洞的优先级。同时，漏洞利用信息（Exploits）为安全研究人员提供了攻击者可能的攻击手段，有助于提前制定防御策略。时效性：专注于 2024 年的漏洞数据，反映了当前网络安全领域面临的新挑战和新趋势。该数据集可用于多种研究和实践场景：安全研究：研究人员可以利用该数据集分析漏洞的分布规律、攻击趋势以及不同操作系统之间的安全差异，为网络安全防护提供理论支持。机器学习与数据分析：数据集中的结构化信息适合用于机器学习模型的训练，例如预测漏洞的 CVSS 评分、识别潜在的高危漏洞等。企业安全评估：企业安全团队可以参考该数据集中的漏洞信息，结合自身系统的实际情况，进行安全评估和漏洞修复计划的制定。

QML Combobox 自动过滤，输入字符串后自动匹配: 博客主页：https://blog.csdn.net/luoyayun361 QML ComboBox控件，输入关键字后自动过滤包含关键字的列表，方便快速查找列表项

【人工智能领域】人工智能技术发展历程、核心原理及应用指南：涵盖机器学习、深度学习、NLP和计算机视觉的全面介绍: 内容概要：本文全面介绍了人工智能技术的发展历程、核心技术原理、应用方法及其未来趋势。首先阐述了人工智能的定义和核心目标，随后按时间顺序回顾了其从萌芽到爆发的五个发展阶段。接着详细讲解了机器学习、深度学习、自然语言处理和计算机视觉等核心技术原理，并介绍了使用现成AI服务和开发自定义AI模型的应用方法。此外，还展示了智能客服系统、图像分类应用和智能推荐系统的具体实现案例。针对普通用户，提供了使用大模型的指南和提问技巧，强调了隐私保护、信息验证等注意事项。最后展望了多模态AI、可解释AI等未来发展方向，并推荐了相关学习资源。; 适合人群：对人工智能感兴趣的初学者、技术人员以及希望了解AI技术应用的普通大众。; 使用场景及目标：①帮助初学者快速了解AI的基本概念和发展脉络；②为技术人员提供核心技术原理和应用方法的参考；③指导普通用户如何有效地使用大模型进行日常查询和任务处理。; 其他说明：本文不仅涵盖了AI技术的基础知识，还提供了丰富的实际应用案例和实用技巧，旨在帮助读者全面理解人工智能技术，并能在实际工作中加以应用。同时提醒读者关注AI伦理和版权问题，确保安全合法地使用AI工具。

本学习由 Matrix 工作室制作并开发，包括算法与数据结构的学习路线和各种题解: 本学习由 Matrix 工作室制作并开发，包括算法与数据结构的学习路线和各种题解。

基于智慧图书馆基础业务流程Axure11高保真原型设计: 本项目致力于构建基于微服务架构的智慧图书馆管理平台，重点突破多校区图书馆异构系统间的数据壁垒。通过建立统一数据治理规范、部署智能分析模块、重构业务流程引擎，系统性实现以下建设目标：构建跨馆业务数据的标准化整合通道，实施容器化部署的弹性资源管理体系，开发具备机器学习能力的业务辅助决策系统，打造可量化评估的管理效能提升模型，最终形成支持PB级数据处理的分布式存储体系与全维度数据资产图谱。

mysql中慢sql分析: 根据processlist查询出慢sql 1.修改配置文件中的mysql链接 2.目前是15秒执行一次获取执行时间在5秒上的sql，可以在配置中修改 3.执行后查出的慢sql会记录到log文件夹中以日期命名的txt文件中，可自行查验

全域通航低空经济服务平台建设实施方案.pptx: 全域通航低空经济服务平台建设实施方案.pptx

全国联合交通查询手册，涵盖各大城市: 全国交通一卡通互联互通服务手册，支持在线查询

电力电子中移相全桥DC-DC变换器的Simulink离散化建模与优化: 内容概要：本文详细介绍了如何在Simulink中进行移相全桥DC-DC变换器的离散化建模及其优化。主要内容包括搭建主电路、PWM波形生成、数字PI调节器的设计以及针对负载突变情况下的闭环控制优化。文中特别强调了移相控制、死区时间设置、采样周期选择、积分限幅、前馈补偿等关键技术点的应用，确保在极端负载条件下（如从3kW突变为3.6W）输出电压仍能保持稳定。此外，作者还分享了许多实践经验，如避免非线性磁化曲线带来的数值振荡、合理设置仿真步长等。适合人群：从事电力电子研究或开发的技术人员，尤其是对移相全桥变换器感兴趣的研究者和技术爱好者。使用场景及目标：适用于需要深入了解移相全桥DC-DC变换器工作原理及其在Simulink环境下的离散化建模和优化的人群。目标是掌握如何通过合理的参数设定和算法改进，使系统能够在复杂工况下保持良好的性能。其他说明：文中提供了大量具体的Matlab/Simulink代码片段，帮助读者更好地理解和实践相关概念。同时，作者也指出了许多常见的陷阱和注意事项，有助于初学者少走弯路。

西门子S7-1200 PLC污水处理项目的博途V17程序设计与优化: 内容概要：本文详细介绍了西门子S7-1200 PLC在污水处理项目中的应用，涵盖模拟量处理、设备轮换、Modbus通讯控制以及事件记录等多个方面。具体包括：使用4-20mA超声波传感器进行液位检测并采用滑动窗口滤波法处理信号，确保液位波动控制在±2cm以内；通过SCL代码实现两组提升泵的智能轮换，避免长时间连续运行带来的设备损耗；利用Modbus TCP和RTU协议对变频器进行精确控制，确保鼓风机和其他设备的稳定运行；采用ALARM_S函数和循环存储队列实现高效的报警管理和事件记录。此外，文中还分享了许多实际操作中的经验和技巧，如硬件滤波与软件校验结合、防止设备同时启动的延时机制等。适合人群：从事工业自动化领域的工程师和技术人员，尤其是熟悉西门子PLC编程和博途软件使用的专业人士。使用场景及目标：适用于污水处理厂或其他类似工业环境中，旨在提高PLC系统的稳定性和可靠性，减少维护成本，延长设备使用寿命。通过对文中提供的代码片段和实践经验的学习，可以帮助工程师更好地理解和掌握PLC编程技巧，从而应用于实际工程项目中。其他说明：文中不仅提供了具体的编程实例，还分享了很多宝贵的实战经验，如如何处理传感器异常、优化通讯协议配置等。这些内容对于初学者来说是非常宝贵的知识财富，能够帮助他们快速成长并在工作中游刃有余。

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论