新浪微博 Redis 实战经验分享

san_yun

浏览: 2693583 次
来自: 杭州

最近访客更多访客>>

空城旧梦why

sd3870181

alexqdjay

hanmiao

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

redis

Tape is Dead，Disk is Tape，Flash is Disk，RAM Locality is King. — Jim Gray

Redis不是比较成熟的Memcache或者Mysql的替代品，是对于大型互联网类应用在架构上很好的补充。现在有越来越多的应用也在纷纷基于Redis做架构的改造。

可以简单公布一下Redis平台实际情况

2200+亿 commands/day 5000亿Read/day 500亿Write/day

18TB+ Memory

500+ Servers in 6 IDC 2000+instances

应该是国内外比较大的Redis使用平台，今天主要从应用角度谈谈Redis服务平台。

Redis使用场景

1.Counting（计数）

计数的应用在另外一篇文章里较详细的描述，计数场景的优化 http://www.xdata.me/?p=262 这里就不坳述了。

可以预见的是，有很多同学认为把计数全部存在内存中成本非常高，我在这里用个图表来表示下我的观点：

很多情况大家都会设想纯使用内存的方案会很有很高成本，但实际情况往往会有一些不一样：

1.COST，对于有一定吞吐需求的应用来说，肯定会单独申请DB、Cache资源，很多担心DB写入性能的同学还会主动将DB更新记入异步队列，而这三块的资源的利用率一般都不会太高。资源算下来，你惊异的发现：反而纯内存的方案会更精简！

2.KISS原则，这对于开发是非常友好的，我只需要建立一套连接池，不用担心数据一致性的维护，不用维护异步队列。

3.Cache穿透风险，如果后端使用DB，肯定不会提供很高的吞吐能力，cache宕机如果没有妥善处理，那就悲剧了。

4.大多数的起始存储需求，容量较小。

2.Reverse cache（反向cache）

面对微博常常出现的热点，如最近出现了较为火爆的短链，短时间有数以万记的人点击、跳转，而这里会常常涌现一些需求，比如我们向快速在跳转时判定用户等级，是否有一些账号绑定，性别爱好什么的，已给其展示不同的内容或者信息。

普通采用Memcache+Mysql的解决方案，当调用id合法的情况下，可支撑较大的吞吐。但当调用id不可控，有较多垃圾用户调用时，由于memcache未有命中，会大量的穿透至Mysql服务器，瞬间造成连接数疯长，整体吞吐量降低，响应时间变慢。

这里我们可以用redis记录全量的用户判定信息，如string key:uid int:type，做一次反向的cache，当用户在redis快速获取自己等级等信息后，再去Mc+Mysql层去获取全量信息。如图：

当然这也不是最优化的场景，如用Redis做bloomfilter，可能更加省用内存。

3.Top 10 list

产品运营总会让你展示最近、最热、点击率最高、活跃度最高等等条件的top list。很多更新较频繁的列表如果使用MC+MySQL维护的话缓存失效的可能性会比较大，鉴于占用内存较小的情况，使用Redis做存储也是相当不错的。

4.Last Index

用户最近访问记录也是redis list的很好应用场景,lpush lpop自动过期老的登陆记录，对于开发来说还是非常友好的。

5.Relation List/Message Queue

这里把两个功能放在最后，因为这两个功能在现实问题当中遇到了一些困难，但在一定阶段也确实解决了我们很多的问题，故在这里只做说明。

Pinterest使用Redis存储社交graph信息：

http://blog.gopivotal.com/case-studies-2/using-redis-at-pinterest-for-billions-of-relationships

Message Queue就是通过list的lpop及lpush接口进行队列的写入和消费，由于本身性能较好也能解决大部分问题。

6.Fast transaction with Lua

Redis 的Lua的功能扩展实际给Redis带来了更多的应用场景，你可以编写若干command组合作为一个小型的非阻塞事务或者更新逻辑，如：在收到message推送时，同时1.给自己的增加一个未读的对话 2.给自己的私信增加一个未读消息 3.最后给发送人回执一个完成推送消息，这一层逻辑完全可以在Redis Server端实现。

但是，需要注意的是Redis会将lua script的全部内容记录在aof和传送给slave，这也将是对磁盘，网卡一个不小的开销。

7.Instead of Memcache

很多测试和应用均已证明，

1.在性能方面Redis并没有落后Memcache多少，而单线程的模型给Redis反而带来了很强的扩展性。

2.在很多场景下，Redis对同一份数据的内存开销是小于Memcache的slab分配的。

3.Redis提供的数据同步功能，其实是对cache的一个强有力功能扩展。

Redis使用的重要点

1.rdb/aof Backup!

我们线上的Redis 95%以上是承担后端存储功能的，我们不仅用作cache，而更为一种k-v存储，他完全替代了后端的存储服务（MySQL），故其数据是非常重要的，如果出现数据污染和丢失，误操作等情况，将是难以恢复的。所以备份是非常必要的！为此，我们有共享的hdfs资源作为我们的备份池，希望能随时可以还原业务所需数据。

2.Small item & Small instance!

由于Redis单线程（严格意义上不是单线程，但认为对request的处理是单线程的）的模型，大的数据结构list,sorted set,hash set的批量处理就意为着其他请求的等待，故使用Redis的复杂数据结构一定要控制其单key-struct的大小。

另外，Redis单实例的内存容量也应该有严格的限制。单实例内存容量较大后，直接带来的问题就是故障恢复或者Rebuild从库的时候时间较长，而更糟糕的是，Redis rewrite aof和save rdb时，将会带来非常大且长的系统压力，并占用额外内存，很可能导致系统内存不足等严重影响性能的线上故障。我们线上96G/128G内存服务器不建议单实例容量大于20/30G。

3.Been Available!

业界资料和使用比较多的是Redis sentinel(哨兵)

http://www.huangz.me/en/latest/storage/redis_code_analysis/sentinel.html

http://qiita.com/wellflat/items/8935016fdee25d4866d9

2000行C实现了服务器状态检测，自动故障转移等功能。

但由于自身实际架构往往会复杂，或者考虑的角度比较多，为此@许琦eryk 和我一同做了hypnos项目。

hypnos是神话中的睡神，字面意思也是希望我们工程师无需在休息时间处理任何故障。:-)

其工作原理示意如下：

Talk is cheap, show me your code! 稍后将单独写篇博客细致讲下Hypnos的实现。

4.In Memory or not?

发现一种情况，开发在沟通后端资源设计的时候，常常因为习惯使用和错误了解产品定位等原因，而忽视了对真实使用用户的评估。也许这是一份历史数据，只有最近一天的数据才有人进行访问，而把历史数据的容量和最近一天请求量都抛给内存类的存储现实是非常不合理的。

所以当你在究竟使用什么样的数据结构存储的时候，请务必先进行成本衡量，有多少数据是需要存储在内存中的？有多少数据是对用户真正有意义的。因为这其实对后端资源的设计是至关重要的，1G的数据容量和1T的数据容量对于设计思路是完全不一样的

Plans in future?

1.slave sync改造

全部改造线上master-slave数据同步机制，这一点我们借鉴了MySQL Replication的思路，使用rdb+aof+pos作为数据同步的依据，这里简要说明为什么官方提供的psync没有很好的满足我们的需求：

假设A有两个从库B及C,及 A `— B&C，这时我们发现master A服务器有宕机隐患需要重启或者A节点直接宕机，需要切换B为新的主库，如果A、B、C不共享rdb及aof信息，C在作为B的从库时，仍会清除自身数据，因为C节点只记录了和A节点的同步状况。

故我们需要有一种将A`–B&C 结构切换切换为A`–B`–C结构的同步机制，psync虽然支持断点续传，但仍无法支持master故障的平滑切换。

实际上我们已经在我们定制的Redis计数服务上使用了如上功能的同步，效果非常好，解决了运维负担，但仍需向所有Redis服务推广，如果可能我们也会向官方Redis提出相关sync slave的改进。

2.更适合redis的name-system Or proxy

细心的同学发现我们除了使用DNS作为命名系统，也在zookeeper中有一份记录，为什么不让用户直接访问一个系统，zk或者DNS选择其一呢？

其实还是很简单，命名系统是个非常重要的组件，而dns是一套比较完善的命名系统，我们为此做了很多改进和试错，zk的实现还是相对复杂，我们还没有较强的把控粒度。我们也在思考用什么做命名系统更符合我们需求。

3.后端数据存储

大内存的使用肯定是一个重要的成本优化方向，flash盘及分布式的存储也在我们未来计划之中。

分享到：

跳表SkipList的原理和实现 | solr code quick start

2014-02-07 13:36
浏览 859
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

新浪redis运维实战.pdf: 【新浪Redis运维实战】是新浪高级DBA赵景波分享的关于新浪数据库平台在Redis运维方面的实践经验。这个分享主要涵盖了三个核心部分：...这对于任何希望深入了解和实践Redis运维的专业人士来说，都是极其宝贵的经验分享。

从程序员到CTO大牛企业内部PDF与PPT合集.zip: 新浪微博redis优化历程微博Cache架构设计实践 Go在大数据开发中的经验总结基于Go构建滴滴核心业务平台的实践京东分布式K-V存储设计与挑战去哪网数据库架构发展历程 58速运数据库降压优化实践云时代的数据库演变...

新浪PHP面试题新浪PHP面试题: 14. **项目实战经验**：包括代码组织结构、团队协作、项目部署、调试技巧等。以上知识点是PHP开发者在面试中可能遇到的，尤其对于新浪这样的大型互联网公司，对候选人的综合能力和问题解决能力会有较高要求。通过...

Java开发微信朋友圈PC版系统（架构1.0+Spring Boot2.X实战）: 2021已然来临，在此之际debug抽空撸了一套类似“QQ空间”、“新浪微博”、“微信朋友圈”PC版的互联网社交软件系统，并将其录制成了视频，特此分享给诸位进行学习，以掌握、巩固更多的技术栈和项目、产品开发经验！...

Delphi 12.3控件之TraeSetup-stable-1.0.12120.exe: Delphi 12.3控件之TraeSetup-stable-1.0.12120.exe

基于GPRS，GPS的电动汽车远程监控系统的设计与实现.pdf: 基于GPRS，GPS的电动汽车远程监控系统的设计与实现.pdf

基于MATLAB/Simulink 2018a的单机无穷大系统暂态稳定性仿真与故障分析: 内容概要：本文详细介绍了如何利用MATLAB/Simulink 2018a进行单机无穷大系统的暂态稳定性仿真。主要内容包括搭建同步发电机模型、设置无穷大系统等效电源、配置故障模块及其控制信号、优化求解器设置以及绘制和分析转速波形和摇摆曲线。文中还提供了多个实用脚本，如故障类型切换、摇摆曲线计算和极限切除角的求解方法。此外，作者分享了一些实践经验，如避免常见错误和提高仿真效率的小技巧。适合人群：从事电力系统研究和仿真的工程师和技术人员，尤其是对MATLAB/Simulink有一定基础的用户。使用场景及目标：适用于需要进行电力系统暂态稳定性分析的研究项目或工程应用。主要目标是帮助用户掌握单机无穷大系统的建模和仿真方法，理解故障对系统稳定性的影响，并能够通过仿真结果评估系统的性能。其他说明：文中提到的一些具体操作和脚本代码对于初学者来说可能会有一定的难度，建议结合官方文档或其他教程一起学习。同时，部分技巧和经验来自于作者的实际操作，具有一定的实用性。

【KUKA 机器人资料】：KUKA机器人剑指未来——访库卡自动化设备(上海)有限公司销售部经理邹涛.pdf: KUKA机器人相关资料

基于DLR模型的PM10–能见度–湿度相关性研究.pdf: 基于DLR模型的PM10–能见度–湿度相关性研究.pdf

MATLAB/Simulink中基于电导增量法的光伏并网系统MPPT仿真及其环境适应性分析: 内容概要：本文详细介绍了如何使用MATLAB/Simulink进行光伏并网系统的最大功率点跟踪(MPPT)仿真，重点讨论了电导增量法的应用。首先阐述了电导增量法的基本原理，接着展示了如何在Simulink中构建光伏电池模型和MPPT控制系统，包括Boost升压电路的设计和PI控制参数的设定。随后，通过仿真分析了不同光照强度和温度条件对光伏系统性能的影响，验证了电导增量法的有效性，并提出了针对特定工况的优化措施。适合人群：从事光伏系统研究和技术开发的专业人士，尤其是那些希望通过仿真工具深入理解MPPT控制机制的人群。使用场景及目标：适用于需要评估和优化光伏并网系统性能的研发项目，旨在提高系统在各种环境条件下的最大功率点跟踪效率。其他说明：文中提供了详细的代码片段和仿真结果图表，帮助读者更好地理解和复现实验过程。此外，还提到了一些常见的仿真陷阱及解决方案，如变步长求解器的问题和PI参数整定技巧。

【KUKA 机器人坐标的建立】：mo2_base_en.ppt: KUKA机器人相关文档

风力发电领域双馈风力发电机（DFIG）Simulink模型的构建与电流电压波形分析: 内容概要：本文详细探讨了双馈风力发电机（DFIG）在Simulink环境下的建模方法及其在不同风速条件下的电流与电压波形特征。首先介绍了DFIG的基本原理，即定子直接接入电网，转子通过双向变流器连接电网的特点。接着阐述了Simulink模型的具体搭建步骤，包括风力机模型、传动系统模型、DFIG本体模型和变流器模型的建立。文中强调了变流器控制算法的重要性，特别是在应对风速变化时，通过实时调整转子侧的电压和电流，确保电流和电压波形的良好特性。此外，文章还讨论了模型中的关键技术和挑战，如转子电流环控制策略、低电压穿越性能、直流母线电压脉动等问题，并提供了具体的解决方案和技术细节。最终，通过对故障工况的仿真测试，验证了所建模型的有效性和优越性。适用人群：从事风力发电研究的技术人员、高校相关专业师生、对电力电子控制系统感兴趣的工程技术人员。使用场景及目标：适用于希望深入了解DFIG工作原理、掌握Simulink建模技能的研究人员；旨在帮助读者理解DFIG在不同风速条件下的动态响应机制，为优化风力发电系统的控制策略提供理论依据和技术支持。其他说明：文章不仅提供了详细的理论解释，还附有大量Matlab/Simulink代码片段，便于读者进行实践操作。同时，针对一些常见问题给出了实用的调试技巧，有助于提高仿真的准确性和可靠性。

linux之用户管理教程.md: linux之用户管理教程.md

三菱PLC与组态王构建3x3书架式堆垛立体库：IO分配、梯形图编程及组态画面设计: 内容概要：本文详细介绍了利用三菱PLC（特别是FX系列）和组态王软件构建3x3书架式堆垛式立体库的方法。首先阐述了IO分配的原则，明确了输入输出信号的功能，如仓位检测、堆垛机运动控制等。接着深入解析了梯形图编程的具体实现，包括基本的左右移动控制、复杂的自动寻址逻辑，以及确保安全性的限位保护措施。还展示了接线图和原理图的作用，强调了正确的电气连接方式。最后讲解了组态王的画面设计技巧，通过图形化界面实现对立体库的操作和监控。适用人群：从事自动化仓储系统设计、安装、调试的技术人员，尤其是熟悉三菱PLC和组态王的工程师。使用场景及目标：适用于需要提高仓库空间利用率的小型仓储环境，旨在帮助技术人员掌握从硬件选型、电路设计到软件编程的全流程技能，最终实现高效稳定的自动化仓储管理。其他说明：文中提供了多个实用的编程技巧和注意事项，如避免常见错误、优化性能参数等，有助于减少实际应用中的故障率并提升系统的可靠性。

基于STM32的循迹避障小车仿真20250426（带讲解视频）: 基于STM32的循迹避障小车主控：STM32 显示：OLED 电源模块舵机云台超声波测距红外循迹模块（3个，左中右）蓝牙模块按键（6个，模式和手动控制小车状态） TB6612驱动的双电机功能：该小车共有3种模式：自动模式：根据红外循迹和超声波测距模块决定小车的状态手动模式：根据按键的状态来决定小车的状态蓝牙模式：根据蓝牙指令来决定小车的状态自动模式：自动模式下，检测距离低于5cm小车后退未检测到任何黑线，小车停止检测到左边或左边+中间黑线，小车左转检测到右边或右边+中间黑线，小车右转检测到中边或左边+中间+右边黑线，小车前进手动模式：根据按键的状态来决定小车的状态蓝牙模式： //需切换为蓝牙模式才能指令控制 *StatusX X取值为0-4 0：小车停止 1：小车前进 2：小车后退 3：小车左转 4：小车右转

海西蒙古族藏族自治州乡镇边界，矢量边界，shp格式: 矢量边界，行政区域边界，精确到乡镇街道，可直接导入arcgis使用

基于IEEE33节点的主动配电网优化：含风光储柴燃多源调度模型的经济运行研究: 内容概要：本文探讨了基于IEEE33节点的主动配电网优化方法，旨在通过合理的调度模型降低配电网的总运行成本。文中详细介绍了模型的构建，包括风光发电、储能装置、柴油发电机和燃气轮机等多种分布式电源的集成。为了实现这一目标，作者提出了具体的约束条件，如储能充放电功率限制和潮流约束，并采用了粒子群算法进行求解。通过一系列实验验证，最终得到了优化的分布式电源运行计划，显著降低了总成本并提高了系统的稳定性。适合人群：从事电力系统优化、智能电网研究的专业人士和技术爱好者。使用场景及目标：适用于需要优化配电网运行成本的研究机构和企业。主要目标是在满足各种约束条件下，通过合理的调度策略使配电网更加经济高效地运行。其他说明：文章不仅提供了详细的理论推导和算法实现，还分享了许多实用的经验技巧，如储能充放电策略、粒子群算法参数选择等。此外，通过具体案例展示了不同电源之间的协同作用及其经济效益。

【KUKA 机器人资料】：KUKA 机器人初级培训教材.pdf: KUKA机器人相关文档

基于MATLAB的CSP电站与ORC综合能源系统优化建模及应用: 内容概要：本文详细介绍了将光热电站(CSP)和有机朗肯循环(ORC)集成到综合能源系统中的优化建模方法。主要内容涵盖系统的目标函数设计、关键设备的约束条件（如CSP储热罐、ORC热电耦合）、以及具体实现的技术细节。文中通过MATLAB和YALMIP工具进行建模，采用CPLEX求解器解决混合整数规划问题，确保系统在经济性和环境效益方面的最优表现。此外，文章还讨论了碳排放惩罚机制、风光弃能处理等实际应用场景中的挑战及其解决方案。适合人群：从事综合能源系统研究的专业人士，尤其是对光热发电、余热利用感兴趣的科研工作者和技术开发者。使用场景及目标：适用于需要评估和优化包含多种能源形式（如光伏、风电、燃气锅炉等）在内的复杂能源系统的项目。目标是在满足供电供热需求的同时，最小化运行成本并减少碳排放。其他说明：文中提供了大量具体的MATLAB代码片段作为实例，帮助读者更好地理解和复现所提出的优化模型。对于初学者而言，建议从简单的确定性模型入手，逐渐过渡到更复杂的随机规划和鲁棒优化。

网站设计与管理作业一.ppt: 网站设计与管理作业一.ppt

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论