Feed系统架构资料收集 -

wangxiaoxu

浏览: 576174 次
性别:
来自: 北京

最近访客更多访客>>

loginboot

healthylife

lwj_199011

nanber1

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

2015-11 ( 37)
2015-10 ( 13)
2015-09 ( 10)
更多存档...

Feed系统架构资料收集

博客分类：

Java web

原文地址：http://blog.csdn.net/zhangzhaokun/article/details/7834797

完全用nosql轻松打造千万级数据量的微博系统

微博feed系统的push和pull模式和时间分区拉模式架构探讨

关于如何构建一个微博型广播
关于如何构建一个微博型广播2

用 mongodb 储存多态消息/提醒类数据

构建高性能的微博系统-再谈新浪微博架构

人人网技术经理张铁安-Feed系统结构浅析
新浪微博Cache设计@TimYang.pdf

人人网技术经理张铁安-Feed系统结构浅析

新浪微博基于MySQL的分布式数据库实践

杨卫华谈新浪微博架构:MySQL和NoSQL

Sina微博构架师-杨卫华：构建可扩展的微博系统

张松国-腾讯微博架构介绍08

杨卫华序列

百万用户时尚分享网站feed系统扩展实践

最后这篇文章写得很不错的，也基本讲清楚了Feed系统的方方面面的考虑了，基本涉及到了一个Feed系统从小发展到大的全过程了！还没有完全领会到它为用Cassandra替换Redis的理由，或者他还是考虑把Casandra的作为半缓存的结构来替换的，加大Cassandr的内存，可以缓存大量的热数据，当然它的好处是冷热数据都可以完美的持久化，但是数据的一致性处理起来有些麻烦，毫无疑问他会是采用R+W>N的模式，但是无论写多份还是读多份都是有些难于取舍的，Feed系统的写入量本来就很大，如果写入多份的话会大大降低写入的性能，另外，存在Feed的系统，无一例外的是Feed都会是全系统的核心，提高读的性能会大大提高用户的体验，如果读取的时候读多份数据会相对降低性能，到底取舍哪一个呢？我这里光是凭空想象，无法取舍，具体还可以看性能测试来说法，如果有同学做过这方面的压测，还望留言告知下！

腾讯微博主要使用拉模型，只有未读的微博数是使用推得模式实现的！拉模型的问题在于一个人跟随了几百或者上千的人的时候，去看关注的人所发的消息要进行多个层次的Map/Reduce才能得到结果，需要非常高效的获取最新Feed的方式以及快速的聚合算法，只用Memcache\Redis之类的从性能上是比较难于实现的，需要从数据层面或者是缓存的层面都进行聚合，再在应用层面进行聚合，技术难度比较大！这个模式属于知易行难，绝大多数公司不具备构建基础设施的能力！
新浪微博使用推拉结合的方式，大号不推送，小号则推送，看Feeds的时候，需要将推过来的Feeds索引数据与关注的大号的Feed进行聚合，小小的牺牲下拉的性能一下子就将大号的推送问题解决掉了！

对于稍微小些的网站，比如Pinterest和花瓣都使用推的方式来实现，PInterest的直接在Redis中保存500个最新的索引信息，使用Python脚本定时来扫描，保证缓存的索引信息始终只保存最新的500个，老的信息则直接丢弃掉，花瓣则将老索引存储到LevelDBA中去了！

Pinterest网站的内容信息缓存在memcache中，关系信息则缓存到Redis中，持久化方式保存！对于那种大号的粉丝，亦或是关注的人数太多则需要将关系数据拆分之后再缓存起来，对于动态变化的部分则需要独立存放，在使用的时候需要将两部分数据聚合，在可变部分达到一定长度的时候，需要与不变的部分进行合并！

当然推送的时候，所有的网站都使用异步的方式来实现！

分享到：

常用社交网络（SNS、人人网、新浪微博） ... | 微博feed系统推拉模式和时间分区拉模式架构 ...

2014-08-05 15:08
浏览 636
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Feed系统架构资料收集

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Feed系统架构资料收集

评论

发表评论

相关推荐

HTTP协议之multipart/form-data请求分析

Servlet中的过滤器(拦截器)Filter与监听器Listener的作用和区别

过滤器和拦截器的区别

过滤器、监听器、拦截器的区别

【JSP】让HTML和JSP页面不缓存的方法

jsp去掉浏览器缓存

pageContext对象的用法

log4j日志文件乱码问题的解决方法

JEECMS 系统权限设计

使用servlet保存用户上传的文件到本地

Servlet 实现文件的上传与下载

android文件上传到服务器

常用社交网络（SNS、人人网、新浪微博）动态新闻（feed、新鲜事、好友动态）系统浅析

微博feed系统推拉模式和时间分区拉模式架构探讨

spring 出错,Could not find acceptable representation

spring @ResponseBody 返回json格式有关问题

httpclient上传文件及传参数

在eclipse中把java工程变为web工程

配置Tomcat直接显示目录结构和文件列表

压力测试工具apache-ab讲解

最近访客更多访客>>