`

谈冷热数据

 
阅读更多

http://jishu.zol.com.cn/11379.html

 

web产品最重要的核心单元无疑是数据,而主流的存储容器则是Mysql,对于快速增长的数据,其性能可能会呈指数级的递减,为解决该问题,主流的做法基本是水平和垂直拆分,根据数据的特性将数据进行库和表级的拆分,实际上的理论还是数据分割,但是终有一天你会发现单表的数据还是越来越大,也许你可以说我再拆分,可拆分的代价可能就是部署多次方的辅库.存储容量可能会让你很吃惊,而且这样的做法有没有人真正去想有用吗?很多人说,我们用缓存去解决,可是缓存就是无形中增加了一层,缓存的设计很重要,更新,颗粒度对一个系统的稳定性是非常重要的,另外缓存的大小你有没有考虑过.所以我们有没有办法从DB层进行一些分析,Mysql作为一个优秀的软件,再没有合理的分析的基础上不应该去质疑它,也不应该想着如何去替代它.

   web产于基于数据,那么处理方式也应该基于数据,你有没有分析过你的产品形态是什么,数据性质是什么?最近针对我们的文章数据进行了一些统计(相信具有一定代表性),PV百万的用户不到很少(相对于总注册用户来说).但是总pv占了64%.文章大概11G的存储空间.解释下:我们一半的webserver在为很少一部分人服务,但是他们占的流量却能吓死人,但是他们的文章才11G,我相信大部分人明白了,假如我对于这些用户的数据进行剥离,重点为他们服务,那我相信性能和容量成本将进一步降低.

   这就是所谓的冷热数据分离,很明显将热数据剥离出去,核心保证其的性能,而相对来说冷数据访问量少,服务等级减低,也可以想象能节省多少的容量.假如我将这些数据放入到内存,那么性能会提升多少呢.

   冷热数据的拆分没有很多难度和技巧,但是仔细分析下还是有很多事情需要去做,毕竟做事情的目的是保证结果是合理和有效的.性能和维护性是要平衡的.

  (1)有没有想过这些pv高的人是什么样的人,他的文章更新频率是什么样的.

  (2)对于热数据需要分库分表吗,怎么分才合理,是否会影响query cache,对于活跃数据来说,需要多少个辅库来支撑千万级的访问,对于这些访问和数据特性来说,支持大并发的瓶颈在哪儿(磁盘I/O,CPU?)

  (3)冷热数据迁移策略和如何区分冷热数据,这样的拆分可能需要手动的,以及未来是否需要自动拆分

  (4)一涉及到冷热数据的分离,就可能去要区分用户,那么数据的serverid如何设计,是否会成为瓶颈

  (5)是否能够明确DB是制约性能的核心问题?实施后是否有提升?提升了多少.

  (6)我们是按照pv来区分冷热数据的,再基于具有一级页面缓存的基础上,区分冷热数据的分析方法是否合理.

  这些用户的访问对于实际后端的访问频率是多少?

  (7)对于活跃数据我们是否需要建立脱离于DB的二级缓存,或者对于活跃数据是否通过SSD这样的设计进行硬件提升

  (8)很实际的一个问题,冷数据的数据量还是非常庞大的,只是他们的访问量少了一点,那么如何优化这些用户的访问呢,二级缓存?是否涉及到归档数据的设计,它解决的问题是什么.

  (9)如何有效提升DB的query cache.

分享到:
评论
1 楼 vb2005xu 2015-07-20  
http://www.cnblogs.com/weafer/archive/2011/09/21/2184059.html
https://github.com/phpredis/phpredis#connect-open

相关推荐

    浅谈绿色数据中心的建设.doc

    此外,机房布局应便于设备的安装、维护和散热,例如采用面对面、背靠背的机柜摆放方式,形成冷热通道,有利于热量管理。 供配电系统是数据中心的生命线,必须构建高效、可靠的供电网络。通常采用“双路市电+ATS”...

    浅谈数据中心的通信工艺、配电与智能弱电.pdf

    例如,机房机柜通常采用微模块设计,保证独立运行且具备冷热通道分离,以优化冷却效率。模块化设计可以根据需求定制,最大可支持36个机架。机柜尺寸标准化,便于安装和维护,同时电力系统采用380VAC输入,PUE(Power...

    通信与网络中的浅谈典型数据中心机房设计及各专业平衡

    后者是一项复杂的系统工作,笔者结合自身多年实践经验,就冷热通道的气流组织、管线综合平衡、数据中心机房集中监控平台等三个横跨多专业的问题提出专业技术平衡和协调的解决方案,以此强调专业技术平衡与协调的复杂...

    浅谈通信机房节能降耗—空调的冷源优化送风应用.pdf

    6. 对于已有数据中心,可以考虑实施冷热通道的隔离措施,避免冷热空气混合造成额外的能量消耗。 综上所述,机房散热和节能降耗的关键在于空调系统的优化和合理利用机房内部空间的冷热气流,以及采用先进的控制策略...

    DTCC2021第12届中国数据库技术大会(88份).zip

    Elasticsearch基于对象存储的冷热分离架构以及NLP特性增强实践 开源分布式图数据库的思考和实践经验 移动时代,从业务出发,性能优化与实践 金融云数据库的应用与实践 中信银行数据库部署环境变革-从小型机迁移到x86...

    浅谈客车空调系统的计算机辅助设计.pdf

    完整的客车空调系统设计过程包括确定车内外气候参数、计算冷热湿负荷、选择空调设备、组织车内气流、设计风道、进行特性计算和校核、确定系统布置方案、绘制生产图纸以及存储和输出数据和图形等。传统设计方法由于...

    浅谈天然气分布式能源用户选择及发展探讨.pdf

    典型的用户包括医院、宾馆、商业综合体、高档写字楼、交通枢纽、数据中心、机关和工厂等。这些用户通常对供电安全要求较高,位置适合接入天然气及电力。 2. 天然气分布式能源系统的分类:分布式能源系统可划分为...

    2021-2022年收藏的精品资料浅谈新奥迪A6L自动空调故障.doc

    本文主要探讨了2006款奥迪A6L轿车自动空调系统出现的故障问题,其中特别关注了左侧暖风调节阀门N175和右侧暖风调节阀门N176失效导致的冷热风异常现象。文章介绍了新款奥迪A6L空调系统的特点,包括取消电磁式离合器的...

    浅谈现代化楼宇建设设备自动化.rar

    空调与通风系统采用变频技术,根据室内负荷自动调节冷热源输出,达到节能效果。同时,通过新风处理和空气净化,确保室内空气质量和健康环境。 七、照明控制系统 照明控制系统通过感应器和定时器控制灯具开关,实现...

    浅谈氢燃料电池电动汽车用空气滤清器.pdf

    4. **环境适应性**:考虑到车辆可能在各种气候条件下运行,滤清器应能在冷热环境中保持性能稳定。 5. **维护性**:设计应便于更换和清洁,降低维护成本。 6. **成本**:尽管性能优先,但成本控制也是设计时不可...

    浅谈建筑智能空气调节系统设计.rar

    这些设备通常采用先进的微处理器技术,可以实时收集环境数据并作出相应调整,确保室内环境始终处于设定的最佳状态。 系统设计时,首要考虑的是用户需求和舒适性。这包括对室内温度的精确控制,尤其是在四季温差大的...

    浅谈中央空调系统自控技术应用.docx

    - 通过RS232接口获取冷水供回水的温度、压力和流量数据,计算总冷负荷和冷冻水循环量,自动调整冷冻水旁通阀以维持管内压力稳定。 - 根据工作时间调整系统设定值,如在白天和夜晚设置不同的温度标准。 - 根据指令...

    浅谈电气自动化在电气工程中的融合运用 (1).pdf

    建筑智能化系统的组成包括采暖空调系统、冷热源系统、给排水系统、照明系统、电梯与扶梯,以及通讯网络系统等,它们通过计算机网络、接入系统和通讯系统实现了一体化,极大地提高了建筑物的智能化管理与服务水平。...

    工业电子中的浅谈模糊控制器在中央空调系统温度控制中的应用

    《工业电子中的浅谈模糊控制器在中央空调系统温度控制中的应用》 本文主要探讨了模糊控制器在工业电子领域,特别是中央空调系统温度控制中的应用。中央空调系统的设计核心在于通过实时监测和控制室内空气参数,如...

    八年级物理上册4.1从全球变暖谈起拔高练习1新版粤教沪版

    这篇资料主要涉及初中物理中的... (2)应选择温度计示数稳定后读取数据,即乙的观点。 以上是对八年级物理上册4.1单元中关于温度、温度计使用及相关实验的详细解释,涵盖了选择题、填空题和实验探究题的相关知识点。

    2017_2018学年八年级物理上册4.1从地球变暖谈起一课一练含解析新版粤教沪版

    首先,提到温度的读取,基础概念中我们了解到温度计上的示数表示物体的冷热程度。标准的读取格式应当包括单位和正负号,例如-2℃读作“负二摄氏度”。在实际操作中,仔细观察温度计上的刻度是必须的。温度计上的每一...

    2017_2018学年八年级物理上册4.1从全球变暖谈起分层练习新版粤教沪版

    首先,温度是自然界中无处不在的概念,它衡量的是物体的冷热程度。在实际生活中,我们经常需要对温度进行测量,而温度计就是实现这一目的的重要工具。现代温度计的工作原理主要基于液体的热胀冷缩性质。液体在受热时...

Global site tag (gtag.js) - Google Analytics