从集中到分布,化解存储瓶颈
接上篇:从集中到分布,解读网络视频IT架构变迁(下)。集中式存储已经拥有了诸多优势,那么为何这家视频网站最终却选择了其他的存储架构呢?该视频网站究竟在运营过程中遭遇到了什么样的阻碍呢?经过我们对整个网站存储结构的分析,原来,NAS头成为整个存储环境的瓶颈……
NAS成为系统瓶颈
传统集中式存储的瓶颈
从以上两幅图中,我们可以看到传统的集中存储方案中,存在如下问题:
I/O瓶颈
容量扩展性差
性能不可扩展
专业高端NAS成本高昂
单点故障
随着数据量的增加,存储压力也变得越来越集中,NAS已不足以支撑现有的应用,无法更好的应对未来的挑战。既而,该网站从集中式的存储方式转向了采用分布式的存储方式。
分布式存储系统架构
图中,每台服务器上都提供文件共享服务,由应用层来实现媒体资源数据在各个服务器集群之间的迁移,从而比较好的解决了集中存储的IO瓶颈问题,但是问题也随之而来。
分布式的存储没有负载均衡,例如:发生热点的时候、部分流媒体服务器忙或部分闲置
分布式存储利用相对较低率,重复数据大量存在,且份数多
无法实现集中的高Raid 级别保护
快照、备份、恢复、远程容灾比集中存储实现成本高
需要在应用层对存储层过多关注。管理复杂度程几何级增长,整体系统维护工作越来越复杂、繁重。以管理Mount点为例:同样的服务器数,需管理Mount点的数量为48 [M*(N+F)+W*N]个,即上图中的48根红线,远大于集中存储结构。这仅仅是Mount点一项,还不包括各个点存储数据的维护,在实际应用中相关的工作量是相当惊人,管理员疲于奔命。
集中VS.分布?还是分布式的集中?
既然传统的集中和分布都存在不同的问题,怎么样去解决?在给出答案之前,我们重新归纳前面分析的视频网站对存储的需求:
1. 各种服务器集群之间有视频传递的需求,需要上传服务器、流媒体服务器、在线录制服务器和转换服务器之间的视频文件是互相可见的,翻译成存储的语言则需要文件级共享的存储。
2. 各种应用服务器可能使用着不同的操作系统平台,都需要无差异的访问到存储空间,而翻译成存储的语言则需要跨平台共享的存储。
3. 多台流媒体服务器之间的存储容量需要共享,从而提高存储空间的利用率。如采用传统SAN上面划分独立的存储空间,给每台服务器的类似做法显然是不可接受的,并且需要视频内容合理的分布在各个存储设备上,翻译成存储的语言则需要存储容量的负载均衡。
4. 单台存储设备的存储速度始终是有限的,需要多个存储设备的聚合才能满足视频内容访问量的爆炸式的增长,翻译成存储的语言则需要多台存储设备间的存储速度的聚合,从而实现存储速度的负载均衡。
5. 新增视频内容的不断添加会导致存储容量的不断扩大,在添加设备扩展容量的时,能够不影响原有系统,且平滑扩展,能够实现在线的扩展业务系统不停机,翻译成存储的语言则需要容量线性可扩展,能够实现在线扩容。
6. 随着用户访问量增长和视频清晰度提高带来的带宽增长等诸多增长因素的影响,对存储带宽的增长需求,要求存储系统实现带宽随容量呈线性增长。
7. 合理的成本控制是一个恒久的话题,需要存储系统的总体拥有成本随容量的扩展而合理的扩展,不能出现突变式的增长。
8. 稳定性自然不用说,需要存储系统采用冗余结构以提高系统的稳定性。
为了满足上述需求,当我们面对“集中VS.分布”这个艰难抉择的时候,技术的不断进步,涌现出:分布式的集中存储结构——集群存储技术,其核心技术是集群文件系统。
集群存储系统满足视频行业服务需求
目前,广为流行的集群文件系统的典型代表主要有:
Google 的GFS (Google File System)
国内中科院研发的BWFS(Blue Whale File System)
Panasas 的PanFS (PanFS File System)
IBM 的 GPFS (General Parallel File System)
CFS 的 Lustre (Lustre File System)
这五种集群文件系统各有特点和优势,一般而言,分布式集中存储相对于传统存储系统来说拥有如下优点:采用统一的全局命名空间,支持文件级共享,且采用分布式存储结构,能实现高聚合I/O带宽,并且跨Linux平台和Windows平台的文件共享,还能够线性扩展I/O带宽,拥有良好的系统负载平稳性,并能够动态扩展存储容量,实现成本可控。
基于分布式结构的集中存储
如上图所示:该架构能较好的满足网络视频对存储系统的需求。
1. 文件共享、统一的全局命名空间——上传服务器和流媒体服务器之间的文件可见性;多台流媒体服务器间的存储容量共享
2. 多台存储设备间的存储速度的聚合——流媒体服务器可用的存储速度负载均衡
3. 跨平台共享(Windows/Linux)——支持不同平台的流媒体服务器、上传和其他服务器
4. 容量线性可扩展——使流媒体服务能应对不断扩大的存储容量需求
5. 带宽随着容量线性增长——使流媒体服务能应对不断扩大的用户访问量; 可以按需扩大流媒体服务器的数量而不用担心存储
6. 成本需随着容量的扩展而扩展——良好的成本控制
7. 全冗余结构——稳定的强壮的存储系统
该视频网站最终选择基于BWFS集群文件系统的BWStor蓝鲸集群存储系统。BWFS是由我国中科院计算所工程中心自主研发的文件系统,并经由中科院中科储天公司产品化。中科院中科储天蓝鲸集群存储系统(BWStor)即采用BWFS文件系统为核心技术,是中国自主知识产权存储产品的代表之一。
作者:朱智力,系中科储天公司售前顾问,E-mail:zhuzhili@nrchpc.ac.cn
分享到:
相关推荐
金融-证券:一叶知秋系列一:从组织架构维度复盘国际投行战略变迁.pdf
从最初的 MySQL 数据库到 Redis 缓存,再到 Nginx Web Server 和 Picture Storage 的使用,知乎的架构设计都是为了满足业务需求和提高系统性能。 三、架构设计的原则 架构设计的原则是指在架构设计过程中需要遵循...
### 互联网时代的架构变迁 #### 单机时代与单体架构 互联网的早期阶段,特别是在资源有限、人力资源紧张的情况下,为了能够快速推出产品或者上线网站,单机模式成为了一个非常实用的选择。在这种模式下,所有的...
余额宝作为一款现象级的金融产品,其架构变迁史同样令人瞩目。余额宝的架构逆袭,主要经历了基金交易系统的整体服务化改造和基金大数据平台的构建两个重要阶段。这些变迁不仅在技术层面带来了创新,也对运维模式和...
综上所述,从小米网的发展历程来看,其技术架构经历了从单一数据库支持到多层结构拆分,再到面向服务的转型等多个阶段。每一次架构的调整都是为了更好地适应业务需求的变化,同时也反映了小米网在技术创新方面的不懈...
服务渠道的变迁是银行IT架构转型的一大挑战。过去,银行的服务渠道主要集中在实体网点上,现在逐渐转移到数字化渠道上。例如,现在到工行建行网点办卡都是通过一台综合服务机;交行几年前开始试点网点机器人,而招行...
TalkingData-大数据统计分析平台架构故事-数据库技术进化 数据库架构变迁 共28页.pptx
豆瓣网技术架构变迁的知识点主要包括以下几个方面: 1. 豆瓣网简介:2005年3月上线,是一个以分享和发现为核心内容的社区,主要内容包括读书、电影、音乐、小组、同城以及九点等板块,同时还有“我的豆瓣”和“友邻...
### 从零到十亿——大型网站架构设计变迁 #### 架构的定义与意义 在探讨大型网站架构设计变迁之前,我们首先需要明确“架构”这一概念的本质。架构可以被理解为对一个系统内各个组成部分及其相互关系的一种主观...
支付宝作为中国领先的第三方在线支付平台,其组织架构的变迁反映了互联网行业快速发展的特性与需求。在分析支付宝组织架构的过程中,我们可以看到几个关键的知识点: 1. **组织架构的重要性**:组织架构是企业运营...
通过计算hash值将数据均匀分布到多个节点上,实现了数据的水平扩展。 - **实现原理**:每个key被分配一个hash值,根据这个hash值可以定位到具体的存储节点。当需要读取或写入数据时,首先计算出对应的hash值,再...
【知乎架构变迁史】从初创时期的简单架构到应对大规模用户需求的复杂演进,知乎的技术栈和设计策略经历了显著变化。在2010年,知乎由两位工程师启动,使用Python作为主要开发语言,选择Tornado框架是因为其异步特性...
- **架构变迁**:从完全自有的架构演变为混合架构。 #### 四、WPS架构团队的发展历程 - **核心程序员**:最初由少数核心程序员负责整个项目的架构设计。 - **个体架构师**:随着项目复杂度的提高,出现了专门的架构...
知乎的架构变迁史是一部典型的互联网企业技术成长史,它反映了从初创公司到大规模平台的转型过程中,如何通过不断的技术迭代和创新,解决日益复杂的业务挑战。这一过程涉及了数据库优化、高可用架构设计、分布式系统...
360云查杀服务的架构变迁是一个从零到千亿级PV的进化过程,代表了在极高流量下对系统性能与稳定性的不懈追求。在这个过程中,360公司通过不断的架构升级和优化,成功应对了各种挑战,实现了从单一到复杂的多代架构...
阿里、小米、京东、美团的组织架构和战略变迁 本文将对阿里、小米、京东、美团四家商业巨头的组织架构和战略变迁进行分析。通过对这四家公司的发展阶段和组织架构调整的梳理,我们可以了解到企业发展的重要性和组织...
2. **架构调整**:从同步架构逐步过渡到异步架构、并发架构直至分布式架构,每一次架构的调整都带来了显著的性能提升。 3. **技术选型**:选择合适的技术栈,如采用ShardingMQ降压、分布式内存存储、NoSQL存储等,...