从集中到分布,化解存储瓶颈
接上篇:从集中到分布,解读网络视频IT架构变迁(下)。集中式存储已经拥有了诸多优势,那么为何这家视频网站最终却选择了其他的存储架构呢?该视频网站究竟在运营过程中遭遇到了什么样的阻碍呢?经过我们对整个网站存储结构的分析,原来,NAS头成为整个存储环境的瓶颈……
NAS成为系统瓶颈
传统集中式存储的瓶颈
从以上两幅图中,我们可以看到传统的集中存储方案中,存在如下问题:
I/O瓶颈
容量扩展性差
性能不可扩展
专业高端NAS成本高昂
单点故障
随着数据量的增加,存储压力也变得越来越集中,NAS已不足以支撑现有的应用,无法更好的应对未来的挑战。既而,该网站从集中式的存储方式转向了采用分布式的存储方式。
分布式存储系统架构
图中,每台服务器上都提供文件共享服务,由应用层来实现媒体资源数据在各个服务器集群之间的迁移,从而比较好的解决了集中存储的IO瓶颈问题,但是问题也随之而来。
分布式的存储没有负载均衡,例如:发生热点的时候、部分流媒体服务器忙或部分闲置
分布式存储利用相对较低率,重复数据大量存在,且份数多
无法实现集中的高Raid 级别保护
快照、备份、恢复、远程容灾比集中存储实现成本高
需要在应用层对存储层过多关注。管理复杂度程几何级增长,整体系统维护工作越来越复杂、繁重。以管理Mount点为例:同样的服务器数,需管理Mount点的数量为48 [M*(N+F)+W*N]个,即上图中的48根红线,远大于集中存储结构。这仅仅是Mount点一项,还不包括各个点存储数据的维护,在实际应用中相关的工作量是相当惊人,管理员疲于奔命。
集中VS.分布?还是分布式的集中?
既然传统的集中和分布都存在不同的问题,怎么样去解决?在给出答案之前,我们重新归纳前面分析的视频网站对存储的需求:
1. 各种服务器集群之间有视频传递的需求,需要上传服务器、流媒体服务器、在线录制服务器和转换服务器之间的视频文件是互相可见的,翻译成存储的语言则需要文件级共享的存储。
2. 各种应用服务器可能使用着不同的操作系统平台,都需要无差异的访问到存储空间,而翻译成存储的语言则需要跨平台共享的存储。
3. 多台流媒体服务器之间的存储容量需要共享,从而提高存储空间的利用率。如采用传统SAN上面划分独立的存储空间,给每台服务器的类似做法显然是不可接受的,并且需要视频内容合理的分布在各个存储设备上,翻译成存储的语言则需要存储容量的负载均衡。
4. 单台存储设备的存储速度始终是有限的,需要多个存储设备的聚合才能满足视频内容访问量的爆炸式的增长,翻译成存储的语言则需要多台存储设备间的存储速度的聚合,从而实现存储速度的负载均衡。
5. 新增视频内容的不断添加会导致存储容量的不断扩大,在添加设备扩展容量的时,能够不影响原有系统,且平滑扩展,能够实现在线的扩展业务系统不停机,翻译成存储的语言则需要容量线性可扩展,能够实现在线扩容。
6. 随着用户访问量增长和视频清晰度提高带来的带宽增长等诸多增长因素的影响,对存储带宽的增长需求,要求存储系统实现带宽随容量呈线性增长。
7. 合理的成本控制是一个恒久的话题,需要存储系统的总体拥有成本随容量的扩展而合理的扩展,不能出现突变式的增长。
8. 稳定性自然不用说,需要存储系统采用冗余结构以提高系统的稳定性。
为了满足上述需求,当我们面对“集中VS.分布”这个艰难抉择的时候,技术的不断进步,涌现出:分布式的集中存储结构——集群存储技术,其核心技术是集群文件系统。
集群存储系统满足视频行业服务需求
目前,广为流行的集群文件系统的典型代表主要有:
Google 的GFS (Google File System)
国内中科院研发的BWFS(Blue Whale File System)
Panasas 的PanFS (PanFS File System)
IBM 的 GPFS (General Parallel File System)
CFS 的 Lustre (Lustre File System)
这五种集群文件系统各有特点和优势,一般而言,分布式集中存储相对于传统存储系统来说拥有如下优点:采用统一的全局命名空间,支持文件级共享,且采用分布式存储结构,能实现高聚合I/O带宽,并且跨Linux平台和Windows平台的文件共享,还能够线性扩展I/O带宽,拥有良好的系统负载平稳性,并能够动态扩展存储容量,实现成本可控。
基于分布式结构的集中存储
如上图所示:该架构能较好的满足网络视频对存储系统的需求。
1. 文件共享、统一的全局命名空间——上传服务器和流媒体服务器之间的文件可见性;多台流媒体服务器间的存储容量共享
2. 多台存储设备间的存储速度的聚合——流媒体服务器可用的存储速度负载均衡
3. 跨平台共享(Windows/Linux)——支持不同平台的流媒体服务器、上传和其他服务器
4. 容量线性可扩展——使流媒体服务能应对不断扩大的存储容量需求
5. 带宽随着容量线性增长——使流媒体服务能应对不断扩大的用户访问量; 可以按需扩大流媒体服务器的数量而不用担心存储
6. 成本需随着容量的扩展而扩展——良好的成本控制
7. 全冗余结构——稳定的强壮的存储系统
该视频网站最终选择基于BWFS集群文件系统的BWStor蓝鲸集群存储系统。BWFS是由我国中科院计算所工程中心自主研发的文件系统,并经由中科院中科储天公司产品化。中科院中科储天蓝鲸集群存储系统(BWStor)即采用BWFS文件系统为核心技术,是中国自主知识产权存储产品的代表之一。
作者:朱智力,系中科储天公司售前顾问,E-mail:zhuzhili@nrchpc.ac.cn
分享到:
相关推荐
根据提供的文件内容,以下是对文件中涉及IT领域知识点的详细解读: 一、社会服务行业分析与投资策略 文件首先介绍了社会服务行业在2020年面临的挑战和机遇。在新冠疫情的影响下,整个行业经历了第一季度的急剧下滑...
8. **形势与政策五**:虽然不是IT专业课程,但这类课程通常会讨论当前的社会经济形势和政策,帮助学生理解全球化背景下的社会变迁和政策影响。 通过这个课表,我们可以看出苗雨在大三阶段专注于Android开发技术和...
1基于蓝牙的项目开发--蓝牙温度监测器.docx
AppDynamics:性能瓶颈识别与优化
xtrabackup银河麒麟v10rpm安装包
2024年全球产品经理大会(脱敏)PPT合集,共34份。 1、AI 原生产品设计的 7 个反共识 2、AI 时代的策略产品与内容社区推荐实践 3、AI时代的用户界面设计 4、AI智能陪练:大模型赋能销售成长 5、AI浪潮中的应用主义者 6、AI驱动下的B端产品的思考与创新 7、AI驱动业务增长的探索与实践 8、Al Native 生产力工具的发展、价值与商业落地 9、B端产品设计避坑指南 10、GenAl驱动的xGen电商AI平台产品实践与思考 11、Kwaipilot 在快手的落地实践 12、OPPO AI的探索新交互到新生态 13、RPA + AI打造大模型驱动的领先数字员工 14、产品AI化重塑的思考与实践 15、产品分析:通过关键指标助力团队与企业成功 16、从RPA到Al Agent,高价值、可落地的智能助手 17、从流量运营到AI驱动的机器增长 18、做穿越时代的产品 19、创造好工具,创造世界一流产品力 20、医疗健康场景的大模型产品探索 21、即时零售柔性供应链体系建设与AIGC在零售数字化的探索 22、向量数据库的出海实践与未来展望 23、大模型在B端落地思考实践
基于物联网技术的停车场智能管理系统设计用户有单独APP
Adobe XD:AdobeXD高级技巧与最佳实践.docx
ARKit(iOS的增强现实):ARKit的多人AR场景实现
1python自动化脚本.docx
河北省、市、区县及街镇可编辑SVG图
金融工程之量化交易算法:均值回归:时间序列分析与预测.docx
技术资料分享ADV7123非常好的技术资料.zip
Sawmill_cn.ppt
使用LabVIEW输入数字n,然后计算n的阶乘
1无人值守灌溉系统--stm.docx
金融工程之量化交易算法:动量交易:金融数据获取与处理.docx
基于SSM的毕业设计源码
头像图片调试使用用来调试