`
chenkangxian
  • 浏览: 87977 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

漫谈大型网站架构

阅读更多

---应CSDN编辑钱曙光先生之邀请,发表了一些对于网站架构设计的看法,也是最近的一些感悟,欢迎留言交流

 

大型网站架构从来都不是一个预先定义的架构,而是一个演进式的架构。很少有一个网站从建站开始,就能够因具备大型网站的所有属性而一成不变的,从最简单的LAMP架构,再到基于IOE的大型集中式应用架构,再演变成时下的分布式应用架构,随着网站用户规模的扩大,架构也在不断演进。从实体机到虚拟机再到当前流行的Docker技术,从单机房到同城多机房再到异地多活,从LAMP到J2EE再到各种分布式中间件如服务框架、分布式消息队列、配置管理中间件、分布式数据访问层,由简至繁的艰难蜕变,也正是一个网站从小变大由弱变强的成长历程,哪里有挑战,哪里才会有变革,这正是作为技术人建功立业的时刻。

规模不断扩大,但成本不可能随之线性增长,因此,如何利用规模效应降低资源成本,抽取公共部分,避免重复造轮子,提高开发效率和响应速度,成了必须思考的问题。技术存在的核心价值就是为了生产力的提高,当技术架构制约了生产力发展,就需要进行技术变革。当前支撑大型网站的几大核心技术,分布式、服务化、虚拟化,其中分布式解决的是规模化带来的问题,所谓的规模化即包括数据规模越来越大,访问量越来越高,也包括开发团队规模越来越大,工程代码规模越来越大。单机的存储能力以及负载能力必然有限,从PC到小型机再到中型机、大型机,成本将成指数级升高,而成百上千人开发同一个工程,则导致系统臃肿,开发、发布效率极低,互联网将丧失了赖以生存的灵活性,回到以前传统软件的开发模式。通过应用垂直拆分,集群分布式水平扩展,不仅使系统容量得到提升,存储和负载将分配到大规模的廉价集群上,以降低成本,开发效率和开发模式也得到改变。通过公共业务抽取,将诞生一批处于系统底层的基础服务,避免相同的内容重复造轮子,提高开发效率。作为大型网站架构中最重要的中间件,服务化框架简化了服务调用所涉及的对象序列化与反序列化,通信协议,服务路由等操作,以及到后来诞生的一个新名词—服务治理,去梳理服务的依赖关系、调用链路、强弱依赖等等更复杂的问题。除此之外,在架构师的武器库中,还有众多不同应用场景下使用的中间件,如消息中间件、 分布式数据访问层、配置管理中心、数据迁移工具、分布式文件系统等等,这些都是日常系统架构中的粘合剂。大型网站的另外一个核心技术就是资源的虚拟化,从实体机到Xen、KVM再到基于LXC的轻量级虚拟化方案,再到Docker,技术的更新换代使得资源的利用率越来越高,集群的运维、部署和管理越来越方便。另外不同的场景下如何选择存储也十分重要,高并发和大数据往往都不会单独出现,到底是采用磁盘、SSD还是采用内存,到底是采用分布式文件系统,关系数据库,还是NOSQL,还是采用内存分布式缓存,不同的场景下方案会大相径庭,分布式文件系统存储容量几乎可以理解为无限,但是吞吐低,关系型数据库有严谨的schema以及功能强大的SQL语句,可以满足各种复杂的查询条件,但无奈扩展太麻烦,为了应对高并发读写访问,master-slave、读写分离、分库分表一折腾,不仅工作量大增,且查询维度受限,还需要引入垂直化搜索引擎来扩展查询维度,NOSQL虽然能自动分区扩容,但无奈不支持SQL,而缓存虽快,内存条又太贵,架构就是要不断的权衡取舍。

大公司之所以不如小公司响应速度快,原因在于大公司有太多积累,有时候积累多了也会成为包袱,现有的模型会使得新业务难以快速融入。当遇到问题和挫折的时候,就是思考改进和系统变革的时候,从来没有哪个系统在设计好之后就封存代码永不改变的,技术永远是不断发展,需求和市场也是不断变化的,因此不要指望用一种架构满足所有的需求,系统设计需要满足一段时间内的可扩展性,但千万不要过度设计,因为过了半年之后你回过头来重新review,你会发现需求早已改变,这就是互联网的快节奏。对于系统的架构来说,一段时间之内架构的演变,常常会经历从清晰,再到模糊混乱,再重构,再清晰,然后又变得模糊的过程,市场环境总是瞬息万变的,因此,系统的设计要遵循对扩展开放,对修改封闭的原则,做到这点即可方便及时的接入新流程,又能够不影响既有的流程。从宏观来看,各个系统间的关系一定不是烟囱与烟囱的关系,而是犹如城市里的高楼大厦,通过公路连接起来,因此,要提高建房子的速度,就要充分利用已有的基础设施,已有的中间件,来降低系统构建的成本和风险。架构设计的几个层次,没有架构也是架构,专注于解决现有问题也能称为架构,而好的架构应该是即能够约束开发者又能够解放开发者使其专注于功能的设计。尽量将复杂的事情变的简单,而不要将简单的事情变的复杂,技术从来都不是用来炫的,而是用来解决实际问题的,因此我们不需要花拳绣腿,洛克希德·马丁公司的著名飞机设计师凯利·约翰逊所提出的KISS原则,就是最好的诠释。风险驱动的架构理念告诉我们,避免失败是所有工程技术的核心,架构也是技术,运用架构技术去缓解风险,避免走极端,是架构师的最根本职责。

分享到:
评论

相关推荐

    大型分布式网站架构设计与实践.带目录书签.完整版.rar

    《大型分布式网站架构设计与实践》主要介绍了大型分布式网站架构所涉及的一些技术细节,包括SOA架构的实现、互联网安全架构、构建分布式网站所依赖的基础设施、系统稳定性保障和海量数据分析等内容;深入地讲述了...

    架构漫谈PDF

    2. **团队协作**:在大型项目中,架构师需要与开发团队紧密合作,确保每个人都理解并遵循架构设计的原则。 3. **持续改进**:随着项目的进展和技术的发展,架构也需要不断地进行调整和完善。架构师需要具备前瞻性的...

    漫谈数据中心clos网络架构

    CLOS架构允许使用较为普通的、成本较低的盒式交换机来构建大型网络,这对于降低成本具有重要意义。此外,该架构还确保了接入、汇聚和核心层级之间的总带宽保持一致,保证了服务器接入带宽1:1的超载比。 **特点三:...

    Dubbo 分布式服务架构

    Dubbo分布式服务架构,对于研究大型Web服务器的并发技术的同学们有帮助。

    通向架构师的道路(最全的资料)

    了解如何高效地部署和优化WebSphere是架构师必备的技能,特别是对于大型企业环境,掌握集群技术能提高系统的可用性和扩展性。 接着,"通向架构师的道路(第二十七天)IBM网格计算与企业批处理任务架构.docx"探讨了...

    FPGA研发之道(6)架构设计漫谈(一)流驱动和调用式.pdf

    由于FPGA的调试时间较长,大型设计可能需要数小时的编译时间,这使得测试和调试变得极其耗时。因此,在设计初期就要考虑可测性,比如添加足够的调试接口和逻辑,以便于后期的故障定位和修复。同时,优化编译流程和...

    通向架构师的道路.rar

    3. **通向架构师的道路(第六天)之漫谈基于数据库的权限系统的设计.docx** 权限系统是任何大型应用的基础组件,确保数据的安全访问。此文档可能讨论了如何设计和实现一个基于数据库的权限控制模型,涵盖了用户角色...

    X86平台的国产化迁移漫谈.docx

    本文主要讨论了 X86 平台的国产化迁移,探讨了计算机行业的发展历程,从大型机到 x86 架构,再到今天的国产化迁移。文章指出,当前的 x86 架构已经不能满足开发者的需求,需要新的解决方案,特别是随着移动应用的...

    架构师反向代理视频培训.rar

    本视频培训课程聚焦于反向代理技术,这是架构设计中的一个重要环节,尤其是在大型网络应用中。反向代理能够提高系统性能,隐藏后端服务器信息,以及实现负载均衡等目标。 首先,"架构概述"部分会介绍软件架构的基本...

    嵌入式处理器体系结构发展漫谈.pdf

    随着后PC时代的到来,嵌入式处理器体系结构的漫谈显得尤为关键。后PC时代的特点在于移动性、低功耗和高度集成,这些需求促使嵌入式处理器的设计向着更加高效、灵活的方向发展。 ### 二、理解用户需求的重要性 用户...

    漫谈插花艺术十七漫谈餐桌插花花艺的设计与布置.pdf

    【布置要点】布置是设计的具体实施,需根据餐桌规格划分空间,如双人桌适合小型瓶插,大型餐桌则适合西式或架构式插花。花卉选择应注重品种、色彩和特性,常用花卉如月季、石竹、百合等,配叶如肾蕨、天门冬等。色彩...

    数据库系统设计漫谈.ppt

    在“数据库系统设计漫谈”中,讲师童家旺,一位阿里集团的数据库架构师,探讨了一系列关键概念和实践。 首先,数据库基本问题的调查引出了各种类型的数据库系统,包括传统的Oracle、DB2、SQL Server、MySQL和...

    漫谈云计算 蔡学镛 云计算的前世今生 云计算商业模式

    良好的云计算架构具备水平可伸缩性,即随着计算需求的增长,可以通过简单地添加更多节点来扩展系统的规模。这种特性使得云计算能够适应不断变化的工作负载。 ##### 3. 容错机制 数据冗余存储在不同位置,确保即使...

    Java思维导图xmind文件+导出图片

    漫谈分布式架构 初识分布式架构与意义 如何把应用从单机扩展到分布式 大型分布式架构演进过程 分布式架构设计 主流架构模型-SOA架构和微服务架构 领域驱动设计及业务驱动规划 分布式架构的基本理论CAP、BASE...

    漫谈云数据中心与网络技术.docx

    集中云是将所有计算资源集中在单一的物理位置,便于管理和维护,适合大型企业和组织。相反,分散云则将资源分布在多个地理位置,这提高了数据的安全性、可靠性和服务质量,尤其适用于需要满足严格数据主权要求的企业...

    J2EE漫谈 简单讲解下J2EE

    它旨在简化企业级软件的开发、部署和管理,解决多层架构中的复杂问题,并提供了跨平台的“编写一次,到处运行”(Write Once, Run Anywhere)的能力。 **J2EE的构成**: J2EE包含了一系列的技术和规范,如Java ...

    顺丰刘新凯直播实录:数据安全治理漫谈.pdf

    综上所述,刘新凯的直播实录《顺丰刘新凯直播实录:数据安全治理漫谈》涵盖了数据安全治理的多个层面,包括开发安全、自动化安全、安全人才、安全管理等重要议题,并且还提及了业务安全、安全防护、安全防御和安全...

    漫谈电子商务解决方案(ppt-34页).ppt

    IBM的E-business理念是将Web、信息技术(IT)与商业实践相结合,构建出高效且灵活的电子商务架构。其基础结构主要由硬件平台和软件解决方案两大部分组成。 1. **硬件平台** - **RS/6000 企业服务器**:RS/6000是一...

    【推荐】最新网络安全运营方案和实践合集(共80多份).zip

    漫谈JSRC安全应急响应; 美团基础安全运营实践; 面向电信行业的数据安全监管运营实践; 面向实战运营的安全人才培养; 企业安全运营的一些思考; 企业上云后的安全建设思考; 浅谈互联网银行数据安全建设; 如何...

    Java工程师新人入门书籍推荐

    - 《大型网站系统与Java中间件实践》:阿里大神的作品,帮助理解分布式开发的全貌。 - 《Effective Java 中文版》:优化编码风格,提高代码质量。 - 《Java解惑》:解答Java中的疑难问题,增进对语言特性的理解。...

Global site tag (gtag.js) - Google Analytics