`

优化和架构之服务切分

 
阅读更多

切分是最基本,且最多变的思路之一,说基本,是因为在学习程序设计的第一天就应该知道,说多变,是因为在未来的很多年里,你会不停的应用这个方法来解决问题。不幸的是,切分这个思路并没有得到应有的重视。

大概是因为这个词比较土,说起来也比较普通,远不如并行,集群,负载平衡这些词听起来大。所以碰到一个问题的时候,往往被拿出来的解决方案会是以上3个大词之一,很少有人去认真的考虑切分问题。但事实上,这3个大词所需要的技术,其实也是建立在良好可切分的系统之上的。

最近碰到了2个项目,都是典型案例。

案例1 ,小公司,发展的不错。一台服务器眼看不够用了,于是就买了第二台,希望能做一个"负载均衡"系统。很多人大概认为负载均衡,是类似自来水一样的技术,只要打开笼头,清水就汩汩涌出。往往忘记了水龙头后面的水管和自来水公司。

一个服务器上放了很多个服务,是很难应用负载均衡这种技术的。必须先要把服务拆开,找到性能薄弱的点,对这个点进行负载均衡,才能得到比较好的效果。否则很可能用了80%的力气,但是只得到20%的结果。

案例2,某外企。之前我们给他们做过咨询,解决了一次问题,上次我们找到了系统最慢的地方,去掉了老系统中性能消耗多的地方,用通用的缓存 (squid/memcached)系统来代替他们用php写的硬盘文件缓存,上次的改动让性能困扰远离了他们一年,随着业务发展,性能又显得不够了。

比起来一年前,他们的服务器数量增长了一倍。其中大量服务器用于做mysql集群和web集群。服务器是复杂的网状关系。前面说过,这种不分主次的架构往往只能解决20%的问题。而且很容易到达瓶颈。

套用回那3个大词,这个系统确实是集群的,负载平衡的。因为所有服务器的功能是完全一样的,任何一台单独拿出来,都是完整的系统镜像。看上去很美, 但实际用起来可没有这么理想。在实际应用中,一台服务器出了问题,几分钟之后,所有的服务器都出问题了。并没能如预期想像的,损坏一两台不影响正常工作。

这个案例中,实际使用了6台服务器做mysql集群。每台服务器的数据是完全镜像。可以想像,如果6台服务器中有一台出了故障,所有的压力就会被平 均分到其他5台上。在集群负载大的情况下,增加1/5压力,很可能让另外的5台直接被压垮。这时候发生的情况,就好像最近株洲的塌了的大桥一样,一个桥墩 一个桥墩,好像多米诺骨牌一样,一路塌了下去。

从任何角度看来,这都不是一个好架构。别说稳定了,连基本的服务都保证不了。

对于2个案例,我给出的解决方案都是先做切分,然后再分别进行优化。首先可以按照业务切分,把现有服务器分成多个组。对于web前端和mysql集 群,每组2~3个足够应付大多数情况。每组服务器数量太多,不仅造成单点故障的概率增加,也容易在自身的数据同步中消耗大量的资源。

比较以下两张图:

改造前:

改造后:

之前的结构是所有web服务器放着同样的应用,所有数据库服务器放着同样的数据。改进后的结构是将整个系统按照服务内容和性质拆成了几组。从 ServiceA到Service n 采用了不同的配置方式,简单的只用一组机器,复杂的用多组。在实践中,其实还可以分的更细致,甚至几个Service公用一组机器。(之前beta技术沙龙,有道讲他们的阅读器架构的时候,也提到了类似的办法)

后者的好处很明显,最明显的:

1 可以有效的使用资源。比如:服务A是低负载型的,并非核心业务,可以给予较少的资源。(较少的机器,较差的机器) ,而服务B是核心服务,需要全力支持。
2 可以简单的监控性能。所有服务都混在一起的时候,碰到性能问题很难下手分析。很有可能是最不常用的服务A中有bug,导致了整个集群性能低下。寻找这种bug要耗费大量的人力和时间。
3 易于备份,升级时切换服务平滑。
4 为下一步优化做好准备。综合以上2点,下一步可以集中资源,对重要服务专门进行优化,保证稳定和性能。


在以上的例子中,我们可以看到,专门对重要服务B进行负载均衡,无论在成本上还是性能受益上都比对整个应用进行处理划算的多。

除了根据明显的业务边界进行切分,还有很多种方式,比如按照时间,按照读写频率等。


这种思路也不仅仅应用于web server/database。比如,设计缓存的时候,也应该进行一定的切分。以squid为例,应该把文件大小差不多的文件放在一个squid中,把更新频率接近的文件放在一个squid中。这些都是让架构清晰,性能提高的办法。

从系统设计的初期,就应该贯彻这个思路,用子域名来标记不同的服务 (img.yourdomain.com,bbs.yourdomain.com...),比用虚拟目录的方式 (www.yourdomain.com/img,www.yourdomain.com/bbs)更便于切分。

很多人咨询过我这个问题,不过他们都是从seo和产品方面考虑,从来没想过这是和技术相关的。如果所有的应用都放在www之下,未来一旦想把一个服 务挪到另外一台服务器上,就很困难----不是没有办法,只是难度比较高。 子域名只需要设置一下域名解析,把要挪走的服务指向新的ip,几分钟就搞定了。

这个办法的实质,仍然是降低系统耦合度。必要的关联数据,宁可采用http请求的api形式,也不要跨数据库进行查询。http请求可以很方便的跨 服务器,可以设置页面缓存等,跨数据库请求则只能在数据库上花力气,最后又退回了对全部数据做数据库集群,master/slav的老路上e(当然,这不 是一条原则,还是要根据应用的具体情况而定)。诸如此类,尽量要将思路放远,不要贪图眼前的小得失。(常见的说法:数据库怎么也比http快吧...这没 错,不过要看应用场合)

能在一个单一的服务中承载尽量多的数据和请求,这当然是所有技术工作者不懈的追求。在此之前,如果先进行合理的切分,再令每个服务的性能最大化,一般都能得到更大的好处。简单是美,简单就是力量。

分享到:
评论

相关推荐

    5G系统RAN架构解析之CU和DU的应用和功能切分方式

    综上所述,5G RAN的CU和DU架构是为了解决5G时代高速率、大连接、低延迟等挑战,通过功能分离实现网络的优化和灵活配置,以适应多样化服务需求。这种创新架构为5G网络的高效运行和未来发展奠定了坚实的基础。

    mysql性能优化与架构设计

    MySQL性能优化与架构设计是数据库管理员和开发人员必须掌握的关键技能之一。MySQL作为一个广泛使用的开源关系型数据库管理系统,其性能优化对于提升应用的整体性能至关重要。本资料主要关注MySQL的架构理解、性能...

    5G系统RAN架构解析之CU和DU的应用和功能切分方式.docx

    在CU和DU分离的架构下,网络运营商可以通过集中管理CU来实现对网络性能和负荷的协调管理,同时也可以针对DU进行实时性能优化。此外,得益于虚拟化技术的应用,运营商可以在CU层面上灵活部署和调整网络功能,以适应...

    高性能高并发服务器架构

    综上所述,构建高性能高并发服务器架构涉及多个层面的技术和策略,需要综合考虑数据库优化、负载均衡、缓存机制、系统架构设计、大数据处理以及安全性和稳定性等多个因素。通过合理规划和持续优化,可以有效提升系统...

    数据库水平切分架构方案.docx

    总的来说,数据库水平切分架构方案需要综合考虑业务需求、查询模式和性能要求,通过合理选择切分字段和策略,实现系统的扩展性和性能优化。在实际应用中,可能还需要结合缓存、读写分离、分布式事务等技术,进一步...

    MySQL性能调优与架构设计.pdf

    主要包括可扩展和高可用两部分内容,可扩展部分包括设计原则、Replication 的利用、数据切分、如何使用 Cache 和 Search,以及 NDB Cluster等内容。高可用则主要包括 Dual Master、DRBD、NDB Cluster,以及系统监控...

    高性能高并发服务架构.doc

    - **架构设计**:合理规划服务架构,采用微服务、容器化、云原生等现代技术手段,确保系统的可伸缩性和弹性。 ### 2. 具体实践案例 #### Lighttpd+Squid+Apache构建高效率Web服务器 - **Lighttpd**:轻量级Web...

    高性能高并发服务器架构.pdf

    - **重要性**: 在当前互联网高速发展的背景下,越来越多的网站和服务需要面对大量的在线用户,因此构建高性能、高并发的服务器架构变得尤为重要。 #### 2. 关键技术与策略 - **负载均衡**: 使用负载均衡技术可以将...

    数据库切分

    数据库切分是数据库架构设计的一种方法,主要应用于海量数据存储和处理场景。它将单一数据库逻辑上划分为多个物理数据库,每个部分(切片)都包含一部分数据。数据的分割可以基于不同的策略,如按范围、哈希值或特定...

    大型网站系统架构演化之路.pdf

    大型网站系统架构演化之路的知识点主要包括以下几个方面: ...以上知识点涵盖了大型网站架构演化的核心要素,从基础架构到高级优化策略,每一步都至关重要,共同构成了大型网站系统架构的完整演化之路。

    阿里巴巴中文站架构实践

    从架构角度讲,阿里巴巴中文站的演进历程很好地体现了企业级架构设计和Java实战中的关键要素,包括但不限于:服务化、高性能计算、数据一致性、水平切分、分布式存储、缓存优化、安全性和灾备机制等。通过这些技术的...

    电商网站分布式架构设计与优化.docx

    因此,优化方向包括应用的垂直切分和水平切分、减少冗余代码、使用分布式缓存来减轻数据库压力、采用负载均衡和集群技术提高可用性,以及利用CDN加速静态内容的分发。 电商网站的分布式架构设计是一个持续演进的...

    架构师之路2017半年精选40篇

    ### 架构师之路2017半年精选40篇:关键知识点解析 ...以上内容概括了《架构师之路2017半年精选40篇》中涉及的核心架构设计方法与实践案例,旨在帮助读者理解现代互联网架构设计的关键要素和技术趋势。

    切分代码

    3. **按组件切分**:将应用程序划分为可复用的组件,如前端UI组件和后端服务组件。 4. **按责任切分**:根据代码负责的任务来划分,例如数据访问层、业务逻辑层、展示层。 总结来说,切分代码是软件工程中不可或缺...

    MySQL性能调优与架构设计(PDF)

    主要包括可扩展和高可用两部分内容,可扩展部分包括设计原则、Replication 的利用、数据切分、如何使用 Cache 和 Search,以及 NDB Cluster等内容。高可用则主要包括 Dual Master、DRBD、NDB Cluster,以及系统监控...

    基于特征图切分的轻量级卷积神经网络.pdf

    基于特征图切分的轻量级卷积神经网络 本文主要介绍了一种轻量级卷积神经网络...4. SFNet架构的性能优化和改进 5. 轻量级卷积神经网络的应用和挑战 关键词:卷积神经网络、轻量级网络、切分模块、特征图切分、组卷积。

Global site tag (gtag.js) - Google Analytics