`
san_yun
  • 浏览: 2651871 次
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

服务治理过程演进

 
阅读更多

转于自己在公司的Blog: 
http://pt.alibaba-inc.com/wp/experience_1402/service-governance-process.html 

 

在大规模服务化之前,应用可能只是通过RMI或Hessian等工具,简单的暴露和引用远程服务,通过配置服务的URL地址进行调用,通过F5等硬件进行负载均衡。 

(1) 当服务越来越多时,服务URL配置管理变得非常困难,F5硬件负载均衡器的单点压力也越来越大。 

此时需要一个服务注册中心,动态的注册和发现服务,使服务的位置透明。 

并通过在消费方获取服务提供方地址列表,实现软负载均衡和Failover,降低对F5硬件负载均衡器的依赖,也能减少部分成本。 

(2) 当进一步发展,服务间依赖关系变得错踪复杂,甚至分不清哪个应用要在哪个应用之前启动,架构师都不能完整的描述应用的架构关系。 

这时,需要自动画出应用间的依赖关系图,以帮助架构师理清理关系。 

(3) 接着,服务的调用量越来越大,服务的容量问题就暴露出来,这个服务需要多少机器支撑?什么时候该加机器? 

为了解决这些问题,第一步,要将服务现在每天的调用量,响应时间,都统计出来,作为容量规划的参考指标。 

其次,要可以动态调整权重,在线上,将某台机器的权重一直加大,并在加大的过程中记录响应时间的变化,直到响应时间到达阀值,记录此时的访问量,再以此访问量乘以机器数反推总容量。 

(4) 规模继续扩大,应用之间不再是扁平的对应关系,开始分层,比如核心数据层,业务集成层等,就算没有出现循环依赖,也不允许从低层向高层依赖,以免后续被逼循环依赖。 

这时,需要在注册中心定义架构体系,列明有哪些层的定义,每个服务暴露或引用时,都必须声明自己应用属于哪一层,这样注册中心能更快的发现架构的腐化现象。 

(5) 服务多了,沟通成本也开始上升,调某个服务失败该找谁?服务的参数都有什么约定? 

这时就需要登记每个服务都是谁负责的,并建立一个服务的文档库,方便检索。 

(6) 慢慢一些敏感数据也都服务化了,安全问题开始变得重要,谁能调该服务?如何授权? 

这样的服务可能需要一个密码,访问时需带着此密码,但如果用密码,要改密码时,就会很不方便,所有的消费方都要改,所以动态生成令牌(Token)可能会更好,提供方将令牌告之注册中心,由注册中心决定是否告之消费方,这样就能在注册中心页面上做复杂的授权模型。 

(7) 就算是不敏感的服务,也不是能任意调用,比如某服务突然多了一个消费者,这个消费者的请求量直接把服务给拖跨了,其它消费者跟着一起故障。 

首先服务提供方需要流控,当流程超标时,能拒绝部分请求,进行自我保护。 

其次,消费者上线前和提供者约定《服务质量等级协定(SLA)》,SLA包括消费者承诺每天调用量,请求数据量,提供方承诺响应时间,出错率等,将SLA记录在监控中心,定时与监控数据对比,超标则报警。 

(8) 虽然有SLA约定,如果不能控制,就只是君子协定,如何确保服务质量? 

比如:一个应用很重要,一个不那么重要,它们调用同一个服务,这个服务就应该向重要应用倾斜,而不是一视同仁,当支撑不住时,应限制不重要应用的访问,保障重要应用的可用,如何做到这一点呢。这时,就需要服务路由,控制不同应用访问不同机器,比如: 
应用分离: 
consumer.application = foo => provider.host = 1,2,3 
consumer.application != foo => provider.host = 5,6 
读写分离: 
method.name = find*,get* => provider.host = 1,2,3 
method.name != find*,get* => provider.host = 5,6 

(9) 服务上线后,需要验证服务是否可用,但因防火墙的限制,线下是不能访问线上服务的,不得不先写好一个测试Main,然后放到线上去执行,非常麻烦,并且容易忘记验证。 

所以线上需要有一个自动运行的验证程序,用户只需在界面上填上要验证的服务方法,以及参数值和期望的返回值,当有一个服务提供者上线时,将自动运行该用例,并将运行结果发邮件通知负责人。 

(10) 服务应用和Web应用是有区别的,它是一个后台Daemon程序,不需要Tomcat之类的Web容器。但因公司之前以Web应用为主,规范都是按Web应用的,所以不得不把服务跑在一个根本用不上的Web容器里,而搭一个这样的Web工程也非常费事。 

所以需要实现一个非Web的容器,只需简单的Main加载Spring配置即可,并提供Maven模板工程,只需mvn dubbo:generate 即可创建一个五脏俱全的服务应用。 

(11) 开发服务的人越来越多,更注重开发效率,IDE的集成支持必不可少。 

通过插件,可以在Eclipse中直接运行服务,提供方可以直接填入测试数据测试服务,消费方可以直接Mock服务不依赖提供方开发。 

(12) 因为暴露服务很简单,服务的上线越来越随意,有时候负责服务化的架构师都不知道有人上线了某个服务,使得线上服务鱼龙混杂,甚至出现重复的服务,而服务下线比上线还困难。 

需要一个新服务上线审批流程,必须经过服务化的架构师审批过了,才可以上线。 

而服务下线时,应先标识为过时,然后通知调用方尽快修改调用,直到没有人调此服务,才能下线。 

(13) 因服务接口设计的经验一直在慢慢的积累过程中,很多接口并不能一促而蹴,在修改的过程中,如何保证兼容性,怎么判断是否兼容?另外,更深层次的,业务行为兼容吗? 

可以根据使用的协议类型,分析接口及领域模型的变更是否兼容,比如:对比加减字段,方法签名等。 

而业务上,可能需要基于自动回归测试用例,形成Technology Compatibility Kit (TCK),确保兼容升级。 

(14) 随着服务的不停升级,总有些意想不到的事发生,比如cache写错了导致内存溢出,故障不可避免,每次核心服务一挂,影响一大片,人心慌慌,如何控制故障的影响面?服务是否可以功能降级?或者资源劣化? 

应用间声明依赖强度,哪些功能强依赖,哪些弱依赖,然后基于依赖强度,计算出影响面,并定期测试复查,加强关键路径上的服务的优化和容错,清理不该在关键路径上的服务。 

提供容错Mock数据,Mock数据也应可以在注册中心在运行时动态下发,当某服务不可用时,用Mock数据代替,可以减少故障的发生,比如某验权服务,当验权服务全部挂掉后,直接返回false表示没有权限,并打印Error日志报警。 

另外,前端的页面也应采用Portal进行降级,当该Portal获取不到数据时,直接隐藏,或替换为其它模块展示,并提供功能开关,可人工干预是否展示,或限制多少流量可以展示。 

(15) 当已有很多小服务,可能就需要组合多个小服务的大服务,为此,不得不增加一个中间层,暴露一个新服务,里面分别调其它小服务,这样的新服务业务逻辑少,却带来很多开发工作量。 

此时,需要一个服务编排引擎,内置简单的流程引擎,只需用XML或DSL声明如何聚合服务,注册中心可以直接下发给消费者执行聚合逻辑,或者部署通用的编排服务器,所有请求有编排服务器转发。 

(16) 并不是所有服务的访问量都大,很多的服务都只有一丁点访问量,却需要部署两台提供服务的机器,进行HA互备,如何减少浪费的机器。 

此时可能需要让服务容器支持在一台机器上部署多个应用,可以用多JVM隔离,也可以用ClassLoader隔离。 

(17) 多个应用如果不是一个团队开发的,部署在一台机器上,很有可以误操作,停掉了别人的服务。 

所以需要实现自动部署,所有的部署都无需人工干扰,最好是一键式部署。 

(18) 机器总是的闲时和忙时,或者冗余机器防灾,如何提高机器的利用率? 

即然已经可以自动部署了,那根据监控数据,就可以实现资源调度,根据应用的压力情况,自动添加机器并部署。

如果你的应用是国际化的,有中文站,美国站之类,因为时差,美国站的机器晚上闲的时候,可能正是中文站的白天忙时,可以通过资源调度,分时段自动调配和部署双方应用。 

按关键词归纳为: 

1. 服务注册与发现 

2. 软负载均衡与容错 

3. 服务监控与统计 

4. 服务容量评估 

5. 服务上线审批 

6. 服务下线通知 

7. 服务负责人 

8. 服务文档 

9. 服务路由 

10. 服务编排 

11. 服务黑白名单 

12. 服务权限控制 

13. 服务依赖关系 

14. 服务分层架构 

15. 服务调用链跟踪 

16. 故障传导分析 

17. 服务降级 

18. 服务等级协定 

19. 服务自动测试 

20. 服务伪装容错 

21. 服务兼容性检测 

22. 服务使用情况报告 

23. 服务权重动态调整 

24. 服务负载均衡调整 

25. 服务映射 

26. 服务模板工程 

27. 服务开发IDE 

28. 服务健康检测 

29. 服务容器 

30. 服务自动部署 

31. 服务资源调度 

分享到:
评论

相关推荐

    服务治理的技术演进之路.pptx

    猫眼娱乐在服务治理的技术演进过程中面临了诸多挑战,主要包括高可用性、微服务稳定性、以及面对大规模流量的处理能力。 1. **猫眼业务面临的难点**: - 高DAU(日活跃用户数)和海量调用:数千万DAU和百亿级别的...

    企业级 DevSecOps 开源治理方案演进之路.pdf

    "方案演进之路" 说明了该方案是一个发展和演进的过程。 描述分析: * 该描述中没有提供具体的信息,但是标题已经明确表明了该方案的主要内容和目标。 标签分析: * "DevSecOps" 是该方案的核心标签,表明了该...

    微服务治理的技术演进和架构实践.docx

    在技术演进的过程中,服务治理的关键技术点包括: 1. 服务注册与发现:服务实例启动后,会向注册中心注册自己的元数据信息,其他服务通过注册中心找到所需的服务实例。 2. 负载均衡:在请求分发过程中,确保服务...

    企业级 DevSecOps 开源治理方案演进之路.zip

    本文将深入探讨企业级 DevSecOps 开源治理方案的演进过程,以及如何构建一个高效、安全的开源软件管理体系。 一、DevSecOps 的概念与重要性 DevSecOps 是 DevOps 的延伸,它强调在整个软件生命周期中集成安全实践...

    百度外卖基础服务体系演进过程.pdf

    百度外卖作为一家快速发展的外卖服务平台,其基础服务体系的构建与演进过程体现了技术团队在面对高并发、高可用性挑战时的智慧和创新。本文将深入探讨百度外卖的基础服务体系是如何从依赖大树到自力更生,以及在服务...

    好买财富基金交易系统的分布式架构演进过程.pdf

    "分布式交易系统架构演进过程" 分布式交易系统架构演进过程是指好买财富基金交易系统从传统金融到互联网金融系统发展历程的演进过程。...为了解决这些问题,需要业务系统垂直拆分、服务治理和架构演进等策略。

    华为架构师8年经验谈:从单体架构到微服务的服务化演进之路(李林锋 DBAplus社群)

    服务化实施过程中也存在挑战,例如服务拆分、服务治理、服务监控、服务安全等。 #### 服务化架构的演进方向 服务化架构的演进方向包括不断演进的微服务架构、无服务架构(Serverless),以及与容器化技术如Docker、...

    公司治理演进与会计信息披露监管——博弈分析与历史证据.pdf

    总之,公司治理的演进促进了会计信息披露监管制度的形成和发展,而有效的会计信息披露监管机制反过来又强化了公司治理的效果,两者相辅相成,共同促进了资本市场的健康发展。这篇研究通过历史证据和博弈论的分析,...

    作业帮服务治理探索和落地实践.pdf

    《作业帮服务治理探索与落地实践》这篇...总的来说,作业帮的服务治理实践涵盖了微服务架构、云原生技术、服务注册发现、服务网格和日志管理等多个层面,通过不断的技术演进和创新,实现了服务的高效、稳定和成本优化。

    余额宝的服务治理架构.pdf

    在整个过程中,余额宝在服务治理方面积累了丰富的实践经验,包括数据治理、团队协同和精益管理。数据治理方面,面对金融行业的复杂数据资产,构建了有效的数据治理体系,确保数据的安全、准确和可用。团队协同方面,...

    美团命名服务的演进与业务赋能.pptx

    这一过程中,MNS引入了灰度迁移策略和标准操作流程(SOP),建立了数据仓库,优化了业务系统层,如Pigeon、Whale、Oceanus和Mtthrift,统一了代理接入层,引入了ServiceMesh和SgAgent,并构建了MNS-API控制服务层,...

    企业技术中台架构演进之路.pptx

    总结来说,企业技术中台架构的演进是一个不断迭代、优化的过程,它涉及到微服务化、容器化、DevOps实践、服务治理、多语言支持、资源管理等多个层面,旨在构建一个高效、灵活且可扩展的技术基础设施,以适应快速变化...

    服务治理相关

    在IT行业中,服务治理是构建大规模分布式系统的关键技术之一,特别是在微服务架构中。...随着技术的发展,服务治理也在不断地演进,新的工具和技术如 Istio(Service Mesh)正在改变我们对服务治理的理解和实践。

    全球化短视频服务架构演进之路.pptx

    总的来说,小影APP全球化短视频服务架构的演进是一个不断技术创新和优化的过程,它涉及到网络加速、多机房部署、数据一致性、服务化治理、高效运维等多个方面,体现了互联网企业在面对全球化竞争时,如何通过技术...

    藏经阁-微服务治理技术白皮书-379.pdf

    书中详细阐述了服务治理的演进历程,从无到有,从服务框架提供的SDK,到轻量级隔离容器Pandora,再到无侵入式的Java Agent以及Service Mesh,这些技术的发展反映了服务治理能力的不断提升,涵盖了开发、测试、线上...

    大型系统架构 设计与优化 人人网网站架构-服务化与架构变迁 服务化的演进 共34页.pptx

    \n\n**异构服务总线的挑战**\n\n在服务化过程中,人人网遇到了异构服务总线的问题。自建REST框架虽然灵活,但无法很好地支持跨语言服务调用。开源ICE虽然提供了一体化的解决方案,但定制和扩展性成为难题。这些挑战...

    信息时代大学文化生态的演进逻辑与治理架构.pdf

    大学文化生态的演变与大学的治理模式紧密相连,历史与传承、创新与内生是其演进的统一特性。 【信息时代的影响】随着信息技术的发展,信息时代的到来对大学文化生态产生了深远影响。大学的物理空间扩展到了虚拟空间...

    藏经阁-饿了么服务架构演进.pdf

    通过以上知识点,我们可以看出饿了么在服务架构演进过程中,不断优化技术方案,以应对快速增长的业务需求,提升系统稳定性和用户体验。同时,它也借鉴了其他行业的最佳实践,并结合自身特点,构建了一套高效、弹性的...

Global site tag (gtag.js) - Google Analytics