`

淘宝技术发展(分布式时代:服务化)

 
阅读更多

接上一篇:淘宝技术发展(Java时代:创造技术-Tair)

在系统发展的过程中,架构师的眼光至关重要,作为程序员,把功能实现即可,但作为架构师,要考虑系统的扩展性、重用性,这种敏锐的感觉,有人说是一种代码洁癖。淘宝早期有几个架构师具备了这种感觉。一指开发的Webx是一个扩展性很强的框架,行癫在这个框架上插入了数据分库路由的模块、session框架等等。在做淘宝后台系统的时候,同样需要这几个模块,行癫指导我把这些模块单独打成了jar包。 另外在做淘宝机票、彩票系统的时候,页面端也有很多东西需要复用,最直观的是页头和页脚,一开始我们每个系统里面复制了一份过去,但奇妙的是,那段时间页 脚要经常修改,例如把“雅虎中国”改成“中国雅虎”,过一段时间又加了一个“口碑网”,再过一段时间变成了“雅虎口碑”,最后又变成了“中国雅虎”,每个 系统都改一遍,折腾啊。后来我就把这部分velocity模版单独拿出来了,做成了公用的模块。

 

上面这些都是比较小的复用模块,到2006年 我们做了一个商品类目属性的改造,在类目里面引入属性的概念。项目的代号叫做“泰山”,如同它的名字,这是一个举足轻重的项目,这个改变是一个划时代的创 新。在这之前的三年时间内,商品的分类都是按照树状的一级一级的节点来分的,随着商品数量的增长,类目也变得越来越深,越来越复杂,这带给买家的就是查找 一件商品要逐级类目点开,找商品之前要懂商品的分类。而淘宝运营部门管理类目的小二也发现一个很严重的问题——例如男装里面有T恤、T恤下面有耐克、耐克有纯棉的,女装里面也有T恤、T恤下面还是有耐克、耐克下面依然有纯棉的,那是先分男女装再分款式再分品牌再分材质呢?还是先分品牌再分款式再分材质再分男女呢?晕倒了。这时候,一位大侠出来了——一灯,他说品牌、款式、材质这种东东可以叫做“属性”,属性是类似tag的 一个概念,与类目相比更加离散,更加灵活,这样也缩减了类目的深度。这个思想的提出,一举解决了分类的难题!从系统的角度来看,我们建立了“属性”这样一 个数据结构,由于除了类目的子节点有属性,父节点也有可能有属性,于是类目属性合起来也是一个结构化的数据对象。这个做出来之后我们把它独立出来作为一个 服务,叫做catservercategory server)。跟类目属性密切关联的商品搜索功能,独立出来,叫做hesper(金星),catserverhesper供淘宝的前后台系统调用。

 

现在淘宝的商品类目属性已经是地球上最大的了,几乎没有什么类目的商品在淘宝上找不到(除了违禁的),但最初类目属性改造完之后,我们很缺属性数据,尤其 是数码类的最缺。那从哪里弄这些数据呢亲?我们跟“中关村在线”合作,拿到了很多数据,那个时候,很多商品属性信息的后边标注着:“来自中关村在线”。有 了类目属性,给运营的工作带来很大的便利,我们知道淘宝的运营主要就是类目的运营,什么季节推什么商品,都要在类目属性上面做调整,让买家更容易找到。例 如夏天我要用户在女装一级类目下就标出来材质是不是蕾丝的、是不是纯棉的,冬天却要把羽绒衣调到女装一级类目下,流行什么就要把什么商品往更高级的类目调 整。这样类目和属性要经常调整,随之而来的问题就显现了——调整到哪个类目,那类商品的卖家就要编辑一次自己的商品,随着商品量的增长,卖家的工作量越来 越大,然后我们就发现卖家受不了啦。到了2008年,我们研究 了超市里面前后台商品的分类,发现超市前台商品可以随季节和关联来调整摆放场景(例如著名的啤酒和尿布的关联),后台仓库里面要按照自然类目来存储,二者 密切关联却又相互分开。然后我们就把前后台类目分开了,这样卖家发布商品选择的是自然类目和属性,淘宝前台展示的是根据运营需要而摆放的商品的类目和属 性。改造后的类目属性服务取名叫做forest(森林,跟类目属性有点神似。catserver还在,提供卖家授权、品牌服务、关键词等相关的服务)。类目属性的服务化,是淘宝在系统服务化方面做的第一个探索。

 

虽然个别架构师具备了代码洁癖,但淘宝前台系统的业务量和代码量还是爆炸式的增长了起来。业务方总在后面催,开发人员不够了就继续招人,招来的人根本看不 懂原来的业务,只好摸索着在“合适的地方”加一些“合适的代码”,看看运行起来像那么回事,就发布上线了。在这样的恶性循环中,系统越来越臃肿,业务的耦 合性越来越高,开发的效率越来越低。借用当时比较流行的一句话“写一段代码,编译一下能通过,半个小时就过去了;编译一下没通过,半天就过去了。”在这种 情况下,系统出错的概率也逐步增长,常常是你改了商品相关的某些代码,发现交易出问题了,甚至你改了论坛上的某些代码,旺旺出问题了。这让开发人员苦不堪言,而业务方还认为这帮人干活越来越慢了。

 

大概是在2007年 底的时候,研发部空降了一位从硅谷来的高管,空闻大师。空闻是一位温厚的长者,他告诉我们一切要以稳定为中心,所有影响系统稳定的因素都要解决掉。例如每 做一个日常修改,都必须整个系统回归测试一遍;多个日常修改如果放在一个版本里面,要是一个功能没有测试通过,整个系统都不能发布。我们把这个叫做“火车模型”,任何一个乘客没有上车,都不许发车。这样做的最直接后果就是火车一直晚点,新功能上线更慢了,我们能明显的感觉到业务方的不满,空闻的压力肯定非常大。当时我都不理解这种一刀切的做法,为了稳定牺牲了发展的速度,这跟某Party的“稳定压倒一切”有什么分别?

 

但是到现在回过头来看看,其实我们并没有理解背后的思路。正是在这种要求下,我们不得不开始改变一些东西,例如把回归测试日常化,每天晚上都跑一遍整个系统的回归。还有就是在这种要求下,我们不得不对这个超级复杂的系统做肢解和重构,其中复用性最高的一个模块——用户信息模块开始拆分出来了,我们叫它UICuser information center)。在UIC里面,它只处理最基础的用户信息操作,例如getUserByIdgetUserByName等等。

 

在另外一个方面,还有两个新兴的业务,也对系统基础功能的拆分提出了要求。在那个时候,我们做了淘宝旅行(trip.taobao.com)和淘宝彩票(caipiao.taobao.com) 两个新业务,这两个新业务在商品的展示和交易的流程上都跟主站的业务不一样,机票是按照航班的信息展示的,彩票是按照双色球、数字和足球的赛程来展示的。 但用到的会员的功能和交易的功能是跟主站差不多的,当时做的时候就很纠结,在主站里面做的话,会有一大半跟主站无关的东西,重新做一个的话,会有很多重复 建设。最终我们决定不再给主站添乱了,就另起炉灶做了两个新的业务系统。从查询商品、购买商品、评价反馈、查看订单这一整个流程都重新写了一套出来。现在 在“我的淘宝”里面查看交易记录的时候,还能发现“已买到的宝贝”里面把机票和彩票另外列出来了,他们没有加入到普通的订单里面去。在当时如果已经把会 员、交易、商品、评价这些模块拆分出来,就不用什么都重做一遍了。

 



2008年初,整个主站系统(有了机票、彩票系统之后,把原来的系统叫做主站)的容量已经到了瓶颈,商品数在一亿以上,PV2.5亿以上,会员数超过了五千万。这个时候Oracle的连接池数量都不够用了,数据库的容量到了极限,上层系统再增加机器也无法继续扩容了,我们只有把底层的基础服务继续拆分,从底层开始扩容,上层才能扩展,这才能容纳以后三五年的增长。

 

于是那一年我们专门启动了一个更大的项目,把交易这个核心业务模块也拆分出来了。原来的淘宝交易除了跟商品管理耦合在一起,也在支付宝和淘宝之间跳来跳去,跟支付宝耦合在一起,系统复杂,用户体验也很不好。我们把交易的底层业务拆出来叫交易中心TCtrade center),所谓底层业务是例如创建订单、减库存、修改订单状态等原子型的操作;交易的上层业务叫交易管理TMtrade manager),例如拍下一件普通商品要对订单、库存、物流进行操作,拍下虚拟商品不需要对物流进行操作,这些在TM里面完成。这个项目取了一个很没有创意的名字——“千岛湖”,这帮开发人员取这个名字的目的是想在开发完毕之后,去千岛湖玩一圈,后来他们如愿以偿了。这个时候还有一个项目也在搞,就是淘宝商城,之前拆分出来的那些基础服务,给商城的快速构建,提供了良好的基础。



 

类目属性、用户中心、交易中心,随着这些模块逐步的拆分和服务化改造,我们在系统架构方面也积累了不少的经验。到2008年底干脆做了一个更大的项目,把淘宝所有的业务都模块化,这是继2004年从LAMP架构到Java架构之后的第二次脱胎换骨。这个项目取了一个很霸气的名字,叫“五彩石”(女娲炼石补天,用的石头)。这个系统重构的工作非常惊险,有人称之为“给一架高速飞行的飞机换发动机”。

 

五彩石项目发布之后,这帮工程师去三亚玩了几天。他们把淘宝的系统拆分成了如下架构:

 

 



其中UICForest上文说过,TCICSC分别是交易中心(Trade Center)、商品中心(Item Center)、店铺中心(Shop Center),这些中心级别的服务只提供原子级的业务逻辑,如根据ID查找商品、创建交易、减少库存等操作。再往上一层是业务系统TMTrade Manager交易业务)、IMItem Manager商品业务)、SMShop Manager,因为不好听,所以后来改名叫SSShop System,店铺业务)、Detail(商品详情)。

拆分之后,系统之间的交互关系变得非常复杂,示意图如下:

系统这么拆分的话,好处显而易见,拆分之后每个系统可以单独部署,业务简单,方便扩容;有大量可重用的模块以便于开发新的业务;能够做到专人专事,让技术 人员更加专注于某一个领域。这样要解决的问题也很明显,分拆之后,系统之间还是必须要打交道的,越往底层的系统,调用它的客户方越多,这就要求底层的系统 必须具有超大规模的容量和非常高的可用性。另外,拆分之后的系统如何通讯?这里需要两种中间件系统,一种是实时调用的中间件(淘宝的HSF,高性能服务框架)、一种是异步消息通知的中间件(淘宝的Notify)。另外还有一个需要解决的问题是用户在A系统登录了,到B系统的时候,用户的登录信息怎么保存?这又涉及到一个Session框架。再者,还有一个软件工程方面的问题,这么多层的一套系统,怎么去测试它?

分享到:
评论

相关推荐

    淘宝技术发展(分布式时代:服务化).docx

    淘宝技术发展过程中,面对日益复杂的业务需求和不断增长的数据量,采取了服务化策略来应对挑战,这在“分布式时代:服务化”阶段尤为明显。服务化的核心目标是提高系统的可扩展性、重用性和维护性,降低业务之间的...

    案例2淘宝技术发展史.docx

    #### 七、淘宝技术发展(分布式时代:服务化) - **服务化转型**:随着业务的持续扩展,淘宝开始向服务化方向转型,将复杂的应用拆分成多个独立的服务,以提高系统的灵活性和可维护性。 - **微服务架构**:采用...

    分布式IT架构的演进.docx

    分布式IT架构是现代信息技术发展的重要方向,随着互联网和大数据时代的到来,传统的单体架构已经无法满足高并发、大规模数据处理的需求。本篇文章将详细探讨分布式架构的定义、应用、资源推荐以及其演进历程。 一、...

    案例2淘宝技术发展史(推荐版本).docx

    随着业务的复杂度增加,淘宝迈入了分布式时代,开始推行服务化策略。服务化将业务逻辑拆分成多个独立的服务,每个服务专注于特定的功能,通过消息中间件进行通信。这种模式提高了系统的可扩展性和容错性,使得淘宝...

    TFS淘宝分布式核心存储引擎

    在当今大数据时代,高效、稳定、可扩展的存储系统成为支撑互联网业务发展的基石。淘宝作为中国最大的电商平台,其背后的技术架构自然备受关注。其中,TFS(Taobao File System)是淘宝自主研发的一款分布式文件系统...

    淘宝分布式框架fourinone介绍.pdf

    淘宝分布式框架Fourinone是一个创新的分布式计算平台,它的诞生是为了解决互联网大型应用在处理大数据时所面临的技术难题。分布式计算框架的出现,极大程度上推动了搜索、云计算、大数据等领域的技术发展。Fourinone...

    淘宝技术这十年高清批注版.pdf.zip

    1. **技术架构演变**:淘宝最初的技术架构基于小型网站模式,随着业务的快速发展,逐步演变为分布式、服务化架构。书中深入探讨了如何从单一系统过渡到微服务架构,以及在此过程中遇到的挑战和解决方案。 2. **大...

    《淘宝技术这十年》高清版

    根据给定的信息,本文将对《淘宝技术这十年》这一主题进行深入解析,重点围绕淘宝技术发展历程中的关键节点、技术创新及应用实践等知识点展开。 ### 淘宝技术发展历程概览 #### 初创期(2003-2006年) - **背景...

    淘宝网系统架构

    从1999年起步至今,淘宝网的技术架构已经从最初的简单结构发展为复杂的分布式系统。 #### 二、淘宝网架构发展历程 - **1999-2001年(史前时代)** - **技术选型**:最初采用了Perl语言进行开发,使用CGI脚本处理...

    淘宝技术那十年

    04--下手加过批注.pdf:这一章可能聚焦于淘宝的移动化进程,包括移动应用的开发、优化,以及如何适应移动互联网时代的用户需求。下手的批注可能解析了淘宝如何应对移动设备的多样性,实现跨平台的无缝体验,并探讨了...

    google、facebook、Twitter、eBay、腾讯、淘宝技术发展历程

    【标题】:“google、facebook、Twitter、eBay、腾讯、淘宝技术发展历程” 【描述】:本文探讨了全球知名互联网公司,如Google、Facebook、Twitter、eBay、腾讯和淘宝在其技术发展历程中的关键变革和创新,展示了...

    基于分布式云计算技术进行海量数据运营的探讨.pdf

    借鉴Google、Facebook和淘宝等企业的成功经验,电信运营商可以通过数据运营发现潜在的商业价值,提供更个性化、更精准的服务,避免被边缘化为简单的“管道”。 【总结】 分布式云计算技术,特别是Hadoop,为电信...

    探寻农产品批发市场转型之路——建立面向终端群体的分布式一体化农产品流通服务平台.pdf

    本文试图探讨在新信息科技环境下,农产品批发市场的转型路径,特别是如何通过建立一个分布式一体化的农产品流通服务平台来面向终端群体,并期望这一变革能成为未来农业产业发展的新趋势。 首先,农产品批发市场作为...

    基于消息队列的分布式爬虫——以电商产品数据为例.pdf

    分布式爬虫技术、消息队列应用、电商平台数据抓取、大数据存储和处理是本篇文档所涉及的核心知识点。本文将围绕这些知识领域进行详细阐述。 首先,分布式爬虫是一种在分布式系统中运行的爬虫程序,它可以同时在多台...

    淘宝技术这十年PDF阅读

    《淘宝技术这十年》这本书深度剖析了中国最大的电商平台——淘宝在技术领域的演进历程,从一个初创公司的简单网站发展到如今的超大规模互联网系统。在这个过程中,淘宝的技术团队面临着无数挑战,他们如何应对并实现...

Global site tag (gtag.js) - Google Analytics