`
cenwenchu
  • 浏览: 164903 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
阅读更多
 

Author:放翁(文初)

Date:2010/4/2

         过年到现在还没有更新过blog,就和年前说的一样,到了淘宝就要真的踏实做实事了(起码Q3前)。和以前在阿软不同的是现在更加关注产品的设计和实现,对于新技术的尝试缺少了一些空间和时间。可以拿程序员对新技术的追求做个类比,就好比结婚前的浪漫,而到了你真的结婚有了家庭和小孩,那需要的是更多的责任感和务实的工作。当然如果生活成为一种生存,那么就失去了意义,如何在责任和浪漫之间找到平衡点,是一个技术人员成长的挑战。我们不可能永远是一个长不大的小孩,也不会是老气横秋的中年男人。有点废话了,言归正传,谈一下这年后短短的一个多月的工作心得,一点分享,一点记录。

         系统透明化

         去年就加入了淘宝的虚拟小组(稳定性小组),同时在开放平台团队内最大的一个职责也是稳定性。对于客户来说并不关心你的技术实现是如何fancy,对他来说能够快速、稳定、方便的满足他的需求就是一个好网站,一个好系统,一套好服务。因此稳定,高效成为了淘宝主站和开放平台的根本。前两天看了黄裳在infoq的一些关于淘宝技术展望的文章,就两个字“实在”,没有啥潮流的词汇,没有很炫的技术推荐,有的就是如何用最有效的手段满足用户需求。

         记得在最近一次稳定小组会议上大家谈到了这些年发展带来的问题,其实我们在解决问题的同时也在不断地引入问题,同时在规模化的驱使下,不断地采用松耦合及去中心化的设计,但是带来的问题就是系统复杂度的不断增加,同时系统间的交互和依赖也变得越来越复杂和混沌。我在Q1的工作计划中,大部分的工作为了一个目标:系统透明化。

系统透明化能够为海量请求的系统带来什么?

1. 实实在在的性能优化。

2. 简单有效的问题排查和定位。

3. 系统风险预警。

4. 有效地系统健康监控和业务健康监控。

过去我们总在线下做各种压力测试,同时对于一些优化策略也都是通过线下来验证,但是实际的业务场景往往会和具体的数据相关,而线下无法做到的就是数据模拟。在开放平台系统基础框架重构以后,首先是采用了管道链的插拔模式,直接通过对当前运行数据的在线分析就可以看出系统消耗的环节,同时加上控制台对集群单台机器的配置推送,这样比对两台不同处理策略的服务器就能够很明显看出性能优化的效果以及后续的改进点。举个例子,在我们业务方需求中要求对某一部分业务数据去掉本地缓存,全部启用纯粹的集中式缓存,我们通过批次的关闭本地缓存,比对了自身系统和外部依赖系统的压力增长情况,当3/4的机群机器采用纯集中式缓存的时候,两方服务器都出现了load较高的问题,因此考虑采用更细粒度的业务数据来决定是否启用本地缓存,满足了用户请求,同时也大大降低了双方的压力情况,同时由于业务数据配置可运行期推送,因此随着压力的增大可以在线调整策略。

在新架构上线后,发现运行一段时间会有“内存泄露”的问题,64位机器最后3G的内存都被吃光。当时就是担心新架构可能产生一些问题,因此允许系统通过控制台切换新老引擎。线上一台新引擎的服务器跑了一段时候就把内存dump出来,然后拖到线下分析,发现有大量的tomcatSession被保存在Manager中没有被释放(1.7G),然后通过线下卸载管道做测试,最终发现是由于其中一个管道需要在运行期获取到spring的容器,去掉用了request.getsession().getContext方法,结果容器创建了有效期为30分钟的session,对于平台这么大的访问量,其实这种非内存泄露的问题,也足以使得高压力下OOM

透明化另一方面就是需要对依赖系统及自身的健康状况有所了解。当前TOP在这方面主要做的工作被定义成为免疫系统,其主要的职责

                                                 



         流程管道化

         这些年一直都在谈面向服务,模块化,这些概念。但是就其目标来说,就是希望能够让设计者更多的考虑流程之间的松耦合,无依赖。因为一旦服务之间没有过多的依赖,服务本身没有中间状态,那么任务就可以并行处理,一旦并行处理,那么对于流程的关键路径优化就有很大的帮助。

         下面是重构前和重构后的两个流程对比:

         老框架流程:

                                                

新框架流程:

                                                

具体的框架类图如下:

                                                    

         看了以后,可能很多同学会说,其实就那么简单一个设计么,但其实系统的设计目标就是用简单的设计来满足复杂的需求。其实对于开放平台来说,再复杂的业务都是可以抽象成管道,同时大部分情况下都是无状态的服务管道,基于业务的不同需求,管道的执行会有所不同。

         这里设计的几个原则:

1.       管道之间无关联性。管道与管道之间完全没有任何关联,因为在管道看来就只有输入和输出的数据流,其他管道对于它来说是透明的。独立性降低业务耦合度,支持运行期变更。

2.       管道之间通过上下文的方式交互数据,减少数据输入带来的适配依赖。

3.       业务处理权及流程中断权交给管道,管道可以通过实现ignoreit来判断是否要处理此次请求,也可以在IPipeResult中设置isBreakPipeChain来主动中断流程。(对于资源回收最好不要交给一个管道执行,因为随时可能因为流程中断而没有被执行到)

4.       管道设计尽量为无状态,线程安全,便于扩展,防止产生资源竞争带来的处理瓶颈。

5.       监控管道执行状况,必要时自动降级卸载管道,保护系统稳定性。

早先考虑是否能够启动线程池来执行管道链,这么做的目标是能够控制超时执行的管道链,避免系统的不稳定性。但最大的问题就是线程切换代价以及线程池的容量问题,因此作罢,改为事后记录降级处理。

安全还是安全

         开放平台成立之初,就要面对着安全的问题,主站有很多的约束和限制,但是开放平台成为淘宝对外的窗口,为了业务需要,作了必要的妥协,但是安全方面也是一直在抓的事情。最近就处理淘宝访客应用的问题,有些软件开发者就利用302转跳的方式,在商品或者店铺的页面上留痕迹,来获取访客信息,可谓用尽心思,封一个漏洞找一个漏洞。对于这种转跳来获取访客信息,简单的处理就这些,禁止get请求(由于都是页面图片的get请求转跳,因此无法简单的变成post请求),然后如果是post需要加上动态会话码的校验,最后在加上对于请求的refer检查,来屏蔽这类的问题。不过对于钓鱼网站,真的没有啥太好的处理方式,个人感觉最靠谱的就是写浏览器的插件。

         标签化开放

         开放平台现在都是数据服务开放,很多场景下会有标签化开放的需求。还是看图说话吧:

                                               

         剩下的就是基于Map-Reduce的可配置分析引擎的优化,当前支持文件数据源和数据库数据源,支持增量分析和离线一次性分析,分析模型运行期可改变,提供实时的监控预警。太晚了,最后贴一个开放平台的技术当前总体架构图:

分享到:
评论
1 楼 sdh5724 2010-08-26  
大量的tomcat的Session被保存在Manager中没有被释放(1.7G)。。。。。

這個架構師應該拉出插到死, 直接爆頭!

無狀態群集是互聯網基本特徵, 這個都忘記, 不要搞設計了。

相关推荐

    长虹智能电视强制刷机数据 Q1C、Q1R、Q1N、Q1S系列 ZLM50HiS机芯 整机USB升级文件 V1.00020

    Q1C、Q1R、Q1N、Q1S系列 软件升级方法及步骤 第1步,压缩包解压,将pkg、zip升级程序拷贝到U盘根目录 第2步,在关机情况下,将U盘插入USB 接口。 第3步,开机,自动进入升级模式。 第4步,升级完成后电视会自动重启...

    长虹智能电视强制刷机数据 Q1C、Q1R、Q1N、Q1S系列 ZLM50HiS机芯 整机USB升级文件 V1.00025

    Q1C、Q1R、Q1N、Q1S系列 软件升级方法及步骤 第1步,压缩包解压,将pkg、zip升级程序拷贝到U盘根目录 第2步,在关机情况下,将U盘插入USB 接口。 第3步,开机,自动进入升级模式。 第4步,升级完成后电视会自动重启...

    HCFA禾川Q1系列PAC CPU单元说明书V4.0.rar

    禾川自动化技术有限公司推出的HCFA Q1系列PAC(Programmable Automation Controller)是面向工业自动化领域的一款高性能控制器。PAC作为综合了PLC(可编程逻辑控制器)与SCADA(Supervisory Control and Data ...

    DS90UB948Q1

    DS90UB948Q1支持的FPD-Link III接口技术能够在减少互连尺寸和重量的同时简化系统设计,这使得它成为对设计灵活性有高度要求的车载系统设计者的理想选择。通过使用单通道或双通道配置,DS90UB948Q1能够进一步提高设计...

    2019Q1-2020Q1中国二次元游戏用户规模.xls

    2019Q1-2020Q1中国二次元游戏用户规模.xls

    MODIS 13Q1数据下载方法.docx

    13Q1数据产品是MODIS植被指数系列中的一种,主要包含归一化植被差异指数(NDVI)、增强植被指数(EVI)等关键植被参数,这些指数对于农业、森林管理、气候变化研究等领域具有重要意义。 批量下载MODIS 13Q1数据的...

    2022年Q1小家电行业趋势报告.pdf

    2022年Q1小家电行业趋势报告.pdf 2022年Q1小家电行业趋势报告.pdf 2022年Q1小家电行业趋势报告.pdf 2022年Q1小家电行业趋势报告.pdf 2022年Q1小家电行业趋势报告.pdf 2022年Q1小家电行业趋势报告.pdf 2022年Q1小家电...

    七彩虹平板电脑官方工具E708 Q1_SV3.09_CQL_20131126

    一键刷机功能使得即使是技术新手也能轻松完成对设备的操作系统刷新,无需深入了解复杂的刷机流程,大大降低了操作难度。 在提供的压缩包文件名称“PhoenixUSBPro”中,我们可以推测这是用来实现这一功能的软件工具...

    长虹智能电视强制刷机升级固件 Q1F系列 ZLS59Gi机芯 整机USB升级软件 V9.00035

    适配电视机型:55Q1F、58Q1F、32Q1F、43Q1F、50Q1F、40Q1F、49Q1F 软件强制升级方法: 1、下载后解压,找到upgrade_ZLS59Gi_V1.00XXX.bin 、ZLS59Gi_mboot.bin复制到U盘根目录(不要有任何文件夹),将U盘插入USB1...

    科威盛Q1写频软件

    5. 更新升级:软件定期提供更新,以支持新版本的硬件和通信协议,保持设备的最新技术状态。 三、操作流程 1. 安装:下载Q1_V1.02setup.exe安装文件,按照向导步骤完成软件的安装。 2. 连接设备:通过USB或串口线...

    PGA411-Q1中文手册

    PGA411-Q1 器件是一款集成有激励器放大器和升压稳压器电源的旋转变压器数字转换器,能够激励和读取旋转变压器传感器上的正弦角和余弦角。凭借集成的激励器放大器和带保护的升压电源,PGA411-Q1 器件消除了对大多数...

    Q1对讲机写频软件

    首先,安装Q1_V1.12setup.exe,这是Q1对讲机写频软件的安装包。按照提示完成安装后,启动软件。此时,需要将对讲机通过USB数据线连接到电脑,确保电脑识别到对讲机设备。 接下来,软件会自动扫描并识别出对讲机型号...

    Codesys禾川Q1配置SV-X3EB实现单轴控制.zip

    《Codesys禾川Q1配置SV-X3EB伺服电机实现单轴控制详解》 Codesys是一款基于IEC 61131-3标准的编程环境,被广泛应用于工业自动化领域,尤其在PLC(可编程逻辑控制器)编程中表现出色。本教程将详细介绍如何在Codesys...

    天迈Q1手机刷机平台软件

    刷机虽能带来个性化和性能提升,但也存在一定风险,如刷机失败可能导致手机变砖,因此建议只有对技术有一定了解的用户尝试。同时,由于天迈Q1是移动3G定制手机,刷机时需特别注意保持与网络的兼容性,避免因系统更改...

    dp83tg720s-q1参考设计.zip

    该压缩包内包含多个PDF文档,分别对应不同的技术手册和应用笔记,这些文档详细阐述了如何使用TI(德州仪器)的dp83tg720s-q1芯片进行车载以太网的设计与实现。首先,"dp83tc811s-q1.pdf"可能是一个相关的数据手册或...

    AppGrowing:2022年Q1移动广告投放分析.pdf

    AppGrowing:2022年Q1移动广告投放分析.pdf AppGrowing:2022年Q1移动广告投放分析.pdf AppGrowing:2022年Q1移动广告投放分析.pdf AppGrowing:2022年Q1移动广告投放分析.pdf AppGrowing:2022年Q1移动广告投放分析...

    2022年Q1移动互联网行业数据研究报告.pdf

    《2022年Q1移动互联网行业数据研究报告》揭示了第一季度中国移动互联网行业的多项关键数据。这份报告由MoonFox Data发布,旨在分析该季度内移动互联网行业的发展趋势、用户行为变化以及各类型应用的表现。 首先,...

    DRV8703D-Q1芯片调试.docx

    DRV8703D-Q1 芯片调试详解 本文档主要介绍 DRV8703D-Q1 芯片...DRV8703D-Q1 芯片的调试过程需要开发者具备一定的技术基础和经验。通过本文档,开发者可以快速理解和使用 DRV8703D-Q1 芯片,实现直流电机的控制和调试。

    TI-TPS92662A-Q1.pdf

    **TI-TPS92662A-Q1 高亮度LED矩阵管理器** **概述** TPS92662A-Q1是一款专为汽车应用设计的高性能LED矩阵管理器,尤其适用于需要高亮度和精确控制的汽车照明系统,如前照灯、自适应驾驶光束(ADB)或防眩远光灯。...

Global site tag (gtag.js) - Google Analytics