`
pan_java
  • 浏览: 286155 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
阅读更多
这个是前面程序员约稿的时候写的,咱们博客上这篇是从标题到内容是原装未删改版。

开源软件的历史,我们可以追溯到上个世纪的八十年代。在 1983 年 9 月 27 日,麻省理工学院人工智能实验室(MIT Artificial Intelligence Lab)的 Richard M. Stallman在 net.unix-wizards 以及 net.usoft 的 newsgroups 上贴了一份标题为 “new UNIX implementation” 的讯息。这就是如今广为人知的 GNU 计划的开始。在那则被视为「GNU 宣言」草稿的讯息中,Richard M. Stallman 阐述个人的理念与计划的目的-完成一个命名为 GNU 的 “Free UNIX” 操作系统,希望藉此寻找理念相同者共襄盛举。从第一个Emacs开始到如今,已经过去了二十多年,现在已经有大量的开源软件可以供我们选择使用,从必须的操作系统到应用服务器软件,从中间件到日常办公软件,从数据库系统到我们的图片处理、视频音频播放等等。可以说我们在日常的生活,不论是娱乐,办公,还是构建企业级应用,都可以完全的采用开源的软件。

淘宝网,是一个在线商品数量突破一亿,日均成交额超过两亿元人民币,注册用户接近八千万的大型电子商务网站,是亚洲最大的购物网站。那么对于淘宝网这样大规模的一个网站,我猜想大家一定会非常关心整个网站都采用了什么样的技术、产品和架构,也会很想了解在淘宝网中是否采用了开源的软件或者是完全采用的商业软件。那么下面我就简单的介绍一下淘宝网中应用的开源软件。

一个很小规模的网站,比如说一个企业内部的OA系统,我们只需要架设一台服务器,然后在这台服务器上安装Web服务器,应用服务器,数据库,最后将业务应用部署在这个服务器上,就可以开始工作了。但是对于规模稍大的网站来说,就必须是一个服务器集群来提供网站服务,数据库也必然要和应用服务分开,有单独的数据库服务器。那么对于像淘宝网这样规模的网站,不仅仅是数据库和应用分开服务器部署,就是应用也是分成了很多组,并不是所有应用都绑在一起的。那么下面,我就从应用服务器操作系统、应用服务器软件、WebServer、数据库、开发框架等几个方面来介绍一下淘宝网中开源软件的应用。

我们首先就从应用服务器的操作系统说起。一个应用服务器,从软件的角度来说他的最底层首先是操作系统。要先选择操作系统,然后才是操作系统基础上的应用软件。在淘宝网,我们的应用服务器上采用的是Linux操作系统。Linux操作系统从1991年第一次正式被公布到现在已经走过了十七个年头,在PC Server上有广泛的应用。硬件上我们选择PC Server而不是小型机,那么Server的操作系统供我们选择的一般也就是Linux,FreeBSD, windows 2000 Server或者Windows Server 2003。如果不准备采用微软的一系列产品构建应用,并且有能力维护Linux或者FreeBSD,再加上成本的考虑,那么还是应该在Linux和FreeBSD之间进行选择。可以说,现在Linux和FreeBSD这两个系统难分伯仲,很难说哪个一定比另外一个要优秀很多、能够全面的超越对手,应该是各有所长。那么在选择的时候有一个因素就是企业的技术人员对于哪种系统更加的熟悉,这个熟悉一方面是系统管理方面,另外一方面是对于内核的熟悉,对内核的熟悉对于性能调优和对操作系统进行定制剪裁会有很大的帮助。而应用全面的优化、提升性能也是从操作系统的优化开始的。

在确定了服务器的硬件、服务器的操作系统之后,下面我们来说说业务系统的构建。淘宝网有很多业务系统应用是基于JEE规范的系统。还有一些是C C++构建的应用或者是Java构建的Standalone的应用。那么我们要选择一款实现了JEE规范的应用服务器。我们的选择是JBoss Applcation Server。JBoss AS是RedHat的一个开源的支持JEE规范的应用服务器。在几年前,如果采用Java技术构建互联网应用或者企业级应用,在开源软件中的选择一般也就是Apache组织的Tomcat、JBoss的 JBoss AS和Resin。严格意义上讲,Tomcat和Resin并不能算是一个应用服务器,他们是实现了部分J2EE规范的一个容器。而商业软件的选择就是IBM的WebSphere和BEA的WebLogic。到了现在,除了JBoss AS外,Apache的Geronimo,Sun的Glassfish也都是很优秀的JEE应用服务器。也给现在的开发人员提供了更多的选择。具体对于目前JEE应用服务器的比较。这边就不在赘述。

在应用服务器前端,我们采用了WebServer做了一次转发,我们选择的Web服务器是大名鼎鼎的Apache。几年前,Apache几乎是Linux系统上开源WebServer的唯一选择。那个时候虽然也有一些其他的开源的WebServer,但是从功能和稳定性上来说都无法和Apache相对。在今天来说,Lighty也会是一个非常好的选择。Lighty是一个非常轻量级、占用内存资源也比较少的WebServer。虽然功能上没有Apache强大,但是在不少场景下,性能是非常出色、强于Apache的。而微软的IIS,就只能工作在Windows的系统上了。并且使用IIS的话,基本上也就是选择了ISAPI、ASP或者ASP.net进行Web应用的开发了。

说完了我们采用的操作系统、应用服务器、WebServer后,下面就来谈谈我们的数据库。在淘宝网的应用中,采用了两种关系型数据库管理系统。一个是Oracle公司的Oracle 10g,另外一个是Sun Mysql的Mysql。Oracle是一款优秀的、广泛采用的商业数据库管理软件。有很强大的功能和安全性,可以处理相对海量的数据(这里提到相对海量的意思是,相对于大型互联网企业、大型互联网应用所产生的海量数据,Oracle还是有些力不从心)。而Mysql是一款非常优秀的开源数据库管理软件,非常适合用多台PC Server组成多点的存储节点阵列(这里我所指的不是Mysql自身提供的集群功能),每单位的数据存储成本也非常的低廉。用多台PC Server安装Mysql组成一个存储节点阵列,通过Mysql自身的Replication或者应用自身的处理,可以很好的保证容错(允许部分节点失效),保证应用的健壮性和可靠性。可以这么说,在关系数据库管理系统的选择上,可以考虑应用本身的情况来决定。

一个互联网应用,除了服务器的操作系统,WebServer软件,应用服务器软件,数据库软件外,我们还会涉及到一些其他的系统,比如一些中间件系统、文件存储系统、搜索、分布式框架、缓存系统等等。在淘宝网,这些系统都是自主开发的,没有采用目前商业的或者开源的产品。有些系统,会存在着一些开源的产品或者商业产品。但是,考虑到淘宝网自己的需求和大并发量的压力,这些系统都选择了自主开发。

前面谈的都是系统级的产品,下面我们说说开发框架的使用。可能有朋友想问,作为一个如此大规模的网站,淘宝网的Web展现层采用的是什么框架,是怎么实现的呢?曾经也有到淘宝的应聘者问过我这个问题,他问我说是不是用的struts。我告诉他说不是的。其实淘宝网的Web展现层的框架用的不是struts,不是webwork,不是spring mvc等等。淘宝网的Web展现层的框架用的是集团内部自主开发的一套Web框架。这个框架能够解决一些其他Web框架不能解决的、在淘宝的应用中又会出现并需要解决的问题。在淘宝的多个应用中,也采用了一些开源的框架,比如Spring、iBatis、jBpm、Hessian、Mina等等。这些开源软件的采用为我们构建应用系统提供了很大的帮助。

采用开源软件构建系统,我想有两个很大的好处:

一个是降低成本。假设你有1000台应用服务器,如果你每台服务器上采用的不是JBoss AS或者其他开源的软件,而是使用商业的Oracle BEA的Weblogic或者IBM的WebSphere,那么为这1000台机器的应用购买License的费用是非常高的。

另外一个好处(我觉得最大的好处)是你可以看到软件的源码,你可以研究了解软件内部的工作过程、原理。这对于应用设计、开发、查错、优化都是非常有帮助的。你面对的不在是一个黑盒子,不再是商业软件的市场人员告诉你的商业软件能够提供的一二三四这样的功能。你可以清楚的了解到内部到底是怎么运作的,到底在运行的时候发生了什么事情,你可以很清楚的知道有什么问题。这一点是非常重要的。

对于开源软件的应用,有些人可能担心质量的问题,有些人可能担心软件本身发展更新的问题,等等。对于质量的问题,我想现在很多的开源软件尤其是一些很著名的开源软件都有很完善的组织,有完善的开发、测试、发布流程。在一个新版本完成前,会有多次的测试版本发布,最后才是正式版。这和商业软件是一样的。并且因为代码公开,反而更加的容易发现错误,提高质量。至于第二个问题,我想跟第一个问题一样,关键是组织和规划而不在是否开源,并且在很多著名的开源软件背后,会有厂商在进行支持。软件本身的发展应该是不会成为问题的,不太会出现软件突然停止发展的情况。

在今后的发展中,我们还是会一如既往的关注开源软件的发展,也还会根据需要采用不同的开源软件。在选择一个开源产品的时候,我会考虑以下几点:

1.         这个软件目前的功能和它的RoadMap

2.         软件本身的架构

3.         该软件开发的活跃度

4.         该开源软件是否是遵守该领域内的国际规范的

5.         在同类产品中,要挑选有比较优势的。并且要考虑可能存在的移植代价。这个移植指的是采用了这款开源软件后现有系统的移植,或者是从这个开源软件到其他软件的移植

开源软件发展到今天,已经非常的活跃和普及。开源软件的使用率也在逐步的提高。不论是大型的网站、还是企业级的应用、或者是小型规模的系统、甚至是自己的桌面应用,都可以全部的或者部分的采用开源软件来构建。对于企业级系统、互联网应用来说,采用开源软件不仅可以降低成本,更重要的是能够真正了解软件的内部工作机制。还可以在现在的基础上进行增强和定制,也能够从开源软件中借鉴到很多好的设计和实现。最后,也希望国内能有更多的企业在使用开源软件的同时,也能开源自身的一些软件,或者能够成为一些开源软件的贡献者。而作为淘宝网,我们也会非常积极的参与到开源的活动中,也会努力为开源的发展做出我们应有的贡献
分享到:
评论

相关推荐

    淘宝之开源之路

    本文将以淘宝为例,探讨开源软件在电子商务领域的应用及其带来的好处。 #### 走上开源道路 首先,我们来看看为什么像淘宝这样的电商平台会选择开源的道路。在早期,淘宝作为一个初创公司,在资源有限的情况下,...

    解密淘宝网的开源架构

    淘宝网,作为亚洲最大的购物平台,其背后的技术架构和开源软件的应用是许多IT专业人士关注的焦点。本文将深入探讨淘宝网在操作系统、应用服务器、Web服务器、数据库等方面的开源选择。 首先,淘宝网选择了Linux作为...

    解密淘宝网的开源架构.pdf

    本文将重点解析淘宝网在操作系统、应用服务器、Web Server及数据库等方面采用的开源软件。 首先,淘宝网选择的是Linux操作系统作为应用服务器的基础。Linux自1991年发布以来,已在PC Server领域广泛应用,具有良好...

    企业应用:解密淘宝网的开源架构

    在Linux与FreeBSD之间,淘宝网选择了前者,这基于其技术人员对Linux的熟悉度以及对系统优化的需求,因为深入理解内核有助于提升系统性能。 在业务系统构建方面,淘宝网采用JEE(Java Enterprise Edition)规范。其...

    解密淘宝网的开源架构.docx

    淘宝网的开源架构是其成功的关键之一,它利用开源软件构建了一个高效、可扩展的电商平台。以下是关于淘宝网开源架构的详细说明: 1. **操作系统**:淘宝网选择了Linux作为应用服务器的操作系统,主要是因为Linux的...

    C#网店开源软件eshop

    "C#网店开源软件eshop"就是这样一个基于C#开发的开源项目,它旨在提供类似淘宝的购物体验,为开发者和商家提供了自建电商平台的解决方案。 eshop项目的出现,使得开发者能够更深入地理解和学习C#在电商领域的应用,...

    淘宝客系统juanpi7.6开源

    淘宝客是一种通过推广淘宝网商品赚取佣金的网络营销模式,而这个系统则是一个工具,帮助淘宝客更有效地管理和推广商品。 1. **开源软件**:开源意味着源代码对公众开放,允许用户查看、修改和分发代码。这对于...

    java开源包10

    Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司的开源项目。 SwingSet 增强现实标记跟踪软件库 AccuTag AccuTag是AR(增强现实)标记跟踪软件库。它利用GPGPU的快速和...

    阿里巴巴自动登录+私信聊天源码开源+淘宝阿里巴巴营销软件

    7. 淘宝阿里巴巴营销软件:这个工具可能包含了针对淘宝和阿里巴巴平台的营销策略,例如批量发送促销信息、自动回复客户咨询等。这需要对电商平台的API接口有深入理解,能够遵守平台的使用规则,并进行有效率的数据...

    java开源包6

    Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司的开源项目。 SwingSet 增强现实标记跟踪软件库 AccuTag AccuTag是AR(增强现实)标记跟踪软件库。它利用GPGPU的快速和...

    51CTO下载-淘宝网Nginx定制与开发实战

    - **内核修改与开源**:2011年,淘宝网进一步深入,开始修改Nginx内核,并启动了Tengine项目,将其开源,以贡献于社区,同时优化自身的技术栈。 #### 收益分析 通过定制和深度使用Nginx,淘宝网在业务稳定性和性能...

    基于PHP的狼群淘宝客 php开源淘宝客程序源码.zip

    3. **开源软件**:开源意味着源代码对公众开放,任何人都可以查看、使用、修改和分发代码。开源淘宝客程序允许开发者根据自己的需求定制功能,增强安全性和效率,同时社区的协作也能够推动程序的持续改进和更新。 4...

    java开源包9

    Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司的开源项目。 SwingSet 增强现实标记跟踪软件库 AccuTag AccuTag是AR(增强现实)标记跟踪软件库。它利用GPGPU的快速和...

    淘宝网网站架构详解(电子商务网站)

    本文将深入探讨淘宝网的技术架构,特别是其在开源软件方面的应用。 #### 二、概述 淘宝网不仅是一个简单的购物平台,更是一个集合了多种复杂业务和技术挑战的大规模电子商务网站。面对如此巨大的用户量和交易额,...

    淘宝开源客户端

    开源软件意味着源代码对公众开放,任何人都可以查看、使用、修改和分发这些代码,遵循特定的开源许可协议。在这个案例中,淘宝开源客户端可能采用了如MIT、Apache或GPL等开源许可,鼓励社区协作和创新。 关于淘宝...

    与淘宝网店互通插件源码

    标题中的“与淘宝网店互通插件源码”指的是一个能够实现第三方电商平台,如echsop网站,与淘宝网店数据交互的软件组件。这种插件的主要功能是帮助商家在不同的平台上同步管理商品信息、订单状态、库存等关键数据,...

Global site tag (gtag.js) - Google Analytics