`
zy77612
  • 浏览: 285512 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

也谈如何架构一个"马马虎虎"的网站?

阅读更多

所谓“Just so so”,翻译成中文大致是“马马虎虎,还算凑合”的意思。所以,如果你想搞一个新浪,搜狐之类的门户的话,估计这篇文章对你没有太大用处,但是就像80/20原则所叙述的一样,大多数站点其实都是“Just so so”的规模而已。

那么如何架构一个“Just so so”的网站呢?IMO(在我看来:In My Opinions),可以粗略的分为硬架构和软架构,这个分类是我一拍脑袋杜撰出来的,所以有考证癖的网友们也不用去搜索引擎查找相关资料了。简单解释一下:所谓硬架构主要是说网站的运行方式和环境等。所谓软架构主要是说在代码层次上如何实现功能等。下面就分别看看How to do。

一:硬架构

 

1:机房的选择:

在选择机房的时候,根据网站用户的地域分布,可以选择网通或电信机房,但更多时候,可能双线机房才是合适的。越大的城市,机房价格越贵,从成本的角度看可以在一些中小城市托管服务器,比如说北京的公司可以考虑把服务器托管在天津,廊坊等地,不是特别远,但是价格会便宜很多。

2:带宽的大小:

通常老板花钱请我们架构网站的时候,会给我们提出一些目标,诸如网站每天要能承受100万PV的访问量等等。这时我们要预算一下大概需要多大的带宽,计算带宽大小主要涉及两个指标(峰值流量和页面大小),我们不妨在计算前先做出必要的假设:

第一:假设峰值流量是平均流量的5倍。
第二:假设每次访问平均的页面大小是100K字节左右。

如果100万PV的访问量在一天内平均分布的话,折合到每秒大约12次访问,如果按平均每次访问页面的大小是100K字节左右计算的话,这12次访问总计大约就是1200K字节,字节的单位是Byte,而带宽的单位是bit,它们之间的关系是1Byte = 8bit,所以1200K Byte大致就相当于9600K bit,也就是9Mbps的样子,实际情况中,我们的网站必须能在峰值流量时保持正常访问,所以按照假设的峰值流量算,真实带宽的需求应该在45Mbps左右。

当然,这个结论是建立在前面提到的两点假设的基础上,如果你的实际情况和这两点假设有出入,那么结果也会有差别。

另一个需要注意的是,这个计算中没有考虑浏览器缓存的影响,所以算出来的是带宽最大值。

 

3:服务器的划分:

先看我们都需要哪些服务器:图片服务器,页面服务器,数据库服务器,应用服务器,日志服务器等等。

对于访问量大点的网站而言,分离单独的图片服务器和页面服务器相当必要,我们可以用lighttpd来跑图片服务器,用apache来跑页面服务器,当然也可以选择别的,甚至,我们可以扩展成很多台图片服务器和很多台页面服务器,并设置相关域名,如img.domain.com和www.domain.com,页面里的图片路径都使用绝对路径,如<img src="http://img.domain.com/abc.gif" />,然后设置DNS轮循,达到最初级的负载均衡。当然,服务器多了就不可避免的涉及一个同步的问题,这个可以使用rsync软件来搞定。

数据库服务器是重中之重,因为网站的瓶颈问题十有八九是出在数据库身上。现在一般的中小网站多使用MySQL数据库,不过它的集群功能似乎还没有达到stable的阶段,所以这里不做评价。一般而言,使用MySQL数据库的时候,我们应该搞一个主从(一主多从)结构,主数据库服务器使用innodb表结构,从数据服务器使用myisam表结构,充分发挥它们各自的优势,而且这样的主从结构分离了读写操作,降低了读操作的压力,甚至我们还可以设定一个专门的从服务器做备份服务器,方便备份。不然如果你只有一台主服务器,在大数据量的情况下,mysqldump基本就没戏了,直接拷贝数据文件的话,还得先停止数据库服务再拷贝,否则备份文件会出错。但对于很多网站而言,即使数据库服务仅停止了一秒也是不可接受的。如果你有了一台从数据库服务器,在备份数据的时候,可以先停止服务(slave stop)再备份,再启动服务(slave start)后从服务器会自动从主服务器同步数据,一切都没有影响。但是主从结构也是有致命缺点的,那就是主从结构只是降低了读操作的压力,却不能降低写操作的压力。为了适应更大的规模,可能只剩下最后这招了:横向/纵向分割数据库。所谓横向分割数据库,就是把不同的表保存到不同的数据库服务器上,比如说用户表保存在A数据库服务器上,文章表保存在B数据库服务器上,当然这样的分割是有代价的,最基本的就是你没法进行LEFT JOIN之类的操作了。所谓纵向分割数据库,一般是指按照用户标识(user_id)等来划分数据存储的服务器,比如说:我们有5台数据库服务器,那么“user_id % 5 + 1”等于1的就保存到1号服务器,等于2的就保存到2号服务器,以此类推,纵向分隔的原则有很多种,可以视情况选择。不过和横向分割数据库一样,纵向分割数据库也是有代价的,最基本的就是我们在进行如COUNT, SUM等汇总操作的时候会麻烦很多。综上所述,数据库服务器的解决方案一般视情况往往是一个混合的方案,以其发挥各种方案的优势,有时候还需要借助memcached之类的第三方软件,以便适应更大访问量的要求。

如果有专门的应用服务器来跑PHP脚本是最合适不过的了,那样我们的页面服务器只保存静态页面就可以了,可以给应用服务器设置一些诸如app.domain.com之类的域名来和页面服务器加以区别。对于应用服务器,我还是更倾向于使用prefork模式的apache,配上必要的xcache之类的PHP缓存软件,加载模块要越少越好,除了mod_rewrite等必要的模块,不必要的东西统统舍弃,尽量减少httpd进程的内存消耗,而那些图片服务器,页面服务器等静态内容就可以使用lighttpd或者tux来搞,充分发挥各种服务器的特点。

如果条件允许,独立的日志服务器也是必要的,一般小网站的做法都是把页面服务器和日志服务器合二为一了,在凌晨访问量不大的时候cron运行前一天的日志计算,不过如果你使用awstats之类的日志分析软件,对于百万级访问量而言,即使按天归档,也会消耗很多时间和服务器资源去计算,所以分离单独的日志服务器还是有好处的,这样不会影响正式服务器的工作状态。

二:软架构

1:框架的选择:

现在的PHP框架有很多选择,比如:CakePHP,Symfony,Zend Framework等等,至于应该使用哪一个并没有唯一的答案,要根据Team里团队成员对各个框架的了解程度而定。很多时候,即使没有使用框架,一样能写出好的程序来,比如Flickr据说就是用Pear+Smarty这样的类库写出来的,所以,是否用框架,用什么框架,一般不是最重要的,重要的是我们的编程思想里要有框架的意识。

2:逻辑的分层:

网站规模到了一定的程度之后,代码里各种逻辑纠缠在一起,会给维护和扩展带来巨大的障碍,这时我们的解决方式其实很简单,那就是重构,将逻辑进行分层。通常,自上而下可以分为表现层,应用层,领域层,持久层。

所谓表现层,并不仅仅就指模板,它的范围要更广一些,所有和表现相关的逻辑都应该被纳入表现层的范畴。比如说某处的字体要显示为红色,某处的开头要空两格,这些都属于表现层。很多时候,我们容易犯的错误就是把本属于表现层的逻辑放到了其他层面去完成,这里说一个很常见的例子:我们在列表页显示文章标题的时候,都会设定一个最大字数,一旦标题长度超过了这个限制,就截断,并在后面显示“..”,这就是最典型的表现层逻辑,但是实际情况,有很多程序员都是在非表现层代码里完成数据的获取和截断,然后赋值给表现层模板,这样的代码最直接的缺点就是同样一段数据,在这个页面我可能想显示前10个字,再另一个页面我可能想显示前15个字,而一旦我们在程序里固化了这个字数,也就丧失了可移植性。正确的做法是应该做一个视图助手之类的程序来专门处理此类逻辑,比如说:Smarty里的truncate就属于这样的视图助手(不过它那个实现不适合中文)。

所谓应用层,它的主要作用是定义用户可以做什么,并把操作结果反馈给表现层。至于如何做,通常不是它的职责范围(而是领域层的职责范围),它会通过委派把如何做的工作交给领域层去处理。在使用MVC架构的网站中,我们可以看到类似下面这样的URL:domain.com/articles/view/123,其内部编码实现,一般就是一个Articles控制器类,里面有一个view方法,这就是一个典型的应用层操作,因为它定义了用户可以做一个查看的动作。在MVC架构中,有一个准则是这么说的:Rich Model Is Good。言外之意,就是Controller要保持“瘦”一些比较好,进而说明应用层要尽量简单,不要包括涉及领域内容的逻辑。

所谓领域层,最直接的解释就是包含领域逻辑的层。它是一个软件的灵魂所在。先来看看什么叫领域逻辑,简单的说,具有明确的领域概念的逻辑就是领域逻辑,比如我们在ATM机上取钱,过程大致是这样的:插入银联卡,输入密码,输入取款金额,确定,拿钱,然后ATM吐出一个交易凭条。在这个过程中,银联卡在ATM机器里完成钱从帐户上划拨的过程就是一个领域逻辑,因为取钱在银行中是一个明确的领域概念,而ATM机吐出一个交易凭条则不是领域逻辑,而仅是一个应用逻辑,因为吐出交易凭条并不是银行中一个明确的领域概念,只是一种技术手段,对应的,我们取钱后不吐交易凭条,而发送一条提醒短信也是可能的,但并不是一定如此,如果在实际情况中,我们要求取款后必须吐出交易凭条,也就是说吐出交易凭条已经和取款紧密结合,那么你也可以把吐出交易凭条看作是领域逻辑的一部分,一切都以问题的具体情况而定。在Eric那本经典的领域驱动设计中,把领域层分为了五种基本元素:实体,值对象,服务,工厂,仓储。具体可以参阅书中的介绍。领域层最常犯的错误就是把本应属于领域层的逻辑泄露到了其他层次,比如说在一个CMS系统,对热门文章的定义是这样的:每天被浏览的次数多于1000次,被评论的次数多于100次,这样的文章就是热门文章。对于一个CMS来说,热门文章这个词无疑是一个重要的领域概念,那么我们如何实现这个逻辑的设计的?你可能会给出类似下面的代码:“SELECT ... FROM ... WHERE 浏览 > 1000 AND 评论 > 100”,没错,这是最简单的实现方式,但是这里需要注意的是“每天被浏览的次数多于1000次,被评论的次数多于100次”这个重要的领域逻辑被隐藏到了SQL语句中,SQL语句显然不属于领域层的范畴,也就是说,我们的领域逻辑泄露了。

所谓持久层,就是指把我们的领域模型保存到数据库中。因为我们的程序代码是面向对象风格的,而数据库一般是关系型的数据库,所以我们需要把领域模型碾平,才能保存到数据库中,但是在PHP里,直到目前还没有非常好的ORM出现,所以这方面的解决方案不是特别多,参考Martin的企业应用架构模式一书,大致可以使用的方法有行数据入口(Row Data Gateway)或者表数据入口(Table Data Gateway),或者把领域层和持久层合二为一变成活动记录(Active Record)的方式。

原文:http://hi.baidu.com/thinkinginlamp/blog/item/6f969f3d44556d02baa167b9.html

http://hi.baidu.com/%C4%E0%F6%FA/blog/item/0438ad4b7e7800f382025c8e.html

分享到:
评论

相关推荐

    马马虎虎&nbsp;

    【标题】:“马马虎虎”可能是指在网页加载或者数据...通过分析上述信息,我们可以了解到“马马虎虎”是一个关于网页下载过程中视觉反馈的设计案例,它涉及到了用户体验设计、动画制作、交互反馈等多个IT领域的知识。

    微信小程序-马马虎虎的计算器

    本项目“微信小程序-马马虎虎的计算器”是一个适合初学者入门的实践案例,旨在帮助开发者掌握微信小程序的基本开发流程和核心技术。 首先,我们需要了解微信小程序的开发环境。开发微信小程序需要安装微信开发者...

    仿mediaPlayer小的样子,马马虎虎

    简单的模仿的播放器界面ui实现的,不是用什么图片控件来实现的

    如何建立营销性企业网站.docx

    我们已经了解了网站的诉求风格,随之,您要了解的是建立网站的目的:建立一个行之有效的营销性的网站决不能马马虎虎,草率行事,随便准备点资料,找一些象征性的图片,一揽子塞给专业公司,过个不长时间网站就 OK 了...

    虎虎oa办公 v3.0.9

    软件介绍:虎虎云办公OA软件,企业移动化办公的解决方案移动社交 全新方式低成本 高效益随时随地 协同办公云端存储 安全无忧包含了审批、任务、协同办公、考勤等众多功能手机端 电脑端实时操作,真正的移动化办公...

    小猫虎虎.pdf

    小猫虎虎.pdf

    [虎虎vr] leap适配htc vive定位插件 v1.0

    【标题】"虎虎VR Leap适配HTC Vive定位插件 v1.0"是一个针对虚拟现实(VR)体验的专业工具,旨在为那些没有HTC Vive设备但希望享受其游戏内容的用户带来便利。这款插件是专为Leap Motion控制器设计的,允许用户通过...

    Jquery EasyUI的基础权限管理

    一直想做一个基础权限管理的框架可以方便的用在管理系统里面,不需要太复杂,只要有基础的功能即可,平时比较懒,就一直从去年拖到了现在,好在马马虎虎的算是做完基本功能了,至于代码方面嘛,还有很多不尽人意的...

    VB仿彩票第六感自动随机选号器.rar

     说明,模仿《彩票第六感》,一个马马虎虎的彩票选号程序,比较小,程序应该有存在Bug。  两种实现筛选号码的方法:  1 . 生成随机数,看选中的次数最多的"个数"数字放到"选定号码里"  2 . 生成随机数,看选中...

    图片文字及各种文档文字识别提取

    标签“马马虎虎”可能暗示了OCR软件的识别准确率或用户体验可能并非完美无瑕,但仍有实用价值。用户在使用过程中可能会遇到一些小问题,需要一定的耐心和技巧来优化结果。 压缩包中的文件名提供了关于该软件的一些...

    C++代码小练习

    C++的小练习,马马虎虎能看,可以运行通过,可以交作业

    部编版二年级语文上册词语积累

    2018部编版二年级上册词语积累 二年级词语积累1 AABB式 马马虎虎? ?吞吞吐吐 密密麻麻 开开心心 日日夜夜 仔仔细细? ? 风风雨雨 风风火火 堂堂正正 隐隐约约 迷迷糊糊 清清楚楚 原原本

    web framwork

    "马马虎虎的小框架"可能指的是一个相对较小且不太知名的Web框架,尽管它的年龄较大,但仍然具有一定的可用性。 在Web开发中,框架扮演着核心角色,它们通常包含以下关键组件: 1. **路由系统**:路由是将URL映射到...

    C++小练习代码

    C++的小练习,马马虎虎,用来练手,可以用于作业参考

    软件开发实习总结.pdf

    作为一个程序员,对需求的理解能力也是很重要的,只有真正理解了一个模块的作用,才会写出高效率的代码,才能使整个软件项目作出来更加优秀,具备更好的安全性和稳定性。 单元测试对于一个程序员来说是不可不做的一...

    七年级下册《马》综合练习精选.doc

    4. 关联词的使用:题中给出了一个关联词填空,让学生理解并选择合适的关联词语,如“虽然...因为...并且...却”。 5. 文章主题理解和分析:整体感悟部分要求学生概括文章《马》的主题,以及找出表现两种马特点的...

    贪吃蛇,DE2-115,FPGA,0.96OLED

    这个作业没花多长时间,把每个格子看作状态机,所以代码比较冗长,一开始就是抱着试一试的态度,最后马马虎虎能用了 https://www.bilibili.com/video/BV1hF411i7LY?spm_id_from=333.999.0.0

    VB模拟QQ魔法表情处理Flash文件背景透明

    内容索引:VB源码,图形处理,魔法表情,仿QQ,背景透明 主要是对QQ的透明动态图标的生成方法很好奇,因为QQ聊天所带的...不过要用到qqTrans.dll这个控件,写出的这个程序也算是对这个控件的使用作一个展示,效果马马虎虎。

    非常实用的后台管理模板 4个

    其中,“有1个非常好,其他的马马虎虎”暗示这些模板质量不一,一个特别优秀,其余的虽然可能不如最佳的那个,但仍然具备一定的可用性。最后的“呵呵,希望大家喜欢”表达了分享者对接收者的友好期望,希望这些模板...

Global site tag (gtag.js) - Google Analytics