`

Apache之工作模型篇

阅读更多

Apache作为最流行的web服务器,有必要深入一下,现在就开始吧,带着很多疑问来写Apache的系列blog:

首先:

Apache的工作模式,是进程模型还是线程模型或者是线程进程混搭模型?

Apache的工作原理是什么?

Apache的最大并发数是多大,在哪里可以配置?

如何对Apache进行调优?


Apache的工作模型

 

Apache有两种工作模型,一种是基于进程的preforker模型,一种是基于线程和进程混合的Worker模型

 

1.prefork
prefork采用预派生子进程方式,用单独的子进程来处理 不同的请求,进程之间彼此独立。在make编译和make install安装后,使用httpd -l来确定当前使用的MPM是prefork.c。

查看httpd-mpm.conf配置文件,里面包含如下默认的配置段:
<IfModule prefork.c>
StartServers 5
MinSpareServers 5
MaxSpareServers 10
MaxClients 150
MaxRequestsPerChild 0
</IfModule>

prefork 控制进程在最初建立“StartServers”个子进程后,为了满足MinSpareServers设置的需要创建一个进程,等待一秒钟,继续创建两 个,再等待一秒钟,继续创建四个……如此按指数级增加创建的进程数,最多达到每秒32个,直到满足MinSpareServers设置的值为止。这种模式 可以不必在请求到来时再产生新的进程,从而减小了系统开销以增加性能。MaxSpareServers设置了最大的空闲进程数,如果空闲进程数大于这个 值,Apache会自动kill掉一些多余进程。这个值不要设得过大,但如果设的值比MinSpareServers小,Apache会自动把其调整为 MinSpareServers+1。如果站点负载较大,可考虑同时加大MinSpareServers和MaxSpareServers。

MaxRequestsPerChild设置的是每个子进程可处理的请求数。每个子进程在处理了“MaxRequestsPerChild”个请求后将自 动销毁。0意味着无限,即子进程永不销毁。虽然缺省设为0可以使每个子进程处理更多的请求,但如果设成非零值也有两点重要的好处:
1、可防止意外的内存泄 漏。
2、在服务器负载下降的时侯会自动减少子进程数。

因此,可根据服务器的负载来调整这个值。MaxClients是这些指令中最为重要的一个,设定的是 Apache可以同时处理的请求,是对Apache性能影响最大的参数。其缺省值150是远远不够的,如果请求总数已达到这个值(可通过ps -ef|grep http|wc -l来确认),那么后面的请求就要排队,直到某个已处理请求完毕。这就是系统资源还剩下很多而HTTP访问却很慢的主要原因。虽然理论上这个值越大,可以 处理的请求就越多,但Apache默认的限制不能大于256。ServerLimit指令无须重编译Apache就可以加大MaxClients。
<IfModule prefork.c>
ServerLimit 10000
StartServers 5
MinSpareServers 5
MaxSpareServers 10
MaxClients 10000
MaxRequestsPerChild 0
</IfModule>

2.Worker
相对于prefork,worker全新的支持多线程和多进程混合模型的MPM。由于 使用线程来处理,所以可以处理相对海量的请求,而系统资源的开销要小于基于进程的服务器。但是,worker也使用了多进程,每个进程又生成多个线程,以 获得基于进程服务器的稳定性。在configure –with-mpm=worker后,进行make编译、make install安装。在缺省生成的httpd-mpm.conf中有以下默认配置段:
<IfModule worker.c>
StartServers 2
MaxClients 150
MinSpareThreads 25
MaxSpareThreads 75
ThreadsPerChild 25
MaxRequestsPerChild 0
</IfModule>

Worker 由主控制进程生成“StartServers”个子进程,每个子进程中包含固定的ThreadsPerChild线程数,各个线程独立地处理请求。同样, 为了不在请求到来时再生成线程,MinSpareThreads和MaxSpareThreads设置了最少和最多的空闲线程数;而MaxClients 设置了同时连入的clients最大总数。如果现有子进程中的线程总数不能满足负载,控制进程将派生新的子进程。

MinSpareThreads和 MaxSpareThreads的最大缺省值分别是75和250。这两个参数对Apache的性能影响并不大,可以按照实际情况相应调节。 ThreadsPerChild是worker MPM中与性能相关最密切的指令。ThreadsPerChild的最大缺省值是64,如果负载较大,64也是不够的。这时要显式使用 ThreadLimit指令,它的最大缺省值是20000。Worker模式下所能同时处理的请求总数是由子进程总数乘以ThreadsPerChild 值决定的,应该大于等于MaxClients。

如果负载很大,现有的子进程数不能满足时,控制进程会派生新的子进程。默认最大的子进程总数是16,加大时 也需要显式声明ServerLimit(最大值是20000)。需要注意的是,如果显式声明了ServerLimit,那么它乘以 ThreadsPerChild的值必须大于等于MaxClients,而且MaxClients必须是ThreadsPerChild的整数倍,否则 Apache将会自动调节到一个相应值。

<IfModule worker.c>
ServerLimit 25
ThreadLimit 200
StartServers 3
MaxClients 2000
MinSpareThreads 50
MaxSpareThreads 200
ThreadsPerChild 100
MaxRequestsPerChild 0
</IfModule>

3.两种工作模型的性能对比

 

分享到:
评论

相关推荐

    apache架构设计原理剖析

    本篇将深入探讨Apache架构的基础、设计原理,以及与RESTful架构的结合。 一、HTTP基础 HTTP(超文本传输协议)是互联网上应用最为广泛的一种网络协议,它定义了客户端(如浏览器)和服务器之间交换数据的格式和行为...

    Apache源代码全景分析

    本篇将基于《Apache源代码全景分析》一书,对Apache的核心概念、架构设计、工作流程以及关键模块进行详尽解读。 1. **Apache核心概念** - **事件模型**:Apache支持多种事件模型,如预读(Prefork)、多进程(MPM_...

    大数据技术分享 Spark技术讲座 使用Apache Spark生成H2O模型 共20页.pdf

    本篇将重点介绍如何结合Apache Spark与H2O,构建一个高效的数据处理流程,特别是在使用Spark来生成H2O模型的过程中所涉及的关键技术和步骤。 #### 二、H2O与Spark集成:Sparkling Water ##### 1. Sparkling Water...

    Apache体系结构ppt

    本篇将基于提供的"Apache体系结构ppt"来探讨Apache服务器的核心架构和主要组件,以及其在源码层面的一些关键特性。 1. **模块化设计** Apache服务器采用模块化的设计理念,允许用户根据需求自由添加或移除功能模块...

    Apache Poi Excel导出

    这篇博客“Apache Poi Excel导出”可能详细介绍了如何使用Apache POI库来生成Excel文件,特别适用于数据导出或报表生成等场景。 Apache POI API 包含多个关键组件,如HSSF(Horizontally Stored Format)用于处理旧...

    apache的配置及文件详解

    本篇将深入解析Apache的配置及其相关文件,帮助初学者掌握如何安装、配置Apache服务器。 **1. Apache安装** Apache的安装过程因操作系统而异。在Windows上,你可以从Apache官方网站下载预编译的二进制文件,然后...

    apache在windons下利用visual studio 10 进行编译

    本篇文章将详细讲解如何在Windows 7系统下,使用Visual Studio 10对Apache进行编译。 首先,你需要准备以下软件和资源: 1. Apache源代码:这里使用的是httpd-2.2.22版本。 2. Microsoft Visual Studio 2010 (VS10...

    apache模块开发入门级资料

    Apache模块开发是构建高效Web服务器的关键技术之一,它允许开发者根据特定需求定制和扩展Apache的功能。这份入门级资料集合提供了丰富的资源,涵盖了从基础到进阶的多个方面,旨在帮助初学者快速掌握Apache模块开发...

    Apache 2.4帮助文档

    Apache 2.4是世界上最流行的Web服务器软件之一,它的最新版本带来了许多性能改进、安全强化以及功能增强。这篇详尽的文档将深入探讨Apache 2.4的核心特性、配置选项和最佳实践,旨在帮助用户更好地理解和管理他们的...

    Apache Server源代码分析

    Apache服务器是全球最广泛使用的Web服务器之一,以其开源、稳定和可扩展性著称。深入理解Apache服务器的源代码有助于开发者优化性能、定制功能以及排查问题。本篇将围绕"Apache Server源代码分析"这一主题,详细介绍...

    Apache服务器指令大全

    Apache服务器是世界上最流行的Web服务器软件之一,用于提供静态和动态内容。它支持多种操作系统,包括Linux,通过配置文件实现高度可定制性。本篇文章将详细解释Apache服务器的一些基本配置指令,帮助你更好地理解和...

    Apache服务基础

    【Apache服务基础】这篇内容主要介绍了Web服务的基本概念、Apache服务器的安装以及配置等相关知识。 首先,Web服务基于HTTP协议,这是一种应用层协议,用于分布式、协作的信息系统,具有通用性、无状态性和面向对象...

    如何利用 Flink 和深度学习模型实现垃圾图片分类(Apache Flink 极客挑战赛特别场.pdf

    本篇文章将深入探讨如何利用Apache Flink这一强大的流处理框架与深度学习模型来实现垃圾图片的实时分类。 Apache Flink是一个开源的分布式流处理框架,它支持批处理和流处理,提供低延迟、高吞吐量的数据处理能力。...

    apache and tomcat show

    Apache是目前广泛使用的Web服务器之一,它通过一系列的配置文件来实现灵活的功能扩展和调整。最核心的配置文件为`httpd.conf`,文档中给出的部分配置示例如下: 1. **基本设置** - `ServerRoot`:定义Apache服务器...

    Apache Cassandra

    关系型数据库主要不是为了横向扩展(scale out)设计的,而是通过增加单个服务器的资源(例如CPU、RAM、存储等)来提升性能,这种做法称之为纵向扩展(scale up)。然而,单个服务器的资源是有限的,而且成本也会...

    Apache Wicket Cookbook

    - **组件化开发**:Wicket采用组件化的架构模型,允许开发者将用户界面分割成可复用的组件。 - **事件驱动**:框架基于事件处理机制,能够轻松处理用户的输入和其他触发事件。 - **面向对象**:支持面向对象编程范式...

    平台云基石-CoreOS之入门资料篇

    《平台云基石-CoreOS之入门资料篇》是一篇详细介绍如何使用CoreOS结合Docker、Kubernetes和Apache Stratos搭建DevOps PaaS的入门级指导文章。本文中,将对CoreOS平台、Kubernetes集群的搭建、以及Apache Stratos的...

    org.apache.http包

    本篇文章将深入探讨`org.apache.http`包中的关键概念和使用方法,以及它在爬虫开发中的作用。 首先,让我们了解`org.apache.http`包的基本结构。这个包主要包含了以下几个子包: 1. `client`:包含HTTP客户端接口...

    Linux结课论文 ubuntu下 apache mysql php环境的整合

    本篇文章主要介绍了如何在Ubuntu操作系统下配置PHP环境,具体涉及Apache、MySQL和PHP的集成,也就是我们常说的LAMP(Linux + Apache + MySQL + PHP)环境。首先,我们需要在Ubuntu上安装Apache服务器,通过运行`sudo...

    TeraByte Sort on Apache Hadoop

    《TeraByte Sort on Apache Hadoop》是由Yahoo公司的Owen O’Malley撰写的一篇关于Hadoop基准测试方法的论文,该论文详细介绍了一种用于Hadoop平台的大规模数据排序算法——TeraByte Sort。这一基准测试方法因其高效...

Global site tag (gtag.js) - Google Analytics