`

深入解析PHP中的(伪)多线程与多进程

    博客分类:
  • php
 
阅读更多
原文地址:http://www.jb51.net/article/39347.htm


(伪)多线程:借助外力
利用WEB服务器本身的多线程来处理,从WEB服务器多次调用我们需要实现多线程的程序。
QUOTE:
我们知道PHP本身是不支持多线程的, 但是我们的WEB服务器是支持多线程的.
也就是说可以同时让多人一起访问. 这也是我在PHP中实现多线程的基础.
假设我们现在运行的是a.php这个文件. 但是我在程序中又请求WEB服务器运行另一个b.php
那么这两个文件将是同时执行的.
(PS: 一个链接请求发送之后, WEB服务器就会执行它, 而不管客户端是否已经退出)
有些时候, 我们想运行的不是另一个文件, 而是本文件中的一部分代码.该怎么办呢?
其实可是通过参数来控制a.php来运行哪一段程序.
下面看一个例子:
复制代码 代码如下:

<?php
function runThread(){
    $fp = fsockopen('localhost', 80, $errno, $errmsg);
    fputs($fp, "GET /a.php?act=brnrn");//这里的第二个参数是HTTP协议中规定的请求头,不明白的请看RFC中的定义                            
    fclose($fp);
}
function a(){
    $fp = fopen('result_a.log', 'w');
    fputs($fp, 'Set in ' . Date('h:i:s', time()) . (double)microtime() . "rn");
    fclose($fp);       
}
function b(){
    $fp = fopen('result_b.log', 'w');
    fputs($fp, 'Set in ' . Date('h:i:s', time()) . (double)microtime() . "rn");
    fclose($fp);       
}
if(!isset($_GET['act'])){ $_GET['act'] = 'a';};
if($_GET['act'] == 'a'){
    runThread();
    a();
}else if($_GET['act'] == 'b'){
    b();
};
?>

打开result_a.log 和 result_b.log 比较一下两个文件的中访问的时间. 大家会发现, 这两个的确是在不同线程中运行的.有些时间完全一样.
上面只是一个简单的例子, 大家可以改进成其它形式.
既然PHP中也能多线程了, 那么问题也来了, 那就是同步的问题. 我们知道 PHP本身是不支持多线程的. 所以更不会有什么像Java 中synchronize的方法了. 那我们该如何做呢.
1. 尽量不访问同一个资源. 以避免冲突. 但是可以同时像数据库操作. 因为数据库是支持并发操作的. 所以在多线程的PHP中
不要向同一个文件中写入数据. 如果必须要写的话, 用别的方法进行同步.. 如调用 flock对文件进行加锁等. 或建立临时文件并在另外的线程中等待这个文件的消失 while(file_exits('xxx')); 这样就等于这个临时文件存在时, 表示其实线程正在操作,如果没有了这个文件, 说明其它线程已经释放了这个.
2. 尽量不要从runThread在执行fputs后取这个socket中读取数据. 因为要实现多线程, 需要的用非阻塞模式. 即在像fgets这样的函数时立即返回.. 所以读写数据就会出问题. 如果使用阻塞模式的话, 程序就不算是多线程了. 他要等上面的返回才执行下面的程序. 所以如果需要交换数据最后利用外面文件或数据中完成. 实在想要的话就用socket_set_nonblock($fp) 来实现.

说了这么多, 倒底这个有没有实际的意义呢? 在什么时候需要这种用这种方法呢 ?
答案是肯定的. 大家知道. 在一个不断读取网络资源的应用中, 网络的速度是瓶颈. 如果采多这种形式就可以同时以多个线程对不同的页面进行读取.

本人做的一个能从8848、soaso这些商城网站搜索信息的程序。还有一个从阿里巴巴网站上读取商业信息和公司目录的程序也用到了此技术。 因为这两个程序都是要不断的链接它们的服务器读取信息并保存到数据库。 利用此技术正好消除了在等待响应时的瓶颈。
多进程:使用PHP的Process Control Functions(PCNTL/线程控制函数)
只能用在Unix Like OS,Windows不可用。
编译php的时候,需要加上--enable-pcntl,且推荐仅仅在CLI模式运行,不要在WEB服务器环境运行。
以下为简短的测试代码:
复制代码 代码如下:

declare(ticks=1);
$bWaitFlag = FALSE; /// 是否等待进程结束
$intNum = 10;           /// 进程总数
$pids = array();        ///  进程PID数组
echo ("Start\n");
for($i = 0; $i < $intNum; $i++) {
  $pids[$i] = pcntl_fork();/// 产生子进程,而且从当前行之下开试运行代码,而且不继承父进程的数据信息
  if(!$pids[$i]) {
    // 子进程进程代码段_Start
    $str="";
    sleep(5+$i);
    for ($j=0;$j<$i;$j++) {$str.="*";}
    echo "$i -> " . time() . " $str \n";
    exit();
    // 子进程进程代码段_End
  }
}
if ($bWaitFlag)
{
  for($i = 0; $i < $intNum; $i++) {
    pcntl_waitpid($pids[$i], $status, WUNTRACED);
    echo "wait $i -> " . time() . "\n";
  }
}
echo ("End\n");

运行结果如下:
CODE:[Copy toclipboard][qiao@oicq qiao]$ phptest.php       
Start
End
[qiao@oicq qiao]$ ps -aux | grep "php"
qiao     32275  0.0  0.5 49668 6148pts/1    S    14:03   0:00/usr/local/php4/b
qiao     32276  0.0  0.5 49668 6152pts/1    S    14:03   0:00/usr/local/php4/b
qiao     32277  0.0  0.5 49668 6152pts/1    S    14:03   0:00/usr/local/php4/b
qiao     32278  0.0  0.5 49668 6152pts/1    S    14:03   0:00/usr/local/php4/b
qiao     32279  0.0  0.5 49668 6152pts/1    S    14:03   0:00/usr/local/php4/b
qiao     32280  0.0  0.5 49668 6152pts/1    S    14:03   0:00 /usr/local/php4/b
qiao     32281  0.0  0.5 49668 6152pts/1    S    14:03   0:00/usr/local/php4/b
qiao     32282  0.0  0.5 49668 6152pts/1    S    14:03   0:00/usr/local/php4/b
qiao     32283  0.0  0.5 49668 6152pts/1    S    14:03   0:00/usr/local/php4/b
qiao     32284  0.0  0.5 49668 6152pts/1    S    14:03   0:00/usr/local/php4/b
qiao     32286  0.0  0.0  1620  600pts/1    S    14:03   0:00 grep php
[qiao@oicq qiao]$ 0 -> 1133503401 
1 -> 1133503402 *
2 -> 1133503403 **
3 -> 1133503404 ***
4 -> 1133503405 ****
5 -> 1133503406 *****
6 -> 1133503407 ******
7 -> 1133503408 *******
8 -> 1133503409 ********
9 -> 1133503410 *********
[qiao@oicq qiao]$
如果$bWaitFlag=TURE,则结果如下:
CODE:[Copy toclipboard][qiao@oicq qiao]$ phptest.php       
Start
0 -> 1133503602 
wait 0 -> 1133503602
1 -> 1133503603 *
wait 1 -> 1133503603
2 -> 1133503604 **
wait 2 -> 1133503604
3 -> 1133503605 ***
wait 3 -> 1133503605
4 -> 1133503606 ****
wait 4 -> 1133503606
5 -> 1133503607 *****
wait 5 -> 1133503607
6 -> 1133503608 ******
wait 6 -> 1133503608
7 -> 1133503609 *******
wait 7 -> 1133503609
8 -> 1133503610 ********
wait 8 -> 1133503610
9 -> 1133503611 *********
wait 9 -> 1133503611
End
[qiao@oicq qiao]$
从 多进程的例子可以看出,使用pcntl_fork()之后,将生成一个子进程,而且子进程运行的代码,从pcntl_fork()之后的代码开始,而子进 程不继承父进程的数据信息(实际上是把父进程的数据做了一个全新的拷贝),因而使用if(!$pids[$i]) 来控制子进程实际运行的代码段。
更详细的研究出于时间关系,暂时没有进行,你可以参考我给出的手册的链接。
[文章二] 尝试php命令行脚本多进程并发执行
除了fork, cli下的并发方式还有一种,看我的例子:
php不支持多线程,但是我们可以把问题转换成“多进程”来解决。由于php中的pcntl_fork只有unix平台才可以使用,所以本文尝试使用popen来替代。
下面是一个例子:
被并行调用的子程序代码:
复制代码 代码如下:

<?php
if($argc==1){
    echo("argv\n");
}
$arg = $argv[1];
for($i=0; $i<10; $i++)
{
    echo($i.".1.".time()." exec $arg \n");
    if($arg=='php2'){
        sleep(1);
        echo($i.".2.".time()." exec $arg \n");
        sleep(1);
    }else{
        sleep(1);
    }
}
?>

主调用者程序,由他调用子进程,同时并发的收集子程序的输出
复制代码 代码如下:

error_reporting(E_ALL);
$handle1 = popen('php sub.php php1', 'r');
$handle2 = popen('php sub.php php2', 'r');
$handle3 = popen('php sub.php php3', 'r');
echo "'$handle1'; " . gettype($handle1) . "\n";
echo "'$handle2'; " . gettype($handle2) . "\n";
echo "'$handle3'; " . gettype($handle3) . "\n";
//sleep(20);
while(!feof($handle1) || !feof($handle2) || !feof($handle3) )
{
$read = fgets($handle1);
echo $read;
$read = fgets($handle2);
echo $read;
$read = fgets($handle3);
echo $read;
}
pclose($handle1);
pclose($handle2);
pclose($handle3);

下面是我机器上的输出:
C:\my_hunter>php exec.php
'Resource id #4'; resource
'Resource id #5'; resource
'Resource id #6'; resource
0.1.1147935331 exec php1
0.1.1147935331 exec php2
0.1.1147935331 exec php3
1.1.1147935332 exec php1
0.2.1147935332 exec php2
1.1.1147935332 exec php3
2.1.1147935333 exec php1
1.1.1147935333 exec php2
2.1.1147935333 exec php3
3.1.1147935334 exec php1
1.2.1147935334 exec php2
3.1.1147935334 exec php3
4.1.1147935335 exec php1
2.1.1147935335 exec php2
4.1.1147935335 exec php3
5.1.1147935336 exec php1
2.2.1147935336 exec php2
5.1.1147935336 exec php3
6.1.1147935337 exec php1
3.1.1147935337 exec php2
6.1.1147935337 exec php3
7.1.1147935338 exec php1
3.2.1147935338 exec php2
7.1.1147935338 exec php3
8.1.1147935339 exec php1
4.1.1147935339 exec php2
8.1.1147935339 exec php3
9.1.1147935340 exec php1
4.2.1147935340 exec php2
9.1.1147935340 exec php3
5.1.1147935341 exec php2
5.2.1147935342 exec php2
6.1.1147935343 exec php2
6.2.1147935344 exec php2
7.1.1147935345 exec php2
7.2.1147935346 exec php2
8.1.1147935347 exec php2
8.2.1147935348 exec php2
9.1.1147935349 exec php2
9.2.1147935350 exec php2
**总结:**
**主程序循环等待子进程, 通过fgets或fread 把子进程的输出获取出来 , 从时间戳上看,的确实现了并发执行。**
-----------------------------------------------
以后的改进:
*  popen打开的句柄是单向的,如果需要向子进程交互,可以使用proc_open
*  使用数组和子函数代替while(!feof($handle1)|| !feof($handle2) || !feof($handle3) )这种龌龊的写法
*  用fread一次把子进程已经产生的输出取完,而不是每次一行。
一个并发执行shell任务的调度者,本程序读取一个任务文件,把里面的每行命令并发执行, 可以设置同时存在的子进程数目:
复制代码 代码如下:

/*
   主任务管理器
   并发的执行子任务列表
*/
include("../common/conf.php");
include("../common/function.php");
//开启的进程数
$exec_number = 40 ;
/***** main ********/
if($argc==1){
    echo("argv\n");
}
$taskfile = $argv[1];
//tasklist
$tasklist = file($taskfile);
$tasklist_len = count($tasklist);
$tasklist_pos = 0;
$handle_list = array();
while(1)
{
    //子进程列表有空闲,则填充补齐子进程列表
    if($exec_number > count($handle_list) &&
            $tasklist_pos < $tasklist_len)
    {
        for($i=$tasklist_pos; $i<$tasklist_len; )
        {
            $command = $tasklist[$i] ;
            $handle_list[] = popen($command , "r" );
            tolog("begin task \t ".$tasklist[$i]);
            $i++;
            if($exec_number == count($handle_list)) break;
        }
        $tasklist_pos = $i;
    }
    //如果子进程列表空,退出
    if(0 == count($handle_list))
    {
        break;
    }
    //检查子进程列表的输出,把停掉的子进程关闭并记录下来
    $end_handle_keys = array();
    foreach($handle_list as $key => $handle)
    {
        //$str = fgets($handle, 65536);
        $str = fread($handle, 65536);
        echo($str);
        if(feof($handle))
        {
            $end_handle_keys[] = $key;
            pclose($handle);
        }
    }
    //踢出停掉的子进程
    foreach($end_handle_keys as $key)
    {
        unset($handle_list[$key]);
        //var_dump($handle_list);
        //exit;
    }
}
tolog("\n\n*******************end**********************\n\n", "" ,  true);

附加一段Socket多进程接收的代码:
复制代码 代码如下:

do {
if (($msgsock = socket_accept($sock)) < 0) {
  echo "socket_accept() failed: reason: " . socket_strerror($msgsock) . "\n";
  break;
}
$pid = pcntl_fork();
if ($pid == -1) {
  die('could not fork');
} else if (!$pid) {
  .....
  socket_write($msgsock, $msg, strlen($msg));
  do {
   ......
  } while (true);
   socket_close($msgsock);
}
} while (true);
分享到:
评论

相关推荐

    PHP 线程安全与非线程安全版本的区别深入解析

    描述中提到了多进程与多线程的工作方式差异,以及CGI、ISAPI和FastCGI这三种不同的PHP运行模式。 线程安全和非线程安全是PHP在Windows环境下特有的概念,因为在Linux/Unix系统中,PHP主要基于多进程模型运行,而在...

    crul多线程查询百度收录情况

    本项目涉及的是利用PHP开发语言中的cURL库来实现多线程查询百度的收录情况,这对于评估网站的在线可见性和SEO效果至关重要。下面我们将深入探讨这个主题。 首先,cURL是一个强大的命令行工具和库,用于在不同协议间...

    解析PHP实现多进程并行执行脚本

    本文将深入解析如何利用PHP实现多进程并行执行脚本,以及相关的关键知识点。 首先,我们需要了解的是`pcntl_fork()`函数,这是PHP中用于创建子进程的关键函数。当调用`pcntl_fork()`时,当前进程会被复制成两个完全...

    Beanbun是用PHP编写的多进程网络爬虫框架

    总之,Beanbun为PHP开发者提供了一个强大的工具,它利用多进程和Workerman的特性,使PHP在处理网络爬虫任务时能够展现出不亚于其他多线程或异步编程语言的效能。同时,其高度可定制化的设计使得开发者可以根据具体...

    PHP7内核剖析,包括php基本框架,变量,Zend虚拟机,php基本语法实现,内存管理,线程安全,扩展开发,命名空间等

    线程安全在多进程或多线程环境中尤为重要。虽然PHP7默认是非线程安全的,但理解其潜在的线程不安全性,以及如何在需要时启用线程安全模式,对于构建大型分布式系统具有重要意义。 扩展开发是PHP7的一大特色。书中有...

    php进程间通讯实例分析_.docx

    本文将通过一个实例来深入解析PHP如何实现进程间的通信。 首先,PHP不支持原生的多线程操作,但可以通过创建多个进程来实现并发处理。这里,我们采用`pcntl_fork()`函数来创建子进程,从而实现多进程。`pcntl_fork...

    php_swoole_loader_2.2_nzts_php7.4 linux版本

    《PHP Swoole Loader 2.2 for NZTS PHP 7.4 on Linux:深入解析与应用》 在现代Web开发领域,PHP Swoole Loader是实现高性能、高并发网络应用的重要工具。本文将深入探讨PHP Swoole Loader 2.2在NZTS (Non-ZTS) PHP...

    php实现简单的守护进程创建、开启与关闭操作

    对于那些希望深入了解PHP在多进程编程方面的内容,本文提及的几个专题链接提供了额外的学习资源,例如《PHP进程与线程操作技巧总结》提供了更多关于PHP进程管理的深入探讨,《PHP网络编程技巧总结》则可能包含了网络...

    深入理解PHP内核.pdf

    - 利用多线程或多进程处理高并发请求。 - 使用异步IO模型提高I/O密集型任务的效率。 #### 六、总结 通过《深入理解PHP内核》这本书的学习,我们不仅可以了解到PHP内部工作原理的细节,还能掌握如何利用这些知识来...

    PHP开发搜索引擎技术全解析

    同时,可以使用多线程或多进程(如pthreads扩展)提高抓取效率。 二、预处理与分词 抓取到的数据需要进行预处理,包括HTML标签去除、URL规范化、文本清洗等。然后是关键的分词步骤,可以使用PHP的正则表达式或者第...

    PHP实例开发源码—雅虎php音乐爬虫.zip

    PHP可以通过pthreads扩展实现多线程,或者使用pcntl扩展进行多进程编程。 8. 避免IP被封策略: 爬虫可能会遇到网站的反爬机制,如限制同一IP地址频繁访问。为避免这种情况,可能使用了代理IP池、设置延迟(sleep...

    PHP实例开发源码——Mars_Qvod资源采集爬虫程序 php版.zip

    8. 并发处理:使用多线程或多进程提高爬取效率。 9. 日志管理:记录爬虫运行过程中的重要事件,便于调试和分析。 通过研究这个PHP实例,开发者不仅可以学习到PHP编程的基本技巧,还能深入理解网络爬虫的工作原理,...

    基于PHP的雅虎php音乐爬虫.zip

    9. **并发与多线程**:高级爬虫可能使用多线程或多进程技术提高抓取效率,PHP可以借助pthreads扩展实现。 10. **合规性**:爬虫的使用必须遵守网站的robots.txt文件规定以及相关法律法规,尊重网站的版权和用户隐私...

    PHP底层的运行机制与原理共8页.pdf.zip

    1. PHP在CLI环境下支持多进程模型,如`pcntl`扩展,而在Web服务器环境中,通过`pthreads`扩展实现多线程。 总结,PHP的底层运行机制包括代码解析、编译、执行、内存管理和错误处理等多个环节。了解这些原理有助于...

    深入理解Nginx 模块开发与架构解析

    在架构解析部分,本书将详细探讨Nginx的工作原理,包括多进程/线程模型、异步非阻塞I/O、内存池的使用以及负载均衡策略。这将帮助你了解Nginx如何实现高并发和低延迟,以及如何优化性能。此外,Nginx的配置文件解析...

    PHP实例开发源码—坐车网爬虫程序 php版.zip

    6. **并发与多线程**:为了提高爬虫效率,开发者可能使用PHP的多进程或多线程功能,如pthreads扩展,或者使用Guzzle的并发请求特性。 7. **IP更换与代理**:为了避免因频繁请求被目标网站封禁,爬虫可能需要使用...

    Swoole框架PHP 异步网络通信引擎swoole-v5.1.2.zip

    《Swoole框架PHP异步网络通信引擎:深入解析swoole-v5.1.2》 Swoole,作为一款高性能的PHP扩展,为PHP提供了异步、非阻塞的网络通信引擎,极大地提升了PHP在处理高并发、长连接等场景下的性能。在swoole-v5.1.2版本...

Global site tag (gtag.js) - Google Analytics