php获取网页内容方法总结 -

sun123start

浏览: 36824 次
性别:
来自: 珠海

最近访客更多访客>>

loginboot

terriblegod

18601930748

zhengshujunyx

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

php获取网页内容方法总结

博客分类：

原文：php获取网页内容方法总结

用php抓取页面的内容在实际的开发当中是非常有用的，如作一个简单的内容采集器，提取网页中的部分内容等等

抓取到的内容在通过正则表达式做一下过滤就得到了你想要的内容，至于如何用正则表达式过滤，在这里就不做介绍了，有兴趣的，以下就是几种常用的用php抓取网页中的内容的方法。
1.file_get_contents
PHP代码

复制代码代码如下:

<?php 
$url = "http://www.jb51.net"; 
$contents = file_get_contents($url); 
//如果出现中文乱码使用下面代码 
//$getcontent = iconv("gb2312", "utf-8",$contents); 
echo $contents; 
?> 

2.curl
PHP代码

复制代码代码如下:

<?php 
$url = "http://www.jb51.net"; 
$ch = curl_init(); 
$timeout = 5; 
curl_setopt($ch, CURLOPT_URL, $url); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout); 
//在需要用户检测的网页里需要增加下面两行 
//curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY); 
//curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD); 
$contents = curl_exec($ch); 
curl_close($ch); 
echo $contents; 
?> 

3.fopen->fread->fclose
PHP代码

复制代码代码如下:

<?php 
$handle = fopen ("http://www.jb51.net", "rb"); 
$contents = ""; 
do { 
$data = fread($handle, 1024); 
if (strlen($data) == 0) { 
break; 
} 
$contents .= $data; 
} while(true); 
fclose ($handle); 
echo $contents; 
?> 

注：
1. 使用file_get_contents和fopen必须空间开启allow_url_fopen。方法：编辑php.ini，设置 allow_url_fopen = On，allow_url_fopen关闭时fopen和file_get_contents都不能打开远程文件。
2.使用curl必须空间开启curl。方法：windows下修改php.ini，将extension=php_curl.dll前面的分号去掉，而且需要拷贝ssleay32.dll和libeay32.dll到C:\WINDOWS\system32下；Linux下要安装curl扩展。

分享到：

正则表达式学习参考 | git切换到远程分支

2014-11-05 16:09
浏览 355
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

php获取网页内容方法总结

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

php获取网页内容方法总结

评论

发表评论

相关推荐

php.ini memory_limit引起的问题

php和javascript如何获取数字开头的属性

php生成随机数的三种方法

PHP定时执行计划任务

PHP 如何判断AJAX请求

php中soap的使用实例以及生成WSDL文件，提供自动生成WSDL文件的类库——SoapDiscovery.class.php类

基于PHP——简单的WSDL的创建(WSDL篇)

php中soap的使用实例以及生成WSDL文件，提供自动生成WSDL文件的类库——SoapDiscovery.class.php类

php输出目录的所有子文件

基于PHP的cURL快速入门

windows主机的IIS连接数限制，Linux的Apache连接限制，PHP的CPU限制！

Laravel学习笔记（一）安装配置开发环境

git切换到远程分支

配置php+apache环境遇到的空格问题

在线编译器（含有c、c++、php、Rube等）

最近访客更多访客>>