- 浏览: 207583 次
- 性别:
- 来自: 东莞
文章分类
最新评论
-
wzwahl36:
你那个链接的网页已经过期了~~~
终于找到了 Editplus 3.4 注册码 keycode -
xa_zbl:
感谢,解决了我的问题
lucene特殊字符处理
编写curl类,进行网页内容抓取
创建curl对象
抓取yahoo搜索结果
测试结果
class CurlUtil { private $curl; private $timeout = 10; /** * 初始化curl对象 */ public function __construct() { $this->curl = curl_init(); curl_setopt($this->curl, CURLOPT_RETURNTRANSFER, 1); curl_setopt($this->curl, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"); curl_setopt($this->curl, CURLOPT_HEADER, false); //设定是否显示头信息 curl_setopt($this->curl, CURLOPT_NOBODY, false); //设定是否输出页面内容 curl_setopt($this->curl, CURLOPT_CONNECTTIMEOUT, $this->timeout); curl_setopt($this->curl, CURLOPT_FOLLOWLOCATION, true); curl_setopt($this->curl, CURLOPT_AUTOREFERER, true); } /** * 注销函数 关闭curl对象 */ public function __destruct() { curl_close($this->curl); } /** * 获取网页的内容 */ public function getWebPageContent($url) { curl_setopt($this->curl, CURLOPT_URL, $url); return curl_exec($this->curl); } }
创建curl对象
$CurlUtil = new CurlUtil();
抓取yahoo搜索结果
function getYahooSearch(CurlUtil $curl, $key) { $key = urlencode($key); $searchUrl = "http://boss.yahooapis.com/ysearch/web/v1/$key?appid=你的雅虎appid&lang=tzh®ion=hk&abstract=long&count=20&format=json&start=0&count=10"; $josnStr = $curl->getWebPageContent($searchUrl); $searchDataInfo = json_decode($josnStr, true); $searchData = $searchDataInfo['ysearchresponse']['resultset_web']; $returnArray = array(); if (!empty($searchData)) { foreach ($searchData as $data) { $returnArray[] = array("url" => $data['url'], "date" => $data['date'], 'title' => strip_tags($data['title']), 'description' => strip_tags($data['abstract'])); } } return $returnArray; }
测试结果
var_dump(getYahooSearch($CurlUtil, "百度"));
发表评论
-
php 获取百度的热词数据
2012-02-16 18:29 1228/** * 获取百度的热词 * @user 小杰 * ... -
phpstrom 优化设置
2011-12-14 14:57 1032-Xms700m -Xmx700m -XX:Max ... -
phpstrom key
2011-12-07 11:45 1365username: yyj key: 73904-120420 ... -
php 字符层截取 技巧
2011-11-08 15:51 812/** * 去除字符串最后1个字符 最简单方法 */ $ ... -
php去除字符串首尾中英文空格
2011-07-05 10:40 1721/** * 去除空格(包括中英文空格) * User ... -
获取php时间戳
2011-05-27 19:17 1157function getmicrotime(){ ... -
php 写入和读取序列化的cookie
2011-05-26 14:52 1454public function ... -
linux php 编译 eaccelerator
2011-05-11 11:19 1128tar -zxvf eaccelerator-0.9.6.1. ... -
正则不包含某字符串
2011-05-11 00:05 1005$patT = '@<a.*?href="(? ... -
zend framework firephp 调试函数
2011-04-26 17:58 905function showVarInfo($var) ... -
php mail 标题乱码
2011-04-19 14:20 836$to = 'yangyingjieok@163.com'; ... -
php 5.3.6 You are *required* to use the date.timezone setting or the date_defaul
2011-03-24 10:10 1058date.timezone = "Asia/Shan ... -
winow使用php非安装版
2011-02-25 17:24 874要将php.exe所在的路径加入环境变量中,从而避开很多未知的 ... -
使用 Apache mod_deflate模块
2011-01-09 23:04 10271.使用此模块 LoadModule deflate_modu ... -
40个技巧优化你的PHP代码
2011-01-09 22:45 898英文版权归Reinhold Weber所有,中译文作者yang ... -
php 繁体字转化为简体字
2010-12-30 12:56 74081.php加载mbstring extension=php ... -
php生成某个范围内的随机时间
2010-12-30 12:23 7552/** * 生成某个范围内的随机时间 * @pa ... -
phpadmin自动登录
2010-12-14 15:22 936设置libraries的config.default.php ... -
php 5.3 It is not safe to rely on the system's timezone settings
2010-12-12 11:10 772看看官方文档,设置一下参数,搞定 latitude and ... -
解决PHP在IE下载文件,为文件名为乱码问题
2010-12-12 01:20 4329通常使用以下代码就能导出为流的文件,而不是打开文件 head ...
相关推荐
本文将详细介绍如何使用PHP的cURL库来实现这一目标,以抓取Yahoo Boss的搜索结果为例。 首先,我们来理解cURL(客户端URL)库。cURL是一个用于在命令行下工作的开源工具,用于传输数据。在PHP中,cURL被用作一个...
本教程将详细讲解如何使用CURL来抓取网页数据,并结合C++的STL字符串进行分析,最终将提取的数据写入log.txt文件。 首先,我们要了解CURL的基本用法。CURL可以用来发送HTTP请求,获取服务器的响应。例如,使用CURL...
2. **设置cURL选项**:为了抓取网页,类可能会使用`curl_setopt()`来配置cURL,例如设置`CURLOPT_RETURNTRANSFER`为true,这样cURL不会直接输出数据,而是将结果存储在变量中。其他可能的选项包括`CURLOPT_...
完成设置后,使用curl_exec()执行会话,这个函数会返回执行结果。如果操作成功,返回的是请求的网页内容;如果失败,返回的是false,并且可以通过curl_error()函数获取错误信息。 需要注意的是,由于网络环境的复杂...
然而,在某些情况下,我们可能需要通过PHP脚本利用curl工具来抓取这些通过AJAX异步加载的内容。本示例将展示如何使用PHP的curl扩展来抓取AJAX异步内容。 首先,要理解AJAX异步内容抓取与普通页面抓取在技术上并无...
**网页抓取工具curl** curl 是一款强大的命令行工具,用于传输数据到或从服务器,支持多种协议,包括HTTP、HTTPS、FTP、FTPS等。它在IT行业中被广泛使用,特别是对于网络开发者和系统管理员,因为它允许他们方便地...
在IT行业中,网络数据抓取是一项重要的技能,特别是在数据分析、搜索引擎优化(SEO)以及网站监控等领域。本示例介绍了一种结合`curl`和`simple_html_dom`库的方法,用于高效地从网页中抓取数据。`curl`是用于传输...
使用cURL获取网页内容,可以设置`CURLOPT_RETURNTRANSFER`选项,使得cURL不直接输出,而是返回结果。然后可以通过`curl_exec()`执行请求。 5. **正则表达式抓取** 一旦获取到网页内容,可以使用PHP的`preg_match...
`curl-7.63.0` 是一个包含 `curl` 源代码、依赖库以及编译结果的压缩包。`curl` 是一个著名的开源命令行工具,用于传输数据,支持多种网络协议如 HTTP、FTP、SMTP 等。在开发或系统管理中,`curl` 常用来测试网络...
`curl`是一个强大的命令行工具,用于在操作系统中下载或上传数据,支持众多...无论是简单的网页抓取,还是复杂的API交互,`curl`都能提供有效的解决方案。学习和掌握`curl`的使用,无疑能提升你在IT领域的技能和效率。
命令行下调用curl获取网页信息,例如在Java servlet中使用response.getWriter().print("success") curl就可以获取到"success",并保存到check.txt中,再从check.txt中读取数据,并做判断
以下是一个简单的多线程cURL抓取示例: ```php class CurlThread extends \Thread { private $url; public function __construct($url) { $this->url = $url; } public function run() { $ch = curl_init...
在PHP开发中,有时我们需要获取一些需要用户登录后才能访问的网页内容,此时可以借助Curl库来模拟登录过程并抓取数据。Curl库是一个强大的URL处理工具,支持多种协议,包括HTTP、HTTPS等,它能让我们在PHP中发送HTTP...
我们首先需要定义要抓取的网页地址(URL),并通过cURL设置一系列选项,如隐藏头信息、设置请求的URL、将获取的结果以字符串形式返回等。通过curl_exec函数,我们执行了初始化的cURL会话句柄,从而获取了目标页面的...
在IT行业中,网络爬虫和数据抓取是常见的任务,`curl` 是一个非常实用的命令行工具,用于传输数据到或从服务器。本示例将详细介绍如何利用PHP的cURL库来抓取远程页面内容。 首先,让我们理解这段代码的基本结构。在...
Curl.zip 文件包含了一个在Windows环境下使用C++开发的CURL库示例程序。CURL是一个流行的开源库,用于在各种编程语言中处理URL传输,包括文件上传、下载、HTTP、HTTPS、FTP等网络协议。这个C++ DEMO将帮助我们理解...
理解并熟练使用`curl`,无论是对开发者还是系统管理员,都是非常有价值的技能,它可以帮助诊断网络问题,自动化数据抓取,甚至进行API测试。在AIX 7.1这样的企业级操作系统上,`curl`的稳定性和效率尤为重要。
在这个示例中,`curl_init()`初始化一个cURL会话,`curl_setopt()`函数用于设置cURL的各种选项。`CURLOPT_URL`指定了要请求的URL,`CURLOPT_VERBOSE`开启详细日志,`CURLOPT_HEADER`和`CURLOPT_NOBODY`分别设置是否...
curl 支持多种功能,如 POST 请求、文件上传、HTTP 头定制、URL 重定向等,广泛应用于自动化脚本和数据抓取。 2. **www-curl**: `www-curl` 是 Perl 模块 `WWW::Curl` 的简称,它是 Perl 语言的一个接口,允许...