`
hongyu6
  • 浏览: 20154 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

实用PHP网页抓取

    博客分类:
  • PHP
阅读更多

前些日子跟别的公司合作了一个短信投票业务,对方需要把用户上行发送到我们平台,我这需要receive他的数据,然后他需要每发送一个数据我这边判断正确的话就输出一个内容让其抓取。之前只做过接收数据并处理,至于抓取没做过。在网上找了好多关于相关的文档。不过感觉都挺麻烦,最后就直接删除了很多功能代码,不过可以完成自己需要的功能了!
我说下我做的几个简单步骤:
       1.可以新建一个test页面,如test.php


<html>
<head>
  <title>PHP 网页抓取测试</title>
</head>
<body  >
<?php echo '<p>Hello World!</p>'; ?>
</body>
</html>
   
     2.新建抓取页面,如zhuaqu.php,代码如下:

<html>
<head>
<title>实用抓取网页内容测试 </title>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
</head>
<body  >
<?php
$url = 'http://localhost/test.php'; //测试本地网页
#$url = 'http://www.myenjoylife.cn/index.php'; //抓取www.myenjoylife.cn首页内容
$lines_array = file($url);
$lines_string = implode('', $lines_array);
eregi("(.*)", $lines_string, $head);
echo $head[0];
?>
</body>
</html>
3. 完成,就这么简单,如果你想抓取别的网页内容,只要改$url参数变量值,像抓取http://www.myenjoylife.cn的内容改成这个网址就OK啦!

 

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/hongyu6/archive/2008/03/11/2170585.aspx

分享到:
评论

相关推荐

    php应用curl扩展抓取网页类.zip

    `php应用curl扩展抓取网页类.zip`这个压缩包提供了一个PHP类,它封装了cURL功能,方便开发者进行网页抓取。 cURL是一个强大的库,用于处理URLs,它支持多种协议,包括HTTP、HTTPS、FTP等,同时也支持POST、PUT等...

    php网页分析内容抓取爬虫文件分析

    php网页分析内容抓取爬虫文件分析 好用实用

    php 模拟浏览器请求网页见容

    这一技术常被称为“网页抓取”或“屏幕抓取”,在数据分析、信息聚合、自动化测试等场景下非常实用。 首先,模拟浏览器请求的关键在于发送HTTP请求。PHP提供了多种方式来实现这一功能,如`file_get_contents`、cURL...

    php实现递归抓取网页类实例

    首先,从标题中我们可以了解到本文的重点在于PHP语言实现的递归网页抓取类的构建和应用。标题中的“递归”一词意味着该类将使用递归方法来遍历网页,以寻找并抓取页面上的链接。而“类实例”则指的是通过编写一个...

    PHP抓取及分析网页的方法详解

    本知识点将详细介绍PHP在网页抓取和分析方面的主要方法及技巧。 ### 网页抓取的基本方法 1. 使用`file_get_contents`函数: `file_get_contents`函数用于读取整个文件的内容,也可以用来获取网页内容。它的语法...

    php网页抓图片的类.zip

    总的来说,"php网页抓图片的类"为PHP开发者提供了一个实用的工具,简化了从网页抓取图片的过程。通过理解这个类的原理和功能,我们可以更高效地实现类似的需求,提高开发效率。在使用时,确保遵循相关法律法规,尊重...

    秋风网页Flash抓取器FastDownSwf1.5

    【秋风网页Flash抓取器FastDownSwf1.5】是一款专为用户设计的高效、便捷的Flash资源下载工具,适用于那些希望保存网页中的SWF文件,以便离线查看或者进一步编辑的用户。该软件的主要功能是识别并提取网页中的Flash...

    PHP抓取网页、解析HTML常用的方法总结

    本文将重点总结PHP在网页抓取和HTML解析方面常用的方法。 首先,我们来探讨PHP实现网页抓取的方法。网页抓取主要是指从其他网站获取数据的过程,这些数据可能包括HTML、文本、图片等多种格式。以下是PHP中常见的几...

    分享PHP源码批量抓取远程网页图片并保存到本地的实现方法

    在本文中,我们将探讨如何使用PHP来批量抓取远程网页上的图片并将其保存到本地。这个功能对于网站复制、数据抓取或者分析工作非常有用,尤其是当你需要获取一个网站的所有图片资源时。以下是一个简单的PHP脚本,它...

    图片定时抓取代码

    本项目名为“图片定时抓取代码”,其主要功能是自动化地从指定网页抓取图片,并且设置为定时任务,使得程序能持续运行,无需人工干预。下面将详细介绍这个项目涉及的关键知识点。 1. **网络请求**: - `curl`:这...

    php写的页面小偷 自动抓取页面并在本地重新生成HTML文件

    标题中的“php写的页面小偷 自动抓取页面并在本地重新生成HTML文件”是指一种使用PHP编程语言编写的网页爬虫程序。这种程序的主要功能是自动地从互联网上抓取指定网页的内容,并在本地计算机上生成对应的HTML文件,...

    基于PHP的股票贴吧抓取天宇版源码.zip

    【标题】"基于PHP的股票...总的来说,这个项目涵盖了网络爬虫、数据处理、数据库操作等多个方面,是学习和实践PHP Web开发的一个实用示例。通过研究源码,可以深入理解PHP在网络爬虫领域的应用,同时提升Web开发技能。

    PHP抓虫助手(抓取搜索引擎爬虫记录)

    **PHP抓虫助手详解** ...总的来说,PHP抓虫助手是一个实用的工具,它结合了PHP的HTTP请求、HTML解析、数据处理等多种技术,可以帮助我们深入了解搜索引擎爬虫的行为,为网站管理和优化提供有价值的数据支持。

    curl.phpcurl库函数的简单实用

    php的curl库简单实用,其中包含了网页抓取和远程登录

    新款简约PHP在线扒站小工具源码 两套在线扒扒站web源码.zip

    【标题】"新款简约PHP在线扒站小工具源码 两套在线扒扒站web源码.zip"涉及的核心知识点主要包括PHP编程语言、网页抓取技术以及简单的前端开发。 PHP是一种广泛使用的开源服务器端脚本语言,尤其适用于Web开发。在这...

    用snoopy抓取EMS验证码,远程模拟查询单号,取得查询结果

    总的来说,这个项目展示了如何利用Snoopy库进行网页抓取和模拟交互,特别是在处理验证码和远程查询这类任务时的实用性。通过这种方式,开发者可以自动化获取EMS的快递信息,为个人或企业的物流管理提供便利。然而,...

    PHP实例开发源码—phpQuery 强大的php采集类库.zip

    PHPQuery是基于PHP的一个强大网页抓取和HTML文档处理类库,它借鉴了jQuery的API设计,使得在PHP中进行DOM操作变得极其简便,极大地提高了网页数据抓取和解析的效率。 1. **PHPQuery简介** PHPQuery的主要目标是...

    SimpleHtmlDom:php使用simple_html_dom抓取网页数据的一个Demo

    通过结合cURL或file_get_contents等HTTP请求函数,可以构建强大的网页抓取系统。 总结来说,SimpleHtmlDom是一个实用的PHP库,提供了一种直观的方式来解析和操作HTML文档。尽管有其限制,但对许多开发者而言,它是...

    必应每日壁纸图片抓取 v1.0

    【必应每日壁纸图片抓取 v1.0】是一个基于PHP编程语言开发的实用工具,其主要功能是自动抓取微软官方必应搜索引擎提供的每日壁纸图片。这款软件的设计旨在为用户收集并保存最近15天内的必应壁纸,让用户能够方便地...

    基于PHP的Sanner-Inurlbr 利用搜索引擎来进行漏洞批量抓取.zip

    【标题】"基于PHP的Sanner-Inurlbr 利用搜索引擎来进行漏洞批量抓取"指的是一个使用PHP语言编写的工具,名为Sanner-Inurlbr,它利用了搜索引擎的强大功能来发现潜在的安全漏洞。这个工具主要面向网络安全专业人士和...

Global site tag (gtag.js) - Google Analytics