`
baiyuxiong
  • 浏览: 177914 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

simple_html_dom 采集网页

    博客分类:
  • php
阅读更多
//$this->load->view('welcome_message');
		$this->load->library('Simple_html_dom');
		
		$html = file_get_html('http://localhost/test/reg.htm');
		foreach($html->find('.single_block ul.company_info') as $e)
		{
			echo $e->plaintext;
		}


递进搜索
//$this->load->view('welcome_message');
		$this->load->library('Simple_html_dom');
		
		$html = file_get_html('http://localhost/test/reg.htm');
		foreach($html->find('.single_block ul.company_info li') as $e)
		{
			echo $e->find('.gray',0)->plaintext;
		}
分享到:
评论
3 楼 wxhlwd 2012-07-11  
为什么load之后,页面报错说是没有找到simple_html_dom
2 楼 baiyuxiong 2010-09-18  
sentryward 写道
选择器有jquery强大吗?~。~

我觉得差不多强大,可以根据样式名称、ID、属性等选择,还能选子节点,父节点等。差不多够用了。
1 楼 sentryward 2010-09-18  
选择器有jquery强大吗?~。~

相关推荐

    curl配合simple_html_dom进行页面数据抓取

    本示例介绍了一种结合`curl`和`simple_html_dom`库的方法,用于高效地从网页中抓取数据。`curl`是用于传输数据的PHP扩展,而`simple_html_dom`是一个方便的PHP类,可以解析HTML并提取所需信息。 首先,`curl`...

    Php多线程内容采集器(集成snoopy simple_html_dom)。

    使用php curl族的多线程函数,并结合开源的snoopy 和simple_html_dom 对html的处理,使采集特定区域的内容轻松起来。当然,您也可以设置通过正则来采集。程序也可以采集远程图片到本地。详细使用说明见readme.html. ...

    PHP simple_html_dom.php+正则 采集文章代码

    这段代码中的`include_once('./simplehtmldom/simple_html_dom.php');`行包含了这个库,使我们能够使用它提供的DOM解析功能。 接着,定义了一个名为`getwebcontent`的函数,它利用cURL库获取指定URL的HTML内容。...

    simple html dom php

    要使用Simple HTML DOM,首先需要下载库文件,这里我们有一个名为`simplehtmldom_1_5`的文件,通常是一个包含`simple_html_dom.php`的压缩包。将其解压并引入到PHP项目中,即可开始使用。 5. **使用示例** - 加载...

    基于PHP的simplehtmldom 一个PHP处理HTML的利器(方便采集).zip

    本文将深入探讨SimpleHtmlDom的功能、使用方法以及其在网页采集中的应用。 SimpleHtmlDom库是PHP中的一款开源工具,它的主要功能是解析HTML文档并提供了一个DOM(Document Object Model)接口,使得开发者可以像...

    基于PHP的simplehtmldom一个PHP处理HTML的利器(方便采集)源码.zip

    《PHP的SimpleHtmlDom库:高效网页数据抓取与处理》 在Web开发领域,PHP是一种广泛使用的服务器端脚本语言,尤其在处理动态网页内容时表现出色。当我们需要从HTML网页中抓取数据或者进行网页解析时,PHP的Simple...

    信息采集(小偷程序)

    在IT行业中,信息采集是一种常见的技术手段,用于自动抓取互联网上的数据,如网页内容、用户行为等。小偷程序,或称为网络爬虫,是实现这一目标的工具,它模拟用户浏览行为,遍历网站并提取所需信息。在本案例中,...

    大淘客VIP版本_大淘客会员_大淘客_大淘客vip申请_queen1h6_采集网大淘客_源码

    - `simple_html_dom.php`:这是一个PHP库,用于解析HTML文档,提取所需的数据。在大淘客VIP版本中,它可能用于从电商网站抓取商品信息。 - `css`:这个目录包含了样式表文件,用于定义软件的界面样式和布局,提供...

    PHP实例开发源码-simplehtmldom 一个PHP处理HTML的利器(方便采集).zip

    PHP实例开发源码—simplehtmldom 一个PHP处理HTML的利器(方便采集).zip PHP实例开发源码—simplehtmldom 一个PHP处理HTML的利器(方便采集).zip PHP实例开发源码—simplehtmldom 一个PHP处理HTML的利器(方便采集).zip

    (已失效,代码仅供学习)php采集58,赶集网,搜房网,安居客(个人房源)

    在采集网页数据时,`simple_html_dom`可以帮助我们找到并提取所需元素,如房源的标题、价格、地点等。它支持CSS选择器,可以轻松定位到页面上的特定元素,简化了HTML解析的过程。 除了以上核心知识点,项目可能还...

    深入php数据采集的详解

    本文将详细介绍两种PHP数据采集工具:Snoopy和simple_html_dom,并探讨它们的特点和使用方法。 首先,Snoopy是一个PHP类库,它的主要功能是模拟浏览器行为,用于获取网页内容并执行表单提交。以下是一些Snoopy的...

    简单易学的php采集

    同时,可以使用正则表达式或者DOM解析库如PHP Simple HTML DOM Parser来解析HTML内容,提取所需的数据。 2. 使用file_get_contents进行基础采集 `file_get_contents()` 是PHP内置的函数,可以用来读取远程或本地...

    Laracvs_v1.1自动采集影视系统源码

    可能使用了如Guzzle HTTP客户端这样的库来实现HTTP请求,以及DOM解析库如PHP Simple HTML DOM Parser来处理抓取到的HTML内容。 3. **数据库管理**:采集到的数据会被存储在数据库中,可能使用的是MySQL或PostgreSQL...

    php数据采集

    此外,PHP还有许多第三方库可以帮助我们更高效地进行数据采集,例如Guzzle HTTP客户端库、Simple HTML DOM Parser等。这些库提供了更高级的功能,如HTTP事务处理、链式操作、错误处理等,可以简化我们的工作。 至于...

    万能新闻采集器--php版

    PHP中常用的HTML解析库有DOMDocument、DOMXpath以及更轻量级的选择,如PHP Simple HTML DOM Parser。这些库可以帮助我们定位并提取特定的HTML节点。 3. **正则表达式**:虽然DOM解析更为推荐,但有时简单的正则...

    PHP万能采集网站源码.zip

    2. **网页采集**:该系统可能使用了如DOMDocument、DOMXPath等PHP内置库,或第三方库如GuzzleHTTP、SimpleHTMLDom等,来抓取网页内容。这些工具能够解析HTML结构,定位到目标元素,从而提取所需数据。 3. **数据...

    PHP 采集程序原码

    此外,还有更轻量级的选择如PHP Simple HTML DOM Parser,适合快速处理HTML。 3. **正则表达式**:在某些情况下,正则表达式可以用来匹配和提取特定格式的数据。然而,由于HTML结构的复杂性,过度依赖正则可能导致...

    PHP采集远程网址数据

    - **HTML解析**:如果需要提取特定内容,可以使用DOM解析库(如PHP的DOMDocument)或正则表达式,但更推荐使用专门的库如PHP Simple HTML DOM Parser。 - **API限制**:许多网站有API调用频率限制,需要合理安排请求...

Global site tag (gtag.js) - Google Analytics