`
sony-soft
  • 浏览: 1105527 次
文章分类
社区版块
存档分类
最新评论

使用php的DOM函数,解析网页元素

 
阅读更多


此例用php的dom库解析百度首页的所有链接:

$doc = new DOMDocument();
@$doc->loadHTMLFile("http://www.baidu.com/");
$as=$doc->getElementsByTagName("a");

foreach($as as $node){
if(($value=$node->nodeValue)!=''){
print $value."=====";
print $node->getAttributeNode("href")->value;
echo "<br>";
}
}



注:由于使用的是中文的帮助手册,有些类和方法属性涵盖不全,所以短短的代码却费了不少的功夫(幸好了解一些javascript,其实语言这东西思想都是相通的),建议去官方网站下载最新的英文帮助手册。
关于对网页进行深度搜索或广度搜索可以将该方法置于循环中或对其递归,通过动态设定循环次数即可实现,以免进入无限制搜索的局面。

分享到:
评论

相关推荐

    php dom 解析类和函数文件封装

    在给定的“php dom 解析类和函数文件封装”主题中,我们可以深入探讨PHP如何利用DOM进行HTML解析。 `simple_html_dom`是PHP的一个开源库,它简化了HTML文档的处理,使得开发者可以像操作DOM节点一样操作HTML。`...

    simple_html_dom,php下的html文件DOM解析库

    PHP Simple HTML DOM Parser是一个轻量级且易于使用的库,它允许开发者像操作DOM对象一样方便地处理HTML文档,同时也支持jQuery风格的选择器,使得对HTML元素的操作更加直观。本文将详细讲解这个库的核心概念、功能...

    PHP Simple HTML DOM解析器使用入门

    ### PHP Simple HTML DOM 解析器使用入门 #### 一、简介 在Web开发领域,解析HTML文档是一项常见的任务。PHP Simple HTML DOM Parser是一款强大的库,它简化了这一过程,使得开发者能够更加高效地处理HTML文档。该...

    PHP中使用DOM

    这通常涉及到`json_decode()`函数来解析JSON,接着用DOM方法创建和修改元素。 此外,标签“源码”和“工具”暗示了这个话题可能包含一些实用的代码示例和可能的工具库,如PHP的DOM扩展,或者是帮助简化DOM操作的第...

    php截取html源代码的简单函数simplehtmldom

    `simplehtmldom`是一个PHP类库,它使得解析和操作HTML变得简单而直观,避免了使用正则表达式可能带来的复杂性和错误。 1. **安装和引入simplehtmldom** 首先,你需要下载`simplehtmldom`库。通常,这个库是一个...

    php使用自带dom扩展进行元素匹配的原理解析

    PHP使用自带DOM扩展进行元素匹配的原理解析涉及到PHP中DOM扩展库的使用。DOM扩展库是PHP提供的用于解析和操作HTML和XML文档的一个扩展。它允许开发者通过程序控制HTML或XML文档的结构、内容和样式。本文将详细介绍...

    HtmlDom.rar_HTML dom_PHP HTMLdom

    HTML DOM(Document Object Model)是HTML和XML文档的树型结构表示,它为网页提供了一种标准的编程接口,使得开发者可以通过JavaScript或PHP等语言来操作网页中的元素,实现动态更新、添加、删除以及修改页面内容。...

    PHP抓取网页新闻函数(包含示例)

    - `DOMDocument`和`DOMXPath`可能不够灵活,对于复杂网页结构,可以考虑使用`PHP-Scraping`或者`Goutte`这样的现代爬虫框架。 以上就是关于“PHP抓取网页新闻函数”的主要知识点。实际应用中,我们需要根据具体...

    用PHP读取和编写XML DOM

    在PHP中,有多种方法来处理XML,包括使用DOM库、SAX解析器和正则表达式。DOM(Document Object Model)库是其中最常用的一种,它将整个XML文档加载到内存中,形成一棵节点树,便于遍历和操作。 例如,要读取清单1中...

    PHP实现html标签补全函数

    对于更复杂的情况,可能需要使用更高级的解析库,如PHP的DOMDocument类,它可以解析整个HTML文档,然后逐个处理元素,确保所有标签都正确闭合。 在实际应用中,`closetags.php`可能是包含上述函数的文件。为了使用...

    PHP函数壁纸

    若需要解析HTML并提取特定信息,可以使用`DOMDocument`类和`DOMXPath`对象,它们提供了操作HTML文档对象模型(DOM)的方法。 接着,"字符串查找替换"除了前面提到的`str_replace()`,还有`strstr()`和`strpos()`等...

    蓝奏云网盘直链解析PHP源码

    这可能需要使用到PHP的DOM解析库(如DOMDocument和DOMXPath)来解析HTML,提取相关信息,或者使用随机化策略改变请求头以避免被识别为机器人。 在实际的代码实现中,可能还会涉及到错误处理和日志记录,确保在解析...

    htmldom_document

    - `find()`方法是核心功能之一,可以使用CSS选择器找到DOM树中的特定元素。 - 例如,`$dom-&gt;find('p')`将找到所有的段落元素。 4. **操作元素**: - `outertext`属性允许获取或设置元素的完整HTML代码,包括所有...

    simple_html_dom下载和使用

    Simple HTML DOM 是一个 PHP 库,用于解析和操作 HTML 文档。它提供了一种简单而直观的方式来处理 HTML 内容,使得开发者能够轻松地抓取网页数据、修改 HTML 结构等。本篇文章将详细介绍如何下载 Simple HTML DOM ...

    基于PHP的simplehtmldom 一个PHP处理HTML的利器(方便采集).zip

    《基于PHP的SimpleHtmlDom:高效网页数据抓取与处理》 PHP作为一款广泛使用的服务器端脚本语言,尤其在Web开发领域有着重要的地位。在处理HTML文档时,PHP提供了多种库和工具,其中SimpleHtmlDom是一个非常实用的库...

    php仿jQuery控制dom | php采集

    5. **遍历元素**:你可以使用`each()`函数遍历选中的元素集合,类似于jQuery的`.each()`。 6. **操作元素**:phpQuery提供了添加、删除、修改元素的方法,如`append()`, `remove()`, `text()`, `attr()`, `html()`...

    php使用simple_html_dom解析HTML示例

    在使用simple_html_dom解析HTML文档时,常用的方法包括获取网页的DOM对象,以及使用选择器来查找HTML元素。例如,使用file_get_html函数可以从指定的URL获取网页的DOM对象。一旦获取了DOM对象,就可以利用简单的选择...

    PHP函数参考手册大全

    XML 语法解析函数 CLVII. XML-RPC 函数 CLVIII. XMLReader functions CLIX. XSL functions CLX. XSLT Functions CLXI. YAZ Functions CLXII. YP/NIS Functions CLXIII. Zip File Functions (Read Only Access) ...

    PHP使用DOM对XML解析处理操作示例

    ### PHP使用DOM对XML解析处理操作示例知识点 #### 1. DOMDocument对象与DOM模型 DOM(Document Object Model)文档对象模型是XML和HTML文档的编程接口,它提供了一个结构化的方式来表示文档,并允许程序和脚本动态...

Global site tag (gtag.js) - Google Analytics