在dom4j里面这两个方法都返回的是list,但是两个list可能有所不同。看了例子:
xml文件:
<?xml version="1.0"?>
<note>
<to></to>
<from>John</from>
<heading>Reminder</heading>
<body>5555
<head>333</head>
</body>
</note>
java文件:
File file=new File("C:\\Users\\Administrator\\Desktop\\zzz\\1.xml");
SAXReader reader=new SAXReader();
Document document=reader.read(file);
System.out.println(document.getRootElement().elements());//取到该元素下的子节点,对于孙子节点取不到
System.out.println(document.getRootElement().elements().size());//有多少个直接子节点
System.out.println(document.getRootElement().content());//可以取到该元素下所有的后代元素,其中还包括后代元素的text内容
System.out.println(document.getRootElement().content().size());//有多少个后代元素,包括他们text内容的总个数
执行结果:
[org.dom4j.tree.DefaultElement@19fcc69 [Element: <to attributes: []/>], org.dom4j.tree.DefaultElement@253498 [Element: <from attributes: []/>], org.dom4j.tree.DefaultElement@9fef6f [Element: <heading attributes: []/>], org.dom4j.tree.DefaultElement@209f4e [Element: <body attributes: []/>]]
4
----------------------------------------------------------------------------------------------
[org.dom4j.tree.DefaultText@17172ea [Text: "
"], org.dom4j.tree.DefaultElement@19fcc69 [Element: <to attributes: []/>], org.dom4j.tree.DefaultText@12f6684 [Text: "
"], org.dom4j.tree.DefaultElement@253498 [Element: <from attributes: []/>], org.dom4j.tree.DefaultText@f38798 [Text: "
"], org.dom4j.tree.DefaultElement@9fef6f [Element: <heading attributes: []/>], org.dom4j.tree.DefaultText@4b222f [Text: "
"], org.dom4j.tree.DefaultElement@209f4e [Element: <body attributes: []/>], org.dom4j.tree.DefaultText@b169f8 [Text: "
"]]
9
相关推荐
6. **遍历和搜索**:DOM提供了一系列方法进行遍历和搜索,如`DOMNodeList`接口用于存储节点集合,`DOMXPath`类用于执行XPath查询,以便更高效地定位文档中的特定部分。 **示例代码** 以下是一个简单的示例,展示了...
### 功能和方法 SimpleHtmlDom提供了许多方法来处理HTML元素,如`plaintext`获取纯文本内容,`innertext`获取包含HTML标签的内容,`outertext`设置或获取元素的完整HTML,`attr`获取或设置属性值,`children`获取子...
2. **更丰富的API**:`Advanced HTML DOM`提供了更多的方法和属性,如查找、遍历、修改和删除DOM元素,使得代码编写更加简洁高效。 3. **CSS选择器支持**:支持CSS3选择器,使得定位HTML元素更加精确,减少了对XPath...
在处理网络请求时,PHP提供了如`file_get_contents()`或`cURL`库等方法。例如,`file_get_contents()`函数可以方便地获取指定URL的网页内容。 在创建采集程序时,首先需要确定目标网站和要抓取的数据。这通常涉及到...
Table of Contents Part 1 Starting with jQuery Chapter 1 Introducing jQuery Part 2 Core jQuery Chapter 2 Selecting elements Chapter 3 Operating on a jQuery collection Chapter 4 Working with properties...
4. **查询和操作**:现在你可以使用选择器和方法进行查询和操作了: ```php $elements = $pq->find('div.container'); $elements->each(function($i, $element){ echo pq($element)->text(); }); ``` 5. **...
有些网站的数据是通过JavaScript动态加载的,这需要使用更复杂的方法,比如使用Selenium WebDriver或者PhantomJS等工具,它们能模拟浏览器执行JavaScript。 6. 避免被封IP与反爬策略 在进行数据采集时,应尊重...
PHP作为一种广泛使用的服务器端脚本语言,虽然不像Python那样拥有丰富的专门库,但依然可以通过一些方法实现网页抓取。下面将详细探讨PHP如何进行网页抓取及其相关知识点。 首先,要进行网页抓取,我们需要了解HTTP...
数据提取在IT行业中是一项至关重要的技术,特别是在网页信息建设和数据分析领域。PHP作为一种广泛使用的服务器端脚本语言,常被用于实现数据的自动化提取。在这个“数据提取范例”中,我们将探讨如何利用PHP进行高效...
phpQuery允许用户自定义选择器和方法,以满足特定需求。通过继承`phpQueryObject`类并重写相关方法,可以扩展其功能。 **7. 性能与效率** 尽管phpQuery提供了强大的功能,但在处理大量数据时,可能会比其他DOM解析...
但要注意,file_get_contents可能无法处理重定向和需要登录或cookie的情况。 #### 2.2 使用cURL cURL是更强大的HTTP客户端,可以处理更多复杂情况: ```php $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $...
$() looks for DOM elements within the context of the current HTML document. If you do specify a context, such as a DOM element or jQuery object, the expression will be matched against the contents of...
$() looks for DOM elements within the context of the current HTML document. If you do specify a context, such as a DOM element or jQuery object, the expression will be matched against the contents of...
Chapter 4. Events Chapter 5. Making Your Site Snazzy with jQuery Chapter 6. Better Forms with jQuery Chapter 7. Talking to Your Server Chapter 8. Writing Code that You can Read Later Chapter 9. Faster...
本书还包括详细的参考手册,涵盖了JavaScript的核心API、遗留的客户端API和W3C标准DOM API,记述了这些API中的每一个JavaScript对象、方法、性质、构造函数、常量和事件处理程序。 这本最畅销的JavaScript参考书的第...
Chapter 4: Polymer Elements Chapter 5: First Application with Polymer Chapter 6: Polymer Designer Tool and Polymer Starter Kit Chapter 7: Working with Polymer.dart Chapter 8: Best Practices
D3.js 4.x Data Visualization - Third Edition by Andrew Rininsland English | 28 Apr. 2017 | ASIN: B01MG90SSJ | 308 Pages | AZW3 | 6.6 MB Key Features Build interactive and rich graphics and ...
4. **DOMXPath**:与DOMDocument配合,提供了一种基于XPath查询语言的方式来查找文档中的特定元素。XPath是一种在XML文档中查找信息的语言,例如,我们可以使用`/html/body/p`找到所有的段落元素。 以下是一个简单...
...这个库的主要目的是为了方便网页数据的抓取,进而实现网页爬虫的功能。PHPQuery允许开发者通过...在构建爬虫时,理解网页结构、正确使用DOM操作和正则表达式,以及遵循网络抓取的道德规范,都是确保项目成功的关键。
$() looks for DOM elements within the context of the current HTML document. If you do specify a context, such as a DOM element or jQuery object, the expression will be matched against the contents of...