HTMLParser的一个疑问 - - ITeye博客

`

liuqiyuan

浏览: 1095 次
性别:
来自: 杭州

最近访客更多访客>>

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

全部博客 (2)

社区版块

存档分类

2010-12 ( 2)
更多存档...

最新评论

HTMLParser的一个疑问

阅读更多

给这2个表格，如何过滤出指定的TD 表格内容项。我想根据td_num得到指定的td_value。因为标签属性都一样，所以有些困难。比如，我只想要第一个表格的td_value2和第二个表格的td_value6。如何根据td_num得到td_value呢？？？
请高手给出代码，最好用filter方法遍历节点访问内容。
代码好的，我会追加分！！！

<table border="0" cellpadding="2" cellspacing="0"><tr><td>FN</td><td>ISI Export Format</td></tr><tr><td>VR</td><td>1.0</td></tr><table xmlns:exsl="http://exslt.org/common">
<tr>
<td valign="top">td_1 </td>
<td>td_value1</td>
</tr>
<tr>
<td valign="top">td_2 </td>
<td>td_value2</td>
</tr>
<tr>
<td valign="top">td_3</td>
<td>td_value3</td>
</tr>
</table>
<table border="0" cellpadding="2" cellspacing="0"><tr><td>FN</td><td>ISI Export Format</td></tr><tr><td>VR</td><td>1.0</td></tr><table xmlns:exsl="http://exslt.org/common">
<tr>
<td valign="top">td_4 </td>
<td>td_value4</td>
</tr>
<tr>
<td valign="top">td_5</td>
<td>td_value5</td>
</tr>
<tr>
<td valign="top">td_6</td>
<td>td_value6</td>
</tr>
<tr>
<td valign="top">td_7</td>
<td>td_value7</td>
</tr>
</table>

分享到：

ceshi

2010-12-31 18:56
浏览 590
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

htmlparser: META-INF/maven/org.htmlparser/htmlparser/pom.properties META-INF/maven/org.htmlparser/htmlparser/pom.xml org.htmlparser.Parser.class org.htmlparser.PrototypicalNodeFactory.class org.htmlparser.beans....

htmlparser.jar文件: HTMLParser提供了多种方法来访问和操作解析树，比如`parseContent()`用于获取整个文档的节点列表，`visitAllNodesWith()`可以遍历所有节点并应用自定义的访问器，`getFirstNodeWithTag()`用于找到第一个特定标签的...

HTMLParser.net源代码HTMLParser.net使用demo: 本项目名为"HTMLParser.net源代码HTMLParser.net使用demo"，显然是一个包含示例代码的压缩包，用于展示如何在实际应用中使用HTMLParser.net。 HTMLParser.net的核心功能包括： 1. **HTML解析**：它能够将HTML字符...

c#版htmlparser htmlparser.dll htmlparser源代码: 总之，`c#版htmlparser htmlparser.dll htmlparser源代码`提供了一个C#实现的HTML解析工具，可以帮助开发者高效地处理HTML文档，同时提供了源代码供进一步学习和定制。结合`WinistaDownload-dll`和`WinistaDownload-...

HtmlParser: HTMLParser是用于解析HTML文档的一种工具或库，尤其在网络爬虫技术中扮演着关键角色。网络爬虫，也称为网络蜘蛛或Web抓取器，是一种自动浏览互联网并收集信息的程序。它广泛应用于搜索引擎优化、数据分析、市场研究...

htmlparser库与教程: "htmlparser实现从网页上抓取数据.doc"文件则很可能是一个详细的教程，指导用户如何利用HTMLParser库进行网页数据抓取。在这个教程中，可能会涵盖以下关键知识点： 1. **安装和引入HTMLParser**：首先，用户需要将...

HtmlParser源码及demo: 5. **示例代码（Demo）**：在提供的文件中，可能包含一个或多个演示如何使用HTMLParser的示例。这些示例通常会展示如何初始化解析器、注册事件处理器、遍历DOM树或执行特定的HTML操作。 6. **项目构建配置**：`....

Winista.Htmlparser.Net 源码 +Demo: `HtmlParser2003`可能是一个早期版本的源代码，而`AnalyzeHtml`和`WebParser`则可能是演示如何使用HtmlParser的项目。 1. **AnalyzeHtml**：这个项目可能展示了如何分析HTML文档，通过调用HtmlParser的API来提取...

htmlParser.jar包: 在很多Web抓取、信息提取以及网页分析的项目中，HTMLParser都是一个理想的工具。 HTMLParser库的设计考虑了易用性和灵活性，它提供了丰富的API，允许开发者通过编程方式来访问和操作HTML文档的各个元素，如标签、...

htmlparser网页分析: 9. 结合其他工具：HTMLParser可以与其他工具结合使用，如Jsoup，后者是一个更现代的HTML解析库，提供更友好的API和更强的CSS选择器支持。两者结合可以提高处理复杂HTML文档的效率。 10. 性能考虑：虽然HTMLParser...

htmlparser的jar包: HTMLParser是一个Java库，用于解析HTML文档。这个库在处理非结构化或不规范的HTML时特别有用，因为网页在实际环境中往往不严格按照HTML标准编写。HTMLParser提供了两种主要的解析方式：事件驱动和DOM（Document ...

htmlparser-1.2.1 jar: htmlparser-1.2.1jar包下载htmlparser-1.2.1jar包下载

htmlparser1.6最新版: HTMLParser是一个Java库，专为处理HTML文档而设计，它在网页信息提取和解析领域扮演着重要角色。本文将深入探讨HTMLParser 1.6版本的功能、用途、使用方法以及其在IT领域的应用。 HTMLParser的核心功能是解析HTML...

HtmlParser源码及其jar包: - `htmlparser1_6_20060610.zip`：这是HTMLParser的一个较早版本，发布于2006年6月10日。它可能包含旧版API和特性，对于需要兼容旧项目或研究历史版本的人来说是有价值的。 - `HTMLParser-2.0-SNAPSHOT-src.zip`：...

解析htmlparser的所有jar包: HTMLParser是一个Java库，专为解析HTML文档而设计。它提供了简单且灵活的方式来处理HTML标记，使得在Java程序中操作和分析HTML内容变得容易。在这个压缩包中，你可能找到了HTMLParser项目的所有必需jar包，这将帮助...

HtmlParser 实现简易爬虫: 在本场景中，我们讨论如何使用HTMLParser库来创建一个基础的网络爬虫，以便从网页上抓取和分析数据。首先，我们需要了解HTMLParser的基本用法。HTMLParser设计为易于使用，它提供了对HTML元素、属性和文本的访问，...

java解析html工具htmlparser的jar包及api文档: HTMLParser是一个Java库，专为解析HTML而设计。它提供了对HTML文档的解析能力，使得开发者可以方便地处理网页内容，提取有用的信息或者进行数据抓取。这个工具在IT行业中，尤其是在Web开发和数据处理领域，有着广泛...

HtmlParser 2.1 码源: HtmlParser是一个强大的开源库，主要用于解析HTML文档，它在处理不规则的HTML结构时表现出了极高的灵活性和稳定性。这个"HtmlParser 2.1 码源"是该库的2015年6月的最新版本，包含了用于理解和操作HTML内容的全部源...

Global site tag (gtag.js) - Google Analytics