HTML Parser 使用例子

全部 Linux 数据库敏捷编程数据结构软件测试项目管理 Oracle 编程综合互联网 Erlang MySQL

浏览 9328 次

锁定老帖子主题：HTML Parser 使用例子精华帖 (0) :: 良好帖 (0) :: 新手帖 (1) :: 隐藏帖 (0)
作者	正文
hanyuanbo 等级: 初级会员性别: 文章: 4 积分: 60 来自: 深圳	发表时间：2010-11-22 相关推荐: web-log-parser:开源分析Web日志工具 C# spec - 1.5 Statements C# spec - 1.3 Types and variables rpm的制作 spec文件写法 druid sqlparser使用例子更多相关推荐搜索引擎 htmlparser是一个纯的java写的html解析的库，它不依赖于其它的java库文件，主要用于改造或提取html。它能超高速解析html，而且不会出错。现在htmlparser最新版本为2.0。毫不夸张地说，htmlparser就是目前最好的html解析和分析的工具。无论你是想抓取网页数据还是改造html的内容，用了htmlparser绝对会忍不住称赞。最近用Heritrix下载了大概1.5G 左右的网页，但是内容包含了很多HTML标签内容，打算今天搞下HTMLParser，写下简单使用实例。 (待续) 声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

flyingzl 等级: 性别: 文章: 78 积分: 247 来自: 大连	发表时间：2010-12-02 恩。推荐看看jsoup，也不错的，类似于jQuery的查询方式。
返回顶楼	回帖地址 0 0 请登录后投票

wlwolf 等级: 初级会员性别: 文章: 36 积分: 30 来自: 北京	发表时间：2010-12-09 感觉新星jsoup不错
返回顶楼	回帖地址 0 0 请登录后投票

lqixv 等级: 性别: 文章: 146 积分: 172 来自: 深圳	发表时间：2010-12-09 我也用 jsoup ，感觉不错！
返回顶楼	回帖地址 0 0 请登录后投票

gbfd2012 等级: 初级会员性别: 文章: 24 积分: 30 来自: 天津	发表时间：2010-12-09 最后修改：2010-12-09 htmlparser可以结合nekohtml使用下。。htmlparser很小但感觉解析网页很easy啊，很好的开源工具。抓取网页heritrix，功能挺强大的。nutch也不错，省硬盘空间。
返回顶楼	回帖地址 0 0 请登录后投票

xinnn 等级: 初级会员性别: 文章: 44 积分: 0 来自: 杭州	发表时间：2010-12-10 试试jsoup吧，好吃又好玩
返回顶楼	回帖地址 0 0 请登录后投票

ak121077313 等级: 初级会员性别: 文章: 146 积分: 80 来自: 深圳	发表时间：2010-12-14 <i>aaaaaaaaa</i>解析不到
返回顶楼	回帖地址 0 0 请登录后投票

longware 等级: 性别: 文章: 84 积分: 127 来自: 南京	发表时间：2010-12-14 http://www.iteye.com/topic/828723
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → 综合技术版

跳转论坛:

HTML Parser 使用 例子

HTML Parser 使用例子