浏览 9240 次
锁定老帖子 主题:HTML Parser 使用 例子
精华帖 (0) :: 良好帖 (0) :: 新手帖 (1) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2010-11-22
最近用Heritrix下载了大概1.5G 左右的网页,但是内容包含了很多HTML标签内容,打算今天搞下HTMLParser,写下简单使用实例。 (待续) 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2010-12-02
恩。推荐看看jsoup,也不错的,类似于jQuery的查询方式。
|
|
返回顶楼 | |
发表时间:2010-12-09
感觉新星jsoup不错
|
|
返回顶楼 | |
发表时间:2010-12-09
我也用 jsoup ,感觉不错!
|
|
返回顶楼 | |
发表时间:2010-12-09
最后修改:2010-12-09
htmlparser可以结合nekohtml使用下。。htmlparser很小但感觉解析网页很easy啊,很好的开源工具。抓取网页heritrix,功能挺强大的。nutch也不错,省硬盘空间。
|
|
返回顶楼 | |
发表时间:2010-12-10
试试jsoup吧,好吃又好玩
|
|
返回顶楼 | |
发表时间:2010-12-14
<i>aaaaaaaaa</i>解析不到
|
|
返回顶楼 | |
发表时间:2010-12-14
http://www.iteye.com/topic/828723
|
|
返回顶楼 | |