Java解析HTML

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 22322 次

锁定老帖子主题：Java解析HTML 精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
illu 等级: 初级会员性别: 文章: 50 积分: 0 来自: 西安	发表时间：2010-11-30 nurenok 写道 JSOUP谁用谁知道 +1
返回顶楼	回帖地址 0 0 请登录后投票

lovemylover 等级: 初级会员性别: 文章: 81 积分: 40 来自: 天津	发表时间：2010-11-30 htmlparser很好用，基本就相当于DOM遍历，至于想要其他更好的效果，就自己封装吧
返回顶楼	回帖地址 0 0 请登录后投票

flyingzl 等级: 性别: 文章: 78 积分: 247 来自: 大连	发表时间：2010-11-30 如果没有记错，一个叫做jsoup的html解析器，速度非常快。类似于python中的BeautifulSoup
返回顶楼	回帖地址 0 0 请登录后投票

qiren83 等级: 初级会员性别: 文章: 191 积分: 30 来自: 上海	发表时间：2010-11-30 illu 写道 nurenok 写道 JSOUP谁用谁知道 +1 ++1
返回顶楼	回帖地址 0 0 请登录后投票

noobjava 等级: 初级会员性别: 文章: 12 积分: 50 来自: 无锡	发表时间：2010-12-01 最后修改：2010-12-01 qiren83 写道 illu 写道 nurenok 写道 JSOUP谁用谁知道 +1 ++1 有空打算写写jsoup的中文的一些东西，这玩意我从0.3.1开始用，最近发现已经更新的若干个版本了。我觉得在jsoup面前，htmlparser还是比较难用的，方便易用性上与jsoup不是一个级别。但有一个小前提，就是你用过jquery,了解jquery的一些语法，那就会瞬间上手了，不了解也没关系，因为学起来也比较简单，能看懂它的英文文档基本上很快就学会了，一句话，实在太好用了
返回顶楼	回帖地址 0 0 请登录后投票

ahitbo 等级: 初级会员性别: 文章: 32 积分: 0 来自: 深圳	发表时间：2010-12-01 qiren83 写道 illu 写道 nurenok 写道 JSOUP谁用谁知道 +1 ++1 +++1
返回顶楼	回帖地址 0 0 请登录后投票

dengzhangtao 等级: 初级会员性别: 文章: 73 积分: 30 来自: 上海	发表时间：2010-12-01 抛出异常的爱写道 dom4j 支持 xpath div[@id=123] 恩用dom4j处理节点
返回顶楼	回帖地址 0 0 请登录后投票

longware 等级: 性别: 文章: 84 积分: 127 来自: 南京	发表时间：2010-12-01 aoliwen521 写道目前没有接触过需求需要专门去抓别人的东西。。但是以前面试写过一个抓信息的。。当时就是抓javaeye。。我愚蠢的使用正则表达式抓。。看来比较麻烦啊。 xpath，我就怕他页面万一不规范，不能正常的操作了。正则很累人的
返回顶楼	回帖地址 0 0 请登录后投票

longware 等级: 性别: 文章: 84 积分: 127 来自: 南京	发表时间：2010-12-01 谢谢讨论，我试试dom4j 、 jsoup 、 xalan 、NekoHTML+HttpClient with xpath
返回顶楼	回帖地址 0 0 请登录后投票

nighthawk 等级: 性别: 文章: 419 积分: 134 来自: 北京	发表时间：2010-12-01 看来大家都有“拿来主义”的需求。不仅扣人家页面风格，连内容也要抓。
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → Java企业应用版

跳转论坛: