浏览 3654 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2009-02-11
最后修改:2009-02-11
htmlparser的基本用法网上有 不再罗嗦 这里介绍一篇写htmlparser自定义标签的文章: http://www.ibm.com/developerworks/cn/opensource/os-htmlparser/ 下面说下如何注册自己定义的标签:(其实很简单, 只是不熟悉API.....@_@) HTML: 在我的页面中有<Strong>.....</Strong>等htmlparser没有实现的Tag 自定义StrongTag: import org.htmlparser.tags.CompositeTag; public class StrongTag extends CompositeTag { private static final long serialVersionUID = 1L; private static final String[] mIds = new String[] { "STRONG" }; public String[] getIds() { return mIds; } public String[] getEnders() { return mIds; } } 注册使用StrongTag: PrototypicalNodeFactory factory = new PrototypicalNodeFactory (); factory.registerTag (new StrongTag()); factory.registerTag (new BTag()); Parser parser = new Parser(file); parser.setNodeFactory (factory); NodeList nodeList = parser.parse(null); Node[] nodes = nodeList.toNodeArray(); PrototypicalNodeFactory 在: import org.htmlparser.PrototypicalNodeFactory; 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |