论坛首页 Java企业应用论坛

htmlparser 自定义标签的扩展 注册

浏览 3651 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2009-02-11   最后修改:2009-02-11
最近项目中用到htmlparser(1.6)
htmlparser的基本用法网上有 不再罗嗦
这里介绍一篇写htmlparser自定义标签的文章:
http://www.ibm.com/developerworks/cn/opensource/os-htmlparser/

下面说下如何注册自己定义的标签:(其实很简单, 只是不熟悉API.....@_@)

HTML:

     在我的页面中有<Strong>.....</Strong>等htmlparser没有实现的Tag

自定义StrongTag:
import org.htmlparser.tags.CompositeTag;

public class StrongTag extends CompositeTag {

   private static final long serialVersionUID = 1L;
   private static final String[] mIds = new String[] { "STRONG" };

   public String[] getIds() {
      return mIds;
   }

   public String[] getEnders() {
      return mIds;
   }

}



注册使用StrongTag:
     PrototypicalNodeFactory factory = new PrototypicalNodeFactory ();
      factory.registerTag (new StrongTag());
      factory.registerTag (new BTag());
      Parser parser = new Parser(file);
      parser.setNodeFactory (factory);
      NodeList nodeList = parser.parse(null);
      Node[] nodes = nodeList.toNodeArray();


PrototypicalNodeFactory 在:
import org.htmlparser.PrototypicalNodeFactory;
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics