org.htmlparser.util.ParserException: Error in open

lzj0470

浏览: 1284241 次
性别:
来自: 深圳

最近访客更多访客>>

gljhh

hedgehog12

chen88358323

wyx065747

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

htmlparser

Java .net Blog

使用HTMLparser时碰到一个错误

org.htmlparser.util.ParserException: Error in opening a connection to

java.io.IOException: Invalid argument

at java.io.WinNTFileSystem.canonicalize0(Native Method)

at java.io.Win32FileSystem.canonicalize(Win32FileSystem.java:396)

at java.io.File.getCanonicalPath(File.java:559)

at org.htmlparser.http.ConnectionManager.openConnection(ConnectionManager.java:774)

at org.htmlparser.Parser.<init>(Parser.java:304)

at org.htmlparser.Parser.<init>(Parser.java:316)

at tentsoft.util.CNLinkInfParser.doCNLinkInfParser(CNLinkInfParser.java:62)

at tentsoft.util.CNLinkInfParser.getCNLinkList(CNLinkInfParser.java:111)

at tentsoft.util.CNLinkInfParser.main(CNLinkInfParser.java:138)

仔细查看源代码，发现是在
myParser = new Parser(htmlBody);这句出错

其中htmlBody是我request到一个网站得到的response,类型为String.
但是报错。
最后通过定义一个方法

     /**
     * 解析字符串
     * @param inputHTML String
     * @return Parser
     */
    public static Parser createParser(String inputHTML) {
        Lexer mLexer = new Lexer(new Page(inputHTML));
        return new Parser(mLexer,
                          new DefaultParserFeedback(DefaultParserFeedback.QUIET));
    }

在createParser里面去做new Parser()的。
问题解决。而上面的myParser = new Parser(htmlBody)语句改成myParser = createParser(htmlBody)就行了

本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/rudyMatrix/archive/2007/11/18/1891663.aspx

分享到：

网站的后缀名可以指示来自哪个国家 | 畜牧所举办“表观遗传学学术报告会”

2009-06-11 11:03
浏览 3635
评论(3)
查看更多

3 楼 qcfking 2011-12-06

感谢，感谢，我也碰到了这样的问题，一头雾水。、

2 楼 fengzhizi715 2010-06-26

顶了解决了我的问题谢谢

1 楼 marc0658 2010-06-18

....这么好的文章在些沉寂！！！！！唉。。。。

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论