`
tianyalinfeng
  • 浏览: 442439 次
  • 性别: Icon_minigender_1
  • 来自: 苏州
社区版块
存档分类
最新评论

用htmlunit模拟浏览器

    博客分类:
  • Java
 
阅读更多

public String getPageAsXml(String url) {
  final WebClient webClient = new WebClient(
    BrowserVersion.INTERNET_EXPLORER_8);
  HtmlPage page = null;
  try {
   page = webClient.getPage(url);
  } catch (FailingHttpStatusCodeException e) {
   e.printStackTrace();
  } catch (MalformedURLException e) {
   e.printStackTrace();
  } catch (IOException e) {
   e.printStackTrace();
  }

  String pageAsXml = page.asXml();
  webClient.closeAllWindows();

  return pageAsXml;
 }

 

用htmlunit的优点是它不仅可以抓到静态的页面内容,而且可以抓到页面里js执行显示的内容,即它会像浏览器一样解析js

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics