0

1

回答

1945 浏览

JAVA + jsoup + httpUnit 爬虫报错[已解决]0

String sinaLoginUrl="http://apps.evozi.com/apk-downloader"; WebClient client=new WebClient(); client.getOptions().setCssEnabled(false); client.getOptions().setJavaScriptEnabled(true);//设置成tru ...

2015年1月04日 21:07
0

1

回答

1903 浏览

java抓取雪球数据时连接老是失败,不知道是否被屏蔽还是参数不对[已解决]25

尝试了好多参数,都是一样的 Server returned HTTP response code: 400 for URL,不知道是不是雪球有限制,但是对照浏览器的请求,一模一样的做了设置也不行,多谢! 也用jsoup做同样的事情,还是同样的错误。 Java代码 收藏代码 package com.test; import java.io.BufferedReader; import java.io. ...

2014年12月01日 19:09
0

1

回答

557 浏览

如何做好爬虫[已解决]5

做爬虫有一段时间了,请问一下这个资源网站 http://www.ququshe.com/videoInfo/VMTIxNjc1NTc1K.htm的多资源爬取除了HttpClient、Jsoup、Htmlunit 技术之外,对于视频链接如何获取? 还想问一下,对于多线程爬虫大家有什么见解和心得,共享一下。

2013年11月09日 14:49
0

2

回答

881 浏览

Jsoup 解析网站问题[已解决]15

<div style="display: none"> <ul select="50"> <li>....</li> ... </ul> </div> 如上网页中的隐藏域的结构,我想定位到li元素层,取所有li的text值 Document doc = Jsoup.connec ...

2013年3月14日 17:10
0

0

回答

951 浏览

jsoup对BR标签的支持问题[已解决]5

似乎jsoup不把BR标签看成是节点,在取子节点时BR标签会被忽略,不知道jsoup如何实现BR标签的分割

2012年1月13日 14:31
0

3

回答

4200 浏览

如何用jsoup过滤文本内容[已解决]5

比如<p>111111<br>2222</br><p> 现在想要得到“111111”这部分文本而过滤掉后面的HTML代码,用jsoup如何实现?(注:后面的html代码是不定的)

2012年1月06日 16:19

本周活跃投票用户

最新评论

Global site tag (gtag.js) - Google Analytics