jsoup使用

hwy1782

浏览: 155543 次
性别:
来自: 杭州

最近访客更多访客>>

anhzhi

micropang

dengzhangtao

jk_zero

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

J2SE 基础

jsoup是一个开源的html解析工具：

jsoup的对象模型由多个elements 和tetxNode组成。

其继承结构如下：

Node

-----------------------

| |

Element TextNode

Document

其中一个Element包含一个子节点集合，并拥有一个父element

分以下几个部分描述一下这个工具的用法：

1.获取远程HTML document

2.解析document

1.获取HTML document

基本方法：

//获取参数URL对应的HTML文档，第二个参数为超时时间。
public static Document parse(URL url, int timeoutMillis)

Jsoup还提供了一个方法链来解决特殊请求，具体如下：

Document doc = Jsoup.connect("http://example.com")
  .data("query", "Java")
  .userAgent("Mozilla")
  .cookie("auth", "token")
  .timeout(3000)
  .post();

通过上述方法获取到HTML Document.，然后我们就可以通过Document中适当的方法或者它父类Elment和Node的方法来获取HTML文档中的相关数据

2.解析获取到的document

将HTML解析成Docuemnt之后，就可以使用类似DOM的方法来操作。

先给一个简单的例子：

//获取百度新歌100中的数据
private static void analyesBaidu() {
		
		String urlStr = "http://music.baidu.com/";
		
		try {
			URL urlBase = new URL(urlStr);
			Document doc = Jsoup.parse(urlBase, 10000);
			String topMsic = doc.select("div[monkey=new-top]").text();
			System.out.println(topMsic);
		} catch (Exception e) {
			e.printStackTrace();
		}
		
	}

返回的结果如下：

写道

更多>> 新歌TOP100 1 到不了李代沫 2 经过刘若英 3 等你爱我金池 4 平安夜平安 5 How You .. Avril La.. 6 伤痕金池 7 遗憾李代沫 8 愤怒的老鸟多亮 9 Dancing Q.. 少女时代 10 Super Girl .. 萧亚轩播放榜单

解释一下上述代码。

通过Jsoup拿到HTML对应的Document对象，使用jsoup的select方法。获取对应的内容。

其中

//查找docuemtn中div标签下有monkey=“new-top”属性的元素
String topMsic = doc.select("div[monkey=new-top]").text();

分享到：

java 枚举类型使用 | linux账户密码

2013-01-14 11:09
浏览 1035
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

jsoup使用

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

jsoup使用

评论

发表评论

相关推荐

mina源码阅读1

Address already in use:JVM_Bind 错误解决

java回调函数的例子

java 中annotation的使用

jmock 中unexpected invocation错误

生产者消费者模式

java timeTask

Java对象序列化（整理篇） 选择自 hdAptechIvan 的 Blog

Java class反编译后的代码还原

String作为参数传递

继承与初始化

线程池技术

堆排序

数组的一个问题

java中初始化顺序

堆和堆栈的区别

synchronized的用法（转）

java synchronized 用法

关于String pool转自CSDN的一篇文章

String Pool

最近访客更多访客>>

Java对象序列化（整理篇）选择自 hdAptechIvan 的 Blog