`
you_java
  • 浏览: 96356 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

jsoup抓取其他网站的页面代码

    博客分类:
  • java
阅读更多

需要的jar包见http://you-java.iteye.com/blog/1457440

 

<%@ page language="java" contentType="text/html; charset=UTF-8"
	pageEncoding="UTF-8"%>
<%@ page import="org.jsoup.Jsoup"%>
<%@ page import="org.jsoup.nodes.Element"%>
<%@ page import="org.jsoup.select.Elements"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
	<head>
		<meta http-equiv="Content-Type"
			content="text/html; charset=UTF-8">
		<title>气象地图</title>
	</head>
	<body>
		<%
			org.jsoup.nodes.Document doc = 
				Jsoup.connect("http://www.weather.com.cn/forecast/").get(); // 根据网址获取Document对象
			Elements els = doc.select(".weatherNetwork"); // 获取class为weatherNetwork的标记 ,返回符合条件的元素集合

			for (int i = 0; i < els.size(); i++) {
				Element el = els.get(i);
				System.out.println(el.html());
		%>
		<pre>
	 		<%=el.html()%>
	 	</pre>
		<%
			}
		%>
	</body>
</html>
分享到:
评论

相关推荐

    Jsoup抓取整个网站

    在本篇中,我们将深入探讨如何使用Jsoup来抓取整个网站,并将其保存到本地,包括CSS、JavaScript、图片以及各个页面。 首先,我们需要了解Jsoup的基本用法。Jsoup通过建立一个HTTP连接到目标网站,然后解析返回的...

    java+jsoup抓取网页数据

    以下是关于如何使用Java+Jsoup抓取网页数据的详细讲解。 首先,你需要了解HTML的基础结构,因为Jsoup的工作原理是解析HTML文档并提供类似于DOM的API来操作这些文档。HTML是由标签组成的树形结构,每个标签都有属性...

    Java使用Jsoup抓取网页关键信息并入库

    在"Java使用Jsoup抓取网页关键信息"这部分,我们需要了解以下几个知识点: 1. **Jsoup连接与解析网页**:使用Jsoup的`connect()`方法建立HTTP连接,然后通过`get()`或`post()`发送请求获取网页内容。获取到的HTML...

    Jsoup抓取实例

    这可能是一个Java项目,其中包含了用于演示Jsoup抓取功能的代码。你可以解压文件,运行代码,查看其如何使用Jsoup来抓取特定网站的数据。通过阅读和学习这个实例,你将能更好地理解Jsoup的使用方法和数据抓取的流程...

    httpClient+jsoup抓取网页数据实例和jar包

    本教程将详细介绍如何结合使用HttpClient与Jsoup来抓取和处理网页数据。 HttpClient是Apache基金会开发的一个开放源代码库,它允许开发者发送HTTP请求并接收响应,支持多种HTTP协议版本。HttpClient提供了丰富的...

    Http,Jsoup-网页数据抓取

    在IT行业中,网络数据抓取是一项重要的技能,它允许开发者获取并分析网页上的信息,以进行各种用途,如数据分析、网站监控或者构建自己的应用程序。在这个主题中,我们将深入探讨两个关键概念:Http协议和Jsoup库,...

    jsoup 网页信息 抓取 选择器

    通过熟练掌握jsoup库,我们可以快速实现对特定网页的定制化抓取,例如在新浪高尔夫频道的例子中,提取新闻信息并进行分析或存档。此外,jsoup还提供了多种高级功能,满足了多样化的网页解析需求,使得开发者可以更...

    Java爬虫Jsoup+httpclient获取动态生成的数据

    通过上述方法,结合Jsoup和HttpClient,开发者可以构建出一个能够抓取动态网页内容的爬虫程序。这不仅适用于商品价格的抓取,也适用于其他需要抓取动态数据的场景。但需要注意的是,爬取数据时应遵守网站的robots....

    java网页抓取Jsoup包全

    Jsoup包全指的是包含所有必要组件的完整Jsoup集合,以确保能进行完整的网页抓取工作。 Jsoup的核心组件是`jsoup-1.8.1.jar`,这是Jsoup的主要库文件,包含了所有必需的类和方法,使得开发者能够轻松地连接到网站,...

    jsoup多线程爬虫

    此外,项目中可能还包含了`jsoupDemo.docx`文件,这可能是一个详细的文档,包含了更多关于如何使用jsoup和多线程抓取新闻的步骤和示例代码。而`jsoup-1.10.2.jar`是jsoup库的版本,确保将其添加到项目的类路径中,...

    Android Jsoup 爬虫协议抓取网页信息

    本文将深入探讨如何利用Jsoup在Android环境中抓取和处理网页信息。 首先,我们需要了解Jsoup的基本用法。Jsoup的核心在于`connect()`和`parse()`两个方法。`connect()`用于建立HTTP连接,获取网页源代码;`parse()`...

    使用jsoup获取网页内容并修改

    在Android开发中,Jsoup常用于网页数据抓取和页面内容的处理。以下将详细解释如何使用Jsoup来实现这个功能。 首先,我们需要在项目中引入Jsoup库。如果是在Gradle项目中,可以在build.gradle文件中添加依赖: ```...

    jsoup网页内容分析

    - **自动化测试**:在自动化测试场景中,JSoup可以帮助检查网页元素的存在或状态,确保页面渲染正确。 - **内容过滤与清洗**:在处理用户提交的HTML内容时,JSoup可以用来清除恶意代码或不合规的HTML结构,保障网站...

    JAR包—jsoup HTML抓取

    这使得`jsoup`成为Java开发者在处理网页抓取任务时的首选工具。 首先,让我们了解如何导入并使用`jsoup`。在Java项目中,你可以通过Maven或Gradle来添加依赖。对于Maven,只需在`pom.xml`文件中添加以下依赖: ```...

    jsoup-1.13.1.jar Java爬虫经典框架 抓取网页内容

    - **网站抓取**:jsoup常用于爬虫项目,可以抓取网页内容,提取数据,如新闻文章、商品价格等。 - **Web自动化**:在自动化测试中,jsoup可以用来解析网页,验证元素的存在和状态。 - **数据迁移**:将旧版网站...

    使用jsoup异步抓取新闻数据装载listview(仿开源中国资讯列表)

    通过jsoup异步抓取新闻数据,可以高效地从网页中提取所需信息。在Android中,结合ListView和AsyncTask,可以在不阻塞主线程的情况下,提供流畅的用户体验。记得根据实际的网页结构调整jsoup的选择器,以及适配...

Global site tag (gtag.js) - Google Analytics