`
Sharpleo
  • 浏览: 574123 次
  • 性别: Icon_minigender_1
  • 来自: newsk
社区版块
存档分类
最新评论

java抓网站html

阅读更多

import java.io.DataInputStream;
import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;

//用url获取网上的资源html文件  (html源代码)
public class GetHtmlByUrl {

	public void getHtmlbyurl()
	{
		try {
			URL url = new URL("http://www.iteye.com");
			DataInputStream di = new DataInputStream(url.openStream());
			byte [] bytes = new byte[1024];
			while (di.read(bytes, 0, 1024)!=-1) {
				System.out.println(new String(bytes,"utf-8"));
			}
			di.close();
			
		} catch (MalformedURLException e) {
			// 
			e.printStackTrace();
		} catch (IOException e) {
			// 
			e.printStackTrace();
		}
	}
	
	public static void gethtmlbyurlcon()
	{
		try {
			URL url = new URL("http://www.csdn.org");
			URLConnection urlcon = url.openConnection();
			DataInputStream di = new DataInputStream(url.openStream());
			byte [] bytes = new byte[1024];
			while (di.read(bytes, 0, 1024)!=-1) {
				System.out.println(new String(bytes,"utf-8"));
			}
			di.close();
		} catch (MalformedURLException e) {
			// 
			e.printStackTrace();
		} catch (IOException e) {
			// 
			e.printStackTrace();
		}
	}
	public static void main(String[] args) {
		GetHtmlByUrl.gethtmlbyurlcon();
	}
}
分享到:
评论

相关推荐

    java实现网络抓包

    对于数据包的抓取,Java本身并不提供原生的抓包功能。因此,我们通常会借助于第三方库,例如Jpcap,这是一个Java接口,允许程序捕获、过滤、分析和保存网络数据包。Jpcap提供了类似于libpcap(一个广泛用于抓包的C库...

    java抓包程序jsoup实例

    Java抓包程序是一个用于捕获和分析网络数据流的工具,通常用于开发、调试和测试网络应用程序。在本例中,我们关注的是使用Jsoup库进行网页数据抓取的实践应用。Jsoup是一个非常强大的Java库,它允许开发者解析HTML...

    java抓取新闻 抓新闻 抓网站新闻

    本示例提供了如何使用Java来抓取Google和QQ网站的新闻。 首先,我们需要理解网络爬虫的基本原理。网络爬虫通过发送HTTP请求到目标网站,获取响应的HTML内容,然后解析这些内容来提取所需的信息,如新闻标题、日期、...

    java课程设计java jsoup 爬取1688网站信息,详细例子

    在这个项目中,我们关注的是使用Java和Jsoup库来爬取1688网站的信息。这是一个非常实用的技术,它可以帮助我们自动化地获取网页上的数据,如商品名称、价格、评价等,为数据分析或构建电商平台的模拟系统提供基础。 ...

    java抓取网站数据

    ### Java抓取网站数据知识点详解 #### 一、概述 在现代互联网开发中,抓取网站数据是一项重要的技能。无论是进行市场调研、竞品分析还是数据挖掘,掌握如何使用Java来抓取数据都是十分必要的。本篇文章将详细介绍...

    java源码包---java 源码 大量 实例

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    java编写的网站图片抓取小程序

    该程序是一个基于Java SE开发的简单网站图片抓取工具,主要展示了如何利用Java进行网络请求和数据解析,特别适用于初学者了解和学习Java网络编程。在这个项目中,开发者并未依赖任何特定的框架,而是直接使用Java的...

    java源码包3

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    基于Java开发的网站爬抓系统(输入地址自动下载HTML css img 资源).zip

    基于Java开发的网站爬抓系统(输入地址自动下载HTML css img 资源).zip

    java源码包2

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    一个用java实现的抓取网站程序

    本项目是一个基于Java实现的网站抓取程序,利用多线程技术和HTML解析技术,同时具备防屏蔽功能,以高效、稳定的方式从目标网站获取数据。 首先,我们要理解Java在编程中的地位。Java是一种跨平台的面向对象的编程...

    java开源包6

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包9

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    基于Java与HTML技术的八抓鱼二手书交易平台设计源码

    该项目为八抓鱼二手书交易平台设计源码,采用Java和HTML技术实现,总计包含40个文件,其中32个为Java源代码文件,2个为属性配置文件,1个为Git忽略规则文件,以及1个HTML文件。

    java开源包101

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包4

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包5

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    抓娃娃机前端源码,注意 只有前端代码

    这套源码很可能是用HTML、CSS和JavaScript等前端技术编写的,用于构建一个模拟真实抓娃娃机的互动界面。 描述中提到,用户可以“点击开始后开始移动手臂”,这表明源码中包含了事件监听和处理机制,当用户点击开始...

    java开源包8

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

    java开源包10

    github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...

Global site tag (gtag.js) - Google Analytics