import java.io.DataInputStream;
import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;
//用url获取网上的资源html文件 (html源代码)
public class GetHtmlByUrl {
public void getHtmlbyurl()
{
try {
URL url = new URL("http://www.iteye.com");
DataInputStream di = new DataInputStream(url.openStream());
byte [] bytes = new byte[1024];
while (di.read(bytes, 0, 1024)!=-1) {
System.out.println(new String(bytes,"utf-8"));
}
di.close();
} catch (MalformedURLException e) {
//
e.printStackTrace();
} catch (IOException e) {
//
e.printStackTrace();
}
}
public static void gethtmlbyurlcon()
{
try {
URL url = new URL("http://www.csdn.org");
URLConnection urlcon = url.openConnection();
DataInputStream di = new DataInputStream(url.openStream());
byte [] bytes = new byte[1024];
while (di.read(bytes, 0, 1024)!=-1) {
System.out.println(new String(bytes,"utf-8"));
}
di.close();
} catch (MalformedURLException e) {
//
e.printStackTrace();
} catch (IOException e) {
//
e.printStackTrace();
}
}
public static void main(String[] args) {
GetHtmlByUrl.gethtmlbyurlcon();
}
}
分享到:
相关推荐
对于数据包的抓取,Java本身并不提供原生的抓包功能。因此,我们通常会借助于第三方库,例如Jpcap,这是一个Java接口,允许程序捕获、过滤、分析和保存网络数据包。Jpcap提供了类似于libpcap(一个广泛用于抓包的C库...
Java抓包程序是一个用于捕获和分析网络数据流的工具,通常用于开发、调试和测试网络应用程序。在本例中,我们关注的是使用Jsoup库进行网页数据抓取的实践应用。Jsoup是一个非常强大的Java库,它允许开发者解析HTML...
本示例提供了如何使用Java来抓取Google和QQ网站的新闻。 首先,我们需要理解网络爬虫的基本原理。网络爬虫通过发送HTTP请求到目标网站,获取响应的HTML内容,然后解析这些内容来提取所需的信息,如新闻标题、日期、...
在这个项目中,我们关注的是使用Java和Jsoup库来爬取1688网站的信息。这是一个非常实用的技术,它可以帮助我们自动化地获取网页上的数据,如商品名称、价格、评价等,为数据分析或构建电商平台的模拟系统提供基础。 ...
### Java抓取网站数据知识点详解 #### 一、概述 在现代互联网开发中,抓取网站数据是一项重要的技能。无论是进行市场调研、竞品分析还是数据挖掘,掌握如何使用Java来抓取数据都是十分必要的。本篇文章将详细介绍...
Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...
该程序是一个基于Java SE开发的简单网站图片抓取工具,主要展示了如何利用Java进行网络请求和数据解析,特别适用于初学者了解和学习Java网络编程。在这个项目中,开发者并未依赖任何特定的框架,而是直接使用Java的...
Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...
基于Java开发的网站爬抓系统(输入地址自动下载HTML css img 资源).zip
Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...
本项目是一个基于Java实现的网站抓取程序,利用多线程技术和HTML解析技术,同时具备防屏蔽功能,以高效、稳定的方式从目标网站获取数据。 首先,我们要理解Java在编程中的地位。Java是一种跨平台的面向对象的编程...
github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...
github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...
该项目为八抓鱼二手书交易平台设计源码,采用Java和HTML技术实现,总计包含40个文件,其中32个为Java源代码文件,2个为属性配置文件,1个为Git忽略规则文件,以及1个HTML文件。
github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...
github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...
github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...
这套源码很可能是用HTML、CSS和JavaScript等前端技术编写的,用于构建一个模拟真实抓娃娃机的互动界面。 描述中提到,用户可以“点击开始后开始移动手臂”,这表明源码中包含了事件监听和处理机制,当用户点击开始...
github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...
github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache SimpleCache 是一个简单易用的java缓存工具,用来简化缓存代码的编写,让你摆脱单调乏味的重复工作!1. 完全透明的缓存支持,对...