- 浏览: 373464 次
- 性别:
- 来自: 四川
文章分类
- 全部博客 (247)
- 数据库以及sql (11)
- java (48)
- 爬虫学习 (20)
- java编程 (28)
- python编程以及安装和配置 (27)
- oracle数据库 (32)
- mongodb基本操作 (4)
- linux学习 (7)
- easyUI (2)
- nodeJs (8)
- python学习 (16)
- 其他 (13)
- hadoop (1)
- svn (1)
- 汉字 (1)
- windows (2)
- jsp (5)
- fiddler (1)
- ETL (1)
- teamviewer (1)
- maven (4)
- GIT (2)
- datagrip (1)
- ocr (1)
- redis (3)
- mysql (3)
- linux (1)
- 数据服务 (0)
最新评论
=======================================URL常用方法
//创建一个URL实例
URL imooc = new URL("http://www.imooc.com");
//?后面表示参数,#后面表示锚点
URL url = new URL(imooc, "/search/course?words=java");
System.out.println("协议:"+url.getProtocol());
System.out.println("主机:"+url.getHost());
System.out.println("端口:"+url.getPort());//没有指定端口号,默认使用80端口号,但是该方法返回-1
System.out.println("文件路径:"+url.getPath());
System.out.println("文件名:"+url.getFile());
System.out.println("相对路径:"+url.getRef());
System.out.println("查询字符串:"+url.getQuery());
=======================================获取网页数据实例
package com.kai;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
/**
* 使用URL读取网页内容
* */
public class ReadHtmlByURL {
private static String getHtmlByURl(String urlTemp){
try {
URL url = new URL(urlTemp);
//通过url.openStream()获取URL对象的资源字节输入流
InputStream is = url.openStream();
//将字节输入流转换为字符输入流
InputStreamReader isr = new InputStreamReader(is,"utf-8");
//为字符输入流添加缓冲
StringBuffer sb = new StringBuffer();
BufferedReader bfRead = new BufferedReader(isr);
//读取数据
String data = bfRead.readLine();
while(data!=null){
sb.append(data);
//输出数据,继续读取下一行数据
System.out.println(data);
data = bfRead.readLine();
}
//关闭资源
bfRead.close();
isr.close();
is.close();
return sb.toString();
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return null;
}
public static void main(String[] args) {
String html=getHtmlByURl("http://www.imooc.com/search/course?words=java");
System.out.println(html);
}
}
//创建一个URL实例
URL imooc = new URL("http://www.imooc.com");
//?后面表示参数,#后面表示锚点
URL url = new URL(imooc, "/search/course?words=java");
System.out.println("协议:"+url.getProtocol());
System.out.println("主机:"+url.getHost());
System.out.println("端口:"+url.getPort());//没有指定端口号,默认使用80端口号,但是该方法返回-1
System.out.println("文件路径:"+url.getPath());
System.out.println("文件名:"+url.getFile());
System.out.println("相对路径:"+url.getRef());
System.out.println("查询字符串:"+url.getQuery());
=======================================获取网页数据实例
package com.kai;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
/**
* 使用URL读取网页内容
* */
public class ReadHtmlByURL {
private static String getHtmlByURl(String urlTemp){
try {
URL url = new URL(urlTemp);
//通过url.openStream()获取URL对象的资源字节输入流
InputStream is = url.openStream();
//将字节输入流转换为字符输入流
InputStreamReader isr = new InputStreamReader(is,"utf-8");
//为字符输入流添加缓冲
StringBuffer sb = new StringBuffer();
BufferedReader bfRead = new BufferedReader(isr);
//读取数据
String data = bfRead.readLine();
while(data!=null){
sb.append(data);
//输出数据,继续读取下一行数据
System.out.println(data);
data = bfRead.readLine();
}
//关闭资源
bfRead.close();
isr.close();
is.close();
return sb.toString();
} catch (MalformedURLException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return null;
}
public static void main(String[] args) {
String html=getHtmlByURl("http://www.imooc.com/search/course?words=java");
System.out.println(html);
}
}
发表评论
-
java字符串 与 ASCII码相互转换
2018-09-12 14:32 10288public class stringToAscii { p ... -
java根据url下载附件源码
2017-04-18 10:37 711public static void runDownLoad( ... -
解决553 authentication is required 错误
2017-04-12 09:46 3555//获取系统属性 Properties pro = Sys ... -
java序列化和反序列化 以及transient的含义
2017-04-11 15:31 699=============================== ... -
ajax跨源解决办法(jsonp)
2017-04-11 10:39 467<!DOCTYPE html PUBLIC " ... -
socket知识
2017-04-11 10:29 467网络应用: socket java: socket类 1. ... -
tomcat发布Java项目的两种方式
2017-04-06 15:19 358部署tomcat项目有两种方式: 方法一是在eclipse中启 ... -
HashSet,TreeSet和LinkedHashSet的区别
2017-04-06 10:10 407原文:http://www.cnblogs.com ... -
java中map排序(SortedMap的用法)
2017-04-06 09:47 2104package JavaSenior; import jav ... -
java遍历list和map集合
2017-04-06 09:18 1287package JavaSenior; import jav ... -
在Eclipse中使用Axis2插件自动生成WSDL文件
2017-03-30 16:48 1034原文:http://blog.csdn.net/a198810 ... -
java模拟浏览器抓取网站信息和下载附件
2017-03-30 09:46 1638package com.teamdev.jxbrowser.c ... -
window_根据进程号关闭进程
2017-03-29 11:22 549netstat -ano | findstr 80 //列出进 ... -
java代码关闭指定进程
2017-03-28 17:07 1238//window下 public static void m ... -
eclipse配置webservice
2017-03-28 14:19 518引用:http://www.cnblogs.com/xwdre ... -
java遍历list和map的几种方式
2017-03-24 17:06 1011package JavaSenior; import jav ... -
java多态的优点和存在的必要条件
2017-03-24 14:46 1343/** 多态的优点: 1. 消除类型之间的耦合关系 ... -
java 目录创建,遍历与删除
2017-03-24 10:56 524package JavaAdvanced; import j ... -
java输入输出流
2017-03-24 10:15 638package JavaAdvanced; //Java 流( ... -
java中二维数组的赋值与遍历
2017-03-23 16:54 2690//创建多维数组 int [][] IntAy=new i ...
相关推荐
在IT领域,网络爬虫是获取网页数据的重要手段,而HttpClient和Jsoup是两种常用的Java库,用于实现这一目的。HttpClient提供了低级别的HTTP通信能力,而Jsoup则是一个解析和操作HTML文档的强大工具。本教程将详细介绍...
### C# 访问URL接口进行调用代码实例解析 #### 概述 在现代软件开发中,HTTP请求是客户端与服务器端交互的基础之一。本文将深入探讨如何使用C#语言来实现对URL接口的访问,并通过具体示例代码来展示这一过程。此...
创建一个`HttpClient`实例,设置好URL,然后使用`PostAsync`方法发送带有表单数据的POST请求。表单数据通常以键值对的形式存在,可以封装到`HttpContent`对象中。 2. **构建表单数据** 表单数据可以使用`...
Android 中使用 HttpClient 获取网络数据的实例 Android 平台中,HttpClient 是一个常用的网络请求组件,通过它可以与远程服务器进行交互,获取所需的数据。在 Android 应用程序中,我们可以使用 HttpClient 来获取...
本文将详细介绍几种常用的网页间数据传递方法,包括使用URL参数、Cookies、Session变量、Application变量以及`Server.Transfer`方法等,并给出具体的应用实例。 #### 一、URL参数 URL参数是一种最常见的网页间数据...
$.getJSON是JQuery中处理JSON数据常用的一个方法,它用于从服务器获取JSON格式数据,并且可以指定当成功接收到数据时执行的回调函数来处理这些数据。 首先,了解JQuery库是学习$.getJSON方法的前提。JQuery是一个...
这个实例“实例03获取JSON数据,显示计步器的个人信息.rar”显然涉及到从服务器获取JSON格式的数据,并将其用于显示计步器用户的个人信息。下面将详细解释这一过程涉及的关键技术点。 首先,我们需要理解JSON...
对于非文本数据,如图片,通常需要额外的处理,如下载图片到本地,保存其URL,或者直接通过requests库的get方法获取二进制数据。 四、处理反爬虫策略 许多网站为了防止被爬虫频繁访问,会设置反爬策略,如验证码、...
总之,HttpClient和Jsoup是Java开发者进行网页数据抓取的强大工具。HttpClient提供可靠的HTTP通信,而Jsoup则简化了HTML解析和数据提取的过程。结合两者,你可以高效地从各种网页中获取你需要的信息。在实际项目中,...
本文档将介绍C#中三种常用的方法来获取网页内容。 第一种方法是使用`WebClient`类。`WebClient`提供一种简单的方法来从指定的资源发送数据和接收数据,适用于处理网络资源的上传、下载和交互。在使用`WebClient`类...
在Java编程中,URL(Uniform Resource Locator)是用于定位网络资源的一种标准地址格式。当我们需要从互联网上获取数据时,通常有三种主要...在选择获取URL内容的方法时,应根据具体需求和项目需求来决定最适合的方案。
具体到$.get()方法的参数,除了必须的URL和回调函数之外,还可以传入一个额外的数据对象,用于发送到服务器的数据,以及一个数据类型指定参数,通常这些参数都是可选的。在$.get()请求过程中,还可以指定请求成功或...
例如,我们可以创建一个HttpGet实例,设置URL,然后使用HttpClient的execute方法发送请求。 对于HTML响应的解析,Java中常用的库有Jsoup。它提供了简洁的API,让我们能够像操作DOM树一样轻松地解析HTML文档。通过...
Python 提供了多种工具和技术来帮助开发者完成这项任务,其中 `urlparse` 模块是处理URL的常用方法之一。 #### 一、`urlparse`模块简介 `urlparse` 是 Python 标准库中的一个模块,用于对URL进行解析。它可以将一...
本资源是关于Hibernate框架的实例代码集合,涵盖了其常用的方法,旨在帮助开发者快速理解和应用Hibernate到实际项目中。Hibernate是一个强大的Java持久化框架,它简化了数据库操作,使得开发人员可以更加专注于业务...
当我们需要与服务器进行数据交互时,HTTP POST方法是常用的一种技术。本实例将详细讲解如何在C#环境中实现HTTP POST请求,以实现数据的发送和接收。 HTTP POST方法是HTTP协议中的一个请求类型,它允许客户端向...
本书分为5篇15章,共计625个实例和625个经验技巧。每个实例都经作者精心筛选,具有很强的实用性,其中一些实例是开发人员难于寻觅的解决方案。 本书适合PHP的初学者,如高校学生、求职人员作为练习、速查、学习...
【Ajax常用实例代码】主要涵盖了Web开发中的几个关键应用场景,包括用户登录注册注销、数据库交互、跨页面数据传递、文本片段展示以及获取服务器信息。这些功能在构建动态、交互性强的Web应用时非常常见,而Ajax技术...
要使用`WebRequest`请求远程URL,首先需要实例化`HttpWebRequest`子类,然后设置相关属性,如URL、请求方法(GET或POST),最后通过`GetResponse`方法发送请求并获取响应。 ```csharp WebRequest request = ...