`
lisg
  • 浏览: 9784 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
社区版块
存档分类
最新评论

java.net.URL抓取网页数据

阅读更多
/**
文件名 : OpenUrl.java
描述 :通过 java.net.URL 类访问一个页面,并且返回结果
参考:http://java.sun.com
  **/
import java.net.*;
import java.io.*;

public class OpenUrl
{

/**通过域名或IP地址取得网站数据
* @param strUrl  example:http://www.baidu.com
* @return
*/
public String getContent(String strUrl)
// 一个public方法,返回字符串,错误则返回"error open url"
{
  try{
  
   URL url=new URL(strUrl);
   BufferedReader br=new BufferedReader(new InputStreamReader(url.openStream()));
   String s="";
   StringBuffer sb=new StringBuffer("");
   while((s=br.readLine())!=null)
   {    
    sb.append(s+"\r\n");   
   }
   br.close();
   return sb.toString();
  }
  catch(Exception e){
   return "error open url: " + strUrl;
  
  } 
}

public static void main(String args[])
{
  //具体使用方法
  OpenUrl ou=new OpenUrl();
  System.out.println(ou.getContent("http://gongyi.baidu.com"));
}
}
分享到:
评论

相关推荐

    java网络编程抓取指定网页信息--UrlHtml(java源码)

    import java.net.URL; public class UrlHtml { @SuppressWarnings("deprecation") public static void main(String[] s) throws IOException{ try { URL url = new URL("http://www.kum.net.cn"); ...

    Java抓取网页数据Demo

    在Java中,我们可以使用`java.net.URL`类来建立与目标网页的连接,并通过`java.io.BufferedReader`读取响应。例如: ```java URL url = new URL("http://example.com"); HttpURLConnection connection = ...

    JAVA线程根据给定URL生成网页快照

    在Java编程中,生成网页快照是一项常见的任务,它主要用于数据抓取、搜索引擎优化(SEO)或者是为了离线浏览。这个任务通常涉及到网络编程、多线程和网页解析技术。以下将详细介绍如何根据给定的URL利用Java实现线程...

    Java抓取网页内容三种方式

    它使用 java.net.URL 类来打开一个 URL 连接,然后使用 InputStream 读取网页内容。下面是使用 URL 连接的示例代码: ```java import java.io.*; import java.net.*; public class GetURL { public static void ...

    java抓取网页数据实现

    在Java中,我们可以使用`java.net.URL`和`java.net.HttpURLConnection`类来构建基本的HTTP请求。然而,这些类的使用相对复杂,因此大多数开发者会选择使用库如Apache HttpClient或者OkHttp来简化网络请求。这些库...

    java 使用URL访问网页

    在Java编程语言中,访问网页是一项基本操作,通常用于数据抓取、自动化测试或网络通信。本篇文章将详细讲解如何使用Java的内置类`java.net.URL`和相关API来实现这个功能。 首先,我们需要理解`URL`(Uniform ...

    Java实现网页抓取

    2. **Java网络编程**:Java提供了丰富的API来处理网络通信,如`java.net.URL`、`java.net.HttpURLConnection`或Apache的HttpClient库。这些类和库可以帮助我们发送HTTP请求并接收响应。 3. **HTML解析**:抓取到...

    url.zip_Java URL实现文件下载

    在Java中,我们可以使用`java.net.URL`和`java.net.URLConnection`类来建立与远程服务器的连接,并读取数据。以下是一个简单的文件下载示例: ```java import java.io.InputStream; import java.io.OutputStream; ...

    通过url网址下载图片,可以选择有代理下载,也可以选择无代理下载

    在IT行业中,网络编程是必不可少的一部分,而从URL下载图片是一项常见的任务,特别是在网页爬虫、数据抓取或构建Web应用程序时。本篇文章将详细探讨如何使用Java通过URL下载图片,以及如何在需要时利用代理进行下载...

    java网页下载的四种不同实现

    在Java编程中,下载网页是一项常见的任务,尤其对于网络爬虫和数据抓取项目来说更是必不可少。本篇文章将深入探讨四种不同的Java实现方法,帮助初学者理解如何在处理中文乱码问题的同时,有效地下载网页内容。 一、...

    ftp网络下载

    import java.net.URL; public class FilePhoto { /** * 从网络Url中下载文件 * * @param urlStr * @param fileName * @param savePath * @throws IOException */ public static void downLoadByUrl...

    URL网址链接

    要从URL下载数据,可以使用`java.net.HttpURLConnection`类。首先,将其与URL关联,然后设置请求方法(通常是GET或POST),最后读取响应。以下是一个简单的GET请求示例: ```java import java.io.BufferedReader; ...

    Jsp抓取页面内容

    java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection(); l_connection.connect(); l_urlStream = l_connection.getInputStream(); java.io.BufferedReader l_reader ...

    抓取网页中的邮箱地址

    为了实际抓取网页内容,我们可以使用Java的HTTP客户端库,如`java.net.URL`和`java.net.URLConnection`,或者使用第三方库如Apache HttpClient或OkHttp。以下是一个简单的HTTP请求示例: ```java import java.io....

    java http方式抓取网页信息 JAVAIO

    import java.net.URL; public class MyHttp { public static void main(String[] args) throws Exception { URL url = new URL("http://example.com"); HttpURLConnection connection = (HttpURLConnection) url...

    java 获取json网页数据

    可以使用`java.net.URL`和`java.net.HttpURLConnection`,或者更高级的库如Apache HttpClient或OkHttp。这里我们使用简单的`HttpURLConnection`: ```java URL url = new URL("http://example.com/api/data"); ...

    Java抓取URL/Email实例源码

    Java中的`java.net.URL`类可以帮助我们构建和解析URL,而`java.net.HttpURLConnection`则可以用来发送HTTP请求。此外,`java.io`包下的输入输出流类用于处理服务器返回的数据。 接着,解析网页内容是抓取URL和Email...

    java抓取任何指定网页的数据

    通过上述分析我们可以看出,Java抓取网页数据主要依赖于`java.net.HttpURLConnection`和`java.util.regex.Pattern`等类。这些工具能够帮助开发者轻松地构建网络请求,并通过正则表达式解析响应内容。此外,还需注意...

    java 获取页面信息

    首先,我们需要创建一个`java.net.URL`对象,传入目标网页的URL字符串。例如: ```java URL url = new URL("http://example.com"); ``` 2. **打开连接**: 使用`openConnection()`方法打开到该URL的连接: ``...

    java URL转PDF文件(完美支持中文)

    2. **获取URL内容**:使用Java的`java.net.URL`和`java.net.URLConnection`类来打开和读取URL的内容。确保设置`URLConnection`的`setUseCaches(false)`和`setDoInput(true)`,以便获取最新的网页内容。 3. **处理...

Global site tag (gtag.js) - Google Analytics