`
guoyiqi
  • 浏览: 1001097 次
社区版块
存档分类
最新评论

通过java.net.URL类抓取某个网页的内容

阅读更多

/**
 文件名 : OpenUrl.Java
 描述 :通过 java.net.URL 类访问一个页面,并且返回结果
 作者: 慈勤强   cqq1978@yeah.net
 参考:http://java.sun.com
  **/
import java.net.*;
import java.io.*;

public class OpenUrl
{
 public String getContent(String strUrl)
 // 一个public方法,返回字符串,错误则返回"error open url"
 {
  try{
   
   URL url=new URL(strUrl);
   BufferedReader br=new BufferedReader(new InputStreamReader(url.openStream()));
   String s="";
   StringBuffer sb=new StringBuffer("");
   while((s=br.readLine())!=null)
   {     
    sb.append(s+"\r\n");    
   }
   br.close();
   return sb.toString();
  }
  catch(Exception e){
   return "error open url" + strUrl;
   
  }  
 }
 
 public static void main(String args[])
 {
  //具体使用方法
  OpenUrl ou=new OpenUrl();
  System.out.println(ou.getContent("http://127.0.0.1"));
 }
 
}

分享到:
评论
1 楼 small.sprite 2007-10-17  
如果文件是xml
如何抓取出xml文件?

相关推荐

    java网络编程抓取指定网页信息--UrlHtml(java源码)

    import java.net.URL; public class UrlHtml { @SuppressWarnings("deprecation") public static void main(String[] s) throws IOException{ try { URL url = new URL("http://www.kum.net.cn"); ...

    Java抓取网页内容三种方式

    它使用 java.net.URL 类来打开一个 URL 连接,然后使用 InputStream 读取网页内容。下面是使用 URL 连接的示例代码: ```java import java.io.*; import java.net.*; public class GetURL { public static void ...

    JAVA线程根据给定URL生成网页快照

    在Java中,可以使用`java.net.URL`和`java.net.HttpURLConnection`类来发起HTTP请求。例如,我们可以创建一个`URL`对象并打开到该URL的连接,然后读取响应的输入流来获取HTML内容: ```java URL url = new URL(...

    java 使用URL访问网页

    在Java编程语言中,访问网页是一项基本...总之,Java通过`java.net.URL`和相关类提供了强大的网络访问能力,能够满足各种网络编程需求。通过不断学习和实践,你可以熟练地使用这些工具进行网页访问、数据交换等任务。

    Jsp抓取页面内容

    java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection(); l_connection.connect(); l_urlStream = l_connection.getInputStream(); java.io.BufferedReader l_reader ...

    java网页下载的四种不同实现

    这是最基础的下载网页的方法,通过`java.net.URL`类建立与网页服务器的连接,然后使用`java.io`流读取网页内容。以下是一个简单的示例: ```java import java.io.InputStream; import java.io.InputStreamReader; ...

    url.zip_Java URL实现文件下载

    在Java中,我们可以使用`java.net.URL`和`java.net.URLConnection`类来建立与远程服务器的连接,并读取数据。以下是一个简单的文件下载示例: ```java import java.io.InputStream; import java.io.OutputStream; ...

    Java抓取URL/Email实例源码

    Java中的`java.net.URL`类可以帮助我们构建和解析URL,而`java.net.HttpURLConnection`则可以用来发送HTTP请求。此外,`java.io`包下的输入输出流类用于处理服务器返回的数据。 接着,解析网页内容是抓取URL和Email...

    Java实现网页抓取

    2. **Java网络编程**:Java提供了丰富的API来处理网络通信,如`java.net.URL`、`java.net.HttpURLConnection`或Apache的HttpClient库。这些类和库可以帮助我们发送HTTP请求并接收响应。 3. **HTML解析**:抓取到...

    通过url网址下载图片,可以选择有代理下载,也可以选择无代理下载

    在Java中,我们可以使用`java.net.URL`类来创建一个表示URL的对象,然后使用`java.net.URLConnection`打开与该URL的连接。一旦连接建立,我们可以读取输入流并将其写入本地文件以保存图片。以下是一个简单的示例: ...

    URL网址链接

    Java提供了一个名为`java.net.URL`的类来处理这些元素。 要创建一个URL对象,你可以使用以下代码: ```java import java.net.URL; public class URLExample { public static void main(String[] args) { try { ...

    java URL转PDF文件(完美支持中文)

    2. **获取URL内容**:使用Java的`java.net.URL`和`java.net.URLConnection`类来打开和读取URL的内容。确保设置`URLConnection`的`setUseCaches(false)`和`setDoInput(true)`,以便获取最新的网页内容。 3. **处理...

    Java抓取网页数据Demo

    在Java中,我们可以使用`java.net.URL`类来建立与目标网页的连接,并通过`java.io.BufferedReader`读取响应。例如: ```java URL url = new URL("http://example.com"); HttpURLConnection connection = ...

    ftp网络下载

    import java.net.URL; public class FilePhoto { /** * 从网络Url中下载文件 * * @param urlStr * @param fileName * @param savePath * @throws IOException */ public static void downLoadByUrl...

    java http方式抓取网页信息 JAVAIO

    以下是一个基本示例,展示如何通过GET方法抓取网页内容: ```java import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.URL; public class ...

    抓取网页中的邮箱地址

    为了实际抓取网页内容,我们可以使用Java的HTTP客户端库,如`java.net.URL`和`java.net.URLConnection`,或者使用第三方库如Apache HttpClient或OkHttp。以下是一个简单的HTTP请求示例: ```java import java.io....

    java 获取页面信息

    首先,我们需要创建一个`java.net.URL`对象,传入目标网页的URL字符串。例如: ```java URL url = new URL("http://example.com"); ``` 2. **打开连接**: 使用`openConnection()`方法打开到该URL的连接: ``...

    url获取的java源代码

    Java标准库中的`java.net.URL`类用于表示和操作URL。你可以创建URL对象,解析字符串形式的URL,并通过该对象执行打开连接、读取数据等操作。 3. **HTTP 协议**: HTTP(超文本传输协议)是互联网上应用最广泛的一...

    Java Socket聊天室与Java URL爬虫源码.zip

    在Java中,我们可以利用java.net.URL、java.net.URLConnection和java.io等类来实现这个功能。 Java URL爬虫的基本流程如下: 1. 定义起始URL,这是爬虫开始抓取的第一个网页。 2. 使用URL类创建URL对象,然后通过...

    java获取网网页中出现的图片及判断网页代码中是否包含有效图片

    在Java中,可以利用`java.net.URL`和`java.net.URLConnection`类来访问和读取网页内容,再通过正则表达式匹配图片链接。以下是一种基本的实现方式: 1. **使用URL类访问网页**:首先,需要使用`java.net.URL`类创建...

Global site tag (gtag.js) - Google Analytics