`
hwpok
  • 浏览: 252099 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

URL 网上抓数据

    博客分类:
  • Java
阅读更多
    今天,终于明白了别人是怎么在网上抓数据的.
package com.roadway.phserver.test;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.PrintWriter;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;

/**//**
 * <p>
 * 本类用于Post一个URL,并返回它的内容
 * <p>
 * 
 * @author huiwanpeng
 * @time 2008-1-24
 * @see no
 
*/

public class SendPost {
    
/**//** url */
    private URL url;

    
/**//** url连接 */
    private URLConnection conn;

    
public SendPost() {
    }

    
/**//**
     * <p>
     * 本方法根据一个字符串创建一个URL,并打开URL的连接
     * <p>
     * 
     * @param urlAddr
     *            URL地址
     
*/

    
public void setURL(String urlAddr) {
        try {
            
/**//** 创建一个URL */
            url 
= new URL(urlAddr);
            
/**//** 打开URL连接 */
            conn 
= url.openConnection();
        } catch (MalformedURLException ex) {
            
/**//** 错误URL产生异常 */
            ex.printStackTrace();
        } catch (IOException ex) {
            
/**//** 输入输出异常 */
            ex.printStackTrace();
        }
    }

    
/**//**
     * <p>
     * 本方法用于POST一个消息
     * <p>
     * 
     * @param post
     *            要POST的参数,比如user=huiwanpeng&password=hwp##
     
*/

    
public void sendPost(String post) {
        
/**//** 打算将URL连接进行输入 */
        conn.setDoInput(true);
        
/**//** 打算将URL连接进行输出 */
        conn.setDoOutput(true);
        
/**//** 声明的一个打印输出流 */
        PrintWriter pw 
= null;
        try {
            pw 
= new PrintWriter(conn.getOutputStream());
            pw.
print(post);
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            pw.
close();
        }
    }

    
public String getContent() {
        
/**//** 某一行的内容 */
        String line 
= null;
        
/**//** 最终内容 */
        String result 
= "";
        try {
            
/**//** 打开到此 URL 引用的资源的通信链接 */
            conn.connect();
            BufferedReader br 
= new BufferedReader(new InputStreamReader(conn
                    .getInputStream()));
            
/**//** 一行一行地读,直到读完 */
            
while ((line = br.readLine()) != null) {
                result 
+= line + "\n";
            }
            
/**//** 关闭连接 */
            br.
close();
        } catch (IOException ex) {
            ex.printStackTrace();
        }
        
return result;
    }

    
public static void main(String[] args) {
        String urlAddr 
= "http://www.ip138.com:8080/search.asp";
        String post 
= "action=mobile&mobile=13501678250";
        SendPost test 
= new SendPost();
        test.setURL(urlAddr);
        test.sendPost(post);
        String aa 
= test.getContent().trim();
        System.out.println(aa);
    }
}
分享到:
评论

相关推荐

    URL抓包工具

    URL抓包工具是网络调试和分析中的重要辅助手段,它能帮助我们查看、记录和理解网络数据传输的过程。smsniff工具就是这样一个专门用于抓取HTTP请求数据包的专业软件,尤其适用于HTTP协议的分析和调试。 HTTP(超文本...

    数据抓包工具,可以抓取大众点评的所有数据

    在本例中,我们将讨论如何利用抓包工具来抓取大众点评网上的数据,如图片信息和链接地址。这些工具通常被数据分析师、开发者以及网络管理员用来诊断问题、收集数据或进行安全审计。 首先,我们需要了解抓包工具的...

    tcp/udp数据包格式详解 抓包分析二进制数据代表的意思

    而"使用tcpdump抓的一个udp包_mingri_xing的博客-CSDN博客.url"则指向了一个关于如何使用tcpdump抓取UDP包的教程资源,可以帮助我们进一步理解抓包过程。 理解TCP和UDP数据包的帧格式对于网络工程师、开发者和安全...

    android 抓url参数链接测试

    "android 抓url参数链接测试"这个主题就是关于如何在Android环境中使用第三方工具,如Fiddler2,来捕获和检查应用程序发出的HTTP/HTTPS请求及其包含的参数。 首先,我们需要了解什么是URL参数。URL(统一资源定位符...

    C# http发包抓包程序

    发包(Sending Packets)是指向指定URL发送HTTP请求,通常包括GET、POST等方法,抓包(Packet Capture)则是记录网络流量,以便分析数据交换的过程。这样的工具对于开发者调试Web应用、测试API接口或理解网络通信...

    php的curl抓数据专用.zip

    "php的curl抓数据专用.zip"这个压缩包文件很可能包含了一个封装好的PHP类或函数,方便开发者更便捷地利用cURL进行数据抓取。 首先,我们要理解cURL的基础概念。cURL是一个客户端URL传输库,由Libcurl库提供支持,...

    抓京东的数据,整理成cvs

    【标题】"抓京东的数据,整理成cvs" 涉及的核心知识点是网络爬虫技术和数据处理。网络爬虫是一种自动浏览互联网并提取信息的程序,它通过模拟人类浏览器的行为,请求网页并解析其中的数据。在这个过程中,我们通常会...

    自己动手抓数据-网络爬虫

    《自己动手抓数据-网络爬虫》是一篇深入探讨数据抓取技术的文章,它涵盖了从基础知识到高级应用的全面内容。网络爬虫是信息技术领域的一个重要分支,主要用于自动化地从互联网上获取大量信息,这对于数据分析、市场...

    C#抓包,SnifferHttp使用网卡获取Http请求数据

    网络抓包,简单来说,就是监听网络接口(如网卡)上的数据传输,记录并分析网络中的数据包。在Windows系统中,开发者通常使用WinPCap或Npcap库来访问底层网络接口。然而,对于HTTP协议的特定抓包需求,SnifferHttp...

    commix 数据抓包工具

    **Commix 数据抓包工具详解** Commix 是一个自动化命令注入工具,主要用于测试 Web 应用程序中的命令注入漏洞。它结合了半自动化的技术,能够有效地发现并利用潜在的命令注入点,从而帮助安全研究人员或者渗透测试...

    C#抓包,SnifferHttp使用网卡获取Http请求数据,可以用于监控网卡数据包

    Console.WriteLine($"请求方法: {e.Request.Method}, URL: {e.Request.Url}"); }; sniffer.ResponseReceived += (sender, e) =&gt; { Console.WriteLine($"状态码: {e.Response.StatusCode}, 响应时间: {e.Response....

    URL分类管理C#

    在描述中提到,这个工具是为了解决实习公司在数据分析部门遇到的问题,即需要对大量URL进行认证和管理,并且需要将处理后的结果存储为文本文件供抓包机进行测试。以下将详细介绍这一系统的可能实现和相关知识点: 1...

    通过url获取网络位置上的文件流

    这个过程通常涉及将URL转换为文件流,以便我们可以读取、处理或保存这些远程数据。以下是一个详细的知识点介绍,关于如何在Java中通过URL获取网络位置上的文件流。 1. **URL对象**:首先,我们需要创建一个`java...

    C#获取当前页面的url

    ### C# 获取当前页面的URL 在Web开发中,经常需要获取当前页面的URL以便进行进一步的操作或处理。本文将详细介绍如何使用C#在ASP.NET应用...了解这些细节有助于开发者更好地控制和管理Web应用中的数据流和导航逻辑。

    php的curl抓数据专用

    描述中的“一个封装的curl函数 便于调用(抓数据专用)”进一步确认了这个文件的核心内容。它意味着开发者已经编写了一个自定义函数,将cURL的复杂操作包装起来,使得用户只需要简单调用这个函数,就能实现数据抓取。...

    绿化版-Http数据数据抓包助手

    HTTP是互联网上应用最广泛的数据传输协议,抓包工具能够帮助我们查看这些HTTP请求的具体内容,包括请求方法、URL、状态码、头部信息和数据体等。网络数据分析则涉及对抓取到的HTTP数据进行解析、过滤、排序,以便更...

    IPtool网络数据抓包工具

    **IPtool网络数据抓包工具** 在网络安全与网络诊断领域,数据抓包工具扮演着至关重要的角色。IPtool网络数据抓包工具就是其中的一种实用工具,它被设计用于捕获和分析网络上的数据包,帮助用户理解网络通信的细节,...

    http协议抓包

    HttpWatch是强大的网页数据分析工具.集成在Internet Explorer工具栏.包括网页摘要.Cookies管理.缓存管理.消息头发送/接受.字符查询.POST 数据和目录管理功能.报告输出.HttpWatch 是一款能够收集并显示深层信息的软件...

    安卓APK抓包工具

    在安卓上,使用抓包工具可以查看HTTP请求和响应的详细信息,如请求方法(GET、POST等)、URL、请求头、响应状态码、响应头以及数据体等。这对于调试API接口问题,检查请求是否正确发送,或者分析服务器返回的数据都...

    app数据抓包1

    通过分析抓包得到的URL、请求方法(GET/POST等)、参数和Header,可以使用requests库或类似库来复现这些请求,实现App数据的自动化爬取。 此外,Fiddler还支持自定义脚本,通过.NET语言扩展其功能。对于复杂的网络...

Global site tag (gtag.js) - Google Analytics