`

对CURL的一些研究

阅读更多

对CURL的一些研究


前两天看到有人求客户端socket 发HTTP包的代码,受flw版主启发找了一些perl的资料,不过对perl 还是不太熟悉。也没有深入的研究。无意中发现了libcurl.so 这个库。去google上搜索发现它是处理客户端发送HTTP请求的库 以及可以处理web服务器回送回来的包。研究了两天将研究的成果,共享出来给大家一起研究。


参考:http://curl.haxx.se/  这是curl开发者的首页。


利用libcurl.so库 我们能轻松的连接某个web站点。获得某个首页的html代码 或者是http 请求的头部。 还可以提交表单,

此外它还支持ftp,https,


/usr/include/curl/curl.h 中。


1 CURLcode curl_global_init(long flags);


描述:

这个函数只能用一次。(其实在调用curl_global_cleanup 函数后仍然可再用)

如果这个函数在curl_easy_init函数调用时还没调用,它讲由libcurl库自动完成。


参数:flags


CURL_GLOBAL_ALL           //初始化所有的可能的调用。

CURL_GLOBAL_SSL           //初始化支持 安全套接字层。

CURL_GLOBAL_WIN32         //初始化win32套接字库。

CURL_GLOBAL_NOTHING     //没有额外的初始化。



2 void curl_global_cleanup(void);


描述:在结束libcurl使用的时候,用来对curl_global_init做的工作清理。类似于close的函数。


3 char *curl_version( );


描述: 打印当前libcurl库的版本。



4 CURL *curl_easy_init( );


描述:

curl_easy_init用来初始化一个CURL的指针(有些像返回FILE类型的指针一样). 相应的在调用结束时要用curl_easy_cleanup函数清理.

一般curl_easy_init意味着一个会话的开始. 它的返回值一般都用在easy系列的函数中.


5  void curl_easy_cleanup(CURL *handle);


描述:

这个调用用来结束一个会话.与curl_easy_init配合着用. 


参数:

CURL类型的指针.


6  CURLcode curl_easy_setopt(CURL *handle, CURLoption option, parameter);


描述: 这个函数最重要了.几乎所有的curl 程序都要频繁的使用它.

它告诉curl库.程序将有如何的行为. 比如要查看一个网页的html代码等.

(这个函数有些像ioctl函数)


参数:

1 CURL类型的指针

2 各种CURLoption类型的选项.(都在curl.h库里有定义,man 也可以查看到)

3 parameter 这个参数 既可以是个函数的指针,也可以是某个对象的指针,也可以是个long型的变量.它用什么这取决于第二个参数.


CURLoption 这个参数的取值很多.具体的可以查看man手册.


7 CURLcode curl_easy_perform(CURL *handle);


描述:这个函数在初始化CURL类型的指针 以及curl_easy_setopt完成后调用. 就像字面的意思所说perform就像是个舞台.让我们设置的

option 运作起来.


参数:

CURL类型的指针.


对CURL的一些研究


下面来看一个简单的例子:

用来获得某个主页的html代码


[code]#include <stdio.h>;

#include <curl/curl.h>;

#include <stdlib.h>;


int main(int argc, char *argv[])

{

    CURL *curl;                        //定义CURL类型的指针

    CURLcode res;                //定义CURLcode类型的变量


    if(argc!=2)

    {

        printf("Usage : file <url>;\n");

        exit(1);

    }


    curl = curl_easy_init();        //初始化一个CURL类型的指针

    if(curl!=NULL)

    {

        //设置curl选项. 其中CURLOPT_URL是让用户指定url. argv[1]中存放的命令行传进来的网址

        curl_easy_setopt(curl, CURLOPT_URL, argv[1]);        

        //调用curl_easy_perform 执行我们的设置.并进行相关的操作. 在这里只在屏幕上显示出来.

        res = curl_easy_perform(curl);

        //清除curl操作.

        curl_easy_cleanup(curl);

    }

    return 0;

}


编译: gcc -o 001 -Wall 001.c -lcurl


我们来获得www.www.lslnet.com/linux 主页的html代码


./001 www.www.lslnet.com/linux


对CURL的一些研究


再来看一个例子:

实际编程时 我们未必只显示出来.我们的目的是要对获得html代码做相应的处理.比如检验关键字,发现重要信息等等.


那么我们就需要把获得的html代码存入相应的文件中.看下面一个例子


[code]

#include <stdio.h>;

#include <stdlib.h>;

#include <unistd.h>;


#include <curl/curl.h>;

#include <curl/types.h>;

#include <curl/easy.h>;


FILE *fp;  //定义FILE类型指针


size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream)  //这个函数是为了符合CURLOPT_WRITEFUNCTION, 而构造的

{

    int written = fwrite(ptr, size, nmemb, (FILE *)fp);

    return written;

}


int main(int argc, char *argv[])

{

    CURL *curl;


    curl_global_init(CURL_GLOBAL_ALL);  

    curl=curl_easy_init();

    curl_easy_setopt(curl, CURLOPT_URL, argv[1]);  


    if((fp=fopen(argv[1],"w"))==NULL)

    {

        curl_easy_cleanup(curl);

        exit(1);

    }

    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data);  //CURLOPT_WRITEFUNCTION 将后继的动作交给write_data函数处理

    curl_easy_perform(curl);

    curl_easy_cleanup(curl);

    exit(0);

}


gcc -o 002 -Wall 002.c -lcurl

./002 www.www.lslnet.com/linux

这个例子就将html代码保存在了www.www.lslnet.com/linux文件中了.


对CURL的一些研究


此外还可以获得http报文的头部 post表单 等等. 这里就不详细的介绍了. 具体的可以man curl_easy_setopt

(要用到一个重要的结构体,HttpPost)




下面看一个从ftp站点下载文件的例子.



[code]#include <stdio.h>;

#include <curl/curl.h>;

#include <curl/types.h>;

#include <curl/easy.h>;


struct FtpFile   //定义一个结构为了传递给my_fwrite函数.可用curl_easy_setopt的CURLOPT_WRITEDATA选项传递

{

        char *filename;

        FILE *stream;

};


int my_fwrite(void *buffer, size_t size, size_t nmemb, void *stream)

{

        struct FtpFile *out=(struct FtpFile *)stream;  // stream指针其实就是 指向struct FtpFile ftpfile的

        if(out && !out->;stream)

        {

                out->;stream=fopen(out->;filename, "wb"); //没有这个流的话就创建一个 名字是out->;filename.

                if(!out->;stream)

                return -1;

        }

        return fwrite(buffer, size, nmemb, out->;stream);

}


int main(int argc, char *argv[])

{

        CURL *curl;

        CURLcode res;

        struct FtpFile ftpfile={argv[2],NULL};  //初始化一个FtpFile结构 

        curl_global_init(CURL_GLOBAL_DEFAULT);


        curl = curl_easy_init();

        if(curl)

        {

                curl_easy_setopt(curl, CURLOPT_URL,argv[1]);

                curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, my_fwrite);

                curl_easy_setopt(curl, CURLOPT_WRITEDATA, &ftpfile);  //给相关函数的第四个参数 传递一个结构体的指针

                curl_easy_setopt(curl, CURLOPT_VERBOSE, TRUE);  //CURLOPT_VERBOSE 这个选项很常用 用来在屏幕上显示对服务器相关操作返回的信息


                res = curl_easy_perform(curl);

                curl_easy_cleanup(curl);


                if(CURLE_OK != res)

                        fprintf(stderr, "curl told us %d\n", res);

        }

        if(ftpfile.stream)

        fclose(ftpfile.stream);

        curl_global_cleanup();


        return 0;

}


gcc -o 003 -Wall 003.c -lcurl

./003  ftp://202.96.64.144/fei.gif    fei.gif



我有个匿名的ftp的网址 将目录下的fei.gif 保存到本地 也叫fei.gif



此外还有curl_escape curl_unescape函数用来转换 汉字成 %XX 这种类型.以及转换回来.如果要下载带有汉字的文件.先要调用将字符串转换一下.


curl 库 还有好多功能. 有待大家来挖掘.

分享到:
评论

相关推荐

    Curl.zip_C++ curl_DEMO_c++ curl_curl_curl c++

    Curl.zip 文件包含了一个在Windows环境下使用C++开发的CURL库示例程序。CURL是一个流行的开源...在研究DEMO时,注意观察如何初始化CURL,设置选项,处理数据,以及正确地清理资源,这些都是理解和使用CURL的关键步骤。

    CURL 源码和实例

    CURL,全称为“Client URL Library”,是一款强大的命令行工具,用于传输数据到或从URL。...CURL支持众多协议,包括HTTP、HTTPS、FTP...如果你想要深入理解网络通信或打造自己的网络工具,研究CURL源码是一个不错的选择。

    curl win64 curl安装包

    在Elasticsearch中有使用的场景,因此这里研究下如何在windows下执行curl命令。 在官网处下载工具包:http://curl.haxx.se/download.html 下载好后解压 配置环境变量 CURL_HOME指到文件目录 path指到bin目录 ...

    curl-curl-7_53_1 (2).zip

    通过对源代码的研究,开发者可以了解网络通信的底层细节,提升网络编程技能。 6. **应用场景** - **Web爬虫**: curl库常用于编写爬虫程序,抓取网页数据。 - **自动化测试**: 在自动化测试场景中,curl可以模拟...

    利用CURL写下载工具

    CURL是一种强大的命令行工具,用于传输数据到或从服务器,使用各种协议,如HTTP、HTTPS、FTP等。...随着对CURL API的深入理解和实践,你可以创建出适应各种下载需求的工具,甚至可以扩展到支持更多协议和复杂场景。

    curl-7.38.0 开源库源码

    curl-7.38.0是该库的一个特定版本,适用于VC6到VC10的Visual Studio编译环境,这意味着它具有良好的跨平台兼容性和对老版本编译器的支持。 一、curl库的核心功能 1. **多种协议支持**:curl库不仅支持HTTP和HTTPS...

    curl-7.26.0压缩包

    此外,`curl` 的源码也是研究 C 语言编程、网络编程和多线程编程的好材料。 总之,`curl-7.26.0` 压缩包为开发者提供了一个深入了解网络数据传输和客户端实现的机会,无论是学习还是实际开发工作,都能从中受益。...

    curl-7.20.1.tar.gz

    - **教育研究**: 学习HTTP协议和网络编程时,curl是理想的实践工具,方便理解网络请求的细节。 综上所述,curl-7.20.1.tar.gz不仅代表了一个历史版本的curl工具,也展示了开源软件的分发和使用方式。了解和掌握...

    curl-7.61.0源码

    `curl-7.61.0`中的测试用例提供了对功能的全面覆盖,是学习`curl`行为和调试的好资源。通过运行测试,开发者可以确保自己的修改没有破坏现有功能。 9. **移植性** `curl`设计为跨平台,源码中包含了针对不同操作...

    Curl IDE6.0

    CurlCurl是由美国国防部高级研究项目代理资助,马萨诸塞州科技学院的David A. Kranz开发的Web开发语言, HTML语言的创建者Tim Berners-Lee也参与其中,并扮演了重要的角色。  Curl语言是一种编程语言,它被设计...

    curl源码包

    对于开发者来说,深入研究curl源码可以帮助理解网络通信的底层原理,提升网络编程能力。可以从以下几个方面入手: 1. 阅读`main.c`,理解如何初始化curl并执行一个请求。 2. 分析`libcurl`中的函数,了解不同协议的...

    curl-7.37.0简单下载多线程下载断点续载范例_非常简洁

    **正文** `curl` 是一个强大的命令行工具,用于传输数据到或从网络。...本篇文章将深入讲解 `curl...在 `curl-7.37.0` 的源码中,可以进一步学习和研究其背后的实现原理,这对于提升个人技能和解决实际问题都非常有帮助。

    curl源代码分析(包含源代码)

    《curl源代码分析》 curl,一个开源的命令行工具,用于传输数据,支持众多网络协议,包括HTTP、FTP、SMTP等。...通过对curl源代码的细致研究,我们可以提高网络编程能力,更好地应对各种网络通信挑战。

    curl-7.79.1.rar_libcurl.lib源码,含教程说明

    **CURL库详解** CURL库,全称为Client URL Library,是一个开源的命令行工具和库,用于在各种协议下进行文件传输。...对于希望提升网络编程技能的开发者而言,深入研究CURL库和libcurl是很有价值的。

    Curl HTTP客户端源码,用于访问WEB服务器

    在研究Curl的源码时,你可以学习到如何处理网络连接、解析响应、错误处理、内存管理和线程同步等基础但重要的编程技术。通过深入理解Curl的实现,开发者可以提升对网络编程的理解,提高解决实际问题的能力。此外,...

    curl 7.17.1

    **正文** `curl 7.17.1`是一个经典的版本,属于curl工具系列,它是一个功能强大的命令行工具,用于传输数据到或从服务器,使用各种网络协议,...同时,对curl的熟练掌握也是自动化脚本和系统管理中的一项重要技能。

    curl 7.21.3

    通过研究`curl 7.21.3`的源代码,开发者不仅可以深入理解网络通信的底层机制,还可以学习到命令行工具设计、错误处理、多线程编程等多个方面的知识。同时,这也有助于学习如何编写跨平台、高度可配置的开源软件。

    curl-7.49.1

    《curl-7.49.1:探索强大的命令行HTTP客户端》 curl是一个广泛使用的开源命令行工具,用于传输数据到或从服务器,支持多种协议...通过对源码的学习和研究,我们可以更深入地理解网络通信的细节,提升我们的技术能力。

    curl-7.27.0.rar

    在curl-7.27.0这个版本中,包含了完整的源代码,这为开发者提供了深入研究和定制curl的机会。源代码结构清晰,模块划分明确,方便用户了解其工作原理,并可以根据需求进行二次开发。此外,源代码中的文档和示例代码...

    curl-7.31 原码

    **curl-7.31 原码** ...总结来说,`curl-7.31` 原码提供了一个深入了解网络数据传输和协议处理的机会,对开发者和研究人员具有很高的价值。通过分析和修改源代码,可以定制自己的网络工具,满足特定场景的需求。

Global site tag (gtag.js) - Google Analytics