转自:http://blog.csdn.net/ahcen001/archive/2006/08/31/1147618.aspx
仅供自己资料积累
1、CGI工作机理
CGI即公共网关接口(Common Gateway Interface)是在WEB服务器上定义了
WEB客户请求与应答的一种方法。客户向服务器的请求只要属于CGI范围,就启
动WEB服务器的一个CGI(网关)程序。它的任务是把客户的请求从网关的环境变
量(下一节细加以描述)中取出,并进行相应的加工处理。由 CGI程序决定如何
对客户的请求做出应答。另外, CGI程序定义标准的方法为服务器及客户标准
的请求与响应信息。因此, CGI是WEB服务器不可缺少的组成部分。
2、环境变量
CGI的标准规定服务器必须通过其环境变量来为CGI的程序传递信息内容。
通常HTTPD服务器的cgi-bin目录中常用test-env的小程序来验证 CGI返回的环
境变量。如:
SERVER_NAME=lab.fjinfo.sti.ac.cn
HTTP_CONNECTION=Keep-Alive
REMOTE_ADDR=168.160.135.21
HTTP_HOST=lab
REQUEST_METHOD=GET
GATEWAY_INTERFACE=CGI/1.1
QUERY_STRING=
REMOTE_USER=chencx
SERVER_SOFTWARE=NCSA/1.5
SERVER_PROTOCOL=HTTP/1.0
REMOTE_HOST=chencx.fjinfo.sti.ac.cn
SERVER_PORT=80
DOCUMENT_ROOT=/usr/local/etc/httpd/htdocs
HTTP_USER_AGENT=Mozilla/3.0 (Win95; I)
HTTP_ACCEPT=image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, */*
SCRIPT_NAME=/cgi-bin/test-env
SERVER_ADMIN=httpd@lab.fjinfo.sti.ac.cn
AUTH_TYPE=Basic
这些变量作出如下解释: SERVER_SOFTWARE是客户机请求的HTTP服务器的软件名称及其改软件的版 本。
SERVER_NAME是HTTP服务器的主机域名。 GATEWAY_INTERFACE是指该服务器的CGI版本。
SERVER_PROTOCOL用于发送请求的协议名称和版本,目前只有HTTP协议支 持CGI的标准。
SERVER_PORT是用于接受客户请求的服务器端口号,常用的是80。
REMOTE_HOST是指用于发送请求的客户机的主机域名。只有当你的客户主 机具有指定的域名时,才有其值。
REMOTE_ADDR是指发送请求的客户机器在HTTP主机上返回的IP地址。 REMOTE_USER是指远程授权用户的用户名。
AUTH_TYPE 是用于保护客户的授权类型。 REQUEST_METHOD是客户机用于发送请求的方法(有GET/POST两种细节在下
一节叙述)。 HTTP_ACCEPT是客户机支持的MIME类型清单,各个类型间用逗号分割。星
号为通配符,它表示可接受任意类型的数据。不过目前许多HTTP服务器尚未使 用这个变量。
PATH_INFO是接在CGI脚本之后的其他路径名信息。 PATH_TRANSLATED
QUERY_STRING是接收来自客户浏览器的数据(参见下节)。
CONTENT_TYPE是用以发送信息的MIME类型。目前常用:application/x- www-form-urlencoded。
CONTENT_LENGTH是指当客户使用POST方法发送的请求时,计算从客户浏览 器发送的字节数。 3、CGI标题及其GET/POST
(1)Header 标题:HTTP服务器通过环境变量与CGI程序进行通信。而CGI程序通过标准
输出把数据以HTML形式送到服务器再到客户。但是, CGI的输出程序必须使用 三个标题行: 第一行,Content-type:
设定输出的数据的MIME输出类型。常用为: Content-type: plain/text或者Content-type:
jpeg/gif。 第二行,Location: 是指输出的文档名称。 第三行,Status 是HTTP的状态码。
见http://www.w3.org/hypertext/WWW/Protocols/HTTP/HTRESP.html
注意这三行必须单独各占一行,并且每一行之后必须有个空行。只有这样服 务器才能解释CGI产生的文档结果。 (2)POST/GET方法
我们将在第四章HTML语言中讲述的form元素时,其产生的表格传送至服务 器的
CGI脚本,即客户浏览器的信息就是通过POST或GET两种方式传至服务器。 POST方法
当客户端的HTML的表格设计采用POST时,CGI中的环境变量REQUEST_METHOD
就返回值是POST。而CONTENT_LENGTH计算出客户传送的信息的数据量(以字节 为单位)。
CGI程序就依CONTENT_LENGTH计算出HTTP何时开始停止阅读从客户
端传来的信息。用POST方式发送的信息只有application/x-www-form-urlen-
coded一种MIME类型数据。并把此类型记录在CONTENT_TYPE之中。
客户不管是以POST还是GET方式向服务器传送信息必须加以编码才能将其 信息数据传至服务器中。
因此,服务器受到来自客户的信息数据时,必须把 URL之后的数据进行解 码(客户浏览器编码的逆过程)使其数据信息恢复原貌。
该过程是(一)把原来用&连在一起的HTML表格变量与其值分开; (二)把原来用=连在一起的HTML表格变量与其值分开;
(三)把各变量和数据中包含十六进制转换成ASCII码等价表示; (四)把各变量和数据中的所有+号替换成空格。
依次把其编码的信息数据还原成客户端输入时的原来面貌。此时 CGI程序 就可对这些数据进行一系列加工和处理。
GET是把客户的表格的数据加到URL的末尾,传送至服务器。故,必须对其
传送的数据加以专门的编码。大家知道URL的标准中保留了若干特殊的字符,
如:&、#、?、=、空格及其任意不可打印的ASCII控制字符。这些对我们的
CGI来讲具有重要的作用。如用+来代替原来的空格字符,保留的字符用%后接 相应的十六进制的
ASCII码值替代。大多数的客户浏览器均可对其进行正确的 编码。但是值得注意的是应防止一些非法的用户通过 CGI的脚本造成对系统安
全的威胁。(如sendmail) GET方法 基于GET方法的CGI程序与POST的程序的运行机理基本相同,只是服务器发
送的数据采用的方式稍微有些差异。它不是把客户浏览器上传到服务器的数据发
送到CGI程序的标准输入,而是将这些数据经编码后由QUERY_STRING环境变量 传输,服务器上的
CGI程序只要识别QUERY_STRING即可。另外,环境变量 REQUEST_METHOD的缺省值为:GET。 4、几种常用数据库接口
(Sybase,mSQL,Informix,Oracle,) CGI 程序可以完成与一些大型数据库的接口。通过标准的客户浏览器达到
对大型数据库的检索或产生动态的页面。近一两年来,国际上各大公司对此都非
常重视,都相应开发出一系列产品,使二者间的接口更容易。例如:微软公司的 Information Server与MS
SQL接口、还有Sybase、Informix、Orcale等 等。你也可以编写一些CGI使浏览器能对Foxpro数据库进行访问。
5、几种常用CGI及其WEB开发语言(C,Perl,Shell,Tcl,Java,VB)
用于开发CGI的几种常用语言有C,Perl,Sh,Tcl等等。除了C是编译型外,
其他几种都是解释型的开发语言。以下只是举一些简单的例子加以说明。至于 每一种语言细节不是本文的范围。 (1)SH
#!/bin/sh
echo Content-type: text/plain
echo
echo CGI/1.0 test script report:
echo
echo argc is $#. argv is "$*".
echo
echo SERVER_SOFTWARE = $SERVER_SOFTWARE
echo SERVER_NAME = $SERVER_NAME
echo GATEWAY_INTERFACE = $GATEWAY_INTERFACE
echo SERVER_PROTOCOL = $SERVER_PROTOCOL
echo SERVER_PORT = $SERVER_PORT
echo REQUEST_METHOD = $REQUEST_METHOD
echo HTTP_ACCEPT = "$HTTP_ACCEPT"
echo PATH_INFO = $PATH_INFO
echo PATH_TRANSLATED = $PATH_TRANSLATED
echo SCRIPT_NAME = $SCRIPT_NAME
echo QUERY_STRING = $QUERY_STRING
echo REMOTE_HOST = $REMOTE_HOST
echo REMOTE_ADDR = $REMOTE_ADDR
echo REMOTE_USER = $REMOTE_USER
echo CONTENT_TYPE = $CONTENT_TYPE
echo CONTENT_LENGTH = $CONTENT_LENGTH
这是用UNIX上的SH编写的简单CGI小程序,是用来检测WEB服务器的 CGI的 环境变量值。大家可以从这些环境变量编写更深入的程序。
(2)Perl (Practical Extraction and Report Language)
Perl是一种优秀的解释型的文本处理语言。目前已被一些 CGI专家们广泛 使用。目前不仅有UNIX版本,还有Windows
或其他OS的版本。其语法具有同样 的规则。 #程序名:cgi_handlers.pl #用
途:处理由HTML的客户端的FORM的输入的数据,并处理成为 CGI 内部可用参数。包括输入、输出及其中间代码转化等全过程。
sub get_request {
if ($ENV{'REQUEST_METHOD'} eq "POST") {
read(STDIN, $request, $ENV{'CONTENT_LENGTH'});
} elsif ($ENV{'REQUEST_METHOD'} eq "GET" ) {
$request = $ENV{'QUERY_STRING'};
}
%rqpairs = &url_decode(split(/[&=]/, $request));
}
sub url_decode {
foreach (@_) {
tr/+/ /;
s/%(..)/pack("c",hex($1))/ge;
}
@_;
}
sub html_header {
local($title) = @_;
print "Content-type: text/html/n/n";
print "< html >< head >/n";
print "< title >$title< /title >/n";
print "< /head >/n< body >/n";
}
sub html_trailer {
local($sec, $min, $hour, $mday, $mon, $year, $wday, $yday, $isdst)
= gmtime;
local($mname) = ("Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul",
"Aug", "Sep", "Oct", "Nov", "Dec")[$mon];
local($dname) = ("Sun", "Mon", "Tue", "Wed", "Thu", "Fri",
"Sat")[$wday];
print "< p >/nGenerated by: $0< br >/n";
print "Date: $hour:$min:$sec UT on $dname $mday $mname $year.< p
>/n";
print "< /body >< /html >/n";
}
1;
(3)C语言 用C语言编写CGI程序类似于其他语言,只是要加以编译成可执行文件即可。
因此,用C语言进行CGI程序的编写具有更高的安全性。下面是一个用C编写CGI 小程序,仅供参考。
#include
#include
#define MAX_ENTRIES 10000
typedef struct {
char *name;
char *val;
} entry;
char *makeword(char *line, char stop);
char *fmakeword(FILE *f, char stop, int *len);
char x2c(char *what);
void unescape_url(char *url);
void plustospace(char *str);
main(int argc, char *argv[]) {
entry entries[MAX_ENTRIES];
register int x,m=0;
int cl;
if(strcmp(getenv("REQUEST_METHOD"),"POST")) exit(1);
if(strcmp(getenv("CONTENT_TYPE"),"application/x-www-form-urlencoded"))
exit(
cl = atoi(getenv("CONTENT_LENGTH"));
for(x=0;cl>0 && (!feof(stdin));x++) {
m=x;
entries[x].val = fmakeword(stdin,'&',&cl);
plustospace(entries[x].val);
unescape_url(entries[x].val);
entries[x].name = makeword(entries[x].val,'=');
}
for(x=0; x <= m; x++)
printf("%s %s%/n",entries[x].name, entries[x].val);
}
(4)TCL TCL即Tool Command Language,它是高级的跨平台的 Script语言,它与 Perl、C
shell具有相识的机理不同的语法。
proc subhex {v} {
set nv $v
while {[regexp {%[0-9A-F][0-9A-F]} $v blah]} {
scan $blah "%%%x" cv
if {[ctype char $cv]=="&"} {
regsub -all $blah $v //& nv
} else {
regsub -all $blah $v [ctype char $cv] nv
}
set v $nv
}
return $v
}
proc http_proc_args {arg} {
global ar artype
upvar $arg argv
set bigarg ""
#join words with +'s
if [llength $argv]==2 {
set bigarg [split [lindex $argv 1] &]
set path [lindex $argv 0]
set args [split [crange $path 1 end] /]
} else {
set a0 [lindex $argv 0]
if {[cindex $a0 0]=="/"} {
set bigarg {}
set args [split [crange $a0 1 end] /]
} else {
set bigarg [split $a0 &]
set args {}
}
}
foreach arg [concat $bigarg $args] {
if [regexp {(.*)=(.*)} $arg foo name value] {
set name [subhex $name]
if ![info exists argcount($name)] {
set argcount($name) 1
} else {
incr argcount($name)
}
}
}
#split assignments on the '&'
foreach arg [concat $bigarg $args] {
if [regexp {(.*)=(.*)} $arg foo name value] {
regsub -all {/+} $value { } newval
set name [subhex $name]
set val [subhex $newval]
if ![info exists ar($name)] {
if [info exists artype($name)] {
if {$artype($name)=="list"} {
if {$val!=""} {
set ar($name) [list $val]
} else {
set ar($name) {}
}
} else {
set ar($name) $val
}
} else {
set ar($name) $val
}
} else {
# multiple selection
lappend ar($name) $val
}
}
}
}
#makes URL extended pathname to encode current state
proc pkg_attrs {var attrs} {
upvar $var ar
set al ""
foreach i $attrs {
if [info exists ar($i)] {
# regsub { } $ar($i) {+} att
set al "$al/$i=$att"
}
}
return $al
}
proc http_proc_cgi_args {} {
global ar artype
global env
set bigarg ""
#join words with +'s
if [info exists env(PATH_INFO)] {
set args [split [crange $env(PATH_INFO) 1 end] /]
} else {
set args {}
}
if [info exists env(QUERY_STRING)] {
set bigarg [split $env(QUERY_STRING) &]
} else {
set bigarg {}
}
foreach arg [concat $bigarg $args] {
if [regexp {(.*)=(.*)} $arg foo name value] {
set name [subhex $name]
if ![info exists argcount($name)] {
set argcount($name) 1
} else {
incr argcount($name)
}
}
}
#split assignments on the '&'
foreach arg [concat $bigarg $args] {
if [regexp {(.*)=(.*)} $arg foo name value] {
regsub -all {/+} $value { } newval
set name [subhex $name]
set val [subhex $newval]
if ![info exists ar($name)] {
if [info exists artype($name)] {
if {$artype($name)=="list"} {
if {$val!=""} {
set ar($name) [list $val]
} else {
set ar($name) {}
}
} else {
set ar($name) $val
}
} else {
set ar($name) $val
}
} else {
# multiple selection
lappend ar($name) $val
}
}
}
}
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/ahcen001/archive/2006/08/31/1147618.aspx
分享到:
相关推荐
3. 嵌入式WEB服务器原理:深入理解嵌入式WEB服务器的工作原理,包括HTTP守护任务、CGI程序、串口通信等关键技术。 4. 硬件接口技术:了解硬件接口标准,包括UART、SD卡接口、网络接口等,并掌握接口技术在嵌入式WEB...
通用网关接口(Common Gateway Interface,简称CGI)是一种标准,它定义了Web服务器程序与信息提供程序之间如何进行通信。CGI规范允许Web服务器运行独立的外部程序(通常称为CGI程序或CGI脚本),并将HTTP请求传递给...
通过这篇文章,读者可以了解到利用Python进行Web服务器开发的流程和相关知识点,并对HTTP协议、Socket编程、多线程等关键技术有更深刻的理解。这些知识对于希望深入了解网络编程和Web服务开发的读者来说是非常宝贵的...
尽管它已经不是主流的选择,但了解CGI的工作原理及其开发方法仍然具有一定的价值。 #### CGI的介绍 CGI是一种用于定义Web服务器如何与外部应用程序进行交互的标准协议。通过CGI,Web服务器可以接收HTTP请求并将这些...
在"CGI程序设计自学通"这本书中,你将深入理解CGI的基本原理、工作流程及其在Web开发中的应用。 1. **CGI基本概念** - CGI的定义:CGI是Web服务器与外部程序之间的桥梁,用于处理动态请求。 - 功能:接收用户通过...
1. **CGI简介**:介绍CGI的概念、工作原理及其在Web开发中的角色。 2. **环境搭建**:指导读者设置CGI开发环境,包括Web服务器的配置和CGI脚本的执行路径设置。 3. **编程语言选择**:对比Perl、Python、C等CGI常用...
CGI技术的全面接触,让我们深入了解其工作原理及其在现代Web开发中的重要性。 CGI的基本工作流程是这样的:当用户通过浏览器访问一个URL时,Web服务器接收到请求后,会调用CGI程序来处理这个请求。CGI程序读取这些...
这个名为“cgi_test.rar”的压缩包包含了一个CGI示例,用于帮助理解CGI的工作原理及其在实际应用中的使用。 CGI的核心概念是作为一个中介,当用户通过浏览器请求特定的URL时,Web服务器会启动CGI程序,传递请求参数...
这个资源合集提供了一些关于CGI的经典电子书和课件,对于学习和理解CGI工作原理及其应用非常有价值。 CGI的核心概念是将用户通过浏览器发送的HTTP请求转发给服务器上的一个可执行程序(CGI脚本),这个脚本处理请求...
这个教程将全面深入地探讨CGI的概念、工作原理及其在程序设计中的应用,为初学者提供一个全面的了解和实践平台。 首先,我们要理解CGI的核心概念。CGI是一个接口,它允许Web服务器调用非Web服务器程序来处理用户...
1. CGI(通用网关接口)的定义及工作原理,它如何使得Web服务器能够执行服务器端脚本。 2. 使用C语言编写的CGI程序的基本结构,包括如何读取HTTP请求中的数据和如何输出HTTP响应。 3. HTML表单的设计,理解表单的`...
1. **CGI工作原理**:CGI程序作为Web服务器的“中间人”,接收HTTP请求,处理后生成HTTP响应。服务器接收到请求后,启动CGI进程,传递请求数据,CGI进程执行并生成响应内容,再返回给服务器,最后由服务器发送回...
- **原理-实例-分析模式**:本书采用了一种非常有效的教学方法——“原理-实例-分析”,先介绍理论基础,然后通过具体实例进行演示,最后对实例进行深入分析,使读者能够深刻理解每个组件的工作机制及其在Web开发中...
1. **CGI原理**:CGI提供了一种方式,使得Web服务器可以调用外部程序(如脚本或二进制可执行文件)来处理HTTP请求。当用户在聊天室中发送消息时,浏览器将消息封装成HTTP请求发送到服务器,服务器启动CGI程序处理...
CGI(Common Gateway Interface,通用网关接口)是Web服务器与外部应用程序之间通信的一种标准协议。它是1993年由NCSA(国家超级计算...学习CGI不仅有助于理解Web服务器的工作原理,也是掌握动态网页开发的重要一环。
CGI(Common Gateway Interface,通用网关接口)是Web服务器与外部程序进行交互的一种标准协议。这个简明教程全面地涵盖了CGI的基本概念、工作原理以及如何编写CGI程序。以下是对CGI及其相关知识点的详细说明: 1. ...
通过深入研究VBCgi.bas源码,我们可以更深入地了解CGI的工作机制,这对于开发自定义的Web服务扩展或理解Web服务器与应用之间的交互非常有帮助。同时,这也是一次了解Basic编程语言及其在网络编程中应用的好机会。
总结,MDM9x35 WEB工作流程涉及到Web服务器、CGI技术、设备配置流程、接口差异分析等多个方面,这些知识点对于网络工程师、移动设备开发者以及系统管理员来说都是关键信息,他们需要掌握这些知识来有效管理和优化...
通过它,你可以深入理解Web服务器的工作机制,学习CGI编程,甚至可以自定义开发符合特定需求的Web服务应用。同时,这也是一个很好的教学资源,对于网络通信类和资源开发的学习者来说,能够提升对Web服务器及其相关...