- 浏览: 84755 次
- 性别:
- 来自: 北京
最新评论
-
alloyer:
感谢分享!
tomcat startup.bat解读 -
maoweiwer:
很好,很强大,学习了.深深的感谢作者的解读,目前学习正需要能明 ...
tomcat startup.bat解读 -
ahaoahao:
你也去过LG CNS面试过啊
面试第四天 -
aiter:
谢谢先! 我现在是换工作。机会确实还是挺多的,呵呵
面试一周 -
chenzengpeng:
加油
我们这些学生还是很好学的很勤奋的··
不怕找不到工作,就 ...
面试一周
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Q 什么是MIME?什么是MIME邮件? A MIME, 全称为“Multipurpose Internet Mail Extensions”, 比较确切的中文名称为“多用途互联网邮件扩展”。它是当前广泛应用的一种电子邮件技术规范,基本内容定义于RFC 2045-2049。 自然,MIME邮件就是符合MIME规范的电子邮件,或者说根据MIME规范编码而成的电子邮件。 在MIME出台之前,使用RFC 822只能发送基本的ASCII码文本信息,邮件内容如果要包括二进制文件、声音和动画等,实现起来非常困难。MIME提供了一种可以在邮件中附加多种不 同编码文件的方法,弥补了原来的信息格式的不足。实际上不仅仅是邮件编码,现在MIME经成为HTTP协议标准的一个部分。 下面举几个MIME邮件的例子,让我们先对MIME编码的格式有个直观的印象。例1是最简单的,只带纯文本 正文,基本上就是RFC 822格式;例2复杂一些,包含纯文本和超文本正文;例3是最复杂的,包含纯文本正文、超文本正文、内嵌资源和文件附件。其中,行号和行号后的空格是为了 分析方便而另外加的,“... ... ... ...”表示此处省略了大段编码。 例1
例2
例3
Q 在开始研究MIME邮件的时候,如何得到这样的源码? A 一些功能比较完善的邮件客户端软件,如微软的Outlook Express,国产的Foxmail等,都提供了查看和保存邮件源码(原始信息)的功能。在Foxmail中,选择邮件列表右键菜单的“原始信息”进行 查看,主菜单的“文件-导出”进行保存。在Outlook Express中,对应的操作分别是“属性”和“另存为”。所保存的.eml文件,可以调用这些程序打开。 Q 请介绍一下MIME邮件的组成? A 总体来说,MIME消息由消息头和消息体两大部分组成。现在我们关注的是MIME邮件,因此在以下的讨论中姑且称“消息”为“邮件”。在上面的例子中,例 1的1-6行,例2的1—8行,例3的1-18行,是邮件头;例1的8—9行,例2的10—82行,例3的20—3128行,是邮件体。邮件头与邮件体之 间以空行进行分隔,如例1的第7行,例2的第9行,例3的第19行。邮件头中不允许出现空行。有一些邮件不能被邮件客户端软件识别,显示的是原始码,就是 因为首行是空行。 邮件头包含了发件人、收件人、主题、时间、MIME版本、邮件内容的类型等重要信息。每条信息称为一个域, 由域名后加“: ”和信息内容构成,可以是一行,较长的也可以占用多行。域的首行必须“顶头”写,即左边不能有空白字符(空格和制表符);续行则必须以空白字符打头,且第 一个空白字符不是信息本身固有的,解码时要过滤掉。如例2的7-8行,例3的4-5行,13-14行,分别属于一个域。 邮件体包含邮件的内容,它的类型由邮件头的“Content-Type”域指出。常见的简单类型有text/plain(纯文本)和text/html(超文本)。 例2和例3中出现的multipart类型,是MIME邮件的精髓。邮件体被分为多个段,每个段又包含段头和 段体两部分,这两部分之间也以空行分隔。常见的multipart类型有三种:multipart/mixed, multipart/related和multipart/alternative。从它们的名称,不难推知这些类型各自的含义和用处。它们之间的层次关 系可归纳为下图所示: +------------------------- multipart/mixed ----------------------------+ 可以看出,如果在邮件中要添加附件,必须定义multipart/mixed段;如果存在内嵌资源,至少要定义 multipart/related段;如果纯文本与超文本共存,至少要定义multipart/alternative段。什么是“至少”?举个例子 说,如果只有纯文本与超文本正文,那么在邮件头中将类型扩大化,定义为multipart/related,甚至multipart/mixed,都是允 许的。 multipart诸类型的共同特征是,在段头指定“boundary”参数字符串,段体内的每个子段以此 串定界。所有的子段都以“--”+boundary行开始,父段则以“--”+boundary+“--”行结束。段与段之间也以空行分隔。在邮件体是 multipart类型的情况下,邮件体的开始部分(第一个“--”+boundary行之前)可以有一些附加的文本行,相当于注释,解码时应忽略。段间 也可以有一些附加的文本行,不会显示出来,如果有兴趣,不妨验证一下。 结合boundary定界和multipart层次关系图,我们分析一下例2和例3的邮件体层次与段嵌套关系。 在例2中,10-12行是附加文本行,13-82行是multipart/alternative型的段,包含两个子段:13-30行是纯文本正文,32-79行是超文本正文。 在例3中,20-21行是附加文本行,22-3127行是multipart/mixed型的段,包含3个子 段:22-171行是multipart/related段,173-1688行与1690-3125行是两个附件。multipart/related 段又包含两个子段:27-61行是multipart/alternative段,63-169行是一个内嵌资源(图片)。 multipart/alternative段又包含两个子段:31-48行是纯文本正文,40-59行是超文本正文。 例1只有纯文本正文,实际上属于multipart层次关系图中的一个特殊情况。如果非要避简就繁,写成下面的形式,也是完全符合MIME精神的。
Q 在邮件头和段头中,有哪一些常见的域? A 在邮件头中,有很多从RFC 822沿用的域名,MIME也增加了一些。常见的标准域名和含义如下
非标准的、自定义域名都以X-开头,例如X-Mailer, X-MSMail-Priority等,通常在接收和发送邮件的是同一程序时才能理解它们的意义。 在段头中,大致有如下一些域
有的域除了值之外,还带有参数。值与参数、参数与参数之间以“;”分隔。参数名与参数值之间以“=”分隔。如 例3的28-29行,Content-Type域的值为“multipart/alternative”,此外有一个参数boundary,值为"--- -=_NextPart_002_007C_01C3115F.80DFC5E0"。又如例3的第176行,Content-Disposition域的 值为“attachment”,此外有一个参数filename,值为“readme.doc”。 Q Content-Type以及它们的参数有哪些形式? A Content-Type都是“主类型/子类型”的形式。主类型有text, image, audio, video, application, multipart, message等,分别表示文本、图片、音频、视频、应用、分段、消息等。每个主类型都可能有多个子类型,如text类型就包含plain, html, xml, css等子类型。以X-开头的主类型和子类型,同样表示自定义的类型,未向IANA正式注册,但大多已经约定成俗了。如application/x- zip-compressed是ZIP文件类型。在Windows中,注册表的“HKEY_CLASSES_ROOT\MIME\Database\ Content Type”内列举了除multipart之外大部分已知的Content-Type。 关于参数的形式,RFC里有很多补充规定,有的允许带几个参数,较为常见的有
其中字符集也能在Windows注册表的“HKEY_CLASSES_ROOT\MIME\Database\Charset”内见到。 Q Content-Transfer-Encoding有哪些?有什么特点? A Content-Transfer-Encoding共有Base64, Quoted-printable, 7bit, 8bit, Binary等几种。其中7bit是缺省的编码方式。电子邮件源码最初设计为全部是可打印的ASCII码的形式。非ASCII码的文本或数据要编码成要求 的格式,如上面的三个例子。Base64, Quoted-Printable是在非英语国家使用最广使的编码方式。Binary方式只具有象征意义,而没有任何实用价值。 Base64将输入的字符串或一段数据编码成只含有{'A'-'Z', 'a'-'z', '0'-'9', '+', '/'}这64个字符的串,'='用于填充。其编码的方法是,将输入数据流每次取6 bit,用此6 bit的值(0-63)作为索引去查表,输出相应字符。这样,每3个字节将编码为4个字符(3×8 → 4×6);不满4个字符的以'='填充。有的场合,以“=?charset?B?xxxxxxxx?=”表示xxxxxxxx是Base64编码,且原文 的字符集是charset。如例3第7行"=?gb2312?B?wLbAtrXEzOwNCg==?="是由简体中文“蓝蓝的天”编码而成的。在段体内 则直接编码,适当时机换行,MIME建议每行最多76个字符。如例3的1697-3125行,是一个ZIP文件的Base64编码。 Quoted-printable根据输入的字符串或字节范围进行编码,若是不需编码的字符,直接输出;若 需要编码,则先输出'=',后面跟着以2个字符表示的十六进制字节值。有的场合,以“=?charset?Q?xxxxxxxx?=”表示 xxxxxxxx是Quoted-printable编码,且原文的字符集是charset。在段体内则直接编码,适当时机换行,换行前额外输出一个'= '。如例3的44-59行,是HTML文本的Quoted-printable编码。其中第45行“=C7=E7=C0=CA”原文是“晴朗”,因为 “晴”的GB2312码是C7E7,“朗”的GB2312码是C0CA。第48、53、57行末尾只有孤零零的'=',表示这是由编码造成的软回车,而非 原文固有的。 近年来,国内多数邮件服务器已经支持8bit方式,因此只在国内传输的邮件,特别是在邮件头中,可直接使用8bit编码,对汉字不做处理。如果邮件要出国,还是老老实实地按Base64或Quoted-printable编码才行。 Q 什么是内嵌资源?它有哪些形式? A 内嵌资源也是MIME的一个发光点,它能使邮件内容变得生动活泼、丰富多彩。可在邮件的multipart/related框架内定义一些与正文关联的图 片、动画、声音甚至CSS样式和脚本的段。通常在HTML正文内,使用超级链接与内嵌资源相联系。如在例3中,HTML正文53-54行,解码后为
它指出用一个Content-ID为007901c3111c$72b978a0$0100007f@bluesky的图片作为背景(cid:xxxxxxxx也是一种超级链接)。而64-169行恰好就是这样一个内嵌资源。 除了用Content-ID进行联系外,还有另外一种常用形式:用普通超级连接和Content-Location。例如: 在HTML正文中,
对应的内嵌资源为
另外,
与
是等效的。 Q 邮件病毒如何利用附件和内嵌资源传播? A 有的邮件附件可能带有病毒,容易理解。附件毕竟是文件,也好预防,不轻易打开就是了。但内嵌资源是在浏览邮件内容时就要访问的,若其中藏有病毒或恶意代码,你在不知不觉中就中招了。如前两年曾经在全球范围内流行的Nimda病毒,功能性源码如下:
它将一个可执行文件作为资源嵌入了框架型页面,却声明这段可执行代码是波形声音类型。由于当时微软的IE(版本5.0 及以下)存在重大安全漏洞,没有检查Content-Type与name的扩展名是否匹配,于是就被轻易骗过了,致使点选或打开邮件时自动运行了这个 “readme.exe”,机器就感染上病毒。带毒的机器利用地址簿向别人发送带毒的邮件,一传十,十传百,Nimda蠕虫大行其道。 纵观历史,病毒刚出来时是厉害,但没有任何一种能够持续肆虐下去。Nimda如此,SARS亦当如此。曰:“多难兴邦,众志成城”,又曰:“非典终将倒下,城市精神永存”,相信我们定能很快战胜“非典”! 病毒库升级是跟在新病毒屁股后进行的,不要过分依赖杀毒软件。一个良好的习惯是关闭邮件预览功能,或者设定预览纯文本部分,先查看邮件源码,确信排除病毒嫌疑后再打开。对陌生人发来的带超文本正文的邮件,尤其要当心。永远不要在邮件客户端软件内直接打开附件。 Q 一些垃圾邮件采取隐藏发件人的方式,如何追查它们来自哪里? A 从上面的邮件头域名表中可以看出,邮件的创建者可以掌握大部分的域的内容,但Received等域由各级服务器自动添加,发件人是鞭长莫及。垃圾邮件一般 采用了群发软件发送,邮件头的From域(发件人地址)可以任意伪造,甚至写成收件人地址(收到了自己并没有发过的垃圾邮件,气愤吧?)。查看 Received域(传输路径)链可以找到真正的出处。每个服务器添加的Received语句都在邮件首,故最下面一个Received就包含了发件人所 用的SMTP或HTTP服务器,及最初的网关外部IP地址。 Receive语句的基本格式是:from A by B。A为发送方,B为接收方。例如:
从上面的例子中不难看出,该邮件的传输路径是:211.99.162.194 → bjapp9.163.net (Coremail 202.108.255.197?) → bjapp9.163.net (Postfix, 202.108.255.197?) → 202.106.182.244。恰好出现了发件人邮箱fanyingxxxx@tom.com,但多数情况不一定能列出来。 此例的localhost [127.0.0.1],意味着bjapp9.163.net上安装了邮件服务代理性质的软件。 |
发表评论
-
memcached性能测试的几组数据
2009-08-22 12:46 5933memcached 及java-client 版本 ... -
resin apache问题
2009-05-19 22:08 4908前几天修改apache配置引起的apache连接resin问题 ... -
Commons-logging + Log4j 入门指南
2008-07-24 14:53 2756基础好文收藏,清晰明了,一看就懂。完全让你理解commons- ... -
java图表 报表
2008-07-18 10:35 5705chartdirector是干什么的? 她是一图形报表工 ... -
tomcat debug
2008-05-30 14:03 0tomcat debug -
tomcat startup.bat解读
2008-05-30 13:32 4299@echo off ... -
面试一周
2008-05-24 23:45 1425上周六到的北京,到今天满满一周啦,小记一下进展。 keyw ... -
面试第四天
2008-05-22 17:15 1830早上接到新锐的电话,很意外,why? 新锐一面 笔试是我这 ... -
面试续
2008-05-22 11:22 10922008.5.20------------------- ... -
面试小记
2008-05-19 22:15 987今天参加了两个公司的面试,小记一下: 1. 8:30公交, ... -
记录几篇javascript的文章
2008-05-11 21:07 991《悟透JavaScript》 绝对好的文章!!! 下 ... -
yaya的工作
2008-02-24 15:51 921过年又一周多时间了,不知道银行卡什么时候通知体检,本以为年 ... -
smtp简介
2007-03-28 23:53 1327什么是 SMTP SMTP (Simple ... -
便于理解jpf
2007-03-14 10:57 1310http://www.ibm.com/developerwor ... -
在javascript中什么情况出现下面三种情况: null undefined “ ”
2007-03-06 10:18 2456在javascript中什么情况出现下面三种情况: nu ... -
[转]字符,字节和编码
2006-12-28 18:43 1145字符,字节和编码 [原创文章,转载请保留或注明出处:http: ... -
java 名字记录
2006-12-19 23:14 1072JDK 1.1.4 Sparkler 宝石 1997-0 ... -
对[jsvm讨论]的了解
2006-12-11 00:36 2155用了这么久的jsvm,还真没去真正的去了解过她.今 ... -
prototype资料收集
2006-12-10 17:56 1054prototype笔记 quick guide to pro ... -
2007年web开发技术预言
2006-12-10 15:31 879收藏一下: http://www.matrix.org.cn/ ...
相关推荐
### MIME类型的自定义 MIME(Multipurpose Internet Mail Extensions)类型是互联网标准协议之一,用于定义数据在网络上传输时的数据格式。MIME类型通常由两部分组成:类型和子类型,中间用斜线分隔。例如,“text/...
MIME(Multipurpose Internet Mail Extensions)类型是一种标准,用于定义不同类型的互联网数据,如文本、图像、音频或视频。在编程领域,特别是Web开发中,正确识别和处理这些类型至关重要。`mime-types`库就是这样...
它主要关注MIME(Multipurpose Internet Mail Extensions)规范,用于定义邮件和其他互联网协议中的数据格式。 - 在4.1.2版本中,这个库已经相当成熟,解决了许多早期版本的已知问题,增强了稳定性和兼容性。 2. *...
### IIS设置MIME类型详解 #### 一、引言 在互联网技术中,MIME类型(Multipurpose Internet Mail Extensions)是一种标准,用于定义数据格式的类型,它主要用于描述网络文件的性质和格式。在IIS(Internet ...
《httpmime-4.3.jar:HTTP MIME处理的利器》 在Java开发中,我们经常需要处理HTTP协议下的MIME(Multipurpose Internet Mail Extensions)类型数据,比如上传或下载文件、发送带有附件的邮件等。Apache HttpClient...
赠送jar包:httpmime-4.5.13.jar; 赠送原API文档:httpmime-4.5.13-javadoc.jar; 赠送源代码:httpmime-4.5.13-sources.jar; 赠送Maven依赖信息文件:httpmime-4.5.13.pom; 包含翻译后的API文档:...
赠送jar包:httpmime-4.5.13.jar; 赠送原API文档:httpmime-4.5.13-javadoc.jar; 赠送源代码:httpmime-4.5.13-sources.jar; 赠送Maven依赖信息文件:httpmime-4.5.13.pom; 包含翻译后的API文档:...
在IT行业中,MimeType(MIME类型)是一种标准,用于标识互联网上的文件类型和编码方式。MimeType文件校验是网络服务中常见的操作,特别是在处理用户上传的文件时,它能确保服务器正确地解析和处理文件。本示例"Mime...
根据提供的文件信息,我们可以深入探讨MIME类型(Multipurpose Internet Mail Extensions)的相关知识点。MIME类型主要用于描述网络文件的格式,通常在网络传输中用于告诉接收方如何解释数据。以下是对标题、描述及...
【MIME学习笔记】 MIME,全称为“Multipurpose Internet Mail Extensions”,中文名为“多用途互联网邮件扩展”,是一组电子邮件技术规范,旨在扩展传统电子邮件的功能。最初,MIME主要是为了解决1982年RFC 822标准...
MIME是一种标准,用于定义非文本格式的数据如何在网络上传输,如图像、音频、视频等。通过httpmime,开发者可以轻松地处理带有附件、多部分表单数据或复杂内容类型的HTTP请求。 二、主要功能 1. POST请求处理:...
MIME(Multipurpose Internet Mail Extensions,多用途互联网邮件扩展)是一种标准,用于定义电子邮件和互联网消息中的非ASCII字符,如图像、音频、视频以及其他类型的多媒体内容。MIME最初是为了改进早期的简单邮件...
全面覆盖:本枚举类内置了广泛使用的MIME类型,从常见的文本、图片、音频到视频格式,应有尽有。 智能检索:提供基于文件扩展名的MIME类型查询方法,只需一行代码即可获取,极大提升了开发效率。 易用性:采用枚举...
MIME(Multipurpose Internet Mail Extensions)是一种用于定义网络上数据类型的规范,最初设计是为了扩展电子邮件系统,使其能够处理非纯文本的信息,如图像、音频、视频等。随着时间的发展,MIME已经成为互联网...
《httpmime-4.1.1:构建HTTP MIME消息的利器》 在IT行业中,HTTP MIME(Multipurpose Internet Mail Extensions)是一种扩展了HTTP协议的消息格式,使得非文本数据如图片、音频、视频等可以在Web上传输。Apache ...
MIME(Multipurpose Internet Mail Extensions)类型是一种标准,用于定义在网络上传输的数据类型。这个标准在互联网上广泛使用,不仅限于电子邮件,还涉及到HTTP协议、文件上传、Web应用程序等多个领域。MIME类型是...
**IIS MIME 类型配置详解** IIS(Internet Information Services)是微软提供的一个强大的Web服务器,它支持多种功能和服务,包括文件的浏览和下载。在IIS中,MIME(Multipurpose Internet Mail Extensions)类型是...
**MIME协议分析** MIME,全称“Multipurpose Internet Mail Extensions”,中文名为“多用途互联网邮件扩展”,是一种广泛应用于电子邮件系统的规范。该协议的基本内容最初定义于RFC 2045-2049,取代了较早的RFC ...
标题中的“httpclient和httpmime的jar包”指的是Apache HttpClient库和HttpMime模块的Java实现,这两个组件在Java开发中常用于处理HTTP通信。Apache HttpClient是一个强大的HTTP客户端API,而HttpMime则提供了处理...