1.
昨天的《MIME笔记》中提到,MIME主要使用两种编码转换方式----Quoted-printable和Base64----将8位的非英语字符转化为7位的ASCII字符。
虽然这样的初衷,是为了满足电子邮件中不能直接使用非ASCII码字符的规定,但是也有其他重要的意义:
a)所有的二进制文件,都可以因此转化为可打印的文本编码,使用文本软件进行编辑;
b)能够对文本进行简单的加密。
2.
首先,简单介绍一下Quoted-printable编码转换方式。它主要用于ACSII文本中夹杂少量非ASCII码字符的情况,不适合于转换纯二进制文件。
它规定将每一个8位的字节,转换为3个字符。
第一个字符是"="号,这是固定不变的。
后面二个字符是二个十六进制数,分别代表了这个字节前四位和后四位的数值。
举例来说,ASCII码中"换页键"(form feed)是12,二进制形式是00001100,写成十六进制就是0C,因此它的编码值为"=0C"。"="号的ASCII值是61,二进制形式是00111101,因为它的编码值是"=3D"。除了可打印的ASCII码以外,所有其他字符都必须用这种方式进行转换。
所有可打印的ASCII码字符(十进制值从33到126)都保持原样不变,"="(十进制值61)除外。
3.
下面,详细介绍Base64的编码转换方式。
所谓Base64,就是说选出64个字符----小写字母a-z、大写字母A-Z、数字0-9、符号"+"、"/"(再加上作为垫字的"=",实际上是65个字符)----作为一个基本字符集。然后,其他所有符号都转换成这个字符集中的字符。
具体来说,转换方式可以分为四步。
第一步,将每三个字节作为一组,一共是24个二进制位。
第二步,将这24个二进制位分为四组,每个组有6个二进制位。
第三步,在每组前面加两个00,扩展成32个二进制位,即四个字节。
第四步,根据下表,得到扩展后的每个字节的对应符号,这就是Base64的编码值。
0 A 17 R 34 i 51 z
1 B 18 S 35 j 52 0
2 C 19 T 36 k 53 1
3 D 20 U 37 l 54 2
4 E 21 V 38 m 55 3
5 F 22 W 39 n 56 4
6 G 23 X 40 o 57 5
7 H 24 Y 41 p 58 6
8 I 25 Z 42 q 59 7
9 J 26 a 43 r 60 8
10 K 27 b 44 s 61 9
11 L 28 c 45 t 62 +
12 M 29 d 46 u 63 /
13 N 30 e 47 v
14 O 31 f 48 w
15 P 32 g 49 x
16 Q 33 h 50 y
因为,Base64将三个字节转化成四个字节,因此Base64编码后的文本,会比原文本大出三分之一左右。
4.
举一个具体的实例,演示英语单词Man如何转成Base64编码。
Text content | M | a | n | |||||||||||||||||||||
ASCII | 77 | 97 | 110 | |||||||||||||||||||||
Bit pattern | 0 | 1 | 0 | 0 | 1 | 1 | 0 | 1 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | 1 | 1 | 0 |
Index | 19 | 22 | 5 | 46 | ||||||||||||||||||||
Base64-Encoded | T | W | F | u |
第一步,"M"、"a"、"n"的ASCII值分别是77、97、110,对应的二进制值是01001101、01100001、01101110,将它们连成一个24位的二进制字符串010011010110000101101110。
第二步,将这个24位的二进制字符串分成4组,每组6个二进制位:010011、010110、000101、101110。
第三步,在每组前面加两个00,扩展成32个二进制位,即四个字节:00010011、00010110、00000101、00101110。它们的十进制值分别是19、22、5、46。
第四步,根据上表,得到每个值对应Base64编码,即T、W、F、u。
因此,Man的Base64编码就是TWFu。
5.
如果字节数不足三,则这样处理:
a)二个字节的情况:将这二个字节的一共16个二进制位,按照上面的规则,转成三组,最后一组除了前面加两个0以外,后面也要加两个0。这样得到一个三位的Base64编码,再在末尾补上一个"="号。
比如,"Ma"这个字符串是两个字节,可以转化成三组00010011、00010110、00010000以后,对应Base64值分别为T、W、E,再补上一个"="号,因此"Ma"的Base64编码就是TWE=。
b)一个字节的情况:将这一个字节的8个二进制位,按照上面的规则转成二组,最后一组除了前面加二个0以外,后面再加4个0。这样得到一个二位的Base64编码,再在末尾补上两个"="号。
比如,"M"这个字母是一个字节,可以转化为二组00010011、00010000,对应的Base64值分别为T、Q,再补上二个"="号,因此"M"的Base64编码就是TQ==。
6.
再举一个中文的例子,汉字"严"如何转化成Base64编码?
这里需要注意,汉字本身可以有多种编码,比如gb2312、utf-8、gbk等等,每一种编码的Base64对应值都不一样。下面的例子以utf-8为例。
首先,"严"的utf-8编码为E4B8A5,写成二进制就是三字节的"11100100 10111000 10100101"。将这个24位的二进制字符串,按照第3节中的规则,转换成四组一共32位的二进制值"00111001 00001011 00100010 00100101",相应的十进制数为57、11、34、37,它们对应的Base64值就为5、L、i、l。
所以,汉字"严"(utf-8编码)的Base64值就是5Lil。
相关推荐
jquery.base64.js
标题“笔记_base64_”暗示了这是一个关于Base64编码技术的学习笔记或教程,可能包含了如何使用Python进行Base64编码和解码的实践示例。 描述中提到的“此代码是用python编写的,目的是解决base64隐写问题”,这指的...
python中base64编码解码模块的使用笔记, 超级详细. 语法规划, 应用举例. 原理说明.
1. Overview of Operators in SAS Definitions: A SAS operator is a symbol that represents a comparison, arithmetic calculation, or logical operation; a SAS function; or grouping parentheses....
Oceanbase OBCP学习笔记
安卓逆向学习笔记之unicorn来trace还原OLLVM Base64.docx
一个示例项目,展示了如何使用 Picasso Android 库下载和显示用作 Base64 字符串的图像。 整个想法是基于使用自定义毕加索实例和自定义下载实现。 笔记 Anroid 应用程序未实现任何缓存机制(内存或磁盘),因此...
sudo rpm -ivh oceanbase-3.1.0-x86_64.rpm ``` 安装过程中,系统可能会提示你确认依赖关系和许可协议,按照提示操作即可。 OceanBase安装完成后,你需要配置环境变量。编辑~/.bashrc或~/.bash_profile文件,添加...
二:实现crypto&base64加密 关键字:base64 crypto 首先使用npm包管理工具安装 base64.js 和crypto.js 或者可以直接下载,这儿不做详解安装过程 因为需要使用sha1 和hmac 所以一同下载下来 (此图片来源于网络,如有...
java基础的上课笔记,对于初学java的人有很大的帮助
OceanBase OBCP认证是针对OceanBase数据库管理与操作的专业认证,由蚂蚁金服开发的分布式数据库系统。这个认证旨在验证个人对OceanBase数据库的深入理解和实战能力,涵盖了数据库的基础知识、架构、安装配置、运维、...
SAS Base是SAS软件的核心部分,主要用于数据处理、统计分析和报告生成。SAS Base认证是SAS公司提供的一项专业认证,旨在验证个人在使用SAS Base进行数据分析和编程方面的技能。本备考套餐提供了全面的学习资源,帮助...
sudo tar -xvf ubuntu-base-18.04.5-base-arm64.tar.gz -C ubuntufs/ 4. 安装 qemu sudo apt-get install qemu-user-static 5. 定制根文件系统 5.1 准备模拟环境网络 sudo cp -b /etc/resolv.conf ubuntufs/...
Markdown笔记前端人员使用的做笔记的软件 插件
基于gec6818语音识别系统(源代码+项目视频)Linux项目、汉字显示、录音、base64tcp文件传输、iconv字符编码转换、alsa声卡 哔哩哔哩项目展示视频:https://www.bilibili.com/video/BV1Dv411C7cZ/ 源码+库资源+设计...
能否升级是要看你的主板型号的,不同的主板支持的最大内存不同,不过如果你用的是I3 I5 I7的话,一般你现在的主板肯定是支持4G的。你用驱动精灵等软件看看你主板的型号之后搜索一下就知道能否支持4G 8G 16G 了。
标题 "算法笔记base algorithms using go and lc solution using py and g.zip" 暗示了这是一份关于算法的综合学习资料,其中包含了两种编程语言——Go和Python的应用,特别是针对LeetCode平台上的问题解决方案。...
- **Base Unit**:基座单元,承载主板和其他主要组件。 - **HDD Module**:硬盘驱动器模块,存储数据的主要部件。 - **Battery Module**:电池模块,为笔记本提供电力。 #### 二、LCD Module详细分析 - **LCD ...
例如,系统管理员可以利用它来编辑和管理服务器配置,开发者可以借助它进行代码编写和调试,而学生和研究者也能用它来整理笔记或处理文本数据。 总的来说,"Edit Base"是一款强大且多功能的文本编辑工具,无论是...