开发者对Base64编码肯定很熟悉,是否对它有很清晰的认识就不一定了。实际 上Base64已经简单到不能再简单了,如果对它的理解还是模棱两可实在不应该。大概介绍一下Base64的相关内容,花几分钟时间就可以彻底理解它。文 章下边贴了一个Base64的编解码器,方便阅读文章的同时来实验。
一. Base64编码由来
为什么会有Base64编码呢?因为有些网络传送渠道并不支持所有的字节,例如传统的邮件只支持可见字符的传送,像ASCII码的控制字符就 不能通过邮件传送。这样用途就受到了很大的限制,比如图片二进制流的每个字节不可能全部是可见字符,所以就传送不了。最好的方法就是在不改变传统协议的情 况下,做一种扩展方案来支持二进制文件的传送。把不可打印的字符也能用可打印字符来表示,问题就解决了。Base64编码应运而生,Base64就是一种 基于64个可打印字符来表示二进制数据的表示方法。
二. Base64编码原理
看一下Base64的索引表,字符选用了"A-Z、a-z、0-9、+、/" 64个可打印字符。数值代表字符的索引,这个是标准Base64协议规定的,不能更改。64个字符用6个bit位就可以全部表示,一个字节有8个bit 位,剩下两个bit就浪费掉了,这样就不得不牺牲一部分空间了。这里需要弄明白的就是一个Base64字符是8个bit,但是有效部分只有右边的6个 bit,左边两个永远是0。
那么怎么用6个有效bit来表示传统字符的8个bit呢?8和6的最小公倍数 是24,也就是说3个传统字节可以由4个Base64字符来表示,保证有效位数是一样的,这样就多了1/3的字节数来弥补Base64只有6个有效bit 的不足。你也可以说用两个Base64字符也能表示一个传统字符,但是采用最小公倍数的方案其实是最减少浪费的。结合下边的图比较容易理解。Man是三个 字符,一共24个有效bit,只好用4个Base64字符来凑齐24个有效位。红框表示的是对应的Base64,6个有效位转化成相应的索引值再对应 Base64字符表,查出"Man"对应的Base64字符是"TWFU"。说到这里有个原则不知道你发现了没有,要转换成Base64的最小单位就是三个字节,对一个字符串来说每次都是三个字节三个字节的转换,对应的是Base64的四个字节。这个搞清楚了其实就差不多了。
但是转换到最后你发现不够三个字节了怎么办呢?愿望终于实现了,我们可以用两 个Base64来表示一个字符或用三个Base64表示两个字符,像下图的A对应的第二个Base64的二进制位只有两个,把后边的四个补0就是了。所以 A对应的Base64字符就是QQ。上边已经说过了,原则是Base64字符的最小单位是四个字符一组,那这才两个字 符,后边补两个"="吧。其实不用"="也不耽误解码,之所以用"=",可能是考虑到多段编码后的Base64字符串拼起来也不会引起混淆。由此可见 Base64字符串只可能最后出现一个或两个"=",中间是不可能出现"="的。下图中字符"BC"的编码过程也是一样的。
三. 总结
说起Base64编码可能有些奇怪,因为大多数的编码都是由字符转化成二进制的过程,而从二进制转成字符的过程称为解码。而Base64的概念就恰好反了,由二进制转到字符称为编码,由字符到二进制称为解码。
Base64编码主要用在传输、存储、表示二进制等领域,还可以用来加密,但是这种加密比较简单,只是一眼看上去不知道什么内容罢了,当然也可以对Base64的字符序列进行定制来进行加密。
Base64编码是从二进制到字符的过程,像一些中文字符用不同的编码转为二 进制时,产生的二进制是不一样的,所以最终产生的Base64字符也不一样。例如"上网"对应utf-8格式的Base64编码是"5LiK572R", 对应GB2312格式的Base64编码是"yc/N+A=="。
function base64encode($str) { $base64 = [ "A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T", "U", "V", "W", "X", "Y", "Z", 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/' ]; $len = strlen($str); $rstr = ""; for($j=0; $j<$len/3; $j++) { $item = substr($str, $j*3, 3); $itemlen = strlen($item); $eightbit = ""; for($i=0; $i<=$itemlen; $i++) { $bin[$i] = decbin(ord($item[$i])); $combin[$i] = str_pad($bin[$i], 8, "0", STR_PAD_LEFT); $eightbit .= $combin[$i]; } for ($i = 0; $i <= $itemlen; $i++) { $sixbit = substr($eightbit, $i * 6, 6); $rstr .= $base64[bindec($sixbit)]; } $pad = ["==", "=", ""]; $rstr .= $pad[$itemlen-1]; } return $rstr; } echo base64_encode("Maxwelldu"); $r = base64encode("Maxwelldu"); echo $r;
相关推荐
Base64编码的基本原理是将每3个8位字节的数据块转换成4个6位的字节,然后每个6位的字节对应一个Base64字符表中的字符,以此来表示原始的二进制数据。 ### Base64编码过程 1. **分组处理**:首先,Base64编码将输入...
BASE64编码和解码的JAVA实现。 太简单了。直接调用API实现的。 反正不要分,你们看着下吧。
9. **使用示例**:在`base64.cpp`和`base64.h`中提供的`main`函数可能是演示如何使用这两个函数的例子,可以通过它了解如何在C++程序中调用这些编解码方法。 10. **API设计**:`base64.h`文件通常会定义接口,如`...
下面我们将详细探讨如何在LabVIEW中实现Base64编码以及这个VI可能的工作原理。 1. **Base64编码原理**: - Base64编码基于64个可打印的ASCII字符,包括大小写字母、数字以及"+"和"/",还有在末尾可能会出现的等于...
虽然Java 8以后已经有了官方的Base64支持,但这个文件为我们提供了另一种实现方式,可以用来理解Base64编码的工作原理。通过阅读源码,我们可以深入学习位操作、数组映射和字符编码等编程技巧。 总结来说,Base64...
同时,理解Base64编码的基本原理也是必要的,这将帮助你正确地进行编码和解码操作,确保数据的完整性和一致性。 在提供的压缩包文件“图片缩放编码解码”中,很可能包含了实现这些功能的LabVIEW程序或范例。你可以...
用js实现的base64encode,base64decode函数. 包括: function base64encode(str) { function base64decode(str) { function utf16to8(str) { function utf8to16(str) { function doit() {
通过对base64.pbl、base64.pbt和base64.pbw文件的研究,我们可以了解到如何在PB9中自定义实现Base64编码,并学习到如何在PB项目中组织和管理代码。这对于需要在PowerBuilder环境中处理二进制数据的开发者来说,是一...
base64的C语言实现,能够快速实现base64的编解码
只要理解了Base64编码的基本原理和Android提供的API,就可以高效地实现这种转换。在实际项目中,根据具体需求,还可以结合其他技术,如网络请求库(如Retrofit、OkHttp)和文件操作库(如Gson、Jackson)等,来优化...
Base64编码的基本原理是将每3个字节(24位)的数据转换为4个Base64字符(每个6位),不足3个字节的数据会在末尾填充零,并增加相应的结束标记。Base64字符集包含大小写字母、数字以及"+"和"/",最后用"="作为填充和...
base64.js 是 Base64 的 JavaScript 实现。浏览器:[removed][removed]node.jsvar Base64 = require('./base64.js').Base64;示例:Base64.encode('dankogai'); // ZGFua29nYWk= Base64.encode('小飼弾'); // ...
Base64是一种在互联网上广泛使用的编码方式,它将任意二进制数据转换为可打印的ASCII字符,以便在网络传输中不受限制。这种编码方法基于一个64字符的字母数字表,包括大小写字母、数字以及"+"和"/",末尾可能带有...
首先,让我们深入了解一下Base64编码的原理。Base64编码将每3个8位字节的二进制数据块转换成4个6位的字节,并将这些6位字节转换为可打印的ASCII字符。由于2^6 = 64,因此有64种可能的字符组合,通常使用大小写字母、...
Base64是一种用于在网络上传输和存储8位字节数据的编码方法,它将任意的8位字节序列转换为可打印的7位ASCII字符序列。...理解并掌握Base64编码的原理和实现对于进行网络通信、数据存储以及信息安全等相关工作至关重要。
Base64编码的核心原理是将二进制数据进行分组,每24Bit(3字节)为一个大组,再把一个大组的数据分成4个6Bit的小分组。由于6Bit数据只能表示64个不同的字符(2^6=64),所以这也是Base64的名字由来。
在C语言中实现Base64编码解码,需要理解其基本原理并编写相应的函数。 Base64编码的基本原理是将每3个字节(24位)的数据转换为4个6位的Base64字符。由于24位可以表示64的三次方种组合,因此可以完全覆盖64个字符集...
Base64编码原理及base64函数 Base64编码是一种常用的将二进制数据转换为可打印字符的编码,占用空间较小。在RFC 3548中定义。Base64编码的原理是将数据编码成24bit的二进制数,然后将其分成四组,每组6bit,对应于...
如果你使用的是Apache Commons Codec库,引入依赖后,Base64编码可以这样实现: ```java import org.apache.commons.codec.binary.Base64; public class Base64Example { public static void main(String[] args)...