Base64是什么?
Base64编码的用途是为了传输和传输安全(其实并不太安全)。
它的算法是:每3个字节(每字节8bit),转换为4个6bit的字节(一个字节应该是8bit,所以前2位补0),然后每个6位前2位(高位)被2个零。例如:
xxxxxxxx yyyyyyyy xxxxyyyy这里转换前的3个字节,然后,每6位分到一个字节中:
xxxxxx xxyyyy yyyyxx xxyyyy
然后高位补0
00xxxxxx 00xxyyyy 00yyyyxx 00xxyyyy
其中xy是二进制的0和1,然后再按base64码表进行替换(base64,基本的64个码,=号不在其内)
0 A
|
16 Q
|
32 g
|
48 w
|
1 B
|
17 R
|
33 h
|
49 x
|
2 C
|
18 S
|
34 i
|
50 y
|
3 D
|
19 T
|
35 j
|
51 z
|
4 E
|
20 U
|
36 k
|
52 0
|
5 F
|
21 V
|
37 l
|
53 1
|
6 G
|
22 W
|
38 m
|
54 2
|
7 H
|
23 X
|
39 n
|
55 3
|
8 I
|
24 Y
|
40 o
|
56 4
|
9 J
|
25 Z
|
41 p
|
57 5
|
10 K
|
26 a
|
42 q
|
58 6
|
11 L
|
27 b
|
43 r
|
59 7
|
12 M
|
28 c
|
44 s
|
60 8
|
13 N
|
29 d
|
45 t
|
61 9
|
14 O
|
30 e
|
46 u
|
62 +
|
15 P
|
31 f
|
47 v
|
63 /
|
从码表中可以得知,base64编码后的字串只包含在小写字母,数字,还有+/这2个特殊字符。
还有一些扩展的base64用法。例如用于url传递的其中把+号和左斜线换成了*和-
现在以Hello这个单词来测试一下,之前,先通过.net提供的base64转换方法得到它的base64编码。
public static string Base64Encoding(this string selfChar,Encoding encoding)
{
byte[] bb = selfencoding.GetBytes(selfChar);
return Convert.ToBase64String(bb);
}
在Ascii编码环境下
Hello这个单词有5个字母,就是5个字节,那么可以把它分为Hel lo两部分。第一部分的Hel是3个字节,它的二进制格式为(可以查ascii表,也可以由上一篇中给出的方法求):010010000110010101101100
然后分为4个6位:010010 000110 010101 101100
然后高位补0:00010010 00000110 00010101 00101100,然后换算为10进制为18 6 21 44
然后与码表对应替换:SGVs
下边对后2个字节进行编码。因为base64要求8*3——6*4,然后才进行下一步计算。这里只有2个字节,那应该对其补,补就是用=号来替换。
开始:lo的二进制为0110110001101111
因为不够24位,所以分为3个6位字节011011 000110 111100
011011 000110 111100,10进制数为:27 6 60,然后再补一个=号就是
bG8=
与上边的连起来就是SGVs bG8=
在程序中验证,这个是正确的。
再做一个汉字语句的base64编码:赵。
在utf-8编码下,它的二进制是:111010001011010110110101
它有3个字节,分为4个字节:111010 001011 010110 110101,补0:00111010 00001011 00010110 00110101
10进制是:58 11 22 53
码表:6LW1。
在GB2312环境下的64位编码是怎样的?
“赵”字的gb2312编码环境下的字节有2个,它的二进制位是:1101010111010100,分为6位的:
110101 011101 010000
对应的10进制是:53 29 16,对应码表是1dQ,然后补=号就是
1dQ=
在Ascii环境下的64位编码是怎样的?
“赵”字不在Ascii码内(ascii在127之内)。那么对于编码环境下不存在的字符怎么样处理呢?
在ascii环境下,任何大于127的,即U+007F(unicode编码127的),则由ascii的问号替换。
然后,问号在unicode值下是63(Ascii下也是,这是10进制数),63的二进制是:111111。这是一个字节(按Base64编码算法,要补齐3个字节,所以最后要加2个等号),它应该是:00111111,然后每6位分一字节:001111 110000
不足的在后边补0,这个补0与6位变8位补不是一样的概念。那么这两个8位的10进制数是:
15 48,对应码表就是Pw,
然后还要加上2个等号==
最后变成了Pw==
ANSI
American National Standards Institute(ANSI——美国国家标准局)
为使计算机支持更多语言,通常使用 0x80—0xFF 范围的 2 个字节来表示 1 个字符。比如:汉字 '中' 在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。
不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文系统下,ANSI 编码代表 GB2312 编码,在日文操作系统下,ANSI 编码代表 JIS 编码。
不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文本中。
相关推荐
2. **Base64编码**: Base64是一种用于将二进制数据转换为可打印字符的编码方式,常用于在电子邮件等文本环境中传输非ASCII字符。在LabVIEW中,可以使用字符串函数来实现Base64编码。首先,你需要将图像数据转换为...
在C#编程语言中,Base64是一种用于将二进制数据编码为ASCII字符串的机制,以便在不支持二进制传输的系统(如电子邮件)中传输。Base64编码可以将任何二进制数据转换为可打印的字符,包括图片、文件和其他非文本数据...
2. **Base64解码**:将Base64字符串还原为其原始的二进制数据。这个过程是编码的逆操作,使得接收方能够正确解析接收到的Base64字符串。 3. **URL编码**:Base64编码后的字符串可能包含URL不友好的字符,如"+"和"/...
1. **Base64解析**:接收Base64编码的字符串,根据Base64字符集将每个字符转换回6位的二进制数。 2. **组合二进制数据**:将4个6位的二进制数组合成3个8位的字节,注意需要处理末尾的填充字符"="。 3. **数据恢复*...
2. **循环解码**:逐个字符处理输入字符串,并将其从Base64编码还原为原始数据。 3. **特殊字符处理**:处理填充符“=”的情况。 #### 三、Unicode转UTF-8 由于JavaScript内部使用的是Unicode编码,因此需要一个...
Base64是一种编码方式,常用于将二进制数据转化为可打印的ASCII字符,便于在网络传输中使用。在PowerBuilder中,我们可以使用第三方库或自定义函数来实现Base64加密。加密过程包括将原始数据分组、每个6位转换成...
BASE64是一种广泛用于网络数据传输和存储的编码方式,它将任意二进制数据转换成可打印的ASCII字符序列。这种方法最初被设计用来在电子邮件系统中传输非ASCII字符,现在则被应用于各种场景,如在HTTP头中传输图像数据...
《编码规则与用法详解:Unicode、UCS、UTF-8、Base64、ANSI》 在信息技术领域,字符编码是至关重要的,它决定了我们如何在计算机中存储、传输和显示文本。本文将详细介绍几种常见的编码方式,包括Unicode、UCS、UTF...
' =========================...' 功能: 将字符编码为Base64编码 xiaomabuhei=>eGlhb21hYnVoZWk= ' [StrA] 预备编码的字符 ' ======================================================================================
Base64是一种在互联网上广泛使用的编码方式,用于将二进制数据转化为可打印的ASCII字符,以便在不支持二进制传输的协议(如电子邮件)中传递。它基于64个可打印字符来表示二进制数据,这些字符包括大小写字母、数字...
当需要将字符串编码为Base64时,通常先将字符串按照特定字符集转换为字节序列,然后按照Base64规则进行编码。 编码过程大致如下: 1. 将字符串按选定的字符编码(如UTF-8)转换成字节数组。 2. 将字节数组按照每3个...
需要注意的是,这段代码没有提供完整的Base64解码逻辑,实际的`decodeBase64`函数需要实现Base64编码的解码算法,这通常涉及到将Base64字符映射回它们代表的二进制值。 总的来说,这个示例展示了JavaScript在处理二...
标题中的“base64、ANSI、UTF-8、Unicode解析小工具”指的是一个软件工具,这个工具的主要功能是处理和解析四种不同的字符编码格式:Base64编码、ANSI编码、UTF-8编码以及Unicode编码。让我们逐一深入探讨这些编码...
Base64编码是一种在网络上传输二进制数据时常用的编码方式,它将任意二进制数据转换成可打印的ASCII字符序列。这种编码方法最初是为了在电子邮件系统中传输非ASCII字符而设计的,如今在很多场景下都有应用,如图片...
2. 字符编码问题:BASE64转换过程中,可能会出现字符编码问题,例如中文字符的编码问题。 解决方法 要解决这些问题,可以使用以下方法: 1. 对于Access restriction问题,可以在project build path中先移除JRE ...
2. **LabVIEW实现Base64编码**: - 在LabVIEW中,我们可以使用“字符串到字节数组”函数将输入的字符串转化为字节数组,然后用“数组分割”将字节数组按3个字节一组拆分。 - 对每组字节进行6位二进制到Base64字符...
Base64编码基于64个字符的字符集,这个字符集包括26个小写字母、26个大写字母、10个数字以及两个特殊字符“+”和“/”。每个64个字符代表一个6位的二进制数,这意味着每个64字符可以表示2^6 = 64种不同的值。由于...
BASE64编码是基于ASCII字符集的一种编码方法,主要目的是将任意二进制数据转换为可打印的ASCII字符,以便在网络上传输或者保存在文本文件中。它的基本思想是将每3个字节(24位)的数据拆分为4组,每组6位,然后将这6...
Base64是一种网络上常见的数据编码方式,它将任意二进制数据转化为可打印的ASCII字符,以便在电子邮件、文本协议等不支持二进制传输的环境中使用。在Delphi编程环境中,处理Base64编码和解码是常见的需求,这涉及到...
Base64是一种基于64个字符的编码方法,这些字符包括大小写字母、数字以及"+"和"/",还有一个用于填充的字符"="。它将每3个字节的数据转换成4个Base64字符,因此,原始数据的长度会被增加约33%。编码过程主要是为了...