字节
zìjié
字节(Byte): 字节是通过网络传输信息(或在硬盘或内存中存储信息)的单位。
字节是计算机信息技术用于计量存储容量和传输容量的一种计量单位,1个字节等于8位二进制。
在ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。
符号:英文标点占一个字节,中文标点占两个字节.
一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,如一个ASCII码就是一个字节,此类单位的换算为:
1千吉字节(TB,Terabyte)=1024吉字节 (2的40次方字节)
(1TB=1024GB)
1吉字节(GB,Gigabyte) =1024兆字节 (2的30次方字节)
(1GB=1024MB)
1兆字节(MB,Megabyte) =1024千字节 (2的20次方字节)
(1MB=1024KB)
1千字节(KB,Kilobyte) =1024字节 (2的10次方字节)
1字节(Byte) = 8位(bit)
注:更大的单位,还有 PB(Petabyte,1PB=1024TB)、EB(Exabyte,1EB=1024PB)、ZB(Zettabyte,1ZB=1024EB)、YB(Yottabyte,1YB=1024ZB)……
1.2 字符,字节,字符串
理解编码的关键,是要把字符的概念和字节的概念理解准确。这两个概念容易混淆,我们在此做一下区分:
概念描述 举例
字符 人们使用的记号,抽象意义上的一个符号。 '1', '中', 'a', '$', '¥', ……
字节 计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。 0x01, 0x45, 0xFA, ……
ANSI 字符串
在内存中,如果“字符”是以 ANSI 编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那么我们称这种字符串为 ANSI 字符串或者多字节字符串。如,"中文123" (占7字节)。
字符集和代码页
对于 ANSI 编码方式,存在不同的字符集(Charset)。同样的字节序列,在不同的字符集下表示的字符不一样。要正确解析一个 ANSI 字符串,还要选择正确的字符集,否则就可能导致所谓的乱码现象。不同语言版本的操作系统,都有一个默认的字符集。在不指定字符集的情况下,系统会使用此字符集来解析 ANSI 字符串。也就是说,如果我们在简体中文版的 Windows 下打开了一个由日文操作系统保存的 ANSI 文本文件(仅包含 ANSI 字符串的文本文件),我们看到的将是乱码。但是,如果我们使用 Visual Studio 之类的带编码选择的文本编辑器打开此文件,并且选择正确的字符集,我们将可以看到它的原貌。注意:简体中文字符集中的繁体字和繁体中文字符集中的繁体字,编码不一定相同(实事证明,似乎是完全不同)。
每个字符集都有一个唯一的编号,称为代码页(Code Page)。简体中文(GB2312)的代码页为 936,而系统默认字符集的代码页为 0,它表示根据系统的语言设置来选择一个合适的字符集。
UNICODE
字符串 在内存中,如果“字符”是以在 UNICODE 中的序号存在的,那么我们称这种字符串为 UNICODE 字符串或者宽字节字符串。Unicode 中,每个字符都占两个字节。如, L"中文123"(占10字节)。
由于不同 ANSI 编码所规定的标准是不相同的(字符集不同),因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种字符集则,才能够知道它包含了哪些“字符”。而对于 UNICODE 字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。Unicode 有着统一的标准,它定义了世界上绝大多数的字符的编码,使得拉丁文、数字、简体中文、繁体中文、日文都能一同一种编码方式保存。
分享到:
相关推荐
在现代计算机体系结构中,内存是按照字节(byte)为单位进行组织的。理论上,程序员可以假设任何类型的数据变量都可以从任何内存地址开始存储和访问。然而,在实践中,为了提高内存访问的效率和简便性,往往需要在...
在S7-200SMART PLC编程中,有时我们需要处理数据的字节顺序,特别是当数据需要在不同字节顺序的设备之间传输时。在16位数据(一个字,即WORD)中,高字节通常代表数值的高位,低字节代表低位。在某些情况下,我们...
"单字节、多字节、双字节相互转换" 在计算机科学中,字符编码是一个非常重要的话题,特别是在跨平台和多语言环境中。单字节、多字节、双字节是三种常见的字符编码方式,它们之间的相互转换是非常必要的。 单字节...
本文将深入探讨易语言中的字节集(ByteSet)与字节数组(ByteArray)之间的快速互转,以及相关的源码实现和应用。 字节集是易语言中用于存储一系列字节的数据类型,它通常用于处理二进制数据,如读写文件、网络通信...
2. **字节集到字节型数组的转换**:当需要将字节集转换为字节型数组时,可以使用循环语句,逐个读取字节集内的字节并存入新创建的字节型数组中。下面是一个示例源码: ```易语言 .字节集 = .创建字节集() // 创建一...
易语言提供了“字节集到字节”命令,可以将字节集中的一个字节取出,然后使用“数组赋值”命令将这个字节赋值给数组的一个元素。 3. **循环操作**:为了将整个字节集复制到数组,你需要遍历字节集的所有字节。这...
IEEE802.3局域网协议.以太网最小长度是64字节的原因为什么10Mbps以太网最小数据长度是64B,100Mbps以太网最小数据长度是1518B
字节对齐是一种在计算机编程中,特别是在C/C++编程中常见的优化策略,它涉及到如何在内存中组织数据,以确保高效访问和避免硬件错误。字节对齐的基本原理是根据数据类型及其大小来确定它们在内存中的起始位置,以...
本文将详细探讨“文本型转文本字节集”以及“文本字节集转字节集”的转换过程,以帮助你更好地理解和应用易语言。 首先,我们来看“文本型转文本字节集”。在易语言中,“文本型”是指由汉字、字母、数字等字符组成...
在易语言中,处理文件操作是一项基础且重要的任务,而“读写文件到字节集”则是这一任务的具体体现。字节集是易语言中用来存储二进制数据的数据类型,它在处理文件、网络传输或者内存操作时非常有用。 1. **字节集...
字符流处理的单元为 2 个字节的 Unicode 字符,分别操作字符、字符数组或字符串,而字节流处理单元为 1 个字节,操作字节和字节数组。 Java 内用 Unicode 编码存储字符,字符流处理类负责将外部的其他编码的字符流...
首先,我们要理解什么是文本和字节集。文本是人类可读的字符序列,通常以UTF-8、GBK等编码格式存在,而字节集则是一系列二进制数据的集合,它可以包含任何类型的数据,包括图片、音频、视频,甚至文本。在易语言中,...
首先,我们来理解什么是字节集。字节集是易语言中的一个特殊数据类型,它可以容纳任意长度的二进制数据,如图片、音频、视频等非文本信息。字节集的操作包括创建、赋值、读取、写入等。在处理大量二进制数据时,清空...
什么是编码? 将 字符串 转换成 字节 这叫编码。 在文件中写东东的时候要使用编码,因为电脑只知道 0 1 代码。 - 什么是解码? 将 字节 转换成 字符串 这叫解码。 在文件中读取数据的时候使用解码,因为大部分...
字节序,又称为字节顺序或字节排列方式,指的是在计算机内存中或网络传输过程中多字节数据的存储顺序。简单来说,它定义了多字节数据中各个字节如何按顺序排列。在实际编程工作中,尽管很多时候开发者可能不会直接...
在易语言中,字节集是一个非常重要的数据类型,用于存储二进制数据,类似于其他编程语言中的字节数组或byte buffer。本文将深入探讨易语言字节集动态添加的原理、方法以及实际应用。 一、字节集的基本概念 字节集...
字节顺序分为大端字节序和小端字节序,大端字节序是将最高有效字节存储在最低地址,而小端字节序则相反。在S7-200SMART PLC中,数据的默认存储方式可能与某些外部设备或网络协议不一致,因此需要进行字节序转换。 ...
例如,如果我们有两个字节的高字节(MSB,Most Significant Byte)和低字节(LSB,Least Significant Byte),我们可以将它们合并成一个DINT类型的数值。 在博图软件中,用户可以利用编程语言如Ladder Diagram...
首先,我们要理解什么是字节集。字节集是易语言中用来存储一系列字节的容器,它可以用来表示任意二进制数据,比如图片、音频、文件等。在易语言中,字节集通常用“字节集”类型的变量来表示。字节集的操作包括创建、...
在易语言编程环境中,字节集与图片的互转是一个常见的操作,特别是在处理网络数据传输、文件存储或图像处理时。下面将详细解释这个过程,以及如何使用易语言实现这一功能。 字节集(Byte Array)是编程中用来存储二...