比特、字节、字、字长、字符、字符串、字符集、代码页
dx20110915
比特(Bit)
一个比特只能拥有一个值,不是0就是1,所以如果一个值0,它就是一个比特,如果两个(00),它们是两个比特。
字节(Byte)
字节是指一小组相邻的二进制数码。通常是8位作为一个字节。
如八个0或者1组合在一起,例如01101010,可以说它们是八个比特或者说一个字节。八比特就等于一字节,而不管它们都是全是0、全是1或者是由若干0和若干1混合而成。
它是构成信息的一个小单位,并作为一个整体来参加操作,比字小,是构成字的单位。
在微型计算机中,通常用多少字节来表示存储器的存储容量。
字
在计算机中,一串数码作为一个整体来处理或运算的,称为一个计算机字,简称字。字通常分为若干个字节(每个字节一般是8位)。在存储器中,通常每个单元存储一个字,因此每个字都是可以寻址的。字的长度用位数来表示。
在计算机的运算器、控制器中,通常都是以字为单位进行传送的。字出现在不同的地址其含义是不相同。例如,送往控制器去的字是指令,而送往运算器去的字就是一个数。
字长
计算机的每个字所包含的位数称为字长。根据计算机的不同,字长有固定的和可变的两种。固定字长,即字长度不论什么情况都是固定不变的;可变字长,则在一定范围内,其长度是可变的。
计算的字长是指它一次可处理的二进制数字的数目。计算机处理数据的速率,自然和它一次能加工的位数以及进行运算的快慢有关。如果一台计算机的字长是另一台计算机的两倍,即使两台计算机的速度相同,在相同的时间内,前者能做的工作是后者的两倍。
一般地,大型计算机的字长为32―64位,小型计算机为12―32位,而微型计算机为4一16位。字长是衡量计算机性能的一个重要因素。
字符
人们使用的记号,抽象意义上的一个符号。 '1', '中', 'a', '$', '¥', ……
字符串
ANSI字符串 在内存中,如果“字符”是以ANSI编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那称这种字符串为ANSI字符串或者多字节字符串。如"中文123" (占7字节)。
Unicode字符串 在内存中,如果“字符”是以在Unicode中的序号存在的,那称这种字符串为Unicode字符串或者宽字节字符串。在Unicode中,每个字符都占两个字节。如,"中文123"(占10字节)。
Unicode和ANSI的区别就相当于输入法内的“全角”和“半角”的区别。由于不同ANSI编码所规定的标准是不相同的(字符集不同),因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种字符集则,才能够知道它包含了哪些“字符”。而对于 UNICODE 字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。Unicode 有着统一的标准,它定义了世界上绝大多数的字符的编码,使得拉丁文、数字、简体中文、繁体中文、日文等都能以同一种编码方式保存。
字符集
对于ANSI编码方式,存在不同的字符集(Charset)。同样的字节序列,在不同的字符集下表示的字符不一样。要正确解析一个ANSI字符串,还要选择正确的字符集,否则就可能导致所谓的乱码现象。不同语言版本的操作系统,都有一个默认的字符集。在不指定字符集的情况下,系统会使用此字符集来解析
ANSI字符串。也就是说,如果我们在简体中文版的Windows下打开了一个由日文操作系统保存的ANSI文本文件(仅包含 ANSI 字符串的文本文件),我们看到的将是乱码。但是,如果我们使用Visual Studio之类的带编码选择的文本编辑器打开此文件,并且选择正确的字符集,我们将可以看到它的原貌。注意:简体中文字符集中的繁体字和繁体中文字符集中的繁体字,编码不一定相同(事实证明,似乎是完全不同)。
代码页
每个字符集都有一个唯一的编号,称为代码页(Code Page)。简体中文(GB2312)的代码页为936,而系统默认字符集的代码页为0,它表示根据系统的语言设置来选择一个合适的字符集。
分享到:
相关推荐
"字节、比特、字、字长、字符串、字符集和代码页" 在计算机科学中,有一些基本概念需要了解和区分,如字节、比特、字、字长、字符串、字符集和代码页等。这些概念都是计算机科学的基础,正确地理解它们对于编程和...
在探讨计算机科学的基础概念时,“位”、“字节”、“字长”与“位”的理解至关重要,它们构成了数据存储和处理的基本单位,是理解和分析计算机性能的关键。 ### 位(Bit) 位,作为计算机中最基本的数据单位,...
一个字节由 8 个位组成,通常用于表示一个字符的代码。字是由若干个位或字节所组成的,它由若干个字节组合而成,占据一个单独的地址(内存单元的编号)并作为一个单元处理的一组二进制数位。 字长是 CPU 性能的重要...
该程序通过简单的控制台交互实现了字符串输入及字符统计的功能,通过具体的指令集展示了字符统计的基本逻辑和方法。此外,通过对十六进制数到十进制数的转换及显示,进一步增强了程序的实用性和可读性。
解析位,字长,字节的区别和联系,为C++初学者提供有用的信息
数字观测器_考虑有限字长效益数字观测器_考虑有限字长效益数字观测器_考虑有限字长效益数字观测器_考虑有限字长效益数字观测器_考虑有限字长效益数字观测器_考虑有限字长效益数字观测器_考虑有限字长效益数字观测器_...
综上所述,字、半字和字节是计算机硬件和软件中不可或缺的基础概念,了解它们的大小和作用对于理解计算机系统架构以及编写高效、可移植的代码至关重要。在开发过程中,程序员必须清楚地了解和考虑到这些概念,以确保...
例如,286微机的字由2个字节组成,它的字长为16位;486微机的字由4个字节组成,它的字长为32位。计算机的字长决定了其CPU一次操作处理实际位数的多少,由此可见计算机的字长越大,其性能越优越。 字长 字长是...
在提供的MATLAB源代码文件中,如`Untitled5.m`、`Untitled2.m`等,可能包含了滤波器设计、量化和有限字长效应分析的示例。通过这些脚本,我们可以模拟和评估不同字长对滤波器性能的影响,以及如何优化滤波器设计以...
19.计算机机器字长、指令字长、存储字长的区别和联系是什么?.zip19.计算机机器字长、指令字长、存储字长的区别和联系是什么?.zip19.计算机机器字长、指令字长、存储字长的区别和联系是什么?.zip19.计算机机器字长...
### 128个ASCII码的标准字符集包括的字符有以下5组 #### ASCII码标准字符集概述 ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是一种基于拉丁字母的一套电脑编码系统,它...
- **Unicode**: 定义了每种语言中每个字符的唯一代码点,是一种字符集标准。 - **UTF**: 是一组编码方案,将Unicode字符表示为字节序列,便于存储和传输。 **2.2 兼容性** - **不同UTF编码格式间兼容性**: - UTF-...
如果是一台 16 位机,那么,它的 1 个字就由 2 个字节构成,字长为 16 位。 KB(Kilobyte)是计算机存储空间的计量单位,1KB 等于 1024 个字节。MB(Megabyte)是计算机存储空间的计量单位,1MB 等于 1024KB 或者 ...
初始时,字长为9位,随着新字符串的不断加入,字长会逐步增加。例如,当编码数量达到512时(即9位所能表示的最大数值),字长会自动增加到10位。这种机制有助于保持较高的压缩比,同时避免串表过大的问题。 综上所...
char类型是专门为存储单个字符设计的,它在内存中占用一个固定的字节数,即1字节。每个char类型变量存储的是对应字符的ASCII码值。例如,字符'A'在ASCII码中的值是65,该值将被存储在一个char类型的变量中。 接着是...
汉字通常占用2字节,英文字符、数字和大部分标点符号占用1字节,全角数字占用2字节。 在网络传输中,速度通常以bps(比特每秒)为单位,而存储容量则用B(字节)表示。比如,1kb/s等于1000b/s,1MB/s等于1024Kbps。...
《数字滤波器的有限字长效应》\n\n在数字信号处理领域,数字滤波器是不可或缺的一部分,而有限字长效应则是实际应用中必须考虑的重要因素。本篇主要探讨了这一现象及其对数字滤波器性能的影响,主要包括输入信号的...
数字信号处理中的有限字长效应精选.pptx
11.计算机的机器字长.zip11.计算机的机器字长.zip11.计算机的机器字长.zip11.计算机的机器字长.zip11.计算机的机器字长.zip11.计算机的机器字长.zip11.计算机的机器字长.zip11.计算机的机器字长.zip11.计算机的机器...