一.基础概念
字节:1个字节等于8位二进制数(0或者1),取值范围0~255之间.数据存储是以字节(Byte)为单位,数据传输是以位(bit)为单位,一个位就是0或者1,每8个位组成一个字节.1Kb=1024bit,1KB=1024Byte=1024*8bit.([1]百科中还有KB和KiB的区别)
字符:就是一个语言的符号,“中”字就是一个字符.字符所占的大小由编码方式决定,“中”在UTF-8中占3个字节,而在GBK中则占两个字节.
字符集:字符的集合,像Unicode字符集
字符编码:像字符用多少个字节表示等问题,是编码决定的.例如Unicode字符集编码就有很多,例如UTF-8,UTF-16,UTF-32等.
字符集和字符编码是分开的概念,但有时称呼上去有些模糊,我们经常笼统的称这些Unicode字符集的编码为Unicode编码.
内码:操作系统内部的字符编码,像早期的DOS用的是ASCII,而现在的操作系统大部分采用的是Unicode编码.
代码点:Unicode字符集收录的这个世界所有的文字和符号,对于每一个符号都定义了一个值,这个值就是代码点.
Endian:'中'的UTF-16编码为(0x4E,0x2D),数据传输的过程中,字节的顺序有可能会变,像现在这种为Big Endian,而(0x2D,0x4E)这种为Little Endian.
二.编码历史
早期的编码是ASCII,因为只有英文国家在用计算机,而后计算机发展,非英文的国家使用计算机,他们为自己的字符设定编码,像中国的GB2312,台湾的BIG5等,而ASCII和这些派生的字符集称为ANSI字符集,在后来,就到了大家熟悉的Unicode时代.
参考文献
1.字节_百度百科:http://baike.baidu.com/view/60408.htm
2.编码简介:http://www.iteye.com/topic/726265
3.十六进制:http://zh.wikipedia.org/wiki/%E5%8D%81%E5%85%AD%E8%BF%9B%E5%88%B6
相关推荐
### Unicode编码详细介绍 #### 0. Big Endian 和 Little Endian Big Endian 和 Little Endian 是两种不同的字节顺序标准,主要用于表示多字节数据的存储方式。这两种标准主要区别在于高位字节的存储位置。 - **...
**MTK开发中的JPEG编码详解** 在移动设备和嵌入式系统中,图像处理和编码技术扮演着至关重要的角色。MediaTek(MTK)作为知名的芯片制造商,其平台经常需要处理JPEG编码,这是一种广泛用于数字图像存储和传输的有损...
Xilinx-ISE 软件使用AMI 码编码详细介绍及 FPGA 板子调试 在本文中,我们将详细介绍如何使用 Xilinx-ISE 软件对 FPGA 板子的调试,并重点介绍 AMI 码编码在其中的应用。AMI 码编码是一种常用的编码技术,常用于数字...
描述中的“对于奇偶校验矩阵的传统信道编码详细介绍”指出了LDPC码的核心组成部分——奇偶校验矩阵。奇偶校验矩阵是LDPC码构造的关键,它由0和1组成,其中1的密度相对较低,因此称为“低密度”。这个矩阵决定了编码...
Base64 编码详细介绍,包裹原理,编码规则。
EZW编码解码原理详细介绍 文中详细介绍了编码的步骤、解码的步骤,还给出了详细的流程图,对大家理解和掌握EZW编码解码非常有帮助。
第十章信源编码详细介绍了抽样、量化、编码以及信源压缩等关键技术。 首先,信源编码的第一步是抽样,它是将时间上连续的模拟信号转换为时间上离散的抽样信号。抽样定理是该步骤的核心,它规定了为了能够准确重构...
以下是编码器的详细知识点总结: 一、编码器的介绍 * 编码器是一种传感器,用于检测机械运动的速度、位置、角度、距离或计数。 * 编码器具有高分辨率、高精度、简单结构、小体积、可靠使用、易于维护、性价比高等...
PCM编码是一种广泛应用于数字通信和音频处理中的模拟信号数字化技术。该技术主要包括三个主要步骤:抽样、量化和编码。 1. 抽样:抽样是将连续的模拟信号转化为离散的时间序列的过程。根据奈奎斯特定理,为了无失真...
中文编码规范是计算机科学领域中处理中文字符的关键标准,它涉及到如何存储和处理中文文本,以便在各种系统和平台间保持兼容性和可读性。本文将深入探讨几种主要的中文编码方式,包括GB2312、Unicode以及UTF-8和UTF-...
波束赋型(Beamforming)和预编码(Precoding)是无线通信中用于提高信号传输质量和频率利用效率的关键技术。在多输入多输出(MIMO)系统中,两者可以紧密联系起来,但它们在概念和应用上存在一些细微差别。 首先,...
本文将详细介绍几种主要的中文编码标准,包括GB2312、GBK、BIG5和GB18030,以及UTF-8,帮助初学者理解这些编码的基础知识。 首先,GB2312是中华人民共和国于1981年发布的国家标准,全称为《信息交换用汉字编码字符...
台达编码器手册详细介绍了这些编码器的工作原理、技术参数、安装方法、接线图以及故障排查等内容。对于使用者来说,手册提供了选型指导,帮助用户根据实际需求选择合适的编码器型号。同时,手册中的故障排查部分对于...
下面将详细介绍这些信息,以便更好地理解和使用。 ### 邮政编码的概念 邮政编码(Postal Code),也称为邮区编号、邮政区号等,是为方便邮件分发而设定的一种代码。它通常由数字组成,有时也会包含字母。在中国,...
堡盟HS35编码器的详细信息可参考《Baumer_HS35_FL_CN_1106.pdf》文件,该文档包含更全面的技术规格、选型指南和应用案例,为用户提供详尽的参考信息。通过深入了解这款编码器,用户可以更加准确地选择适合自己应用的...
本文将详细介绍x264的编码过程及其关键步骤,旨在为初学者提供一个较为全面的理解框架。 ### x264编码流程详解 #### 初始化参数 x264的编码流程始于参数的初始化。这一步骤主要通过`x264_param_default()`函数完成...
3. **非多播场景的网络编码**:这部分将详细介绍在单播和组播之外的网络编码算法和启发式方法,特别是如何利用网络编码来减少无线下载时的延迟。 4. **网络安全与网络编码**:深入研究网络编码在抵御拜占庭攻击...
编码与解码是数字通信和数据处理中的核心概念,它们涉及到如何将模拟信号转化为数字信号,以及如何将数字信号还原为模拟信号的过程。在信息化社会,无论是语音、视频还是文本,都需要经过编码和解码来适应不同的存储...