本文所说的编码,主要针对字符的IO的编码,不涉及数字编码,视频、音频编码和校验码之类其他编码……
这些资料都是收集自网上各种地方,由于太碎了,所以就不声明引自哪篇文章了……
一、ASCII码
最简单也是最离不开的一种编码,直接对应英文和键盘,计算机中的任何键盘输入都离不开ASCII,每次按下某个键,计算机都得到一个ASCII,无论你输入的是拼音还是五笔,计算机只认识ASCII……
二、汉字编码
1、输入码、内码、字形码
输入码:举例来说,我们所说的输入码就是输入法,比如拼音、五笔什么的,一串字母表示一个汉字(不讨论多个汉字的问题)
内码:汉字在计算机中用于运算和存储所使用的代码,这个代码是统一的
字形码:就是点阵,那些坐标亮,哪些不亮,然后让你看着是一个汉字的形状……
2、区位码、国标码、汉字内码
区位码:就是按照行列的形式吧汉字放在“格”中,然后通过行列数来确定某个汉字的方法,行表示区,列表示位,所以叫区位码。需要特别说明的是,区位码(包括国标码)只是一种编码方法并不是特指某一个编码(比如gb2312)……
国标码:由于当初设计区位码的时候,考虑的比较少,区位码和通信中的控制字符存在二义性,所以ISO就规定将区位码加上2020H变成国标码以消除这种二义性……
汉字内码:虽然解决了通信的问题,但是国标码在计算机的存储中又和ACSII码之间存在二义性,所以又规定在国标码的基础之上再加上8080H变成汉字内码,这样,汉字就可以在计算机中不和任何其他字符编码产生冲突了……
这里需要另外说明一下的是交换码,交换码是一种描述功能的编码(和内码是一起的),与区位码这种描述编码方式的编码没有交集。它表示一种字符在进行数据交换的过程中采用的一种双方都认可的,不会产生冲突的编码方式。实际上ASCII就是即是内码(不是汉字内码,就叫内码),也是交换码,而汉字编码中只有汉字内码才是交换码,区位码和国标码只是给人看的编码,必须变成内码才能被计算机使用……
3、GB2312、GBK、GB18030
这三种编码如果要和上面的汉字编码方式对应,都应该算作区位码,也就是说都是按照行列的形式用数字标识汉字的。但是很多人会想当然的认为看到了GB就是国标码,实则不然,这里的GB表示我们提出了一个汉字的国际标准编码方式,而我们上面说的国标码是一个技术上的概念(但是都叫国标码,所以经常容易被人误解)。况且这三种编码并不都是国家标准,我们最常见的GBK就不是国家标准,而是在GB2312之上的一种扩展,可是算是事实上的标准。这三种编码的兼容顺序是GB18030兼容GBK,GBK兼容GB2312……
unicode(万国码,名字很囧)
这种编码方式是为了囊括全世界的语言而提出的一种编码标准,需要注意的是,这个标准是给人看的标准而不是给计算机看的标准,所以我们讨论编码的时候从来不讨论unicode编码,而是讨论utf8,utf16和utf32,这三种编码是专门为计算机设计的编码,虽然都是根据unicode标准,但却是3种不同的格式,我们通常说的unicode编码,实际上指的是utf16编码……
另外,汉字的编码(区位码)和ASCII是不兼容的(所以要变成内码,利用高位来判断是哪种编码),但是unicode编码和ASC
II是兼容的,也就是说ASCII是unicode码的一个子集……
分享到:
相关推荐
课件目录 1.1 计算机网络的形成与发展 1.2 计算机网络的定义 1.3 计算机网络的功能和分类 ...1.9 数据传输类型与编码技术 1.10 数据同步技术 1.11 多路复用技术 1.12 广域网中的数据交换技术 1.13 差错控制技术
本章涵盖了数在机器中的表示方法(如二进制、真值和机器数、BCD编码、字符与字符串),以及定点数和浮点数的运算。这部分知识常出现在选择题中,尤其是数制转换和定点数运算,包括移位运算、加减运算及溢出判断。...
在计算机系统中,Unicode字符集提供了一种统一的方式来表示世界上各种语言的字符,包括拉丁字母、希腊字母、汉字、阿拉伯文等。Unicode字符集中的每一个字符都有一个唯一的整数编号,称为Unicode码点。 UTF-8的编码...
运算器是计算机硬件中的一个组成部分,主要负责算术运算和逻辑运算。 首先,笔记解释了运算器的作用,即进行基本的算数运算(加、减、乘、除)和逻辑运算(移位、与、或等)。在设计运算器的结构时,通常会以加法和...
字符编码是计算机系统用来表示文本的方式,比如ASCII、GB2312、GBK、Big5和Unicode(UTF-8)等。简体中文通常使用GBK或UTF-8编码,而繁体中文则常使用Big5或UTF-8编码。当软件不支持当前文件或文本的编码时,就可能...
在标准ASCII码中无法直接表示中文字符,因此需要使用扩展的字符集或者通过特殊的编码方式来实现中文字符的显示。具体实现方法未在提供的代码片段中体现,但可以推测可能采用了自定义的中文字符集或编码方案。 #### ...
2. **多线程和并行处理**:x264支持多核CPU的并行处理,能够充分利用现代计算机的硬件资源,显著提高编码速度。 3. **自适应编码参数**:根据视频内容的复杂度,x264能够动态调整编码参数,确保在各种情况下都能达到...
- **通信**:如无线通信中的信道均衡、编码解码等。 - **音频和视频处理**:音频压缩、视频编码、降噪等。 - **图像处理**:图像增强、边缘检测、图像复原等。 - **控制工程**:如PID控制器设计。 - **生物医学...
**PS/2通信协议详解** PS/2通信协议是一种经典的接口标准,主要用于连接键盘和...在现代计算机系统中,虽然已经被更先进的接口所替代,但理解PS/2协议的基本原理对于计算机硬件和单片机编程的学习依然具有重要的价值。
4. 数据压缩:迭代算法在编码和解码过程中发挥重要作用,例如霍夫曼编码就是迭代构建最优编码树的过程。 5. 操作系统调度:如Linux中的CFS( Completely Fair Scheduler)调度器,使用红黑树和时间片的迭代更新来...
标题 "(转载)关于分辨率,还是没搞清楚" 暗示了这篇博客可能讨论的是计算机显示技术中的分辨率概念,以及可能存在的误解。在IT领域,分辨率是衡量图像清晰度的关键指标,通常以宽度和高度的像素数表示,如1920x...
Python语言的解释器先是将计算机上的源代码直接转换成字节编码的中间格式,然后再将其翻译成计算机上的机器语言,然后运行,这种运行方式能大大减少如何翻译、如何保持连接转载正确的库等问题。 最后,本文介绍了...
这个压缩包很可能是收集了一些模仿Jarvis的声音片段或者音频文件,供用户欣赏或用于各种项目,比如个人娱乐、音频创作或者编程实践中的语音合成应用。 在IT行业中,声音处理涉及到多个领域,包括音频编码、数字信号...
4. **代码编写**:按照选定的技术栈进行编码实现。注意保持代码整洁、注释清晰,以便于后期维护和调试。 5. **测试调试**:在不同设备上进行多次测试,确保界面能够在各种环境下正常运行,并修复可能出现的问题。 6....
【暑假做网站项目实践报告】 本实践报告详细记录了作者在暑假期间参与的网站项目...这次经历提醒我们在学习中不能仅停留在理论层面,要勇于实践,敢于面对困难,不断提升自己的综合素质,以适应实际工作中的各种挑战。
USB接口是由Compaq、Digital、IBM、Intel、Microsoft、NEC、Northern Telecom等多家公司联合推出的,旨在简化外设与计算机之间的连接方式。早期的外设通常使用多种不同的接口类型,如串行端口、并行端口等,这些接口...
在IT行业中,套接字(Socket)是一种网络通信机制,它允许不同的计算机通过网络进行数据交换。套接字是应用程序与网络协议栈之间的接口,它为程序员提供了底层网络通信的能力。在本文中,我们将深入探讨如何实现两台...
在开始配置之前,确保你的计算机满足以下基本要求: 1. 操作系统:Windows XP SP2或更高版本,或者Mac OS X 10.4.9或更高版本。 2. .NET Framework 3.5 SP1(对于Windows用户)。 3. Internet Explorer 6.0+ 或其他...
【标签】中的“毕设”、“毕业设计”、“课程设计”进一步强调了这是一个学术性质的项目,可能是某个计算机科学或相关专业学生的课程作业,目的是提升实践能力并评估学习成果。 【压缩包子文件的文件名称列表】中的...