编码发展的历史
在谈bytes
和str
之前,需要先说说关于编码是如何发展的。。
在计算机历史的早期,美国为代表的英语系国家主导了整个计算机行业,26个英文字母组成了多样的英语单词、语句、文章。因此,最早的字符编码规范是ASCII码,一种8位即1个字节的编码规范,它可以涵盖整个英语系的编码需要。
编码是什么?编码就是把一个字符用一个二进制来表示。我们都知道,所有的东西,不管是英文、中文还是符号等等,最终存储在磁盘上都是01010101这类东西。在计算机内部,读取和存储数据归根结底,处理的都是0和1组成的比特流。问题来了,人类看不懂这些比特流,如何让这些010101对人类变得可读呢?于是出现了字符编码,它是个翻译机,在计算机内部某个地方,透明的帮我们将比特流翻译成人类可以直接理解的文字。对于一般用户,不需要知道这个过程是什么原理,是怎么执行的。但是对于程序员却是个必须搞清楚的问题。
以ASCII
编码为例,它规定1个字节8个比特位代表1个字符的编码,也就是“00000000”这么宽,一个一个字节的解读。例如:01000001表示大写字母A,有时我们会“偷懒"的用65这个十进制来表示A在ASCII
中的编码。8个比特位,可以没有重复的最多表示2的8次方(255)个字符。
后来,计算机得到普及,中文、日文、韩文等等国家的文字需要在计算机内表示,ASCII的255位远远不够,于是标准组织制定出了叫做UNICODE的万国码,它规定任何一个字符(不管哪国的)至少以2个字节表示,可以更多。其中,英文字母就是用2个字节,而汉字是3个字节。这个编码虽然很好,满足了所有人的要求,但是它不兼容ASCII
,同时还占用较多的空间和内存。因为,在计算机世界更多的字符是英文字母,明明可以1个字节就能够表示,非要用2个。
于是UTF-8
编码应运而生,它规定英文字母系列用1个字节表示,汉字用3个字节表示等等。因此,它兼容ASCII
,可以解码早期的文档。UTF-8
很快就得到了广泛的应用。
在编码的发展历程中,我国还创造了自己的编码方式,例如GBK
,GB2312
,BIG5
。他们只局限于在国内使用,不被国外认可。在GBK
编码中,中文汉字占2个字节。
相关推荐
《信息论与编码理论》是一门深奥且重要的学科,其发展历程贯穿了近两个世纪的科技进步。信息论的诞生可以追溯到19世纪中叶至20世纪40年代,当时的编码问题主要围绕MORSE码,这标志着通信有效性与可靠性的初步探讨。...
NRZI 编码及其发展 NRZI 编码是一种自同步信号编码方式,广泛应用于串行总线通信中,如 UART、I2C、SPI、USB 等。NRZI 编码的出现是为了解决串行总线通信中的同步问题。 在串行总线通信中,发送者和接收者之间需要...
纠错编码的发展历程是现代通信和信息存储技术中一个极为重要的部分,其理论基础和实际应用的演进极大地提高了数据通信的准确性和可靠性。 纠错编码的基本概念涉及到为什么需要引入纠错码,以及它们在通信系统中扮演...
RTC 2017北大马伟思教授的PPT详细介绍了视频编码的发展历程,从早期的标准到最新的技术进展,涵盖了HEVC、AVS、AV1以及VVC等多个关键阶段。 视频编码的早期标准包括MPEG-1和MPEG-2,这些标准在上世纪90年代被广泛...
### 编码历史演变过程详解 #### 一、编码起源 在信息技术的发展历程中,字符编码扮演了极其重要的角色。早期计算机技术仅限于美国境内使用时,科学家们设计了一种简单而有效的编码方式——ASCII(American ...
总的来说,多媒体技术的发展历程是一部计算机技术与信息交流方式不断融合的历史。从最初的军事应用到如今的日常生活中无处不在,多媒体技术不仅丰富了我们的信息世界,也为社会各个领域的创新提供了强大支持,展示了...
《编码的奥秘》是一本深入探讨编码技术的电子书籍,涵盖了编码的起源、发展历程...通过阅读这25个独立的PDF文档,编程人员不仅可以全面了解编码的历史,还能掌握现代编程的前沿知识,从而在职业生涯中更加游刃有余。
初识Go语言 Go语言地发展历史 • Go语言地优势与特点 • 安装与配置Golang • GoLand安装与配置 • Go语言地优势与特点 • Go语言程序结构及编码规范
- **语音编码的历史沿革**:语音编码的概念最早源于对电话通信的研究。20世纪初,贝尔实验室开始探索电话信号的特点,并提出了信息论的概念,这为语音编码的发展奠定了基础。至1939年至1940年期间,语音编码技术开始...
作者Charles Petzold通过历史的视角深入探讨了编码的发展,从最初的编码方法到现代计算机使用的编码技术。 本书提及了多种编码技术,包括摩尔斯电码(Morse code)、布莱叶盲文(Braille code)、点字码(dotdash)...
在IT行业中,emoji已经成为了日常交流和编程中的重要元素,特别是在移动设备和互联网通信中...而对于历史研究者,`ios_emoji2012-05-17.sql`这样的文件提供了宝贵的资料,揭示了移动操作系统早期阶段emoji的发展历程。
尽管随着技术的进步,BIG5编码逐渐被更先进的编码标准所取代,但它在中文信息历史上的地位不容忽视,仍然是理解中文编码发展史不可或缺的一部分。对于学习繁体中文、进行汉字编码研究以及从事中文信息处理工作的专业...
同时,这也涉及到字符编码的历史和文化背景,因为编码标准不仅关乎技术,还反映了不同地区和时期的信息处理习惯。 总之,JIS X 0208是日本的双字节字符编码标准,用于表示日文字符。这个压缩包中的jis.c文件可能...
### GB2312简体中文编码表知识点详解 #### 一、GB2312简介 ...综上所述,GB2312作为中国最早期的汉字编码标准之一,虽然已经逐渐被新的编码标准所取代,但了解它对于理解中文编码的历史和发展仍然具有重要意义。
通过阅读这本书,读者可以全面了解视频编码的历史发展、技术原理和最新趋势,对于从事视频处理、传输和存储相关工作的人士来说,这是一本不可多得的参考资料。它不仅能够帮助读者掌握现有标准,还能启发他们对未来的...
在漫长的计算机发展历史上,出现了很多为了适应当地的需要而对计算机的编码进行在创造的情况,因此在这个时代,很多软件和程序的编码问题就成了让一些新手头疼的问题。本文系统的介绍了编码的历史和原理,对新手理解...
本文将详细探讨字符编码与解码的历史和发展,帮助读者理解不同编码方式的特点及其应用场景。 #### 二、ASCII:字符编码的开端 ASCII(American Standard Code for Information Interchange,美国信息交换标准代码...
原码、补码和反码是计算机科学中重要的编码概念,它们分别在不同的历史时期和技术背景下发挥着作用。原码虽然直观易懂,但在算术运算上存在局限性;反码在一定程度上优化了原码的缺点,但仍不如补码灵活高效;而补码...
此外,该建议书还包括了视频编码标准的发展历史、视频编码标准的技术特点、视频编码标准的应用前景等信息。 ITU-T H.264建议书的发布标志着视频编码标准的发展进入了新的阶段,为视频应用的发展提供了新的机遇和...