编码字符集与字符集编码,读起来是不是有些拗口?
读起来拗口,听起来头晕。
如果你感觉拗口或者头晕,那么你就得看看这篇博客了。
从字面上看,
“编码字符集”是个偏正词组,这个词组的中心语是“字符集”,因此编码字符集就是一个字符集;
“字符集编码”也是个偏正词组,他的中心语是编码,因此字符集编码是一种编码。
一个是字符集,一个是编码。区别就是这么简单。
字符集好理解,就是字符的集合,例如所有的英文字母是一个字符集,所有的汉字是一个字符集。
但编码是啥东西?其实,编码是省略语,编码是编码方式或者编码方法的意思。
通过词组分析,知道了“字符集”和“编码”的区别,现在再看编码字符集与字符集编码的区别:
其实,
编码字符集就是对其中的字符编了号的字符集。
字符集编码是字符集中字符的存储传输格式。
仅从上面的语言分析,我们就可以大致知道这编码字符集与字符集编码的区别了(语文很重要啊),
下面再举了例子来看。
下图所示的是一个字符集
这是一个集合的图形表现形式,很直观,但不宜使用,看着有些乱。
对的,有些乱,但这个乱就是集合的特性,因为集合是没有顺序性的。像上面这样,把字符乱七八糟地放在一起,想找个字符都不方便,即使找到了,也不好表述其位置。
很乱,怎么办呢?把他们排排队。比如这样排:
A;
u;
C;
*;
g;
8;
0;
z;
?;
@;
这个时候,就比较好找字符了,也比较好描述字符的位置了,比如*,在第4个,0在第7个位置。也许这个例子里对字符排队候的便利性不是很明显,若字符个数很多的话,那便利性就大大滴了。
把字符集中的字符排了队,就相当于对字符编码了。
为什么这么说呢?编的码又在哪里呢?
既然排队了,就肯定有顺序,这个顺序号,自然而然就是字符的编码了。
编码的结果就是A=0;u=1;C=2;*=3;g=4;8=5;0=6;z=7;?=8;@=9
这样编过码的字符集就是编码字符集了。
为什么非要这样编码不可?为什么不可以A=8,u=1001...?
可以,完全可以!但我想,只有特别秀逗的人,才会搞出这么不自然而然的编码方案出来O(∩_∩)O~。
好了,编码字符集介绍完了,下面介绍字符集编码。
前面说字符集编码是字符集中字符的存储传输格式。
这里或许有个疑问,为什么存储传输的时候要搞出另外一种格式,直接用编码字符集中的编码不就可以了吗?
直接存储传输字符的编码,可以,而且很直观,ASCII码就是这样存储传输的。
但有的时候,为了少占用存储空间和少占用网络流量,就要设计出别的存储传输格式。
比如unicode字符集的utf-8格式,这种格式,如果全是英文字符的话,就比直接存储Unicode少占一半的空间。
总结一下:
编码字符集就是对其中的字符编了号的字符集。
字符集编码是字符集中字符的存储传输格式。
常见的编码字符集有ASCII,UNICODE;
常见的字符集编码有utf-8,utf-16,utf-32灯。
- 大小: 3 KB
分享到:
相关推荐
GB18030-2005 信息技术 中文编码字符集,单双四字节所有字符,包含简繁生僻字。
### GB 2312-1980 信息交换用汉字编码字符集 基本集 #### 一、GB 2312-1980简介 GB 2312-1980是中华人民共和国国家技术监督局于1980年发布的信息交换用汉字编码字符集的基本集,它是中国最早的一套国家标准汉字...
字符集与字符集编码简介 我们知道,计算机只能识别诸如0101这样的二进制数,于是人们必须以二进制数据与计算机进行交互,或者先将人类使用的字符按一定规则转换为二进制数。 那什么是字符呢?在计算机领域,我们把...
本文主要探讨了编码字符集和字符集编码的区别,这对于软件开发人员来说是基础且必要的知识。 首先,我们要区分两个概念:编码字符集和字符集编码。编码字符集,如UCS(Universal Character Set)或Unicode,是一个...
Mysql字符集编码详解 Mysql数据库中的字符集编码问题是许多开发者经常遇到的一个问题,特别是在JAVA项目中。解决这个问题需要从多方面入手,包括服务器、数据库、数据表和连接等四个层次。这篇文章将详细介绍如何...
GB2312是中国大陆的国家标准字符集,全称为“信息交换用汉字编码字符集·基本集”。它包含6763个汉字以及一些符号,主要用于简体中文的处理。GB2312使用两个字节来表示一个字符,能够满足早期中文信息处理的基本...
GB18030,全称为《信息技术——汉字编码字符集——基本集的扩充》,是中国国家强制性标准,是GBK字符集的进一步扩展,旨在支持更多的汉字以及少数民族文字。在IT领域,尤其是涉及到中文处理的系统和应用中,对GB...
字符集和字符编码是计算机处理文字的基础,它们决定了如何在二进制的世界中表示和传输人类语言。本文将深入探讨这两个概念,以及相关的知识点。 首先,我们要理解什么是字符集。字符集,顾名思义,就是一个集合,...
字符编码则是字符集与二进制数字之间的映射关系,它是计算机存储和处理字符的方式。通过字符编码,每个字符都可以被转化为一系列的二进制位,以便计算机能够识别和操作。编码过程需要先对字符集内的字符进行排序,...
GB2312汉字编码字符集对照表.xls
信息交换用汉字编码字符集 信息交换用汉字编码字符集是中国国家标准总局发布的一套国家标准,标准号是 GB 2312—1980。这个标准收录了6763个汉字和682个非汉字图形字符,适用于汉字处理、汉字通信等系统之间的信息...
文档中主要介绍了各类字符集以及相关的字符编码,字符的显示原理,从输入到显现的整个过程,程序中出现的乱码问题以及解决方案
1.此版本为传统蒙古文C编码字符集1.0版,为了保持版本的相对稳定,半年以内版本不升级,征集到意见和建议后,改进下一版本,使其更能满足广大用户的需求; 2.C编码的目标是:为全世界传统蒙古文编码统一贡献力量,...
GB2312 是中国大陆规定的字符集和编码,取消了 EASCII 的扩展字符,规定一个小于 127 的字符的意义与原来相同,但两个大于 127 的字符连在一起时,就表示一个汉字。GB2312 编码使用两个字节表示一个汉字,前面的一个...
字符集编码是计算机科学中的一个重要概念,涉及到数据的存储、传输和显示。在这个"字符集编码查询/反查工具"中,我们可以看到涉及到的关键技术包括字符集、二进制、十六进制、Base64以及URL编码。这些知识点在信息...
本文旨在深入探讨与Java相关的字符集编码知识,包括但不限于编码的基本概念、几种常见的字符集编码类型及其特点,以及Java如何处理这些字符集编码问题。 #### 二、编码基本知识 1. **ISO 8859-1** ISO 8859-1是...
GB2312汉字编码字符集是中国最早期的汉字编码标准之一,主要针对简体中文进行编码,由国家标准总局于1980年发布。这个字符集为汉字提供了一个二进制编码方式,使得计算机可以处理和显示汉字,极大地推动了中文信息...
在IT领域,字符集编码是处理文本数据时一个至关重要的概念。不同的编码方式决定了如何将字符映射到二进制表示,以及如何从二进制还原出字符。Qt是一个跨平台的应用程序开发框架,它提供了丰富的API来处理各种编码...
### Java字符集和编码 #### 一、引言 在探讨Java字符集和编码之前,我们先了解一下为什么在Java编程中需要关注字符集和编码。Java作为一种广泛应用的编程语言,其内部采用的是Unicode编码,这使得Java能够很好地...