字符(Character)是文字与符号的总称,包括文字、图形符号、数学符号等。
一组抽象字符的集合就是字符 集(Charset)。
字符集常常和一种具体的语言文字对应起来,该文字中的所有字符或者大部分常用字符就构成了该文字的字符集,比如英文字符集。
常见的字符集包括ASCII字符集(由控制字符和图形字符组成)、GB2312字集(简体字集),GBK字集(简繁字集),通用字符集(Universal Character Set,UCS),Unicode字集(同UCS)。
字符编码(Character Encoding):是一套法则,使用该法则能够对自然语言的字符的一个集合(如字母
表或音节表),与其他东西的一个集合(如号码或电脉冲)进行配对。即在符号集合与数字系统之间建立对应关系,它是信息处理的 一项基本技术。通常人们用符号
集合(一般情况下就是文字)来表达信息。而以计算机为基础的信息处理系统则是利用元件(硬件)不同状态的组合来存储和处理信息的。元件不同状态的组合能代
表数字系统的数字,因此字符编码就是将符号转换为计算机可以接受的数字系统的数,称为数字代码。
以ascii字符集和ascii编码为例
Ascii字符集包含A,B,C….等字符
Ascii编码是一种将ascii字符集中的字符映射到计算机的映射关系,即表示字符与存储形式的对应关系。
A--------------------------->65
B--------------------------->66
C--------------------------->67
-
针对Unicode的编码UTF-32,UTF-16,UTF-8
UTF-32,对每个字符都使用4字节,就空间而言,是非常没有效率的。特别地,非基本多文种平面的字符在大部分文件中通常很罕见,以致于它们通常被认为不存在占用空间大小的讨论,使得UTF-32通常会是其它编码的二到四倍。
UTF-16,Unicode的码空间从U+0000到U+10FFFF,对每个字符使用2字节或者4字节进行存储。java中的string就是使用UTF-16编码存储的,当一个字符的编码在16bit范围内,就用一个char存储,当字符编码范围超过16bit时,用两个char来保存这个字符。
UTF-8使用一至四个字节为每个字符编码。
可以参考下面链接,去了解unicode编码的一些详细信息。
http://zh.wikipedia.org/wiki/UTF-32
http://zh.wikipedia.org/wiki/UTF-16
http://zh.wikipedia.org/wiki/UTF-8
分享到:
相关推荐
数据字典通常记录了表结构、表名、主键、外键参照等信息,但很少记录字段之间的逻辑关系和表的概念定义。因此,需要通过观察和分析来确定这些信息。 总的来说,数据探索需要明确目的,根据主题缩小范围,对字段进行...
知识点一: 字符串的定义和初始化 在 C语言中,字符串是使用 char 类型数组来存储的。例如,char string[100] 声明了一个可以存储 100 个字符的字符串数组。在本实验中,我们使用 gets 函数来输入一个字符串,并将其...
### 理清概念:数据、信息、知识和智慧之间的关系 #### 一、引言 在当今数字化时代,我们每天都被大量的数据所包围。这些数据不仅仅是简单的数字或符号,而是构成了我们的工作环境、日常生活乃至整个社会的基础。...
### 通信业协调发展需理清的十大关系 #### 关系一:速度与效益的关系 通信业作为国家重要的基础设施,其发展速度与效益之间的平衡尤为重要。一方面,为了抓住信息时代的机遇,尤其是在经济欠发达地区,通信业需要...
固定资产管理方法:制作台账和盘点库房、年度盘点和全面理清资产方法.pdf
在画用例图的时候,理清用例之间的关系是重点。用例的关系有泛化(generalization)、扩展(extend)和包含(include)。...泛化(generalization):泛化关系是一种继承关系,子用例将继承基用例的所有行为,关系和通信关系
理清框架与脉络是指在需求分析阶段建立一个明确、结构化的思路,以便于后续的设计、编码和测试。这篇博文“需求分析 理清框架与脉络”可能详细阐述了如何进行有效的需求分析,以及如何构建项目的整体框架。 首先,...
计算机前端-实战.目视频2-06.理清rbac表之间的关系.wmv
gcc,libc,glibc的关系
【大阅读理清文章思路学习教案】主要针对的是如何理解和分析文章的结构、内容与主旨,这在学术和教育领域尤为重要,尤其是对于处理文学作品和科学论著等不同类型的文本。文章思路的理解不仅关乎到对文章层次结构的...
【RPG项目C++编码规范】是针对C++编程者在开发角色扮演游戏(RPG)项目时遵循的一套代码编写准则,旨在提高代码的可读性、可维护性和团队协作效率。以下是规范的详细说明: 1. **命名规则**: - 文件名和类名应...
一文理清国有企业董事会、经理层决策重大问题的前置程序时的权责边界.pdf
亲属是基于婚姻、血缘和法律拟制而形成的社会关系。亲属关系包括夫妻、父母、子女、兄弟姊妹、祖父母和外祖父...让您准确的叫出亲戚称谓,理清亲属之间的亲戚关系,轻松掌握中国式的亲戚关系换算,让你更了解中国文化。
2. **分支与子分支**:软件允许用户添加多个分支,每个分支可以进一步细分,以展示层次结构和逻辑关系。 3. **图形元素**:Sharemind可能提供各种图形和符号,使导图更具视觉吸引力,更便于理解。 4. **颜色编码**...
PE(Portable ...它展示了PE文件的内部结构,包括不同部分的功能和相互关系,对于深入理解Windows程序的运行机制具有极大的价值。无论你是开发人员、系统管理员还是安全研究人员,熟悉PE结构都是必备技能之一。
- **详细概述围绕线索展开的人物、时间、地点和事件的起因、经过和结果,以及情感表达。** **四、判断线索的技巧** 1. **线索特点**:贯穿全文且反复出现,将材料紧密联系。 2. **找线索的方法** - **了解文章...
梳理Informatic的元数据,理清ETL背后的数据加工流水线基础数据,基于SQL析可以获取目标表依赖的源表和映射,然后基于映射可以追溯到相应的会话、工作集、工作流,完成整个数据加工链的血缘
4. 答题策略:理解和分析论证结构时,需要关注段落间的逻辑关系,理解关键词句,识别过渡段或句,理清论点和论据之间的关系,以及论证方法的运用。 5. 论证过程分析:第③段首先提出孩童时期是培养读书习惯和能力的...
- 部管理关系、行政隶属关系、业务指导关系、垂直管理关系和属地管理关系是政务关系的具体体现。 5. 公文写作的过程: - 包括公文准备阶段、起草阶段、修改阶段和整理阶段。 - 准备阶段需要收集信息、明确依据、...