unicode中的几大区间

thoughtfly

浏览: 692778 次
性别:
来自: 合肥

最近访客更多访客>>

exe19

qh529

二冲2010

a1002323289

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

偏门

游戏 C C++C#D语言

基本平面

平面0 (0000–FFFF): 基本多文种平面（Basic Multilingual Plane, BMP）.

unicode基本平面区的编码区间含义

第一辅助平面

第一辅助平面又称多文种补充平面（Supplementary Multilingual Plane，缩写SMP，或简称Plane 1），摆放拼音文字（主要为现时已不再使用的文字）和音符等符号。范围在U+10000～U+1FFFD。计划分配如下。

编码范围中文名称英语名称

10000-100FF 线形文字B Linear B

10100-101CF 古代记数系统 Ancient numeric systems

101D0-107FF 从左向右书写的音素和音节文字和符号集 Alphabetic and syllabic LTR scripts and sets of symbols

10800-10FFF 从右向左书写的音素和音节文字 Alphabetic and syllabic RTL scripts

11000-11FFF 婆罗米文字 Brahmic scripts

12000-12FFF 楔形文字和其他古代文字 Cuneiform and other ancient scripts

13000-15BFF 埃及和玛雅圣书体 Egyptian and Maya hieroglyphs

15C00-15FFF 阿兹台克象形文字 Aztec pictograms

16000-16FFF 新创文字 Recently-devised scripts

17000-1B5FF 亚洲大文字 Large Asian scripts

1B600-1BFFF 未分配 unassigned

1C000-1CDFF 米格马赫圣书体 Micmac hieroglyphs

1CE00-1CFFF 原始埃兰文字 Proto-Elamite

1D000-1DFFF 记号系统 Notational systems

1E000-1E7FF 未分配 unassigned

1E800-1EFFF 从右向左书写的文字 RTL scripts

1F000-1F0FF 游戏符号 Game symbols

1F100-1F2FF 字母数字和表意字符集 Alphanumeric and ideographic sets

1F300-1F7FF 象形字符集 Pictographic sets

1F800-1FFFD 未分配 unassigned

第二辅助平面

第二辅助平面又称为表意文字补充平面（Supplementary Ideographic Plane，缩写SIP，或简称Plane 2），整个范围在 U+20000～U+2FFFD。整个平面配置的都是一些罕用的汉字或地区的方言用字，如粤语用字及越南语的字喃。现时摆放了“中日韩统一表意文字扩展B区”（4万3253个汉字）、“中日韩统一表意文字扩展C区”（4149个汉字）以及中日韩兼容表意文字增补（CJK Compatibility Ideographs Supplement）。预计“中日韩统一表意文字扩展D区”和“中日韩统一表意文字扩展E区”也会使用此平面。

已分配和计划分配的编码区段为：

U+20000-U+2A6DF：中日韩统一表意文字扩展B区

U+2A700-U+2B73F：中日韩统一表意文字扩展C区

U+2B740-U+2B81F：中日韩统一表意文字扩展D区

还在草拟阶段。

U+2B820-U+2????：中日韩统一表意文字扩展E区

还在草拟阶段。

U+2F800-U+2FA1F：中日韩兼容表意文字增补

第三至十三辅助平面

第三辅助平面尚未使用，但打算用来摆放甲骨文、金文、小篆、中国战国时期文字等。计划分配的编码区段为：

U+30000-U+317FF：甲骨文

U+32000-U+32FFF：金文

U+34000-U+368FF：小篆

第四至第十三辅助平面并未计划使用。

第十四辅助平面

第十四辅助平面又称特别用途补充平面（Supplementary Special-purpose Plane，简称SSP），摆放“语言编码标签”和“字形变换选取器”，它们都是控制字符。范围在U+E0000～U+E01FF。

编码表详见E0000-E0FFF。

第十五至十六辅助平面

第十五至十六辅助平面都是私人使用区。它们的范围是U+F0000～U+FFFFD 及U+100000～U+10FFFD.

分享到：

关于unicode编码的研究 | unicode基本平面区的编码区间含义

2011-03-28 16:31
浏览 1939
评论(0)
论坛回复 / 浏览 (0 / 2074)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论