`
zsjg13
  • 浏览: 142246 次
  • 性别: Icon_minigender_1
  • 来自: 安徽
社区版块
存档分类
最新评论

Unicode字符集

    博客分类:
  • Java
阅读更多

Unicode字符集

 

Unicode字符集将characters映射到integer code points。例如,Latin字母A赋的是code point 65。Unicode的容量超过了100万个字符,足够容纳来自世界上手稿(scripts)中的每一个字符。当前版本的Unicode 4.1定义了来自许多语言的97,655个不同字符。

 

最前面的128个Unicode字符(0~127)和ASCII字符集是一致的。ASCII空格是32;因此32也是Unicode空格。

 

紧接着的128个Unicode字符(128~255)和ISO standard 8859-1定义的Latin-1字符集是一致的。

Latin-1的一个轻微的变体被Windows所利用,再加上各种重读字符,元音变音,乱七八糟的问号,以及其他在大多数西欧语言中编写文本需要用到的其他字符。

 

Unicode分割成了块。例如,字符0~127是基本的Latin块,其中包含了ASCII。字符128~255是Latin扩展。

 

尽管内部,Java可以处理完整的Unicode data(毕竟,code point只是numbers),并不是所有的Java环境都能够显示所有Unicode字符。最大的问题就是缺少字体。

分享到:
评论

相关推荐

    关于GBK和Unicode字符集转换乱码问题

    ### 关于GBK和Unicode字符集转换乱码问题 在计算机科学与互联网技术中,字符集是一种用于表示文本的标准集合,不同的字符集适用于不同的语言环境。本文将深入探讨GBK与Unicode这两种字符集之间的转换问题,特别是在...

    【Unicode字符集】

    【Unicode字符集】Unicode字符集系列

    Unicode字符集和多字节字符集关系[借鉴].pdf

    Unicode 字符集和多字节字符集关系 Unicode 字符集是为了整合全世界的所有语言文字而诞生的,任何文字在 Unicode 中都对应一个值,这个值称为代码点(code point)。代码点的值通常写成 U+ABCD 的格式。 Unicode ...

    unicode字符集转换函数

    《Unicode字符集转换函数详解》 在信息技术领域,字符编码是一个至关重要的概念,它涉及到文本的存储、处理和传输。Unicode是一种广泛采用的国际字符集标准,旨在为全球所有语言提供一个统一的编码方式。...

    Java Unicode 和字符集

    随着Unicode字符集的不断扩大,UCS-2已经不足以覆盖所有字符,因此引入了更高级的编码方式——UTF-16。UTF-16仍然使用16位的基本单位,但对于超出基本多文种平面(Basic Multilingual Plane,BMP)的字符,则使用更...

    Unicode字符集 8.0 2015-06-17最新标准

    ### Unicode字符集 8.0 – 2015-06-17 最新标准 #### 一、概述 Unicode是一种重要的国际字符编码标准,它旨在为世界上几乎所有的书写系统提供标准化的编码方案,从而使得不同语言的文字能够在计算机和其他数字设备...

    Unicode字符集.pdf

    Unicode字符集是一种在计算机中使用广泛的标准字符编码系统,它的目标是为每一种现代和古代文字的字符提供一个唯一的代码。Unicode的中文全称为统一码、统一字符集、万国码或单一码,其设计的目标之一是解决传统字符...

    vs2008-Unicode字符集下CString与char_互转换

    在VS2008中,默认的字符集形式是Unicode,但在VC6.0等工程中,默认的字符集形式是多...这里总结了在VS2008环境中 Unicode字符集下CString和char *之间相互转换的几种方法,其实也就是Unicode字符集与MBCS字符集转换。

    Unicode字符集 V6.1

    ### Unicode字符集 V6.1 知识点详解 #### 一、Unicode标准简介 Unicode是一种全球性的字符编码标准,旨在提供一个通用的字符集,支持世界上几乎所有语言的文字表示。Unicode标准由Unicode联盟制定和维护,它定义了...

    Unicode 字符集转换

    **Unicode字符集转换详解** Unicode,全称统一码或万国码,是一种为所有现代计算机系统设计的全球字符编码标准。它的目标是为世界上每一种已知的语言提供一个唯一的数字编码,使得各种语言的文字能够在不同的计算机...

    unicode 字符集 与 多字节字符集 转换的代码

    unicode 字符集 与 多字节字符集转换/kekegeneral

    BabeMap Unicode字符集工具

    一个浏览Unicode字符集的工具,可以加载不同的字体.研究Unicode字符集的绝好工具.

    MFC在unicode字符集下的多字节串口调试助手

    《MFC在Unicode字符集下的多字节串口调试助手详解》 在现代软件开发中,字符编码的处理是一项至关重要的任务,尤其是在涉及到跨平台或跨语言环境的应用时。MFC(Microsoft Foundation Classes)作为微软提供的C++...

    unicode 汉字字符集

    ### Unicode汉字字符集详解 #### 一、Unicode简介 Unicode是一种国际编码标准,旨在为所有书写语言中的每个字符提供唯一的数字。它不仅包括了西文字符,还包含了各种语言文字,如汉字、日文、韩文等。Unicode的...

    unicode字符集

    If you are an existing user, make sure you know the Top 10 Features and that you reclaimed shortcuts Visual Studio usurped over the years, including Shift+Alt+O assigned to Open Web Site....

    20081024Unicode字符集扩展及Surrogate[归纳].pdf

    Unicode字符集是编码标准,旨在容纳世界上所有语言的文字,确保数据在不同的计算机系统间能够无缝交换。这个标准是由Unicode联盟制定的,它定义了一个字符到一个数字(代码点)的映射,使得每个字符都有一个唯一的...

    unicode字符集下编写多字节的串口调试助手

    当我们提到“unicode字符集下编写多字节的串口调试助手”时,这涉及到字符编码的处理,尤其是Unicode和多字节编码间的转换。 Unicode是一种国际标准,用于表示世界上几乎所有的文字和符号,确保不同语言的字符可以...

    LTDC—液晶显示中英文(第2节)—Unicode字符集.pptx

    总结来说,Unicode字符集为全球各种文字提供了一种统一的编码标准,而UTF-32、UTF-16和UTF-8则是Unicode编码的不同实现,各有优缺点。在实际应用中,UTF-8由于其良好的ASCII兼容性和空间效率,已经成为互联网上最...

    oracle字符集的查看和client字符集的修改

    Oracle支持多种字符集,包括单字节字符集(SBCS)、多字节字符集(MBSCS)以及Unicode字符集等。 - **单字节字符集(Single Byte Character Set, SBCS)**:每个字符由一个字节表示。 - **多字节字符集(Multi Byte ...

Global site tag (gtag.js) - Google Analytics