`
ihuashao
  • 浏览: 4744994 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

Unicode介绍

阅读更多

很早就知道这个概念,只知道是提供全球统一的编码,今天仔细搜索了一下。

问:什么是Unicode?
答:Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode标准已经被这些工业界的领导们所采用,例如:Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys和其它许多公司。最新的标准都需要Unicode,例如XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML等等,并且,Unicode是实现ISO/IEC 10646的正规方式。许多操作系统,所有最新的浏览器和许多其他产品都支持它。Unicode标准的出现和支持它工具的存在,是近来全球软件技术最重要的发展趋势。

问:为什么使用Unicode?
答:基本上,计算机只是处理数字。它们指定一个数字,来储存字母或其他字符。在创造Unicode之前,有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符:例如,单单欧州共同体就需要好几种不同的编码来包括所有的语言。即使是单一种语言,例如英语,也没有哪一个编码可以适用于所有的字母,标点符号,和常用的技术符号。这些编码系统也会互相冲突。也就是说,两种编码可能使用相同的数字代表两个不同的字符,或使用不同的数字代表相同的字符。任何一台特定的计算机(特别是服务器)都需要支持许多不同的编码,但是,不论什么时候数据通过不同的编码或平台之间,那些数据总会有损坏的危险。

问:举个例子吧。
答:比如,简体中文(GB)、繁体中文(BIG5)、日文中,“赵”都是一个字,但是编码不同。在不同的编码下,BIG5的赵是0xBBAF,而0xBBAF在GB里面就被显示为“化”,这就是乱码。而Unicode采用统一的编码,“赵”只有一个,不必管他在哪种文字里。

问:Unicode的优点是什么?
答:举一个最明显的例子就是Windows 2000/XP以及微软Office2000及其后的产品。因为这些软件都是Unicode内核,因此,无论何种文字,都可以在上面正常显示,而且是同屏显示。以前,简体中文的Word文件拿到英文版打开就会是乱码,简体中文的程序在Windows英文版上运行会出现乱码,而现在一切都解决了。

在线转换工具:http://www.chinaue.com/tool/uni.htm

分享到:
评论

相关推荐

    Unicode知识介绍

    #### Unicode介绍 Unicode是一种广泛接受的字符编码标准,旨在支持世界上几乎所有的书写系统。它不仅包括拉丁字母,还包括汉字、日文假名、阿拉伯文字等,从而实现了全球语言的统一编码。Unicode的核心是其定义的...

    Unicode介绍,i18n测试需要的了解的知识,很全面很详细。

    【Unicode介绍】 Unicode是一种国际标准的字符编码体系,旨在为全球所有语言提供一个统一的、无歧义的字符表示方法。它的核心理念是为世界上每一个字符分配一个唯一的数字,称为码点(code point),使得计算机能够...

    unicode字符串

    1. **Unicode介绍**:Unicode是一个统一的字符集,包含超过14万的字符,覆盖了全球几乎所有的文字系统。每个字符都有一个唯一的编号,称为码点。 2. **Unicode编码形式**:Unicode有多种编码形式,如UTF-8、UTF-16...

    Unicode VIs_asciiunicode_

    - “Unicode介绍.pdf”:一个详细的Unicode编码体系介绍文档。 - “ASCII_to_UTF8_example.txt”:包含ASCII到UTF-8转换的示例文本文件。 - “转换工具源码.zip”:可能包含用不同编程语言编写的ASCII到UTF-8转换的...

    第十六节 unicode绕过过滤触发XSS-01

    Unicode介绍 Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的...

    让易语言支持Unicode

    不要在求官方支持Unicode啦自己完全能使得易语言支持Unicode 本源码Unicode播放音乐 Unicode文件名自己找,自己看源码,如果你问我界面不支持Unicode怎么解决那我想给你一拳,不会用UI?写代码最重要的是能傻瓜化就傻瓜...

    UTF8转Unicode的详细介绍

    这篇详细的介绍将深入探讨UTF8与Unicode的关系、各自的特点以及如何进行转换。 首先,Unicode是一个字符集,它定义了世界上几乎所有的文字和符号,包括汉字、拉丁字母、希腊字母、数学符号等。它的目标是为每个字符...

    Unicode中文编码对照表

    在描述中提到的“博文链接:https://junefsh.iteye.com/blog/635385”,这是一个指向博主junefsh在ITEYE技术社区发表的文章的链接,这篇文章很可能详细介绍了Unicode编码与中文字符的关系,以及如何使用Unicode来...

    Unicode转换成GBK

    本文将详细介绍如何利用C/C++编程语言实现从Unicode到GBK的编码转换。 #### 二、Unicode与GBK概述 1. **Unicode**:Unicode是一种通用的字符编码方式,它为每一个字符分配了一个唯一的数字,以便于在计算机上存储...

    中文转化为unicode格式的方法类

    本文将深入探讨如何将中文字符转换为 Unicode 格式,并介绍一个名为 `unicodeConvert.java` 的 Java 类,该类已通过实际程序验证,确保了其功能的可行性。 Unicode 编码通常采用 UTF-8、UTF-16 或 UTF-32 这样的...

    Unicode标准版本5.0The Unicode Standard, Version 5.0

    - **技术报告**:详细介绍Unicode标准的各项技术和实践指南。 - **参考手册**:提供了详尽的字符列表及其属性说明。 - **开发工具**:包括验证工具、转换工具等,帮助开发者进行Unicode编码的测试和调试工作。 ####...

    GBK与Unicode码对照表.rar

    这篇内容将深入解析这两个编码系统,并介绍它们之间的对应关系。 首先,GBK编码是GB2312编码的扩展,是中华人民共和国国家汉字信息交换编码标准之一。GB2312在1980年发布,主要涵盖了6763个常用汉字和一些基本的...

    Unicode编码详细介绍

    ### Unicode编码详细介绍 #### 0. Big Endian 和 Little Endian Big Endian 和 Little Endian 是两种不同的字节顺序标准,主要用于表示多字节数据的存储方式。这两种标准主要区别在于高位字节的存储位置。 - **...

    vb utf8转Unicode

    本文将详细介绍如何在VB中实现UTF-8到Unicode的转换,解决在使用`StrConv`函数时遇到的中文乱码问题。 #### 二、背景知识 1. **UTF-8与Unicode**: - **UTF-8**是一种变长字符编码,用于表示Unicode标准中的字符...

    js 中文汉字转Unicode、Unicode转中文汉字、ASCII转换Unicode、Unicode转换ASCII、中文转换&#XXX函数代码

    Unicode介绍 Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。 Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、...

    GB与Unicode转换

    本文将详细介绍GB码(国标码)与Unicode码之间的转换原理及实现方法,为相关领域的工程师提供实用的技术指南。 #### 二、GB码与Unicode码概述 **GB码(国标码)**是中国制定的一套汉字编码标准,主要用于简体中文...

    常用汉字unicode和拼音的对应关系

    ### 常用汉字Unicode与拼音的对应关系详解 在数字化时代,汉字的编码与转换成为信息技术中的一个重要环节。...通过本文的介绍,希望能帮助读者更深入地理解汉字编码的世界,为今后的学习和工作打下坚实的基础。

    Big5字与Unicode的互换

    本文将详细介绍Big5与Unicode之间的转换方法,并通过具体的Java代码示例来展示这一过程。 #### 二、Big5编码概述 Big5(大五码)是一种繁体中文字符集标准,主要在中国台湾地区以及部分海外华人社区中使用。它包含...

    delphi2009 Unicode转汉字,汉字转Unicode源码

    这篇文档将详细介绍如何在Delphi 2009中进行这种转换,并提供源码示例。 首先,了解Unicode的基础知识是至关重要的。Unicode是一个字符集,包含了世界上几乎所有的文字系统,它用一个唯一的数字(码点)来表示每个...

Global site tag (gtag.js) - Google Analytics