`
田野君
  • 浏览: 6511 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
社区版块
存档分类
最新评论

unicode编码 简谈

    博客分类:
  • Java
 
阅读更多
世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读,就会出现乱码。为什么电子邮件常常出现乱码?就是因为发信人和收信人使用的编码方式不一样。



可以想象,如果有一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,那么乱码问题就会消失。这就是 Unicode,就像它的名字都表示的,这是一种所有符号的编码。



历史上存在两个试图独立设计 Unicode 的组织,即国际标准化组织(ISO)和一个软件制造商的协会(unicode.org)。ISO 开发了 ISO 10646 项目,Unicode 协会开发了 Unicode 项目。

在1991年前后,双方都认识到世界不需要两个不兼容的字符集。于是它们开始合并双方的工作成果,并为创立一个单一编码表而协同工作。从 Unicode2.0 开始,Unicode 项目采用了与 ISO 10646-1 相同的字库和字码。

目前两个项目仍都存在,并独立地公布各自的标准。Unicode 协会现在的最新版本是2005年的 Unicode 4.1.0。ISO 的最新标准是 10646-3:2003。


Unicode 是一个很大的集合,现在的规模可以容纳100多万个符号。每个符号的编码都不一样,比如,U+0639表示阿拉伯字母Ain,U+0041表示英语的大写字母A,U+4E00表示汉字"一"。具体的符号对应表,可以查询 unicode.org,或者专门的汉字对应表。 



Unicode的问题

需要注意的是,Unicode 只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。


比如,汉字"一"的 unicode 是十六进制数4E00,转换成二进制数足足有15位(100111000000000),也就是说这个符号的表示至少需要2个字节。而表示其他更大的符号,可能需要3个字节或者4个字节,甚至更多。


这里就有两个的问题,一个是,如何才能区别 unicode 和 ascii?计算机怎么知道三个字节表示一个符号,而不是分别表示三个符号呢?第二个问题是,我们已经知道,英文字母只用一个字节表示就够了,如果unicode统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有二到三个字节是0,这对于存储空间来说是极大的浪费,文本文件的大小会因此大出二三倍,这是难以接受的。

它们造成的直接结果是:出现了unicode 的多种存储方式,也就是说有许多种不同的二进制格式,可以用来表示 unicode 。另外 unicode 在很长一段时间内无法推广,直到互联网的出现。

网络上流行的utf-8就是unicode编码的一类应用.



如何查询 Unicode 编码

在 Windows 系统下,你可以在运行栏输入 "eudcedit.exe" 调用 TrueType 造字程序,在其中的窗口--参照页,在"代码"栏输入 Unicode 编码可以查找到相应的字符;在"形状"栏输入字符则可以查找到相应的 Unicode 编码 。
分享到:
评论

相关推荐

    大众车系编码简谈.pdf

    在当今汽车行业,随着电子化和智能化的不断深入,编码在汽车系统中的作用日益凸显。尤其是在大众车系中,编码不仅承载着车辆控制逻辑的核心,还提供了实现车辆多样化功能的灵活性。本文将深入探讨大众车系中的编码...

    简谈Windows下的反调试技术.pdf

    简谈Windows下的反调试技术 简谈Windows下的反调试技术 简谈Windows下的反调试技术 简谈Windows下的反调试技术 简谈Windows下的反调试技术 简谈Windows下的反调试技术

    简谈工程项目成本管理.doc

    简谈工程项目成本管理.doc

    简谈公司员工绩效承诺.doc

    简谈公司员工绩效承诺.doc

    房地产开发流程简谈.pptx

    房地产开发流程简谈.pptx

    简谈英文自我介绍精选.doc

    简谈英文自我介绍精选.doc

    简谈ERP上机实验心得体会.doc

    简谈ERP上机实验心得体会

    计算机网络安全漏洞防范简谈.pdf

    计算机网络安全漏洞防范简谈.pdf

    简谈计算机应用基础教学.doc

    简谈计算机应用基础教学 简谈计算机应用基础教学 任务驱动教学法是一种建立在建构主义学习理论基础上的教学法,怎样分析计算 机应用基础教学? 一、引言 从事中职计算机教学多年来,发现了一个非常普遍的现象,即使...

    简谈校园网络安全方案的设计.pdf

    简谈校园网络安全方案的设计.pdf

    班级管理方法简谈.doc

    "班级管理方法简谈" 班级管理是学校教育中的一项重要工作,直接关系到学生的学习和成长。在《班级管理方法简谈》中,作者卢海战提出了五点班级管理方法,旨在提高班级管理的效率和质量。 首先,作者强调了加强学生...

    简谈jdk动态代理

    ### 简谈JDK动态代理 #### 一、引言 JDK动态代理机制是Java反射机制的一个重要应用,它允许程序在运行时创建一个实现了特定接口的新类实例,并且能够控制这些新类实例的方法调用行为。这种机制不仅提高了代码的灵活...

    手机成像技术简谈.doc

    【手机成像技术简谈】 手机成像技术是现代生活中不可或缺的一部分,随着智能手机的发展,越来越多的人选择使用手机作为日常拍照的主要工具。手机成像技术的关键在于如何在各种环境条件下捕捉到理想亮度的照片,这...

    房地产开发流程简谈(PPT 67页).pptx

    房地产开发流程简谈(PPT 67页).pptx

    简谈互联网时代高校辅导员的管理工作方法.pdf

    简谈互联网时代高校辅导员的管理工作方法.pdf

    简谈音乐教育教学课程改革-魏晓媛共4页.pdf.zip

    很抱歉,根据您提供的信息,"简谈音乐教育教学课程改革-魏晓媛共4页.pdf.zip" 和 "赚钱项目" 这些内容并不属于IT知识领域。标题和描述提到的是关于音乐教育课程改革的学术文章,而标签内容也是对这篇文章的作者和...

    简谈计算机病毒.pptx

    到了1992年至1995年的成熟发展阶段,病毒具备了多态性,传统的特征码检测方法面临挑战。1995年至2000年的网络病毒阶段,随着互联网的普及,病毒通过网络传播,蠕虫病毒开始大规模扩散。2000年后,计算机病毒进入了...

    简谈三菱PLC编程软件.docx

    【标题】:简谈三菱PLC编程软件 【描述】:本文主要探讨了三菱可编程逻辑控制器(PLC)的编程软件,包括不同系列的软件特点及其在编程、监控、调试和维护中的应用。 【标签】:互联网 cs 【正文】: 三菱PLC编程...

    简谈buntu之DIY发行版.pdf

    ### 知识点生成:简谈Ubuntu之DIY发行版 #### 1. 概述 随着二十一世纪的到来,个性化需求愈发明显,这不仅体现在日常生活中,也体现在技术领域,比如自定义操作系统(OS)。本文将详细介绍如何通过简单的步骤DIY一...

Global site tag (gtag.js) - Google Analytics