`
hongjn
  • 浏览: 56588 次
  • 性别: Icon_minigender_1
  • 来自: 火星
社区版块
存档分类
最新评论

unicode编码

阅读更多

终于把unicode编码做了一个大致的了解了。  

在学习的过程中知道了很多概念和相关的发展历史,对以前比较模糊的概念也有了比较深入的了解。

 

一些概念:

  1. bom(byte order mark)用来区别是big endian(BE)还是little endian(LE)。
    区别的方法: 在UTF-16文件的头2个字节里做个标记: LE [0xFF, 0xFE], BE [0xFE, 0xFF]; 而在UTF-8中,标记[0xEF, 0xBB, 0xBF],可有可无的
  2. Unicode的理解
  3. UCS(universal character set)通用字符集
  4. UTF-16
  5. UTF-8
  6. BMP(Basic Multilingual Plane),在表达一个Unicode的字符时,通常会用“U+”然后紧接着一组十六进制的数字来表示这一个字符。在BPM里的所有字符,要用四位十六进制数,在BMP以外的需要使用五位或六位十六进制数。


 
看完总结出来的简单的思维导图。
每一个点上都有细节可以研究,例如utf-8,utf-16等都有各自的算法,各自的实现方式。

参考
http://tech.idv2.com/2008/02/21/unicode-intro/

  • 大小: 15.3 KB
2
0
分享到:
评论

相关推荐

    最全的常用汉字Unicode码表

    1. **跨平台兼容性**:由于Unicode编码标准的普及,无论是Windows、macOS还是Linux系统,都能识别并正确显示这些编码所对应的汉字,大大增强了汉字信息的通用性和可读性。 2. **国际化支持**:随着全球化的深入发展...

    C实现数字转Unicode码

    总的来说,C语言实现数字到Unicode码的转换涉及对Unicode编码的理解、选择合适的编码方案以及可能需要的字节顺序处理。在处理Unicode时,应确保充分理解其工作原理,以便编写出正确且高效的应用程序。

    完整Unicode编码表

    Unicode编码表是一种国际标准,用于文本的编码、处理和显示,它旨在为世界上所有的字符提供一个独一无二的数字,无论它们在哪个语言中。随着Unicode 10.0版本的发布,编码表内容进一步扩充,增加了新的字符,以满足...

    各国文字Unicode编码范围

    Unicode编码是一种全球统一的字符编码标准,旨在为世界上所有语言的字符提供唯一的数字标识。它由Unicode联盟制定,包括了各种文字系统,如拉丁字母、汉字、日文、韩文、阿拉伯文等。通过Unicode编码,不同的计算机...

    通用规范汉字UNICODE码表

    标题“通用规范汉字UNICODE码表”表明本文件内容涉及了UNICODE编码体系中的通用规范汉字部分。Unicode是一个全球性的字符编码标准,它为世界上绝大部分的文字系统提供了唯一编号。UNICODE码表在计算机领域内具有...

    汉字与unicode编码(十六进制)对照表

    在这个“汉字与unicode编码(十六进制)对照表”中,我们可以找到汉字与其对应的Unicode编码,这对于编程、文本处理以及国际化和本地化工作来说具有重要的参考价值。 Unicode编码系统包括多个平面,其中基本多文种...

    Unicode中文编码对照表

    压缩包内的“unicode编码表.pdf”文件很可能是一个详细的Unicode中文编码对照表,列出了每个中文字符对应的Unicode值,这对于开发者调试代码、理解字符编码问题或者进行文本处理非常有用。这种表格通常会包括字符的...

    维吾尔文unicode编码表

    ### 维吾尔文Unicode编码表详解 #### 标题:维吾尔文Unicode编码表 **维吾尔文Unicode编码表**是针对现代维吾尔文中使用的字母、标点符号等字符制定的一种标准化编码方案。该编码表遵循Unicode国际标准,确保了...

    Fontcreate用Unicode编码下较完整的字符集分类压缩包

    标题中的“Fontcreate用Unicode编码下较完整的字符集分类压缩包”表明这是一份与字体设计软件Fontcreate相关的资源包,其中包含了使用Unicode编码的各种字符集合。Unicode是一种国际标准,旨在为全球所有语言提供一...

    文本与unicode码转换小工具V1.02.02

    文本与Unicode码转换小工具V1.02.02是一款专为处理字符编码问题而设计的...同时,理解Unicode编码的基本原理,如Unicode码点、UTF-8、UTF-16编码方式,以及它们与ASCII、GBK等编码的区别,也是IT专业人士必备的知识点。

    中文unicode编码表.rar

    Unicode编码,全称为统一码或万国码,是一种在计算机上表示文本的标准化方式,旨在解决全球不同语言字符的表示问题。中文Unicode编码表是Unicode标准的一部分,它包含了所有中文字符的编码,使得无论在哪种操作系统...

    得到字符或汉字的Unicode编码

    在“得到字符或汉字的Unicode编码”这个场景下,我们可能会使用到`wcstoul`函数,它能将宽字符串转换成无符号长整型,从而获取Unicode码点。例如,可以使用以下代码将一个汉字转换为其Unicode编码: ```c #include ...

    中英文与Unicode码互转

    《中英文与Unicode码互转》是一款非常实用的工具,主要功能是帮助用户将中文和英文字符转换成Unicode编码,反之亦然。Unicode是一种全球通用的字符编码标准,旨在为世界上所有的文字提供一个统一的表示方式,使得...

    手机号转Unicode.zip_labview_手机号码_转Unicode码

    通过以上介绍,我们可以看到,"手机号转Unicode.zip_labview_手机号码_转Unicode码"这个项目不仅涉及到LabVIEW的编程技巧,还展示了Unicode编码在实际问题解决中的应用。理解这两个概念对于提升IT技能和解决实际问题...

    IconfontTool.7z 阿里巴巴iconfont 字体库,显示图标及相应的unicode 编码。 .NET 5平台

    IconfontTool可能是专门为.NET 5平台设计的一个实用工具,它允许用户查看和管理Iconfont中的图标及其Unicode编码。这个工具可能具有以下功能: 1. **图标浏览**:提供一个图形界面,用户可以预览和搜索Iconfont库中...

    Unicode编码与汉字互转.rar

    在IT领域,Unicode编码是一种广泛使用的字符编码标准,旨在表示世界上所有语言的字符。这个压缩包文件"Unicode编码与汉字互转.rar"显然是一个关于如何在Qt C++环境中处理Unicode编码,特别是涉及到汉字转换的资源...

    Unicode编码转换源码

    总之,Unicode编码转换源码是关于在不同编码体系之间进行转换的程序,涉及Unicode码点和各种编码格式如UTF-8的交互。掌握这一技术有助于实现跨平台、跨语言的信息交换,对于构建全球化软件至关重要。通过深入理解...

    VB6.0 Unicode码 汉字 互转,支持混合互转.zip

    在VB6.0编程环境中,Unicode编码是一种标准的字符编码方式,它能够表示世界上几乎所有的文字,包括中文字符。在处理包含英文、汉字以及Unicode码的字符串时,有时我们需要进行编码之间的转换,以便正确地显示或处理...

    最全 Unicode 编码表 5.0,带索引

    Unicode编码表是计算机行业中用于字符编码的一种标准,它为世界上大多数的文字系统提供了唯一的数字标识。Unicode标准是由Unicode联盟开发和维护的,用于映射字符到唯一的数字(也称为码点)。Unicode 5.0是该标准的...

    Unicode码转中文和中文转Unicode码的最简便的方法

    Unicode码是一种国际标准字符编码,它能够表示世界上几乎所有的文字和符号,包括中文。Unicode码以16位或32位二进制形式存储每个字符,确保了不同语言间的兼容性和可交换性。中文转Unicode码和Unicode码转中文的过程...

Global site tag (gtag.js) - Google Analytics