`
isiqi
  • 浏览: 16356059 次
  • 性别: Icon_minigender_1
  • 来自: 济南
社区版块
存档分类
最新评论

浅谈unicode 内码

 
阅读更多

前段时间做了个程序从hotmail获取好友列表,发现返回来的都是类似飓这种代码

我本来想返回一个汉字“飓”,居然返回来的是飓后来上网查了下,原来这个就是传说中的unicode汉字内码,并且还有一个巨大的内码和汉字的对应表

如果要将内码转换为汉字,难道要加载这个对应表做映射?,这个实在是麻烦,通过一些简单的分析,发现了两者之间的对应规律,其实很简单,汉字的utf-16编码的字节为4个,取低位的两个字节然后做一个双字节转无符号整数的计算就得到了这个内码

现在的情况的需要从内码转为汉字,此过程就是上面的过程的一个逆过程,了解了上面的冬冬,做个反转换就简单了

比如汉字“39123---16进制 98d3---〉字节数组[-104, -45]----utf-16编码成“飓“

同理用于其它特殊字符的unicode内码

分享到:
评论

相关推荐

    字符/汉字 unicode/内码查看

    标题中的“字符/汉字 unicode/内码查看”指的是在信息技术领域中处理文本编码的相关知识,尤其是针对中文字符的表示方式。Unicode是一种国际标准,旨在为世界上所有语言提供一个统一的字符编码体系,使得不同语言的...

    Unicode汉字内码表

    根据提供的信息,我们可以了解到这是一份关于Unicode汉字内码表的内容。下面将对这份文档中的信息进行详细解读。 ### Unicode简介 Unicode是一种国际标准字符编码方案,旨在为世界上所有书面语言提供统一且唯一的...

    unicode编码,区位码,机内码,国标码

    http://zhaozeen.googlepages.com/unicode.html

    Unicode 中文转换工具

    有的时候,遇见中文都被转化成了Unicode内码,看着很不爽,于是写了这么个小工具,用来将Unicode内码转换为中文,可以实现整篇的转换。 另外,此工具也可以将中英文转换为Unicode内码(您可以选择是否将英文转换)...

    高效Unicode/GB编码转换算法的设计和实现.pdf

    高效Unicode/GB编码转换算法的设计和实现.pdf

    汉字内码查询器汉字内码查询器汉字内码查询器

    对于汉字而言,常见的内码有GB2312、GBK、Big5(主要应用于繁体字)以及Unicode等。GB2312是中国大陆最早的标准汉字编码,它包含了6763个常用汉字。GBK是在GB2312基础上扩展的,支持更多的汉字和符号。Unicode则是一...

    汉字内码查询器,包括unicode和Ansi码

    本文将深入探讨汉字内码查询器及其与Unicode和Ansi码的关系。 首先,我们需要理解什么是汉字内码。在计算机系统中,每个字符都有一个特定的数字代码,称为字符编码。对于汉字,由于其数量庞大,简单的ASCII码不足以...

    资料:Unicode 汉字内码对应表第1/5页

    ### Unicode汉字内码对应表解析 #### 一、Unicode简介 Unicode是一种国际化的字符编码标准,旨在为世界上所有书写系统提供统一的编码方案。它解决了传统字符编码(如ASCII、GB2312等)在处理多语言文本时存在的...

    机内码与汉字转换工具

    本文将详细探讨“机内码”这一概念以及如何进行“汉字转换”,并结合“机内码与汉字转换工具”的使用,帮助你深入理解这个主题。 机内码,又称为内码或字符编码,是指计算机内部用于表示字符的一组二进制代码。不同...

    GBK内码字符串转Unicode字符串

    GBK和Unicode都是常见的字符编码标准,它们在处理中文字符时扮演着重要角色。GBK(Great Wall Code)是中国大陆广泛使用的汉字编码标准,而Unicode是一个国际化的编码标准,旨在统一全球所有语言的字符表示。 **GBK...

    汉字内码查询

    1. 使用命令行工具:在Windows系统中,可以使用`charmap`命令打开字符映射表,选择相应的汉字,查看其Unicode内码。对于GB2312、GBK等编码,可以使用专门的转换工具,如`GBCCovert.exe`,进行查询。 2. 在线内码...

    汉字内码查询软件

    汉字内码查询软件是一种计算机程序,它主要用于帮助用户将汉字转换为其对应的内码表示,以便于编程、数据库操作或其他需要处理汉字编码的场景。在计算机系统中,汉字不能直接以图形形式存储,而是通过特定的编码方式...

    win7 内码输入法及设置工具

    内码是计算机内部存储和处理汉字时所使用的二进制编码,常见的有GB2312、GBK、BIG5和Unicode等。在Windows系统中,每个汉字都有一个对应的内码,由两个或四个字节组成,表示该汉字在字符集中的位置。 在Windows 7中...

    汉子内码查询

    汉字内码查询是一款针对软硬件开发者的实用工具,主要用于帮助开发者快速查看并转换汉字的Unicode编码和GBK编码。在编程和系统开发过程中,理解和处理汉字内码是非常关键的一步,因为不同的编码方式会影响到字符的...

    win7内码输入法

    2. **输入方法**:用户通常需要知道汉字的内码,通常是区位码(每个汉字由一个区号和一个位号组成)或Unicode编码,然后按照特定的键入规则输入内码。 3. **内码查询**:用户可能需要使用内码表或工具来查找不熟悉的...

    win7内码输入法 一键安装

    为了更好地使用win7内码输入法,用户需要了解一些基本的内码知识,比如GB2312、GBK和Unicode编码的区别,以及如何查找和输入字符的内码。此外,还需要了解如何在系统中切换输入法,以及设置和管理已安装的输入法。 ...

    中文 Big5/GBK/Unicode/UTF8 内码转换器

    本文将详细讲解标题所提及的“中文 Big5/GBK/Unicode/UTF8 内码转换器”这一工具,以及相关编码标准的基本知识。 首先,我们要理解什么是字符编码。字符编码是一种规定,它将不同的字符(如汉字、字母、数字等)...

    内码转换小软件

    内码转换是一个在信息技术领域中常见的问题,尤其是在处理不同编码标准的文本文件时。编码,或者说内码,是指计算机内部存储、处理和传输文本时所使用的特定二进制表示方式。不同的编码方式决定了字符集中的字符如何...

    查汉字内码的VB源码

    1. **字符编码**:汉字内码通常指的是GBK或Unicode编码,GBK是GB2312的扩展,支持更多的汉字;Unicode是国际通用的字符集,能表示世界上大部分文字。VB中,字符串变量默认使用Unicode编码,所以查询汉字内码时可能...

Global site tag (gtag.js) - Google Analytics