`
冲杯茶喝
  • 浏览: 30590 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

UTF8编码

 
阅读更多
UTF-8是Unicode的实现方式之一。
UTF-8的编码规则很简单,只有二条:
1)对于单字节的符号,字节的第一位设为0,后面7位为这个符号的unicode码。因此对于英语字母,UTF-8编码和ASCII码是相同的。
2)对于n字节的符号(n>1),第一个字节的前n位都设为1,第n+1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的unicode码。
UTF-8编码方式                                                     | 对应的十进制Unicode编码值
0xxxxxxx  |          0 - 127
110xxxxx 10xxxxxx  |      128 - 2047
1110xxxx 10xxxxxx 10xxxxxx  |    2048 - 65535
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx  |  65536 - 1114111

注意:x表示可编码位


分享到:
评论

相关推荐

    Discuz! X 官方 GBK/UTF8编码转换工具

    X 官方 GBK/UTF8编码转换工具详解》 Discuz! X 是一款广泛应用的开源社区论坛软件,它为用户提供了一个高效、功能丰富的互动平台。在使用过程中,由于历史原因或者不同环境的需求,我们可能会遇到论坛数据编码格式...

    EncodeDecode & ANSI-UTF8编码转换工具

    "EncodeDecode & ANSI-UTF8编码转换工具"是一款专门用于解决这个问题的软件,它能够帮助用户将文本数据从ANSI编码转换为UTF-8编码,反之亦然。这两种编码方式在不同的上下文中有各自的适用性,理解它们的差异和用途...

    UTF8编码表汉字对照

    电脑UTF8编码表 完不完整不知道 也是找的 嗯 就是这样

    Ansi Unicode UTF8编码转换及代码示例

    ### ANSI、Unicode与UTF-8编码转换及相关代码示例 #### 一、基本概念解析 在探讨ANSI、Unicode以及UTF-8之间的转换之前,我们首先需要了解这三种编码的基本概念及其应用场景。 - **ANSI编码**:ANSI(American ...

    ASCII,UTF8编码汉字获取首字母

    utf8编码汉字获取首字母,去掉ConvertGBKToUtf8(ch);函数和引用库,ASCII编码汉字也可获取拼音首字母,第一个cpp是所有汉字可以获取首字母,第二个cpp仅针对常用汉字可用的c++获取汉字首字母

    souce insight支持utf8编码

    而"Souce Insight支持UTF8编码"这一特性,意味着该软件已经具备了处理多语言字符集的能力,这对于全球化开发和包含非ASCII字符(如中文、日文、韩文等)的项目来说,显得尤为重要。 UTF8编码是一种常见的Unicode...

    Xcode控制台把UTF8编码显示成中文

    然而,当这些信息中包含中文字符时,Xcode的控制台默认可能会按照UTF8编码显示,而不是直接以中文形式展示,这给调试带来了不便。标题"Xcode控制台把UTF8编码显示成中文"正是针对这一问题提供了解决方案。 首先,...

    utf8.rar_C UTF8_utf8是二进制吗_utf8编码_utf8转2进制_utf8转二进制

    UTF8编码是Unicode的一种实现方式,它是一种广泛用于文本数据编码的标准。在计算机科学中,字符通常被编码成数字,而这些数字可以是二进制形式。UTF8就是一种将字符编码为二进制的形式,使得不同的语言和字符集能够...

    目前最好用的GB2312和UTF8编码互转工具

    GB2312和UTF8是两种常见的字符编码标准,它们各有特点,并且在不同的场景下有着各自的适用性。 GB2312,全称为“汉字机内码扩展规范”,是中国大陆早期广泛使用的汉字编码标准,主要针对简体中文。它定义了6763个...

    gb2utf8编码转换

    "gb2utf8编码转换"是一个专门用于解决这个问题的工具。这个工具帮助用户将GBK(GB2312)编码的文本文件转换成UTF-8编码,使得文件能够在全球范围内更广泛地兼容各种操作系统和编程环境。 GBK编码是中国大陆广泛使用...

    批量文件GBK-UTF8编码转换器

    批量文件GBK-UTF8编码转换器

    对UTF8编码的初步认识.rar_UTF8_utf

    UTF8编码是现代计算机系统中广泛使用的字符编码标准,它是一种可变长度的Unicode编码方式。这个压缩包“对UTF8编码的初步认识.rar_UTF8_utf”包含两个文件:“对UTF8编码的初步认识.htm”和“www.pudn.com.txt”,...

    判断是否是utf8编码的c程序

    本代码可以直接嵌入到c代码中直接编译,并判断当前的字符是否是utf8编译,避免研究utf8字符的规范自己编写,该函数是本人遇到有些字符是非utf8编码时写入数据库失败而编写的,经几个月的运行未发现判断失误导致的...

    文本与UTF8编码互转.zip

    在这个“文本与UTF8编码互转.zip”压缩包中,包含了一个LabVIEW程序(文本与UTF8编码互转.vi),其主要目的是帮助用户在LabVIEW环境中实现文本字符串与UTF-8编码之间的转换。 1. **UTF-8编码**: UTF-8是一种变长的...

    unicode和utf8编码相互转换C代码

    内容为utf8编码和unicode编码相互转换的C代码,关于utf8和unicode的用途另一篇博客有介绍,请参考。 压缩包 : ntf_code.rar 列表 ntf_code\uni_utf8.h ntf_code\utf8_u.c ntf_code\utf82u.c ntf_code\u2utf8.c ntf_...

    C++转UTF8编码.txt

    本文将深入探讨如何使用C++将普通字符串转换为UTF8编码格式,这一过程涉及到的知识点包括但不限于:C++语言特性、字符串操作、编码转换原理以及相关的标准库函数应用。 ### C++中的字符串与编码 在C++中,字符串...

    Python-convert2utf将目录下的全部源文件转成UTF8编码

    标题"Python-convert2utf将目录下的全部源文件转成UTF8编码"指的是使用Python编写的一个脚本或工具,该工具能够遍历指定目录,检测并转换其中的GB、GBK以及其他非UTF-8编码的文本文件和源代码文件,统一转换为UTF-8...

    UNICODE&GBK&UTF8编码查看工具

    `UNICODE`、`GBK`和`UTF8`是三种常见的字符编码标准,每种都有其特定的应用场景和特点。接下来,我们将深入探讨这些编码格式,以及如何利用C#语言开发一个用于查看这些编码的工具。 首先,`UNICODE`,全称为Unicode...

    GBK与UTF8编码批量转码工具

    在压缩包内的文件中,"GBK与UTF编码批量转码工具.exe"是执行转码操作的主程序,用户双击运行即可启动工具。"使用说明.txt"可能包含了详细的操作指南,包括如何使用软件、注意事项等信息,用户应当仔细阅读以确保正确...

    gbk_utf8编码转化工具

    本文将详细讨论“GBK_to_UTF8”编码转换工具的相关知识点,包括编码的基本概念、GBK与UTF-8的区别以及转换工具的使用方法。 首先,让我们了解编码的基础知识。计算机只认识二进制,而人类则使用字符进行交流,因此...

Global site tag (gtag.js) - Google Analytics