`
limingnihao
  • 浏览: 1824632 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

关于UTF-8

阅读更多

    Unicode编码中,19968-40869为汉字:

 

摘自一部分:

&#19968-19978一丁丂七丄丅丆万丈三
&#19978-19988上下丌不与丏丐丑丒专
&#19988-19998且丕世丗丘丙业丛东丝
&#19998-20008丞丟丠両丢丣两严並丧
&#20008-20018丨丩个丫丬中丮丯丰丱
&#20018-20028串丳临丵丶丷丸丹为主
&#20028-20038丼丽举丿乀乁乂乃乄久
&#20038-20048乆乇么义乊之乌乍乎乏
&#20048-20058乐乑乒乓乔乕乖乗乘乙

 

 

得到某汉字的编码:

String str = "黎明你好";
for(int j=0; j<str.length(); j++){
	char temp = str.charAt(j);
	System.out.print( "&#" + (int)temp);
}

输出结果:&#40654&#26126&#20320&#22909

把他保存成html,就可以显示汉字。

 

微软word转的mht文件,有的时候title不对,用工具打开直接改title,改完肯定是乱码。

用上面的代码找到他的Unicode编码,copy进去,OK了。

 

 

 

 

分享到:
评论

相关推荐

    pb12 gb转utf-8

    总之,“pb12 gb转utf-8”是一个关于使用PowerBuilder 12将GBK编码的数据转换为UTF-8编码的过程,这在处理多语言环境或者跨平台应用时尤其重要。理解和掌握这种转换技巧对于确保数据的正确性和兼容性是至关重要的。

    解决Invalid byte 1 of 1-byte UTF-8 sequence

    标题 "解决Invalid byte 1 of 1-byte UTF-8 sequence" 涉及的问题是关于字符编码不匹配引发的错误,通常在处理包含非ASCII字符的文本文件时出现。UTF-8是一种广泛使用的字符编码标准,能表示世界上大部分语言的字符...

    Web开发关于UTF-8的问题总结.docx

    在Web开发中,UTF-8编码是一个至关重要的概念,它是一种广泛使用的字符编码标准,能够支持全球大部分语言的字符表示。以下是对Web开发中遇到的UTF-8问题的详细总结: 1. HTML页面转UTF-8编码问题: - 在HTML文件的...

    Source Insight 3支持Utf-8

    对于处理各种编码格式的源代码文件,Source Insight 3表现出了良好的兼容性,其中包括UTF-8编码。 UTF-8是一种广泛使用的Unicode字符编码方案,它可以表示Unicode字符集中的所有字符,覆盖了全球大部分语言的文字。...

    SAS EG导入UTF-8编码的文本数据文件时的乱码问题解决方法

    在使用SAS EG(Enterprise Guide)导入编码为UTF-8的文本数据文件时,用户可能会遇到中文乱码问题。UTF-8编码的文本文件在处理中文字符时,如果没有正确设置编码,可能会导致中文字符显示不正确,即出现乱码现象。...

    utf-8-tool.rar_tool_utf-8

    标题中的“utf-8-tool.rar_tool_utf-8”暗示了这是一个与UTF-8编码相关的工具,主要用于处理文本编码问题。UTF-8是一种广泛使用的字符编码标准,能够表示Unicode字符集中的所有字符,从最基本的ASCII字符到各种语言...

    易语言判断UTF-8字符源码

    标题提到的“易语言判断UTF-8字符源码”就是关于如何在易语言中识别和处理UTF-8编码的字符串的知识点。 UTF-8是一种广泛使用的Unicode字符编码,它能够表示Unicode字符集中几乎所有的字符,包括汉字和其他多语言...

    winForm中进行Utf-8 及 GB2312转换

    Utf-8和GB2312是两种常见的字符编码格式,它们各自有着特定的应用场景和特点。Utf-8是一种广泛使用的多字节字符编码,支持Unicode字符集,能表示世界上几乎所有的文字。GB2312则是中国国家标准的简体中文编码,主要...

    GB/BIG5/UTF-8 文件编码批量转换程序

    "GB/BIG5/UTF-8 文件编码批量转换程序"就是解决这个问题的工具,它可以将GB2312(GBK)、BIG5编码的文件批量转换为UTF-8编码,确保在各种环境中正确显示文本。 3. **批量转换** 批量转换功能使得用户无需逐个文件...

    转码工具中文-utf-8

    "转码工具中文-utf-8"这个标题暗示了一个专门针对中文字符编码转换的应用或程序,它的主要功能是将中文文本从一种编码格式转换成UTF-8编码。UTF-8是一种广泛使用的Unicode编码方式,它能够表示所有Unicode字符,并且...

    豆葵GB-BIG5-UTF-8 文件编码批量转换工具

    本文将深入探讨"豆葵GB-BIG5-UTF-8 文件编码批量转换工具"的相关知识点。 首先,我们要了解编码的基础知识。字符编码是用来表示文本的数字表示方式,常见的有ASCII、GB2312、GBK、BIG5和UTF-8等。ASCII是最基础的7...

    HTML1114 (HTTP 标头)的代码页 gb2312 覆盖(META 标记)的冲突的代码页 utf-8

    2. **DOMINO配置修改**: 如果使用的是IBM Domino服务器,需要确保服务器文档中的Internet协议(Domino Web引擎字符集)设置为utf-8。具体操作是,在相关设置中选择“在HTML表单中使用UTF-8”,并重启服务器以使更改...

    C++使用WideCharToMultiByte函数生成UTF-8编码文件的方法

    在C++编程中,将Unicode字符串转换为UTF-8编码并保存到文件是常见的操作,尤其是在处理跨平台的文本数据时。WideCharToMultiByte函数是Windows API提供的一种方法,用于将Unicode字符串转换为特定的多字节字符集,...

    Web_开发中遇到的UTF-8以及乱码的问题总结.zip

    以下是关于UTF-8及乱码问题的深入探讨: 1. **UTF-8编码的基本理解**:UTF-8是一种变长编码,其中英文字符使用1个字节,大部分常用汉字使用3个字节,少数不常用字符使用4-6个字节。这种设计使得UTF-8在兼容ASCII...

    ueditor-1.4.3.3(utf-8 jsp)2.zip

    ueditor-1.4.3.3 jsp版本源码(UTF-8),关于springmvc集成ueditor,可以参考我的文章:https://blog.csdn.net/qq_34688048/article/details/94735176

    如何将文本转换为UTF-8码 .e.rar

    以上就是关于“如何将文本转换为UTF-8码”的详细步骤和方法,通过这些工具和技巧,你可以轻松地处理各种编码格式的文本文件,确保在不同环境下都能正常显示和处理文本内容。在日常工作中,了解和掌握这些知识能帮助...

    php汉字转拼音 降汉字转换为拼音,utf-8

    标题“php汉字转拼音 降汉字转换为拼音,utf-8”表明这是一个关于使用PHP实现汉字到拼音转换的方法,且该方法支持UTF-8编码。UTF-8是目前最广泛使用的字符编码,能够表示世界上大部分字符,包括汉字。 描述中的...

    EXCMS2011 utf-8版本

    EXCMS2011 utf-8版本是一款专为中文用户设计的内容管理系统,具有高度的稳定性和性能优化,尤其在处理千万级别的数据负载时表现出色。该系统采用UTF-8编码,确保了全球语言的兼容性,是搭建多语言网站的理想选择。在...

    最好的汉字转换拼音utf-8 php版 权威

    "utf-8"编码是Unicode的一种变体,能够表示世界上几乎所有的字符,包括汉字。在PHP中处理UTF-8编码的数据,需要确保所有涉及字符串操作的函数都支持多字节字符,比如使用mb_string扩展来处理,避免出现乱码问题。 ...

    php检测文件夹下有含BOM的UTF-8的文件

    标题提到的问题是关于如何使用PHP来检测一个文件夹中所有UTF-8格式的文件是否含有BOM。这是一个实用的技巧,特别是在确保代码文件正确运行或避免因BOM导致的解析问题时。下面我们将详细探讨这个问题。 首先,我们...

Global site tag (gtag.js) - Google Analytics