代码:
private static String convertToChinese(String dataStr) {
System.out.println("--------data str---->" + dataStr);
if(dataStr == null || dataStr.length() == 0) {
return dataStr;
}
int start = 0;
int end = 0;
final StringBuffer buffer = new StringBuffer();
while (start > -1) {
int system = 10;// 进制
if (start == 0) {
int t = dataStr.indexOf("&#");
if (start != t)
start = t;
if(start > 0) {
buffer.append(dataStr.substring(0, start));
}
if(start == -1) {
return dataStr;
}
}
end = dataStr.indexOf(";", start + 2);
String charStr = "";
if (end != -1) {
charStr = dataStr.substring(start + 2, end);
// 判断进制
char s = charStr.charAt(0);
if (s == 'x' || s == 'X') {
system = 16;
charStr = charStr.substring(1);
}
// 转换
try {
char letter = (char) Integer.parseInt(charStr, system);
buffer.append(new Character(letter).toString());
} catch (NumberFormatException e) {
e.printStackTrace();
}
}
// 处理当前unicode字符到下一个unicode字符之间的非unicode字符
start = dataStr.indexOf("&#", end);
if (start - end > 1) {
buffer.append(dataStr.substring(end + 1, start));
}
// 处理最后面的非 unicode字符
if (start == -1) {
int length = dataStr.length();
if (end + 1 != length) {
buffer.append(dataStr.substring(end + 1, length));
}
}
}
return buffer.toString();
}
Sample input:
引用
Ahimsa Vegetarian Restaurant健康煮营养餐厅
Sample output:
引用
Ahimsa Vegetarian Restaurant健康煮营养餐厅
分享到:
相关推荐
编码转换是IT领域中一个...通过理解HTML编码、Unicode编码和URL编码的原理及其应用场景,用户可以更好地利用这款工具解决实际工作中的编码转换问题。同时,批量处理功能使得处理大量文件变得更加便捷,提高了工作效率。
在这个“汉字与unicode编码(十六进制)对照表”中,我们可以找到汉字与其对应的Unicode编码,这对于编程、文本处理以及国际化和本地化工作来说具有重要的参考价值。 Unicode编码系统包括多个平面,其中基本多文种...
汉字转Unicode编码工具是一款实用的软件,主要用于将汉字转换成其对应的Unicode编码。Unicode是一种国际标准,旨在统一全球各种字符的编码方式,包括了世界上几乎所有的文字系统,从拉丁字母到汉字,再到阿拉伯文和...
汉字Unicode转换器是一种工具,主要用于在汉字和Unicode编码之间进行转换。Unicode是一种国际标准,旨在为世界上所有语言提供一个统一的字符集,确保每个字符都有一个唯一的数字代码,便于计算机处理和显示各种语言...
当一个网页的字符集设定为UTF-8时,浏览器就能正确解析包含中文的Unicode编码,显示页面上的中文内容。如果不正确设置编码,可能会导致乱码现象,影响用户体验。开发者可以通过在HTML文档的头部添加`...
"中文转换成NCR编码"是解决跨平台或跨浏览器字符显示问题的一种常见方法,特别是在生成HTML文件时遇到中文乱码的问题。NCR(Numeric Character Reference)编码是一种在XML、HTML和SGML等标记语言中表示Unicode字符...
- **网页开发**:网页编码通常使用UTF-8,这是一种基于Unicode的编码格式,开发者在处理中文字符时会用到这种转换。 - **数据交换**:当两个系统使用不同编码时,转换工具能帮助进行数据的正确传输和解析。 - **字符...
在编码过程中,转换器会查找特定汉字在Unicode字符集中的位置,并将其对应的16进制数值转换成Unicode编码形式。例如,汉字“汉”在Unicode中的编码是U+6C49。解码时,转换器会接收到这个编码,然后找到相应的汉字并...
在IT领域,Unicode字符编码和汉字编码转换是一个重要的主题,特别是在处理多语言文本时。Unicode是一种全球统一的字符集,涵盖了世界上几乎所有的文字系统,包括汉字。而汉字编码则包括了GB2312、GBK、GB18030等,...
通过这个程序,用户可以将Unicode编码转换为可读的中文字符,反之亦然,帮助理解和操作这些编码。 "比克尔.url"是一个快捷方式文件,通常指向互联网上的某个资源。在这个例子中,它可能链接到了一个与Unicode编码、...
- 编码转换器:允许用户在不同的Unicode编码格式(如UTF-8、UTF-16等)之间转换文本文件。 - 字符映射表:列出所有Unicode字符及其对应码点。 - 文件解码器:将编码错误的文件解码成正确的Unicode格式。 - 字符...
在处理网页内容时,有时我们需要将HTML中的Unicode字符串转换为UTF-8编码。下面将详细阐述这个过程以及相关的知识点。 Unicode是一种国际标准,它为世界上几乎所有的字符提供了一个唯一的数字表示,称为码点。...
这时,Unicode编码转换器就能派上用场,它能将文件的编码转换成目标系统支持的格式,从而解决乱码问题。 BatchUnicode这个文件名可能是转换器提供的批处理功能,允许用户一次性处理多个文件。这种批量转换功能在...
Unicode编码是一种全球统一的字符编码标准,旨在为世界上所有语言的字符提供唯一的数字标识。它由Unicode联盟制定,包括了各种文字系统,如拉丁字母、汉字、日文、韩文、阿拉伯文等。通过Unicode编码,不同的计算机...
通过此类信息,开发人员可以在处理包含中文字符的数据时进行准确的编码转换。 - “aba1ff5e”显示 GBK 编码“aba1”对应于 Unicode 的“ff5e”。这个码点代表的是全角问号(?),用于中文排版中的标点符号。 ####...
综上所述,"网页编码转换工具GB2312转换UTF-8"是一个实用的工具,它简化了不同编码格式之间的转换过程,尤其在处理大量中文文本时,其批量转换功能显得尤为高效。无论是网页开发者、内容创作者还是数据管理人员,都...
在易语言中,进行HTML编码转换是一项常见的任务,尤其是在处理网页数据或者网络通信时,正确地进行编码转换至关重要。 HTML编码转换涉及到多个方面,包括URL解码、UTF-8到GB2312的转换、Ansi到Unicode以及Unicode到...
在IT领域,网页编码转换是一项重要的任务,尤其是在处理多语言网站或者从不同源获取数据时。"网页编码转换期"这个主题聚焦于批量处理文件的编码转换,特别是针对UTF-8和GB编码之间的转换。UTF-8是一种广泛使用的...
HTML编码转换是一个重要的主题,特别是在网页开发中,它涉及到如何将特定字符转化为可以在HTML文档中安全显示的形式。在本文中,我们将深入探讨HTML编码转换的基本概念、用途以及易语言实现HTML编码转换的源码。 ...
使用这个工具时,用户可以输入或复制需要转换的汉字,工具会自动将其转换成相应的Unicode转义序列。这对于编写Java源代码、XML文件、JSON数据等非常有帮助,因为这些格式通常要求字符串中的非ASCII字符以Unicode转义...