/**
* 将文件名中的汉字转为UTF8编码的串,以便下载时能正确显示另存的文件名.
* @param s 原文件名
* @return 重新编码后的文件名
*/
public static String toUtf8String(String s) {
StringBuffer sb = new StringBuffer();
for (int i=0;i<s.length();i++) {
char c = s.charAt(i);
if (c >= 0 && c <= 255) {
sb.append(c);
} else {
byte[] b;
try {
b = Character.toString(c).getBytes("utf-8");
} catch (Exception ex) {
System.out.println(ex);
b = new byte[0];
}
for (int j = 0; j < b.length; j++) {
int k = b[j];
if (k < 0) k += 256;
sb.append("%" + Integer.toHexString(k).
toUpperCase());
}
}
}
return sb.toString();
}
分享到:
相关推荐
可以使用 convmv 工具来实现文件名编码转换,例如,将一个 UTF-8 编码的文件名转换成 GBK 编码可以使用 `convmv -f UTF-8 -t GBK --notest filename` 命令。 Vim 的编码方式设置可以通过四个选项来实现,分别是 ...
"BatUTF8Conv.exe"工具就是专门为了帮助用户批量将批处理脚本文件转换为UTF-8编码格式而设计的。 批量转换工具"BatUTF8Conv.exe"的使用非常方便,尤其对于那些需要处理大量批处理脚本的系统管理员或开发者来说,它...
"批量文件名编码转换.7z" 提供了一种解决方案,帮助用户将那些使用不同编码格式的文件名,尤其是包含中文汉字的文件名进行批量转换。这个压缩包中的主要工具是 "批量URL转码文件命名.exe",它专门针对URL编码问题,...
"UTF-8 编码转换详解" 1. UTF-8 编码的重要性:在 WEB 开发中,UTF-8 编码扮演着非常重要的角色,特别是在传递中文时,必须经过编码的动作,否则可能会出现乱码的情况。 2. 使用 URLEncoder.encode() 方法:在 ...
这段代码首先将中文文件名转换为指定编码的字节数组,然后创建一个`Path`对象。最后,使用`Files.createFile()`创建文件。同样的逻辑也适用于读取和删除文件。 此外,当从文件系统读取文件名时,也需要进行类似的...
在VB6.0编程环境中,有时我们需要处理不同字符编码之间的转换,例如将UTF-8编码的字符串转换为GB2312编码。UTF-8是一种广泛使用的Unicode编码,而GB2312是中国大陆常用的简体中文字符集,主要用于早期的计算机系统。...
本文将深入探讨如何使用Java工具将GBK编码的文件夹批量转换为UTF-8编码,同时支持文件名的转换。 首先,GBK是中国大陆广泛使用的汉字编码标准,它兼容GB2312,能够表示大部分中文字符。然而,GBK不支持Unicode,这...
本文主要探讨如何使用TXT实现批量将ANSI编码转换为UTF-8编码,这对于我们处理多语言文档或者确保文件在不同环境下正常显示至关重要。 首先,我们要理解ANSI和UTF-8这两种编码的区别。ANSI编码(也称为Windows默认...
2. 文件名转换:如果文件名不是UTF8编码,脚本可能会将其转换为UTF8,以避免因字符编码问题导致的错误。 3. 数据导入:脚本读取UTF8编码的文本文件内容,并将其转换为Excel可以理解的数据格式。 4. 创建新的Excel...
1. 将UTF-8字符串转换为Unicode字符串:你可以使用`UTF8ToString()`函数将UTF-8编码的字节数组转换为`AnsiString`,然后通过`AnsiToString()`将其转换为`WideString`。 ```delphi var UTF8Bytes: TBytes; Unicode...
// 设置文件名编码为UTF-8 stream.UseUnicodeAsNecessary = true; // 遍历源目录中的所有文件 foreach (var file in Directory.GetFiles(sourceDir)) { var entryName = Path.GetFileName(file); // 获取...
2. "xml读取异常Invalid byte 1 of 1-byte UTF-8 sequence-中文版的window下java的默认的编码为GBK.url":这个文件名暗示了解决XML文件读取异常的方法,尤其是在Windows环境下,Java默认的文件编码可能是GBK,这可能...
这个脚本会遍历指定的文件夹,找到所有`.txt`文件,并将其GBK编码转换为UTF-8,同时保留原始文件并添加`_utf8`作为文件名后缀。 在实际应用中,可能还会遇到编码错误或乱码问题,例如遇到无法识别的字符。此时,...
在使用SAS EG(Enterprise Guide)导入编码为UTF-8的文本数据文件时,用户可能会遇到中文乱码问题。UTF-8编码的文本文件在处理中文字符时,如果没有正确设置编码,可能会导致中文字符显示不正确,即出现乱码现象。...
下面是一个简单的Python脚本示例,用于将GBK编码的文件转换为UTF-8: ```python import codecs def convert_file_encoding(input_path, output_path): with codecs.open(input_path, 'r', 'gbk') as f_in, \ ...
在给定的“易语言源码易语言TXT快速转换UTF-8源码.rar”压缩包中,包含的源码是用来实现TXT文本文件从其他编码格式快速转换到UTF-8编码格式的功能。 首先,我们要理解TXT文本文件编码的重要性。文本文件的编码决定...
这个"易语言TXT快速转换UTF-8源码"项目,为学习易语言的初学者提供了一个很好的实践机会,让他们能够深入理解文件操作和编码转换的概念,同时也可作为日常工作中处理编码问题的一个实用工具。通过分析和运行这个源码...
标签进一步明确了该工具的主要特性,包括“gbk转换utf-8工具”、“gbk转换utf-8”、“gbk转换”和“编码格式转换工具”、“编码格式转换”。这些标签强调了工具的核心功能,即在GBK与UTF-8编码之间进行转换,这对于...
在本场景中,我们面对的问题是“MFC UTF-8文件批量转成GB2312 解决中文乱码问题”,这涉及到文件的读取、编码转换以及文件的写入操作。 首先,我们需要理解UTF-8和GB2312这两种编码的区别。UTF-8是一种变长的...
在IT领域,字符编码是一个非常重要的概念,尤其是在处理文本数据时..."GB2312转utf-8编码批量转换软件"是实现这一目标的实用工具,它简化了转换过程,提高了工作效率,对于处理大量中文文本的IT专业人士来说非常有用。