一些有意思的解决方法,从网上抓到,转载过来
用new String(str.getBytes("UTF-8"),"GBK"),不能把utf-8转为gbk
方法一
URLDecoder.decode(URLEncoder.encode(str,"gbk"),"gbk"),
其中str为utf-8 String,结果被转为GBK,呵呵,很有趣。
方法二
GBK 汉字转 UTF-8 汉字 来源:CSDN 发布会员:新书城收集整理 发布时间:2006-8-8 人气:93 |
|
近日做一程序,需要将不同内码的文字转换成为某一种统一编码的文字(例如将 GBK 编码的汉字转换为 UTF-8 编码的汉字)。网上关于不同内码文字处理的文章,大都是关于解决汉字乱码问题的。而我需要做的,类似于 UltraEdit 中的 convertion 中的功能。
开始时,尝试了诸如 new String(str.getBytes("GBK"), "UTF-8"); 之类的方法。对于内码转换来说,这些方法都不是正确的。这些方法,对于解决汉字显示乱码是实用的,但是并不能正确地将 GBK 汉字映射到具有相同意义的 UTF-8 汉字上去。
我们都知道,在 JVM 内部,所有的字符串都是转换成为 Unicode 编码来处理的。我们从一个 GBK 编码的文本中读取的内容,写到另外一个 UTF-8 编码的文本文件中去,并不会出现乱码的问题。似乎可以猜测到,我们可以利用 Java IO 中的 Stream 来良好的处理内码转换的问题。为了方便起见,可以借助 Apache Commons-IO 项目中提供的实用工具来编写代码。 /* gbkString 为一 GBK 编码的字符串 */ String utf8String = IOUtils.toString(IOUtils.toInputStream(gbkString, "UTF-8")); utf8String中字符,皆变为 UTF-8 编码。
附,com.apache.commons.io.IOUtils 中相关代码如下: /** * Convert the specified string to an input stream, encoded as bytes * using the specified character encoding. * <p> * Character encoding names can be found at * <a href="http://www.iana.org/assignments/character-sets">IANA</a>. * * @param input the string to convert * @param encoding the encoding to use, null means platform default * @throws IOException if the encoding is invalid * @return an input stream * @since Commons IO 1.1 */ public static InputStream toInputStream(String input, String encoding) throws IOException { byte[] bytes = encoding != null ? input.getBytes(encoding) : input.getBytes(); return new ByteArrayInputStream(bytes); }
|
GB/BIG5/UTF-8 文件编码批量转换程序September 12th, 2006
昨天我需要将一个 GB 编码的 WEB 应用改变成 UTF-8 编码,整个 WEB 程序涉及 300 多个 ASP 和 HTML 文件….于是乎,我上网搜索能将 GB 文件批量转换成 UTF-8 编码的软件。找来找去,多是一些仅能在网页中实时编码的 VBS、JS 或 PHP 脚本,而没有进行大量文件编码转换的工具。
因为时间紧迫,后来只好使用最原始的办法,用 Windows 的记事本打开一个个 ASP 文件,使用“另存为…”的方式变成 UTF-8 编码。真是郁闷得要S….最后急S我了,只好再去找软件,拼了!!!
终于发现了这款很棒的GB/BIG5/UTF-8 文件编码批量转换程序,用下来感觉确实挺不错,推荐一下!
软件很小,才25KB,希望对于网站开发或者其他网页编辑人员有帮助。
下载地址:http://beebee.com.cn/jinnylife/wp-content/rar/gb2utf8.rar
解压缩密码:http://beebee.com.cn/jinnylife/
更新一个下载地址:
http://www.pc-soft.cn/download/gb2utf8.rar
分享到:
相关推荐
GBK、UTF-8批量文件3秒快速转码工具(支持GBK,UTF-8免费转换),UTF-8/GBK编码在线转换工具,压缩包可以有多目录与文件,如目录中有图片不会转码,但是会随转码好的文件一起打包下载。 使用帮助 . 上传压缩包(仅支持zip...
UTF-8编码和GBK编码互转,一个头文件搞定!跨平台不使用第三方库。只需要添加一些C语言标准的头文件即可实现俩种编码互相转换。摆脱第三方库移植问题。原理是将UTF-8编码的汉字、字母、符号、数字等转换成unicode...
例如“utf-8 ansi 字符互转 工具”就是这样一个软件,它能方便地帮助用户将文件或文本内容在UTF-8和ANSI编码之间进行转换。使用这类工具,用户通常只需选择输入文件、指定输出格式,然后点击转换按钮即可完成操作。 ...
在标题和描述中提到的“批量转 GBK 转 UTF-8”、“gb2312 转 UTF-8”以及“Iso-8859-1 转 UTF-8”是指将使用这些编码格式的文件转换成UTF-8编码。这是因为UTF-8具有广泛的兼容性和通用性,许多系统和软件默认使用UTF...
在UTF-8转GBK或GBK转UTF-8的情况下,你需要指定输入和输出的编码名。例如: ```c iconv_t cd = iconv_open("GBK", "UTF-8"); ``` 这将创建一个从UTF-8到GBK的转换描述符。如果需要反向转换,只需交换两个编码名...
在C语言中实现UTF8和GBK的互转,需要理解这两种编码的结构和转换规则。UTF8的转换涉及识别字节序列,根据前导字节判断字符的长度,然后将其转换为GBK编码。GBK的转换则相反,需要将GBK编码的字节流解析成对应的UTF8...
综上所述,"UTF-8转ANSI文本文件转换器"涉及到了字符编码的基础知识、编码转换的原理以及批量处理和代码设计的实践。理解和掌握这些知识点,对于处理文本文件编码问题、开发相关工具或理解软件内部工作流程都...
"帮助文档.doc"可能是关于如何进行GBK和UTF-8编码转换的指导文档,其中可能包含了详细的步骤、注意事项和常见问题解答。在实际操作中,用户需要了解源文件的原始编码,选择正确的转换方式,并注意转换后的文件是否能...
"UTF-8互转GBK"这个主题涉及到字符编码标准的转换,这对于确保文本在不同环境下的正确显示至关重要。UTF-8和GBK都是广泛使用的字符编码方案,但它们之间存在一些差异。 UTF-8是一种变长的Unicode编码方式,它使用1...
在处理UTF-8和GB2312之间的转码问题时,我们需要确保正确地转换每个字符的编码,以避免乱码情况的发生。转码过程通常包括两个步骤:解码和编码。首先,我们需要将UTF-8编码的字符串解码为Unicode,然后将Unicode转换...
*文件编码转换,gbk与utf-8互转 * changeFileCode 方法,4个属性:(需要转换的文件目录,转换后的文件目录,当前文件编码格式,转换成需要的文件编码); * 需要转换的文件目录,转换后的文件目录--可以为同一路径...
GB2312和UTF-8是两种不同的字符编码标准,它们各自有其特点和适用范围。本资源提供了一个C语言实现的GB2312到UTF-8的转换函数,方便开发者在需要进行这种编码转换时使用。 GB2312是中国大陆早期广泛使用的简体中文...
Java工程编码格式由GBK转化成utf-8(编码格式互转) https://ymjin.blog.csdn.net/article/details/118769530
总的来说,GBK与UTF-8互转工具是处理多语言环境下的字符编码问题的有效手段,它们简化了编码转换的过程,避免了手动操作可能出现的错误,提高了工作效率。在处理中文数据时,理解并掌握这两种编码格式的特点和转换...
"CharsetConv"类提供了一个工具,帮助开发者在ANSI、Unicode(Little Endian和Big Endian)、UTF-8及UTF-8+BOM之间灵活转换,从而避免编码问题带来的困扰。通过深入学习和实践,开发者可以更好地应对各种编码挑战,...
GB2312编码与utf-8编码的字符串的转换,主要使用windows api函数MultiByteToWideChar和WideCharToMultiByte,代码简洁,经测试可用
本文将深入探讨C/C++中GBK/UTF-8以及ANSI/UTF-8字符集的转换,以及如何通过纯C代码实现这些转换,确保程序在Windows和Linux等不同操作系统上的一致性。 首先,我们需要理解字符集的基础知识。ASCII是最基础的字符集...
总之,GBK和UTF-8编码互转是一个常见的编程任务,尤其是在处理中文文本时。了解编码原理,掌握转换方法,以及合理处理转换过程中的问题,对于任何IT专业人员来说都是非常重要的技能。本压缩包提供的资源可以帮助...
GBK和UTF-8是两种广泛使用的字符编码标准,它们各自有其特点和适用场景。本文将深入探讨GBK和UTF-8编码的区别,以及如何在两者之间进行转换。 GBK编码是中国大陆广泛采用的一种多字节字符集,它是GB2312的扩展,...
在IT领域,字符编码是处理文本数据的基础,GBK、Unicode和UTF-8是三种常见的字符编码...无论是GBK、Unicode还是UTF-8,它们都有各自的优势和适用范围,熟悉它们的特性并能够灵活运用,可以有效避免编码问题带来的困扰。