`

java UTF-8转换GB2312

    博客分类:
  • java
阅读更多
private String utf8Togb2312(String str){
      StringBuffer sb = new StringBuffer();
      for(int i=0; i<str.length(); i++) {
          char c = str.charAt(i);
          switch (c) {
             case '+':
                 sb.append(' ');
             break;
             case '%':
                 try {
                      sb.append((char)Integer.parseInt(
                      str.substring(i+1,i+3),16));
                 }
                 catch (NumberFormatException e) {
                     throw new IllegalArgumentException();
                }
                i += 2;
                break;
             default:
                sb.append(c);
                break;
           }
      }
      // Undo conversion to external encoding
      String result = sb.toString();
      String res=null;
      try{
          byte[] inputBytes = result.getBytes("8859_1");
          res= new String(inputBytes,"UTF-8");
      }
      catch(Exception e){}
      return res;
}
分享到:
评论

相关推荐

    JAVA文件编码格式转换:UTF-8转为GB2312

    能够集成到Source Insight中,解决JAVA文件乱码问题

    完美转换UTF-8 到 GB2312(源代码和详细说明)

    不幸的是,广收欢迎的代码查看工具Source insight 虽然支持汉字,但是它不支持UTF-8。笔者感到疑惑的是,当初开发source insight的这帮人现在哪里去了?为何不继续开发?这么好的工具,却不再更新了,实在让人可惜。...

    UTF-8与GB2312之间的互换类.rar_ UTF-8toGB2312_UTF-8 GB2312_gb2312_mmi_ch

    标题中的"UTF-8与GB2312之间的互换类.rar_ UTF-8toGB2312_UTF-8 GB2312_gb2312_mmi_ch"指的是一个能够帮助开发者在UTF-8和GB2312两种编码格式之间进行转换的程序类库。这个压缩包可能包含了源代码文件,使得用户可以...

    gb2312与utf-8转换

    在实际操作中,我们有时需要将GB2312编码的文件转换为UTF-8,或者反过来,以便在不同系统或应用间进行兼容。例如,如果你收到一个GB2312编码的文档,在一个默认使用UTF-8的环境中打开可能会出现乱码。这时,就需要...

    UTF-8和GB2312编码格式之间互转接口

    // 使用转换函数,如iconv,将UTF-8转换为GB2312 // ... // 创建新的Java字符串并返回 } ``` 3. 同理,从GB2312转回UTF-8,只需逆向操作即可。 在Android项目中,你需要将C/C++代码编译为.so动态链接库,并在...

    UTF-8.rar_utf_utf gb2312_utf 转换_utf-8_utf-8解码

    本文将深入探讨UTF-8和GB2312这两种字符编码,并解释它们之间的转换过程以及相关的解码技术。 首先,UTF-8是一种广泛使用的Unicode字符编码方式。它能够表示Unicode字符集中所有的字符,包括汉字、拉丁字母、希腊...

    字符转码,gb2312 usc2 ,utf-8

    例如,将GB2312编码的文本转换为UTF-8,可以使用以下代码: ```python import codecs with codecs.open('source_file.gb2312', 'r', 'gb2312') as f: content = f.read() with codecs.open('target_file.utf-8',...

    java 编码 UTF-8、ISO-8859-1、GBK

    在Java中,UTF-8 支持国际化,是处理多种语言的理想选择,因为它具有良好的向后兼容性,并且通常不需要额外的转换。 ISO-8859-1,又称为Latin-1,是一种单字节编码,只包含西欧语言的基本拉丁字母。在处理英文为主...

    UTF-8GB2312互转

    在提供的"UTF-8GB2312互转.exe"文件中,很可能是实现了一个简单的命令行工具,用于快速将UTF-8编码的文件转换为GB2312,或者反之。使用这样的工具,用户可以在本地环境下方便地解决文件编码不匹配导致的乱码问题。但...

    utf8转GB2312

    所以,从UTF-8转换到GB2312,需要将每个UTF-8编码的字符转换成对应的GB2312编码。 在.NET程序中进行编码转换,可以利用内置的System.Text.Encoding类。例如,可以使用以下代码片段将UTF-8编码的字符串转换为GB2312...

    utf-8 ansi 字符互转 工具

    例如“utf-8 ansi 字符互转 工具”就是这样一个软件,它能方便地帮助用户将文件或文本内容在UTF-8和ANSI编码之间进行转换。使用这类工具,用户通常只需选择输入文件、指定输出格式,然后点击转换按钮即可完成操作。 ...

    GB13000 UCS-2格式转UTF-8

    身份证读卡器生成的基本信息TEXT文件,由于是采用 GB 13000 的 UCS-2 编码格式,java读取出来是乱码,这个段代码就是解决转码问题的,亲测可用

    java utf8 to gb2312

    本文介绍了 Java 中 UTF-8 转 GB2312 的编码转换原理及实现方法。通过对给定代码片段的分析,指出了存在的问题,并给出了正确的实现方案。在实际开发过程中,了解并掌握字符编码的转换对于避免乱码等问题至关重要。

    eclipse中class乱码GBK-UTF-8转换工具

    这篇博客文章“eclipse中class乱码GBK-UTF-8转换工具”正是为了解决这个问题。 GBK是GB2312的扩展,包含了更多的汉字和其他字符,主要在中国大陆使用。UTF-8则是一种广泛使用的Unicode编码,支持世界上几乎所有的...

    Java 程序转码(UTF-8)

    常见的字符编码有ASCII、GB2312、GBK、UTF-8等。其中,UTF-8是一种变长字符编码,用于Unicode编码标准,兼容ASCII,并且能够高效地存储大多数非英文字符。 ##### 2. UTF-8编码特点 - **兼容性**:UTF-8编码与ASCII...

    GB2312-UTF-8编码批量转换

    本文将深入探讨"GBK-GB2312-UTF-8编码批量转换"的相关知识点。 首先,我们要理解GB2312、GBK以及UTF-8这三种编码标准。 GB2312(国标汉字编码)是中国大陆最早制定的简体中文字符集,它包含了6763个常用汉字和一些...

    将字符串从常用编码转为utf-8编码(java)

    Java字符串编码查询及转换,可将常用的一些编码格式转换成utf-8

    自动检测汉字GB18030编码与UTF-8编码

    想到如下特征来识别汉字: 1. 如果第1位是0就不需要判断的,一定是ASCII字符。... 如果第1位是1开头的,第2位是0开头的,一定是GB编码。 3. 如果第1位是非1110开头的,则一定是GB编码。 4. 多做几个汉字判断。

    简单的UTF-8与GBK之间相互转码工具

    这个名为`encoding_p.java`的Java源代码文件,应该包含了一个简单的类或函数,用于实现文件从GBK到UTF-8,以及从UTF-8到GBK的转换。在Java中,我们可以使用`java.nio.charset`包中的`Charset`和`CharsetDecoder`、`...

    Eclipse项目的GBK编码转为UTF-8插件

    Eclipse是一款广泛使用的Java开发集成环境,而GBK和UTF-8是两种常见的字符编码格式。在处理源代码时,编码的选择至关重要,因为它直接影响到字符的正确显示和处理。GBK编码是中国大陆广泛使用的汉字编码标准,它包含...

Global site tag (gtag.js) - Google Analytics