GB2312 码,中华人民共和国国家标准汉字信息交换用编码,是一个由中华人民共和国国家标准总局发布的关于简化汉字的编码,通行于中国大陆地区及新加坡,简称国标 码。两个字节中,第一个字节(高字节)的值为区号值加32(20H),第二个字节(低字节)的值为位号值加32(20H),用这两个值来表示一个汉字的编 码。UNICODE 码是微软提出的解决多国字符问题的多字节等长编码,它对英文字符采取前面加“0”字节的策略实现等长兼容。如 “A” 的 ASCII 码为0x41,UNICODE 就为0x00,0x41。利用特殊的工具各种编码之间可以互相转换.
编码转化的过程如下:
GB2312------------------>Unicode------------->Big5
import java.io.BufferedReader; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.io.OutputStreamWriter; import java.io.Reader; import java.io.UnsupportedEncodingException; import java.io.Writer; /** * */ /** * @author liheng * gb2big5.java * 2009-3-3 */ public class gb2big5 { static int iCharNum = 0; public static void main(String[] args) { String str1 = "d:\\share.po"; //需要转换的文件(GB2312) String str2 = "d:\\text.po"; //转换后的文件(BIG5) String inputString = readInput(str1); writeOutput(inputString,str2); } static String readInput(String str) { StringBuffer buffer = new StringBuffer(); try { FileInputStream fis = new FileInputStream(str); try { InputStreamReader isr = new InputStreamReader(fis,"GBK"); Reader in = new BufferedReader(isr); int ch; try { while((ch = in.read()) > -1) { iCharNum +=1; buffer.append((char)ch); } in.close(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } System.out.println("@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@"); return buffer.toString(); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e.printStackTrace(); } } catch (FileNotFoundException e) { // TODO Auto-generated catch block e.printStackTrace(); } return ""; } static void writeOutput(String str,String str2) { try { FileOutputStream fos = new FileOutputStream(str2); try { Writer out = new OutputStreamWriter(fos,"Big5"); try { out.write(str); out.close(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e.printStackTrace(); } } catch (FileNotFoundException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }
您还没有登录,请您登录后再发表评论
标题中的“一个将BIG5编码转换为GB2312编码的类”指的是这个压缩包包含了一个Java类,它的功能是实现字符编码的转换,即从BIG5编码转成GB2312编码。在早期的中文计算机系统中,由于地区差异和历史原因,台湾地区普遍...
标题中的"gb2big5_java.rar_GB-BIG5 java_java big5_简体 繁体"表明这是一个关于Java编程的资源,具体是处理字符编码转换的问题,特别是GB2312(简体中文)到BIG5(繁体中文)的转换。在描述中提到的“使用java算法...
在给定的场景中,我们关注的是从Big5编码转换到GB2312编码的过程。Big5和GB2312都是针对中文字符的编码标准,它们在不同的地区和语境中有各自的使用。 Big5编码,又称为大五码,主要用于繁体中文,特别是在台湾和...
《中文编码转换器详解:Big5、GBK、Unicode与UTF8的互换之道》 在计算机世界里,字符编码是沟通人类语言与机器之间的重要桥梁。本文将详细讲解标题所提及的“中文 Big5/GBK/Unicode/UTF8 内码转换器”这一工具,...
例如,Python可以使用`str.encode()`和`str.decode()`方法进行编码转换,而Java则可以利用`CharsetDecoder`和`CharsetEncoder`类进行操作。在处理大量数据时,优化查找算法和数据结构对于提高转换速度至关重要。 总...
标题 "GB/BIG5文件批量转UTF-8" 指的是一个工具或程序,它的主要功能是将编码格式为GB(GBK/GB2312)或BIG5的文件转换为UTF-8编码。在计算机领域,字符编码是表示文本的方式,不同的编码方式适用于不同的语言和地区...
在计算机科学中,最常用的编码系统包括ASCII、ISO 8859-1、Unicode(尤其是UTF-8)、GB2312、GBK、BIG5等。 1. ASCII编码:这是最早的字符编码标准,包含128个字符,主要用于英文。每个字符用7位二进制数表示。 2....
编码是计算机存储和显示文本的一种方式,不同的编码系统有着不同的规则,例如ASCII、GB2312、GBK、Big5以及我们这里提到的UTF-8等。这个名为"一个编码转换小工具"的程序,显然就是为了解决不同编码格式之间转换问题...
4. **编程语言中的编码处理**:在编程中,语言如Python、Java、C#等都有处理编码转换的库和函数。例如Python的`codecs`库,可以方便地进行编码转换操作。 5. **文件编码的识别**:在处理未知编码的文件时,需要先...
常见的字符编码有ASCII、GB2312、GBK、Big5(繁体中文)、Unicode以及UTF系列(如UTF-8、UTF-16、UTF-32)等。ASCII是最早的编码,只能表示英文字符,而Unicode则是一个包含全世界大部分字符的编码标准,UTF是...
接下来,文档讨论了多种常见的中文字符编码标准,如GB2312、GBK、BIG5和GB18030。GB2312是一个早期的中文编码标准,能够表示6763个汉字和682个其他符号。GBK是GB2312的扩展,提供了更多的字符支持,包括一些扩展的...
- **背景**:考虑到在软件开发过程中,不同的字符编码格式(如GB2312、UTF-16、BIG5等)可能会带来复杂的兼容性和处理难题,JVM的设计者们做出了明智的决策,即在JVM内部统一使用UTF-16作为字符的唯一编码格式。...
"ultracodingswitch UTF8 GB2312 .exe" 是一个专门用于转换文件编码的工具,它可以将文件从UTF-8编码转换为GBK或GB2312,反之亦然。这样的工具对于跨平台工作、处理多语言文本或者与旧版软件兼容时非常有用。 转换...
在Java编程语言中,字符编码转换是一个常见的任务,特别是在处理多国语言或者与不同系统交互时。这个PDF文件中的代码示例提供了一个名为`ChangeCharset`的类,它包含了多种常见的字符编码转换方法,如US-ASCII、ISO-...
对于中文字符,建议使用UTF-16编码,因为Java内部使用UTF-16编码表示字符,这样可以避免不必要的编码转换,减少程序中可能出现的乱码问题。了解这些编码方式及其与Java的关系,对于进行国际化软件开发和处理多语言...
编码转换工具是IT行业中不可或缺的一部分,它主要用于处理各种字符编码之间的转换问题。在计算机系统中,文本数据是以特定编码方式存储的,不同的编码标准适用于不同的语言和地区。常见的编码格式有ASCII、ISO-8859-...
常见的编码格式有ASCII、UTF-8、GBK、BIG5等,每种编码方式支持的字符范围和规则都不同。当不同编码的文件相互交互时,如果不进行正确的转换,就可能出现乱码现象。 `code.exe`是这个编码转换工具的可执行文件,...
相关推荐
标题中的“一个将BIG5编码转换为GB2312编码的类”指的是这个压缩包包含了一个Java类,它的功能是实现字符编码的转换,即从BIG5编码转成GB2312编码。在早期的中文计算机系统中,由于地区差异和历史原因,台湾地区普遍...
标题中的"gb2big5_java.rar_GB-BIG5 java_java big5_简体 繁体"表明这是一个关于Java编程的资源,具体是处理字符编码转换的问题,特别是GB2312(简体中文)到BIG5(繁体中文)的转换。在描述中提到的“使用java算法...
在给定的场景中,我们关注的是从Big5编码转换到GB2312编码的过程。Big5和GB2312都是针对中文字符的编码标准,它们在不同的地区和语境中有各自的使用。 Big5编码,又称为大五码,主要用于繁体中文,特别是在台湾和...
《中文编码转换器详解:Big5、GBK、Unicode与UTF8的互换之道》 在计算机世界里,字符编码是沟通人类语言与机器之间的重要桥梁。本文将详细讲解标题所提及的“中文 Big5/GBK/Unicode/UTF8 内码转换器”这一工具,...
例如,Python可以使用`str.encode()`和`str.decode()`方法进行编码转换,而Java则可以利用`CharsetDecoder`和`CharsetEncoder`类进行操作。在处理大量数据时,优化查找算法和数据结构对于提高转换速度至关重要。 总...
标题 "GB/BIG5文件批量转UTF-8" 指的是一个工具或程序,它的主要功能是将编码格式为GB(GBK/GB2312)或BIG5的文件转换为UTF-8编码。在计算机领域,字符编码是表示文本的方式,不同的编码方式适用于不同的语言和地区...
在计算机科学中,最常用的编码系统包括ASCII、ISO 8859-1、Unicode(尤其是UTF-8)、GB2312、GBK、BIG5等。 1. ASCII编码:这是最早的字符编码标准,包含128个字符,主要用于英文。每个字符用7位二进制数表示。 2....
编码是计算机存储和显示文本的一种方式,不同的编码系统有着不同的规则,例如ASCII、GB2312、GBK、Big5以及我们这里提到的UTF-8等。这个名为"一个编码转换小工具"的程序,显然就是为了解决不同编码格式之间转换问题...
4. **编程语言中的编码处理**:在编程中,语言如Python、Java、C#等都有处理编码转换的库和函数。例如Python的`codecs`库,可以方便地进行编码转换操作。 5. **文件编码的识别**:在处理未知编码的文件时,需要先...
常见的字符编码有ASCII、GB2312、GBK、Big5(繁体中文)、Unicode以及UTF系列(如UTF-8、UTF-16、UTF-32)等。ASCII是最早的编码,只能表示英文字符,而Unicode则是一个包含全世界大部分字符的编码标准,UTF是...
接下来,文档讨论了多种常见的中文字符编码标准,如GB2312、GBK、BIG5和GB18030。GB2312是一个早期的中文编码标准,能够表示6763个汉字和682个其他符号。GBK是GB2312的扩展,提供了更多的字符支持,包括一些扩展的...
- **背景**:考虑到在软件开发过程中,不同的字符编码格式(如GB2312、UTF-16、BIG5等)可能会带来复杂的兼容性和处理难题,JVM的设计者们做出了明智的决策,即在JVM内部统一使用UTF-16作为字符的唯一编码格式。...
"ultracodingswitch UTF8 GB2312 .exe" 是一个专门用于转换文件编码的工具,它可以将文件从UTF-8编码转换为GBK或GB2312,反之亦然。这样的工具对于跨平台工作、处理多语言文本或者与旧版软件兼容时非常有用。 转换...
在Java编程语言中,字符编码转换是一个常见的任务,特别是在处理多国语言或者与不同系统交互时。这个PDF文件中的代码示例提供了一个名为`ChangeCharset`的类,它包含了多种常见的字符编码转换方法,如US-ASCII、ISO-...
对于中文字符,建议使用UTF-16编码,因为Java内部使用UTF-16编码表示字符,这样可以避免不必要的编码转换,减少程序中可能出现的乱码问题。了解这些编码方式及其与Java的关系,对于进行国际化软件开发和处理多语言...
编码转换工具是IT行业中不可或缺的一部分,它主要用于处理各种字符编码之间的转换问题。在计算机系统中,文本数据是以特定编码方式存储的,不同的编码标准适用于不同的语言和地区。常见的编码格式有ASCII、ISO-8859-...
常见的编码格式有ASCII、UTF-8、GBK、BIG5等,每种编码方式支持的字符范围和规则都不同。当不同编码的文件相互交互时,如果不进行正确的转换,就可能出现乱码现象。 `code.exe`是这个编码转换工具的可执行文件,...