`
bageer707
  • 浏览: 50667 次
  • 来自: ...
社区版块
存档分类
最新评论

java编码问题

阅读更多
将中文转换为Unicode编码格式
提示:

  JDK提供了一个将中文转换为Unicode编码格式的工具native2ascii.exe,它位于<JDK>/bin/目录下。在DOS命令窗口下,通过native2ascii -encoding SJIS <源文件> <目标文件>即可以完成转换。
 
native2ascii-本地码-至-ASCII 码转换器
将含有本地编码字符(既非 Latin1 又非 Unicode 字符)的文件转换为 Unicode 编码字符的文件。 

结构
native2ascii [options] [inputfile [outputfile]]

说明
Java 编译器和其它 Java 工具只能处理含有 Latin-1 和/或 Unicode 编码(\udddd 记号)字符的文件。native2ascii 将含有其它字符编码的文件转换成含 Latin-1 和/或 Unicode 编码字符的文件。 

若省略 outputfile,则使用标准输出设备输出。此外,如果也省略 inputfile,则使用标准输入设备输入。 


选项
-reverse 
执行相反的操作:将含 Latin-1 和/或 Unicode 编码字符的文件转换成含本地编码字符的文件: 


-encoding encoding_name 
指定转换过程使用的编码名称。缺省的编码从系统属性 file.encoding 中得到。encoding_name 字符串必须是下表第一栏所示的字符串。


-------------------------------------------------------------

转换器        说明

-------------------------------------------------------------

8859_1           ISO 8859-1
8859_2           ISO 8859-2
8859_3           ISO 8859-3
8859_4           ISO 8859-4
8859_5           ISO 8859-5
8859_6           ISO 8859-6
8859_7           ISO 8859-7
8859_8           ISO 8859-8
8859_9           ISO 8859-9
Big5             Big5 码,繁体中文
CNS11643         CNS 11643,繁体中文
Cp037            美国、加拿大(两种语言,法语)、荷兰、葡萄牙、巴西、澳大利亚
Cp1006           IBM AIX 巴基斯坦(乌尔都语)
Cp1025           IBM 多语种西里尔语:保加利亚、波斯尼亚
                               黑塞哥维那、马其顿 (FYR)
Cp1026           IBM Latin-5,土耳其
Cp1046           IBM Open Edition US EBCDIC
Cp1097           IBM 伊朗(波斯语)/波斯
Cp1098           IBM 伊朗(波斯语)/波斯 (PC)
Cp1112           IBM 拉脱维亚,立陶宛 
Cp1122           IBM 爱沙尼亚
Cp1123           IBM 乌克兰
Cp1124           IBM AIX 乌克兰
Cp1125           IBM 乌克兰 (PC)
Cp1250           Windows 东欧
Cp1251           Windows 斯拉夫语
Cp1252           Windows Latin-1
Cp1253           Windows 希腊
Cp1254           Windows 土耳其
Cp1255           Windows 希伯莱
Cp1256           Windows 阿拉伯
Cp1257           Windows 波罗的语
Cp1258           Windows 越南语
Cp1381           IBM OS/2, DOS 中华人民共和国 (PRC)
Cp1383           IBM AIX 中华人民共和国 (PRC)
Cp273            IBM 奥地利、德国
Cp277            IBM 丹麦、挪威
Cp278            IBM 芬兰、瑞典
Cp280            IBM 意大利
Cp284            IBM 加泰罗尼亚语/西班牙、拉丁美洲西班牙语
Cp285            IBM 英国、爱尔兰 
Cp297            IBM 法国
Cp33722          IBM-eucJP - 日语 (5050 的超集)
Cp420            IBM 阿拉伯
Cp424            IBM 希伯莱
Cp437            MS-DOS 美国、澳大利亚、新西兰、南非
Cp500            EBCDIC 500V1
Cp737            PC 希腊
Cp775            PC 波罗的语
Cp838            IBM 泰国扩展 SBCS
Cp850            MS-DOS Latin-1
Cp852            MS-DOS Latin-2
Cp855            IBM 斯拉夫语
Cp857            IBM 土耳其语
Cp860            MS-DOS 葡萄牙语
Cp861            MS-DOS 冰岛语
Cp862            PC 希伯莱
Cp863            MS-DOS 加拿大法语
Cp864            PC 阿拉伯语
Cp865            MS-DOS 日尔曼语
Cp866            MS-DOS 俄语
Cp868            MS-DOS 巴基斯坦语
Cp869            IBM 现代希腊语
Cp870            IBM 多语种 Latin-2
Cp871            IBM 冰岛语
Cp874            IBM 泰国语
Cp875            IBM 希腊语
Cp918            IBM 巴基斯坦(乌尔都语)
Cp921            IBM 拉脱维亚、立陶宛(AIX, DOS)
Cp922            IBM 爱沙尼亚 (AIX, DOS)
Cp930            与 4370 UDC 混合的日语,5026 的超集
Cp933            与 1880 UDC 混合的韩文,5029 的超集
Cp935            与 1880 UDC 混合的简体中文主机,5031 的超集 
Cp937            与 6204 UDC 混合的繁体中文,5033 的超集
Cp939            与 4370 UDC 混合的日语拉丁字母,5035 的超集
Cp942            日语 (OS/2),932 的超集 
Cp948            OS/2 中文(台湾),938 超集
Cp949            PC 韩文
Cp950            PC 中文(香港、台湾)
Cp964            AIX 中文(台湾)
Cp970            AIX 韩文
EUCJIS           JIS, EUC 编码、日语
GB2312           GB2312, EUC 编码、简体中文
GBK              GBK, 简体中文
ISO2022CN        ISO 2022 CN, 中文
ISO2022CN_CNS    ISO-2022-CN 形式的 CNS 11643,繁体中文 
ISO2022CN_GB     ISO-2022-CN 形式的 GB 2312,简体中文
ISO2022KR        ISO 2022 KR, 韩文
JIS              JIS, 日语
JIS0208          JIS 0208, 日语
KOI8_R           KOI8-R, 俄语
KSC5601          KS C 5601, 韩文
MS874            Windows 泰国语
MacArabic        Macintosh 阿拉伯语
MacCentralEurope Macintosh Latin-2
MacCroatian      Macintosh 克罗地亚语
MacCyrillic      Macintosh 斯拉夫语
MacDingbat       Macintosh Dingbat
MacGreek         Macintosh 希腊语
MacHebrew        Macintosh 希伯莱语
MacIceland       Macintosh 冰岛语
MacRoman         Macintosh 罗马语
MacRomania       Macintosh 罗马尼亚语
MacSymbol        Macintosh 符号
MacThai          Macintosh 泰国语
MacTurkish       Macintosh 土耳其语
MacUkraine       Macintosh 乌克兰语
SJIS             Shift-JIS, 日语
UTF8             UTF-8
分享到:
评论

相关推荐

    java乱码问题解决方法

    Java 乱码问题是 Java 开发中常见的问题之一,解决这个问题需要了解 Java 的编码方式、JSP 中文乱码问题、Tomcat 5.5 中文乱码问题、JDBC ODBC Bridge 的 Bug 及其解决方法、Solaris 下 Servlet 编程的中文问题及...

    Java乱码问题

    3. **对于已存在的Java文件**,如果之前保存时使用的是GBK编码格式,并且在编译时出现了乱码问题,可以通过转换文件的编码格式来解决。 - 将文件另存为ANSI格式。尽管这种方法看起来简单粗暴,但它实际上是一种有效...

    Java乱码问题解决

    在Java开发过程中,尤其是在处理中文字符时,经常遇到字符编码不一致导致的乱码问题。由于Java默认使用Unicode编码,而在中国大陆地区,常见的字符集为GB2312(GB18030)或GBK,在台湾地区则多使用Big5编码。这些...

    JAVA 乱码问题集合

    在Java编程中,乱码问题是一个常见的困扰,尤其是在处理字符编码时。以下是一些关键的知识点,可以帮助理解和解决Java中的乱码问题。 首先,我们需要理解字符编码的基本概念。字符编码是用来表示文本的一种方式,...

    JAVA编码问题.pdf

    Java编码问题一直是开发者在处理中文字符时经常遇到的挑战,尤其是在Web应用中。Java使用Unicode作为内部字符存储标准,处理字符时涉及两次编码转换:从源输入流按指定编码读取,转换为Unicode,再从Unicode编码转换...

    java乱码问题

    在探讨“Java乱码问题”这一主题时,我们首先需要理解字符编码的基本概念以及它在Java编程中的应用。字符编码是计算机系统用来表示文本的一种方式,它将字符映射为特定的二进制数,以便于存储和传输。常见的字符编码...

    Java乱码问题解决方法

    Java乱码问题解决方法,java乱码怎么解决,java项目乱码,java乱码处理,

    Java开发乱码问题解决方法汇总

    Java开发乱码问题解决方法汇总 Java开发中乱码问题是非常常见的问题之一,而解决这些问题需要具备一定的技术知识和经验。在本文中,我们将总结一些常见的Java开发乱码问题解决方法,希望能够为读者提供帮助。 1. ...

    字符集基础知识(描述解决java乱码问题的最详细的资料)

    在Java开发中,处理乱码问题的关键在于理解数据在不同阶段的编码转换。例如,源代码文件可能使用UTF-8编码,JSP页面可能使用GBK,而服务器可能默认使用ISO8859-1。如果不正确地设置这些编码,就会导致乱码。因此,...

    java中文乱码问题详解--- java中文乱码问题详解

    #### 三、Java编码转换的详细过程 Java程序从开发到运行的过程中,涉及到多个环节的编码转换,主要包括: 1. **源文件编码**:Java源文件(`.java`)在保存时通常采用操作系统默认的编码格式。例如,在中文Windows...

    Java乱码学习 Java乱码学习

    Java 乱码问题一直是开发过程中常见的困扰之一,它涉及到字符编码的理解、文件编码的设定以及网络传输中的编码处理。本文将深入探讨Java编程中的乱码现象,并提供一系列的解决策略。 首先,我们要理解两个基本概念...

    java乱码问题的解决

    当你编写代码时是不是也遇到了乱码问题 尤其是jquery post提交 来下载看看吧 你会有所收获 (个人总结 针对不同情况)

    java获取乱码问题

    ### Java获取乱码问题解析与解决方案 在Java应用开发过程中,字符编码问题一直是困扰开发者的一大难题,尤其是在处理HTTP请求中的中文或特殊字符时,经常会出现乱码现象。本文将详细介绍如何通过修改`server.xml`...

    java乱码终极必杀技

    Java编程语言在处理字符编码时可能会遇到乱码问题,这主要涉及到输入输出、网络传输、文件读写等场景。在Java中,理解字符编码的概念、常见编码格式以及如何正确设置和转换编码至关重要。本篇文章将深入探讨Java乱码...

    java中文乱码问题解决

    "Java中文乱码问题解决" ...解决Java中文乱码问题需要了解编码的基本原理和各种编码格式的区别,并了解Java中常见的编码格式和应用场景。只有这样,才能更好地避免乱码问题,提高Java开发的效率和质量。

    java中文乱码解决问题

    JAVA 中文乱码问题是开发过程中常见的问题之一,解决这个问题需要了解乱码产生的原因,然后对症下药。下面我们对容易产生乱码问题的场景进行分析,并提出解决方案。 1. 以 POST 方法提交的表单数据中有中文字符 在...

Global site tag (gtag.js) - Google Analytics