`

转载:《JDK自带的实用工具——native2ascii.exe 》

阅读更多
转自:http://blog.csdn.net/rayleigh_w/article/details/2407575

声明:本人转载只为分享,如涉及商业版权纠纷,请及时与本人联系,必将立即删除,造成不便,还望见谅,谢谢。

导读:


在做Java开发的时候,常常会出现一些乱码,或者无法正确识别或读取的文件,原因是编码方式的不一致。native2ascii是sun
java
sdk提供的一个工具。用来将别的文本类文件(比如*.txt,*.ini,*.properties,*.java等等)编码转为Unicode编码。

一.获取native2ascii
  安装了jdk后,假如你是在windows上安装,那么在jdk的安装目录下,会有一个bin目录,其中native2ascii.exe正是。


二.使用方法
命令行格式:




native2ascii.exe -[options] [inputfile [outputfile]]



其中:
  -[options]表示命令开关,有两个选项可供选择:
    -reverse:用Latin-1或Unicode编码把文件转换成本地编码格式
    -encoding encoding_name:要把文件转换的目标编码
  inputfile:表示输入文件全名。
  outputfile:输出文件名。如果缺少此参数,将输出到控制台。


具体介绍如下:
1.命令行交互方式
  在这种方式下通过手工输入字符实时在Console中实现交互转码。退出按Ctrl+c
  1)本地编码→Latin编码:
   直接敲入native2ascii.exe,程序光标会停在下一行,这时你可以直接敲入想要转换的字符,例如:




D:/jdk1.5.0_06/bin>native2ascii.exe
  我们
  /u6211/u4eec



  2)Latin-1编码→指定编码:
   直接敲入native2ascii.exe -reverse,程序光标会停在下一行,这时你可以直接敲入想要转换的字符,例如:




D:/jdk1.5.0_06/bin>native2ascii.exe -reverse
  /u6211/u4eec
  我们



2.文件转换方式
  在这种方式下通过指定inputfile和outputfile来实现转码。
  1)指定编码→Latin编码:
    例如:




D:/jdk1.5.0_06/bin>native2ascii.exe -encoding utf8 abc.txt bcd.txt



  2)Latin-1编码→指定编码:
    例如:




D:/jdk1.5.0_06/bin>native2ascii.exe -reverse utf8 abc.txt bcd.txt



常见编码列表:
8859_1           ISO 8859-1
8859_2           ISO 8859-2
8859_3           ISO 8859-3
8859_4           ISO 8859-4
8859_5           ISO 8859-5
8859_6           ISO 8859-6
8859_7           ISO 8859-7
8859_8           ISO 8859-8
8859_9           ISO 8859-9
Big5             Big5 码,繁体中文
CNS11643         CNS 11643,繁体中文
Cp037            美国、加拿大(两种语言,法语)、荷兰、葡萄牙、巴西、澳大利亚
Cp1006           IBM AIX 巴基斯坦(乌尔都语)
Cp1025           IBM 多语种西里尔语:保加利亚、波斯尼亚 、黑塞哥维那、马其顿 (FYR)
Cp1026           IBM Latin-5,土耳其
Cp1046           IBM Open Edition US EBCDIC
Cp1097           IBM 伊朗(波斯语)/波斯
Cp1098           IBM 伊朗(波斯语)/波斯 (PC)
Cp1112           IBM 拉脱维亚,立陶宛
Cp1122           IBM 爱沙尼亚
Cp1123           IBM 乌克兰
Cp1124           IBM AIX 乌克兰
Cp1125           IBM 乌克兰 (PC)
Cp1250           Windows 东欧
Cp1251           Windows 斯拉夫语
Cp1252           Windows Latin-1
Cp1253           Windows 希腊
Cp1254           Windows 土耳其
Cp1255           Windows 希伯莱
Cp1256           Windows 阿拉伯
Cp1257           Windows 波罗的语
Cp1258           Windows 越南语
Cp1381           IBM OS/2, DOS 中华人民共和国 (PRC)
Cp1383           IBM AIX 中华人民共和国 (PRC)
Cp273            IBM 奥地利、德国
Cp277            IBM 丹麦、挪威
Cp278            IBM 芬兰、瑞典
Cp280            IBM 意大利
Cp284            IBM 加泰罗尼亚语/西班牙、拉丁美洲西班牙语
Cp285            IBM 英国、爱尔兰
Cp297            IBM 法国
Cp33722          IBM-eucJP - 日语 (5050 的超集)
Cp420            IBM 阿拉伯
Cp424            IBM 希伯莱
Cp437            MS-DOS 美国、澳大利亚、新西兰、南非
Cp500            EBCDIC 500V1
Cp737            PC 希腊
Cp775            PC 波罗的语
Cp838            IBM 泰国扩展 SBCS
Cp850            MS-DOS Latin-1
Cp852            MS-DOS Latin-2
Cp855            IBM 斯拉夫语
Cp857            IBM 土耳其语
Cp860            MS-DOS 葡萄牙语
Cp861            MS-DOS 冰岛语
Cp862            PC 希伯莱
Cp863            MS-DOS 加拿大法语
Cp864            PC 阿拉伯语
Cp865            MS-DOS 日尔曼语
Cp866            MS-DOS 俄语
Cp868            MS-DOS 巴基斯坦语
Cp869            IBM 现代希腊语
Cp870            IBM 多语种 Latin-2
Cp871            IBM 冰岛语
Cp874            IBM 泰国语
Cp875            IBM 希腊语
Cp918            IBM 巴基斯坦(乌尔都语)
Cp921            IBM 拉脱维亚、立陶宛(AIX, DOS)
Cp922            IBM 爱沙尼亚 (AIX, DOS)
Cp930            与 4370 UDC 混合的日语,5026 的超集
Cp933            与 1880 UDC 混合的韩文,5029 的超集
Cp935            与 1880 UDC 混合的简体中文主机,5031 的超集
Cp937            与 6204 UDC 混合的繁体中文,5033 的超集
Cp939            与 4370 UDC 混合的日语拉丁字母,5035 的超集
Cp942            日语 (OS/2),932 的超集
Cp948            OS/2 中文(台湾),938 超集
Cp949            PC 韩文
Cp950            PC 中文(香港、台湾)
Cp964            AIX 中文(台湾)
Cp970            AIX 韩文
EUCJIS           JIS, EUC 编码、日语
GB2312           GB2312, EUC 编码、简体中文
GBK              GBK, 简体中文
ISO2022CN        ISO 2022 CN, 中文
ISO2022CN_CNS    ISO-2022-CN 形式的 CNS 11643,繁体中文
ISO2022CN_GB     ISO-2022-CN 形式的 GB 2312,简体中文
ISO2022KR        ISO 2022 KR, 韩文
JIS              JIS, 日语
JIS0208          JIS 0208, 日语
KOI8_R           KOI8-R, 俄语
KSC5601          KS C 5601, 韩文
MS874            Windows 泰国语
MacArabic        Macintosh 阿拉伯语
MacCentralEurope Macintosh Latin-2
MacCroatian      Macintosh 克罗地亚语
MacCyrillic      Macintosh 斯拉夫语
MacDingbat       Macintosh Dingbat
MacGreek         Macintosh 希腊语
MacHebrew        Macintosh 希伯莱语
MacIceland       Macintosh 冰岛语
MacRoman         Macintosh 罗马语
MacRomania       Macintosh 罗马尼亚语
MacSymbol        Macintosh 符号
MacThai          Macintosh 泰国语
MacTurkish       Macintosh 土耳其语
MacUkraine       Macintosh 乌克兰语
SJIS             Shift-JIS, 日语
UTF8             UTF-8
分享到:
评论

相关推荐

    JVM堆模型

    2. **JDK自带的native2ascii工具完全揭密.txt**:Native2ASCII工具用于在Java源代码中处理非ASCII字符。在处理包含本地化资源的项目时,如国际化字符串,会用到这个工具将原生编码转换为ASCII可表示的Unicode转义...

    eclipse下properties文件中文乱码的解决方案

    此时,可以考虑使用JDK自带的`native2ascii`工具进行编码转换,尽管这一方法较为繁琐,但在某些特定场景下不失为一种有效解决方案。 #### 解决方案三:使用PropertiesEditor插件 最理想的解决方法是借助于专门设计...

    晋城市-晋城市-街道行政区划_140500_Shp数据-wgs84坐标系.rar

    晋城市-晋城市-街道行政区划_140500_Shp数据-wgs84坐标系.rar

    【Linux系统管理】经典Linux面试题汇总:涵盖路径操作、文件管理、权限设置及磁盘配额查询等核心知识点

    内容概要:本文档汇总了46个经典的Linux面试题及其答案,涵盖了Linux系统操作的基本命令和概念。内容涉及路径表示与目录切换、进程管理、文件和目录操作、权限设置、文件内容查看等多个方面。每个问题都给出了明确的答案,旨在帮助面试者全面掌握Linux命令行操作技能,同时加深对Linux系统原理的理解。 适合人群:准备Linux相关职位面试的求职者,尤其是有一定Linux基础但缺乏实战经验的技术人员。 使用场景及目标:①用于个人自学或面试前复习,巩固Linux基础知识;②作为企业内部培训资料,帮助员工提升Linux操作水平;③为初学者提供系统化的学习指南,快速入门Linux命令行操作。 其他说明:文档内容侧重于实际操作命令的讲解,对于每个命令不仅提供了基本语法,还解释了具体应用场景,有助于读者更好地理解和记忆。建议读者在学习过程中多加练习,将理论知识转化为实际操作能力。

    唐山市-路南区--街道行政区划_130202_Shp-wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接下载使用。

    【C++编程竞赛】华中杯C++真题解析:涵盖函数参数传递、宏定义、数组操作等10个经典算法题型及源码实现

    内容概要:本文提供了10道华中杯C++竞赛真题的详细解析,涵盖多种基础编程技能与高级特性。每道题目不仅包含详细的解题思路和代码实现,还附带了完整的运行结果。具体包括:函数参数传递(指针实现)、宏定义比较、数组元素打印、几何图形面积计算、字符串拼接、素数判断、多态的实现、文件操作、简单计算器和学生信息管理。这些题目帮助读者深入理解C++语言的核心概念和技术应用。 适合人群:对C++有一定了解的编程初学者和中级开发者,尤其是准备参加编程竞赛的学生或程序员。 使用场景及目标:①作为编程练习和竞赛备考资料,帮助读者掌握C++的基本语法和常用算法;②通过实际代码示例加深对C++特性的理解,如指针、宏定义、面向对象编程等;③提供完整的源码供读者参考和调试,增强动手能力和问题解决能力。 阅读建议:建议读者按照题目难度逐步学习,先理解题目背景和解题思路,再仔细研读代码实现,并尝试独立编写和调试代码。同时,鼓励读者扩展思考,探索更多可能的解决方案,以提高编程水平。

    邯郸市-曲周县--街道行政区划_130435_Shp-wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接使用。

    沧州市-孟村回族自治县--街道行政区划_130930_Shp-wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接使用。

    通用计算器的设计FPGA.doc

    通用计算器的设计FPGA.doc

    晋城市-沁水县-街道行政区划_140521_Shp数据-wgs84坐标系.rar

    晋城市-沁水县-街道行政区划_140521_Shp数据-wgs84坐标系.rar

    赤峰市-松山区-街道行政区划_150404_Shp数据-wgs84坐标系.rar

    赤峰市-松山区-街道行政区划_150404_Shp数据-wgs84坐标系.rar

    JAVA中Stream编程常见的方法分类

    JAVA中Stream编程常见的方法分类

    呼和浩特市_和林格尔县_街道级--街道行政区划_150123_Shp_wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接使用。

    【K02】基于51单片机的秒表计时器设计(二).zip

    大同市-浑源县-街道行政区划_140225_Shp数据-wgs84坐标系.rar

    大同市-浑源县-街道行政区划_140225_Shp数据-wgs84坐标系.rar

    包头市-昆都仑区-街道行政区划_150203_Shp数据-wgs84坐标系.rar

    包头市-昆都仑区-街道行政区划_150203_Shp数据-wgs84坐标系.rar

    临汾市-翼城县-街道行政区划_141022_Shp数据-wgs84坐标系.rar

    街道级行政区划shp矢量数据,wgs84坐标系,下载直接使用

    张家口市-阳原县--街道行政区划_130727_Shp-wgs84坐标系.rar

    街道级行政区划shp数据,wgs84坐标系,直接下载使用。

    汽车电子车载网络拓扑开发概述:涵盖总线类型、设计原则及流程优化

    内容概要:本文详细介绍了车载电子电器架构中的网络拓扑开发,涵盖开发概述、车载网络总线、网络设计原则、开发流程及小结。网络拓扑开发是汽车电气架构中的重要环节,旨在设计合理的网络结构以确保各电子控制单元(ECU)之间的高效通信。文中阐述了通信协议选择、网络节点布局、通信介质选择、拓扑结构设计及安全性考虑等关键要素,并强调了仿真与验证的重要性。此外,还讨论了网络设计的原则,如前瞻性、兼容性、拓展性、实时性、可靠性和安全性,以及网络负载的优化措施。最后,总结了网络拓扑开发的流程,包括需求分析、设计、仿真验证、优化迭代及文档记录。 适合人群:汽车电子工程师、各域功能工程师、子系统及零部件开发者、测试工程师等从事汽车电气架构开发的相关人员。 使用场景及目标:①帮助工程师理解汽车网络拓扑开发的关键步骤和技术要点;②指导工程师在设计过程中遵循科学合理的设计原则,确保网络拓扑的高性能和可靠性;③提供网络负载优化的措施,确保数据传输的实时性和效率。 其他说明:网络拓扑开发不仅需要考虑技术层面的因素,还需兼顾成本效益,以适应不断变化的市场需求和技术趋势。本文建议读者在实践中不断积累经验,关注新技术的应用和发展,以应对未来的挑战和机遇。

    金融行业智能分析AI Agent的应用实践与技术创新:提升企业数字化决策能力

    内容概要:本文探讨了智能分析AI Agent在金融行业的先进实践与展望,指出金融行业在经营分析领域面临的现状和痛点,包括管理团队无法快速获得深度结论,业务团队面对BI产品学习门槛高、依赖人工等问题。文中介绍了智能分析AI Agent相较于传统解决方案的技术创新,如数据建模右移、基于虚拟层的数据编织、指标平台与大模型组合方案等,强调其在降低使用门槛、提高效率和增强交互性方面的优势。同时,文章展示了智能分析AI Agent在交互式指标问询、自动分析报告生成等应用场景中的价值,并对未来的发展进行了展望。 适合人群:金融行业的管理层、业务分析师、数据科学家以及对金融科技感兴趣的从业者。 使用场景及目标:①帮助管理层快速获取数据背后的深层次原因和结论;②降低业务团队使用数据分析工具的门槛,提高工作效率;③实现数据的自动化处理和分析,减少人工干预;④推动企业内部的数据民主化,使更多员工能够参与数据分析和决策。 阅读建议:本文不仅提供了智能分析AI Agent的技术细节,还结合实际案例展示了其应用效果,因此在阅读过程中应重点关注技术创新点及其对企业管理和业务流程的具体影响。

Global site tag (gtag.js) - Google Analytics