- 浏览: 648071 次
- 性别:
- 来自: 北京
文章分类
- 全部博客 (310)
- C&C++ (14)
- Java (52)
- Python (13)
- Web (10)
- Tomcat (2)
- Struts2 (2)
- Spring (3)
- Hibernate (11)
- SWT (1)
- Linux (35)
- WebService (1)
- 工具 (3)
- 数据库 (10)
- 开源项目 (3)
- 搜索技术 (4)
- 链接记录 (3)
- 搜集信息 (12)
- 工作笔记 (16)
- 星星点点 (20)
- 英文片语 (7)
- 读书笔记 (3)
- 自考资料 (3)
- 习题自解 (1)
- 一例一课 (0)
- 运动积累 (1)
- 留档 (0)
- SQL (5)
- JPA (1)
- JSP (3)
- JSON (1)
- Javascript (5)
- Excel (1)
- vbox (3)
- 虚拟机 (1)
- nat (1)
- secureCRT (1)
- centos (1)
- ssh (1)
- ide (1)
- hive (2)
- impala (1)
- ascii (1)
- redis (1)
- seckill (1)
- nginx (2)
- git (0)
- mq (1)
- maven (1)
- java并发包 (1)
- 阅源 (1)
- mybatis (1)
最新评论
-
dotjar:
awk -F "/" '{print $3 ...
@Marked-linux命令使用 cut/sort/uniq -
DEMONU:
直接将要删除的key记下来,遍历完了,在删除
@Marked-Java 遍历Map时 删除元素 -
LeeXiao:
感谢分享
@Marked-Java 遍历Map时 删除元素 -
nicegege:
受益匪浅
mysql char varchar -
nicegege:
受益匪浅
@Maked-mysql使用规范
2011-1-6
1.找到jdk的bin目录:
进入到jdk的bin之下,有一个native2ascii.exe,就是它!
“运行”-“cmd”-“cd %JAVA_HOME%/bin”
2.在我的目录“C:/nie/”之下有一个cn.txt,内容如下:
name=小兔子 gender=女 age=20 birth=199104 province=北京 city=北京 hobby=运动看书 #------------------- ecol.100=不详 ecol.101=无格 ecol.102=无格或有格 ecol.103=红格 ecol.104=红格或无格 ecol.105=红栏格 ecol.106=红边栏 ecol.107=绿格 ecol.108=蓝格 ecol.109=蓝格或黑格 ecol.110=蓝格或无格 ecol.111=黑格 ecol.112=黑格或无格 ecol.113=黑格或蓝格或红格 ecol.114=黄格 ecol.115=紫格 ecol.116=朱格 ecol.117=方格 ecol.118=小方格 ecol.119=红方格 ecol.120=横格 ecol.121=兰格 ecol.122=米格 ecol.123=白格 ecol.124=直格 ecol.125=竹简形行格 ecol.126=红格或黑格 ecol.127=兰格或红格 ecol.128=墨栏 ecol.129=乌丝栏
转换成unicode:
native2ascii -encoding GBK c:\nie\cn.txt c:\nie\cn_gbk.txt //GB2312也可以
name=\u5c0f\u5154\u5b50 gender=\u5973 age=20 birth=199104 province=\u5317\u4eac city=\u5317\u4eac hobby=\u8fd0\u52a8\u770b\u4e66 #------------------- ecol.100=\u4e0d\u8be6 ecol.101=\u65e0\u683c ecol.102=\u65e0\u683c\u6216\u6709\u683c ecol.103=\u7ea2\u683c ecol.104=\u7ea2\u683c\u6216\u65e0\u683c ecol.105=\u7ea2\u680f\u683c ecol.106=\u7ea2\u8fb9\u680f ecol.107=\u7eff\u683c ecol.108=\u84dd\u683c ecol.109=\u84dd\u683c\u6216\u9ed1\u683c ecol.110=\u84dd\u683c\u6216\u65e0\u683c ecol.111=\u9ed1\u683c ecol.112=\u9ed1\u683c\u6216\u65e0\u683c ecol.113=\u9ed1\u683c\u6216\u84dd\u683c\u6216\u7ea2\u683c ecol.114=\u9ec4\u683c ecol.115=\u7d2b\u683c ecol.116=\u6731\u683c ecol.117=\u65b9\u683c ecol.118=\u5c0f\u65b9\u683c ecol.119=\u7ea2\u65b9\u683c ecol.120=\u6a2a\u683c ecol.121=\u5170\u683c ecol.122=\u7c73\u683c ecol.123=\u767d\u683c ecol.124=\u76f4\u683c ecol.125=\u7af9\u7b80\u5f62\u884c\u683c ecol.126=\u7ea2\u683c\u6216\u9ed1\u683c ecol.127=\u5170\u683c\u6216\u7ea2\u683c ecol.128=\u58a8\u680f ecol.129=\u4e4c\u4e1d\u680f
而且这两种生成的编码是相同的,因为GBK兼容GB2312;
3.现在反过来按照GBK编码再转回中文本地:
native2ascii -reverse -encoding GBK c:\nie\cn_gbk.txt c:\nie\gbk_back.txt
或者:
native2ascii -reverse c:\nie\cn_gbk.txt c:\nie\gbk_back.txt
都会产生转换转换结果如上面的中文!
“GBK”、“GB2312”、“8859_1”可以互转;
但是/unicode/UTF-8转换之后不能转回中文;
--------------------------------------风骚的分割线-------------------------------------
4.小结:
如果要使用本地中文转换成unicode编码:
使用参数:native2ascii -encoding GBK(或者GB2312);
如果要使用unicode再转换回来生成我们看的懂的中文:
使用参数:native2ascii -reverse -encoding GBK(或者GB2312);也可以省掉-encoding GBK(或者GB2312),只用-reverse就可以。
5.备注:如果是要转换成8859_1的话,再翻转中文的时候就必须加上-encoding 8859_1才可以回转成中文;其他的UTF-8则回转不成功,还没有弄明白原因。
发表评论
-
@Marked-ExecutorService的invokeAny方法注意
2018-08-23 20:19 932package com.msxf.datasource.t ... -
XML fragments parsed from previous mappers already contains value for
2018-06-02 19:36 26151. ssm项目报错: WARN [main] ... -
@Marked-阅源-jdk8-FunctionalInterface注解
2017-10-26 17:01 860package java.lang; impor ... -
TPE-ThreadPoolExecutor
2017-10-10 15:24 94TPE: java.util.concurrent ... -
@Marked-java-Queue方法
2017-06-27 14:09 618Collection>Queue // 1. 新增 ... -
ImpalaTest
2017-02-16 15:11 414package com.niewj.demo; imp ... -
@Marked-CORS跨域请求:前后端分离
2016-12-22 16:42 16781. 请求过滤器: /** ... -
@Marked-null列的值不参与比较
2016-10-26 17:23 572假如数据库有表emp: empno name age ... -
自定义泛型方法, 三级排序, low版,待升级
2016-10-20 21:17 462package com.jd.dashboard.util ... -
java enum 枚举值
2016-09-21 18:45 567public enum PieChartEnum { P ... -
maven install 时 pom中skip test
2016-09-19 23:08 5630<plugin> <groupI ... -
DateUtil-1
2016-09-19 21:47 507/** * @Title: DateUtil.java ... -
@Marked-ClassNotFoundException: java.util.ArrayList$SubList 错误
2016-09-18 15:00 1750ClassNotFoundException: java ... -
@Marked-mybatis 字符串比较 == 用法
2016-08-22 21:45 5894private String deptLevel; &l ... -
@Marked-List/Set 泛型转换
2016-08-04 11:02 1652Type typeSet = new TypeToken& ... -
@Marked-excel导出csv包括逗号等的处理
2016-08-03 09:22 4751/** * @Title: trimRubbishCh ... -
@Marked-保留两位小数,四舍五入
2015-06-16 01:09 674new java.text.DecimalFormat(& ... -
tomcat 404报错 问题可能之一
2015-05-29 18:20 1434一个tomcat下多个应用:我的应用xxx启动不起来,页面 ... -
@Marked-关于java和JS中的lastIndexOf方法的误解。
2014-08-08 16:32 763今天看JS的数组的lastIndexOf()方法,看书上的 ... -
@Marked-冒泡排序易理解实例
2013-05-08 11:43 1252package com.niewj.ds; publ ...
相关推荐
在Java中,所有的字符串都是以Unicode编码存储的,因此当需要处理包含其他编码(如ISO-8859-1或GB2312等)的文本时,`native2ascii`就显得非常有用。 在图形界面下,`native2ascii`通常并不直接提供图形工具,而是...
`native2ascii` 是Sun Java SDK中的一个实用工具,主要用于将包含非ASCII字符的文本文件(如`.txt`、`.ini`、`.properties`、`.java`等)转换为Unicode编码格式。在软件开发过程中,特别是在处理国际化(i18n)需求...
2. **ASCII转汉字**:将ASCII码转换回汉字的过程相对复杂。由于ASCII码只能表示128个字符,不能直接表示汉字,所以需要将ASCII码组合成更大的编码(如GBK或UTF-8的编码单元)来还原汉字。这个过程通常需要知道输入...
中文转Unicode码和Unicode码转中文的过程在Java环境下可以通过`native2ascii`工具轻松实现,这个工具是Java开发工具包(JDK)的一部分。 **中文转Unicode码**: 1. 首先,你需要确保已经安装了Java JDK。JDK包含了...
`native2ascii`命令是Java开发中用于处理非ASCII字符的一种工具,主要用于将含有非英文字符(如中文、日文等)的文本文件转换为Unicode编码的ASCII格式,以便Java虚拟机(JVM)能够正确识别和处理。这个命令对于国际...
当这些文件需要包含中文或其他非ASCII字符时,就需要用到`native2ascii`工具进行编码转换。 `native2ascii`工具能够将非ASCII字符转换为`\uXXXX`的Unicode转义序列,使得Java虚拟机(JVM)能够正确解析并显示这些非...
它是一个用于转换ASCII和Unicode编码之间格式的实用程序,帮助开发者在Java源代码中正确地表示非ASCII字符。 一、native2ascii.exe的用途 1. ASCII转Unicode:将包含非ASCII字符的文本文件转换为Java源代码中可读...
偶没有装JDK,所以也无法使用JDK自带的实用工具native2ascii.exe,这是一个仿制工具,仅供JAVA加载资源文件时将汉字转换为UNICODE编码用;
【描述】:这个工具不仅保留了`native2ascii`的基本功能,即转换非ASCII字符到Unicode转义序列,还引入了图形化的交互界面,使得用户可以无需记忆复杂的命令行参数,只需简单的点击和拖放操作,即可完成转换过程。...
通过对本案例的学习,我们不仅了解了Unicode编码的基本概念及其与汉字之间的关系,还掌握了如何使用JDK自带的native2ascii工具来进行有效的Unicode编码转换操作。希望这些知识能够帮助大家在未来的项目中更加顺利地...
`native2ascii`是Sun Java SDK提供的一个工具,用于将其他文本文件(如`.txt`, `.ini`, `.properties`, `.java`等)的编码转换为Unicode编码。进行转码的原因是为了程序的国际化。通常在安装了JDK后,在Windows系统...
2. **Native2ASCII**:在Java开发中,`native2ascii` 是一个工具,用于将非ASCII字符(通常为Unicode)转换为ASCII可表示的形式。这是因为在某些平台上,如Windows,文件名和资源文件可能不支持Unicode,这时就需要...
"native2ascii"工具就是为此目的而设计的,它能够将本地化资源文件中的非ASCII字符转换为相应的Unicode转义序列。而"native2ascii-crx"插件则是在这个基础上,提供了一种更便捷、用户友好的方式来实现这一过程,尤其...
在Java开发中,`native2ascii`是一个非常重要的工具,它用于将本地编码(例如中文)转换为ASCII编码,以便在Java源代码中使用。通常,当我们需要在Java字符串常量中包含非ASCII字符时,就需要使用这个工具。然而,...
Intellij IDEA 插件,可将具有本机编码字符(非拉丁 1 和非 Unicode 的字符)的属性文件转换为 Unicode 编码。 处理在编译阶段自动完成。 可通过 Intellij IDEA 插件库()获得。 发展 git clone ...
NATIVE/ASCII编码在线互转工具主要用于各类代码中各类本地字符的Unicode转换... 原理:获得输入框里的值,然后逐个转换为unicode编码(这个返回值是 0 – 65535 之间的整数),unicode转化为16进制,再添加上”\u”前缀.