- 浏览: 241298 次
- 性别:
- 来自: 济南
文章分类
最新评论
-
糯米烧麦:
按上文说明ws发布成功了,但浏览器输入url?wsdl报404 ...
使用JAX-WS的Provider和 Dispatch发布WebService的例子 -
gongmingwind:
我设定后就OK了
使用Servlet实现文件下载的时候,避免浏览器自动打开文件 -
fanhang116:
为什么设定了后还是自动打开呢.
使用Servlet实现文件下载的时候,避免浏览器自动打开文件
package example.encoding; /** *//** * The Class ChineseValidator. */ public class CharacterValueConveter { /** *//** * The main method. * * @param args the arguments */ public static void main(String args[]) { CharacterValueConveter conveter = new CharacterValueConveter(); conveter.testConvertion("中文"); } /** *//** * Test convertion. * * @param content the content */ public void testConvertion(String content) { byte[] bytes = content.getBytes(); System.out.println("Original String : " + content); System.out.println(); // Get bytes array System.out.println("Convert string to bytes array : "); for (int i = 0; i < bytes.length; i++) { System.out.println(" byte[" + i + "]=" + bytes[i]); } System.out.println(); // Get each character and unicode System.out.println("Start to convert by character: " + "\n"); for (int j = 0; j < content.length(); j++) { char c = content.charAt(j); printAllValue(c); } } /** *//** * Prints the all value. * * @param c the c */ public void printAllValue(char c) { byte b = (byte) c; int i = (int) c; short s = (short) c; String binaryString = Integer.toBinaryString(i); String hexString = Integer.toHexString(i); StringBuffer output = new StringBuffer(); // Base value output.append("Character : ").append(c).append("\n"); output.append(" byte value : ").append(b).append("\n"); output.append(" int value : ").append(i).append("\n"); output.append(" short value : ").append(s).append("\n"); // Hex value and binary value output.append(" hex value :").append(hexString).append("\n"); output.append(" binary value : ").append(binaryString).append("\n"); // Unicode value in java file & web page with decimal encoding output.append(" unicode value (Base 10): "); output.append("\\u").append(i).append(";").append("\n"); output.append(" unicode value (Base 10 in web page): "); output.append("&#").append(i).append(";").append("\n"); // Unicode value in java file & web page with hexadecimal encoding output.append(" unicode value (Base 16): "); output.append("\\u").append(hexString).append(";").append("\n"); output.append(" unicode value (Base 16 in web page): "); output.append("&#").append(hexString).append(";").append("\n"); System.out.println(output.toString()); } }
最终的测试结果如下:
Original String : 中文
Convert string to bytes array :
byte[0]=-42
byte[1]=-48
byte[2]=-50
byte[3]=-60
Start to convert by character:
Character : 中
byte value : 45
int value : 20013
short value : 20013
hex value :4e2d
binary value : 100111000101101
unicode value (Base 10): \u20013;
unicode value (Base 10 in web page): 中
unicode value (Base 16): \u4e2d;
unicode value (Base 16 in web page): e2d;
Character : 文
byte value : -121
int value : 25991
short value : 25991
hex value :6587
binary value : 110010110000111
unicode value (Base 10): \u25991;
unicode value (Base 10 in web page): 文
unicode value (Base 16): \u6587;
unicode value (Base 16 in web page): ᦻ
可以看到在Java中,字符的unicode有两种表示显示:一种是10进制形式,一种是16进制形式。它们可以分别通过:int i = (int)(string.charAt(i))和Integer.toHexString(i);获得。而且在java文件和Web页面,同一个unicode的表示形式是不同。web页面需要用&#进行转义,在java文件中则使用\u进行转义。
发表评论
-
Volatile使用场景
2014-11-26 17:39 896Volatile的特性:可见性,但不互斥.怎么理解这句话, ... -
Java线程(四):线程中断、线程让步、线程睡眠、线程合并 .
2014-10-28 15:49 873有人会问:JDK5之后有了更完善的处理多线程问题的类(并发包 ... -
Java线程(三):线程协作-生产者/消费者问题
2014-10-28 15:35 753上一篇讲述了线程的 ... -
Java线程(二):线程同步synchronized和volatile
2014-10-24 18:19 845上篇通过一个简单 ... -
Java线程(一):线程安全与不安全
2014-10-24 18:01 741当我们查看JDK API的时候,总会发现一些类说明写着,线程 ... -
Java线程(七):Callable和Future
2014-10-24 17:51 533接着上一篇继续并发 ... -
final修饰符
2012-07-09 16:30 918final修饰符1.final 可以修饰变量,被fina ... -
super的限制
2012-07-09 15:49 868super的限制1.子类方法不能直接使用 return sup ... -
JAVA继承在处理成员变量和方法时是有区别
2012-07-09 15:27 1094JAVA继承在处理成员变 ... -
System.getProperty()参数大全
2011-09-29 09:33 1016内容来源网站: http://blog.sina.com.cn ... -
字符集和编码
2011-07-07 14:48 873很久很久以前,有一群 ... -
【Java基础专题】编码与乱码(07)---native2ascii命令的用法
2011-07-05 11:54 1130【1】native2ascii命令的语 ... -
【Java基础专题】编码与乱码(05)---GBK与UTF-8之间的转换
2011-07-05 11:51 1324【GBK转UTF-8】 在很多论坛、网上经常有网友问“ 为什么 ... -
【Java基础专题】编码与乱码(04)---输出时的编码与乱码
2011-07-05 11:45 1337package example.encoding; im ... -
【Java基础专题】编码与乱码(03)----String的toCharArray()方法
2011-07-05 11:43 1250package example.encoding; i ... -
【Java基础专题】编码与乱码(02)---String的getBytes([encoding])方法
2011-07-05 11:41 1125package example.encoding; im ... -
【Java基础专题】编码与乱码(01)---编码基础
2011-07-05 11:30 964Unicode中文“艺”字: 827A二进制的“艺”字编码:1 ... -
JavaEE防止中文乱码的设置
2011-07-04 17:29 1570在基于J2EE的B/S应用中,中文乱码是一个永恒的主题,永远都 ... -
JAVA 序列化
2011-05-21 13:49 908当进行序列化的时候: 首先JVM会先调用writeReplac ...
相关推荐
### JAVA字符编码详解:Unicode, ISO-8859-1, GBK, UTF-8 及其相互转换 #### 一、引言 在Java编程中,字符编码的管理和转换是一项基本而又重要的任务。不同的编码标准适用于不同的场景,而理解和掌握这些编码之间...
在Java中,如果使用ISO-8859-1编码获取Unicode字符时,可能会出现乱码,因为一个Unicode字符可能无法准确地转换成一个ISO-8859-1字节。 #### 3. GBK GBK是中国大陆地区广泛使用的一种汉字编码标准,它是对GB2312...
不需要关心接受的字符串编码是UTF_8还是GBK,还是ios-8859-1,自动转换为utf-8编码格式,无需判断字符串原有编码,用法://处理编码String newStr = GetEncode.transcode(oldStr);
#### 三、Java编码转换的详细过程 Java程序从开发到运行的过程中,涉及到多个环节的编码转换,主要包括: 1. **源文件编码**:Java源文件(`.java`)在保存时通常采用操作系统默认的编码格式。例如,在中文Windows...
字符编码决定了如何将字符转换为字节序列,以及如何从字节序列恢复字符。本篇将围绕"JAVA 转换字符编码工具"这个主题,深入探讨字符编码的概念、Java中的字符编码API以及`ReadFile.java`这个可能的源码文件如何处理...
然而,当涉及到字符编码时,如GBK和UTF-8之间的转换,可能会遇到乱码问题。这篇博客文章“eclipse中class乱码GBK-UTF-8转换工具”正是为了解决这个问题。 GBK是GB2312的扩展,包含了更多的汉字和其他字符,主要在...
Java 编码问题一直是开发者们面临的一大挑战,尤其是在处理中文字符时。UTF-8、ISO-8859-1 和 GBK 是三种常见的字符编码格式,每种都有其特定的应用场景和优缺点。 首先,UTF-8 是一种广泛使用的多字节编码,能够...
这个问题的根本原因在于PDFBox在解析和渲染使用Identity-H编码的PDF文档时,未能正确地将Unicode字符转换为PDF中的字形。这可能涉及到字体嵌入、编码设置、或者PDFBox库自身的编码处理逻辑。 为了解决这个问题,你...
Java中的字符编码转换是编程实践中一个至关重要的概念,尤其是在处理多语言环境和跨平台交互时。Java通过统一采用UTF-16编码格式在JVM内部处理字符,简化了字符操作的复杂性。UTF-16是一种变长的Unicode编码,它可以...
本文将深入探讨"字符编码过滤器"、"J2EE字符编码"、"字符编码转换"以及"POST字符转换"这些关键知识点,并结合提供的文件"encoding-filter.jar"和"使用方法.txt"来解释它们的应用。 首先,字符编码是计算机存储和...
- 解决Java处理CSV文件时的中文乱码问题,关键在于正确指定字符编码。 - 要注意文件的读取、写入以及处理过程中的编码一致性。 - 使用专门的CSV处理库能简化操作,并提供更好的兼容性。 - 对于复杂情况,了解并...
编码是指将字符转换为字节序列的过程,不同的字符集有不同的编码方式。例如,ASCII编码用1个字节表示一个字符,而UTF-8编码则根据字符的不同,使用1到4个字节。 二、简单字符串的编码转换 在Java中,String类提供了...
乱码通常发生在不同字符集之间转换时,例如从GBK编码转换到UTF-8编码,或者反之。当原始数据的编码与系统识别的编码不匹配时,就会出现无法正确显示的字符,也就是我们常说的乱码。 在数据库编程中,编码问题可能...
4. **使用标准化的编码格式**:尽可能地使用如UTF-8这样的通用编码格式,它可以很好地支持各种语言字符,减少乱码的风险。 5. **编码转换工具的选择**:选择合适的工具进行编码转换也非常重要。例如,Java中的`...
当从不同的源(如网络请求、文件读取等)获取字符串时,必须明确知道其原始编码格式,并在必要时进行转换,以便与当前系统或程序所使用的编码格式相匹配。在Java中,常用的编码有`ISO-8859-1`(也称为`latin1`)、`...
在Java基础教程中,徐培成老师的"Java基础第09天-005.String-字符集编码"主题深入探讨了这一主题,帮助初学者理解字符串(String)类与字符编码的关系。 首先,我们要知道什么是字符集。字符集是一系列用于表示文本的...
本文将围绕“Java编码与乱码”这一主题展开,探讨字符编码系列的第一部分。 首先,我们需要理解什么是字符编码。字符编码是计算机用于表示文字、符号等字符的方式,它为每个字符分配了一个唯一的数字,使得计算机...