`
dannyhz
  • 浏览: 398114 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

中文编码

 
阅读更多


char c = '淘';  中文字
String uncoide = Integer.toHexString(c); 把中文字转成16进制的 unicode 因为是2个字节的
 System.out.println(c+"的uncoide编码:\t"+uncoide);
       

c = '宝';
uncoide = Integer.toHexString(c);
System.out.println(c+"的uncoide编码:\t"+uncoide);


//从uncoide编码转换成10进制
int x = Integer.parseInt(uncoide, 16);
System.out.println(uncoide+"转成10进制:\t"+x);


打印出 23453

宝 的10进制数是  23453
 System.out.println(Integer.toBinaryString(23453));


淘宝 两个字的16进制树
String a = "\u6dd8\u5b9d";
System.out.println(a);





package dannytest.charset;

import java.io.UnsupportedEncodingException;
import java.nio.ByteBuffer;
import java.nio.CharBuffer;
import java.nio.charset.Charset;

public class CharsetTest {
	
	public static void main(String[] args) throws UnsupportedEncodingException {
		
		Charset charset = Charset.forName("UTF-8");
		ByteBuffer byteBuffer = charset.encode("淘宝");
		byte[] c1 = byteBuffer.array();
		for(byte t : c1){
			System.out.println(t);
		}
		
		System.out.println(new String(c1, "UTF-8"));
		CharBuffer charBuffer = charset.decode(byteBuffer);
		String c2 = charBuffer.toString();
		System.out.println(c2);
		
		parseByISO_8859_1();
		parseByGB2312();
		parseByUtf8();
		
		parseByUnicode();
        
       
        
		
		
	}
	
	
	public static void parseByUnicode(){
		//获得字符的uncoide编码
        char c = '淘';
        String uncoide = Integer.toHexString(c);
        System.out.println(c+"的uncoide编码:\t"+uncoide);
        
         c = '宝';
        uncoide = Integer.toHexString(c);
        System.out.println(c+"的uncoide编码:\t"+uncoide);
         
        
        //从uncoide编码转换成10进制
        int x = Integer.parseInt(uncoide, 16);
        System.out.println(uncoide+"转成10进制:\t"+x);
         
        //从10进制转成uncoide编码
        int y = 39118;
        System.out.println(y+"转成uncoide编码:\t"+Integer.toHexString(y));
		
		
		String a = "\u6dd8\u5b9d";
		
		
		System.out.println(a);
	}
	
	public static void parseByUtf8() throws UnsupportedEncodingException{
		String tao = "淘";
		String bao = "宝";
		
		byte[] taoByte = tao.getBytes("UTF-8");
		
		for(byte t : taoByte){
			System.out.println(t);
		}
		
		System.out.println("word1 : " + new String(taoByte, "UTF-8"));
		
		byte[] baoByte = bao.getBytes("UTF-8");
		
		for(byte t : baoByte){
			System.out.println(t);
		}		
		
		System.out.println("word2 : " + new String(baoByte, "UTF-8"));
		
	}

	public static void parseByISO_8859_1() throws UnsupportedEncodingException{
		String tao = "淘";
		String bao = "宝";
		
		byte[] taoByte = tao.getBytes("ISO-8859-1");
		
		for(byte t : taoByte){
			System.out.println(t);
		}
		
		System.out.println("word1 : " + new String(taoByte, "ISO-8859-1"));
		
		byte[] baoByte = bao.getBytes("ISO-8859-1");
		
		for(byte t : baoByte){
			System.out.println(t);
		}		
		
		System.out.println("word2 : " + new String(baoByte, "ISO-8859-1"));
		
	}
	
	public static void parseByGB2312() throws UnsupportedEncodingException{
		String tao = "淘";
		String bao = "宝";
		
		byte[] taoByte = tao.getBytes("GB2312");
		
		for(byte t : taoByte){
			System.out.println(t);
		}
		
		System.out.println("word1 : " + new String(taoByte, "GB2312"));
		
		byte[] baoByte = bao.getBytes("GB2312");
		
		for(byte t : baoByte){
			System.out.println(t);
		}		
		
		System.out.println("word2 : " + new String(baoByte, "GB2312"));
		
	}
	
}

分享到:
评论

相关推荐

    FORM表单中文乱码问题分析与解决

    FORM表单中文乱码问题分析与解决 在 Web 开发中,中文乱码问题是一个常见的问题,尤其是在FORM表单传递参数时。...使用正确的编码方式和解码方式可以解决中文乱码问题,从而确保FORM表单中的中文参数传递正确。

    中文乱码问题分析 自己总结的

    中文乱码问题是 Java 和 JSP 开发中的一种常见问题,主要是由于 Java 和 JSP 源文件的保存方式是基于字节流的,而编译成 class 文件过程中,使用的编码方式与源文件的编码不一致所致。在 Java 文件中,尽量不要写...

    Unicode汉字编码表(全)

    Unicode汉字编码表是全球计算机系统中用于表示汉字的标准编码之一,它在中文信息处理领域扮演着至关重要的角色。Unicode,全称统一码或万国码,是一个为所有字符集提供唯一数字标识的国际标准,旨在解决不同语言字符...

    解决JSP中文乱码问题

    解决 JSP 中文乱码问题 解决 JSP 中文乱码问题是一个很常见...解决 JSP 中文乱码问题需要从多方面入手,包括在 JSP 文件中指定编码方式,在 Java 文件中指定编码方式,在页面中指定编码方式,并确保编码方式的一致性。

    C#的ini文件操作,解决网上未解决的Get或Set中文乱码问题

    本资源参考网上原版为存取英文字符的ini操作,未考虑中文乱码问题。而网上另外也有资料如何处理中文编码,例如转码为utf-8,存能解决乱码,取又出现问题。本资源我重新整理,用unicode完美解决中文乱码问题。用法: ...

    航信汉字编码与解码/eterm汉字编码与解码

    航信汉字的编码与解码,编码便于使自己的pid进行汉字传输, 航信汉字编码与解码,eterm汉字编码与解码,汉字编码问题

    sqlite3 for delphi 解决中文乱码问题

    "sqlite3 for delphi 解决中文乱码问题"这个主题,正是针对这一问题提供了解决方案。这里我们将详细探讨SQLite3在Delphi中的应用,中文乱码的成因,以及如何通过自定义修改来解决这个问题。 首先,SQLite3是一个轻...

    JSPServlet 中的汉字编码问题

    特别是在处理非英文字符时,如中文字符,很容易遇到编码不匹配导致的乱码问题。本文主要针对JSP (Java Server Pages) 和 Servlet 中汉字编码问题的解决方法进行详细阐述。 #### 二、字符编码基础知识 1. **字符集*...

    hadoop中文乱码问题

    解决Hadoop中文乱码问题的关键在于识别和匹配数据的正确编码,并在Hadoop组件和工具中设置相应的编码选项。在实际操作中,可能需要结合日志信息和源码调试来定位问题。同时,建立良好的编码规范,统一数据的编码格式...

    MySQL数据库系统中文乱码问题及解决方案.pdf

    解决中文乱码问题的关键是选择合适的字符集和编码方式。以下是三个解决方案: * 使用utf-8编码方式:utf-8是一种支持大部分语言的字符集,可以自动选择编码的长短,提高Unicode的编码效率。 * 使用GB2312码或GBK码...

    RouterOS软路由中文编码转换,RouterOS使用中文备注

    总的来说,这个“RouterOS软路由中文编码转换”工具是解决ROS系统中文支持问题的一个有效途径,它使得非英文环境下的用户能够更加方便地使用和管理RouterOS系统。通过深入研究源码,用户不仅可以解决当前的问题,还...

    java中文乱码问题详解--- java中文乱码问题详解

    ### Java中文乱码问题详解 #### 一、中文问题的来源与背景 计算机技术发展初期,操作系统主要支持单字节的ASCII字符集。随着全球化进程加快和技术进步,为支持多种语言,尤其是双字节编码的语言(如中文),提出了...

    解决中文乱码问题

    中文乱码问题是指在计算机中,中文字符由于编码问题而导致的乱码问题。这种问题常见于读取txt文件、csv文件或者其他文本文件时。解决方法是使用正确的编码方式和读取方式。 知识点6:ASP和C# ASP是微软公司推出的...

    gb18030的汉字编码,Unicode汉字编码表

    在IT行业中,理解和掌握汉字编码对于处理中文字符的存储、传输和显示至关重要。本文将深入探讨GB18030、GBK、Unicode这三种汉字编码以及它们在编程中的应用。 首先,让我们了解一下GB18030编码。GB18030是中国国家...

    Ajax中文乱码问题解决方案

    然而,在处理中文字符时,Ajax请求可能会遇到乱码问题,这主要是由于编码格式不一致或者处理不当导致的。本文将深入探讨Ajax中文乱码问题的成因,并提供一系列解决方案。 **一、问题原因** 1. **编码格式不一致**...

    汉字编码问题总结

    汉字编码问题总结 GB2312-80 编码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集--基本集》,由国家标准总局发布,1981年5月1日实施,通行于大陆。新加坡等地也使用此编码。GB2312 收录...

    中文编码问题.zip

    "中文编码问题.zip"这个压缩包文件可能包含了几个实例,旨在帮助我们理解和解决在Java Web开发中遇到的中文乱码问题。在这个问题上,UTF-8编码扮演了至关重要的角色。 首先,我们要理解什么是编码。在计算机世界里...

    最全的unicode 汉字编码表

    ### 最全的Unicode汉字编码表知识点解析 #### Unicode与汉字编码概述 - **Unicode简介**:Unicode是一种国际标准字符编码方案,旨在支持世界上几乎所有语言的文字表示。它通过为每个字符分配一个唯一的数字来实现...

    GB2312简体中文编码表+Unicode汉字编码表+特殊符号UNICODE码

    同时,在处理特殊符号时,知道其UNICODE码可以帮助正确地插入和处理这些符号,避免乱码问题。 总的来说,GB2312、Unicode和特殊符号的UNICODE码是理解中文字符和特殊符号在数字世界中如何表示的基础。通过学习和...

Global site tag (gtag.js) - Google Analytics