`
lean1252
  • 浏览: 218239 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

unicode和中文字符互相转换

阅读更多
简单轻松实现unicode和中文字符之间切换

一 unicode字符转换为中文
public String unicode2Chinese(String str) {
		 
		 StringBuffer sb = new StringBuffer();
		 StringTokenizer st = new StringTokenizer(str, "\\u");
		 while(st.hasMoreElements()) {
			 String value = st.nextElement().toString();
			 //System.out.println(value.substring(5));
			 Integer intValue = Integer.parseInt(value.substring(0, 4), 16);			 sb.append((char)intValue.intValue()).append(value.substring(4, value.length()));
		 }
		 
		 return sb.toString();
	 }


二 中文转换为unicode
public String chinese2Unicode(String str) {
	
		 StringBuffer sb = new StringBuffer();
		 for(int i = 0; i < str.length(); i++) {
			char c = (char)str.charAt(i);
			if(isChineseCharacter(c))
		sb.append("\\u").append(Integer.toHexString((int)c));
			else
				sb.append(c);
		 }
		 
		 return sb.toString();
	 }


三 判断中文字符函数
private boolean isChineseCharacter(char c) {
		 
		 int value = (int)c;
		 int low = Integer.parseInt("4e00", 16);
		 int up = Integer.parseInt("9fa5", 16);
		 if(value > low && value < up) return true;
		 
		 return false;
	 }


四 测试
public static void main(String args[]) {
		//\u4e00-\u9fa5中文编码范围
		Unicode2Chinese u2c = new Unicode2Chinese();
		String str = u2c.unicode2Chinese("\\u4e00\u9fa5ooo\\u535a\\u5b66asdf\\u591a\\u624d");
		System.out.println(str);
		System.out.println(u2c.chinese2Unicode("博学asdf多才"));
	}


运行结果:
一龥ooo博学asdf多才
\u535a\u5b66asdf\u591a\u624d

分享到:
评论

相关推荐

    unicode和中文互相转换工具

    unicode和中文互相转换工具,支持不同编码格式。

    Unicode和汉字互相转换工具

    Unicode和汉字转换是计算机处理中文字符时经常遇到的问题。Unicode是一种国际编码标准,它为世界上几乎所有的文字系统提供了一个统一的编码方式,包括汉字。汉字转换则是将汉字在不同的编码格式间进行转换,如从...

    unicode编码(UTF8)的十六进制 与字符 互相转换

    一些设备串口通讯使用的是unicode,这时候我们解码就要使用unicode 编码包含的是中文,英文,俄文还是日文什么的,只要把它转换成Unicode就能被识别,而不用再考虑...unicode编码(UTF8)的十六进制 与字符 互相转换

    C语言字符编码转换UNICODE、GBK、UTF-8互相转换

    GBK是中国大陆广泛使用的汉字编码标准,它是GB2312的扩展,增加了更多的汉字和符号,尤其包含了繁体字。GBK编码使用两个字节来表示一个字符,与UNICODE相比,它不是全球通用的,主要用于中文环境。 UTF-8是一种变长...

    C#字串与Unicode互相转换方法

    ### C# 字串与 Unicode 互相转换方法 在软件开发过程中,经常需要处理不同编码格式的数据,其中 Unicode 是一种常见的字符编码方式,它为每个字符分配一个唯一的数字(即码点),支持世界上几乎所有的书写系统。C# ...

    unicode和汉字转换

    在描述中提到的“实现Unicode和汉字的互相转码”,这意味着提供的资源可能是一个工具或者程序,可以将Unicode编码的文本转换为特定的汉字编码,反之亦然。这在处理不同系统间的数据交换时尤其有用,例如,当需要将...

    字符工具V1.6.zip UTF8 unicode GBK字符格式互相转换 空格剔除 换行剔除 和校验 异或校验

    3. **GBK**:GBK是中国大陆使用的扩展GBK编码,它是GB2312的升级版,包含了更多的汉字和其他语言字符,主要用于简体中文环境。GBK编码使用2个字节表示一个字符,覆盖了大部分中文字符。 接下来,我们关注字符工具V...

    ASCII_UNICODE_UTF8字符串互相转换的C++代码

    ASCII_UNICODE_UTF8字符串互相转换的C++代码ASCII_UNICODE_UTF8字符串互相转换的C++代码ASCII_UNICODE_UTF8字符串互相转换的C++代码ASCII_UNICODE_UTF8字符串互相转换的C++代码ASCII_UNICODE_UTF8字符串互相转换的...

    Unicode—汉字互相转换工具

    总的来说,“Unicode—汉字互相转换工具”是一个实用性极强的辅助软件,它可以帮助用户快速查找和转换汉字与Unicode编码,极大地提升了跨语言环境下的文本处理效率。无论你是程序员、翻译工作者还是学术研究者,都能...

    汉字和Unicode互相转换

    在计算机科学领域,字符编码是...总的来说,汉字与Unicode的互相转换涉及到字符编码理论、字节顺序理解、编程语言的字符串处理技巧以及对HTML的解析能力。掌握这些知识对于进行跨语言、跨平台的文本处理工作至关重要。

    Unicode,ftf-8字符互相转换工具类

    Unicode,ftf-8字符互相转换工具类

    javascript实现unicode和字符的互相转换

    ### JavaScript 实现 Unicode 和字符的互相转换 #### 一、引言 在处理文本数据时,经常需要将字符串转换为其 Unicode 编码形式,或从 Unicode 编码还原成原始字符。JavaScript 提供了强大的字符串操作功能,可以...

    封装ANSI,UNICODE,UTF8互相转换类

    "封装ANSI,UNICODE,UTF8互相转换类"是一个专门解决字符编码转换问题的工具,尤其适用于处理多语言环境下的文本数据。以下是对这些编码方式以及它们之间转换的详细解释: 1. ANSI 编码:ANSI(American National ...

    .Net(c#)汉字和Unicode编码互相转换实例

    经常遇到这样内容的json字符串,原来是把其中的汉字做了Unicode编码转换。 Unicode编码: ...但是在将 UNICODE字符编码的内容转换为汉字的时候,字符是从后面向前处理的,所以,需要把字符按照顺序

    VC ASCII,UNICODE,UTF8字符串互相转换的C++代码

    UTF-8的优势在于其与ASCII的兼容性,前128个Unicode字符与ASCII编码相同,这使得许多ASCII处理的库和工具可以无缝地处理UTF-8编码的文本。 在C++中进行这些编码间的转换,通常需要使用一些库函数或者自定义的实现。...

    unicode码与GB码互相转换

    标题中的"unicode码与GB码互相转换"涉及到两种主要的汉字编码标准:Unicode(国际通用的字符编码标准)和GBK(中国国家标准的扩展GB2312编码)。在嵌入式系统或者文件系统中,为了正确显示和存储中文字符,就需要...

    ASCII码和Unicode中韩字符集(包括简体和繁体中文)很强大

    Unicode使用统一的编码空间,使得不同语言间的字符可以互相比较和操作。 Unicode有多种实现方式,其中最常见的是UTF-8编码。UTF-8是一种变长编码,它可以表示Unicode中的所有字符。对于英文字符,UTF-8与ASCII码...

    .Net(c#)汉字和Unicode编码互相转换实例.docx

    在C#中,汉字和Unicode编码的转换主要涉及对字符串的编码和解码过程。 首先,让我们了解Unicode编码的基本概念。Unicode编码通常使用16位表示一个字符,因此对于汉字这样的双字节字符,它由两个16进制的数字组成。...

    字符编码转换类,支持 ANSI、Unicode、Unicode big endian、UTF-8、UTF-8+Bom互相转换

    1. ANSI编码:通常指的是Windows系统的默认编码,如GBK或CP936,它是一种多字节编码,不支持所有Unicode字符。 2. Unicode:这是一个标准,定义了所有已知字符的唯一数字表示,分为Little Endian和Big Endian两种...

Global site tag (gtag.js) - Google Analytics