简单轻松实现unicode和中文字符之间切换
一 unicode字符转换为中文
public String unicode2Chinese(String str) {
StringBuffer sb = new StringBuffer();
StringTokenizer st = new StringTokenizer(str, "\\u");
while(st.hasMoreElements()) {
String value = st.nextElement().toString();
//System.out.println(value.substring(5));
Integer intValue = Integer.parseInt(value.substring(0, 4), 16); sb.append((char)intValue.intValue()).append(value.substring(4, value.length()));
}
return sb.toString();
}
二 中文转换为unicode
public String chinese2Unicode(String str) {
StringBuffer sb = new StringBuffer();
for(int i = 0; i < str.length(); i++) {
char c = (char)str.charAt(i);
if(isChineseCharacter(c))
sb.append("\\u").append(Integer.toHexString((int)c));
else
sb.append(c);
}
return sb.toString();
}
三 判断中文字符函数
private boolean isChineseCharacter(char c) {
int value = (int)c;
int low = Integer.parseInt("4e00", 16);
int up = Integer.parseInt("9fa5", 16);
if(value > low && value < up) return true;
return false;
}
四 测试
public static void main(String args[]) {
//\u4e00-\u9fa5中文编码范围
Unicode2Chinese u2c = new Unicode2Chinese();
String str = u2c.unicode2Chinese("\\u4e00\u9fa5ooo\\u535a\\u5b66asdf\\u591a\\u624d");
System.out.println(str);
System.out.println(u2c.chinese2Unicode("博学asdf多才"));
}
运行结果:
一龥ooo博学asdf多才
\u535a\u5b66asdf\u591a\u624d
分享到:
相关推荐
unicode和中文互相转换工具,支持不同编码格式。
Unicode和汉字转换是计算机处理中文字符时经常遇到的问题。Unicode是一种国际编码标准,它为世界上几乎所有的文字系统提供了一个统一的编码方式,包括汉字。汉字转换则是将汉字在不同的编码格式间进行转换,如从...
一些设备串口通讯使用的是unicode,这时候我们解码就要使用unicode 编码包含的是中文,英文,俄文还是日文什么的,只要把它转换成Unicode就能被识别,而不用再考虑...unicode编码(UTF8)的十六进制 与字符 互相转换
GBK是中国大陆广泛使用的汉字编码标准,它是GB2312的扩展,增加了更多的汉字和符号,尤其包含了繁体字。GBK编码使用两个字节来表示一个字符,与UNICODE相比,它不是全球通用的,主要用于中文环境。 UTF-8是一种变长...
### C# 字串与 Unicode 互相转换方法 在软件开发过程中,经常需要处理不同编码格式的数据,其中 Unicode 是一种常见的字符编码方式,它为每个字符分配一个唯一的数字(即码点),支持世界上几乎所有的书写系统。C# ...
在描述中提到的“实现Unicode和汉字的互相转码”,这意味着提供的资源可能是一个工具或者程序,可以将Unicode编码的文本转换为特定的汉字编码,反之亦然。这在处理不同系统间的数据交换时尤其有用,例如,当需要将...
3. **GBK**:GBK是中国大陆使用的扩展GBK编码,它是GB2312的升级版,包含了更多的汉字和其他语言字符,主要用于简体中文环境。GBK编码使用2个字节表示一个字符,覆盖了大部分中文字符。 接下来,我们关注字符工具V...
ASCII_UNICODE_UTF8字符串互相转换的C++代码ASCII_UNICODE_UTF8字符串互相转换的C++代码ASCII_UNICODE_UTF8字符串互相转换的C++代码ASCII_UNICODE_UTF8字符串互相转换的C++代码ASCII_UNICODE_UTF8字符串互相转换的...
总的来说,“Unicode—汉字互相转换工具”是一个实用性极强的辅助软件,它可以帮助用户快速查找和转换汉字与Unicode编码,极大地提升了跨语言环境下的文本处理效率。无论你是程序员、翻译工作者还是学术研究者,都能...
在计算机科学领域,字符编码是...总的来说,汉字与Unicode的互相转换涉及到字符编码理论、字节顺序理解、编程语言的字符串处理技巧以及对HTML的解析能力。掌握这些知识对于进行跨语言、跨平台的文本处理工作至关重要。
Unicode,ftf-8字符互相转换工具类
### JavaScript 实现 Unicode 和字符的互相转换 #### 一、引言 在处理文本数据时,经常需要将字符串转换为其 Unicode 编码形式,或从 Unicode 编码还原成原始字符。JavaScript 提供了强大的字符串操作功能,可以...
"封装ANSI,UNICODE,UTF8互相转换类"是一个专门解决字符编码转换问题的工具,尤其适用于处理多语言环境下的文本数据。以下是对这些编码方式以及它们之间转换的详细解释: 1. ANSI 编码:ANSI(American National ...
经常遇到这样内容的json字符串,原来是把其中的汉字做了Unicode编码转换。 Unicode编码: ...但是在将 UNICODE字符编码的内容转换为汉字的时候,字符是从后面向前处理的,所以,需要把字符按照顺序
UTF-8的优势在于其与ASCII的兼容性,前128个Unicode字符与ASCII编码相同,这使得许多ASCII处理的库和工具可以无缝地处理UTF-8编码的文本。 在C++中进行这些编码间的转换,通常需要使用一些库函数或者自定义的实现。...
标题中的"unicode码与GB码互相转换"涉及到两种主要的汉字编码标准:Unicode(国际通用的字符编码标准)和GBK(中国国家标准的扩展GB2312编码)。在嵌入式系统或者文件系统中,为了正确显示和存储中文字符,就需要...
Unicode使用统一的编码空间,使得不同语言间的字符可以互相比较和操作。 Unicode有多种实现方式,其中最常见的是UTF-8编码。UTF-8是一种变长编码,它可以表示Unicode中的所有字符。对于英文字符,UTF-8与ASCII码...
在C#中,汉字和Unicode编码的转换主要涉及对字符串的编码和解码过程。 首先,让我们了解Unicode编码的基本概念。Unicode编码通常使用16位表示一个字符,因此对于汉字这样的双字节字符,它由两个16进制的数字组成。...
1. ANSI编码:通常指的是Windows系统的默认编码,如GBK或CP936,它是一种多字节编码,不支持所有Unicode字符。 2. Unicode:这是一个标准,定义了所有已知字符的唯一数字表示,分为Little Endian和Big Endian两种...