`
104zz
  • 浏览: 1508393 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类

Unicode和字符串、汉字的相互转化

阅读更多

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Unicode {
	public Unicode() {
	}
	public static void main(String[] args) {
		String str = "你好";
		String str1 = StringToUnicode(str);
		System.out.println(str1);
		String str2 = "\u54c8\u54c8";
		System.out.println(str2);
	}

	public static String StringToUnicode(String str) {
		StringBuffer strb = new StringBuffer();
		for (int i = 0; i < str.length(); i++) {
			strb.append("\\u").append(Integer.toHexString(str.charAt(i)));
		}
		return strb.toString();
	}

	public static String UnicodeToString(String str) {
		Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))");
		Matcher matcher = pattern.matcher(str);
		char ch;
		while (matcher.find()) {
			ch = (char) Integer.parseInt(matcher.group(2), 16);
			str = str.replace(matcher.group(1), ch + "");
		}
		return str;
	}
}
 
分享到:
评论

相关推荐

    字符串十六进制转换工具(包含ANSI和UNICODE)

    本工具专注于ANSI和UNICODE字符串与十六进制之间的转换,这涉及到字符编码和二进制数据的理解。 首先,我们要理解ANSI和UNICODE的概念。ANSI字符串通常指的是基于特定地区或语言的ASCII编码,它使用7位或8位来表示...

    (资料大全加程序)C++ 字符串之间的相互转化 宽字符与多字符集(LPTSTR、LPCSTR、LPCTSTR、LPSTR)

    - `c++ 字符串之间的相互转化.txt` 可能是一份详细的文本指南,列出了C++中字符串转化的具体步骤和示例代码。 理解这些概念对于开发跨平台或需要处理多种语言的C++应用程序至关重要。确保正确处理字符串类型和字符...

    labview字符串拆分到数组 支持中文1

    只需确保字符串本身和分隔符都是正确的Unicode编码,LabVIEW就能正确识别和处理中文字符。 五、实例演示 假设我们有一个包含中文的字符串“我喜欢 LabVIEW,它很强大”。可以使用“字符串到数组”函数,将这个字符...

    中文转化为unicode格式的方法类

    总结来说,将中文转化为 Unicode 格式是通过理解 Unicode 编码原理,利用 Java 提供的相关 API 完成的。`unicodeConvert.java` 类是实现这一功能的代码载体,它可以方便地在各种场景下进行中文字符与 Unicode 之间的...

    几种常见字符集以及字符串的转化方法.rar

    1. MultiByteToWideChar函数:将MBCS(如ANSI)字符串转化为Unicode字符串。需要提供源字符串、代码页和目标缓冲区。 2. WideCharToMultiByte函数:将Unicode字符串转化为MBCS字符串。同样需要指定目标编码页和输出...

    字符串处理类:将GBK,UTF8字符串转化为Unicode编码的php类库.zip

    这个压缩包提供的类库专门用于处理GBK和UTF8编码的字符串,并将其转换为Unicode编码,反之亦然。下面我们将深入探讨字符串编码转换的相关知识以及如何使用这个PHP类库。 Unicode是一种广泛使用的字符编码标准,它...

    js字符串与Unicode编码互相转换

    总结而言,掌握JavaScript中字符串与Unicode编码互相转换的知识不仅有助于处理多语言文本数据,也是进行国际化软件开发的基础技能。通过了解相关方法和原理,可以更好地支持软件的全球化布局,确保文本在不同系统和...

    iOS 字符串转中文

    在iOS开发中,字符串处理是一项基础且重要的任务,特别是在涉及到中文字符时,转换和操作变得更加复杂。"iOS 字符串转中文"这个话题主要聚焦于如何在Objective-C或Swift环境中将字符串转换为中文字符,这对于实现...

    汉字字符串拼音排序-QT、C++

    总之,"汉字字符串拼音排序-QT、C++"这个主题涵盖了C++的字符串操作、QT的QString类、Unicode支持以及中文字符串的拼音处理技术。对于开发涉及中文内容的应用来说,掌握这些知识点是非常有价值的。

    汉字跟Unicode 互相 转化 C# 代码

    例如,将UTF-8编码的汉字转换为Unicode字符串: ```csharp byte[] utf8Bytes = File.ReadAllBytes("hanzitoutf-8.txt"); // 读取UTF-8编码的文件 string unicodeString = Encoding.UTF8.GetString(utf8Bytes); // ...

    JAVA中汉字字符转化为英文字符

    - 返回一个由汉字转换后的英文字符组成的字符串。 - **实现细节**: - 使用 `getBytes()` 方法获取字符串的字节数组。 - 遍历字节数组,检查每个字节是否小于0(即非ASCII字符)。 - 如果是负数,则使用位运算 `...

    MFC编写的字符和Unicode相互转换

    1.可以将字符(包括中文和英文)和Unicode相互转换。2.将正整数转化为八进制、二进制、十进制、十六进制。3.键盘钩子,根据按键,显示字符、ACS码值、二进制数值。编译环境VC++6.0,系统:windows xp SP3

    js对中文字符串进行gb2312编码解码

    1. 将中文字符串转化为Unicode编码,可以使用`encodeURIComponent()`函数。 2. 将Unicode编码转换为GB2312编码。这一步需要一个映射表,将Unicode编码映射到对应的GB2312编码。因为JavaScript本身不提供这个映射,...

    Unicode码字符转换器

    Unicode码字符转换器是一款工具,主要用于帮助编程人员和其他用户将任意字符转化为Unicode编码。Unicode是一种国际标准,旨在统一全球各种语言的文字表示,包括中文在内的多种字符集都可以在Unicode中找到对应的编码...

    Unicode码转中文和中文转Unicode码的最简便的方法

    Unicode码是一种国际标准字符编码,它能够表示世界上几乎所有的文字和符号,包括中文。Unicode码以16位或32位二进制形式存储每个字符,确保了不同语言间的兼容性和可交换性。中文转Unicode码和Unicode码转中文的过程...

    Qt中的字符编码转换:UTF8、Unicode、GBK、ASCII、16进制字符、16进制数值

    但如果需要,可以使用`QString::toUtf8()`将Unicode字符串转换为UTF-8字节序列。 5. **16进制数值转换**:在串口通信中,可能需要将接收到的16进制数值转换为字符或字符串。例如,函数`QByteArray_to_HexQString`将...

    汉字字符串输出首字母源代码

    实现这个功能,可以编写一个函数,接收一个汉字字符串作为参数,然后遍历字符串中的每个字符,将其转化为Unicode码点,再根据码点找到对应的首字母。这个过程可能需要借助于预先定义好的映射表,将Unicode码点映射到...

    C++二维码生成库,直接调用即可,支持中文和各种各样字符串转二维码

    输入的字符串可以是任何字符,包括中文,这得益于Qt库对Unicode的支持。字符串处理包括校验、编码转换和错误检查等步骤,确保字符串能正确转化为二维码。 5. **图像处理**: 生成的二维码是一个二维像素阵列,...

    汉字、UNICODE、GBK变化相互转化VB6源程序源码

    2. **UNICODE到汉字**:相反的过程,将UNICODE字符串转换为GBK,你需要将`FromCharCode`设为0,`ToCharCode`设为65001。 3. **GBK到UNICODE**:VB6中没有直接的函数来完成这个转换,需要自定义函数。基本思路是遍历...

    JAVA反编译和unicode转字符.rar

    描述中的“反编译后的汉字unicode显示格式转换为字符格式的代码”意味着在反编译过程中,可能会遇到汉字以Unicode编码形式出现,这通常是由于Java字节码中存储字符串的方式决定的。Unicode编码虽然通用,但在直接...

Global site tag (gtag.js) - Google Analytics