package com.convert;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ConvertCode {
/**
* 将汉字转换为Unicode 码
* */
public static String toUnicode(String s) {
String as[] = new String[s.length()];
String s1 = "";
for (int i = 0; i < s.length(); i++) {
as[i] = Integer.toHexString(s.charAt(i) & 0xffff);
s1 = s1 + "\\u" + as[i];
}
return s1;
}
/**
* 将 Unicode 转换为汉字
* */
public static String UnicodeToString(String str) {
Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))");
Matcher matcher = pattern.matcher(str);
char ch;
while (matcher.find()) {
ch = (char) Integer.parseInt(matcher.group(2), 16);
str = str.replace(matcher.group(1), ch + "");
}
return str;
}
public static void main(String[] args) {
System.out.println(toUnicode("程序员"));
System.out.println(UnicodeToString("\u7a0b\u5e8f\u5458"));
}
}
分享到:
相关推荐
下面我们将详细探讨如何用C语言实现数字到Unicode码的转换。 首先,理解Unicode编码的基本概念是必要的。Unicode使用不同的编码方案,如UTF-8、UTF-16和UTF-32。其中,UTF-32是最简单的,因为它为每个字符分配一个...
在处理汉字时,我们经常会将其转换为UTF-8、GBK等编码形式,以便在不同的操作系统和软件环境中进行交换和显示。 在实际应用中,开发者会使用这些对照表来实现汉字与编码之间的转换。例如,在编程中,如果需要查找...
在网上找资料很少有汉字直接转GBK编码格式,一般都是汉字转Unicode编码,这套是将汉字先转换成Unicode编码,在通过参照表得出汉字的GBK编码数据。虽然是一个js文件,但是加以修改可以用于很多平台上如:小程序,...
用于文字编码转换的GB2312转Unicode数据表,用于文字编码转换的GB2312转Unicode数据表
“支持多字节和uincode编码”是Rapidjson的一大特色。在处理不同语言和地区的数据时,多字节编码(如GBK)和Unicode编码(如UTF-8、UTF-16)的兼容性至关重要。Rapidjson不仅能够处理ASCII字符,还能有效地处理非...
Unicode是一种字符编码标准,它包含了世界上几乎所有的字符和符号,包括汉字、日文、希腊字母等,极大地增强了软件的国际化能力。在Delphi XE中,`TIniFiles`使用UTF-16编码格式,这是Unicode的一种实现方式,每个...
本主题聚焦于“UTF-8编码转GBK编码”,这是一个常见的需求,特别是在嵌入式系统如单片机中,由于资源限制,可能需要将UTF-8编码的字符串转换为GBK编码以便正确显示中文字符。 首先,我们要理解UTF-8和GBK这两种编码...
支持中文 utf-8 转 unicode 从网络整理 验证可用 分享给需要的人
UTF8,UINCODE GBK码表,介绍了中文字符部分的区别 , 帮助开发指导使用
问:对Excel文档,替换后的新的字符串如果是超过12位的数值,系统自动将其转换为科学记数格式,如果输入超过15位的数值,系统自动将15位以后的数值转换为“0”。要替换为长串数字(比如身份证号码)怎么办?答:在...
数字识别通常指的是OCR(Optical Character Recognition)技术,能将图像中的数字转换为可编辑的文本;人脸检测则是在图像中定位人脸的位置和大小,是人脸识别的第一步。 在“标签”中,“k210”再次强调了硬件平台...
UINCODE方式编译,支持多国语言输入显示。 在非简体中文环境下使用,自动更换成英文界面,翻译有误的地方请留言指正。 一、脚本客户端(包括但不限于EVAL)部分 1)基本信息 Eval服务端只需要简单的一行代码,...
此数据为csv格式 数据表包含 txt:文字uincode zbh:文字笔画 zyb:文字部首+余笔 zjg:文字结构 zpy:文字拼音 有其它需求可下载详细版 字典数据库-字海字典完整数据-共计98340字
此数据为csv格式 数据表包含 txt:文字uincode zbh:文字笔画 zyb:文字部首+余笔 zjg:文字结构 zpy:文字拼音 有其它需求可下载详细版 字典数据库-字海字典完整数据-共计98340字
此数据为csv格式 数据表包含 txt:文字uincode zbh:文字笔画 zyb:文字部首+余笔 zjg:文字结构 zpy:文字拼音 有其它需求可下载详细版 字典数据库-字海字典完整数据-共计98340字
此数据为csv格式 数据表包含 txt:文字uincode zbh:文字笔画 zyb:文字部首+余笔 zjg:文字结构 zpy:文字拼音 有其它需求可下载详细版 字典数据库-字海字典完整数据-共计98340字
JS美化器 这个小小的美化工具将重新格式化和缩进书签,丑陋JavaScript,解压缩由Dean Edward受欢迎的打包程序打包的脚本,以及对由npm软件包处理的脚本进行部分反混淆处理。 打开尝试一下。 可通过UI使用选项。需要...
此数据为csv格式 数据表包含 zcp:文字 txt:文字uincode val:文字释义 zbh:文字笔画 zyb:文字部首+余笔 zjg:文字结构 zpy:文字拼音 zqu:文字分区 zfy:两分字元 zsp:两分双拼 zms:文字描述 zly:文字来源 zhi:字海来源 ...