public static String escape(String src) {
int i;
char j;
StringBuffer tmp = new StringBuffer();
tmp.ensureCapacity(src.length() * 6);
for (i = 0; i < src.length(); i++) {
j = src.charAt(i);
if (Character.isDigit(j) || Character.isLowerCase(j)
|| Character.isUpperCase(j))
tmp.append(j);
else if (j < 256) {
tmp.append("%");
if (j < 16)
tmp.append("0");
tmp.append(Integer.toString(j, 16));
} else {
tmp.append("%u");
tmp.append(Integer.toString(j, 16));
}
}
return tmp.toString();
}
/**
* 转化成汉字
*/
public static String unescape(String src) {
StringBuffer tmp = new StringBuffer();
tmp.ensureCapacity(src.length());
int lastPos = 0, pos = 0;
char ch;
while (lastPos < src.length()) {
pos = src.indexOf("%", lastPos);
if (pos == lastPos) {
if (src.charAt(pos + 1) == 'u') {
ch = (char) Integer.parseInt(src
.substring(pos + 2, pos + 6), 16);
tmp.append(ch);
lastPos = pos + 6;
} else {
ch = (char) Integer.parseInt(src
.substring(pos + 1, pos + 3), 16);
tmp.append(ch);
lastPos = pos + 3;
}
} else {
if (pos == -1) {
tmp.append(src.substring(lastPos));
lastPos = src.length();
} else {
tmp.append(src.substring(lastPos, pos));
lastPos = pos;
}
}
}
return tmp.toString();
}
分享到:
相关推荐
字符编码是计算机处理文本的基础,不同的编码方式对字符集的支持程度和表示范围各有不同。本文将深入探讨字符编码转化、libiconv库以及GB18030编码,这些都是在跨平台开发或处理多语言文本时至关重要的概念。 首先...
这些编码方式各有特点,适用范围也不同。例如,ASCII是最基础的编码,只包含128个字符;GBK是针对中文的扩展ASCII,能表示更多的汉字;而UTF-8则是一种变长编码,能表示世界上几乎所有的字符。 在易语言中,进行...
总之,"二维码扫描枪编码字符串转化"涉及了二维码的生成和解析、字符编码转换以及设备与软件的交互等多个方面的技术,是一个实用且具有挑战性的IT应用。通过这一技术,我们可以轻松地将大量的数据以直观的方式呈现,...
常用的字符编码方式有ISO8859-1、GB2312、GBK、Unicode、UTF等。 ISO8859-1是一种单字节编码,表示的字符范围很窄,只能应用于英文字符,无法表示中文字符。例如,字母‘a’的码值为Ox61。但是,由于是单字节编码,...
在编程领域,尤其是在Windows开发中,字符编码是一个重要的概念,涉及到数据的正确显示和处理。在VC/C++环境中,常见的编码格式有ANSI、UTF-8和Unicode。这些编码各有其特点,适用于不同的场景。本篇文章将深入探讨...
字符编码是计算机处理文本的关键部分,它决定了如何将人类可读的字符转化为二进制数据进行存储和传输。在IT领域,尤其是编程和文件处理中,理解不同的字符编码至关重要,因为错误的编码设置可能导致乱码问题。本篇将...
- **ASCII**: 一种早期的字符编码方式,仅支持英文和其他拉丁文字。 - **UTF-8**: 一种常用的Unicode编码方式,可变长度,兼容ASCII,并且能表示Unicode中的所有字符。 ##### 2. 方法 `toTureAsciiStr` 该方法的...
批量字符编码转换则涉及到更复杂的字符集和编码方式。例如,从ASCII到UTF-8的转换,ASCII只能表示有限的字符,而UTF-8是一种通用的多字节编码方式,能表示世界上几乎所有的字符。批量转换对于处理大量文本数据,尤其...
在编程领域,字符集和字符串转换是至关重要...在实际开发中,我们需要根据需求选择合适的字符集和编码方式,以确保数据的准确性和程序的兼容性。同时,熟悉并运用各种转换函数,可以有效地处理多语言环境下的文本数据。
不同的字符编码方式决定了字符占用的字节数,例如ASCII编码只用一个字节表示,而某些多字节编码如GBK或UTF-8则根据字符复杂性使用1至4个字节。 在早期的计算机系统中,由于主要针对英文,ASCII编码成为主流,它定义...
下面将详细介绍如何在C#环境下通过Oracle.NET接口实现将长于4000字符的字符串转化为CLOB类型并存入Oracle数据库的过程。 ### 一、CLOB类型的简介 CLOB是Oracle数据库中用于存储大量文本数据的一种数据类型,它可以...
ubuntu 上将utf8等编码格式转换为shift_jis格式的安装包,共三个enca_1.12-1_i386.deb libenca0_1.12-1_i386.deb librecode0_3.6-17_i386.deb
"字符编码查看器"是一种工具,用于帮助用户识别和理解不同文件或文本中的字符编码方式。这个压缩包“字符编码查看器.rar”很可能包含了一个这样的软件,允许用户查看并分析各种文件的内部编码格式。 字符编码主要有...
在IT行业中,字符编码是一个非常重要的概念,尤其是在处理多语言或者跨平台的数据交换时。"字符转化工具"是一个专门用于转换字符串编码格式的实用程序,它可以帮助开发者解决因编码不匹配导致的乱码问题。标题中的"....
"批量转化文件或者文件夹的字符格式"这个主题涉及到的是如何将大量文件从一种字符编码格式转换为另一种,以确保正确显示和处理文本。在这个场景下,我们看到一个名为"UltraCodingSwitch.exe"的程序,这很可能是一个...
UTF-8是一种广泛使用的多字节字符编码,它能够表示Unicode字符集中的所有字符,包括中文。UTF-8的优势在于对英文字符的效率高,且能很好地支持多种语言,是网络上最常用的编码格式。而GBK(Great Wall Chinese Code...
不同的编码方式决定了字符集的大小和覆盖的字符范围。例如,ASCII只包含英文字符,而GBK则包含了更多的中文字符。UTF-8是一种多字节编码,可以表示世界上大部分语言的字符。 2. 自动检测编码的技术: 工具通常采用...
Base64是一种网络上常用的编码方式,用于将二进制数据转化为可打印的ASCII字符,以便在邮件系统、文本协议等环境下传输。它基于标准的64个字符集,包括大小写字母、数字以及"+"和"/",末尾可能会添加一个或多个等于...
字符编码是计算机处理文本的基础,它将人类可读的字符转换为计算机可处理的二进制数字。在本文中,我们将深入探讨四种重要的字符编码:ASCII、GB2312、Unicode以及UTF-8。 首先,ASCII(美国信息交换标准代码)是最...