工作中需要这样的功能,下面是实现代码,比如输入“朋友”,输出/u0b67/ucb53
public class UnicodeByteUtil {
public static void main(String[] args) {
UnicodeByteUtil instance = new UnicodeByteUtil();
BufferedReader reader = new BufferedReader(new InputStreamReader(System.in));
String line;
try {
while ((line = reader.readLine()) != null) {
if (line.trim().equals("q")) System.exit(0);
String s = instance.getBytes(line);
System.out.println("bytes:" s);
//System.out.println("line:" );
}
} catch (IOException e) {
e.printStackTrace();
}
}
String getBytes(String s) {
try {
StringBuffer out = new StringBuffer("");
byte[] bytes = s.getBytes("unicode");
for (int i = 2; i < bytes.length; i ) {
out.append("\\u");
String str = Integer.toHexString(bytes[i 1] & 0xff);
for (int j = str.length(); j < 2; j ) {
out.append("0");
}
out.append(str1);
}
return out.toString();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
return null;
}
}
}
分享到:
相关推荐
汇编语言中定义字符串形如: szText byte '这不是一颗流星',0 在程序中这个字符串的是...masm32软件包中的ucmacros.asm中有两个定义Unicode字符串的宏,但却不支持汉字。此文件中的WSTR和UText两个宏弥补了这个不足。
本文将深入探讨标题和描述中提到的“Unicode转中文”以及“字符串转Unicode”的相关知识点。 首先,Unicode是一种国际标准的字符编码体系,旨在统一全球所有语言的字符表示,它包含了几乎世界上所有的文字和符号。...
本篇文章将详细探讨“按byte截取字符串”这一技术点,并通过两个Java文件——SliceByByteTest.java和SliceByByte.java的实例来阐述其实现方法。 首先,我们需要理解字符串在计算机内存中的存储方式。在Java中,字符...
字符串是由Unicode字符组成的序列,每个字符在计算机内部通常用16位(2个字节)来表示,可以是英文、数字、标点符号,甚至是中文等多语言字符。十六进制是一种逢16进1的方式,用于表示二进制数,它使用0-9和A-F这16...
C# 提供了丰富的字符串处理功能,包括将字符串与 Unicode 编码进行转换的能力。本文将详细介绍如何在 C# 中实现字串与 Unicode 的相互转换,并通过具体的代码示例来展示这一过程。 #### 一、C# 字串转 Unicode 方法...
这个函数`SafeSubstring`接收字符串S、起始字节位置StartByte和截取的字节数LenBytes,返回一个从指定字节位置开始,长度为LenBytes字节的新字符串。注意,这个函数假设输入的都是有效的字节位置,没有进行边界检查...
接下来,我们可以编写一个名为`GetChineseStringLength`的函数,该函数接受一个字符串参数,返回该字符串中中文字符的数量。以下是一个可能的实现: ```vb Function GetChineseStringLength(ByVal strInput As ...
GBK编码的字符串转换为Unicode字符串的过程,通常涉及以下几个步骤: 1. 首先,读取GBK编码的字节流。 2. 使用GBK解码器将GBK编码的字节解码为字符。这一步会得到一个基于GBK编码的字符序列。 3. 将GBK编码的字符...
4. **`public String fromUnicodeBytes(byte[] bytes, Charset charset)`**:此方法将按照指定的字符集(如 UTF-8)解码字节数组,返回原始中文字符串。 在实际应用中,`unicodeConvert.java` 类可能会包含异常处理...
在Java编程语言中,处理带有汉字的字符串时,由于汉字占据多个字节,按照字节进行截取可能会导致汉字被不完整地分割,从而产生乱码。为了解决这个问题,我们需要理解Unicode编码以及如何在Java中正确处理多字节字符...
总之,处理中英混合字符串,特别是涉及中文截取时,需要理解字符编码,尤其是Unicode的工作原理,以及如何在不同编码间进行转换。通过适当的方法,我们可以确保截取的字符串保持完整性和可读性,避免在处理多语言...
// 如果没有匹配的子串(例如,字节长度小于实际字符数),返回整个字符串 return input; } } // 示例用法: string truncatedStr = CutOffStringByByteLength(str, 10, Encoding.UTF8); ``` 需要注意的是,这...
C/C++字符串一般通过char* 或wchar_t*来表示,char*表示的是ANSCII字符串, wchar_t*表示Unicode字符串,Unicode字符串在C/C++中一个字符占用两个字节,ANSII字符串一个字符占用一个字节(中文占用两个字节), ...
19. 字符串编码函数:`encode(data bytea, type text)` 该函数用于将二进制数据编码为只包含 ASCII 形式的数据。例如,`encode('123\000\001', 'base64')`将返回`'MTIzAAE='`。 20. 字符串首字母大写函数:`...
### 转换带十六进制Unicode编码字符串文件的Java程序 #### 一、背景介绍 在处理文本数据时,经常会遇到不同格式的编码问题,其中Unicode编码是一种广泛使用的字符编码标准,它能够支持世界上几乎所有的字符集。...
将字节数组转换回字符串,同样使用`StrConv`函数,但这次将`Conversion`设置为`vbUnicode`(对于非ASCII字符)或`vbFromUnicode`(对于ASCII字符)。由于VB6.0默认使用Unicode编码,因此通常使用`vbUnicode`。 示例...
在Java中,`String`类的构造函数`new String(byte[], charsetName)`用于将字节数组按照指定的字符集转换为字符串。例如,`new String(bs, "utf-8")`将字节数组`bs`解码为UTF-8编码的字符串。`substring`方法用于从...
最后,jieQu方法返回截取后的字符串,并在main方法中通过调用jieQu方法,传入特定的字符串和长度值,输出最终截取的结果。 总结来说,处理包含中文的字符串截取问题,不能仅仅依赖于字符串级别的操作,而需要对字节...
但是,Java的字符串是Unicode的,`getBytes()`会根据指定的字符集编码字符串为字节数组。例如: ```java String str = "你好,世界"; int byteCount = 5; // 指定字节数 byte[] bytes = str.getBytes("UTF-8"); // ...
// 去除可能的填充部分,返回异或后的字符串 int unpaddedLength = resultBytes.Length / 2; return Encoding.Unicode.GetString(resultBytes.Take(unpaddedLength).ToArray()); } ``` 上述代码首先通过`...