`

返回中文unicode的byte字符串

    博客分类:
  • J2SE
阅读更多
工作中需要这样的功能,下面是实现代码,比如输入“朋友”,输出/u0b67/ucb53

public class UnicodeByteUtil {
public static void main(String[] args) {
UnicodeByteUtil instance = new UnicodeByteUtil();
BufferedReader reader = new BufferedReader(new InputStreamReader(System.in));
String line;
try {
while ((line = reader.readLine()) != null) {
if (line.trim().equals("q")) System.exit(0);
String s = instance.getBytes(line);
System.out.println("bytes:" s);
//System.out.println("line:" );
}
} catch (IOException e) {
e.printStackTrace();
}
}

String getBytes(String s) {
try {
StringBuffer out = new StringBuffer("");
byte[] bytes = s.getBytes("unicode");
for (int i = 2; i < bytes.length; i ) {
out.append("\\u");
String str = Integer.toHexString(bytes[i 1] & 0xff);
for (int j = str.length(); j < 2; j ) {
out.append("0");
}
out.append(str1);
}
return out.toString();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
return null;
}
}
}


分享到:
评论

相关推荐

    汇编语言中定义Unicode汉字字符串的宏

    汇编语言中定义字符串形如: szText byte '这不是一颗流星',0 在程序中这个字符串的是...masm32软件包中的ucmacros.asm中有两个定义Unicode字符串的宏,但却不支持汉字。此文件中的WSTR和UText两个宏弥补了这个不足。

    Unicode转中文 Unicode字符串 转中文编码

    本文将深入探讨标题和描述中提到的“Unicode转中文”以及“字符串转Unicode”的相关知识点。 首先,Unicode是一种国际标准的字符编码体系,旨在统一全球所有语言的字符表示,它包含了几乎世界上所有的文字和符号。...

    按byte截取字符串

    本篇文章将详细探讨“按byte截取字符串”这一技术点,并通过两个Java文件——SliceByByteTest.java和SliceByByte.java的实例来阐述其实现方法。 首先,我们需要理解字符串在计算机内存中的存储方式。在Java中,字符...

    C# 字符串转十六进制串,16进制反向转回原字符串

    字符串是由Unicode字符组成的序列,每个字符在计算机内部通常用16位(2个字节)来表示,可以是英文、数字、标点符号,甚至是中文等多语言字符。十六进制是一种逢16进1的方式,用于表示二进制数,它使用0-9和A-F这16...

    C#字串与Unicode互相转换方法

    C# 提供了丰富的字符串处理功能,包括将字符串与 Unicode 编码进行转换的能力。本文将详细介绍如何在 C# 中实现字串与 Unicode 的相互转换,并通过具体的代码示例来展示这一过程。 #### 一、C# 字串转 Unicode 方法...

    delphi 实现截取字符串中中文+英文混合截取

    这个函数`SafeSubstring`接收字符串S、起始字节位置StartByte和截取的字节数LenBytes,返回一个从指定字节位置开始,长度为LenBytes字节的新字符串。注意,这个函数假设输入的都是有效的字节位置,没有进行边界检查...

    获取中文字符串长度的函数(VB6.0代码编写)

    接下来,我们可以编写一个名为`GetChineseStringLength`的函数,该函数接受一个字符串参数,返回该字符串中中文字符的数量。以下是一个可能的实现: ```vb Function GetChineseStringLength(ByVal strInput As ...

    GBK内码字符串转Unicode字符串

    GBK编码的字符串转换为Unicode字符串的过程,通常涉及以下几个步骤: 1. 首先,读取GBK编码的字节流。 2. 使用GBK解码器将GBK编码的字节解码为字符。这一步会得到一个基于GBK编码的字符序列。 3. 将GBK编码的字符...

    中文转化为unicode格式的方法类

    4. **`public String fromUnicodeBytes(byte[] bytes, Charset charset)`**:此方法将按照指定的字符集(如 UTF-8)解码字节数组,返回原始中文字符串。 在实际应用中,`unicodeConvert.java` 类可能会包含异常处理...

    关于java按字节截取带有汉字的字符串的解法

    在Java编程语言中,处理带有汉字的字符串时,由于汉字占据多个字节,按照字节进行截取可能会导致汉字被不完整地分割,从而产生乱码。为了解决这个问题,我们需要理解Unicode编码以及如何在Java中正确处理多字节字符...

    C++中英混合字符串截取

    总之,处理中英混合字符串,特别是涉及中文截取时,需要理解字符编码,尤其是Unicode的工作原理,以及如何在不同编码间进行转换。通过适当的方法,我们可以确保截取的字符串保持完整性和可读性,避免在处理多语言...

    C# 按照字节长度截取字符串

    // 如果没有匹配的子串(例如,字节长度小于实际字符数),返回整个字符串 return input; } } // 示例用法: string truncatedStr = CutOffStringByByteLength(str, 10, Encoding.UTF8); ``` 需要注意的是,这...

    C#调用C/C++DLL收取中文字符处理

     C/C++字符串一般通过char* 或wchar_t*来表示,char*表示的是ANSCII字符串, wchar_t*表示Unicode字符串,Unicode字符串在C/C++中一个字符占用两个字节,ANSII字符串一个字符占用一个字节(中文占用两个字节), ...

    ORACLE字符串函数

    19. 字符串编码函数:`encode(data bytea, type text)` 该函数用于将二进制数据编码为只包含 ASCII 形式的数据。例如,`encode('123\000\001', 'base64')`将返回`'MTIzAAE='`。 20. 字符串首字母大写函数:`...

    转换带十六进制Unicode编码字符串文件的Java程序文.pdf

    ### 转换带十六进制Unicode编码字符串文件的Java程序 #### 一、背景介绍 在处理文本数据时,经常会遇到不同格式的编码问题,其中Unicode编码是一种广泛使用的字符编码标准,它能够支持世界上几乎所有的字符集。...

    vb6.0 字节数组和字符串的相互转换.rar

    将字节数组转换回字符串,同样使用`StrConv`函数,但这次将`Conversion`设置为`vbUnicode`(对于非ASCII字符)或`vbFromUnicode`(对于ASCII字符)。由于VB6.0默认使用Unicode编码,因此通常使用`vbUnicode`。 示例...

    java实现十六进制字符unicode与中英文转换示例

    在Java中,`String`类的构造函数`new String(byte[], charsetName)`用于将字节数组按照指定的字符集转换为字符串。例如,`new String(bs, "utf-8")`将字节数组`bs`解码为UTF-8编码的字符串。`substring`方法用于从...

    截取如下字符串“java程序教程”的前5个字节,字符串应该为“java程”,截取前6个字符,字符串也应该为“java程”,程序实现之.

    最后,jieQu方法返回截取后的字符串,并在main方法中通过调用jieQu方法,传入特定的字符串和长度值,输出最终截取的结果。 总结来说,处理包含中文的字符串截取问题,不能仅仅依赖于字符串级别的操作,而需要对字节...

    字符串按照指定的字节数来截取

    但是,Java的字符串是Unicode的,`getBytes()`会根据指定的字符集编码字符串为字节数组。例如: ```java String str = "你好,世界"; int byteCount = 5; // 指定字节数 byte[] bytes = str.getBytes("UTF-8"); // ...

    实现字符串异或操作

    // 去除可能的填充部分,返回异或后的字符串 int unpaddedLength = resultBytes.Length / 2; return Encoding.Unicode.GetString(resultBytes.Take(unpaddedLength).ToArray()); } ``` 上述代码首先通过`...

Global site tag (gtag.js) - Google Analytics