JAVA字符是以unicode处理，但是通过getbytes()方法，看到的是英文是一个byte而中文是三个byte - ITeye问答

问答首页 → 综合技术

0 0

JAVA字符是以unicode处理，但是通过getbytes()方法，看到的是英文是一个byte而中文是三个byte15

可以看出JAVA并不是使用固定长度的字节来编码的，目前我要处理一些固定2个字节16位的字节码，这些字节码在C++中可以用wchar*的方式，在java中如何能正确的转换为JAVA的编码格式，通过utf-8,utf-16,utf-32和其他的中文编码格式，都不能正确的转换，但是我通过手动删除每个字符的第二个字节码，可以转换为正确的JAVA格式，因为一些英文字等没有用到高位字节码，但是如果是用到多字节的字符就会出问题。请问是否有做过该字节码的兄弟请教一下如何转换？？？

举例:47 0 114 0 101 0 115 0 47 0 103 0 97 0 109 0 101 0 47 0 50 0 48 0 48 0 52 0 47 0 0 0
这是从流中读取的字节码了，通过JAVA转码转换为不正常字符串
手动删除高位：47 114 101 115 47 103 97 109 101 47 50 48 48 52 47
转换正确,这是在只用到一个字节的情况下

编码字节码转码 unicode16

2012年3月21日 10:43

appletxx
10
0 0 1

1个答案按时间排序按投票排序

0 0

    不是很明白楼主要问的问题，是要处理固定长度的字节码还是处理指定格式的？
    java.io里有很多处理字节或字符流的类。
    比如如果要处理utf-8格式的字符流，可以利用DataInputStream里的readUTF，类似的，也有处理其他格式的方法。
    如果要处理固定长度的字节码流，可以先read(Bytes[])读取字节流，再进行高低位转换等处理流程后再(char)转换为字符。
    初学者，回答不专业，希望有点用哈。

2012年3月21日 11:58

tobacco5648
10
0 0 0

添加评论

相关推荐

中文转化为unicode格式的方法类: 本文将深入探讨如何将中文字符转换为 Unicode 格式，并介绍一个名为 `unicodeConvert.java` 的 Java 类，该类已通过实际程序验证，确保了其功能的可行性。 Unicode 编码通常采用 UTF-8、UTF-16 或 UTF-32 这样的...

关于JAVA字符编码：Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换: 在Java中，可以通过`String`类和`byte[]`数组的转换方法来进行不同字符编码之间的转换： - **从`String`到`byte[]`**： - `public byte[] getBytes(String charsetName) throws UnsupportedEncodingException` - ...

java_byte与char、String互转: Java的核心设计是基于Unicode的，这意味着无论是内部处理还是外部交互，Java都采用Unicode作为字符的基础表示。然而，在实际应用中，文件存储或网络传输时往往采用字节流的形式。因此，Java需要在Unicode与字节之间...

按byte截取字符串: 本篇文章将详细探讨“按byte截取字符串”这一技术点，并通过两个Java文件——SliceByByteTest.java和SliceByByte.java的实例来阐述其实现方法。首先，我们需要理解字符串在计算机内存中的存储方式。在Java中，字符...

GBK内码字符串转Unicode字符串: GBK（Great Wall Code）是中国大陆广泛使用的汉字编码标准，而Unicode是一个国际化的编码标准，旨在统一全球所有语言的字符表示。 **GBK编码** GBK是GB2312的扩展，GB2312编码主要包含了常用的简体中文字符，GBK则...

JAVA字符编码：Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换: ### JAVA字符编码详解：Unicode, ISO-8859-1, GBK, UTF-8 及其相互转换 #### 一、引言在Java编程中，字符编码的管理和转换是一项基本而又重要的任务。不同的编码标准适用于不同的场景，而理解和掌握这些编码之间...

java 中文字符串，utf-8编码为byte数组的计算过程: 在Java编程语言中，处理中文字符串时，理解字符与字节之间的转换是非常关键的。本文将深入探讨如何将中文字符串转换成UTF-8编码的字节数组，并解析这一过程中的计算步骤。UTF-8是一种广泛使用的Unicode字符编码，它...

关于java按字节截取带有汉字的字符串的解法: 在Java编程语言中，处理带有汉字的字符串时，由于汉字占据多个字节，按照字节进行截取可能会导致汉字被不完整地分割，从而产生乱码。为了解决这个问题，我们需要理解Unicode编码以及如何在Java中正确处理多字节字符...

java字符串的各种编码转换: 根据提供的文件信息，本文将详细解释Java中字符串的不同编码转换方法及原理，并深入探讨每种编码格式的特点。 ### Java字符串的编码转换在Java中，处理不同字符集之间的字符串转换是一项常见任务。尤其是在处理...

Unicode转中文 Unicode字符串转中文编码: 这可以通过`Encoding`类的`GetBytes()`方法实现，先将其他编码的字符串转换为字节数组，然后使用`Encoding.Unicode.GetString()`将其转换为Unicode字符串。示例代码如下： ```csharp string nonUnicodeString = ...

C#字串与Unicode互相转换方法: 在软件开发过程中，经常需要处理不同编码格式的数据，其中 Unicode 是一种常见的字符编码方式，它为每个字符分配一个唯一的数字（即码点），支持世界上几乎所有的书写系统。C# 提供了丰富的字符串处理功能，包括将...

截取如下字符串“java程序教程”的前5个字节,字符串应该为“java程”,截取前6个字符,字符串也应该为“java程”,程序实现之.: 由于Java默认使用Unicode字符编码，每个字符（char）占用2个字节（byte），因此对于中文字符来说，其占用的字节数也通常是2个。在这个特定的题目中，我们关注的是如何从包含中文的字符串中准确截取特定长度的字符...

Java String与Byte类型转换: String是Java中的一个不可变类，用于表示字符串，它是基于Unicode字符集的。Byte类型是Java的八种基本数据类型之一，用于存储8位二进制值，范围是-128到127。 1. **String转Byte**： - **字面量转换**: 直接使用`...

java字符集编码问题: 通过对ISO 8859-1、GB2312/GBK、Unicode和UTF等常见编码的理解，以及Java提供的字符串操作方法（如`getBytes`和`new String`），开发者可以有效地解决实际项目中的字符编码问题，确保应用程序能够正确地处理各种文本...

简单说说JAVA的String和byte[]的关系: - `getBytes()`: `String`类提供了一个`getBytes()`方法来将字符串转换为字节数组。如果不指定字符集，则使用平台默认的字符集进行编码。 - `getBytes(String charsetName)`: 可以通过指定字符集名称的方式进行...

java中常用字符串方法总结: `compareTo()`方法则基于Unicode值比较字符串，返回值表示一个字符串在字典顺序上是否在另一个之前。 4. **字符串长度** `length()`方法返回字符串的长度，即包含的字符数。 5. **字符访问** 字符串是不可变的，...

java字符集: UTF-8编码的每个字符长度可以在1至6个字节之间变化，其中英语字母通常只需要一个字节表示，而汉字则使用三个字节。UTF-8的设计考虑到了节省存储空间的需求，尤其是在含有大量英文字符的文本中，相比Unicode编码能够...

JAVA及相关字符集编码问题: 与`getBytes()`方法相反，这个方法是从字节数组到字符串的转换。 3. `setCharacterEncoding(String charset)` 这是用于设置HTTP请求或响应的字符集编码的方法。在处理客户端发送的请求参数时，如果请求头没有明确...

Java字符编码简介_动力节点Java学院整理: UTF-8是最常见的UTF编码，它在表示英文字符时只需一个字节，而汉字则使用三个字节。这使得UTF-8在处理包含大量英文字符的数据时比Unicode更节省空间。在Java中，字符串内部总是以Unicode编码存储。`getBytes...

Java中字符集的详细介绍: 而中文字符串`s2 = "中国"`，在GBK等非Unicode编码下，每个汉字通常需要两个字节，因此`s2.getBytes().length`的结果为4。在Unicode和UTF-16编码下，无论是英文字符还是汉字，都需要额外的两个字节来表示字节顺序...

Ask-but

我的问答 FAQ | 勋章

相关推荐

已解决问题

未解决问题

排行榜

查看全部排名>>

Global site tag (gtag.js) - Google Analytics