本文来自:http://blog.csdn.net/hellogv/ ,转载必须注明出处!
大家都知道,一个汉字等于两个byte的大小。二进制数据通过网络传输时,如果两个byte都超过128则会合并成一个Unicode(汉字)字符,本文的代码主要实现的功能是:把这些汉字拆分为byte,然后重新变为ASCII类型的字符串。
-
publicstaticStringChineseToASCII(byte[]rec){
-
ByteArrayInputStreambais=newByteArrayInputStream(rec);
-
DataInputStreamdis=newDataInputStream(bais);
-
StringBTS=null;
-
try{
-
BTS=newString(rec,"ISO8859-1");
- bais.close();
- dis.close();
-
}catch(Exceptione){
- e.printStackTrace();
- }
-
returnBTS;
- }
-
-
-
publicstaticvoidmain(String[]args){
-
Stringsource="一二三四五六七八九十";
- System.out.println(source.length());
- Stringtarget=ChineseToASCII(source.getBytes());
- System.out.println(target);
- System.out.println(target.length());
- }
结果是:
compile:
run:
10
???????????ù??°????? ASCII字符如果超过128,则会显示为?,但是其本身的值不变
20
BUILD SUCCESSFUL (total time: 1 second)
分享到:
相关推荐
总结起来,Java中实现整句汉字拆分并转换为ASCII字符主要是通过将汉字的字节序列转换为`ISO8859-1`编码,这样每个汉字的两个字节就会分别对应到一个ASCII字符,超出ASCII范围的字节将被转换为问号。这种方法虽然简单...
在编程领域,尤其是在Java语言中,将数字转换为大写汉字是常见的需求,尤其是在财务、会计等场景下,为了满足规范和格式要求。这个过程通常称为数字汉字转换,它涉及到字符编码、字符串处理以及数学运算等多个方面的...
在标签中,“源码”意味着可能会涉及具体的编程代码示例,这通常包括使用某种编程语言(如C++、Python或Java)来编写函数,实现字符到16进制的转换函数和16进制到字符的解码函数。“工具”可能指的是存在一些现成的...
总结来说,搜索引擎中的搜索字符与汉字转换是通过字符编码和URL编码技术实现的,这一过程涉及到Unicode、UTF-8、GB系列编码等概念,以及Java中处理字符编码的相关API。了解并掌握这些知识,对于理解和解决与字符编码...
例如,空格被转换为`+`,汉字等多字节字符则会被拆分为多个连续的百分号编码。 2. **`toUtf8String`方法** 这个方法用于将包含汉字的字符串转换为URL编码格式。首先,它遍历输入字符串`s`中的每个字符。如果字符是...
五笔码是一种汉字输入法,通过将汉字拆分成基本的笔画和部首,然后用数字键来代表这些部分,从而实现快速输入。五笔码输入法对于熟悉其规则的用户来说,打字速度通常比拼音输入法更快。这个应用程序能将汉字转换成...
TXT文件是一种纯文本格式,只包含ASCII字符,因此我们将搜狗词库中的每个条目拆分成单词、拼音等部分,然后按照某种约定(如每行一个词,或者每个词后面跟上其拼音和词性)写入TXT文件。这里可以使用`PrintWriter`或...
3. **处理24点阵字库**:将需要打印的中文文本转换为24点阵字模。这通常涉及将每个汉字拆分成24x24的像素矩阵,然后以打印机能理解的格式(如ESC/POS指令集)发送。 4. **发送打印命令**:通过Java代码调用`ts24....
除了内码转换器软件,还有一些编程语言提供了内置的编码转换函数,如Python的`codecs`库,Java的`Charset`类等。开发者也可以通过编程实现编码转换,但这需要对字符编码有深入的理解,包括字节流、字节序、字符集等...
例如,“中文”在GB2312编码下的表示为“d6d0 cec4”,在ISO 8859-1中的表示形式则是将其拆分为四个独立的字节:“d6 d0 ce c4”。 **2.2 GB2312/GBK** GB2312是中国大陆使用的一种双字节编码标准,专门用于表示...
这意味着 Java 源文件会被编译器按照系统默认编码读取,然后转换为 Unicode 编码保存。例如,使用 javac 命令编译时,会将所有的字符转化为 Unicode 格式存储。 在运行时,JVM 使用 Unicode 进行字符编码。这意味着...
在IT领域,尤其是在编程中,将字符串转换成汉字或汉字转换为其他形式(如二进制)是一项常见的任务。这通常涉及到字符编码的理解和使用,其中最常用的编码格式包括ASCII、Unicode(包括UTF-8、UTF-16等)以及GBK等。...
例如,如果字符串"00111100 11110000"是两个字节的二进制表示,可以将其拆分为两部分,然后转换为整数,最后将这两个整数放入byte数组中。 2. **ArrayList或LinkedList实现FIFO队列**: 在Java中,ArrayList和...
这个问题的根源在于Java和Android默认使用不同的字符编码,如GBK或UTF-8,而十六进制转换通常基于ASCII,不包含全部Unicode字符,特别是中文字符。 在给定的代码示例中,`StringToSixthUtils` 类提供了两个静态方法...
- `-8`: 将 Unicode 字符转换为 ASCII 输出,以便中文字符正确显示,而不是 `uXXXX` 形式的编码。 - `-nl`: 将字符串拆分成多行输出,提高代码的可读性。 - `-ff`: 数据成员在方法之前显示,更符合常规编程习惯。 - ...
当遇到无法表示的字符时,如中文的“中文”,ISO8859-1会将其拆分为多个字节来表示,这可能导致乱码问题。 GB2312和GBK是中国国家标准编码,用于表示汉字,它们是双字节编码,兼容ASCII,但GBK扩展了GB2312,能够...
- **拆分**: 将32位浮点数按照IEEE 754格式拆分为两个16位的整数。 - **字节顺序转换**:根据目标系统(Big-Endian或Little-Endian)进行字节顺序转换。 - **发送/接收**:通过Modbus协议发送这两个16位的整数,或者...
这个开源项目源自sourceforge.net,为开发者提供了灵活且高效的方式来处理PDF文档的创建、更新和格式转换。iText不仅支持生成PDF和rtf格式的文档,还具备将XML和HTML文件转化为PDF的功能,大大扩展了其在各种应用...