`
fanguanghui
  • 浏览: 97122 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
最近访客 更多访客>>
社区版块
存档分类
最新评论

JAVA实现整句汉字拆分、转换为ASCII

 
阅读更多
本文来自:http://blog.csdn.net/hellogv/ ,转载必须注明出处!

大家都知道,一个汉字等于两个byte的大小。二进制数据通过网络传输时,如果两个byte都超过128则会合并成一个Unicode(汉字)字符,本文的代码主要实现的功能是:把这些汉字拆分为byte,然后重新变为ASCII类型的字符串。
  1. publicstaticStringChineseToASCII(byte[]rec){//从字节读取内容
  2. ByteArrayInputStreambais=newByteArrayInputStream(rec);
  3. DataInputStreamdis=newDataInputStream(bais);
  4. StringBTS=null;
  5. try{
  6. BTS=newString(rec,"ISO8859-1");//转换编码
  7. bais.close();
  8. dis.close();
  9. }catch(Exceptione){
  10. e.printStackTrace();
  11. }
  12. returnBTS;
  13. }
  14. /**
  15. *@paramargsthecommandlinearguments
  16. */
  17. publicstaticvoidmain(String[]args){
  18. Stringsource="一二三四五六七八九十";
  19. System.out.println(source.length());
  20. Stringtarget=ChineseToASCII(source.getBytes());
  21. System.out.println(target);
  22. System.out.println(target.length());
  23. }
结果是:
compile:
run:
10
???????????ù??°????? ASCII字符如果超过128,则会显示为?,但是其本身的值不变
20
BUILD SUCCESSFUL (total time: 1 second)


分享到:
评论

相关推荐

    JAVA 中实现整句汉字拆分、转换为ASCII实例详解

    总结起来,Java中实现整句汉字拆分并转换为ASCII字符主要是通过将汉字的字节序列转换为`ISO8859-1`编码,这样每个汉字的两个字节就会分别对应到一个ASCII字符,超出ASCII范围的字节将被转换为问号。这种方法虽然简单...

    数字转换成大写,例如:123 转换后:一百二十三

    在编程领域,尤其是在Java语言中,将数字转换为大写汉字是常见的需求,尤其是在财务、会计等场景下,为了满足规范和格式要求。这个过程通常称为数字汉字转换,它涉及到字符编码、字符串处理以及数学运算等多个方面的...

    生僻字与16进制的转换

    在标签中,“源码”意味着可能会涉及具体的编程代码示例,这通常包括使用某种编程语言(如C++、Python或Java)来编写函数,实现字符到16进制的转换函数和16进制到字符的解码函数。“工具”可能指的是存在一些现成的...

    搜索引擎上搜索字符与汉字的转换

    总结来说,搜索引擎中的搜索字符与汉字转换是通过字符编码和URL编码技术实现的,这一过程涉及到Unicode、UTF-8、GB系列编码等概念,以及Java中处理字符编码的相关API。了解并掌握这些知识,对于理解和解决与字符编码...

    java中url汉字编码互相转换实例

    例如,空格被转换为`+`,汉字等多字节字符则会被拆分为多个连续的百分号编码。 2. **`toUtf8String`方法** 这个方法用于将包含汉字的字符串转换为URL编码格式。首先,它遍历输入字符串`s`中的每个字符。如果字符是...

    汉字转拼音码和五笔码(Winform)

    五笔码是一种汉字输入法,通过将汉字拆分成基本的笔画和部首,然后用数字键来代表这些部分,从而实现快速输入。五笔码输入法对于熟悉其规则的用户来说,打字速度通常比拼音输入法更快。这个应用程序能将汉字转换成...

    java 搜狗词库转txt

    TXT文件是一种纯文本格式,只包含ASCII字符,因此我们将搜狗词库中的每个条目拆分成单词、拼音等部分,然后按照某种约定(如每行一个词,或者每个词后面跟上其拼音和词性)写入TXT文件。这里可以使用`PrintWriter`或...

    ts24.lib打印中文java使用

    3. **处理24点阵字库**:将需要打印的中文文本转换为24点阵字模。这通常涉及将每个汉字拆分成24x24的像素矩阵,然后以打印机能理解的格式(如ESC/POS指令集)发送。 4. **发送打印命令**:通过Java代码调用`ts24....

    内码转换器.rar 免安装,

    除了内码转换器软件,还有一些编程语言提供了内置的编码转换函数,如Python的`codecs`库,Java的`Charset`类等。开发者也可以通过编程实现编码转换,但这需要对字符编码有深入的理解,包括字节流、字节序、字符集等...

    java字符集

    例如,“中文”在GB2312编码下的表示为“d6d0 cec4”,在ISO 8859-1中的表示形式则是将其拆分为四个独立的字节:“d6 d0 ce c4”。 **2.2 GB2312/GBK** GB2312是中国大陆使用的一种双字节编码标准,专门用于表示...

    java字符集编码乱码详解

    这意味着 Java 源文件会被编译器按照系统默认编码读取,然后转换为 Unicode 编码保存。例如,使用 javac 命令编译时,会将所有的字符转化为 Unicode 格式存储。 在运行时,JVM 使用 Unicode 进行字符编码。这意味着...

    StrToBin.rar_字符串转汉字

    在IT领域,尤其是在编程中,将字符串转换成汉字或汉字转换为其他形式(如二进制)是一项常见的任务。这通常涉及到字符编码的理解和使用,其中最常用的编码格式包括ASCII、Unicode(包括UTF-8、UTF-16等)以及GBK等。...

    java招聘最新面试题

    例如,如果字符串"00111100 11110000"是两个字节的二进制表示,可以将其拆分为两部分,然后转换为整数,最后将这两个整数放入byte数组中。 2. **ArrayList或LinkedList实现FIFO队列**: 在Java中,ArrayList和...

    Android字符串和十六进制相互转化出现的中文乱码问题

    这个问题的根源在于Java和Android默认使用不同的字符编码,如GBK或UTF-8,而十六进制转换通常基于ASCII,不包含全部Unicode字符,特别是中文字符。 在给定的代码示例中,`StringToSixthUtils` 类提供了两个静态方法...

    jad的使用方法——包括参数的详细介绍

    - `-8`: 将 Unicode 字符转换为 ASCII 输出,以便中文字符正确显示,而不是 `uXXXX` 形式的编码。 - `-nl`: 将字符串拆分成多行输出,提高代码的可读性。 - `-ff`: 数据成员在方法之前显示,更符合常规编程习惯。 - ...

    JAVA及相关字符集编码问题研究分享

    当遇到无法表示的字符时,如中文的“中文”,ISO8859-1会将其拆分为多个字节来表示,这可能导致乱码问题。 GB2312和GBK是中国国家标准编码,用于表示汉字,它们是双字节编码,兼容ASCII,但GBK扩展了GB2312,能够...

    modbus浮点数处理(IEEE754标准)-易语言

    - **拆分**: 将32位浮点数按照IEEE 754格式拆分为两个16位的整数。 - **字节顺序转换**:根据目标系统(Big-Endian或Little-Endian)进行字节顺序转换。 - **发送/接收**:通过Modbus协议发送这两个16位的整数,或者...

    iText操作Pdf简单整理

    这个开源项目源自sourceforge.net,为开发者提供了灵活且高效的方式来处理PDF文档的创建、更新和格式转换。iText不仅支持生成PDF和rtf格式的文档,还具备将XML和HTML文件转化为PDF的功能,大大扩展了其在各种应用...

Global site tag (gtag.js) - Google Analytics