`
nirvana1988
  • 浏览: 137697 次
  • 性别: Icon_minigender_1
  • 来自: 郑州
社区版块
存档分类
最新评论

解读GBK编码格式下的" "(类似于空格)的字符

 
阅读更多

     今天同事在解析用户上传的excel表格时,发现有的数据后面带了" "这个字符,以为是空格,无论怎么trim都搞不掉,晚上抽了点时间研究了下这个特殊的字符。

       具体代码如下:

     

 String str = " "; //把特殊字符单独拿出来定义成String类型

 char[] c = str.toCharArray();//转化成f字符数组
 for(int i=0;i<c.length;i++) 
 {  System.out.println(c[i]+" : " +Integer.toHexString((int)c[i])); //打印每个字符对应的unicode码制(这里就一个字符),输出为3000

 } 
	  
     //查看unicode码值表,3000对应的为CJK(中日韩)标志和符号,已经得知它在GBK编码下表现为空格样式,换用日文编码解析一下
	  
	  str  = new String(str.getBytes("Shift_JIS"));
      System.out.println(str);  //打印出来为"丂",日文下读作"kao  第四声",意思为弯曲的钉子

  

分享到:
评论

相关推荐

    javascript 判断是否GBK编码

    在JavaScript中,判断一个字符串是否属于GBK编码是一个常见的需求,特别是在处理中文字符集时。...总的来说,理解和判断GBK编码在JavaScript中的应用是处理中文字符集问题的重要一环,尤其在网络传输和多语言环境下。

    IDEA编码GBK不可映射字符解决方法

    IDEA编码GBK不可映射字符解决方法 IDEA是一款功能强大且广泛应用的集成开发环境(Integrated Development Environment),它提供了大量实用的功能来提高开发效率和代码质量。但是,在使用IDEA时,开发者可能会遇到...

    cxf3.2.0编码GBK的不可映射字符问题

    在Java中,默认的字符编码是UTF-8,而GBK是一个中文常用的编码格式,它包含了更多的中文字符。当XML或者HTTP请求的数据采用GBK编码,而CXF服务端按照UTF-8进行解码时,如果数据中存在GBK编码下无法映射到Unicode的...

    GBK字符集编码表

    ### GBK字符集编码表详解 #### 一、概述 GBK是中文内码扩展规范,是一种简体中文字符集编码方案。它是在GB2312的基础上进行扩展,增加了对更多的汉字以及符号的支持,旨在更好地满足中文信息化处理的需求。本文将...

    ant打包时编码 GBK 的不可映射字符.txt

    本文将详细介绍当使用Ant进行项目打包时,遇到GB2312(GBK)编码下不可映射字符问题的原因及解决方案。 #### 问题现象 在使用Ant构建Java项目的过程中,如果项目中包含了中文注释或其他非ASCII字符,并且项目的...

    cxf2.7.18编码GBK的不可映射字符问题

    这个问题通常出现在使用GBK编码处理非GBK编码的数据时,导致字符无法正确显示或引发异常。 标题中的“cxf2.7.18编码GBK的不可映射字符问题”直指Apache CXF 2.7.18版本在处理GBK编码时遇到了问题。GBK是一种扩展的...

    Unicode编码转GBK编码(汉字转GBK)

    在网上找资料很少有汉字直接转GBK编码格式,一般都是汉字转Unicode编码,这套是将汉字先转换成Unicode编码,在通过参照表得出汉字的GBK编码数据。虽然是一个js文件,但是加以修改可以用于很多平台上如:小程序,...

    url编码gbk格式

    GBK编码在中文环境下比较常见,但在国际化的应用中,UTF-8因其更广泛的字符支持而被更广泛使用。因此,理解各种编码方式之间的转换和适应性,是提升程序兼容性和健壮性的关键。 总结来说,这个压缩包提供的工具类...

    GBK编码转换汉字,汉字转换GBK编码,VC代码实现

    GBK编码是GB2312编码的扩展,用于表示更多的汉字和符号,是简体中文环境下广泛使用的一种字符编码。VC++,作为Microsoft的C++开发环境,提供了丰富的库支持来处理这种编码转换。本篇文章将深入探讨如何在VC++环境中...

    C++实现判断一个字符串是否为UTF8或GBK格式的方法

    本文实例讲述了C++实现判断一个字符串是否为UTF8或GBK格式的方法。分享给大家供大家参考,具体如下: 在处理外部数据的时候,很可能因为数据格式不一样而导致乱码,甚至导致某些程序挂掉。鉴于对多数系统来说,使用...

    GBK字符集(汉字完整版)

    - **与UTF-8比较**: UTF-8是一种通用的多字节编码格式,能够支持世界上几乎所有语言的文字,而GBK只针对中文。 - **与GBK18030比较**: GBK18030是在GBK基础上进一步扩展的字符集,包含了更多的少数民族文字。 #### ...

    GBK编码表GBK编码表

    **GBK编码**,全称为“汉字内码扩展规范”,是中国国家技术监督局于1995年发布的国家标准GB 18030-1995《信息技术中文编码字符集》的一个组成部分。该标准是在GB2312编码基础上进行的扩展,主要目的是为了支持更多的...

    js实现GBK编码

    在处理中文字符集时,我们经常会遇到编码问题,尤其是当服务器与客户端使用不同的字符编码标准时,如GBK(国标扩展编码)和UTF-8(万国码)。GBK编码是中国大陆使用的一种广泛的标准,它包含了GB2312中的所有汉字,...

    C语言字符编码转换UNICODE、GBK、UTF-8互相转换

    GBK编码使用两个字节来表示一个字符,与UNICODE相比,它不是全球通用的,主要用于中文环境。 UTF-8是一种变长的编码方式,它可以使用1到4个字节来表示一个字符。对于ASCII字符,UTF-8使用单个字节,而对于其他...

    c语言gbk、utf8转换编码表及函数

    GBK和UTF-8是两种常见的字符编码格式,它们各有特点并应用于不同的场景。本篇将详细介绍GBK与UTF-8编码的区别,以及如何在C语言中进行这两种编码的转换。 1. **GBK编码** - GBK是中国大陆广泛使用的汉字编码标准,...

    c语言利用编码转换表实现gbk与unicode互转

    在实际应用中,你可能还需要考虑字符串的编码格式,如UTF-8、UTF-16等。GBK是单字节编码,而Unicode的UTF-8形式是多字节的,因此在读取或写入文件时,需要正确处理这些编码的边界和结束标志。 最后,为了提高效率,...

    UTF-8/GBK编码转换工具

    UTF-8和GBK是两种常见的字符编码格式,它们各自有特定的应用场景和特点。这篇内容将深入讲解UTF-8与GBK编码,以及如何进行编码转换。 UTF-8(Unicode Transformation Format - 8 bit)是一种基于Unicode字符集的变...

    STM32 MDK utf8 gbk编码转换

    类似地,`utf8_to_gbk`函数则相反,首先解析UTF-8编码的字节序列得到Unicode码点,再根据GBK编码规则转换为GBK编码的字符串。 在实际应用中,你可能需要在STM32的程序中调用这些转换函数,例如在接收网络数据时,先...

    字符工具V1.6.zip UTF8 unicode GBK字符格式互相转换 空格剔除 换行剔除 和校验 异或校验

    字符工具V1.6是一款集成了UTF-8、unicode(UCS-2/UTF-16)和GBK字符格式互相转换功能的实用软件,同时具备空格剔除、换行剔除以及和校验和异或校验的高效工具。本文将详细介绍这些核心知识点。 首先,我们要了解...

Global site tag (gtag.js) - Google Analytics