`

[转]java 类里判断字符串是iso-8859-1还是gb2312,utf-8,gbk等,判断编码类型

 
阅读更多
System.out.println(java.nio.charset.Charset.forName("GB2312").newEncoder().canEncode("张三"));
System.out.println(java.nio.charset.Charset.forName("ISO-8859-1").newEncoder().canEncode("张三"));


第一个输出true
第二个输出false

分享到:
评论
1 楼 guyinyihun 2018-01-25  
好用,谢谢分享

相关推荐

    ISO-8859.docx

    判断是否为UTF-8的方法是基于ISO-8859-1编码转换为UTF-8后字符串长度的变化。因为ISO-8859-1是单字节编码,转换为UTF-8后,单字节的字符长度不变,但多字节字符会变成多个字节,所以长度会有变化。 在Web应用开发中...

    java获取字符串编码类型代码(导入直接查看结果)

    常见的编码类型有ASCII、ISO-8859-1、UTF-8、GBK等。在某些场景下,我们需要确定字符串的具体编码类型,比如读取未知编码格式的文件或处理来自不同源的数据。下面我们将详细探讨如何在Java中检测和获取字符串的编码...

    多种语言(big5\gbk\gb2312\utf8\Shift_JIS\iso8859-1)的网页编码切换解决方案归纳

    不同的语言字符集有着不同的编码标准,常见的编码包括big5、gbk、gb2312、utf8、Shift_JIS、iso8859-1等。为了确保网页能够正确地展示各种语言,就需要一种有效的编码切换解决方案。 首先,Web服务器发送给客户端的...

    java_character-set.rar_java Character

    常见的字符集有ASCII、ISO-8859-1、GBK、UTF-8等。在Java中,最基础的字符集是Unicode,它包含了世界上几乎所有的字符,提供了统一的编码方式。 Java的`Character`类是处理字符的核心工具。它提供了许多方法,如...

    实例讲解JSP内置对象

    要正确处理汉字,我们需要将获取的字符串先转换为ISO-8859-1编码的字节数组,然后用正确的字符集(如GBK或UTF-8)解码。在tree2.jsp的例子中,这段代码展示了如何解决这个问题: ```java String textContent = ...

    网页编码解析包(chardet.jar,cpdetector_1.0.7.jar)

    Chardet支持多种常见的字符编码,包括ASCII、ISO-8859-1、UTF-8、GB2312、GBK等,以及一些更复杂的多字节编码如Big5、EUC-JP等。 接下来是 `cpdetector_1.0.7.jar`,这是另一个字符集检测工具,全称为“Charset ...

    Struts原理与实践 ——

    需要注意的是,某些Web容器(例如Tomcat 4.x)在处理接收到的请求字符串时,默认采用ISO-8859-1作为编码方式。 ##### 2. 多字节字符集与单字节字符集 - **多字节字符集**(MultiByte Charsets):主要用于表示非...

    java中文传值乱码问题的解决方法

    首先,使用`URLEncoder.encode()`方法将字符串按照UTF-8编码,然后在插入数据前,再使用相应的解码方式,如`new String(value.getBytes("iso-8859-1"), "UTF-8")`,将编码后的数据转换回UTF-8,确保字符集的一致性。...

    2014年Java最全面试题以及答案.

    29. 编码转换,怎样实现将GB2312编码的字符串转换为ISO-8859-1编码的字符串? 可以使用String类的构造器,指定目标编码来创建一个新的字符串对象。 30. Strings=new String("xyz");创建了几个String Object? 这句话...

    一段检测字节数组的编码方式的代码

    这种检测过程通常涉及比较字节模式与已知编码的特征,如ASCII、UTF-8、GBK、ISO-8859-1等。 编码检测通常涉及以下几个步骤: 1. **预处理**:首先,可能需要对字节数组进行一些基本的清理或过滤,以去除可能影响...

    core java 小结

    它包括ASCII、ISO8859-1、GBK(GB2312)等编码,其中,中文字符在Unicode中占用3个字节。Unicode与UTF的关系在于,UTF是Unicode的传输格式,用于网络传输。 #### 九、Boolean类型与逻辑运算 Java中的`boolean`类型...

    CharsetUtil.zip_Java编程_Java_

    1. **字符集检测**:除了自动检测UTF-8,它可能还支持其他常见字符集,如GBK、ISO-8859-1等,通过分析字节序列来确定最合适的字符集。 2. **解码方法**:`decode()`函数可能接受字节数组和字符集作为参数,返回解码...

    FF浏览器和IE下载文件乱码问题的解决方法

    - 如果不是IE浏览器,将文件名先转换为UTF-8字节,然后用`iso8859-1`编码,这是许多老式系统和浏览器默认的编码,可以保证在Firefox和其他浏览器中的正确显示。 5. **使用示例:** 在实际应用中,当需要提供文件...

    execl导出工具类

    fileName = new String(fileName.getBytes(encoding), "iso8859-1"); response.setHeader("Content-disposition", "attachment;filename=" + fileName + ".xls"); ``` - **检测浏览器类型**:通过获取`user-agent`...

    txt文档阅读器

    //即返回字符串在GBK、UTF-8和ISO8859-1编码下的byte数组表示 //目的在于把m_mbBufEnd改成指向下一行 } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e....

    通过过滤器(Filter)解决JSP的Post和Request中文乱码问题

    将从GET请求中获取的参数先转换为字节码(使用ISO-8859-1编码),然后再解码为字符串(使用GBK编码)。这样做是因为GET请求中的参数通常以URL编码形式存在,需要进行正确的解码才能正确显示中文。 4. destroy方法:...

    common_utils:项目常用工具类

    - `EncodingUtils`:字符编码转换,如GBK、UTF-8等。 11. **反射与注解**: - `ReflectionUtils`:动态获取类、字段、方法信息,以及调用方法等。 - `AnnotationUtils`:处理和解析注解。 12. **日志记录**: ...

Global site tag (gtag.js) - Google Analytics