`

Invalid byte 1 of 1-byte UTF-8 sequence

 
阅读更多

问题:

      在解析XML文档时抛出:“Invalid byte 1 of 1-byte UTF-8 sequence.”错误。

 

产生的原因:

      由于XML编码与将XML字符串转换成字节数组(getBytes()方法)时使用编码不一致所导致。

 

实例:

<?xml version='1.0' encoding='UTF-8' ?>
<ROOT>
   <REF>false</REF>
   <MSG>错误信息:指定的信息不存在</MSG>
</ROOT>

 解析该XML的java代码:

public Map<String,Object> parseXMLToMap(String xml){
		Map<String,Object> maps = new HashMap<String,Object>();
		
		try{
			DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
			DocumentBuilder db = dbf.newDocumentBuilder();
			Document doc = db.parse(new ByteArrayInputStream(xml.getBytes()));
			
			Element eleRef = (Element)doc.getElementsByTagName("REF").item(0);
			Element eleMsg = (Element)doc.getElementsByTagName("MSG").item(0);
			
			maps.put("REF", eleRef.getFirstChild().getNodeValue());
			maps.put("MSG", eleMsg.getFirstChild().getNodeValue());
			
			return maps;
		} catch(Exception e){
			e.printStackTrace();
		}
		
		return null;
	}

 注意:Document doc = db.parse(new ByteArrayInputStream(xml.getBytes()));该行代码将要解析的XML字符串以平台默认的字符编码方式转换成一个字节数组,然后创建ByteArrayInputStream对象传递给DocumentBuilder的parse方法进行解析。但是XML文件的encoding='UTF-8',然而windows平台默认编码并非UTF-8,因此产生了乱码。

 

解决办法:

将此行代码Document doc = db.parse(new ByteArrayInputStream(xml.getBytes()));

改成

Document doc = db.parse(new ByteArrayInputStream(xml.getBytes(Charset.forName("UTF-8"))));

问题即可解决。

 

 

 

分享到:
评论

相关推荐

    解决Invalid byte 1 of 1-byte UTF-8 sequence

    2. "xml读取异常Invalid byte 1 of 1-byte UTF-8 sequence-中文版的window下java的默认的编码为GBK.url":这个文件名暗示了解决XML文件读取异常的方法,尤其是在Windows环境下,Java默认的文件编码可能是GBK,这可能...

    php解析xml提示Invalid byte 1 of 1-byte UTF-8 sequence错误的处理方法

    在利用php解析xml时提示Invalid byte 1 of 1-byte UTF-8 sequence错误了,这个问题我百度查实说是编码问题,结果我把编码处理一下果然KO了,下面我来分享一下解决办法

    java.io.UTFDataFormatException(解决方案).md

    UTF-8编码是可变长度的,它以1到4个字节序列的方式表示一个字符。正确的使用UTF-8编码不仅可以避免上述的异常,还可以保证在不同的系统和语言环境中数据的一致性和正确性。 为了解决java.io.UTFDataFormatException...

    iuhyiuhkjh908u0980

    3. **编码问题**:在Windows环境下,使用Ant执行包含UTF-8编码的构建脚本时,可能会遇到`Invalid byte 1 of 1-byte UTF-8 sequence`错误,这通常是因为命令行不支持UTF-8编码。解决办法是将构建脚本改为GBK编码,...

    SQL Server数据迁移至PostgreSQL出错的解释以及解决方案

    本篇文章将深入探讨一个具体的错误:“invalid byte sequence for encoding \"UTF8\": 0x00”,并提供相应的解决方案。 这个错误发生在尝试将包含空字符(0x00)的数据从SQL Server迁移到PostgreSQL时。在SQL ...

    ruby中文文档(ruby入门级别教程)

    1. **Ruby用户指南**:这是学习Ruby的基础,它将引导你了解Ruby的基本语法、数据类型、控制结构、函数、类和模块等概念。通过这本指南,你可以掌握如何在Ruby中编写简单的程序,并逐渐深入到更复杂的编程技巧。 2. ...

    android layout XML解析错误的解决方法

    &lt;?xml version="1.0" encoding="utf-8"?&gt; ``` 如果这一行存在格式问题,如额外的字符、缺失的引号或错误的编码,都可能导致解析错误。有时,即使XML语法没有其他明显错误,这行也可能导致问题。如果删除这行可以...

    LuaUnicode icu-lua

    they come from the closely corresponding ISO standard ISO/IEC 10646-1:2000 and currently differ in that they allow codes outside of the Unicode range, which runs from 0x0 to 0x10FFFF.) Pattern ...

    pyquery报错:UnicodeDecodeError: ‘gbk’ codec can’t decode byte

    当遇到UTF-8编码的文件时,如果使用GBK解码,就会出现“非法多字节序列”的错误,因为UTF-8的某些字节序列在GBK中是无效的。 要解决这个问题,我们可以采取以下步骤: 1. **明确文件编码**:首先,确保你确切知道...

    acpi控制笔记本风扇转速

    Disassembly of raw data buffers with byte initialization data now prefixes each output line with the current buffer offset. Disassembly of ASF! table now includes all variable-length data fields at ...

    k7 SRIO参考例程

    byte-wise writes of CSRs such as the deviceID register and BAR. - Message response transaction received as a user defined packet type using 16-bit device IDs appears as a corrupted packet on the ...

    Bochs - The cross platform IA-32 (x86) emulator

    --enable-sep, --enable-aes, --enable-1g-pages are deprecated and should not be used anymore. - Local APIC configure option --enable-apic is deprecated and should not be used anymore. The LAPIC ...

    Chatlog_Ripper:一个帮助你从聊天记录文件中提取 URL 的小程序

    聊天记录开膛手在 WDI 中,我们共享一切。... 如果您收到错误“in `scan': invalid byte sequence in UTF-8 (ArgumentError)”,只需将您的文本日志解析为可以转换为 UTF-8 的内容(例如 )。 我将来会解决这个问题。

    hibernate常见错误解决方案

    **DOM4J DocumentException: Invalid byte 2 of 2-byte UTF-8 sequence** **异常描述:** 当Hibernate尝试解析一个XML配置文件时,如果文件中的某些字符不符合UTF-8编码规则,就会抛出此类异常。 **解决方法:** ...

    The Art of Assembly Language Programming

    You are visitor as of October 17, 1996. The Art of Assembly Language Programming &lt;br&gt;Forward Why Would Anyone Learn This Stuff? 1 What's Wrong With Assembly Language 2 What's Right With ...

    msp430 C语言例程

    ADC12, Repeated Sequence of Conversions ADC12, Repeated Single Channel Conversions ADC12, Using 10 External Channels for Conversion ADC12, Sequence of Conversions (non-repeated) ADC12, Sample A10 Temp...

    doctest:Haskell的python doctest的实现

    Doctest:测试交互式Haskell示例doctest是一个小程序,用于检查。 它与相似,。安装可以从获得doctest 。 通过键入以下内容进行安装: cabal install doctest确保Cabal的bindir在您的PATH 。 在Linux上: export ...

    eac3to V3.17

    * added support for MKV "SRT/UTF8", "SRT/ASCII", "ASS" and "SSA" subtitles * increased some internal buffers to avoid AC3 overflow in the "thd ac3 joiner" * fixed: frame counting didn't work for MKV ...

Global site tag (gtag.js) - Google Analytics