`
taojingrui
  • 浏览: 67670 次
  • 来自: ...
社区版块
存档分类
最新评论

text/xml 和 application/xml的字符集编码问题

阅读更多

对于Webservice的应用来说,我们通常都是用UTF-8进行网络传输,但也有通过GBK和GB2312传输的情况,但是在我们Webservice的代码实现中,其实是不用关心具体的传输编码的,因为根据RFC2376的定义,Webservice的引擎(axis,cxf,jaxws..)会根据文件传输的ContentType及XML 声明部分定义的编码自动将网络传输过来的内容(字符串)转换成unicode(jvm运行时的字符串都是以unicode形式存在的)。以下是RFC2376的描述:

 

例子1:

 webservice传输的文件

 Content-type: application/xml; charset="utf-16"
   {BOM}<?xml version="1.0"?> 

XML and MIME processors会按照utf-16编码处理该文件

 

例子2:

 webservice传输的文件

Content-type: application/xml
   <?xml version='1.0'?>

XML processors会按照utf-8编码处理该文件

 

例子3:

 webservice传输的文件

Content-type: application/xml
   <?xml version='1.0' encoding="ISO-10646-UCS-4"?>

 XML processors会按照UCS-4编码处理该文件
 

例子4:

 webservice传输的文件

Content-type: text/xml
   {BOM}<?xml version="1.0" encoding="utf-16"?>

 XML processors会按照us-ascii,而不是utf-16编码处理该文件

 

参考文档:

http://www.ietf.org/rfc/rfc2376.txt

分享到:
评论

相关推荐

    JSP/XML中的contextType大全

    此外,`Content-Type`还可以包含字符集信息,如"text/html; charset=UTF-8",这指明了文本的编码方式。 ### 2. 部分`Content-Type`示例及其应用 #### 2.1 文本与文档类型 - **text/plain**:纯文本文件。 - **text...

    cxf3.2.0编码GBK的不可映射字符问题

    然而,在使用CXF时,可能会遇到各种编码问题,特别是当处理非ASCII字符集,如GBK时。本篇将深入探讨"cxf3.2.0编码GBK的不可映射字符问题",并提供解决方案。 在Java中,默认的字符编码是UTF-8,而GBK是一个中文常用...

    不同字符集编码字符的转换处理

    在IT领域,尤其是在软件开发和系统集成中,字符集编码的转换处理是一项至关重要的技术,尤其是在全球化的背景下,数据在不同系统、不同平台之间传输时,由于字符编码的不同,经常会出现乱码问题。本文将围绕“不同...

    JSP_Servlet 中的汉字编码问题.pdf

    - 在IBM WebSphere Application Server 3.5中,可以通过调整应用服务器的配置来解决汉字编码问题,例如通过修改server.xml文件中的相关属性来设置默认字符集。 #### 五、结语 综上所述,JSP/Servlet中的汉字编码...

    XML1.0规范和Xpress帮助文档

    3. **字符集**:XML文档默认使用UTF-8编码,但也可以声明其他字符集。文档必须能够正确表示世界上各种语言的字符。 4. **文档类型定义(DTD)或XML Schema**:用于定义XML文档的结构和数据类型,确保文档符合预设的...

    Ajax中文乱码问题解决方案

    此外,还需要注意在跨平台、跨语言开发场景下可能遇到的编码问题,例如本示例中提到的GB2312编码,这是一种较早的简体中文编码标准,但在现代Web开发中已较少使用。总之,保持编码一致性是解决中文乱码问题的关键。

    MIME规则文件

    - **8bit**:表示使用8位字符集进行传输,支持更多的字符。 - **Binary**:直接传输二进制数据,不进行任何编码。 #### 五、实际应用场景 在实际应用中,MIME类型的作用非常重要。例如,在Web开发中,服务器通过...

    Oracle8i Oracle8i Application Developer’s Guide - XML Release 3

    8. Oracle 8i 的国际化和本地化:Oracle 8i 支持多种语言和字符集,开发者可以使用 Oracle 8i 来开发基于 XML 的应用程序,支持多种语言和字符集。 9. Oracle 8i 的错误处理机制:Oracle 8i 提供了多种错误处理机制...

    web.xml 详细解析四合一.pdf

    - **XML 头**: 所有的 XML 文件都应以 XML 声明开始,它指定了 XML 的版本和字符集。例如:`&lt;?xml version="1.0" encoding="UTF-8"?&gt;`。 - **DOCTYPE 声明**: 紧随 XML 声明之后,它定义了文档遵循的 DTD 或 ...

    asp.net 服务端代码以 xml utf-8的格式向指定地址post 数据并接收返回值 HttpWebRequest

    UTF-8是一种字符编码,能够支持全球大部分字符集,是网络上最常用的字符编码。 以下是一个简单的ASP.NET服务端代码示例,展示了如何使用`HttpWebRequest`发送XML数据: ```csharp using System; using System.IO; ...

    cxf创建客户端出现GBK编码问题解决的jar

    GBK编码是中文字符集的一种,它扩展了GB2312,包含了更多的汉字,但在处理非GBK字符集的数据时可能会引发“不可映射字符”的错误。 Apache CXF是一个开放源码的服务框架,它允许开发人员通过SOAP、RESTful等Web服务...

    web编码问题小结.doc

    ### Web编码问题详解 在Web开发中,字符编码问题时常困扰开发者,尤其是在处理中文或其它非ASCII字符时。本文档《web编码问题小结》详细总结了Java开发中可能遇到的各种编码问题及其解决方案,覆盖了数据库、Cookie...

    JSP-Servlet中的汉字编码问题-JSP教程

    在Web开发中,尤其是在使用JavaServer Pages (JSP) 和 Servlet 进行页面处理时,字符编码问题是经常遇到的技术难题之一。本文将围绕“JSP-Servlet中的汉字编码问题”这一主题展开讨论,通过对相关知识点的深入剖析,...

    asp与.net通信编码乱码问题

    编码问题通常涉及到字符集(charset)和编码方式。在ASCII编码中,只包含英文字符,而在处理包含中文、日文或其他非英文字符的数据时,就需要使用Unicode或其变种,如UTF-8。ASP和.NET可能在默认情况下使用不同的...

    发送解析XML

    XML编码确保不同字符集间的兼容性,如使用`&lt;?xml version="1.0" encoding="UTF-8"?&gt;`声明。命名空间用于区分相同标签名但来自不同来源的数据,常以`xmlns`前缀定义。 总结,发送解析XML涉及客户端构建XML数据,通过...

    web.xml配置解析

    `web.xml`文件以XML文件头开始,指定了XML的版本和字符集编码: ```xml &lt;?xml version="1.0" encoding="ISO-8859-1"?&gt; ``` 紧接着是DTD声明,用于验证XML文档的结构是否符合预定义的规则: ```xml &lt;!DOCTYPE web-...

    web.xml配置汇总(servlet2.3)

    此头部指定了XML文档的版本号为1.0,并使用ISO-8859-1字符集进行编码。 紧接着是文档类型声明(DOCTYPE): ```xml &lt;!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" ...

    Websphere Application Server 6.1乱码问题解决办法

    此外,如果问题仍然存在,可能需要检查其他相关配置,例如数据库连接池的编码设置,Web应用程序的web.xml文件中的字符集设置,以及任何可能涉及字符编码的服务器和应用级别的参数。务必确保所有环节都正确地使用了...

    AJAX编码问题

    ### AJAX编码问题详解 在开发基于Web的应用程序时,AJAX技术因其能够实现网页...总之,理解和掌握AJAX编码问题及其解决方案对于任何Web开发者来说都是非常重要的。希望本文提供的信息能够帮助您更好地应对这类挑战。

    XML ppt讲课课件

    "编码"在XML中指的是字符编码,XML默认使用UTF-8编码,这是一种支持全球多种语言的字符集。了解编码对于确保数据在不同的系统间正确传输至关重要。 "编程表现"可能涉及到如何在各种编程语言中处理XML,如Java、...

Global site tag (gtag.js) - Google Analytics