-
UTF-8编码问题5
在jsp页面中会出现?,我在代码中也没写?,如果是中文乱码,可我在button上的中文正常显示。后来我用Notepad++打开jsp文件发现,它的字符编码是UTF-8,又发现在还有一个UTF-8(无BOM)。然后我就凭感觉选了UTF-8(无BOM),再跑jsp发现?没了,解决了。
我是一个初学者,所以不知道这是为什么,UTF-8和UTF-8(无BOM)之间的具体有什么不同和相同的地方。
希望前辈们给我解释一下,在下先谢谢了。
问题补充:
那再请问一下,我的这个情况,为什么用UTF-(无BOM)就可以,而用UTF-8就不行呢?这跟jsp有关系吗?文中提到:utf8不用考虑字节序列,所以其实有无BOM都可以。UTF-8以字节为编码单元,没有字节序的问题。那我的这种情况怎么解释,难道是jsp的编码方式是UTF-16,所以有编码单元的字节序?
问题补充:
本来jsp的编码格式是utf-8,而我用的Notepad++编辑器载入后是不是把jsp的编码格式转换成了utf-16的格式,所以有了字节序列,才会导致以上的情况?2008年6月18日 14:46
4个答案 按时间排序 按投票排序
-
我感觉不是jsp问题,也不是BOM问题,是浏览器BUG.
你在浏览器上查看一下你的服务器发出的数据.注意以下几个方面:
1.http包头的content-type,应该是:
Content-Type text/html; charset=utf-8
2.页面上meta的写法,应该是
<meta content="text/html; charset=UTF-8" http-equiv="Content-Type"/>
<meta content="zh-CN" http-equiv="Content-Language"/>
3.如果title中有中文的话.页面上title和meta的位置,title应该在meta的后面.
虽然w3c没有规定次序,但是这个次序对IE有影响.
4.我是用php的,在php里BOM是不应该出现在php文件里的,因为如果有cookie发送的话.
BOM会在cookie发送之前发送,这个是不正确的.不过我不了解jsp有关的情况,这点仅供参考.2008年7月03日 16:20
-
觉得,以前一直以为,程序中使用统一编码格式,就能解决所有的编码问题,这是理想的解决方式。但是实际项目中,不会出现这么理想,所以,通过浏览器提交过来的数据,要通过Fiter,转化编码为程序格式。数据库中的数据的编码,也需要转换。。平常,我们导入一个程序进入项目就会出现编码格式问题,那么我们就通过变换编码格式来转化,其实解决的思想:统一编码格式。
2008年6月25日 20:21
-
UTF-8 编码的文件可以分为no BOM 和 BOM两种格式。
何谓BOM? "EF BB BF" 这三个字节就叫BOM,BOM的全称叫做"Byte Order Mard".在utf-8文件中常用BOM来表明这个文件是UTF-8文件,而BOM的本意实在utf16中用来表示高低字节序列的。在字节流之前有 BOM表示采用低字节序列(低字节在前面),而utf8不用考虑字节序列,所以其实有无BOM都可以。UTF-8以字节为编码单元,没有字节序的问题。 UTF-16以两个字节为编码单元,在解释一个UTF-16文本前,首先要弄清楚每个编码单元的字节序。例如收到一个“奎”的Unicode编码是 594E,“乙”的Unicode编码是4E59。如果我们收到UTF-16字节流“594E”,那么这是 “奎”还是“乙”?
来自:http://www.cnblogs.com/zhongru_tu/archive/2008/04/11/1147792.html2008年6月18日 16:47
相关推荐
如果UNICODE字符由2个字节表示,则编码成UTF-8很可能需要3个字节,而如果UNICODE字符由4个字节表示,则编码成UTF-8可能需要6个字节。用4个或6个字节去编码一个UNICODE字符可能太多了,但很少会遇到那样的UNICODE...
标签“pb9 utf-8”明确了讨论的是与PowerBuilder 9相关的UTF-8编码问题。UTF-8是一种广泛使用的Unicode字符编码,能够表示Unicode字符集中几乎所有的字符,包括世界各地的多种语言文字。 在压缩包的文件列表中,有...
netbeans文件并不是用utf-8编码的,所以若果jsp见中文用utf--8编码的话,就会出现乱码,该图片就是解决这个问题的
在C++编程中,UTF-8编码是一种广泛使用的字符编码标准,它能够表示Unicode字符集中的所有字符。本文将深入探讨如何在C++中处理UTF-8字符串,并介绍相关的关键概念和技术。 首先,C++标准库并没有直接支持UTF-8编码...
标题中的“中文-UTF-8编码转换器”指的是一个软件工具,它的主要功能是帮助处理中文和其他特殊字符在UTF-8编码环境下可能出现的乱码问题。UTF-8是一种广泛使用的Unicode字符编码方案,它可以表示Unicode标准中的所有...
GBK、UTF-8批量文件3秒快速转码工具(支持GBK,UTF-8免费转换),UTF-8/GBK编码在线转换工具,压缩包可以有多目录与文件,如目录中有图片不会转码,但是会随转码好的文件一起打包下载。 使用帮助 . 上传压缩包(仅支持zip...
在LabVIEW编程环境中,"UTF-8toGBK.vi"这个程序可能是一个用户自定义的VI(Virtual Instrument),用于将UTF-8编码的字符串转换为GBK编码。LabVIEW作为一个图形化编程语言,提供了丰富的字符串处理函数,其中包括了...
解决SAS EG导入UTF-8编码文本数据文件的乱码问题,通常需要在导入文件之前明确指定文件的编码类型。SAS EG提供了编码识别和转换的选项,但正确识别UTF-8编码的中文字符可能需要一些额外的步骤。为了解决乱码问题,...
为大家提供Python的UTF-8编码查询表,大家可以对照左列的编码查询右列的汉字。 例:\u4e00对应汉字“一”
使用 UTF-8 编码可以确保生成的 XML 文件能够正确地表达 Unicode 字符,从而避免字符乱码的问题。此外,UTF-8 编码也是 XML 文件的默认编码格式,使用它可以与其他系统和应用程序进行良好的集成。 需要注意的是,在...
UTF-8编码是一种广泛使用的字符编码标准,它在信息技术领域起着至关重要的作用。这个“UTF-8编码转换器”工具旨在帮助用户方便地将文本数据从其他编码格式转换为UTF-8,确保数据在不同系统和平台之间的兼容性。 在...
UTF-8编码和GBK编码互转,一个头文件搞定!跨平台不使用第三方库。只需要添加一些C语言标准的头文件即可实现俩种编码互相转换。摆脱第三方库移植问题。原理是将UTF-8编码的汉字、字母、符号、数字等转换成unicode...
描述中的“通过本人亲自己测试修改”表明这个版本的百度编辑器ASP版UTF-8编码可能已经过作者的个人优化,解决了原版可能存在的问题或者增加了特定功能,以适应特定的开发需求或环境。这可能包括修复了一些已知的bug...
在IT领域,文本文件的编码方式对于正确地读取和处理文本至关重要。UTF-8是一种广泛使用的字符编码标准,能够表示...在实际开发中,我们应该养成良好的编码习惯,尽量使用标准的UTF-8编码,以减少潜在的兼容性问题。
最近的项目(Delphi开发),需要经常和java语言开发的系统进行数据交互(Socket通信方式),数据编码约定采用UTF-8编码。 令我无语的是:JAVA系统那边反映说,Delphi发的数据他们收到是乱码,而我这边(Delphi7,...
### UTF-8编码详解与汉字码表解析 #### UTF-8编码原理 UTF-8(Unicode Transformation Format - 8 bits)是一种变长字符编码,由Ken Thompson于1992年设计,旨在解决多语言环境下字符编码兼容性问题。其核心优势...
总之,UTF-8编码转换工具是一个实用的工具,可以帮助用户在处理各种编码问题时进行转换。了解UTF-8编码的工作原理和应用场景,对于从事IT工作的人来说是必不可少的基础知识。在实际工作中,无论是开发网页、编写代码...
UTF-8编码是一种广泛使用的字符编码标准,它能够表示Unicode字符集中的所有字符。在Visual Basic编程环境中,处理UTF-8编码的文件或数据时,你需要理解如何读取、写入以及转换UTF-8格式的数据。以下是一些关键的知识...
### UTF-8编码详解 #### 一、简介 在计算机科学领域中,字符编码是将字符映射到二进制数字的一种方式。其中,UTF-8(8位通用转换格式)是一种可变长度的字符编码,它兼容ASCII,并且能够表示Unicode标准中的所有...
UTF-8-BOM,全称是“UTF-8 Byte Order Mark”,它在UTF-8编码的文件开头添加了一个特殊的字节序列(0xEF, 0xBB, 0xBF)来标识该文件使用的是UTF-8编码。BOM主要用于帮助软件识别文件的编码,但并非所有UTF-8编码的...