iframe页面字符编码问题，页面显示空白

shaomeng95

浏览: 223720 次
性别:
来自: 南京

最近访客更多访客>>

fww4022

dj98986

swei315

zhengdinghe

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

前端设计

IE 浏览器 Firefox HTML Google

问题描述：

包含iframe的页面打开后，引入的子页面显示空白，手动选择子页面编码为utf-8，页面显示正常，但有些页面已经加入了

<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />

，问题依旧。

产生原因：

首先，我们应该知道utf-8用3个字节表示一个汉字，而普通的gb2312或big5使用2个字节。

其次，要知道浏览器是如何知道页面应该用何种编码进行解析的。

如下3种方式

1、HTTP Header中的”Content-Type”项
2、返回的html代码开头是否有BOM
3、html代码中的meta标签

最后，浏览器会按照上面3种方式确定页面解析的编码，浏览器(无论是IE还是Firefox，随着浏览器的升级可能获取编码的方式有所不同)在解析页面时，首先取HTTP Header中的Content-Type项，如果有写明charset的话就认定页面的编码方式为charset指定的值。如果没有指明，则认定为默认值（IE中文版的默认值是GB2312，Firefox中文版的默认值是GBK）。

然后，浏览器会看一下有没有UTF-8 BOM(建议no bom的utf-8,因为不同浏览器处理不同)，一旦发现有UTF-8的3字节BOM，则重新认定页面的编码方式为UTF-8（所以当网页保存为utf -8编码时，可以不在任何地方声明网页代码内声明编码方式了）。然后是解码阶段，解码完成后是解析html的阶段。

解析html的过程中，当解析到head部分的meta标签时，浏览器会根据<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />这个语句中的说明，重新认定编码方式为charset后面的方式，中断html解析过程，返回到解码步骤重新解码。

引用

正因为这样，当Title里有奇数个全角字符时，IE把utf-8当作两个字节解析时出现半个汉字的情况，这时该半个汉字会和</title>的<结合成一个乱码字，导致IE无法读完<title>部分，使整个页面为空白输出。

解决方案：

实际上很简单，把<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />放在<title></title>的前面即可。

参考文章：http://www.smuwcwt.com/archives/540

http://www.cometruer.com/

大公司都是怎么干的：

Google:

<meta http-equiv=content-type content=”text/html; charset=UTF-8″>
<title>这里是中文 – Google 搜索</title>

Yahoo:

<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″>
<title>这里是中文_雅虎网页搜索</title>

分享到：

java数据结构与算法读书笔记（零） | 约瑟夫环问题

2011-04-26 15:44
浏览 9482
评论(1)
论坛回复 / 浏览 (1 / 2663)
分类:Web前端
查看更多

1 楼 shaomeng95 2011-04-26

有必要严格按照标准来使用html,特别是团队协作时，这些东西都要事先约定好，免得有人犯错误，自己在此mark一下

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论