论坛首页 Web前端技术论坛

iframe页面字符编码问题,页面显示空白

浏览 2634 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2011-04-26   最后修改:2011-04-26
 

 

 

 

 

 

  

 

问题描述:

包含iframe的页面打开后,引入的子页面显示空白,手动选择子页面编码为utf-8,页面显示正常,但有些页面已经加入了

<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />

 

,问题依旧。

 

 

产生原因:

首先,我们应该知道utf-8用3个字节表示一个汉字,而普通的gb2312或big5使用2个字节

其次,要知道浏览器是如何知道页面应该用何种编码进行解析的。

如下3种方式
1、HTTP Header中的”Content-Type”项
2、返回的html代码开头是否有BOM
3、html代码中的meta标签

最后,浏览器会按照上面3种方式确定页面解析的编码,浏览器(无论是IE还是Firefox,随着浏览器的升级可能获取编码的方式有所不同)在解析页面时,首先取HTTP Header中的Content-Type项,如果有写明charset的话就认定页面的编码方式为charset指定的值。如果没有指明,则认定为默认值(IE中文版的默认值是GB2312,Firefox中文版的默认值是GBK)。

然后,浏览器会看一下有没有UTF-8 BOM(建议no bom的utf-8,因为不同浏览器处理不同),一旦发现有UTF-8的3字节BOM,则重新认定页面的编码方式为UTF-8(所以当网页保存为utf -8编码时,可以不在任何地方声明网页代码内声明编码方式了)。然后是解码阶段,解码完成后是解析html的阶段。

解析html的过程中,当解析到head部分的meta标签时,浏览器会根据<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />这个语句中的说明,重新认定编码方式为charset后面的方式,中断html解析过程,返回到解码步骤重新解码。 

引用
正因为这样,当Title里有奇数个全角字符时,IE把utf-8当作两个字节解析时出现半个汉字的情况,这时该半个汉字会和</title>的<结合成一个乱码字,导致IE无法读完<title>部分,使整个页面为空白输出。

 

解决方案:

实际上很简单,把<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />放在<title></title>的前面即可。

 

参考文章:http://www.smuwcwt.com/archives/540

               http://www.cometruer.com/ 

 

 

大公司都是怎么干的:

Google:

<meta http-equiv=content-type content=”text/html; charset=UTF-8″>
<title>这里是中文 – Google 搜索</title>

Yahoo:

<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″>
<title>这里是中文_雅虎网页搜索</title>

 

   发表时间:2011-04-26   最后修改:2011-04-26
有必要严格按照标准来使用html,特别是团队协作时,这些东西都要事先约定好,免得有人犯错误,自己在此mark一下
0 请登录后投票
论坛首页 Web前端技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics