`
shaomeng95
  • 浏览: 222205 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

iframe页面字符编码问题,页面显示空白

阅读更多
 

 

 

 

 

 

  

 

问题描述:

包含iframe的页面打开后,引入的子页面显示空白,手动选择子页面编码为utf-8,页面显示正常,但有些页面已经加入了

<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />

 

,问题依旧。

 

 

产生原因:

首先,我们应该知道utf-8用3个字节表示一个汉字,而普通的gb2312或big5使用2个字节

其次,要知道浏览器是如何知道页面应该用何种编码进行解析的。

如下3种方式
1、HTTP Header中的”Content-Type”项
2、返回的html代码开头是否有BOM
3、html代码中的meta标签

最后,浏览器会按照上面3种方式确定页面解析的编码,浏览器(无论是IE还是Firefox,随着浏览器的升级可能获取编码的方式有所不同)在解析页面时,首先取HTTP Header中的Content-Type项,如果有写明charset的话就认定页面的编码方式为charset指定的值。如果没有指明,则认定为默认值(IE中文版的默认值是GB2312,Firefox中文版的默认值是GBK)。

然后,浏览器会看一下有没有UTF-8 BOM(建议no bom的utf-8,因为不同浏览器处理不同),一旦发现有UTF-8的3字节BOM,则重新认定页面的编码方式为UTF-8(所以当网页保存为utf -8编码时,可以不在任何地方声明网页代码内声明编码方式了)。然后是解码阶段,解码完成后是解析html的阶段。

解析html的过程中,当解析到head部分的meta标签时,浏览器会根据<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />这个语句中的说明,重新认定编码方式为charset后面的方式,中断html解析过程,返回到解码步骤重新解码。 

引用
正因为这样,当Title里有奇数个全角字符时,IE把utf-8当作两个字节解析时出现半个汉字的情况,这时该半个汉字会和</title>的<结合成一个乱码字,导致IE无法读完<title>部分,使整个页面为空白输出。

 

解决方案:

实际上很简单,把<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />放在<title></title>的前面即可。

 

参考文章:http://www.smuwcwt.com/archives/540

               http://www.cometruer.com/ 

 

 

大公司都是怎么干的:

Google:

<meta http-equiv=content-type content=”text/html; charset=UTF-8″>
<title>这里是中文 – Google 搜索</title>

Yahoo:

<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″>
<title>这里是中文_雅虎网页搜索</title>

 

分享到:
评论
1 楼 shaomeng95 2011-04-26  
有必要严格按照标准来使用html,特别是团队协作时,这些东西都要事先约定好,免得有人犯错误,自己在此mark一下

相关推荐

    ExtAspNet_v2.3.2_dll

    -修正IE下有时会出现空白页面的情况(feedback:olivia919)。 +2009-12-06 v2.1.8 -修正了使用IFrame的Window关闭后不能再次打开的BUG(feedback:alexa99)。 -修正了IE下Grid中的一个JS问题(feedback:lqm4108)...

    ExtAspNet v2.2.1 (2009-4-1) 值得一看

    -修正IE下有时会出现空白页面的情况(feedback:olivia919)。 +2009-12-06 v2.1.8 -修正了使用IFrame的Window关闭后不能再次打开的BUG(feedback:alexa99)。 -修正了IE下Grid中的一个JS问题(feedback:lqm4108)...

    PHP常用工具函数小结【移除XSS攻击、UTF8与GBK编码转换等】

    这个函数利用了PHP的多字节字符串扩展(mbstring)中的`mb_convert_encoding`函数,它能够将字符串从一种字符编码转换为另一种字符编码。在上述例子中,`$text`参数为GBK编码的字符串,函数将其转换为UTF-8编码的...

    入门级HTML教程-HTML元素

    `&lt;meta&gt;`提供关于文档的元信息,如字符编码、描述等。`&lt;nobr&gt;`阻止文本换行。`&lt;noframes&gt;`为不支持框架的浏览器提供内容。`&lt;noscript&gt;`包含在没有JavaScript支持时显示的文本。`&lt;object&gt;`插入多媒体内容,如图像、...

    webkit源代码阅读笔记

    - **WebFrameView**: 表示网页框架的显示部分,对于没有`&lt;frameset&gt;`或`&lt;iframe&gt;`的页面,可将整个网页视为单一的frame。 - **WebFrame**: 包含网页的数据,包括DOM树和CSS信息。 这三个类之间遵循MVC(Model-View-...

    php提取网页正文内容的例子__4.docx

    这可能涉及到计算元素的字符数、单词数、段落数等指标,以及考虑其在页面结构中的位置。这个例子中没有具体实现这部分,但通常会有一个算法来决定哪个元素或组合最能代表正文。 6. **处理异常**: 如果无法正确...

    javascript一些不错的函数脚本代码

    如果字符编码在0到255之间,认为该字符为单字节字符,否则认为是双字节字符(如中文、日文等)。 ### 去除字符串首尾空格的函数 在处理用户输入或从某些数据源获取的字符串时,字符串首尾空格是常见的问题。去除...

    《javaScrip开发技术大全》源代码

    • sample19.htm 字符串与Unicode编码 • sample20.htm 返回字符串中的一个字符 • sample21.htm 通过字符串的起始位置和结束位置来获得子字符串 • sample22.htm slice()方法的...

    Js技巧大全

    - 应用场景: 常用于去除文本中的空白行,如处理日志文件、配置文件等。 4. **匹配HTML标记的正则表达式** - 表达式: `&lt;(.*)&gt;.*|&lt;(.*) \/&gt;` - 应用场景: 用于解析简单的HTML文档,提取或移除特定的HTML标签。...

    html标签大全

    45. `&lt;meta&gt;`:元信息标签,用于设置文档的元数据,如字符编码、描述、关键词等。 46. `&lt;link&gt;`:关系标签,用于定义文档与其他URL的关系,如样式表链接。 47. `&lt;style&gt;`:样式表标签,用于内联定义CSS样式。 48....

    html编写edm时注意事项小结(一般发邮件需要注意的地方)

    - 避免使用浮动、边距、填充,绝对定位可能导致显示问题,应使用清除浮动的表格代替。 8. 邮件发送策略: - 发送超过20万封邮件后需更换主题,超过200万封考虑重新设计模板。 - 尽量使用图片代替文字内容,以...

    HTML基础知识总结.pdf

    ... 一、常见通用的代码 1. align —— 用于设置水平对齐方式,可以用在 `&lt;hr&gt;`, `&lt;table&gt;`, `&lt;caption&gt;`, `...charset= 字符集类型 ” &gt;` = `”Content-Language ”content = “语言 ”&gt;` —— 设置页面编码和语言。

    php提取网页正文内容的例子__5.docx

    预处理包括将源代码转换为HTML实体,去除冗余标签,并处理编码问题。 `preparSource`方法负责预处理HTML,确保它可以正确解析。这可能包括修复不完整的HTML标签,去除可能干扰DOM解析的元素。 `$dom`对象是DOM...

Global site tag (gtag.js) - Google Analytics