问题描述:
包含iframe的页面打开后,引入的子页面显示空白,手动选择子页面编码为utf-8,页面显示正常,但有些页面已经加入了
<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />
,问题依旧。
产生原因:
首先,我们应该知道utf-8用3个字节表示一个汉字,而普通的gb2312或big5使用2个字节。
其次,要知道浏览器是如何知道页面应该用何种编码进行解析的。
如下3种方式
1、HTTP Header中的”Content-Type”项
2、返回的html代码开头是否有BOM
3、html代码中的meta标签
最后,浏览器会按照上面3种方式确定页面解析的编码,浏览器(无论是IE还是Firefox,随着浏览器的升级可能获取编码的方式有所不同)在解析页面时,首先取HTTP Header中的Content-Type项,如果有写明charset的话就认定页面的编码方式为charset指定的值。如果没有指明,则认定为默认值(IE中文版的默认值是GB2312,Firefox中文版的默认值是GBK)。
然后,浏览器会看一下有没有UTF-8 BOM(建议no bom的utf-8,因为不同浏览器处理不同),一旦发现有UTF-8的3字节BOM,则重新认定页面的编码方式为UTF-8(所以当网页保存为utf -8编码时,可以不在任何地方声明网页代码内声明编码方式了)。然后是解码阶段,解码完成后是解析html的阶段。
解析html的过程中,当解析到head部分的meta标签时,浏览器会根据<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />这个语句中的说明,重新认定编码方式为charset后面的方式,中断html解析过程,返回到解码步骤重新解码。
引用
正因为这样,当Title里有奇数个全角字符时,IE把utf-8当作两个字节解析时出现半个汉字的情况,这时该半个汉字会和</title>的<结合成一个乱码字,导致IE无法读完<title>部分,使整个页面为空白输出。
解决方案:
实际上很简单,把<meta http-equiv=”Content-Type” content=”text/html; charset=UTF-8″ />放在<title></title>的前面即可。
参考文章:http://www.smuwcwt.com/archives/540
http://www.cometruer.com/
大公司都是怎么干的:
Google:
<meta http-equiv=content-type content=”text/html; charset=UTF-8″>
<title>这里是中文 – Google 搜索</title>
Yahoo:
<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″>
<title>这里是中文_雅虎网页搜索</title>
分享到:
相关推荐
-修正IE下有时会出现空白页面的情况(feedback:olivia919)。 +2009-12-06 v2.1.8 -修正了使用IFrame的Window关闭后不能再次打开的BUG(feedback:alexa99)。 -修正了IE下Grid中的一个JS问题(feedback:lqm4108)...
-修正IE下有时会出现空白页面的情况(feedback:olivia919)。 +2009-12-06 v2.1.8 -修正了使用IFrame的Window关闭后不能再次打开的BUG(feedback:alexa99)。 -修正了IE下Grid中的一个JS问题(feedback:lqm4108)...
这个函数利用了PHP的多字节字符串扩展(mbstring)中的`mb_convert_encoding`函数,它能够将字符串从一种字符编码转换为另一种字符编码。在上述例子中,`$text`参数为GBK编码的字符串,函数将其转换为UTF-8编码的...
`<meta>`提供关于文档的元信息,如字符编码、描述等。`<nobr>`阻止文本换行。`<noframes>`为不支持框架的浏览器提供内容。`<noscript>`包含在没有JavaScript支持时显示的文本。`<object>`插入多媒体内容,如图像、...
- **WebFrameView**: 表示网页框架的显示部分,对于没有`<frameset>`或`<iframe>`的页面,可将整个网页视为单一的frame。 - **WebFrame**: 包含网页的数据,包括DOM树和CSS信息。 这三个类之间遵循MVC(Model-View-...
这可能涉及到计算元素的字符数、单词数、段落数等指标,以及考虑其在页面结构中的位置。这个例子中没有具体实现这部分,但通常会有一个算法来决定哪个元素或组合最能代表正文。 6. **处理异常**: 如果无法正确...
如果字符编码在0到255之间,认为该字符为单字节字符,否则认为是双字节字符(如中文、日文等)。 ### 去除字符串首尾空格的函数 在处理用户输入或从某些数据源获取的字符串时,字符串首尾空格是常见的问题。去除...
• sample19.htm 字符串与Unicode编码 • sample20.htm 返回字符串中的一个字符 • sample21.htm 通过字符串的起始位置和结束位置来获得子字符串 • sample22.htm slice()方法的...
- 应用场景: 常用于去除文本中的空白行,如处理日志文件、配置文件等。 4. **匹配HTML标记的正则表达式** - 表达式: `<(.*)>.*|<(.*) \/>` - 应用场景: 用于解析简单的HTML文档,提取或移除特定的HTML标签。...
45. `<meta>`:元信息标签,用于设置文档的元数据,如字符编码、描述、关键词等。 46. `<link>`:关系标签,用于定义文档与其他URL的关系,如样式表链接。 47. `<style>`:样式表标签,用于内联定义CSS样式。 48....
- 避免使用浮动、边距、填充,绝对定位可能导致显示问题,应使用清除浮动的表格代替。 8. 邮件发送策略: - 发送超过20万封邮件后需更换主题,超过200万封考虑重新设计模板。 - 尽量使用图片代替文字内容,以...
... 一、常见通用的代码 1. align —— 用于设置水平对齐方式,可以用在 `<hr>`, `<table>`, `<caption>`, `...charset= 字符集类型 ” >` = `”Content-Language ”content = “语言 ”>` —— 设置页面编码和语言。
预处理包括将源代码转换为HTML实体,去除冗余标签,并处理编码问题。 `preparSource`方法负责预处理HTML,确保它可以正确解析。这可能包括修复不完整的HTML标签,去除可能干扰DOM解析的元素。 `$dom`对象是DOM...