如需正确地显示 HTML 页面,浏览器必须知道使用何种字符集。
(1) ASCII字符集:
万维网早期使用的字符集是 ASCII,ASCII 支持 0-9 的数字,大写和小写英文字母表,以及一些特殊字符。在文章最后详解下ASCII字符集
(2)ISO-8859-1字符集:
由于很多国家使用的字符并不属于 ASCII,现代浏览器的默认字符集是 ISO-8859-1,在文章最后详解下ISO-8859-1字符集
(3)其他:
如果网页使用不同于 ISO-8859-1 的字符集,就应该在 <meta> 标签进行指定
【ISO 字符集:】
ISO 字符集是国际标准组织 (ISO) 针对不同的字母表/语言定义的标准字符集
【Unicode(统一)标准字符集:】
由于上面列出的字符集都有容量限制,而且不兼容多语言环境,Unicode 联盟开发了 Unicode 标准。
Unicode 标准涵盖了世界上的所有字符、标点和符号。
不论是何种平台、程序或语言,Unicode 都能够进行文本数据的处理、存储和交换。
【Unicode (统一)联盟】
Unicode 联盟开发了 Unicode 标准。他们的目标是用标准的 Unicode 转换格式 (UTF) 来取代现有的字符集。
Unicode 标准已经获得了成功,在 XML、Java、ECMAScript (JavaScript)、LDAP、CORBA 3.0、WML 中,Unicode 已经得到了实现。在许多操作系统以及所有的现代浏览器中,Unicode 同样得到了支持。
Unicode 联盟与领导性的标准发展组织进行合作,比如 ISO、W3C 以及 ECMA。
Unicode 可以被不同的字符集兼容。最常用的编码方式是 UTF-8 和 UTF-16。
常用编码方式:
(1)UTF-8:常用于网页和电子邮件
UTF8 中的字符可以是 1-4 个字节长。UTF-8 可以表示 Unicode 标准中的任意字符。UTF-8 向后兼容 ASCII。UTF-8 是网页和电子邮件的首选编码
(2)UTF-16:常用于系统和环境
16 比特的 Unicode 转换格式是一种 Unicode 可变字符编码,能够对全部 Unicode 指令表进行编码。UTF-16 主要被用于操作系统和环境中,比如微软的 Windows 2000/XP/2003/Vista/CE 以及 Java 和 .NET 字节代码环境
提示:最前面的 256 个 Unicode 字符集字符对应于 256 个 ISO-8859-1 字符。
提示:所有 HTML 4 处理器均已支持 UTF-8,而所有 XHTML 和 XML 处理器支持 UTF-8 和 UTF-16。
【拓展:】
(1)ASCII(ˈaskē)字符集:
HTML 和 XHTML 用标准的 7 比特 ASCII 代码在网络上传输数据。
7 比特 ASCII 代码可提供 128 个不同的字符值。
①7 比特 可显示的 ASCII 代码,举例如:
space空格 | ! | |
" | quotation mark引号 | " |
# | number sign数字标志 | # |
$ | dollar sign美元符号 | $ |
②7 比特 设备控制 ASCII代码
ASCII设备控制代码最初被设计为用来控制诸如打印机和磁带驱动器之类的硬件设备。
【注意】:在HTML文档中这些代码不会起任何作用,举例如:
GS | group separator组分隔符 |  |
RS | record separator记录分隔符 |  |
US | unit separator单元分离器 |  |
DEL | delete (rubout)删除 |  |
(2)HTML 4.01 支持 ISO 8859-1 (Latin-1) 字符集。
ISO-8859-1 的较低部分(从 1 到 127 之间的代码)是最初的 7 比特 ASCII。
ISO-8859-1 的较高部分(从 160 到 255 之间的代码)全都有实体名称。
这些符号中的大多数都可以在不进行实体引用的情况下使用,但是实体名称或实体编号为那些不容易通过键盘键入的符号提供了表达的方法。
【注释】:实体名称对大小写敏感
①带有实体名称的 ASCII 实体:
" | quotation mark引号 | " | " |
' | apostrophe 撇号 | ' | ' |
& | ampersand符号 | & | & |
< | less-than小于号 | < | < |
> | greater-than大于号 | > | > |
②ISO 8859-1 符号实体---------实体字符
space空格 | |   | |
© | copyright版权 | © | © |
还有其他许多常用字符,具体详解在http://570109268.iteye.com/blog/2406422文章里已经做了总结
.
相关推荐
HTML 字符集 要正确显示一个 HTML 页面,浏览器必须知道要使用的字符集(字符编码)。 HTML 字符集 在 HTML 中,正确的字符编码是什么? HTML5 中默认的字符编码是 UTF-8。 这并非总是如此。早期网络的字符编码...
- **网页开发**: 在HTML、CSS和JavaScript中,可以通过设置合适的字符集来支持GBK编码的中文内容。 - **数据库存储**: 数据库系统(如MySQL)也支持GBK编码,可以用来存储和检索中文数据。 #### 七、GBK与其他字符...
### HTML实体字符集详解 #### 一、概述 在网页设计与开发过程中,经常会遇到一些特殊字符无法直接在HTML文档中正确显示的情况。为了解决这一问题,HTML引入了一种称为“实体”的机制来表示这些特殊字符。通过使用...
### HTML特殊字符集详解 #### 一、概述 在HTML编码过程中,为了确保网页能够正确显示,有时需要使用特殊的字符编码来替代某些符号或字符。这些特殊字符编码被称为“实体”,通常由一个“&”符号开始,紧接着是实体...
在提供的压缩包文件中,`characterCodeIntroduction.html`可能包含了字符集和编码的基本介绍,`characterCodeList.html`可能是对各种字符编码的详细列表和对比,而`resource`文件夹可能包含了一些示例代码或者相关...
如果服务器没有提供字符集信息,则浏览器会继续查找HTML文档中的`<meta>`标签,尝试从中获取字符集信息。例如: ```html <meta http-equiv="Content-Type" content="text/html; charset=windows-1251"> ``` 上述代码...
网页开发:**网页开发者通常会在HTML文档头部指定字符集,以确保网页在不同浏览器上正确显示。 **3. 数据库管理:**数据库系统也支持不同的字符集设置,以适应不同语言环境下的数据存储需求。 #### 五、总结 通过...
字符集和字符编码是计算机处理文字的基础,它们决定了如何在二进制的世界中表示和传输人类语言。本文将深入探讨这两个概念,以及相关的知识点。 首先,我们要理解什么是字符集。字符集,顾名思义,就是一个集合,...
文件名“字符集编码的识别 - Leo - 博客频道 - CSDN.NET.htm”表明这是一个HTML文件,可能是文章的网页版本,而“字符集编码的识别 - Leo - 博客频道 - CSDN.NET_files”可能包含与该网页相关的图片、样式表或其他...
### 字符集编码知识点 #### 一、概述与背景 在Web开发中,字符集编码问题经常成为开发者需要解决的关键技术挑战之一。不同语言、不同系统间的字符编码差异可能导致数据在传输过程中出现乱码等问题。因此,理解字符...
例如,HTML页面使用UTF-8字符集,而JSP页面使用GBK字符集,这样就会导致乱码问题。解决乱码问题的关键是统一字符集,使得整个输入输出流程使用同一种字符集。 乱码解决方案 解决乱码问题需要在整个输入输出流程中...
### gedit设置中文字符集 #### 问题背景 在日常工作中,我们经常需要处理不同操作系统间的文本文件。尤其是在Linux环境下使用gedit编辑器时,可能会遇到打开来自Windows系统的文本文件出现乱码的情况。这种情况...
此外,Oracle官方文档和第三方资源,如大师的网站(http://www.eygle.com/archives/2004/09/characterset_subset_superset.html),提供了详细的字符集子集-超集对照表,帮助用户更好地理解和管理字符集。...
### ISO Latin-1字符集详解 #### 知识点概览 ISO Latin-1字符集,亦称为ISO/IEC 8859-1,是计算机编码标准中的一种,主要用于西欧语言的字符表示。它由ISO(国际标准化组织)和IEC(国际电工委员会)联合制定,是...
Web开发中,HTML和PHP需正确声明字符集,一般推荐使用UTF-8,以确保网页内容在不同平台和浏览器上的正确显示。 ### MySQL中的字符集 #### 数据类型 MySQL支持多种字符集,如latin1、utf8、utf8mb4等,每种字符集...
HTML语言特殊字符对照表(ISO Latin-1字符集)是指包含拉丁字母的一套字符编码,它在HTML中被广泛使用。ISO Latin-1字符集包含了128个字符,覆盖了基本的西欧语言字符,如法语、德语和西班牙语中的特殊字母。在HTML...
#### 八、HTML字符集 为了正确显示HTML页面,需要指定正确的字符集。常用的字符集包括: - **ASCII**:早期互联网使用的基本字符集,只包含基本的英文字符。 - **ISO-8859-1**:支持更多欧洲语言字符。 - **UTF-8*...
Web开发中的字符集和字符编码是确保正确显示和处理文本数据的关键因素,特别是在涉及多语言和特殊字符时。本文将深入探讨字符集、字符编码、Web浏览器端的处理方式、Web服务器端的处理方式以及数据库的字符编码设置...