HTML 字符实体(Character Entities ),转义字符串(Escape Sequence )
为什么要用转义字符串?
HTML 中< ,> ,& 等有特殊含义(< ,> ,用于链接签,& 用于转义),不能直接使用。这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢?
这就要说到HTML 转义字符串(Escape Sequence )了。
转义字符串 (Escape Sequence )也称字符实体(Character Entity) 。在HTML 中,定义转义字符串的原因有两个:第一个原因是像“<” 和“>” 这类符号已经用来表示HTML 标签,因此就不能直 接当作文本中的符号来使用。为了在HTML 文档中使用这些符号,就需要定义它的转义字符串。当解释程序遇到这类字符串时就把它解释为真实的字符。在输入转 义字符串时,要严格遵守字母大小写的规则。第二个原因是,有些字符在ASCII 字符集中没有定义,因此需要使用转义字符串来表示。
转义字符串的组成
转义字符串(Escape Sequence ),即字符实体(Character Entity )分成三部分:第一部分是一个& 符号,英文叫ampersand ;第二部分是实体(Entity )名字或者是# 加上实体(Entity )编号;第三部分是一个分号。
比如,要显示小于号(< ),就可以写 < 或者 < 。
用实体(Entity )名字的好处是比较好理解,一看lt ,大概就猜出是less than 的意思,但是其劣势在于并不是所有的浏览器都支持最新的Entity 名字。而实体(Entity) 编号,各种浏览器都能处理。
提示:实体名称(Entity )是区分大小写的。
备注:同一个符号,可以用“ 实体名称” 和“ 实体编号” 两种方式引用,“ 实体名称” 的优势在于便于记忆,但不能保证所有的浏览器都能顺利识别它,而“ 实体编号” 则没有这种担忧,但它实在不方便记忆。
如何显示空格?
通常情况下,HTML 会自动截去多余的空格。不管你加多少空格,都被看做一个空格。比如你在两个字之间加了10 个空格,HTML 会截去9 个空格,只保留一个。为了在网页中增加空格,你可以使用 表示空格。
HTML 特殊转义字符列表
最常用的字符实体
Character Entities
显示 |
说明 |
实体名称 |
实体编号 |
|
半方大的空白 |
  |
  |
|
|
|
|
|
全方大的空白 |
  |
  |
|
|
|
|
|
不断行的空白格 |
|
  |
< |
小于 |
< |
< |
> |
大于 |
> |
> |
& |
& 符号 |
& |
& |
" |
双引号 |
" |
" |
© |
版权 |
© |
© |
® |
已注册商标 |
® |
® |
™ |
商标(美国) |
™ |
™ |
|
|
|
|
× |
乘号 |
× |
× |
÷ |
除号 |
÷ |
÷ |
ISO 8859-1 (Latin-1) 字符集
HTML 4.01 支持 ISO 8859-1 (Latin-1) 字符集。
备注:为了方便起见,以下表格中,“ 实体名称” 简称为“ 名称” ,“ 实体编号” 简称为“ 编号”
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
|
|
  |
¡ |
¡ |
¡ |
¢ |
¢ |
¢ |
£ |
£ |
£ |
¤ |
¤ |
¤ |
¥ |
¥ |
¥ |
¦ |
¦ |
¦ |
§ |
§ |
§ |
¨ |
¨ |
¨ |
© |
© |
© |
ª |
ª |
ª |
« |
« |
« |
¬ |
¬ |
¬ |
|
­ |
­ |
® |
® |
® |
¯ |
¯ |
¯ |
° |
° |
° |
± |
± |
± |
² |
² |
² |
³ |
³ |
³ |
´ |
´ |
´ |
µ |
µ |
µ |
¶ |
¶ |
¶ |
· |
· |
· |
¸ |
¸ |
¸ |
¹ |
¹ |
¹ |
º |
º |
º |
» |
» |
» |
¼ |
¼ |
¼ |
½ |
½ |
½ |
¾ |
¾ |
¾ |
¿ |
¿ |
¿ |
À |
À |
À |
Á |
Á |
Á |
 |
 |
 |
à |
à |
à |
Ä |
Ä |
Ä |
Å |
Å |
Å |
Æ |
Æ |
Æ |
Ç |
Ç |
Ç |
È |
È |
È |
É |
É |
É |
Ê |
Ê |
Ê |
Ë |
Ë |
Ë |
Ì |
Ì |
Ì |
Í |
Í |
Í |
Î |
Î |
Î |
Ï |
Ï |
Ï |
Ð |
Ð |
Ð |
Ñ |
Ñ |
Ñ |
Ò |
Ò |
Ò |
Ó |
Ó |
Ó |
Ô |
Ô |
Ô |
Õ |
Õ |
Õ |
Ö |
Ö |
Ö |
× |
× |
× |
Ø |
Ø |
Ø |
Ù |
Ù |
Ù |
Ú |
Ú |
Ú |
Û |
Û |
Û |
Ü |
Ü |
Ü |
Ý |
Ý |
Ý |
Þ |
Þ |
Þ |
ß |
ß |
ß |
à |
à |
à |
á |
á |
á |
â |
â |
â |
ã |
ã |
ã |
ä |
ä |
ä |
å |
å |
å |
æ |
æ |
æ |
ç |
ç |
ç |
è |
è |
è |
é |
é |
é |
ê |
ê |
ê |
ë |
ë |
ë |
ì |
ì |
ì |
í |
í |
í |
î |
î |
î |
ï |
ï |
ï |
ð |
ð |
ð |
ñ |
ñ |
ñ |
ò |
ò |
ò |
ó |
ó |
ó |
ô |
ô |
ô |
õ |
õ |
õ |
ö |
ö |
ö |
÷ |
÷ |
÷ |
ø |
ø |
ø |
ù |
ù |
ù |
ú |
ú |
ú |
û |
û |
û |
ü |
ü |
ü |
ý |
ý |
ý |
þ |
þ |
þ |
ÿ |
ÿ |
ÿ |
|
|
|
|
|
|
|
|
|
|
|
|
数学和希腊字母标志
symbols, mathematical symbols, and Greek letters
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
ƒ |
ƒ |
ƒ |
Α |
Α |
Α |
Β |
Β |
Β |
Γ |
Γ |
Γ |
Δ |
Δ |
Δ |
Ε |
Ε |
Ε |
Ζ |
Ζ |
Ζ |
Η |
Η |
Η |
Θ |
Θ |
Θ |
Ι |
Ι |
Ι |
Κ |
Κ |
Κ |
Λ |
Λ |
Λ |
Μ |
Μ |
Μ |
Ν |
Ν |
Ν |
Ξ |
Ξ |
Ξ |
Ο |
Ο |
Ο |
Π |
Π |
Π |
Ρ |
Ρ |
Ρ |
Σ |
Σ |
Σ |
Τ |
Τ |
Τ |
Υ |
Υ |
Υ |
Φ |
Φ |
Φ |
Χ |
Χ |
Χ |
Ψ |
Ψ |
Ψ |
Ω |
Ω |
Ω |
α |
α |
α |
β |
β |
β |
γ |
γ |
γ |
δ |
δ |
δ |
ε |
ε |
ε |
ζ |
ζ |
ζ |
η |
η |
η |
θ |
θ |
θ |
ι |
ι |
ι |
κ |
κ |
κ |
λ |
λ |
λ |
μ |
μ |
μ |
ν |
ν |
ν |
ξ |
ξ |
ξ |
ο |
ο |
ο |
π |
π |
π |
ρ |
ρ |
ρ |
ς |
ς |
ς |
σ |
σ |
σ |
τ |
τ |
τ |
υ |
υ |
υ |
φ |
φ |
φ |
χ |
χ |
χ |
ψ |
ψ |
ψ |
ω |
ω |
ω |
? |
ϑ |
ϑ |
? |
ϒ |
ϒ |
? |
ϖ |
ϖ |
• |
• |
• |
… |
… |
… |
′ |
′ |
′ |
″ |
″ |
″ |
‾ |
‾ |
‾ |
⁄ |
⁄ |
⁄ |
℘ |
℘ |
℘ |
ℑ |
ℑ |
ℑ |
ℜ |
ℜ |
ℜ |
™ |
™ |
™ |
ℵ |
ℵ |
ℵ |
← |
← |
← |
↑ |
↑ |
↑ |
→ |
→ |
→ |
↓ |
↓ |
↓ |
↔ |
↔ |
↔ |
↵ |
↵ |
↵ |
⇐ |
⇐ |
⇐ |
⇑ |
⇑ |
⇑ |
⇒ |
⇒ |
⇒ |
⇓ |
⇓ |
⇓ |
⇔ |
⇔ |
⇔ |
∀ |
∀ |
∀ |
∂ |
∂ |
∂ |
∃ |
∃ |
∃ |
∅ |
∅ |
∅ |
∇ |
∇ |
∇ |
∈ |
∈ |
∈ |
∉ |
∉ |
∉ |
∋ |
∋ |
∋ |
∏ |
∏ |
∏ |
∑ |
∑ |
∑ |
− |
− |
− |
∗ |
∗ |
∗ |
√ |
√ |
√ |
∝ |
∝ |
∝ |
∞ |
∞ |
∞ |
∠ |
∠ |
∠ |
∧ |
∧ |
∧ |
∨ |
∨ |
∨ |
∩ |
∩ |
∩ |
∪ |
∪ |
∪ |
∫ |
∫ |
∫ |
∴ |
∴ |
∴ |
∼ |
∼ |
∼ |
∝ |
≅ |
≅ |
≈ |
≈ |
≈ |
≠ |
≠ |
≠ |
≡ |
≡ |
≡ |
≤ |
≤ |
≤ |
≥ |
≥ |
≥ |
⊂ |
⊂ |
⊂ |
⊃ |
⊃ |
⊃ |
⊄ |
⊄ |
⊄ |
⊆ |
⊆ |
⊆ |
⊇ |
⊇ |
⊇ |
⊕ |
⊕ |
⊕ |
⊗ |
⊗ |
⊗ |
⊥ |
⊥ |
⊥ |
⋅ |
⋅ |
⋅ |
? |
⌈ |
⌈ |
? |
⌉ |
⌉ |
? |
⌊ |
⌊ |
? |
⌋ |
⌋ |
? |
⟨ |
〈 |
? |
⟩ |
〉 |
◊ |
◊ |
◊ |
♠ |
♠ |
♠ |
♣ |
♣ |
♣ |
♥ |
♥ |
♥ |
♦ |
♦ |
♦ |
|
|
|
重要的国际标记
markup-significant and internationalization characters
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
显示 |
名称 |
编号 |
" |
" |
" |
& |
& |
& |
< |
< |
< |
> |
> |
> |
Œ |
Œ |
Œ |
œ |
œ |
œ |
Š |
Š |
Š |
š |
š |
š |
Ÿ |
Ÿ |
Ÿ |
ˆ |
ˆ |
ˆ |
˜ |
˜ |
˜ |
|
  |
  |
|
  |
  |
|
  |
  |
|
‌ |
‌ |
|
‍ |
‍ |
|
‎ |
‎ |
|
‏ |
‏ |
– |
– |
– |
— |
— |
— |
‘ |
‘ |
‘ |
’ |
’ |
’ |
‚ |
‚ |
‚ |
“ |
“ |
“ |
” |
” |
” |
„ |
„ |
„ |
† |
† |
† |
‡ |
‡ |
‡ |
‰ |
‰ |
‰ |
‹ |
‹ |
‹ |
› |
› |
› |
€ |
€ |
€ |
|
|
|
|
|
|
|
|
|
JavaScript 转义符
转义序列 |
字符 |
\b |
退格 |
\f |
走纸换页 |
\n |
换行 |
\r |
回车 |
\t |
横向跳格 (Ctrl-I) |
\' |
单引号 |
\" |
双引号 |
\\ |
反斜杠 |
编程的时候要注意特殊字符的问题,很多运行时出现的问题都是因为特殊字符的出现而引起的。
注意,由于反斜杠本身用作转义符,因此不能直接在脚本中键入一个反斜杠。如果要产生一个反斜杠,必须一起键入两个反斜杠 (\\) 。
编码转换(to Unicode )
(程序代码来源于网络)
Js 版
<script>
test = " 你好abc"
str = ""
for( i=0; i<test.length; i++ )
{
temp = test.charCodeAt(i).toString(16);
str += "\\u"+ new Array(5-String(temp).length).join("0") +temp;
}
document.write (str)
</script>
vbs 版
Function Unicode(str1)
Dim str,temp
str = ""
For i=1 to len(str1)
temp = Hex(AscW(Mid(str1,i,1)))
If len(temp) < 5 Then temp = right("0000" & temp, 4)
str = str & "\u" & temp
Next
Unicode = str
End Function
Function htmlentities(str)
For i = 1 to Len(str)
char = mid(str, i, 1)
If Ascw(char) > 128 then
htmlentities = htmlentities & "&#" & Ascw(char) & ";"
Else
htmlentities = htmlentities & char
End if
Next
End Function
coldfusion 版
function nochaoscode(str)
{
var new_str = “”;
for(i=1; i lte len(str);i=i+1){
if(asc(mid(str,i,1)) lt 128){
new_str = new_str & mid(str,i,1);
}else{
new_str = new_str & “&##” & asc(mid(str,i,1));
}
}
return new_str;
}
附:
在php 中我们可以用mbstring 的mb_convert_encoding 函数实现这个正向及反向的转化。 如:
mb_convert_encoding (" 你好", "HTML-ENTITIES", "gb2312"); // 输出:你好
mb_convert_encoding ("你好", "gb2312", "HTML-ENTITIES"); // 输出:你好
如果需要对整个页面转化,则只需要在php 文件的头部加上这三行代码:
mb_internal_encoding("gb2312"); // 这里的gb2312 是你网站原来的编码
mb_http_output("HTML-ENTITIES");
ob_start('mb_output_handler');
来源:HTML 转义字符: http://114.xixik.com/character/
相关:正则表达式: http://114.xixik.com/regex/
相关推荐
HTML转义字符是网页开发中不可或缺的一部分,它们用于在HTML文档中表示特殊字符,防止浏览器错误解析或意外的代码执行。这些字符实体通常由一个反斜杠(\)后跟一个或多个数字或字母组成,例如"<"代表小于号(<)...
HTML(HyperText Markup Language)是...总之,HTML转义字符串是编写网页内容时必须了解的基本概念,它确保了HTML代码的正确解析,并有助于防止潜在的安全问题。熟练运用转义字符串,能够使我们的网页更加健壮、安全。
### JAVA实现HTML转义字符及CSS清除解析 #### 一、引言 在Web开发中,经常需要处理用户提交的数据,为了避免XSS攻击等问题,通常需要对这些数据进行一定的处理,比如转义HTML特殊字符、清除HTML标签以及从CSS样式中...
HTML转义字符是HTML语言中的一种机制,用于在文档中插入特殊或无法直接显示的字符。这是因为HTML语言中,某些字符如 "和 ">" 有特殊的含义,它们被用来标记HTML标签,所以不能直接作为文本内容使用。为了解决这个...
HTML转义字符串是Web开发中一个重要的概念,它涉及到网页内容的安全性和正确显示。在HTML中,某些字符具有特殊的含义,比如"<"代表",">"代表">","&"代表"&"等。为了在网页上直接显示这些字符而不是触发...
### HTML转义字符详解 #### 一、引言 在HTML文档中,为了正确地显示某些特殊字符,如小于号(<)、大于号(>)等,需要使用转义字符来替代这些特殊符号。转义字符是HTML的一种特殊语法,用于在网页中插入无法直接...
HTML转义字符是网页开发中不可或缺的一部分,它们用于在HTML文档中插入特殊字符或保留字符,以防止浏览器误解代码。转义字符通过使用反斜杠(\)后跟特定的ASCII值来表示,使得这些字符在HTML源码中能够正确显示和...
HTML转义字符(Escape Sequence)是在HTML文档中用来表示那些在HTML中有特殊意义或者在ASCII字符集中未定义的字符的特定编码。这些特殊字符包括但不限于小于号(<)、大于号(>)和和号(&)。当浏览器在HTML文档中...
#### 三、HTML转义字符使用要点 1. **转义字符必须以“&”开头**:这是识别转义字符的关键标识符。 2. **不要嵌套使用转义字符**:例如,`&amp;` 是不正确的使用方式,应该使用 `&`。 3. **转义字符通常...
JAVA实现html转义字符及css清除.doc
在Java开发中,处理HTML内容时,有时我们需要清除HTML转义字符,以确保文本在显示或存储时不会解析为HTML标签。HTML转义字符是用于在HTML文档中表示特殊字符的字符实体,例如 `会被转义为 `<` 以防止浏览器将其...
在Python编程中,处理HTML转义字符是一项常见的任务,特别是在进行网络爬虫或者解析HTML文档时。HTML转义字符是用来避免HTML元素中的特殊字符被解释为标签或特殊符号的。例如,小于号 `在HTML中是用于开始标签的,但...
### Python处理HTML转义字符的方法详解 在进行Web开发或者数据抓取的过程中,经常会遇到HTML转义字符(也称为HTML字符实体)。这类字符通常用于表示HTML文档中的特殊符号,如`, `>`, `&`等,以避免被误解释为HTML...
在Python编程中,处理HTML转义字符是一项常见的任务,特别是在解析或生成HTML内容时。HTML转义字符是为了确保HTML文档的结构正确,避免特殊字符被解析为HTML标签或实体。本篇文章将深入探讨HTML转义字符的概念,以及...
HTML转义字符,又称字符实体(Character Entity),是HTML中用于表示特殊符号的重要工具。由于HTML语言中的某些字符,如"、">"和"&",具有特定的语义,直接使用它们可能会导致解析错误,因此需要使用转义字符串来...