HTML字符实体(Character Entities),转义字符串(Escape Sequence)
为什么要用转义字符串?
HTML中<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用。这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢?
这就要说到HTML转义字符串(Escape Sequence)了。
转义字符串(Escape Sequence)也称字符实体(Character Entity)。在HTML中,定义转义字符串的原因有两个:第一个原因是像“<”和“>”这类符号已经用来表示HTML标签,因此就不能直接当作文本中的符号来使用。为了在HTML文档中使用这些符号,就需要定义它的转义字符串。当解释程序遇到这类字符串时就把它解释为真实的字符。在输入转义字符串时,要严格遵守字母大小写的规则。第二个原因是,有些字符在ASCII字符集中没有定义,因此需要使用转义字符串来表示。
转义字符串的组成
转义字符串(Escape Sequence),即字符实体(Character Entity)分成三部分:第一部分是一个&符号,英文叫ampersand;第二部分是实体(Entity)名字或者是#加上实体(Entity)编号;第三部分是一个分号。
比如,要显示小于号(<),就可以写 < 或者 < 。
用实体(Entity)名字的好处是比较好理解,一看lt,大概就猜出是less than的意思,但是其劣势在于并不是所有的浏览器都支持最新的Entity名字。而实体(Entity)编号,各种浏览器都能处理。
提示:实体名称(Entity)是区分大小写的。
备注:同一个符号,可以用“实体名称”和“实体编号”两种方式引用,“实体名称”的优势在于便于记忆,但不能保证所有的浏览器都能顺利识别它,而“实体编号”则没有这种担忧,但它实在不方便记忆。
如何显示空格?
通常情况下,HTML会自动截去多余的空格。不管你加多少空格,都被看做一个空格。比如你在两个字之间加了10个空格,HTML会截去9个空格,只保留一个。为了在网页中增加空格,你可以使用 表示空格。
HTML特殊转义字符列表
最常用的字符实体
Character Entities
显示
说明
实体名称
实体编号
|
半方大的空白 |
  |
  |
|
全方大的空白 |
  |
  |
|
不断行的空白格 |
|
  |
< |
小于 |
< |
< |
> |
大于 |
> |
> |
& |
&符号 |
& |
& |
" |
双引号 |
" |
" |
© |
版权 |
© |
© |
® |
已注册商标 |
® |
® |
™ |
商标(美国) |
™ |
™ |
× |
乘号 |
× |
× |
÷ |
除号 |
÷ |
÷ |
ISO 8859-1 (Latin-1)字符集
HTML 4.01 支持 ISO 8859-1 (Latin-1) 字符集。
备注:为了方便起见,以下表格中,“实体名称”简称为“名称”,“实体编号”简称为“编号”
显示
名称
编号
显示
名称
编号
显示
名称
编号
显示
名称
编号
显示
名称
编号
|
|
  |
¡ |
¡ |
¡ |
¢ |
¢ |
¢ |
£ |
£ |
£ |
¤ |
¤ |
¤ |
¥ |
¥ |
¥ |
¦ |
¦ |
¦ |
§ |
§ |
§ |
¨ |
¨ |
¨ |
© |
© |
© |
ª |
ª |
ª |
« |
« |
« |
¬ |
¬ |
¬ |
|
­ |
­ |
® |
® |
® |
¯ |
¯ |
¯ |
° |
° |
° |
± |
± |
± |
² |
² |
² |
³ |
³ |
³ |
´ |
´ |
´ |
µ |
µ |
µ |
¶ |
¶ |
¶ |
· |
· |
· |
¸ |
¸ |
¸ |
¹ |
¹ |
¹ |
º |
º |
º |
» |
» |
» |
¼ |
¼ |
¼ |
½ |
½ |
½ |
¾ |
¾ |
¾ |
¿ |
¿ |
¿ |
À |
À |
À |
Á |
Á |
Á |
 |
 |
 |
à |
à |
à |
Ä |
Ä |
Ä |
Å |
Å |
Å |
Æ |
Æ |
Æ |
Ç |
Ç |
Ç |
È |
È |
È |
É |
É |
É |
Ê |
Ê |
Ê |
Ë |
Ë |
Ë |
Ì |
Ì |
Ì |
Í |
Í |
Í |
Î |
Î |
Î |
Ï |
Ï |
Ï |
Ð |
Ð |
Ð |
Ñ |
Ñ |
Ñ |
Ò |
Ò |
Ò |
Ó |
Ó |
Ó |
Ô |
Ô |
Ô |
Õ |
Õ |
Õ |
Ö |
Ö |
Ö |
× |
× |
× |
Ø |
Ø |
Ø |
Ù |
Ù |
Ù |
Ú |
Ú |
Ú |
Û |
Û |
Û |
Ü |
Ü |
Ü |
Ý |
Ý |
Ý |
Þ |
Þ |
Þ |
ß |
ß |
ß |
à |
à |
à |
á |
á |
á |
â |
â |
â |
ã |
ã |
ã |
ä |
ä |
ä |
å |
å |
å |
æ |
æ |
æ |
ç |
ç |
ç |
è |
è |
è |
é |
é |
é |
ê |
ê |
ê |
ë |
ë |
ë |
ì |
ì |
ì |
í |
í |
í |
î |
î |
î |
ï |
ï |
ï |
ð |
ð |
ð |
ñ |
ñ |
ñ |
ò |
ò |
ò |
ó |
ó |
ó |
ô |
ô |
ô |
õ |
õ |
õ |
ö |
ö |
ö |
÷ |
÷ |
÷ |
ø |
ø |
ø |
ù |
ù |
ù |
ú |
ú |
ú |
û |
û |
û |
ü |
ü |
ü |
ý |
ý |
ý |
þ |
þ |
þ |
ÿ |
ÿ |
ÿ |
数学和希腊字母标志
symbols, mathematical symbols, and Greek letters
显示
名称
编号
显示
名称
编号
显示
名称
编号
显示
名称
编号
显示
名称
编号
ƒ |
ƒ |
ƒ |
Α |
Α |
Α |
Β |
Β |
Β |
Γ |
Γ |
Γ |
Δ |
Δ |
Δ |
Ε |
Ε |
Ε |
Ζ |
Ζ |
Ζ |
Η |
Η |
Η |
Θ |
Θ |
Θ |
Ι |
Ι |
Ι |
Κ |
Κ |
Κ |
Λ |
Λ |
Λ |
Μ |
Μ |
Μ |
Ν |
Ν |
Ν |
Ξ |
Ξ |
Ξ |
Ο |
Ο |
Ο |
Π |
Π |
Π |
Ρ |
Ρ |
Ρ |
Σ |
Σ |
Σ |
Τ |
Τ |
Τ |
Υ |
Υ |
Υ |
Φ |
Φ |
Φ |
Χ |
Χ |
Χ |
Ψ |
Ψ |
Ψ |
Ω |
Ω |
Ω |
α |
α |
α |
β |
β |
β |
γ |
γ |
γ |
δ |
δ |
δ |
ε |
ε |
ε |
ζ |
ζ |
ζ |
η |
η |
η |
θ |
θ |
θ |
ι |
ι |
ι |
κ |
κ |
κ |
λ |
λ |
λ |
μ |
μ |
μ |
ν |
ν |
ν |
ξ |
ξ |
ξ |
ο |
ο |
ο |
π |
π |
π |
ρ |
ρ |
ρ |
ς |
ς |
ς |
σ |
σ |
σ |
τ |
τ |
τ |
υ |
υ |
υ |
φ |
φ |
φ |
χ |
χ |
χ |
ψ |
ψ |
ψ |
ω |
ω |
ω |
? |
ϑ |
ϑ |
? |
ϒ |
ϒ |
? |
ϖ |
ϖ |
• |
• |
• |
… |
… |
… |
′ |
′ |
′ |
″ |
″ |
″ |
‾ |
‾ |
‾ |
⁄ |
⁄ |
⁄ |
℘ |
℘ |
℘ |
ℑ |
ℑ |
ℑ |
ℜ |
ℜ |
ℜ |
™ |
™ |
™ |
ℵ |
ℵ |
ℵ |
← |
← |
← |
↑ |
↑ |
↑ |
→ |
→ |
→ |
↓ |
↓ |
↓ |
↔ |
↔ |
↔ |
↵ |
↵ |
↵ |
⇐ |
⇐ |
⇐ |
⇑ |
⇑ |
⇑ |
⇒ |
⇒ |
⇒ |
⇓ |
⇓ |
⇓ |
⇔ |
⇔ |
⇔ |
∀ |
∀ |
∀ |
∂ |
∂ |
∂ |
∃ |
∃ |
∃ |
∅ |
∅ |
∅ |
∇ |
∇ |
∇ |
∈ |
∈ |
∈ |
∉ |
∉ |
∉ |
∋ |
∋ |
∋ |
∏ |
∏ |
∏ |
∑ |
∑ |
∑ |
− |
− |
− |
∗ |
∗ |
∗ |
√ |
√ |
√ |
∝ |
∝ |
∝ |
∞ |
∞ |
∞ |
∠ |
∠ |
∠ |
∧ |
∧ |
∧ |
∨ |
∨ |
∨ |
∩ |
∩ |
∩ |
∪ |
∪ |
∪ |
∫ |
∫ |
∫ |
∴ |
∴ |
∴ |
∼ |
∼ |
∼ |
∝ |
≅ |
≅ |
≈ |
≈ |
≈ |
≠ |
≠ |
≠ |
≡ |
≡ |
≡ |
≤ |
≤ |
≤ |
≥ |
≥ |
≥ |
⊂ |
⊂ |
⊂ |
⊃ |
⊃ |
⊃ |
⊄ |
⊄ |
⊄ |
⊆ |
⊆ |
⊆ |
⊇ |
⊇ |
⊇ |
⊕ |
⊕ |
⊕ |
⊗ |
⊗ |
⊗ |
⊥ |
⊥ |
⊥ |
⋅ |
⋅ |
⋅ |
? |
⌈ |
⌈ |
? |
⌉ |
⌉ |
? |
⌊ |
⌊ |
? |
⌋ |
⌋ |
? |
⟨ |
〈 |
? |
⟩ |
〉 |
◊ |
◊ |
◊ |
♠ |
♠ |
♠ |
♣ |
♣ |
♣ |
♥ |
♥ |
♥ |
♦ |
♦ |
♦ |
重要的国际标记
markup-significant and internationalization characters
显示
名称
编号
显示
名称
编号
显示
名称
编号
显示
名称
编号
显示
名称
编号
" |
" |
" |
& |
& |
& |
< |
< |
< |
> |
> |
> |
Œ |
Œ |
Œ |
œ |
œ |
œ |
Š |
Š |
Š |
š |
š |
š |
Ÿ |
Ÿ |
Ÿ |
ˆ |
ˆ |
ˆ |
˜ |
˜ |
˜ |
|
  |
  |
|
  |
  |
|
  |
  |
|
‌ |
‌ |
|
‍ |
‍ |
|
‎ |
‎ |
|
‏ |
‏ |
– |
– |
– |
— |
— |
— |
‘ |
‘ |
‘ |
’ |
’ |
’ |
‚ |
‚ |
‚ |
“ |
“ |
“ |
” |
” |
” |
„ |
„ |
„ |
† |
† |
† |
‡ |
‡ |
‡ |
‰ |
‰ |
‰ |
‹ |
‹ |
‹ |
› |
› |
› |
€ |
€ |
€ |
JavaScript转义符
转义序列
字符
\b |
退格 |
\f |
走纸换页 |
\n |
换行 |
\r |
回车 |
\t |
横向跳格 (Ctrl-I) |
\' |
单引号 |
\" |
双引号 |
\\ |
反斜杠 |
编程的时候要注意特殊字符的问题,很多运行时出现的问题都是因为特殊字符的出现而引起的。
注意,由于反斜杠本身用作转义符,因此不能直接在脚本中键入一个反斜杠。如果要产生一个反斜杠,必须一起键入两个反斜杠 (\\)。
编码转换(to Unicode)
(程序代码来源于网络)
Js版
<script>
test = "你好abc"
str = ""
for( i=0; i<test.length; i++ )
{
temp = test.charCodeAt(i).toString(16);
str += "\\u"+ new Array(5-String(temp).length).join("0") +temp;
}
document.write (str)
</script>
vbs版
Function Unicode(str1)
Dim str,temp
str = ""
For i=1 to len(str1)
temp = Hex(AscW(Mid(str1,i,1)))
If len(temp) < 5 Then temp = right("0000" & temp, 4)
str = str & "\u" & temp
Next
Unicode = str
End Function
Function htmlentities(str)
For i = 1 to Len(str)
char = mid(str, i, 1)
If Ascw(char) > 128 then
htmlentities = htmlentities & "&#" & Ascw(char) & ";"
Else
htmlentities = htmlentities & char
End if
Next
End Function
coldfusion版
function nochaoscode(str)
{
var new_str = “”;
for(i=1; i lte len(str);i=i+1){
if(asc(mid(str,i,1)) lt 128){
new_str = new_str & mid(str,i,1);
}else{
new_str = new_str & “&##” & asc(mid(str,i,1));
}
}
return new_str;
}
附:
在php中我们可以用mbstring的mb_convert_encoding函数实现这个正向及反向的转化。 如:
mb_convert_encoding ("你好", "HTML-ENTITIES", "gb2312"); //输出:你好
mb_convert_encoding ("你好", "gb2312", "HTML-ENTITIES"); //输出:你好
如果需要对整个页面转化,则只需要在php文件的头部加上这三行代码:
mb_internal_encoding("gb2312"); // 这里的gb2312是你网站原来的编码
mb_http_output("HTML-ENTITIES");
ob_start('mb_output_handler');
分享到:
相关推荐
HTML转义字符是网页开发中不可或缺的一部分,它们用于在HTML文档中表示特殊字符,防止浏览器错误解析或意外的代码执行。这些字符实体通常由一个反斜杠(\)后跟一个或多个数字或字母组成,例如"<"代表小于号(<)...
### HTML转义字符详解 #### 一、引言 在HTML文档中,为了正确地显示某些特殊字符,如小于号(<)、大于号(>)等,需要使用转义字符来替代这些特殊符号。转义字符是HTML的一种特殊语法,用于在网页中插入无法直接...
HTML(HyperText Markup Language)是...总之,HTML转义字符串是编写网页内容时必须了解的基本概念,它确保了HTML代码的正确解析,并有助于防止潜在的安全问题。熟练运用转义字符串,能够使我们的网页更加健壮、安全。
#### 三、HTML转义字符使用要点 1. **转义字符必须以“&”开头**:这是识别转义字符的关键标识符。 2. **不要嵌套使用转义字符**:例如,`&amp;` 是不正确的使用方式,应该使用 `&`。 3. **转义字符通常...
web开发时 html 页面 特殊字符转义大全 如 引号 冒号 空格等等
### HTML页面转义字符对照表详解 在HTML文档中,为了正确显示某些特殊字符或符号,需要使用到转义字符。这些转义字符通常由一个“&”字符开头,后面跟着表示该字符的代码或者名称,最后以一个“;”结束。这种方式...
"常用HTML转义字符"和"html转义符"文件很可能是对这些常见的转义字符的详细列表,除了上面提到的基本转义字符外,还包括了其他一些特殊字符,如" "用于非破坏性空格,"<br>"用于换行,"<!--"用于开始...
HTML转义字符是HTML语言中的一种机制,用于在文档中插入特殊或无法直接显示的字符。这是因为HTML语言中,某些字符如 "和 ">" 有特殊的含义,它们被用来标记HTML标签,所以不能直接作为文本内容使用。为了解决这个...
本文将围绕“gson转义字符”这一主题展开,深入探讨如何避免Gson在使用时自动将一些字符转为Unicode转义字符。 ### 一、问题背景 在Java项目中,我们经常会使用Gson来处理JSON格式的数据。例如,我们需要将一个...
### JAVA实现HTML转义字符及CSS清除解析 #### 一、引言 在Web开发中,经常需要处理用户提交的数据,为了避免XSS攻击等问题,通常需要对这些数据进行一定的处理,比如转义HTML特殊字符、清除HTML标签以及从CSS样式中...
HTML和XML语言中,转义字符扮演着至关重要的角色,因为它们允许开发者在文本中插入特殊字符,而不会引起解析错误或改变文档结构。在HTML中,某些字符如", ">", "&"拥有特殊的含义,不能直接在文档中使用。这是因为...
* 在 HTML 中,定义转义字符串的原因有两个:第一个原因是像“<”和“>”这类符号已经用来表示 HTML 标签,因此就不能直接当做文本中的符号来使用。第二个原因是,有些字符在 ASCII 字符集中没有定义,因此需要使用...
html中常用的转义字符总结,具体内容如下所示: 不断行的空格   半方大的空格   全方大的空格 < 小于 < > 大于 > & &符号 " 双引号" © 版权符号:copyright: ®...
HTML转义字符是网页开发中不可或缺的一部分,它们用于在HTML文档中插入特殊字符或保留字符,以防止浏览器误解代码。转义字符通过使用反斜杠(\)后跟特定的ASCII值来表示,使得这些字符在HTML源码中能够正确显示和...
HTML转义字符(Escape Sequence)是在HTML文档中用来表示那些在HTML中有特殊意义或者在ASCII字符集中未定义的字符的特定编码。这些特殊字符包括但不限于小于号(<)、大于号(>)和和号(&)。当浏览器在HTML文档中...
通过理解Spring MVC的`@ResponseBody`工作原理,以及如何配置Jackson进行HTML转义,我们可以有效地解决描述中提到的问题,确保Web应用的安全性和正确性。在实际开发中,应始终将数据安全作为优先考虑的因素,避免因...