ttaale

浏览: 554337 次
性别:
来自: 北京

最近访客更多访客>>

ymgjava

liunancun

dd533

cqh520llr

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

HTML字符实体（Character Entities），转义字符串（Escape Sequence）

博客分类：

java综合

为什么要用转义字符串？

HTML中<，>，&等有特殊含义（<，>，用于链接签，&用于转义），不能直接使用。这些符号是不显示在我们最终看到的网页里的，那如果我们希望在网页中显示这些符号，该怎么办呢？

这就要说到HTML转义字符串（Escape Sequence）了。

转义字符串（Escape Sequence）也称字符实体(Character Entity)。在HTML中，定义转义字符串的原因有两个：第一个原因是像“<”和“>”这类符号已经用来表示HTML标签，因此就不能直接当作文本中的符号来使用。为了在HTML文档中使用这些符号，就需要定义它的转义字符串。当解释程序遇到这类字符串时就把它解释为真实的字符。在输入转义字符串时，要严格遵守字母大小写的规则。第二个原因是，有些字符在ASCII字符集中没有定义，因此需要使用转义字符串来表示。

转义字符串的组成

转义字符串（Escape Sequence），即字符实体（Character Entity）分成三部分：第一部分是一个&符号，英文叫ampersand；第二部分是实体（Entity）名字或者是#加上实体（Entity）编号；第三部分是一个分号。

比如，要显示小于号（<），就可以写 < 或者 < 。

用实体（Entity）名字的好处是比较好理解，一看lt，大概就猜出是less than的意思，但是其劣势在于并不是所有的浏览器都支持最新的Entity名字。而实体(Entity)编号，各种浏览器都能处理。

提示：实体名称（Entity）是区分大小写的。

备注：同一个符号，可以用“实体名称”和“实体编号”两种方式引用，“实体名称”的优势在于便于记忆，但不能保证所有的浏览器都能顺利识别它，而“实体编号”则没有这种担忧，但它实在不方便记忆。

如何显示空格？

通常情况下，HTML会自动截去多余的空格。不管你加多少空格，都被看做一个空格。比如你在两个字之间加了10个空格，HTML会截去9个空格，只保留一个。为了在网页中增加空格，你可以使用 表示空格。

HTML特殊转义字符列表

最常用的字符实体
Character Entities

显示说明实体名称实体编号

	半方大的空白	&ensp;
	全方大的空白	&emsp;
	不断行的空白格
<	小于	<	<
>	大于	>	>
&	&符号	&	&
"	双引号	"	"
©	版权	©	©
®	已注册商标	®	®
™	商标（美国）	™	™
×	乘号	×	×
÷	除号	÷	÷

ISO 8859-1 (Latin-1)字符集

HTML 4.01 支持 ISO 8859-1 (Latin-1) 字符集。

备注：为了方便起见，以下表格中，“实体名称”简称为“名称”，“实体编号”简称为“编号”

显示名称编号显示名称编号显示名称编号显示名称编号显示名称编号

数学和希腊字母标志
symbols, mathematical symbols, and Greek letters

显示名称编号显示名称编号显示名称编号显示名称编号显示名称编号

&fnof;

&sigmaf;

&thetasym;

&upsih;

•

…

′

″

‾

&oline;

‾

⁄

&frasl;

⁄

℘

&weierp;

℘

ℑ

&image;

ℑ

ℜ

&real;

ℜ

™

ℵ

&alefsym;

ℵ

←

↑

→

↓

↔

↵

&crarr;

↵

⇐

⇑

&uArr;

⇑

⇒

⇓

&dArr;

⇓

⇔

∀

∂

∃

∅

∇

∈

∉

∋

&ni;

∋

∏

∑

−

∗

&lowast;

∗

√

∝

&prop;

∝

∞

∠

&ang;

∠

∧

&and;

∧

∨

&or;

∨

∩

∪

∫

∴

&there4;

∴

∼

&sim;

∼

∝

&cong;

≅

≈

≠

≡

&equiv;

≡

≤

≥

⊂

⊃

⊄

&nsub;

⊄

⊆

&sube;

⊆

⊇

&supe;

⊇

⊕

&oplus;

⊕

⊗

&otimes;

⊗

⊥

&perp;

⊥

⋅

&lceil;

⌈

&rceil;

⌉

&lfloor;

⌊

&rfloor;

⌋

&lang;

〈

&rang;

〉

◊

&loz;

◊

♠

&spades;

♠

♣

&clubs;

♣

♥

&hearts;

♥

♦

&diams;

♦

重要的国际标记
markup-significant and internationalization characters

显示名称编号显示名称编号显示名称编号显示名称编号显示名称编号

&OElig;

&oelig;

&Scaron;

&scaron;

&Yuml;

&circ;

&tilde;

&ensp;

&emsp;

‌

&zwnj;

‌

‍

&zwj;

‍

‎

&lrm;

‎

‏

&rlm;

‏

–

—

‘

’

‚

&sbquo;

‚

“

”

„

&bdquo;

„

†

&dagger;

†

‡

&Dagger;

‡

‰

&permil;

‰

‹

&lsaquo;

‹

›

&rsaquo;

›

€

JavaScript转义符

转义序列字符

\b	退格
\f	走纸换页
\n	换行
\r	回车
\t	横向跳格 (Ctrl-I)
\'	单引号
\"	双引号
\\	反斜杠

编程的时候要注意特殊字符的问题，很多运行时出现的问题都是因为特殊字符的出现而引起的。

注意，由于反斜杠本身用作转义符，因此不能直接在脚本中键入一个反斜杠。如果要产生一个反斜杠，必须一起键入两个反斜杠 (\\)。

编码转换（to Unicode）

（程序代码来源于网络）

Js版

<script>
     test = "你好abc"
     str = ""
     for( i=0;    i<test.length; i++ )
     {
      temp = test.charCodeAt(i).toString(16);
      str    += "\\u"+ new Array(5-String(temp).length).join("0") +temp;
     }
     document.write (str)
</script>

vbs版

Function Unicode(str1)
     Dim str,temp
     str = ""
     For i=1    to len(str1)
      temp = Hex(AscW(Mid(str1,i,1)))
      If len(temp) < 5 Then    temp = right("0000" & temp, 4)
      str = str & "\u" & temp
     Next
     Unicode = str
End Function

Function htmlentities(str)
     For i = 1 to Len(str)
         char = mid(str, i, 1)
         If Ascw(char) > 128 then
             htmlentities = htmlentities & "&#" & Ascw(char) & ";"
         Else
             htmlentities = htmlentities & char
         End if
     Next
End Function

coldfusion版

function nochaoscode(str)
{
     var new_str = “”;
     for(i=1; i lte len(str);i=i+1){
         if(asc(mid(str,i,1)) lt 128){
             new_str = new_str & mid(str,i,1);
         }else{
             new_str = new_str & “&##” & asc(mid(str,i,1));
         }
     }
     return new_str;
}

附：

在php中我们可以用mbstring的mb_convert_encoding函数实现这个正向及反向的转化。如：

mb_convert_encoding ("你好", "HTML-ENTITIES", "gb2312"); //输出：你好

mb_convert_encoding ("你好", "gb2312", "HTML-ENTITIES"); //输出：你好

如果需要对整个页面转化，则只需要在php文件的头部加上这三行代码：

mb_internal_encoding("gb2312"); // 这里的gb2312是你网站原来的编码

mb_http_output("HTML-ENTITIES");

ob_start('mb_output_handler');

来源：HTML转义字符： http://114.xixik.com/character/

相关：正则表达式： http://114.xixik.com/regex/

分享到：

jquery plugins list | wabacus 框架 JAVA通用快速开发平台

2012-02-27 10:39
浏览 2183
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

HTML字符实体（Character Entities），转义字符串（Escape Sequence）

转义字符串的组成

如何显示空格？

HTML特殊转义字符列表

最常用的字符实体
Character Entities

ISO 8859-1 (Latin-1)字符集

数学和希腊字母标志
symbols, mathematical symbols, and Greek letters

重要的国际标记
markup-significant and internationalization characters

JavaScript转义符

编码转换（to Unicode）

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

HTML字符实体（Character Entities），转义字符串（Escape Sequence）

转义字符串的组成

如何显示空格？

HTML特殊转义字符列表

最常用的字符实体Character Entities

ISO 8859-1 (Latin-1)字符集

数学和希腊字母标志symbols, mathematical symbols, and Greek letters

重要的国际标记markup-significant and internationalization characters

JavaScript转义符

编码转换（to Unicode）

评论

发表评论

相关推荐

使用MongoDB和Spring Data创建一个简单的Java 的CRUD应用

JAVA解决大批量导出数据到excel产生内存溢出的方案 (转)

SSH配置多个数据源

使用SMSLib发短信（收集）

Apache Commons工具集简介

转：YouTube 架构学习体会

字符，字节和编码

Java日期时间操作函数代码

Log4J diy手册

深入分析 Java 中的中文编码问题

BufferedImage to InputStream

Java打包指南－JAR文件包及jar命令详解

正则表达式

svn 命令

使用 jsoup 对 HTML 文档进行解析和操作

linux设置编码

HTML中include file标签的用法

下载 中文文件名乱码问题

Install Redis

eclipse.ini内存设置

最近访客更多访客>>

最常用的字符实体
Character Entities

数学和希腊字母标志
symbols, mathematical symbols, and Greek letters

重要的国际标记
markup-significant and internationalization characters

下载中文文件名乱码问题