- 浏览: 550806 次
- 性别:
- 来自: 北京
文章分类
最新评论
-
jsdsh:
自己写的就是不一样.
Spring3 MVC 注解(二)---@RequestMapping -
jsdsh:
吼,非常吼.学习了
Spring3 MVC 注解(一)---注解基本配置及@controller和 @RequestMapping 常用解释 -
爱情是一种错觉:
我爱你 i love 你[color=red][/color] ...
Spring3 MVC 注解(一)---注解基本配置及@controller和 @RequestMapping 常用解释 -
fs08ab:
大哥,目前这个问题有什么可靠的解决方案吗
@ResponseBody注解 -
lhs295988029:
说的很清楚,明白了~
Spring3 MVC 注解(一)---注解基本配置及@controller和 @RequestMapping 常用解释
为什么要用转义字符串?
HTML中<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用。这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢?
这就要说到HTML转义字符串(Escape Sequence)了。
转义字符串(Escape Sequence)也称字符实体(Character Entity)。在HTML中,定义转义字符串的原因有两个:第一个原因是像“<”和“>”这类符号已经用来表示HTML标签,因此就不能直接当作文本中的符号来使用。为了在HTML文档中使用这些符号,就需要定义它的转义字符串。当解释程序遇到这类字符串时就把它解释为真实的字符。在输入转义字符串时,要严格遵守字母大小写的规则。第二个原因是,有些字符在ASCII字符集中没有定义,因此需要使用转义字符串来表示。
<!-- Contents of this file are Copyright 2006-2008, Xixik Inc. -->转义字符串的组成
转义字符串(Escape Sequence),即字符实体(Character Entity)分成三部分:第一部分是一个&符号,英文叫ampersand;第二部分是实体(Entity)名字或者是#加上实体(Entity)编号;第三部分是一个分号。
比如,要显示小于号(<),就可以写 < 或者 < 。
用实体(Entity)名字的好处是比较好理解,一看lt,大概就猜出是less than的意思,但是其劣势在于并不是所有的浏览器都支持最新的Entity名字。而实体(Entity)编号,各种浏览器都能处理。
提示:实体名称(Entity)是区分大小写的。
备注:同一个符号,可以用“实体名称”和“实体编号”两种方式引用,“实体名称”的优势在于便于记忆,但不能保证所有的浏览器都能顺利识别它,而“实体编号”则没有这种担忧,但它实在不方便记忆。
如何显示空格?
通常情况下,HTML会自动截去多余的空格。不管你加多少空格,都被看做一个空格。比如你在两个字之间加了10个空格,HTML会截去9个空格,只保留一个。为了在网页中增加空格,你可以使用 表示空格。
HTML特殊转义字符列表
最常用的字符实体
Character Entities
半方大的空白 |   |   | |
全方大的空白 |   |   | |
不断行的空白格 | |   | |
< | 小于 | < | < |
> | 大于 | > | > |
& | &符号 | & | & |
" | 双引号 | " | " |
© | 版权 | © | © |
® | 已注册商标 | ® | ® |
™ | 商标(美国) | ™ | ™ |
× | 乘号 | × | × |
÷ | 除号 | ÷ | ÷ |
ISO 8859-1 (Latin-1)字符集
HTML 4.01 支持 ISO 8859-1 (Latin-1) 字符集。
备注:为了方便起见,以下表格中,“实体名称”简称为“名称”,“实体编号”简称为“编号”
|   | ¡ | ¡ | ¡ | ¢ | ¢ | ¢ | £ | £ | £ | ¤ | ¤ | ¤ | |
¥ | ¥ | ¥ | ¦ | ¦ | ¦ | § | § | § | ¨ | ¨ | ¨ | © | © | © |
ª | ª | ª | « | « | « | ¬ | ¬ | ¬ | | ­ | ­ | ® | ® | ® |
¯ | ¯ | ¯ | ° | ° | ° | ± | ± | ± | ² | ² | ² | ³ | ³ | ³ |
´ | ´ | ´ | µ | µ | µ | ¶ | ¶ | ¶ | · | · | · | ¸ | ¸ | ¸ |
¹ | ¹ | ¹ | º | º | º | » | » | » | ¼ | ¼ | ¼ | ½ | ½ | ½ |
¾ | ¾ | ¾ | ¿ | ¿ | ¿ | À | À | À | Á | Á | Á | Â | Â | Â |
à | à | à | Ä | Ä | Ä | Å | Å | Å | Æ | Æ | Æ | Ç | Ç | Ç |
È | È | È | É | É | É | Ê | Ê | Ê | Ë | Ë | Ë | Ì | Ì | Ì |
Í | Í | Í | Î | Î | Î | Ï | Ï | Ï | Ð | Ð | Ð | Ñ | Ñ | Ñ |
Ò | Ò | Ò | Ó | Ó | Ó | Ô | Ô | Ô | Õ | Õ | Õ | Ö | Ö | Ö |
× | × | × | Ø | Ø | Ø | Ù | Ù | Ù | Ú | Ú | Ú | Û | Û | Û |
Ü | Ü | Ü | Ý | Ý | Ý | Þ | Þ | Þ | ß | ß | ß | à | à | à |
á | á | á | â | â | â | ã | ã | ã | ä | ä | ä | å | å | å |
æ | æ | æ | ç | ç | ç | è | è | è | é | é | é | ê | ê | ê |
ë | ë | ë | ì | ì | ì | í | í | í | î | î | î | ï | ï | ï |
ð | ð | ð | ñ | ñ | ñ | ò | ò | ò | ó | ó | ó | ô | ô | ô |
õ | õ | õ | ö | ö | ö | ÷ | ÷ | ÷ | ø | ø | ø | ù | ù | ù |
ú | ú | ú | û | û | û | ü | ü | ü | ý | ý | ý | þ | þ | þ |
ÿ | ÿ | ÿ |
数学和希腊字母标志
symbols, mathematical symbols, and Greek letters
ƒ | ƒ | ƒ | Α | Α | Α | Β | Β | Β | Γ | Γ | Γ | Δ | Δ | Δ |
Ε | Ε | Ε | Ζ | Ζ | Ζ | Η | Η | Η | Θ | Θ | Θ | Ι | Ι | Ι |
Κ | Κ | Κ | Λ | Λ | Λ | Μ | Μ | Μ | Ν | Ν | Ν | Ξ | Ξ | Ξ |
Ο | Ο | Ο | Π | Π | Π | Ρ | Ρ | Ρ | Σ | Σ | Σ | Τ | Τ | Τ |
Υ | Υ | Υ | Φ | Φ | Φ | Χ | Χ | Χ | Ψ | Ψ | Ψ | Ω | Ω | Ω |
α | α | α | β | β | β | γ | γ | γ | δ | δ | δ | ε | ε | ε |
ζ | ζ | ζ | η | η | η | θ | θ | θ | ι | ι | ι | κ | κ | κ |
λ | λ | λ | μ | μ | μ | ν | ν | ν | ξ | ξ | ξ | ο | ο | ο |
π | π | π | ρ | ρ | ρ | ς | ς | ς | σ | σ | σ | τ | τ | τ |
υ | υ | υ | φ | φ | φ | χ | χ | χ | ψ | ψ | ψ | ω | ω | ω |
? | ϑ | ϑ | ? | ϒ | ϒ | ? | ϖ | ϖ | • | • | • | … | … | … |
′ | ′ | ′ | ″ | ″ | ″ | ‾ | ‾ | ‾ | ⁄ | ⁄ | ⁄ | ℘ | ℘ | ℘ |
ℑ | ℑ | ℑ | ℜ | ℜ | ℜ | ™ | ™ | ™ | ℵ | ℵ | ℵ | ← | ← | ← |
↑ | ↑ | ↑ | → | → | → | ↓ | ↓ | ↓ | ↔ | ↔ | ↔ | ↵ | ↵ | ↵ |
⇐ | ⇐ | ⇐ | ⇑ | ⇑ | ⇑ | ⇒ | ⇒ | ⇒ | ⇓ | ⇓ | ⇓ | ⇔ | ⇔ | ⇔ |
∀ | ∀ | ∀ | ∂ | ∂ | ∂ | ∃ | ∃ | ∃ | ∅ | ∅ | ∅ | ∇ | ∇ | ∇ |
∈ | ∈ | ∈ | ∉ | ∉ | ∉ | ∋ | ∋ | ∋ | ∏ | ∏ | ∏ | ∑ | ∑ | ∑ |
− | − | − | ∗ | ∗ | ∗ | √ | √ | √ | ∝ | ∝ | ∝ | ∞ | ∞ | ∞ |
∠ | ∠ | ∠ | ∧ | ∧ | ∧ | ∨ | ∨ | ∨ | ∩ | ∩ | ∩ | ∪ | ∪ | ∪ |
∫ | ∫ | ∫ | ∴ | ∴ | ∴ | ∼ | ∼ | ∼ | ∝ | ≅ | ≅ | ≈ | ≈ | ≈ |
≠ | ≠ | ≠ | ≡ | ≡ | ≡ | ≤ | ≤ | ≤ | ≥ | ≥ | ≥ | ⊂ | ⊂ | ⊂ |
⊃ | ⊃ | ⊃ | ⊄ | ⊄ | ⊄ | ⊆ | ⊆ | ⊆ | ⊇ | ⊇ | ⊇ | ⊕ | ⊕ | ⊕ |
⊗ | ⊗ | ⊗ | ⊥ | ⊥ | ⊥ | ⋅ | ⋅ | ⋅ | ? | ⌈ | ⌈ | ? | ⌉ | ⌉ |
? | ⌊ | ⌊ | ? | ⌋ | ⌋ | ? | ⟨ | 〈 | ? | ⟩ | 〉 | ◊ | ◊ | ◊ |
♠ | ♠ | ♠ | ♣ | ♣ | ♣ | ♥ | ♥ | ♥ | ♦ | ♦ | ♦ |
重要的国际标记
markup-significant and internationalization characters
" | " | " | & | & | & | < | < | < | > | > | > | Œ | Œ | Œ |
œ | œ | œ | Š | Š | Š | š | š | š | Ÿ | Ÿ | Ÿ | ˆ | ˆ | ˆ |
˜ | ˜ | ˜ |   |   |   |   |   |   | | ‌ | ‌ | |||
| ‍ | ‍ | | ‎ | ‎ | | ‏ | ‏ | – | – | – | — | — | — |
‘ | ‘ | ‘ | ’ | ’ | ’ | ‚ | ‚ | ‚ | “ | “ | “ | ” | ” | ” |
„ | „ | „ | † | † | † | ‡ | ‡ | ‡ | ‰ | ‰ | ‰ | ‹ | ‹ | ‹ |
› | › | › | € | € | € |
JavaScript转义符
\b | 退格 |
\f | 走纸换页 |
\n | 换行 |
\r | 回车 |
\t | 横向跳格 (Ctrl-I) |
\' | 单引号 |
\" | 双引号 |
\\ | 反斜杠 |
编程的时候要注意特殊字符的问题,很多运行时出现的问题都是因为特殊字符的出现而引起的。
注意,由于反斜杠本身用作转义符,因此不能直接在脚本中键入一个反斜杠。如果要产生一个反斜杠,必须一起键入两个反斜杠 (\\)。
编码转换(to Unicode)
(程序代码来源于网络)
Js版
<script> test = "你好abc" str = "" for( i=0; i<test.length; i++ ) { temp = test.charCodeAt(i).toString(16); str += "\\u"+ new Array(5-String(temp).length).join("0") +temp; } document.write (str) </script>
vbs版
Function Unicode(str1) Dim str,temp str = "" For i=1 to len(str1) temp = Hex(AscW(Mid(str1,i,1))) If len(temp) < 5 Then temp = right("0000" & temp, 4) str = str & "\u" & temp Next Unicode = str End Function
Function htmlentities(str) For i = 1 to Len(str) char = mid(str, i, 1) If Ascw(char) > 128 then htmlentities = htmlentities & "&#" & Ascw(char) & ";" Else htmlentities = htmlentities & char End if Next End Function
coldfusion版
function nochaoscode(str) { var new_str = “”; for(i=1; i lte len(str);i=i+1){ if(asc(mid(str,i,1)) lt 128){ new_str = new_str & mid(str,i,1); }else{ new_str = new_str & “&##” & asc(mid(str,i,1)); } } return new_str; }
附:
在php中我们可以用mbstring的mb_convert_encoding函数实现这个正向及反向的转化。 如:
mb_convert_encoding ("你好", "HTML-ENTITIES", "gb2312"); //输出:你好
mb_convert_encoding ("你好", "gb2312", "HTML-ENTITIES"); //输出:你好
如果需要对整个页面转化,则只需要在php文件的头部加上这三行代码:
mb_internal_encoding("gb2312"); // 这里的gb2312是你网站原来的编码
mb_http_output("HTML-ENTITIES");
ob_start('mb_output_handler');
来源:HTML转义字符: http://114.xixik.com/character/
相关:正则表达式: http://114.xixik.com/regex/
发表评论
-
使用MongoDB和Spring Data创建一个简单的Java 的CRUD应用
2012-08-01 09:57 1440MongoDB 是一个可扩展的、高性能的、开源的NoSQL ... -
JAVA解决大批量导出数据到excel产生内存溢出的方案 (转)
2012-06-15 10:12 0@SuppressWarnings("u ... -
SSH配置多个数据源
2012-03-13 14:41 01. 编写hibernate的数据库配置文 Mysql_hi ... -
使用SMSLib发短信(收集)
2012-02-07 14:54 24101.mysql做后台数据库; 2 ... -
Apache Commons工具集简介
2011-12-27 19:11 995Apache Commons包含了很多开源的工具,用于解决 ... -
转:YouTube 架构学习体会
2011-11-22 15:23 1189YouTube发展迅速,每天超过1亿的视频点击量,但只有很少人 ... -
字符,字节和编码
2011-11-09 16:22 1195摘要:本文介绍了字符与编码的发展过程,相关概念的正确理解。 ... -
Java日期时间操作函数代码
2011-08-13 16:18 1217/** 日期类 * @date ... -
Log4J diy手册
2011-08-01 11:55 15271. Introduction 在开 ... -
深入分析 Java 中的中文编码问题
2011-07-11 17:12 1529几种常见的编码格式 ... -
BufferedImage to InputStream
2011-06-30 20:56 26130URL url = new URL("http:// ... -
Java打包指南-JAR文件包及jar命令详解
2011-06-15 15:54 9124命令行打war包 ja ... -
正则表达式
2011-06-14 17:35 1427匹配中文字符的正则表达式: [\u4e00-\u9fa5] ... -
svn 命令
2011-06-14 15:59 1015svn co svn+ssh://username@116.2 ... -
使用 jsoup 对 HTML 文档进行解析和操作
2011-06-10 10:32 1628jsoup 简介 Java 程序在解析 HTML 文 ... -
linux设置编码
2011-05-20 10:45 1461set character_set_client='utf ... -
HTML中include file标签的用法
2011-05-05 17:02 21471<!-- #include PathType = Fil ... -
下载 中文文件名乱码问题
2011-04-28 09:42 1250private String processFileName( ... -
Install Redis
2011-04-08 10:16 15111. Get wget http://redis.googl ... -
eclipse.ini内存设置
2011-03-25 17:27 1254eclipse配置: -startu ...
相关推荐
html character entities
HTML字符实体(Character Entities)是HTML中用来表示特殊字符的转义字符串(Escape Sequence),它可以让开发者在网页中显示特殊符号,如<、>、&等。 HTML字符实体分类有两种:一种是实体名称(Entity Name),一种...
HTML旧式字符实体信息:由于旧式原因,某些字符实体不需要带有结尾的分号: ©对于:copyright:完全可以。 安装 该软件包仅适用于ESM:需要使用Node 12+才能使用它,并且必须将其import而不是require d。 : ...
HTML4字符实体信息。 安装 该软件包仅适用于ESM:需要使用Node 12+才能使用它,并且必须将其import而不是require d。 : npm install character-entities-html4 用 import { characterEntitiesHtml4 } from '...
因此,HTML提供了一套字符实体(Character Entities)的机制,用以替代这些特殊字符,确保其在网页中能够被准确无误地显示。 ### 常用的字符实体 #### 空格 在HTML中,一个普通的空格字符在浏览器渲染时可能并不会...
所有的HTML页面中所需的字符对照表 非常适合专业HTML设计师打印出来贴在墙上对照使用
这涉及到HTML实体(HTML Entities)的概念,它们用于在HTML文档中表示特殊字符,以防止浏览器将其解释为HTML标签或其他特殊含义的字符。 在HTML中,某些字符具有特殊的含义,比如"&"代表"与","代表开始标签,">...
HTML 中的预留字符必须被替换为字符实体。 ...如果希望正确地显示预留字符,我们必须在 HTML 源代码中使用字符实体(character entities)。 字符实体类似这样: &entity_name; 或 &#entity_number
HTML转义码,也称为HTML实体(HTML Entities),是HTML语言中用来表示特殊字符的一种机制。在HTML中,有些字符具有特殊含义,如小于号 `和大于号 `>`,它们用于标记HTML标签。如果不进行转义,这些特殊字符可能会被...
确保正确设置字符编码(如UTF-8)并理解如何解码特殊字符实体是至关重要的,否则可能导致乱码或显示异常。 总结,HTML中的特殊字符转换是确保网页内容正确显示和安全的重要手段。理解并熟练运用这些转义规则,有助...
字符串化实体 编码HTML字符引用。 非常快 只是编码部分 拥有您所需的所有选项,用于缩小/修饰符,或具有w / stringifyEntitiesLight的小尺寸 可靠: '`'字符被转义以确保Internet Explorer 6至8中不会运行任何脚本。...
使用JSON.stringify方法在JSON.stringify转义 HTML 实体。 npm install escape-html-in-json > var escape_html_entities = require ( 'escape-html-in-json' ) > var object = { name : "[removed]alert('...
使用这个设置,用户在CKEditor中输入的任何HTML标签和特殊字符都将被原样保留,不会被转换为对应的字符实体。但是,需要注意的是,这种方法会影响到编辑器中的所有内容,可能会引起安全问题,因为恶意脚本也有可能...
HTML提供了一种机制,称为字符实体(Character Entities),允许我们以特定的代码或名称来代表这些特殊字符,从而避免它们被解析为HTML语法。 例如,如果你想要在网页上显示小于号 ",直接写入会触发HTML解析器将其...
与HTML不同,CSS不直接支持预定义的字符实体,但你可以使用Unicode转义序列来表示特殊字符。例如,若要使用版权符号,可以写为`content: '\00A9';`。这里的`\00A9`是版权符号的Unicode编码。 JavaScript,作为Web...
17. **trim($string, $character_mask)**: 去掉字符串两端的空白字符或其他预定义字符。 18. **explode($delimiter, $string, $limit)**: 使用$delimiter将字符串$string切割成数组。$limit参数可以限制返回数组的...
为避免这种情况,HTML引入了字符实体(Character Entities),通过特定的代码序列来代替这些特殊字符。 ### 特殊字符编码的格式 特殊字符编码通常有两种格式: 1. **以&开头的字母组合**:例如`<`表示小于号`,...
HTMLString是用Swift编写的库,它允许您的程序在String中添加和删除HTML实体。 主要特点 :locked_with_pen: 添加ASCII和UTF-8 / UTF-16编码的实体 :memo: 删除超过2100个命名实体(如& ) :input_numbers: 支持...
在HTML中,字符实体(Character Entities)是一种特殊语法,用于在网页中插入无法直接输入或显示的特殊字符。这些实体可以是数字形式,如十进制或十六进制编码,也可以是预定义的名字。在“CharactorEntities.doc”...
HTML实体 Elixir模块,用于对字符串中HTML实体进行解码和编码。 实体名称,代码点及其对应的字符是从复制的。安装将依赖项添加到mix.exs文件,然后运行mix deps.get 。 defp deps do [ { :html_entities , " ~> 0.5 ...