首先什么是 html 实体可参见:HTML Entities
,所有的命名实体列举可见:html4
,至今没啥变化,除了命名实体也可以使用数字实体,详见 html 实体编码问题
。
对于显示可以使用 html 实体,但是对于需要知道具体页面上实体的字符值,则有两个方法:
innerHTML
:
将实体比如 © 设置为一个元素的html,再使用元素的该属性可获得实体真正的字符值,但是对于和 html 语法冲突的字符比如: (\u00a0) <(\u003c) >(\u003e) &(\u0026)则仍然保持原样
innerText
& textContent
将实体比如 < 设置为一个元素的html,再使用元素的上述属性可获得实体真正的字符值,这时就可用 alert 或进一步记录到数据存储媒介。
demo :
html entity's character value
PS: 反向获得字符的实体值
对于和html语法相冲突的字符(< , > , &),如果想要实际显示则需要取得该字符的实体值(即转义 escape html 字符),有三种方法:
1. 本章前述方法的反过程
node.textContent&&node.textContent=str;
node.innerText&&node.innerText=str;
alert(node.innerHTML);
2. 创建文本节点
和方法1实际上是同一种,强制把 html 特殊字符当做普通文本,再用 innerHtml 读出来
var str="<a>x</a>";
var div = doc.createElement('div'),
text = doc.createTextNode(str);
div.appendChild(text);
alert(div.innerHTML);
3. 正则式
因为和 html 语法冲突的实际上就是 & , < ,> 那么我们只要正则一下就可以了,速度还最快
var value="<a>x</a>"
alert(String(value).replace(/&/g, "&").replace(/>/g, ">").replace(/</g, "<").replace(/"/g, """))
Refer
http://bytes.com/topic/javascript/answers/170794-trim-nbsp
http://www.ascii.cl/htmlcodes.htm
http://cn.18dao.net/Asc
分享到:
相关推荐
### HTML实体字符集详解 #### 一、概述 在网页设计与开发过程中,经常会遇到一些特殊字符无法直接在HTML文档中正确显示的情况。为了解决这一问题,HTML引入了一种称为“实体”的机制来表示这些特殊字符。通过使用...
除了上述基本的字符实体外,HTML还提供了丰富的特殊字符实体,用于显示各种货币符号、数学符号以及其他语言的特定字符,极大地扩展了HTML文本的表现力。 #### 货币符号 - 分(¢):`¢`或`¢` - 镑(£)...
HTML中,如果要显示特殊字符本身而不是其功能,可以使用HTML实体(HTML Entities)。例如,小于号 `转义为 `<`,大于号 `>` 转义为 `>`,双引号 `"` 转义为 `"`。常见的HTML实体包括: - `&` 代表 ...
为了避免这种情况,我们可以使用HTML实体(HTML entities)来代替这些特殊字符。HTML实体是一种编码方式,它由一个与特定字符相对应的数字或名称组成,通常以 `&` 开头,后跟实体名或编号,最后以 `;` 结束。 例如...
这是因为XML解析器会严格解析这些字符,将它们视为元素、实体引用或字符引用的组成部分。 预定义的XML实体包括五个基本字符:<代表小于号,>代表大于号,&代表和号,'代表单引号,"代表双引号...
这些表通常会列出每个字符的Unicode值,以及它的HTML实体(entity)形式,方便开发者查找和使用。 了解和熟练运用HTML转义字符串,不仅能够保证网页内容的安全,避免XSS(跨站脚本攻击),还可以使页面的源代码更加...
例如,有一些在线的HTML实体转换器可以方便地将特殊字符转换为其对应的转义序列,反之亦然。这样的工具在处理大量文本数据时非常实用,可以提高工作效率。 总之,HTML转义字符串是编写网页内容时必须了解的基本概念...
基于名称的实体通常更容易记忆,而基于数字的实体则更通用,因为它们直接引用了字符的Unicode编码值。 #### 三、HTML字符实体表 HTML字符实体表列出了HTML4.0中定义的所有字符实体。这些实体覆盖了从基本的ASCII...
压缩包中的另一个文件`codeInfo.txt`可能包含了关于HTML特殊字符的信息,比如它们的Unicode值、HTML实体名称或数字实体等。开发者可以参考这个文本文件来理解代码如何处理不同的特殊字符,或者将其作为代码的补充...
一个php实现HTML实体编号与非ASCII字符串相互转换类,HTML实体符号被用作实现保留字符(reserved characters)或者表达键盘无法输入的一些常用字符。在大多数浏览器中默认的字符集为ISO-8859-1。HTML实体符号我们在...
5. **替换特殊字符**:将HTML实体转换回其对应的字符,例如`&(quot|#34);`转换为双引号`"`。 6. **移除残留的HTML符号**:通过简单的字符串替换方法,移除可能残留的`和`>`符号。 7. **HTML编码和修剪**:最后,...
在HTML中,有些特殊字符有特定的含义,比如 `用于开始一个标签,`>` 用于结束标签,`&` 用于表示实体等。然而,如果在网页内容中直接使用这些字符,可能会导致解析错误或者不符合预期的结果。为了解决这个问题,HTML...
为了解决这个问题,HTML引入了一种机制,即使用HTML实体(HTML Entities)来表示这些特殊字符。 HTML实体分为命名实体和数值实体两种类型。命名实体是通过预定义的名称来代表特殊字符,例如"<"代表",">"代表...
`: 这个字符代表双引号 '"', 在HTML中用于引用属性值,防止浏览器误解。 4. `©`: 用于插入版权符号 ©,表示作品的版权归属。 5. `®`: 用于插入已注册商标符号 ®,表明品牌已经官方注册。 6. `™`...
2. **HTML实体转换**:对于HTML源码,为了防止某些特殊字符(如`、`>`、`&`等)被浏览器误解析,需要将其转换为HTML实体,如`"<"`、`">"`和`"&""`。方法可能包括`toHtmlEntities(String str)`和`...
除了以上提到的基本转义字符之外,HTML还支持广泛的特殊字符实体,如数学符号、希腊字母等,这些可以通过Unicode编码来引用。例如,`α` 表示希腊字母α。 #### 三、HTML转义字符使用要点 1. **转义字符必须...
HTML字符串转换涉及到的是HTML实体编码与解码。在网页开发中,为了防止HTML标签被误解析,或者保护特殊字符不被浏览器解释,我们常常需要对字符串进行转义。例如,"小于"符号 `在HTML中会被转义为 `<`。在...
因此,为了显示这些特殊字符,我们需要使用HTML实体(HTML entities)。比如,"&"用"&"代替,"用"<"代替。HTML编码也包括对非ASCII字符的编码,通常使用"&#"加上字符的Unicode编码值。 "Url/Html字符转换...
HTML实体是一种更高级的转义形式,可以表示更多特殊字符,例如版权符号(©)、注册商标(®)和商标(™)。例如: - ©:`©` - ®:`®` - ™:`™` 四、JavaScript转义字符 在JavaScript中,也有...
2. Unicode转HTML实体:将Unicode字符转换为相应的HTML实体,确保在HTML文档中安全显示。 3. URL编码与解码:在HTTP请求中,URL中某些字符需要进行编码,如空格转换为"%20"。易语言源码可能包含了这部分功能,用于...