1,得到网页上的链接地址:
string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";
2,得到网页的标题:
string matchString = @"<title>(?<title>.*)</title>";
3,去掉网页中的所有的html标记:
string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档
java 中去掉网页中的所有标签
str = str.replaceAll("<[^>]*>", "");
4, string matchString = @"<title>([\S\s\t]*?)</title>";
5,js去掉所有html标记的函数:
function delHtmlTag(str)
{
return str.replace(/<\/?.+?>/g,"");//去掉所有的html标记
}
这个可能IE5会错,那用这个,梅花的:
function delHtmlTag(str)
{
return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
}
document方法:
getElementById(id) 返回指定结点的引用
getElementsByTagName(name) 返回文档中所有匹配的元素的集合
createElement(name) 创建指定类型的新结点
createTextNode(text) 创建一个纯文本结点
element方法:
getAttribute(id) 返回指定属性的值
setAttribute(id,value) 给属性赋值
removeAttribute(id) 移除指定属性和它的值
getElementsByTagName(name) 返回结点内所有匹配的元素的集合
node方法:
appendChild(child) 给指定结点添加一个新的子结点
removeChild(child) 移除指定结点的子结点
replaceChild(newChild,oldChild) 替换指定结点的子结点
insertBefore(newChild,refChild) 在同一层级的结点前面插入新结点
hasChildNodes() 如果结点有子结点则返回true
node属性:
nodeName 以字符串的格式存放结点的名称
nodeType 以整型数据格式存放结点的类型
nodeValue 以可用的格式存放结点的值
parentNode 指向结点的父结点的引用
childNodes 指向子结点的引用的集合
firstChild 指向子结点结合中的第一个子结点的引用
lastChild 指向子结点结合中的最后一个子结点的引用
分享到:
相关推荐
给写了2个方法,一个是直接截取单个需要的字符串,比如字符串string a="ab123456",我只需要提取3,那么就是单独截取就可以了,从2开始到4结束就行。 第二个是把所有的符合条件的字符串都截取出来,提取出来,比如...
Java使用正则表达式提取XML节点内容的方法示例主要介绍了Java使用正则表达式提取XML节点内容的方法,结合具体实例形式分析了java针对xml格式字符串的正则匹配相关操作技巧。 一、正则表达式简介 正则表达式是指一...
本篇将深入探讨Java中的字符串、正则表达式及其在实际编程中的详细实例代码。 1. **字符串基础** - Java中的字符串是不可变的,这意味着一旦创建了字符串对象,就不能更改其内容。这由`final`关键字确保,提高了...
powerbuilder正则表达式,可以截取不定字符串。如 string ls_text ls_text = ' date of payment: 01.11.2004 ' …… ls_date = lnvo_re.of_getmatch(ls_text) //'01.11.2004' ls_day = lnvo_re.of_getmatch(ls_text,...
### MySQL正则表达式详解 #### 一、引言 MySQL作为一款广泛使用的数据库管理系统,在进行数据查询时提供了丰富的功能支持。其中,正则表达式是处理文本数据的强大工具之一,能够帮助用户更加灵活地进行数据筛选。...
示例可能包括了不同类型的正则表达式以及它们在截取字符串时的具体用法,这对于提升你在处理字符串和数据解析方面的技能非常有帮助。 这个压缩包中的“Regex”文件可能包含了一个或多个Java源代码文件,这些文件...
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这 些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一 种过滤逻辑(可以用来做检索,截取或者替换...
使用JS正则表达式,选取video元素的src属性的值,利用jQuery选取元素
从中截取字符串.asp 从中截取字符串 切分字符串.asp 切分字符串 删除字符串前后导空格.asp 删除字符串前导空格.asp 删除字符串后导空格.asp 反向截取字符串.asp ...
VB.NET提供了丰富的字符串方法,如`Substring`用于截取字符串,`Trim`和`TrimEnd`用于去除字符串两侧或尾部的空白字符,`Replace`用于替换特定子串,以及`Split`用于将字符串分割成数组等。了解这些基础操作是提升...
《VB字符串和正则表达式参考手册》是一本专注于Visual Basic(VB)编程语言中字符串操作和正则表达式使用的专业指南。VB是Microsoft开发的一种编程环境,广泛应用于Windows应用程序的开发,而字符串处理和正则表达式...
正则表达式则是一种强大的文本匹配工具,它允许我们在字符串中搜索、匹配和提取特定的文本模式。 ### 字符串处理 PHP提供了丰富的字符串处理函数,从基本的字符操作到复杂的文本转换,涵盖了日常开发中常见的需求...
正则表达式是一种逻辑公式,用于对字符串进行操作,包括检索、截取、替换等操作。正则表达式由特定字符和其组合组成,遵循一定的语法规则,具有很强的灵活性和功能性。 正则表达式的应用场景非常广泛,例如电子邮件...
在JavaScript中,正则表达式是一种强大且灵活的文本处理工具,它可以用来搜索、匹配和操作字符串。本文将介绍如何使用正则表达式结合replace方法的回调函数功能来获取字符串中特定字符。这一技能在处理字符串数据时...
ORACLE 正则表达式的使用(REGEXP_LIKE REGEXP_INSTR REGEXP_SUBSTR REGEXP_REPLACE)
字符串处理和正则表达式是C#中两个非常关键的概念,它们在数据处理、文本分析和验证等方面发挥着重要作用。本参考手册旨在深入解析C#中的字符串操作与正则表达式使用,帮助你提升在这两个领域的专业技能。 ### C# ...
在iOS开发中,正则表达式是一种强大的工具,用于处理字符串和数据验证。本文将深入探讨正则表达式在iOS中的应用以及三种不同的正则表达式实现方式,并进行比较。 一、正则表达式基础 1. 定义:正则表达式(Regular...
《C#字符串和正则表达式参考手册》是针对编程语言C#中关于字符串操作和正则表达式使用的详尽指南。在C#中,字符串是处理文本数据的基础,而正则表达式则是进行复杂文本匹配和处理的利器。本手册深入浅出地介绍了这两...
1. 正则表达式基础:了解基本的元字符(如`.`、`^`、`$`、`*`、`+`、`?`、`|`、`()`、`[]`、`\`)及其含义。 2. 如何在UiPath中设置和使用正则表达式活动。 3. 匹配和提取:学习如何在文本中查找匹配的模式,并提取...
3. **内置方法**:VB.Net提供了一系列内置方法来处理字符串,例如`Substring`(截取子字符串)、`ToLower`/`ToUpper`(转换大小写)、`Trim`(去除两端空白)等。 ### 二、正则表达式 正则表达式(Regular ...