使用正则表达式查询一段Html中的Title标签,包括内容!!
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test {
public static void main(String args[]) {
String html = "<title fdsafdsa>ABCD<hrf></title>gsdggas<title>ggds</title>jkll<title fdfdsa>005</title>";
List resultList = getContextByTag(html,"title");
for (Iterator iterator = resultList.iterator(); iterator.hasNext();) {
String context = (String) iterator.next();
System.out.println(context);
}
}
public static List getContextByTag(String html,String tag) {
String reg="<"+tag+"(([^<|^>|.]*>)|( >)).*?</"+tag+">";
List resultList = new ArrayList();
Pattern p = Pattern.compile(reg);
Matcher m = p.matcher(html );
while (m.find()) {
resultList.add(m.group());
}
return resultList;
}
}
结果:
<title fdsafdsa>ABCD<hrf></title>
<title>ggds</title>
<title fdfdsa>005</title>
分享到:
相关推荐
正则表达式(Regular Expression)是一种强大的文本处理工具,它能用于搜索、替换以及提取文本中的模式。在处理HTML文本时,正则表达式尤其有用,可以用来查找、替换或提取HTML标签及其内容。以下是对这个主题的详细...
正则表达式是一种强大的文本处理工具,用于模式匹配、搜索、替换等操作,在软件开发、数据处理、网络爬虫等领域有着广泛的应用。在项目中直接使用正则表达式可以极大地提高代码的效率和可读性。以下是对给定文件中的...
【正则表达式与JSP课件】是一个深入讲解Web开发技术的课程资源包,涵盖了JSP、Servlet、J2EE以及正则表达式等多个关键领域。这些知识点在现代Web应用开发中扮演着至关重要的角色。 首先,让我们来探讨一下**正则...
精通正则表达式第三版 搜集于网络 前言..........I 第1章:正则表达式入门.... 1 解决实际问题... 2 作为编程语言的正则表达式... 4 以文件名做类比... 4 以语言做类比... 5 正则表达式的知识框架... 6 对于...
### 正则表达式知识点详解 #### 一、正则表达式基础介绍 正则表达式(Regular Expression),简称regex或regexp,是一种用于处理字符串的强大工具。...希望上述内容能够帮助您更好地理解和应用正则表达式。
正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,用于在字符串中查找、替换或提取符合特定模式的文本。它们是编程语言中的一个子集,虽然初学者可能会感到困惑,但一旦掌握,就能高效地处理...
### 常用的正则表达式解析 #### 1. 整数验证 - **正则表达式**: `1^\d+$` - **描述**: 验证非负整数。 - **应用场景**: 用于检查输入是否为一个或多个数字组成(即非负整数)。 #### 2. 正整数验证 - **正则表达式...
3. **内容查找和替换**:在动态生成HTML时,使用正则表达式查找并替换页面上的特定内容。 4. **URL路由**:在自定义URL路由策略时,可以利用正则表达式匹配不同的URL模式,映射到相应的处理函数。 5. **安全防护**...
5. **内容提取**:在HTML中,`<tag>content</tag>`这样的结构可以使用正则表达式进行内容提取。例如,`(.*?)</p>`可以匹配`<p>`标签内的所有内容,但要注意,这仅适用于没有嵌套标签的情况。 6. **正则表达式引擎与...
下面我们将详细探讨如何利用正则表达式去除HTML标签以及相关的样式,并仅保留纯文本内容。 ### 一、正则表达式简介 正则表达式(Regular Expression)是一种强大的文本处理工具,它由一系列特殊字符和普通字符组成...
为了进一步提升效率,开发者可以将常见的正则表达式模式(如邮箱验证、手机号码验证等)封装成函数或自定义标签库(Tag Library),在多个页面间复用。同时,了解正则表达式的语法和特殊字符,如`.`(匹配任意字符)...
它通过查找开标签`<tag>`和相应的闭合标签`</tag>`,并移除它们之间的所有内容,实现HTML内容的清理。 ### 3. 验证电子邮件地址 正则表达式:`\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*` 描述:这是一个常用...
根据提供的文件信息,我们可以整理出一系列与页面验证相关的正则表达式知识点,这些知识点涵盖了从中文字符验证到电子邮件地址、网址、电话号码等常见输入格式的验证规则。下面将逐一介绍这些知识点,并对其进行详细...
正则表达式是一种强大的文本处理工具,它能够帮助我们从一段复杂的文本中快速地提取出需要的信息。...正则表达式应该用在对HTML结构和语法比较简单的场景中,或者作为处理HTML内容的初期快速解决方案。
在Java编程中,正则表达式是处理字符串的强大工具,尤其在处理HTML文档时,能够高效地提取所需信息。本文将详细介绍如何使用Java基于正则表达式获取指定HTML标签的指定属性值。这个方法适用于那些不想引入额外HTML...
在VB编程环境中,正则表达式(Regular Expression)是一种强大的文本处理工具,它允许程序员以结构化的方式处理字符串,执行复杂的数据验证、搜索和替换任务。VB正则表达式库提供了对正则表达式的支持,使得VB开发者...
5. **模板引擎**:一些模板引擎如FreeMarker或Velocity,它们的配置或模板语法中也支持正则表达式,用于动态内容的处理。 这个压缩包很可能包含JSP的基本教程、实例代码、正则表达式的使用指南,甚至可能有实战项目...
正则表达式是一种强大的文本处理工具,用于在字符串中匹配、查找、替换或提取符合特定模式的文本。它由普通字符和特殊字符(元字符)组成,这些字符构成的模式可以灵活地描述复杂的字符串结构。 在正则表达式中,元...
### Flash AS3.0 中的正则表达式应用详解 #### 标题解析 标题“Flash AS3.0 正则表达式”明确指出本文将介绍Adobe Flash在ActionScript 3.0(简称AS3)环境下的正则表达式的使用方法。 #### 描述解析 描述部分重复...