public class Test {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
String atr="<pre class=\"reply-text mb10\" id=\"content-862802486\" style=\"margin-top:0px;margin-bottom:10px;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;font-family:Arial;white-space:pre-wrap;word-wrap:break-word;zoom:1;font-size:14px;line-height:24px;background-color:#FFFFFF;\">你这个错就错在使用了.*" +
"在正则里.<br/>指的是匹配所有字符,而且是匹配优先,对于你这个正则来说到<a\\shref=\"(http:为止都是正常的,但后面的.*就会一直匹配到文件的最后,因为对于.*来说是匹配所有字符,所以后面的一切都是匹配的.匹配到最后结尾时,再来进行结尾检查,但你的正则是以</a>结尾的,不符合,所以就再回头向回一个个的查,一直查到(.*[^>])中的.*匹配.好了,最后你这个表达式最终的结果其实就是匹配以<a\\shref=\"(http: 开头,以[^>])</a>结尾,中间是任意字符的表达式 </pre>";
System.out.println(splitAndFilterString(atr,100));
}
/**
* 删除input字符串中的html格式
*
* @param input
* @param length
* @return
*/
public static String splitAndFilterString(String input, int length) {
if (input == null || input.trim().equals("")) {
return "";
}
// 去掉所有html元素,
String str = input.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll(
"<[^>]*>", "");
str = str.replaceAll("[(/>)<]", "");
int len = str.length();
if (len <= length) {
return str;
} else {
str = str.substring(0, length);
str += "...";
}
return str;
}
}
分享到:
相关推荐
java 利用正则表达式从字符串中提取省、市、区、镇、乡等区域名称(包含少数民族地区),支持地址中无省,无市,无县情况。
java代码,从image标签中正则匹配取出src标签的内容,java代码,从image标签中正则匹配取出src标签的内容
Java语言中使用正则表达式可以实现去除小数点后面多余的0的功能,这个功能示例主要介绍了Java使用正则表达式去除小数点后面多余的0功能,结合具体实例形式分析了java字符串正则替换相关操作技巧。 一、正则表达式的...
### Java正则表达式过滤HTML标签 在处理文本数据时,经常会遇到需要从HTML文档中提取纯文本内容的需求。为了去除HTML标记并保留有意义的文字部分,可以利用Java中的正则表达式来实现这一功能。本篇文章将详细介绍...
"神器验证正则表达式去除复制代码前的序号"这一主题,主要涉及如何利用正则表达式来解决在编程或文本编辑时遇到的一个常见问题:代码块中的序号。 当我们在网页、文档或者代码仓库中复制代码段时,有时这些代码段会...
总结一下,Java通过正则表达式获取字符串中数字的基本步骤包括:编译正则表达式、创建`Matcher`对象、使用`replaceAll`替换非数字字符、使用`split`分割数字和使用`parseInt`转换数字。这个方法灵活且高效,适用于...
在Java编程中,正则表达式是一种强大的文本处理工具,常用于验证字符串格式、提取信息或进行复杂的查找和替换操作。本篇文章将详细介绍如何使用正则表达式来判断一个字符串是否以字符(字母)开始。 首先,让我们...
- **Java中的正则表达式**:Java提供了java.util.regex包来支持正则表达式的使用。 - **JavaScript中的正则表达式**:JavaScript的正则表达式对象提供了丰富的功能,包括全局匹配、忽略大小写等选项。 - **.NET框架...
在项目中直接使用正则表达式可以极大地提高代码的效率和可读性。以下是对给定文件中的正则表达式知识点的详细解析: ### 1. 匹配中文字符 正则表达式:`[\u4e00-\u9fa5]` 此表达式用于匹配中文字符,其中`\u4e00`...
在Java编程中,正则表达式是处理字符串的强大工具,尤其在处理HTML文档时,能够有效地提取纯文本信息。本文将详细介绍如何使用Java的正则表达式来删除HTML标签,以便提取网页内容的核心部分。 首先,我们需要理解...
例如,Python中的`re`模块、Java中的`java.util.regex`包、JavaScript中的`RegExp`对象等,都提供了丰富的正则表达式功能,使得开发者能够轻松地进行字符串操作。 #### 应用实例 正则表达式的应用十分广泛,以下是...
正则表达式是计算机科学领域中一种用于描述字符串模式的强大工具。它广泛应用于文本搜索、数据验证、字符串替换等多种场景。《正则表达式经典实例》这本书深入浅出地介绍了正则表达式的基本概念和高级特性,并提供了...
根据提供的标题、描述、标签及部分内容,我们可以整理出关于Java正则表达式的多个知识点。以下是对这些内容的详细解析: ### Java正则表达式基础知识 #### 1. 基本概念 - **正则表达式**:一种用于匹配字符串模式...
4. **文本处理**:在自动化脚本中,正则表达式可用于处理文本,如切割字符串、去除空白字符等。 The Regulator作为一款强大的正则表达式工具,它将复杂的正则表达式操作变得简单易用,无论是初学者还是经验丰富的...
正则表达式是一种模式匹配工具,它允许用一种简洁的语法来描述一类字符串。在NLP中,正则表达式常用于识别特定的文本模式,如电子邮件地址、电话号码或特定的词汇结构。例如,使用正则表达式可以轻松找出所有以"the...
Java中的正则表达式是处理字符串的强大工具,它允许我们以模式匹配的方式对字符串进行复杂的查找、替换和分割操作。在Java中,正则表达式的处理主要涉及到两个核心类:`Pattern`和`Matcher`。 `Pattern`类是用于...
从给定的文件信息中,我们可以提取到一系列与Java正则表达式相关的知识点,这些正则表达式主要用于匹配和验证各种格式的字符串。下面将详细解释每个正则表达式的功能和应用场景。 ### 正则表达式知识点 1. **数字...
Java正则表达式教程是为那些想要深入了解Java编程语言中正则表达式使用方法的初学者准备的。正则表达式(Regular Expression)是一种强大的文本处理工具,它用于模式匹配、搜索、替换等操作,广泛应用于字符串处理和...