`
z75148885
  • 浏览: 191570 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

一个java正规表达式工具类

阅读更多

转自:http://www.iteye.com/topic/67398

今天加班,一个同事让我给他讲解一下正规表达式的用法。

猛然想起两年写了一个java的正规表达式的java工具类,分享一下,有用到的欢迎下载使用。

如果你有常用的定义好的,且测试通过的正规表达式,欢迎跟贴,也让我享用一下.

类中用到了 jakarta-oro-2.0.jar 包,请大家自己在 apache网站下下载

在这是junit测试单元类我就不提交了,在main()方法中有几个小测试,有兴趣自己玩吧.

这个工具类目前主要有25种正规表达式(有些不常用,但那时才仔细深入的研究了一下正规,写上瘾了,就当时能想到的都写了):

1.匹配图象; 2 匹配email地址; 3 匹配匹配并提取url; 4 匹配并提取http;

5.匹配日期 6 匹配电话; 7 匹配身份证 8 匹配邮编代码

9. 不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 左尖括号< 反斜杠\ 即空格,制表符,回车符等

10 匹配非负整数(正整数 + 0) 11 匹配不包括零的非负整数(正整数 > 0)

12 匹配正整数 13 匹配非正整数(负整数 + 0)

14 匹配负整数; 15. 匹配整数;

16 匹配非负浮点数(正浮点数 + 0)17. 匹配正浮点数

18 匹配非正浮点数(负浮点数 + 0)19 匹配负浮点数;

20 .匹配浮点数; 21. 匹配由26个英文字母组成的字符串;

22. 匹配由26个英文字母的大写组成的字符串 23 匹配由26个英文字母的小写组成的字符串

24 匹配由数字和26个英文字母组成的字符串; 25 匹配由数字、26个英文字母或者下划线组成的字符串;

代码:


package com.ygj.util;

import java.util.*;

import org.apache.oro.text.regex.*;


/**
* 类简介: 使用正则表达式验证数据或提取数据,类中的方法全为静态的
* 主要方法:1. isHardRegexpValidate(String source, String regexp)
区分大小写敏感的正规表达式批配 * 2. isSoftRegexpValidate(String source, String regexp)
* 不区分大小写的正规表达式批配
* 3. getHardRegexpMatchResult(String source, String regexp)
* 返回许要的批配结果集(大小写敏感的正规表达式批配)
* 4. getSoftRegexpMatchResult(String source, String regexp)
* 返回许要的批配结果集(不区分大小写的正规表达式批配)
* 5 getHardRegexpArray(String source, String regexp)
* 返回许要的批配结果集(大小写敏感的正规表达式批配)
* 6. getSoftRegexpMatchResult(String source, String regexp)
* 返回许要的批配结果集(不区分大小写的正规表达式批配)
* 7. getBetweenSeparatorStr(final String originStr,final char leftSeparator,final char rightSeparator)
* 得到指定分隔符中间的字符串的集合
*
* @mail wuzhi2000@hotmail.com
* @author ygj
*
*/
public final class Regexp
{

/** 保放有四组对应分隔符 */
static final Set SEPARATOR_SET=new TreeSet();
{
SEPARATOR_SET.add("(");
SEPARATOR_SET.add(")");
SEPARATOR_SET.add("[");
SEPARATOR_SET.add("]");
SEPARATOR_SET.add("{");
SEPARATOR_SET.add("}");
SEPARATOR_SET.add("<"</span><span>); </span> </li> <li class=""><span> SEPARATOR_SET.add(</span><span class="string">">");
}


/** 存放各种正规表达式(以key->value的形式) */
public static HashMap regexpHash = new HashMap();

/** 存放各种正规表达式(以key->value的形式) */
public static List matchingResultList = new ArrayList();

private Regexp()
{

}
/**
* 返回 Regexp 实例
* @return
*/
public static Regexp getInstance()
{
return new Regexp();
}

/**
* 匹配图象

*
* 格式: /相对路径/文件名.后缀 (后缀为gif,dmp,png)
*
* 匹配 : /forum/head_icon/admini2005111_ff.gif 或 admini2005111.dmp

*
* 不匹配: c:/admins4512.gif
*
*/
public static final String icon_regexp = "^(/{0,1}\\w){1,}\\.(gif|dmp|png|jpg)$|^\\w{1,}\\.(gif|dmp|png|jpg)$";

/**
* 匹配email地址

*
* 格式: XXX@XXX.XXX.XX
*
* 匹配 : foo@bar.comfoobar@foobar.com.au

*
* 不匹配: foo@bar$$$@bar.com
*
*/
public static final String email_regexp = "(?:\\w[-._\\w]*\\w@\\w[-._\\w]*\\w\\.\\w{2,3}$)";

/**
* 匹配匹配并提取url

*
* 格式: XXXX://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX
*
* 匹配 : http://www.suncer.comnews://www

*
* 提取(MatchResult matchResult=matcher.getMatch()):
* matchResult.group(0)= http://www.suncer.com:8080/index.html?login=true
* matchResult.group(1) = http
* matchResult.group(2) = www.suncer.com
* matchResult.group(3) = :8080
* matchResult.group(4) = /index.html?login=true
*
* 不匹配: c:\window
*
*/
public static final String url_regexp = "(\\w+)://([^/:]+)(:\\d*)?([^#\\s]*)";

/**
* 匹配并提取http

*
* 格式: http://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXXftp://XXX.XXX.XXXhttps://XXX
*
* 匹配 : http://www.suncer.com:8080/index.html?login=true

*
* 提取(MatchResult matchResult=matcher.getMatch()):
* matchResult.group(0)= http://www.suncer.com:8080/index.html?login=true
* matchResult.group(1) = http
* matchResult.group(2) = www.suncer.com
* matchResult.group(3) = :8080
* matchResult.group(4) = /index.html?login=true
*
* 不匹配: news://www
*
*/
public static final String http_regexp = "(http|https|ftp)://([^/:]+)(:\\d*)?([^#\\s]*)";

/**
* 匹配日期

*
* 格式(首位不为0): XXXX-XX-XX 或 XXXX XX XX 或 XXXX-X-X

*
* 范围:1900--2099

*
* 匹配 : 2005-04-04

*
* 不匹配: 01-01-01
*
*/
public static final String date_regexp = "^((((19){1}|(20){1})d{2})|d{2})[-\\s]{1}[01]{1}d{1}[-\\s]{1}[0-3]{1}d{1}$";// 匹配日期

/**
* 匹配电话

*
* 格式为: 0XXX-XXXXXX(10-13位首位必须为0) 或0XXX XXXXXXX(10-13位首位必须为0) 或

* (0XXX)XXXXXXXX(11-14位首位必须为0) 或 XXXXXXXX(6-8位首位不为0) 或
* XXXXXXXXXXX(11位首位不为0)

*
* 匹配 : 0371-123456 或 (0371)1234567 或 (0371)12345678 或 010-123456 或
* 010-12345678 或 12345678912

*
* 不匹配: 1111-134355 或 0123456789
*
*/
public static final String phone_regexp = "^(?:0[0-9]{2,3}[-\\s]{1}|\\(0[0-9]{2,4}\\))[0-9]{6,8}$|^[1-9]{1}[0-9]{5,7}$|^[1-9]{1}[0-9]{10}$";

/**
* 匹配身份证

*
* 格式为: XXXXXXXXXX(10位) 或 XXXXXXXXXXXXX(13位) 或 XXXXXXXXXXXXXXX(15位) 或
* XXXXXXXXXXXXXXXXXX(18位)

*
* 匹配 : 0123456789123

*
* 不匹配: 0123456
*
*/
public static final String ID_card_regexp = "^\\d{10}|\\d{13}|\\d{15}|\\d{18}$";

/**
* 匹配邮编代码

*
* 格式为: XXXXXX(6位)

*
* 匹配 : 012345

*
* 不匹配: 0123456
*
*/
public static final String ZIP_regexp = "^[0-9]{6}$";// 匹配邮编代码


/**
* 不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 左尖括号< 反斜杠\ 即空格,制表符,回车符等 )

*
* 格式为: x 或 一个一上的字符

*
* 匹配 : 012345

*
* 不匹配: 0123456
*
*/
public static final String non_special_char_regexp = "^[^'\"\\;,:-<>\\s].+$";// 匹配邮编代码


/**
* 匹配非负整数(正整数 + 0)
*/
public static final String non_negative_integers_regexp = "^\\d+$";

/**
* 匹配不包括零的非负整数(正整数 > 0)
*/
public static final String non_zero_negative_integers_regexp = "^[1-9]+\\d*$";

/**
*
* 匹配正整数
*
*/
public static final String positive_integer_regexp = "^[0-9]*[1-9][0-9]*$";

/**
*
* 匹配非正整数(负整数 + 0)
*
*/
public static final String non_positive_integers_regexp = "^((-\\d+)|(0+))$";

/**
*
* 匹配负整数
*
*/
public static final String negative_integers_regexp = "^-[0-9]*[1-9][0-9]*$";

/**
*
* 匹配整数
*
*/
public static final String integer_regexp = "^-?\\d+$";

/**
*
* 匹配非负浮点数(正浮点数 + 0)
*
*/
public static final String non_negative_rational_numbers_regexp = "^\\d+(\\.\\d+)?$";

/**
*
* 匹配正浮点数
*
*/
public static final String positive_rational_numbers_regexp = "^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$";

/**
*
* 匹配非正浮点数(负浮点数 + 0)
*
*/
public static final String non_positive_rational_numbers_regexp = "^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$";

/**
*
* 匹配负浮点数
*
*/
public static final String negative_rational_numbers_regexp = "^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$";

/**
*
* 匹配浮点数
*
*/
public static final String rational_numbers_regexp = "^(-?\\d+)(\\.\\d+)?$";

/**
*
* 匹配由26个英文字母组成的字符串
*
*/
public static final String letter_regexp = "^[A-Za-z]+$";

/**
*
* 匹配由26个英文字母的大写组成的字符串
*
*/
public static final String upward_letter_regexp = "^[A-Z]+$";

/**
*
* 匹配由26个英文字母的小写组成的字符串
*
*/
public static final String lower_letter_regexp = "^[a-z]+$";

/**
*
* 匹配由数字和26个英文字母组成的字符串
*
*/
public static final String letter_number_regexp = "^[A-Za-z0-9]+$";

/**
*
* 匹配由数字、26个英文字母或者下划线组成的字符串
*
*/
public static final String letter_number_underline_regexp = "^\\w+$";

/**
* 添加正规表达式 (以key->value的形式存储)
*
* @param regexpName
* 该正规表达式名称 `
* @param regexp
* 该正规表达式内容
*/
public void putRegexpHash(String regexpName, String regexp)
{
regexpHash.put(regexpName, regexp);
}

/**
* 得到正规表达式内容 (通过key名提取出value[正规表达式内容])
*
* @param regexpName
* 正规表达式名称
*
* @return 正规表达式内容
*/
public String getRegexpHash(String regexpName)
{
if (regexpHash.get(regexpName) != null)
{
return ((String) regexpHash.get(regexpName));
}
else
{
System.out.println("在regexpHash中没有此正规表达式");
return "";
}
}

/**
* 清除正规表达式存放单元
*/
public void clearRegexpHash()
{
regexpHash.clear();
return;
}

/**
* 大小写敏感的正规表达式批配
*
* @param source
* 批配的源字符串
*
* @param regexp
* 批配的正规表达式
*
* @return 如果源字符串符合要求返回真,否则返回假 如: Regexp.isHardRegexpValidate("ygj@suncer.com.cn",email_regexp) 返回真
*/
public static boolean isHardRegexpValidate(String source, String regexp)
{

try
{
// 用于定义正规表达式对象模板类型
PatternCompiler compiler = new Perl5Compiler();

// 正规表达式比较批配对象
PatternMatcher matcher = new Perl5Matcher();

// 实例大小大小写敏感的正规表达式模板
Pattern hardPattern = compiler.compile(regexp);

// 返回批配结果
return matcher.contains(source, hardPattern);

}
catch (MalformedPatternException e)
{
e.printStackTrace();

}
return false;
}


分享到:
评论

相关推荐

    一个java正则表达式工具类.txt

    一个java正规表达式工具类 关键字: 一个java正规表达式工具类 猛然想起两年写了一个java的正规表达式的java工具类,分享一下,有用到的欢迎下载使用。 如果你有常用的定义好的,且测试通过的正规表达式,欢迎跟贴...

    详解java正规表达式工具类

    Java正则表达式工具类是Java编程语言中用于处理字符串模式匹配的重要组成部分。在Java中,正则表达式主要用于文本的查找、替换和分割等操作,极大地提升了代码的灵活性和效率。本文将深入探讨Java中的正则表达式工具...

    java的正规表达式的java工具类

    分享一个java的正规表达式的java工具类,有用到的欢迎下载使用。类中用到了 jakarta-oro-2.0.jar 包,这个工具类目前主要有25种正规表达式(有些不常用,但那时才仔细深入的研究了一下正规,写上瘾了,就当时能想到的...

    功能强大的Java正则表达式工具类,有这个就够了

    类中的方法全为静态的在这里,我将这个类定义成了一个单例,(本来只有static方法是不new去对象的,也就用不到单例了)是因为有一个 regexpHash(HashMap实例),为了可以动态添加正规表达式,不知道是不是想的太多了:) ...

    一个java正则表达式工具类源代码.zip(内含Regexp.java文件)

    以前写了一个java的正规表达式的java工具类,分享一下,有用到的欢迎下载使用。 如果你有常用的定义好的,且测试通过的正规表达式,欢迎跟贴,也让我享用一下 . 类中用到了 jakarta-oro-2.0.jar 包,请大家自己在 ...

    java正规表达式

    总之,Java正规表达式是编程中不可或缺的一部分,无论是简单的字符匹配还是复杂的文本处理,都能发挥其强大功能。通过学习正规表达式的语法和Java中的相关API,开发者可以更高效地处理字符串,提升代码质量。

    正规表达式 Regex

    例如,“regex”是一个简单的正规表达式,它匹配文本“regex”。 #### 二、元字符与操作符 - **元字符**:这些特殊字符在正规表达式中有特定含义。 - `.`:匹配任何单个字符(除换行符外)。 - `^`:匹配输入...

    Java正则表达式入门

    一个正则表达式是由普通字符(如字母a到z)和特殊字符(元字符)组成的文字模式,用于描述在文本中待匹配的一个或多个字符串。 正则表达式作为一种模板,能够帮助我们识别出符合特定模式的文本串。Java自JDK 1.4起...

    Java 正则表达式详解

    Java 正则表达式是Java语言中用于处理文本和匹配模式的强大工具。它们基于正规语法,可以用来查找、替换或分割字符串,具有高度灵活性和精确性。正则表达式在许多编程语言中都有应用,包括Perl、PHP、Python、...

    Java正则表达式详解

    Java正则表达式是Java语言中用于处理文本和匹配模式的重要工具。正则表达式,又称正规表示式或正规表达项,是一种模式匹配语言,它由一系列字符构成,用于定义要在文本中查找的模式。Java虽然在早期版本中没有内置...

    JAVA正则表达式入门

    自JDK 1.4引入`java.util.regex`包以来,Java开发者有了一个完善的正则表达式应用平台。 #### 二、基本概念 **正则表达式**是一种用于模式匹配和替换的标准规范。它由普通字符(如a-z)和特殊字符(也称为元字符)...

    java正则表达式详解.pdf

    正则表达式,又称正规表达式或正则式,是一种模式匹配语言,它由特定字符构成的字符串,用于定义查找字符串的模式。在Java中,正则表达式支持多种特性,包括: 1. **句点符号 (.)**:句点符号匹配任意单个字符,...

    Java正则表达式的10大问题.pdf

    匹配NBN序列(相同数量的A和B)是一个非正规语言问题,但Java正则表达式引擎可以处理某些非正规语言。这里使用前瞻断言和自我引用实现: ```java Pattern p = Pattern.compile("(?x)(?(?:(?:(?^)|(?))(?=(?:A)*(?))|...

    java .net 正则表达式调试器

    本文将围绕“Java .NET 正则表达式调试器”展开讨论,该调试器是基于.NET Framework构建的,旨在为开发者提供一个便捷的测试和调试环境。 首先,我们来探讨正则表达式的基本概念。正则表达式,又称规则表达式或正规...

    java正则表达式

    总之,Java正则表达式是一个强大且灵活的工具,可用于处理和分析各种文本数据。掌握其基本语法和用法,能够极大提升文本处理的能力。在实际开发中,结合Java内置的`java.util.regex`包,可以实现复杂的文本匹配和...

Global site tag (gtag.js) - Google Analytics