`

Java正则表达式工具类实例

 
阅读更多

Java正则表达式工具类实例

 

 

 

 

以前写了一个Java的正规表达式的Java工具类,分享一下,有用到的欢迎下载使用。如果你有常用的定义好的,且测试通过的正规表达式,欢迎跟贴,也让我享用一下类中用到了 jakarta-oro-2.0.jar包,请大家自己在 apache网站下下载

在这是junit测试单元类我就不提交了,在main()方法中有几个小测试,有兴趣自己玩吧.

这个Java正则表达式工具类目前主要有25种正规表达式,有些不常用,这里只列出15种常用Java正则表达式功能。
1.匹配图象;                      
2 匹配email地址;                    
3 匹配匹配并提取url ;                         
4 匹配并提取http ;
5.匹配日期                       
6 匹配电话;                               
7 匹配身份证                                       
8 匹配邮编代码
9. 不包括特殊字符的匹配
10 匹配非负整数(正整数 + 0)                                         
11 匹配不包括零的非负整数(正整数 > 0)
12 匹配正整数                                                                      
13  匹配非正整数(负整数 + 0)                                                
14 匹配负整数;                                                                      
15.匹配整数

 

package com.ygj.util;      
     
import java.util.*;      
     
import org.apache.oro.text.regex.*;      
    
     
/**     
 * 类简介: 使用正则表达式验证数据或提取数据,类中的方法全为静态的  
 * 主要方法:1. isHardRegexpValidate(String source, String regexp)     
              区分大小写敏感的正规表达式批配    *          2. isSoftRegexpValidate(String source, String regexp)     
 *             不区分大小写的正规表达式批配     
 *          3. getHardRegexpMatchResult(String source, String regexp)     
 *             返回许要的批配结果集(大小写敏感的正规表达式批配)     
 *          4. getSoftRegexpMatchResult(String source, String regexp)     
 *             返回许要的批配结果集(不区分大小写的正规表达式批配)     
 *          5  getHardRegexpArray(String source, String regexp)     
 *             返回许要的批配结果集(大小写敏感的正规表达式批配)     
 *          6. getSoftRegexpMatchResult(String source, String regexp)     
 *             返回许要的批配结果集(不区分大小写的正规表达式批配)     
 *          7.  getBetweenSeparatorStr(final String originStr,final char leftSeparator,final char rightSeparator)     
 *             得到指定分隔符中间的字符串的集合     
 *     
 * @mail wuzhi2000@hotmail.com     
 * @author ygj     
 *     
 */     
public final class Regexp      
{      
     
    /**  保放有四组对应分隔符 */     
    static final  Set SEPARATOR_SET=new TreeSet();      
    {      
               SEPARATOR_SET.add("(");      
               SEPARATOR_SET.add(")");      
               SEPARATOR_SET.add("[");      
               SEPARATOR_SET.add("]");      
               SEPARATOR_SET.add("{");      
               SEPARATOR_SET.add("}");      
               SEPARATOR_SET.add("<");      
               SEPARATOR_SET.add(">");      
    }      
     
     
    /** 存放各种正规表达式(以key->value的形式) */     
     public static HashMap regexpHash = new HashMap();      
     
    /** 存放各种正规表达式(以key->value的形式) */     
    public static  List matchingResultList = new ArrayList();      
     
   private       Regexp()      
    {      
     
    }      
    /**     
     * 返回 Regexp 实例     
     * @return     
     */     
    public static Regexp getInstance()      
    {      
        return new Regexp();      
    }      
     
    /**     
     * 匹配图象   
    
     *     
     * 格式: /相对路径/文件名.后缀 (后缀为gif,dmp,png)     
     *     
     * 匹配 : /forum/head_icon/admini2005111_ff.gif 或 admini2005111.dmp  
    
     *     
     * 不匹配: c:/admins4512.gif     
     *     
     */     
    public static final String icon_regexp = "^(/{0,1}\\w){1,}\\.(gif|dmp|png|jpg)$|^\\w{1,}\\.(gif|dmp|png|jpg)$";      
     
    /**     
     * 匹配email地址   
    
     *     
     * 格式: XXX@XXX.XXX.XX     
     *     
     * 匹配 : foo@bar.com 或 foobar@foobar.com.au   
    
     *     
     * 不匹配: foo@bar 或 $$$@bar.com     
     *     
     */     
    public static final String email_regexp = "(?:\\w[-._\\w]*\\w@\\w[-._\\w]*\\w\\.\\w{2,3}$)";      
     
    /**     
     * 匹配匹配并提取url   
    
     *     
     * 格式: XXXX://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX     
     *     
     * 匹配 : http://www.suncer.com 或news://www  
    
     *     
     * 提取(MatchResult matchResult=matcher.getMatch()):     
     *              matchResult.group(0)= http://www.suncer.com:8080/index.html?login=true     
     *              matchResult.group(1) = http     
     *              matchResult.group(2) = www.suncer.com     
     *              matchResult.group(3) = :8080     
     *              matchResult.group(4) = /index.html?login=true     
     *     
     * 不匹配: c:\window     
     *     
     */     
    public static final String url_regexp = "(\\w+)://([^/:]+)(:\\d*)?([^#\\s]*)";      
     
    /**     
     * 匹配并提取http   
    
     *     
     * 格式: http://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX 或 ftp://XXX.XXX.XXX 或 https://XXX     
     *     
     * 匹配 : http://www.suncer.com:8080/index.html?login=true  
    
     *     
     * 提取(MatchResult matchResult=matcher.getMatch()):     
     *              matchResult.group(0)= http://www.suncer.com:8080/index.html?login=true     
     *              matchResult.group(1) = http     
     *              matchResult.group(2) = www.suncer.com     
     *              matchResult.group(3) = :8080     
     *              matchResult.group(4) = /index.html?login=true     
     *     
     * 不匹配: news://www     
     *     
     */     
    public static final String http_regexp = "(http|https|ftp)://([^/:]+)(:\\d*)?([^#\\s]*)";      
     
    /**     
     * 匹配日期   
    
     *     
     * 格式(首位不为0): XXXX-XX-XX 或 XXXX XX XX 或 XXXX-X-X   
    
     *     
     * 范围:1900--2099   
    
     *     
     * 匹配 : 2005-04-04   
    
     *     
     * 不匹配: 01-01-01     
     *     
     */     
    public static final String date_regexp = "^((((19){1}|(20){1})d{2})|d{2})[-\\s]{1}[01]{1}d{1}[-\\s]{1}[0-3]{1}d{1}$";// 匹配日期      
     
    /**     
     * 匹配电话   
    
     *     
     * 格式为: 0XXX-XXXXXX(10-13位首位必须为0) 或0XXX XXXXXXX(10-13位首位必须为0) 或   
    
     * (0XXX)XXXXXXXX(11-14位首位必须为0) 或 XXXXXXXX(6-8位首位不为0) 或     
     * XXXXXXXXXXX(11位首位不为0)   
    
     *     
     * 匹配 : 0371-123456 或 (0371)1234567 或 (0371)12345678 或 010-123456 或     
     * 010-12345678 或 12345678912   
    
     *     
     * 不匹配: 1111-134355 或 0123456789     
     *     
     */     
    public static final String phone_regexp = "^(?:0[0-9]{2,3}[-\\s]{1}|\\(0[0-9]{2,4}\\))[0-9]{6,8}$
|^[1-9]{1}[0-9]{5,7}$|^[1-9]{1}[0-9]{10}$";      
     
    /**     
     * 匹配身份证   
    
     *     
     * 格式为: XXXXXXXXXX(10位) 或 XXXXXXXXXXXXX(13位) 或 XXXXXXXXXXXXXXX(15位) 或     
     * XXXXXXXXXXXXXXXXXX(18位)   
    
     *     
     * 匹配 : 0123456789123   
    
     *     
     * 不匹配: 0123456     
     *     
     */     
    public static final String ID_card_regexp = "^\\d{10}|\\d{13}|\\d{15}|\\d{18}$";      
     
    /**     
     * 匹配邮编代码   
    
     *     
     * 格式为: XXXXXX(6位)   
    
     *     
     * 匹配 : 012345   
    
     *     
     * 不匹配: 0123456     
     *     
     */     
    public static final String ZIP_regexp = "^[0-9]{6}$";// 匹配邮编代码      
     
     
    /**     
     * 不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 
左尖括号<  反斜杠\ 即空格,制表符,回车符等 )  
    
     *     
     * 格式为: x 或 一个一上的字符   
    
     *     
     * 匹配 : 012345   
    
     *     
     * 不匹配: 0123456     
     *     
     */     
    public static final String non_special_char_regexp = "^[^'\"\\;,:-<>\\s].+$";// 匹配邮编代码      
     
     
    /**     
     * 匹配非负整数(正整数 + 0)     
     */     
    public static final String non_negative_integers_regexp = "^\\d+$";      
     
    /**     
     * 匹配不包括零的非负整数(正整数 > 0)     
     */     
    public static final String non_zero_negative_integers_regexp = "^[1-9]+\\d*$";      
     
    /**     
     *     
     * 匹配正整数     
     *     
     */     
    public static final String positive_integer_regexp = "^[0-9]*[1-9][0-9]*$";      
     
    /**     
     *     
     * 匹配非正整数(负整数 + 0)     
     *     
     */     
    public static final String non_positive_integers_regexp = "^((-\\d+)|(0+))$";      
     
    /**     
     *     
     * 匹配负整数     
     *     
     */     
    public static final String negative_integers_regexp = "^-[0-9]*[1-9][0-9]*$";      
     
    /**     
     *     
     * 匹配整数     
     *     
     */     
    public static final String integer_regexp = "^-?\\d+$";      
     
    /**     
     *     
     * 匹配非负浮点数(正浮点数 + 0)     
     *     
     */     
    public static final String non_negative_rational_numbers_regexp = "^\\d+(\\.\\d+)?$";      
     
    /**     
     *     
     * 匹配正浮点数     
     *     
     */     
    public static final String positive_rational_numbers_regexp = "^(([0-9]+\\.[0-9]*[1-9][0-9]*)
|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$";      
     
    /**     
     *     
     * 匹配非正浮点数(负浮点数 + 0)     
     *     
     */     
    public static final String non_positive_rational_numbers_regexp = "^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$";      
     
    /**     
     *     
     * 匹配负浮点数     
     *     
     */     
    public static final String negative_rational_numbers_regexp = "^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)
|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$";      
     
    /**     
     *     
     * 匹配浮点数     
     *     
     */     
    public static final String rational_numbers_regexp = "^(-?\\d+)(\\.\\d+)?$";      
     
    /**     
     *     
     * 匹配由26个英文字母组成的字符串     
     *     
     */     
    public static final String letter_regexp = "^[A-Za-z]+$";      
     
    /**     
     *     
     * 匹配由26个英文字母的大写组成的字符串     
     *     
     */     
    public static final String upward_letter_regexp = "^[A-Z]+$";      
     
    /**     
     *     
     * 匹配由26个英文字母的小写组成的字符串     
     *     
     */     
    public static final String lower_letter_regexp = "^[a-z]+$";      
     
    /**     
     *     
     * 匹配由数字和26个英文字母组成的字符串     
     *     
     */     
    public static final String letter_number_regexp = "^[A-Za-z0-9]+$";      
     
    /**     
     *     
     * 匹配由数字、26个英文字母或者下划线组成的字符串     
     *     
     */     
    public static final String letter_number_underline_regexp = "^\\w+$";      
     
    /**     
     * 添加正规表达式 (以key->value的形式存储)     
     *     
     * @param regexpName     
     *            该正规表达式名称 `     
     * @param regexp     
     *            该正规表达式内容     
     */     
    public void putRegexpHash(String regexpName, String regexp)      
    {      
        regexpHash.put(regexpName, regexp);      
    }      
     
    /**     
     * 得到正规表达式内容 (通过key名提取出value[正规表达式内容])     
     *     
     * @param regexpName     
     *            正规表达式名称     
     *     
     * @return 正规表达式内容     
     */     
    public String getRegexpHash(String regexpName)      
    {      
        if (regexpHash.get(regexpName) != null)      
        {      
            return ((String) regexpHash.get(regexpName));      
        }      
        else     
        {      
            System.out.println("在regexpHash中没有此正规表达式");      
            return "";      
        }      
    }      
     
    /**     
     * 清除正规表达式存放单元     
     */     
    public void clearRegexpHash()      
    {      
        regexpHash.clear();      
        return;      
    }      
     
    /**     
     * 大小写敏感的正规表达式批配     
     *     
     * @param source     
     *            批配的源字符串     
     *     
     * @param regexp     
     *            批配的正规表达式     
     *     
     * @return 如果源字符串符合要求返回真,否则返回假 如:  Regexp.isHardRegexpValidate("ygj@suncer.com.cn",email_regexp) 返回真     
     */     
    public static boolean isHardRegexpValidate(String source, String regexp)      
    {      
     
        try     
        {      
            // 用于定义正规表达式对象模板类型      
            PatternCompiler compiler = new Perl5Compiler();      
     
            // 正规表达式比较批配对象      
            PatternMatcher matcher = new Perl5Matcher();      
     
            // 实例大小大小写敏感的正规表达式模板      
            Pattern hardPattern = compiler.compile(regexp);      
     
            // 返回批配结果      
            return matcher.contains(source, hardPattern);      
     
        }      
        catch (MalformedPatternException e)      
        {      
            e.printStackTrace();      
     
        }      
        return false;      
    }     

 转 http://developer.51cto.com/art/200906/127994.htm

上面的工具类代码包含了常用Java正则表达式功能,稍加调试就可以满足实际项目中的需求。

分享到:
评论

相关推荐

    java正则表达式.zip

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它基于模式匹配的概念,能够高效地进行文本搜索、替换和解析。在Java中,正则表达式主要通过`java.util.regex`包来实现,提供了Pattern和Matcher两个核心...

    java正则表达式匹配工具

    Java正则表达式匹配工具是IT领域中一种强大的文本处理工具,它利用正则表达式(Regular Expression)的规则来查找、替换或者提取文本中的特定模式。正则表达式是一种特殊的字符序列,能够帮助程序员或者用户高效地...

    java正则表达式实例教程

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。本教程将深入讲解Java中的正则表达式,并提供丰富的实例来帮助开发者理解和应用这些概念。 1. 正则...

    Java正则表达式测试工具

    Java正则表达式测试工具是面向开发者和爱好者的一款实用程序,它可以帮助用户验证和调试他们的正则表达式。在Java编程环境中,正则表达式是一个强大的字符串处理工具,广泛用于数据验证、文本搜索和替换等任务。这款...

    java 正则表达式应用jar包 regex-smart.jar

    Java正则表达式是编程语言Java中的一个强大工具,它用于模式匹配、数据验证和文本检索替换。在Java中,正则表达式是通过java.util.regex包提供的接口和类来实现的。`regex-smart.jar`这个库显然是为了简化开发者在...

    Java正则表达式应用总结

    Java正则表达式是编程语言Java中用于处理字符串和文本的强大工具。它允许开发者通过模式匹配来执行复杂的文本分析和操作。在Java中,正则表达式的操作主要涉及两个核心类:`java.util.regex.Matcher`和`java.util....

    常用正则表达式HTML,JAVA合集

    这个合集提供的HTML和Java正则表达式实例,为开发者提供了一个快速参考的工具,帮助他们在开发过程中快速有效地实现数据验证功能。理解并熟练运用这些正则表达式,对于提高代码质量和用户体验都有极大的帮助。在实际...

    Java正则表达式详细讲解

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。在Java中,正则表达式是通过`java.util.regex`包提供的API来实现的。本讲解将深入探讨Java正则表达式的...

    Java正则表达式的使用实例

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。在Java中,正则表达式是通过`java.util.regex`包中的类和接口实现的。本实例将深入探讨如何在Java中...

    Java正则表达式详解(非常适合入门

    这种设计使得Java正则表达式既保留了Perl的强大功能,又融入了Java自身的特性,成为了一种更加灵活和易于使用的文本处理工具。 #### 三、Java正则表达式的实践学习 学习Java正则表达式,理论与实践并重。通过大量...

    JAVA正则表达式实例教程

    ### JAVA正则表达式实例教程知识点详述 #### 一、正则表达式的定义与特点 **1.1 正则表达式是什么?** - **定义:** 正则表达式(Regular Expression)是一种用于匹配字符串中字符组合的工具,广泛应用于搜索、...

    java正则表达式及例子 pdf

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。正则表达式在各种场景下都有广泛应用,如数据验证、文本提取、搜索替换等。本篇文章将深入探讨Java中的...

    Java根据正则表达式生成字符串—Xeger,automaton

    在Java中,`java.util.regex` 包提供了Pattern和Matcher类来处理正则表达式。然而,对于生成符合正则表达式的字符串,标准库并不提供直接支持。这时,我们可以引入第三方库,如`org.pcollections.Xeger` 和 `...

    Java正则表达式快速学习

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。正则表达式在各种场景下都有广泛应用,如数据验证、文本提取、搜索替换等。本篇文章将深入探讨Java中的...

    java正则表达式详解(PDF)

    Java正则表达式是Java编程语言中的一个强大工具,用于处理字符串模式匹配和搜索替换操作。它是基于Perl和POSIX正则表达式的实现,提供了一种灵活且强大的方式来处理文本数据。本文件"java正则表达式详解(PDF)"深入...

    java 字符串 正则表达式 详细实例代码

    本篇将深入探讨Java中的字符串、正则表达式及其在实际编程中的详细实例代码。 1. **字符串基础** - Java中的字符串是不可变的,这意味着一旦创建了字符串对象,就不能更改其内容。这由`final`关键字确保,提高了...

    JAVA正则表达式实例教程.txt

    Java提供了`java.util.regex`包来支持正则表达式的操作,主要包括`Pattern`和`Matcher`两个类。 4. **正则表达式的局限性?** 学习曲线较陡峭,初学者可能需要时间去理解和掌握其复杂性。同时,过度使用可能导致...

    Java正则表达式入门介绍课件

    Java正则表达式是编程语言Java中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或提取文本。正则表达式在各种场景下都有广泛应用,如数据验证、文本搜索与替换等。本课件旨在为初学者提供一个Java...

    java正则表达式资料下载

    Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。正则表达式在各种场景下都有广泛应用,如数据验证、文本提取、日志分析等。Java中的正则表达式功能主要...

Global site tag (gtag.js) - Google Analytics