一个java正规表达式工具类
类中用到了 jakarta-oro-2.0.jar 包,请大家自己在 apache网站下下载
在这是junit测试单元类我就不提交了,在main()方法中有几个小测试,有兴趣自己玩吧.
这个工具类目前主要有25种正规表达式(有些不常用,但那时才仔细深入的研究了一下正规,写上瘾了,就当时能想到的都写了):
匹配图象; 2 匹配email地址; 3 匹配匹配并提取url ; 4 匹配并提取http ;
匹配日期 6 匹配电话; 7 匹配身份证 8 匹配邮编代码
不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 左尖括号< 反斜杠\ 即空格,制表符,回车符等
10 匹配非负整数(正整数 + 0) 11 匹配不包括零的非负整数(正整数 > 0)
12 匹配正整数 13 匹配非正整数(负整数 + 0)
14 匹配负整数; 15. 匹配整数 ;
16 匹配非负浮点数(正浮点数 + 0) 17. 匹配正浮点数
18 匹配非正浮点数(负浮点数 + 0) 19 匹配负浮点数;
20 .匹配浮点数; 21. 匹配由26个英文字母组成的字符串;
匹配由26个英文字母的大写组成的字符串 23 匹配由26个英文字母的小写组成的字符串
24 匹配由数字和26个英文字母组成的字符串; 25 匹配由数字、26个英文字母或者下划线组成的字符串;
1. java 代码
2. import java.util.*;
3. import org.apache.oro.text.regex.*;
4.
5. /**
6. * 类简介: 使用正则表达式验证数据或提取数据,类中的方法全为静态的 主要方法:1. isHardRegexpValidate(String source,
7. * String regexp)
8. *
9. *
10. * 区分大小写敏感的正规表达式批配 2. isSoftRegexpValidate(String source, String regexp)
11. * 不区分大小写的正规表达式批配 3. getHardRegexpMatchResult(String source, String regexp)
12. * 返回许要的批配结果集(大小写敏感的正规表达式批配) 4. getSoftRegexpMatchResult(String source, String
13. * regexp) 返回许要的批配结果集(不区分大小写的正规表达式批配) 5 getHardRegexpArray(String source, String
14. * regexp) 返回许要的批配结果集(大小写敏感的正规表达式批配) 6. getSoftRegexpMatchResult(String source,
15. * String regexp) 返回许要的批配结果集(不区分大小写的正规表达式批配) 7. getBetweenSeparatorStr(final
16. * String originStr,final char leftSeparator,final char rightSeparator)
17. * 得到指定分隔符中间的字符串的集合
18. *
19. * @mail <A href="mailto:wuzhi2000@hotmail.com">wuzhi2000@hotmail.com</A>
20. * @author ygj
21. *
22. */
23. public final class Regexp {
24. /** 保放有四组对应分隔符 */
25. static final Set SEPARATOR_SET = new TreeSet();
26. {
27. SEPARATOR_SET.add("(");
28. SEPARATOR_SET.add(")");
29. SEPARATOR_SET.add("[");
30. SEPARATOR_SET.add("]");
31. SEPARATOR_SET.add("{");
32. SEPARATOR_SET.add("}");
33. SEPARATOR_SET.add("<");
34. SEPARATOR_SET.add(">");
35. }
36. /** 存放各种正规表达式(以key->value的形式) */
37. public static HashMap regexpHash = new HashMap();
38. /** 存放各种正规表达式(以key->value的形式) */
39. public static List matchingResultList = new ArrayList();
40.
41. private Regexp() {
42. }
43.
44. /**
45. * 返回 Regexp 实例
46. *
47. * @return
48. */
49. public static Regexp getInstance() {
50. return new Regexp();
51. }
52.
53. /**
54. * 匹配图象
55. *
56. * 格式: /相对路径/文件名.后缀 (后缀为gif,dmp,png)
57. *
58. * 匹配 : /forum/head_icon/admini2005111_ff.gif 或 admini2005111.dmp
59. *
60. * 不匹配: c:/admins4512.gif
61. *
62. */
63. public static final String icon_regexp = "^(/{0,1}\\w){1,}\\.(gif|dmp|png|jpg)$|^\\w{1,}\\.(gif|dmp|png|jpg)$";
64. /**
65. * 匹配email地址
66. *
67. * 格式: <A href="mailto:XXX@XXX.XXX.XX">XXX@XXX.XXX.XX</A>
68. *
69. * 匹配 : <A href="mailto:foo@bar.com">foo@bar.com</A> 或 < A href="mailto:foobar@foobar.com.au">foobar@foobar.com.au</A>
70. *
71. * 不匹配: foo@bar 或 $$$@bar.com
72. *
73. */
74. public static final String email_regexp = "(?:\\w[-._\\w]*\\w@\\w[-._\\w]*\\w\\.\\w{2,3}$)";
75. /**
76. * 匹配匹配并提取url
77. *
78. * 格式: XXXX://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX
79. *
80. * 匹配 : <A href="http://www.suncer.com" target=_blank>http://www.suncer.com</A> 或news://www
81. *
82. * 提取(MatchResult matchResult=matcher.getMatch()): matchResult.group(0)=
83. * <A href="http://www.suncer.com:8080/index.html?login=true" target=_blank>http://www.suncer.com:8080/index.html?login=true</A> matchResult.group(1) =
84. * http matchResult.group(2) = <A href="www.suncer.com" target=_blank>www.suncer.com</A> matchResult.group(3) = :8080
85. * matchResult.group(4) = /index.html?login=true
86. *
87. * 不匹配: c:\window
88. *
89. */
90. public static final String url_regexp = "(\\w+)://([^/:]+)(:\\d*)?([^#\\s]*)";
91. /**
92. * 匹配并提取http
93. *
94. * 格式: <A href="http://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX" target=_blank> http://XXX.XXX.XXX.XX/XXX.XXX?XXX=XXX</A> 或 <A href="ftp: //XXX.XXX.XXX" target=_blank>ftp://XXX.XXX.XXX</A> 或 https: //XXX
95. *
96. * 匹配 : <A href="http://www.suncer.com:8080/index.html?login=true" target=_blank>http://www.suncer.com:8080/index.html?login=true</A>
97. *
98. * 提取(MatchResult matchResult=matcher.getMatch()): matchResult.group(0)=
99. * <A href="http://www.suncer.com:8080/index.html?login=true" target=_blank>http://www.suncer.com:8080/index.html?login=true</A> matchResult.group(1) =
100. * http matchResult.group(2) = <A href="www.suncer.com" target=_blank>www.suncer.com</A> matchResult.group(3) = :8080
101. * matchResult.group(4) = /index.html?login=true
102. *
103. * 不匹配: news://www
104. *
105. */
106. public static final String http_regexp = "(http|https|ftp)://([^/:]+)(:\\d*)?([^#\\s]*)";
107. /**
108. * 匹配日期
109. *
110. * 格式(首位不为0): XXXX-XX-XX 或 XXXX XX XX 或 XXXX-X-X
111. *
112. * 范围:1900--2099
113. *
114. * 匹配 : 2005-04-04
115. *
116. * 不匹配: 01-01-01
117. *
118. */
119. public static final String date_regexp = "^((((19){1}|(20){1})d{2})|d{2})[-\\s]{1}[01]{1}d{1}[-\\s]{1}[0-3]{1}d{1}$";// 匹配日期
120. /**
121. * 匹配电话
122. *
123. * 格式为: 0XXX-XXXXXX(10-13位首位必须为0) 或0XXX XXXXXXX(10-13位首位必须为0) 或
124. * (0XXX)XXXXXXXX(11-14位首位必须为0) 或 XXXXXXXX(6-8位首位不为0) 或 XXXXXXXXXXX(11位首位不为0)
125. *
126. * 匹配 : 0371-123456 或 (0371)1234567 或 (0371)12345678 或 010-123456 或
127. * 010-12345678 或 12345678912
128. *
129. * 不匹配: 1111-134355 或 0123456789
130. *
131. */
132. public static final String phone_regexp = "^(?:0[0-9]{2,3}[-\\s]{1}|\\(0[0-9]{2,4}\\))[0-9]{6,8}$|^[1-9]{1}[0-9]{5,7}$|^[1-9]{1}[0-9]{10}$";
133. /**
134. * 匹配身份证
135. *
136. * 格式为: XXXXXXXXXX(10位) 或 XXXXXXXXXXXXX(13位) 或 XXXXXXXXXXXXXXX(15位) 或
137. * XXXXXXXXXXXXXXXXXX(18位)
138. *
139. * 匹配 : 0123456789123
140. *
141. * 不匹配: 0123456
142. *
143. */
144. public static final String ID_card_regexp = "^\\d{10}|\\d{13}|\\d{15}|\\d{18}$";
145. /**
146. * 匹配邮编代码
147. *
148. * 格式为: XXXXXX(6位)
149. *
150. * 匹配 : 012345
151. *
152. * 不匹配: 0123456
153. *
154. */
155. public static final String ZIP_regexp = "^[0-9]{6}$";// 匹配邮编代码
156. /**
157. * 不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 左尖括号< 反斜杠\
158. * 即空格,制表符,回车符等 )
159. *
160. * 格式为: x 或 一个一上的字符
161. *
162. * 匹配 : 012345
163. *
164. * 不匹配: 0123456
165. *
166. */
167. public static final String non_special_char_regexp = "^[^'\"\\;,:-<>\\s].+$";// 匹配邮编代码
168. /**
169. * 匹配非负整数(正整数 + 0)
170. */
171. public static final String non_negative_integers_regexp = "^\\d+$";
172. /**
173. * 匹配不包括零的非负整数(正整数 > 0)
174. */
175. public static final String non_zero_negative_integers_regexp = "^[1-9]+\\d*$";
176. /**
177. *
178. * 匹配正整数
179. *
180. */
181. public static final String positive_integer_regexp = "^[0-9]*[1-9][0-9]*$";
182. /**
183. *
184. * 匹配非正整数(负整数 + 0)
185. *
186. */
187. public static final String non_positive_integers_regexp = "^((-\\d+)|(0+))$";
188. /**
189. *
190. * 匹配负整数
191. *
192. */
193. public static final String negative_integers_regexp = "^-[0-9]*[1-9][0-9]*$";
194. /**
195. *
196. * 匹配整数
197. *
198. */
199. public static final String integer_regexp = "^-?\\d+$";
200. /**
201. *
202. * 匹配非负浮点数(正浮点数 + 0)
203. *
204. */
205. public static final String non_negative_rational_numbers_regexp = "^\\d+(\\.\\d+)?$";
206. /**
207. *
208. * 匹配正浮点数
209. *
210. */
211. public static final String positive_rational_numbers_regexp = "^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$";
212. /**
213. *
214. * 匹配非正浮点数(负浮点数 + 0)
215. *
216. */
217. public static final String non_positive_rational_numbers_regexp = "^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$";
218. /**
219. *
220. * 匹配负浮点数
221. *
222. */
223. public static final String negative_rational_numbers_regexp = "^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$";
224. /**
225. *
226. * 匹配浮点数
227. *
228. */
229. public static final String rational_numbers_regexp = "^(-?\\d+)(\\.\\d+)?$";
230. /**
231. *
232. * 匹配由26个英文字母组成的字符串
233. *
234. */
235. public static final String letter_regexp = "^[A-Za-z]+$";
236. /**
237. *
238. * 匹配由26个英文字母的大写组成的字符串
239. *
240. */
241. public static final String upward_letter_regexp = "^[A-Z]+$";
242. /**
243. *
244. * 匹配由26个英文字母的小写组成的字符串
245. *
246. */
247. public static final String lower_letter_regexp = "^[a-z]+$";
248. /**
249. *
250. * 匹配由数字和26个英文字母组成的字符串
251. *
252. */
253. public static final String letter_number_regexp = "^[A-Za-z0-9]+$";
254. /**
255. *
256. * 匹配由数字、26个英文字母或者下划线组成的字符串
257. *
258. */
259. public static final String letter_number_underline_regexp = "^\\w+$";
260.
261. /**
262. * 添加正规表达式 (以key->value的形式存储)
263. *
264. * @param regexpName
265. * 该正规表达式名称 `
266. * @param regexp
267. * 该正规表达式内容
268. */
269. public void putRegexpHash(String regexpName, String regexp) {
270. regexpHash.put(regexpName, regexp);
271. }
272.
273. /**
274. * 得到正规表达式内容 (通过key名提取出value[正规表达式内容])
275. *
276. * @param regexpName
277. * 正规表达式名称
278. *
279. * @return 正规表达式内容
280. */
281. public String getRegexpHash(String regexpName) {
282. if (regexpHash.get(regexpName) != null) {
283. return ((String) regexpHash.get(regexpName));
284. } else {
285. System.out.println("在regexpHash中没有此正规表达式");
286. return "";
287. }
288. }
289.
290. /**
291. * 清除正规表达式存放单元
292. */
293. public void clearRegexpHash() {
294. regexpHash.clear();
295. return;
296. }
297.
298. /**
299. * 大小写敏感的正规表达式批配
300. *
301. * @param source
302. * 批配的源字符串
303. *
304. * @param regexp
305. * 批配的正规表达式
306. *
307. * @return 如果源字符串符合要求返回真,否则返回假 如:
308. * Regexp.isHardRegexpValidate("ygj@suncer.com.cn",email_regexp) 返回真
309. */
310. public static boolean isHardRegexpValidate(String source, String regexp) {
311. try {
312. // 用于定义正规表达式对象模板类型
313. PatternCompiler compiler = new Perl5Compiler();
314. // 正规表达式比较批配对象
315. PatternMatcher matcher = new Perl5Matcher();
316. // 实例大小大小写敏感的正规表达式模板
317. Pattern hardPattern = compiler.compile(regexp);
318. // 返回批配结果
319. return matcher.contains(source, hardPattern);
320. } catch (MalformedPatternException e) {
321. e.printStackTrace();
322. }
323. return false;
324. }
325. }
分享到:
相关推荐
本节我们将深入探讨正则表达式工具类`RegUtils`,它封装了正则表达式的常用功能,便于在实际开发中进行复用。 首先,`RegUtils`类通常会包含一系列静态方法,这些方法接受正则表达式和待处理字符串作为参数,返回...
本项目提供了一个C#编写的正则表达式测试工具,包含完整的源代码,可以帮助开发者调试和测试他们的正则表达式,支持查找和替换功能,并能直观地显示匹配结果。 1. **C#中的正则表达式基础** - `System.Text....
3. **正则表达式工具的功能** - 自动化转换:工具能自动识别输入内容并生成相应的正则表达式。 - 模式测试:提供测试区域,用户可以输入文本,检查转换后的正则表达式是否有效。 - 反向匹配:从目标字符串出发,...
正则表达式(Regular Expression,简称regex)是一种用于匹配字符串的强大工具,广泛应用于...在实际使用中,结合"The Regulator"这类工具,我们可以快速创建出符合需求的正则表达式,从而更好地应对各种文本处理挑战。
java 验证手机号码 身份证 email url 以及其他常用的正则表达式的验证方法。
在压缩包中的"PbRegeXP"文件可能是作者提供的一个示例代码或库,包含了实现正则表达式的类、函数或其他组件。通过研究这个文件,开发者可以了解如何在PowerBuilder 11.5中构建自己的正则表达式解决方案。 在Power...
在这个场景下,正则表达式是一个非常重要的工具,用于处理和分析文本数据。正则表达式类库则为VC++和MFC的开发者提供了对正则表达式功能的支持。 "VC、VC++,MFC 正则表达式类库"指的是在MFC中实现或集成的正则...
"正则表达式工具"是一个专门针对正则表达式设计的应用程序,它允许用户方便地测试和验证正则表达式的功能。 1. **正则表达式基本概念**: - **字符集**: 包括字母、数字、标点符号等,可以单独或组合使用。 - **...
通过使用正则表达式,可以: 测试字符串内的模式。 例如,可以测试输入字符串,以查看字符串内是否出现电话号码模式或信用卡号码模式。这称为数据验证。 替换文本。 可以使用正则表达式来识别文档中的特定文本,...
在VB.NET中,正则表达式...总之,“vb正则表达式实例”是一个实用的工具,它通过图形界面帮助开发者直观地测试和学习正则表达式。了解并熟练掌握正则表达式在VB.NET中的使用,将极大地提升你在文本处理方面的编程能力。
测试正则表达式工具是开发和调试正则表达式的重要辅助软件,可以帮助程序员和非程序员快速检查正则表达式的正确性和有效性。 在编程领域,正则表达式通常被用来验证用户输入、提取信息或者进行数据清洗。例如,如果...
在PowerBuilder中,pbregexp组件提供了一个接口,使得开发者可以方便地在PB脚本中使用正则表达式功能。这个组件可能包含以下功能: 1. **匹配**:检查输入字符串是否符合特定的正则表达式模式。 2. **查找**:在...
在这个“强大的正则表达式生成工具 C#版”中,我们可以期待一个专为C#开发者设计的高效、直观的工具,它能够帮助程序员快速创建、测试和调试正则表达式。 正则表达式的基本概念包括: 1. **字符集**:如`.`代表...
例如,你可以使用`Pattern.compile("正则表达式")`来创建一个`Pattern`实例。 接着是`Matcher`类,它是`Pattern`的实例,用于对输入字符串进行实际的匹配、查找、替换等操作。`Matcher`提供了诸如`matches()`、`...
而正则表达式(Regular Expression)是匹配字符串模式的一种强大工具,广泛应用于数据验证、文本搜索和替换等方面。 在XML文档中,有时我们需要通过正则表达式来查找、提取或验证特定的标签、属性值或者内容。理解...
Deelx版是专门为提高正则表达式性能和功能而设计的一个支持库,适用于各种编程语言和应用场景。 1. **正则表达式基本概念** - **模式匹配**:正则表达式的核心在于模式,它是由特殊字符和普通字符组成的字符串,...
在项目中,作者已经对正则表达式进行了封装,这意味着提供了一个易于使用的类或函数,可以直接引入到你的Qt工程中。使用这个封装好的模块,你可以避免重复编写正则表达式的验证代码,提高代码的可复用性和一致性。在...
正则表达式验证工具源码 源码的简单描述: ...正则表达式验证工具,通过System.Text.RegularExpressions里边的Regex类的方法对输入的正则表达式与填写的字符串进行验证,界面干净简洁,功能实用,代码简单易懂。
本项目"正则表达式工具(带源码)"是一个由C#语言编写的实用程序,旨在帮助开发者和学习者更方便地理解和应用正则表达式。 该工具的核心功能是支持正则表达式的匹配。用户可以输入自定义的正则表达式和待匹配的文本...