1 用途:
字符串匹配
字符串查找
字符串替换
例如:验证ip是否正确 网页中揪出email 网页中揪出链接
类:java.lang.String java.util.regex.Pattern java.util.regex.Matcher
2 String类型里面有两个方法:mathces和replaceAll。
Pattern中有compile方法
Matcher中有matchers方法
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test {
public static void main(String[] args) {
System.out.println("abc".matches("..."));//返回true
System.out.println("we3223def".replaceAll("\\d", "-"));//把数字全部替换成“-”
Pattern p = Pattern.compile("[a-z]{3}");//把正则表达式编译一下,以便提高速度
Matcher mathcer = p.matcher("dsd");//用已经编译的正则表达式去匹配字符串。产生的结果存到匹配器中
System.out.println(mathcer.matches());//把是否匹配用boolean类型打印出来。
}
}
3 认识 . * + ?
参考 :java1.5 帮助文档Pattern
public class Test2 {
public static void main(String[] args) {
//认识 . * + ?
//. 任何字符
//* 前面内容0个或多个
//+ 前面内容1个或多个
//? 前面内容0或1
System.out.println("a".matches("."));
System.out.println("aa".matches("aa"));
System.out.println("aaaa".matches("a*"));
System.out.println("aaaa".matches("a+"));
System.out.println("".matches("a*"));//true
System.out.println("".matches("a?"));//true
System.out.println("a".matches("a?"));//true
System.out.println("23425342".matches("\\d{3,100}"));
System.out.println("192.168.0.aa".matches("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}"));
System.out.println("192".matches("[1-2][0-9][0-9]"));
}
}
4 范围表述:[]
一个中括号代表匹配一个字符。
^取反 -范围 |交集 &并集
[sdv]表述取其中的某一个即可。
[^sef]表述去除了其中的内容。其他都可以
[a-z]表述从a到z
[a-zA-Z] 表述从a到z或从A到Z
[a-z]|[A-Z] 也是表述从a到z或从A到Z
[a-z[A-z]] 同上
[A-z&&[RFG]] 表述从A到Z且在[]其中的
5 认识\s \w \d \
\d 代表一位数字
\D 代表非数字
\s 代表空白字符:如空格 制表符 回车 等
\S 代表非空白字符
\w 代表名称字符:字母 数字 下划线
\W 代表非名称字符
\ 代表转译字符。
特别注意:当要判断"\"时,在java中表述变为"\\"。用正则表达式去匹配就应该为"\\",但还要用java的中去表述出来,即为"\\\\".综上所述:"\\".matches("\\\\")为true。其实要表达的意思是“\”用正则表达式“\\”来匹配。
6 POSIX (用的不多)
\p{Lower} 小写字母字符:[a-z]
\p{Upper} 大写字母字符:[A-Z]
\p{ASCII} 所有 ASCII:[\x00-\x7F]
\p{Alpha} 字母字符:[\p{Lower}\p{Upper}]
\p{Digit} 十进制数字:[0-9]
\p{Alnum} 字母数字字符:[\p{Alpha}\p{Digit}]
\p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
\p{Graph} 可见字符:[\p{Alnum}\p{Punct}]
\p{Print} 可打印字符:[\p{Graph}\x20]
\p{Blank} 空格或制表符:[ \t]
\p{Cntrl} 控制字符:[\x00-\x1F\x7F]
\p{XDigit} 十六进制数字:[0-9a-fA-F]
\p{Space} 空白字符:[ \t\n\x0B\f\r]
7 边界匹配:
^ 行的开头
$ 行的结尾
\b 单词边界
\B 非单词边界
\A 输入的开头
\G 上一个匹配的结尾
\Z 输入的结尾,仅用于最后的结束符(如果有的话)
\z 输入的结尾
public class Test3 {
public static void main(String[] args) {
System.out.println("hello sir".matches("^h.*"));//true
System.out.println("hello sir".matches(".*ir$"));//true
// \b表示单纯边界
System.out.println("hello sir".matches("^h[a-z]{1,3}o\\b.*"));//true
System.out.println("hellosir".matches("^h[a-z]{1,3}o\\b.*"));//false
System.out.println(" \n".matches("^[\\s&&[^\\n]]*\\n$"));//验证是否是“空白行”,true
}
}
8 有管Patter和Matcher的方法介绍:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test4 {
public static void main(String[] args) {
Pattern pattern = Pattern.compile("\\d{3,5}");
String s = "123-321-3214-32";
Matcher m = pattern.matcher(s);
System.out.println(m.matches());//false 记得是要全面匹配
m.reset();//把mathcer回复回去.让吃掉的内容恢复从原来的样子
//matcher的find的方法是从字符串中查找是否有符合要求的字符子串。然后把已经匹配的吃掉
System.out.println(m.find());//true
System.out.println(m.start()+"-"+m.end());//0-3
System.out.println(m.find());//true
System.out.println(m.start()+"-"+m.end());//4-7
System.out.println(m.find());//true
System.out.println(m.start()+"-"+m.end());//8-12
System.out.println(m.find());//false
//只有在能够找到子串的情况下才能使用start()和end()。否则报错
//System.out.println(m.start()+"-"+m.end());
//matcher的longingAt的方法是从字符串的开始查找是否有符合要在的字符字串。
System.out.println(m.lookingAt());//true
//字符串的替换
Pattern pa = Pattern.compile("java",Pattern.CASE_INSENSITIVE);//后面的意思是忽略大小写
String st = "java java ILoveJava YouHateJava";
Matcher mm = pa.matcher(st);
System.out.println(mm.replaceAll("JAVA"));
}
}
9 分组:在正则表达式中加入(),即可完成分组。0为整个字符串,1...为相应顺序的分组。
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test5 {
public static void main(String[] args) {
Pattern pa = Pattern.compile("(\\d{3,5})([a-z]{2})");
Matcher m = pa.matcher("123dw-31243bf-3243");
System.out.println(m.matches());//false
m.reset();
while(m.find()){
System.out.println("-----");
System.out.println(m.group());//默认为0 即全组
System.out.println(m.group(1));
System.out.println(m.group(2));
}
}
}
分享到:
相关推荐
Python正则表达式基础是学习如何在Python中应用正则表达式的入门指南。正则表达式,或称为REs、regexes、regexpatterns,是能够嵌入到Python中的一个精细、高度专业化的程序语言。通过re模块,程序员得以使用这一...
1. 正则表达式基础 - **模式匹配**:正则表达式是一种特殊的字符序列,用于定义字符串的搜索模式。 - **元字符**:如 `.`(任意单个字符)、`*`(零个或多个前面的字符)、`+`(一个或多个前面的字符)、`?`(零个...
【Groovy正则表达式基础1】 Groovy是一种基于Java平台的动态编程语言,它扩展了Java的功能,包括对正则表达式的处理。在Groovy中,正则表达式是通过`~`运算符或者使用斜杠(`/`)来定义的。这种特性使得Groovy在处理...
1. **C#中的正则表达式基础** - `System.Text.RegularExpressions`命名空间:C#中的正则表达式操作主要基于这个命名空间下的类和方法。 - `Regex`类:这是处理正则表达式的核心类,提供了多种与正则相关的静态方法...
1. **正则表达式基础** - **元字符**:如`.`表示任意字符,`^`表示行首,`$`表示行尾,`\d`代表数字,`\w`代表字母或数字,`\s`代表空白字符。 - **量词**:如`*`表示前面的元素零次或多次,`+`表示一次或多次,`?...
### 正则表达式基础知识与应用 #### 一、正则表达式的定义及用途 正则表达式(Regular Expression)是一种强大的文本处理工具,能够帮助用户查找、替换以及操作特定的字符串或字符组合。它在多种编程语言和操作...
一、正则表达式基础 1. **基本元素**:正则表达式由一系列字符和特殊符号组成,如字母、数字、特殊字符以及元字符(如`.`、`*`、`+`、`?`、`^`、`$`、`|`、`()`、`[]`、`\`等)。 2. **量词**:`*`表示零个或多个...
正则表达式(Regular Expression,简称regex)是用于...通过熟练掌握上述基础知识,你将能够编写出高效且精准的正则表达式,大大提高文本处理的效率。在实际应用中,不断实践和积累经验,是成为正则表达式高手的关键。
首先,让我们了解一下Java中的正则表达式基础。在Java中,`java.util.regex`包提供了对正则表达式的支持。主要涉及以下核心类: 1. **Pattern**:表示一个正则表达式模式,可以通过`Pattern.compile(String regex)`...
**正则表达式基础教程** 1. **本文目标** 本教程旨在为C#开发者提供正则表达式的基础知识,帮助理解正则表达式的概念、语法和常见用途。通过学习,你将能够编写和使用正则表达式进行文本匹配、验证和处理。 2. **...
vba正则表达式基础知识介绍,由浅入深,实例讲解
本教程将深入探讨C#中的正则表达式基础,帮助你掌握这一核心技能。 1. **正则表达式简介** 正则表达式(Regular Expression)是一种模式匹配语言,用于在字符串中查找、替换或捕获特定模式。它通过一套特殊语法来...
但是,正则表达式也是一种非常复杂的技术,需要开发者具备一定的基础知识和经验。 为了帮助开发者更好地掌握Java正则表达式技术,我们提供了一系列的Java正则表达式技巧大全,包括《Java正则表达式技巧大全》、...
### 正则表达式基础 正则表达式(Regular Expression)是一种特殊的字符串序列,用于描述一种模式。在Python中,`re`模块提供了对正则表达式的支持。正则表达式的基本元素包括: 1. 字符匹配:如`.`匹配任意单个...
1. 正则表达式基础:正则表达式是一种模式匹配工具,用于在字符串中搜索、替换和提取特定模式。 2. 正则表达式对象:在C#中,使用`System.Text.RegularExpressions`命名空间下的`Regex`类来处理正则表达式。 3. ...
正则表达式(Regular Expression,简称regex)是用于匹配字符串的一种模式,广泛应用于文本处理、数据验证、搜索和替换...在“正则表达式基础.ppt”这个文件中,应该包含了更详细的讲解,可以帮助你深入理解这一主题。
### 正则表达式基础 正则表达式是一种强大的文本处理工具,主要用于字符串搜索、替换以及提取等操作。通过特定的字符组合,正则表达式能够匹配符合某种模式的字符串。在处理IP地址时,正则表达式可以帮助我们验证一...
1. 正则表达式基础 - **模式匹配**:正则表达式由一系列字符和特殊符号组成,用于定义一个模式,该模式可以匹配特定的字符串。 - **元字符**:如`*`, `+`, `?`, `{}`, `[]`, `\`等,它们具有特殊的含义,用于指定...
一、正则表达式基础 正则表达式(Regular Expression)是一种特殊的字符串模式,用于在文本中搜索匹配该模式的字符串。它们由一系列字符和特殊符号组成,这些符号代表了不同的匹配规则。例如,`\d`表示任何数字,`^...