`
sunqitang
  • 浏览: 76807 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

正则表达式(基础)

阅读更多

1 用途:
  字符串匹配
  字符串查找
  字符串替换
  例如:验证ip是否正确 网页中揪出email 网页中揪出链接
  类:java.lang.String java.util.regex.Pattern java.util.regex.Matcher
2 String类型里面有两个方法:mathces和replaceAll。
  Pattern中有compile方法
  Matcher中有matchers方法

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test {
	public static void main(String[] args) {
		System.out.println("abc".matches("..."));//返回true
		System.out.println("we3223def".replaceAll("\\d", "-"));//把数字全部替换成“-”
		
		Pattern p = Pattern.compile("[a-z]{3}");//把正则表达式编译一下,以便提高速度
		Matcher mathcer = p.matcher("dsd");//用已经编译的正则表达式去匹配字符串。产生的结果存到匹配器中
		System.out.println(mathcer.matches());//把是否匹配用boolean类型打印出来。
	}

}
 


3 认识 . * + ?
  参考 :java1.5 帮助文档Pattern

public class Test2 {
	public static void main(String[] args) {
		//认识 . * + ?
		//. 任何字符
		
		//* 前面内容0个或多个
		//+ 前面内容1个或多个
		//? 前面内容0或1
		System.out.println("a".matches("."));
		System.out.println("aa".matches("aa"));
		System.out.println("aaaa".matches("a*"));
		System.out.println("aaaa".matches("a+"));
		
		System.out.println("".matches("a*"));//true
		System.out.println("".matches("a?"));//true
		System.out.println("a".matches("a?"));//true
		System.out.println("23425342".matches("\\d{3,100}"));
		System.out.println("192.168.0.aa".matches("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}"));
		System.out.println("192".matches("[1-2][0-9][0-9]"));
	}
}
 

 
4 范围表述:[]
  一个中括号代表匹配一个字符。
  ^取反 -范围 |交集 &并集
  [sdv]表述取其中的某一个即可。
  [^sef]表述去除了其中的内容。其他都可以
  [a-z]表述从a到z
  [a-zA-Z] 表述从a到z或从A到Z
  [a-z]|[A-Z] 也是表述从a到z或从A到Z
  [a-z[A-z]]  同上
  [A-z&&[RFG]] 表述从A到Z且在[]其中的
5 认识\s \w \d \
  \d 代表一位数字
  \D 代表非数字
  \s 代表空白字符:如空格 制表符 回车 等
  \S 代表非空白字符
  \w 代表名称字符:字母 数字 下划线
  \W 代表非名称字符
  \ 代表转译字符。
特别注意:当要判断"\"时,在java中表述变为"\\"。用正则表达式去匹配就应该为"\\",但还要用java的中去表述出来,即为"\\\\".综上所述:"\\".matches("\\\\")为true。其实要表达的意思是“\”用正则表达式“\\”来匹配。
 
6 POSIX (用的不多)
  \p{Lower} 小写字母字符:[a-z]
  \p{Upper} 大写字母字符:[A-Z]
  \p{ASCII} 所有 ASCII:[\x00-\x7F]
  \p{Alpha} 字母字符:[\p{Lower}\p{Upper}]
  \p{Digit} 十进制数字:[0-9]
  \p{Alnum} 字母数字字符:[\p{Alpha}\p{Digit}]
  \p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
  \p{Graph} 可见字符:[\p{Alnum}\p{Punct}]
  \p{Print} 可打印字符:[\p{Graph}\x20]
  \p{Blank} 空格或制表符:[ \t]
  \p{Cntrl} 控制字符:[\x00-\x1F\x7F]
  \p{XDigit} 十六进制数字:[0-9a-fA-F]
  \p{Space} 空白字符:[ \t\n\x0B\f\r]
7 边界匹配:
  ^ 行的开头
  $ 行的结尾
  \b 单词边界
  \B 非单词边界
  \A 输入的开头
  \G 上一个匹配的结尾
  \Z 输入的结尾,仅用于最后的结束符(如果有的话)
  \z 输入的结尾

public class Test3 {
	public static void main(String[] args) {
		System.out.println("hello sir".matches("^h.*"));//true
		System.out.println("hello sir".matches(".*ir$"));//true
		// \b表示单纯边界
		System.out.println("hello sir".matches("^h[a-z]{1,3}o\\b.*"));//true
		System.out.println("hellosir".matches("^h[a-z]{1,3}o\\b.*"));//false
		
		System.out.println("  \n".matches("^[\\s&&[^\\n]]*\\n$"));//验证是否是“空白行”,true
	
	}
}

 8 有管Patter和Matcher的方法介绍:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test4 {
	public static void main(String[] args) {
		Pattern pattern = Pattern.compile("\\d{3,5}");
		String s = "123-321-3214-32";
		Matcher m = pattern.matcher(s);
		System.out.println(m.matches());//false 记得是要全面匹配
		m.reset();//把mathcer回复回去.让吃掉的内容恢复从原来的样子
		//matcher的find的方法是从字符串中查找是否有符合要求的字符子串。然后把已经匹配的吃掉
		System.out.println(m.find());//true 
		System.out.println(m.start()+"-"+m.end());//0-3
		System.out.println(m.find());//true
		System.out.println(m.start()+"-"+m.end());//4-7
		System.out.println(m.find());//true
		System.out.println(m.start()+"-"+m.end());//8-12
		System.out.println(m.find());//false
		//只有在能够找到子串的情况下才能使用start()和end()。否则报错
		//System.out.println(m.start()+"-"+m.end());
		//matcher的longingAt的方法是从字符串的开始查找是否有符合要在的字符字串。
		System.out.println(m.lookingAt());//true
		
		
		//字符串的替换
		Pattern pa = Pattern.compile("java",Pattern.CASE_INSENSITIVE);//后面的意思是忽略大小写
		String st = "java java ILoveJava YouHateJava";
		Matcher mm = pa.matcher(st);
		System.out.println(mm.replaceAll("JAVA"));
	}
}

 9 分组:在正则表达式中加入(),即可完成分组。0为整个字符串,1...为相应顺序的分组。

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test5 {
	public static void main(String[] args) {
		Pattern pa = Pattern.compile("(\\d{3,5})([a-z]{2})");
		Matcher m = pa.matcher("123dw-31243bf-3243");
		System.out.println(m.matches());//false
		m.reset();
		while(m.find()){
			System.out.println("-----");
			System.out.println(m.group());//默认为0 即全组
			System.out.println(m.group(1));
			System.out.println(m.group(2));
		}
	}
}
 

 


分享到:
评论

相关推荐

    Python正则表达式基础

    Python正则表达式基础是学习如何在Python中应用正则表达式的入门指南。正则表达式,或称为REs、regexes、regexpatterns,是能够嵌入到Python中的一个精细、高度专业化的程序语言。通过re模块,程序员得以使用这一...

    vb正则表达式实例(正则表达式测试程序)

    1. 正则表达式基础 - **模式匹配**:正则表达式是一种特殊的字符序列,用于定义字符串的搜索模式。 - **元字符**:如 `.`(任意单个字符)、`*`(零个或多个前面的字符)、`+`(一个或多个前面的字符)、`?`(零个...

    groovy正则表达式基础1

    【Groovy正则表达式基础1】 Groovy是一种基于Java平台的动态编程语言,它扩展了Java的功能,包括对正则表达式的处理。在Groovy中,正则表达式是通过`~`运算符或者使用斜杠(`/`)来定义的。这种特性使得Groovy在处理...

    正则表达式测试工具C#版(src)

    1. **C#中的正则表达式基础** - `System.Text.RegularExpressions`命名空间:C#中的正则表达式操作主要基于这个命名空间下的类和方法。 - `Regex`类:这是处理正则表达式的核心类,提供了多种与正则相关的静态方法...

    易语言正则表达式文本替换

    1. **正则表达式基础** - **元字符**:如`.`表示任意字符,`^`表示行首,`$`表示行尾,`\d`代表数字,`\w`代表字母或数字,`\s`代表空白字符。 - **量词**:如`*`表示前面的元素零次或多次,`+`表示一次或多次,`?...

    精通正则表达式(第三版)简体中文版

    ### 正则表达式基础知识与应用 #### 一、正则表达式的定义及用途 正则表达式(Regular Expression)是一种强大的文本处理工具,能够帮助用户查找、替换以及操作特定的字符串或字符组合。它在多种编程语言和操作...

    通过正则表达式生成数据

    一、正则表达式基础 1. **基本元素**:正则表达式由一系列字符和特殊符号组成,如字母、数字、特殊字符以及元字符(如`.`、`*`、`+`、`?`、`^`、`$`、`|`、`()`、`[]`、`\`等)。 2. **量词**:`*`表示零个或多个...

    正则表达式基础学习笔记

    正则表达式(Regular Expression,简称regex)是用于...通过熟练掌握上述基础知识,你将能够编写出高效且精准的正则表达式,大大提高文本处理的效率。在实际应用中,不断实践和积累经验,是成为正则表达式高手的关键。

    测试正则表达式软件

    首先,让我们了解一下Java中的正则表达式基础。在Java中,`java.util.regex`包提供了对正则表达式的支持。主要涉及以下核心类: 1. **Pattern**:表示一个正则表达式模式,可以通过`Pattern.compile(String regex)`...

    01C#正则表达式基础教程.doc

    **正则表达式基础教程** 1. **本文目标** 本教程旨在为C#开发者提供正则表达式的基础知识,帮助理解正则表达式的概念、语法和常见用途。通过学习,你将能够编写和使用正则表达式进行文本匹配、验证和处理。 2. **...

    vba正则表达式基础

    vba正则表达式基础知识介绍,由浅入深,实例讲解

    详细的C#正则表达式基础教程

    本教程将深入探讨C#中的正则表达式基础,帮助你掌握这一核心技能。 1. **正则表达式简介** 正则表达式(Regular Expression)是一种模式匹配语言,用于在字符串中查找、替换或捕获特定模式。它通过一套特殊语法来...

    Java使用正则表达式提取XML节点内容的方法示例

    但是,正则表达式也是一种非常复杂的技术,需要开发者具备一定的基础知识和经验。 为了帮助开发者更好地掌握Java正则表达式技术,我们提供了一系列的Java正则表达式技巧大全,包括《Java正则表达式技巧大全》、...

    第11.25节 Python正则表达式编译re.compile及正则对象使用.rar

    ### 正则表达式基础 正则表达式(Regular Expression)是一种特殊的字符串序列,用于描述一种模式。在Python中,`re`模块提供了对正则表达式的支持。正则表达式的基本元素包括: 1. 字符匹配:如`.`匹配任意单个...

    C#字符串和正则表达式参考手册

    1. 正则表达式基础:正则表达式是一种模式匹配工具,用于在字符串中搜索、替换和提取特定模式。 2. 正则表达式对象:在C#中,使用`System.Text.RegularExpressions`命名空间下的`Regex`类来处理正则表达式。 3. ...

    正则表达式基础正则表达式基础

    正则表达式(Regular Expression,简称regex)是用于匹配字符串的一种模式,广泛应用于文本处理、数据验证、搜索和替换...在“正则表达式基础.ppt”这个文件中,应该包含了更详细的讲解,可以帮助你深入理解这一主题。

    IP地址的正则表达式

    ### 正则表达式基础 正则表达式是一种强大的文本处理工具,主要用于字符串搜索、替换以及提取等操作。通过特定的字符组合,正则表达式能够匹配符合某种模式的字符串。在处理IP地址时,正则表达式可以帮助我们验证一...

    使用正则表达式拆分字符串

    1. 正则表达式基础 - **模式匹配**:正则表达式由一系列字符和特殊符号组成,用于定义一个模式,该模式可以匹配特定的字符串。 - **元字符**:如`*`, `+`, `?`, `{}`, `[]`, `\`等,它们具有特殊的含义,用于指定...

    delphi xe 10 正则表达式

    一、正则表达式基础 正则表达式(Regular Expression)是一种特殊的字符串模式,用于在文本中搜索匹配该模式的字符串。它们由一系列字符和特殊符号组成,这些符号代表了不同的匹配规则。例如,`\d`表示任何数字,`^...

Global site tag (gtag.js) - Google Analytics