正则表达式的定义是以字符为基本单位的。
字符可分为元字符和普通字符。
元字符:是在正则表达式中表示特殊含义的字符。
普通字符:指除元字符外的所有Unicode字符。
说明:Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
元字符包括:
“.”:用于匹配任何单字符(除换行符外)。
“\”:用于字符转义。
“^”:用于匹配输入字符串的开始。
“$”:用于匹配输入字符串的结束。
“|”:可用来创建多个正则表达式分支。
“?”:作为量词出现,用来匹配0个或1个字符。
“*”:作为量词出现,用来匹配0个或多个字符。
“+”:作为量词出现,用来匹配1个或多个字符。
“{}”:和为量词出现,用来匹配指定个数的字符。
例:A{3}:表示匹配3个字符“A”。
A{3,}:表示匹配3个或更多字符“A”。
A{3,5}:表示匹配3个到5个字符“A”。
“[]”:定义了某个范围内的字符。
例:[az]:用于匹配字符“a”或“z”。
[a-z]:用于匹配字符“a”到“z”的任意字符。
[a-z0-9]:用于匹配字符“a”到“z”或字符“0”到“9”中的任意字符。
[^a-z]:表示除了“a”和“z”之外的所有Unicode字符。
注:这里的“^”表示该范围之外的字符集合,必须出现在“[]”之内。
常用的反义代码:
\b:代表单词的开头或结尾,也就是单词的分界处;
\s:匹配任意的空白符(包括空格、制表符、换行符、中文全角空格等);
\s+:匹配不包含空白符的字符串;
\w:匹配字母、数字、下划线等;
\d:匹配一位数字(0~9);
[^x]:匹配除了x以外的任意字符
[^aeiou]:匹配除了aeiou这几个字母以外的任意字符;
分享到:
相关推荐
在Qt框架中,正则表达式(Regular Expression)是一种强大的文本处理工具,它允许程序员以结构化的方式匹配、查找、替换或验证字符串。本项目针对Qt的lineEdit组件,通过正则表达式实现了输入限制功能,使得lineEdit...
正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,它用于匹配、查找、替换等操作,涉及字符串处理的各个领域。正则表达式转换工具是专门针对这一需求而设计的,它能帮助用户将输入的内容转换...
在IT领域,正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,它能够进行复杂的模式匹配、查找、替换等操作。在本话题中,我们将探讨如何使用PowerBuilder 11.5这一经典的开发环境来实现正则...
在易语言中,正则表达式是进行文本处理、数据提取和搜索的关键工具,尤其在处理中文字符时显得尤为重要。本文将深入探讨易语言中的正则表达式匹配中文的原理、方法以及应用。 正则表达式(Regular Expression)是一...
例如,"子程序_正则文本替换"可能就是一个易语言中用于执行正则表达式替换的子程序,它接收输入的文本、正则表达式模式和替换字符串,然后返回经过替换操作的新文本。 1. **正则表达式基础** - **元字符**:如`.`...
标题中的“pb 使用正则表达式源码pbregexp”指的是在PowerBuilder(简称pb)环境中,利用名为“pbregexp”的正则表达式组件来实现源代码级别的正则表达式操作。PowerBuilder是一款流行的可视化的、面向对象的软件...