`
zhongdw
  • 浏览: 8227 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

一刻钟精通正则表达式

阅读更多
想必很多人都对正则表达式都头疼.今天,我以我的认识,加上网上一些文章,希望用常人都可以理解的表达方式.来和大家分享学习经验.

开篇,还是得说说 ^ 和 $ 他们是分别用来匹配字符串的开始和结束,以下分别举例说明

"^The": 开头一定要有"The"字符串;
"of despair$": 结尾一定要有"of despair" 的字符串;

那么,
"^abc$": 就是要求以abc开头和以abc结尾的字符串,实际上是只有abc匹配
"notice": 匹配包含notice的字符串

你可以看见如果你没有用我们提到的两个字符(最后一个例子),就是说 模式(正则表达式) 可以出现在被检验字符串的任何地方,你没有把他锁定到两边

接着,说说 '*', '+',和 '?',
他们用来表示一个字符可以出现的次数或者顺序. 他们分别表示:
"zero or more"相当于{0,},
"one or more"相当于{1,},
"zero or one."相当于{0,1}, 这里是一些例子:

"ab*": 和ab{0,}同义,匹配以a开头,后面可以接0个或者N个b组成的字符串("a", "ab", "abbb", 等);
"ab+": 和ab{1,}同义,同上条一样,但最少要有一个b存在 ("ab", "abbb", 等.);
"ab?":和ab{0,1}同义,可以没有或者只有一个b;
"a?b+$": 匹配以一个或者0个a再加上一个以上的b结尾的字符串.

要点, '*', '+',和 '?'只管它前面那个字符.

你也可以在大括号里面限制字符出现的个数,比如

"ab{2}": 要求a后面一定要跟两个b(一个也不能少)("abb");
"ab{2,}": 要求a后面一定要有两个或者两个以上b(如"abb", "abbbb", 等.);
"ab{3,5}": 要求a后面可以有2-5个b("abbb", "abbbb", or "abbbbb").

现在我们把一定几个字符放到小括号里,比如:

"a(bc)*": 匹配 a 后面跟0个或者一个"bc";
"a(bc){1,5}": 一个到5个 "bc."

还有一个字符 '│', 相当于OR 操作:

"hi│hello": 匹配含有"hi" 或者 "hello" 的 字符串;
"(b│cd)ef": 匹配含有 "bef" 或者 "cdef"的字符串;
"(a│b)*c": 匹配含有这样多个(包括0个)a或b,后面跟一个c
的字符串;

一个点('.')可以代表所有的单一字符,不包括"\n"

如果,要匹配包括"\n"在内的所有单个字符,怎么办?

对了,用'[\n.]'这种模式.

"a.[0-9]": 一个a加一个字符再加一个0到9的数字
"^.{3}$": 三个任意字符结尾 .

中括号括住的内容只匹配一个单一的字符

"[ab]": 匹配单个的 a 或者 b ( 和 "a│b" 一样);
"[a-d]": 匹配'a' 到'd'的单个字符 (和"a│b│c│d" 还有 "[abcd]"效果一样); 一般我们都用[a-zA-Z]来指定字符为一个大小写英文
"^[a-zA-Z]": 匹配以大小写字母开头的字符串
"[0-9]%": 匹配含有 形如 x% 的字符串
",[a-zA-Z0-9]$": 匹配以逗号再加一个数字或字母结尾的字符串

你也可以把你不想要得字符列在中括号里,你只需要在总括号里面使用'^' 作为开头 "%[^a-zA-Z]%" 匹配含有两个百分号里面有一个非字母的字符串.

要点:^用在中括号开头的时候,就表示排除括号里的字符

为了PHP能够解释,你必须在这些字符面前后加'',并且将一些字符转义.

不要忘记在中括号里面的字符是这条规路的例外?在中括号里面, 所有的特殊字符,包括(''), 都将失去他们的特殊性质 "[*\+?{}.]"匹配含有这些字符的字符串.

还有,正如regx的手册告诉我们: "如果列表里含有 ']', 最好把它作为列表里的第一个字符(可能跟在'^'后面). 如果含有'-', 最好把它放在最前面或者最后面, or 或者一个范围的第二个结束点[a-d-0-9]中间的‘-’将有效.

看了上面的例子,你对{n,m}应该理解了吧.要注意的是,n和m都不能为负整数,而且n总是小于m. 这样,才能 最少匹配n次且最多匹配m次. 如"p{1,5}"将匹配 "pvpppppp"中的前五个p

下面说说以\开头的

\b 书上说他是用来匹配一个单词边界,就是...比如've\b',可以匹配love里的ve而不匹配very里有ve

\B 正好和上面的\b相反.例子我就不举了

.....突然想起来....可以到http://www.phpv.net/article.php/251 看看其它用\ 开头的语法

好,我们来做个应用:

如何构建一个模式来匹配 货币数量 的输入

构建一个匹配模式去检查输入的信息是否为一个表示money的数字。我们认为一个表示money的数量有四种方式: "10000.00" 和 "10,000.00",或者没有小数部分, "10000" and "10,000". 现在让我们开始构建这个匹配模式:

^[1-9][0-9]*$ 


这是所变量必须以非0的数字开头.但这也意味着 单一的 "0" 也不能通过测试. 以下是解决的方法:

^(0│[1-9][0-9]*)$ 


"只有0和不以0开头的数字与之匹配",我们也可以允许一个负号在数字之前:

^(0│-?[1-9][0-9]*)$ 


这就是: "0 或者 一个以0开头 且可能 有一个负号在前面的数字." 好了,现在让我们别那么严谨,允许以0开头.现在让我们放弃 负号 , 因为我们在表示钱币的时候并不需要用到. 我们现在指定 模式 用来匹配小数部分:

^[0-9]+(\.[0-9]+)?$ 


这暗示匹配的字符串必须最少以一个阿拉伯数字开头. 但是注意,在上面模式中 "10." 是不匹配的, 只有 "10" 和 "10.2" 才可以. (你知道为什么吗)

^[0-9]+(\.[0-9]{2})?$ 


我们上面指定小数点后面必须有两位小数.如果你认为这样太苛刻,你可以改成:

^[0-9]+(\.[0-9]{1,2})?$ 


这将允许小数点后面有一到两个字符. 现在我们加上用来增加可读性的逗号(每隔三位), 我们可以这样表示:

^[0-9]{1,3}(,[0-9]{3})*(\.[0-9]{1,2})?$ 


不要忘记 '+' 可以被 '*' 替代 如果你想允许空白字符串被输入话 (为什么?). 也不要忘记反斜杆 ’\’ 在php字符串中可能会出现错误 (很普遍的错误).

现在,我们已经可以确认字符串了, 我们现在把所有逗号都去掉 str_replace(",", "", $money) 然后在把类型看成 double然后我们就可以通过他做数学计算了.

再来一个:

构造检查email的正则表达式

在一个完整的email地址中有三个部分:
1. 用户名 (在 '@' 左边的一切),
2.'@',
3. 服务器名(就是剩下那部分).

用户名可以含有大小写字母阿拉伯数字,句号 ('.'), 减号('-'), and 下划线 ('_'). 服务器名字也是符合这个规则,当然下划线除外.

现在, 用户名的开始和结束都不能是句点. 服务器也是这样. 还有你不能有两个连续的句点他们之间至少存在一个字符,好现在我们来看一下怎么为用户名写一个匹配模式:

^[_a-zA-Z0-9-]+$ 


现在还不能允许句号的存在. 我们把它加上:

^[_a-zA-Z0-9-]+(\.[_a-zA-Z0-9-]+)*$ 


上面的意思就是说: "以至少一个规范字符(除了.)开头,后面跟着0个或者多个以点开始的字符串."

简单化一点, 我们可以用 eregi()取代 ereg().eregi()对大小写不敏感, 我们就不需要指定两个范围 "a-z" 和 "A-Z" ? 只需要指定一个就可以了:

^[_a-z0-9-]+(\.[_a-z0-9-]+)*$ 


后面的服务器名字也是一样,但要去掉下划线:

^[a-z0-9-]+(\.[a-z0-9-]+)*$ 


好. 现在只需要用”@”把两部分连接:

^[_a-z0-9-]+(\.[_a-z0-9-]+)*@[a-z0-9-]+(\.[a-z0-9-]+)*$ 


这就是完整的email认证匹配模式了,只需要调用

eregi(‘^[_a-z0-9-]+(\.[_a-z0-9-]+)*@[a-z0-9-]+(\.[a-z0-9-]+)*$ ’,$eamil) 


就可以得到是否为email了

正则表达式的其他用法

提取字符串

ereg() and eregi() 有一个特性是允许用户通过正则表达式去提取字符串的一部分(具体用法你可以阅读手册). 比如说,我们想从 path/URL 提取文件名 ? 下面的代码就是你需要:

ereg("([^\\/]*)$", $pathOrUrl, $regs); 
echo $regs[1]; 


高级的代换

ereg_replace() 和 eregi_replace()也是非常有用的: 假如我们想把所有的间隔负号都替换成逗号:

ereg_replace("[ \n\r\t]+", ",", trim($str));


最后,我把另一串检查EMAIL的正则表达式让看文章的你来分析一下.

"^[-!#$%&\'*+\\./0-9=?A-Z^_`a-z{|}~]+'.'@'.'[-!#$%&\'*+\\/0-9=?A-Z^_`a-z{|}~]+\.'.'[-!#$%&\'*+\\./0-9=?A-Z^_`a-z{|}~]+$"


如果能方便的读懂,那这篇文章的目的就达到了.
分享到:
评论

相关推荐

    Java程序员:一刻钟精通正则表达式.pdf

    ### Java程序员:一刻钟精通正则表达式 #### 前言 正则表达式是一种强大的文本处理工具,被广泛应用于各种编程语言中,包括Java。对于Java开发者来说,掌握正则表达式的使用方法是非常重要的技能之一。本文将详细...

    环境流体力学:海洋流动模拟.zip

    光电材料仿真,电子仿真等;从入门到精通教程;含代码案例解析。

    数据访问.md

    数据访问.md

    基于A*算法的多AGV路径规划与冲突避让的Matlab实现

    内容概要:本文详细介绍了利用A*算法进行多AGV(自动导引车)路径规划的方法及其在Matlab环境下的具体实现。首先,针对单个AGV,使用A*算法计算最短路径,采用曼哈顿距离作为启发函数,适用于栅格地图场景。其次,在多AGV环境中,通过时空冲突检测机制来识别路径重叠,并采取动态调整策略,如让低优先级AGV等待,确保各AGV能够顺利到达目的地而不发生碰撞。此外,还提供了可视化的路径动态演示和时间坐标曲线,帮助用户更好地理解和监控AGV的移动过程。文中给出了完整的代码框架,包括地图配置、AGV数量设定以及起终点随机生成等功能,适用于中小型场景的AGV调度。 适合人群:对机器人导航、路径规划感兴趣的科研人员和技术开发者,尤其是那些希望深入了解A*算法及其应用的人士。 使用场景及目标:本方案旨在解决多AGV系统中存在的路径交叉和死锁问题,提高物流运输效率。主要应用于自动化仓储、智能交通等领域,目标是通过合理的路径规划减少碰撞风险,提升系统的稳定性和可靠性。 其他说明:作者提到在实际运行过程中遇到了一些挑战,比如Matlab全局变量在并行计算时不稳定的问题,经过面向对象重构后得到了改善。同时,对于更大规模的AGV调度,可能需要探索更加高效的算法。

    【多智能体系统】基于增益迭代扰动观测器的隐私保护机制设计与仿真:多智能体系统中用户定义时间内的隐私保护与控制性能优化(论文复现或解答,含详细代码及解释)

    内容概要:本文详细介绍了一篇关于多智能体系统隐私保护和增益迭代扰动观测器的学术论文。论文提出了两种主要创新:一种新的隐私保护机制,通过设定时间掩码函数实现在用户定义时间内保护隐私,减少对系统性能的影响;以及一种增益迭代扰动观测器,基于负梯度优化概念构建增益迭代机制,以提高系统控制精度。文中提供了详细的Python代码实现,包括多智能体系统仿真类、隐私保护和扰动观测器的具体实现,并通过仿真实验验证了所提机制的有效性。此外,还对现有隐私保护技术和系统扰动处理挑战进行了深入分析,展示了改进方法在隐私保护效果、系统性能等方面的显著提升。 适合人群:具备一定编程基础,特别是对多智能体系统、隐私保护技术和控制理论感兴趣的科研人员和工程师。 使用场景及目标:①适用于研究多智能体系统的隐私保护机制;②探索如何通过增益迭代机制提高扰动观测器的性能;③为智能电网、无人机编队、工业物联网等领域提供隐私保护和系统优化的解决方案。 其他说明:该资源不仅包含理论分析,还提供了完整的代码实现和仿真结果,便于读者理解和实践。建议读者在学习过程中结合代码进行调试和实验,以便更好地掌握论文中的核心思想和技术细节。

    混合动力汽车P2构型能量管理:基于规则与庞特里亚金最小值策略的对比与应用

    内容概要:本文深入探讨了P2构型混合动力汽车的能量管理模式,特别是基于规则(Rule-based)和庞特里亚金最小值原理(Pontryagin's Minimum Principle, PMP)这两种控制策略的应用与对比。首先介绍了模式切换逻辑及其潜在问题,如SOC滞环区间、油门踏板信号处理和车速判断。接着详细解释了庞特里亚金最小值原理的核心概念和实现方法,强调了协态变量λ的在线更新策略以及其带来的性能提升。同时,讨论了联合仿真过程中Cruise和Matlab之间的DLL对接技术和注意事项。此外,还提供了关于参数校准、仿真结果分析等方面的指导,并分享了一些实践经验,如驾驶模式的选择和优化。 适合人群:从事混合动力汽车研究与开发的技术人员、高校相关专业学生、对能量管理系统感兴趣的工程师。 使用场景及目标:帮助读者理解不同控制策略的工作原理及其优劣,掌握具体的实现方法和技术细节,为实际项目提供参考和支持。通过案例分析和实践经验分享,使读者能够在自己的工作中应用这些策略,提高系统的燃油经济性和稳定性。 其他说明:文中不仅包含了详细的代码示例,还包括图表、公式等辅助材料,便于理解和实施。特别指出,在进行控制策略比较时,可以通过加入创新元素(如深度学习)来增加研究成果的价值。

    环境热力学:大气热传导模拟.zip

    光电材料仿真,电子仿真等;从入门到精通教程;含代码案例解析。

    os包.md

    os包.md

    DSP数字电源方案解析:基于C2000系列TMS32F28069的300W Buck-Boost双向变换器设计

    内容概要:本文详细介绍了基于TI C2000系列TMS32F28069的300W Buck-Boost双向变换器设计方案。硬件方面,采用了四开关Buck-Boost结构,利用同一电感实现能量双向流动,优化了PCB布局和元件选型。软件部分则着重于PWM配置、ADC采样、双闭环PID控制以及保护机制的设计。文中还分享了许多实用技巧,如PWM死区时间设置、ADC采样窗口调整、PID参数调优等。此外,针对常见问题提供了详细的解决方法,如过流保护、积分饱和处理等。 适合人群:从事电源设计的技术人员,尤其是对数字电源控制有一定经验的研发工程师。 使用场景及目标:适用于需要宽电压范围和高效能的电源应用场景,如新能源设备、电池管理系统等。目标是帮助工程师理解和掌握基于DSP的数字电源设计方法,提高系统的可靠性和效率。 其他说明:文中提到的许多细节和技术要点对于实际项目开发非常有价值,建议读者仔细研读并结合实际情况进行应用。同时,文中的一些优化措施和调试技巧也能为类似项目的开发提供重要参考。

    基于S7-200 PLC的污水处理液位控制系统设计与实现:硬件架构、组态配置及优化策略

    内容概要:本文详细介绍了基于西门子S7-200 PLC和MCGS组态软件的污水处理液位控制系统的设计与实现。系统采用双传感器(模拟量+开关量)冗余设计,确保液位监测的可靠性。PLC程序中加入了防抖动、滤波、互锁等保护措施,有效应对现场复杂环境。MCGS组态实现了动态曲线、报警回溯等功能,便于远程监控和数据分析。此外,文中还分享了多个调试经验和常见错误规避方法,如接地处理、通信参数匹配等。 适合人群:从事工业自动化领域的工程师和技术人员,特别是对PLC编程和组态软件应用有一定基础的人群。 使用场景及目标:适用于需要设计和实施污水处理液位控制系统的工程项目。主要目标是提高系统的稳定性和可靠性,减少误报率,优化人机交互体验,降低维护成本。 其他说明:文中提供了大量实际案例和代码片段,帮助读者更好地理解和掌握相关技术和技巧。同时强调了系统设计中的细节把控和实践经验积累的重要性。

    如无限或半无限介质中的组织吸收、散射、反射率和注量率matlab代码.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    Qt 4 C++ GUI编程入门指南

    本书是关于C++图形用户界面(GUI)编程的权威指南,专注于使用Qt 4框架。全书分为几个部分,首先介绍了Qt的历史和基础知识,包括如何开始使用Qt创建简单的应用程序。接着深入探讨了创建对话框和主窗口的技巧,包括子类化QDialog和QMainWindow,以及如何使用信号与槽机制,这是Qt框架的核心特性之一。书中还详细讲解了控件样式、布局、快速设计对话框、动态对话框以及内置控件和对话框类的使用。此外,还涉及了如何实现应用程序的核心功能,如创建菜单栏、工具栏、状态栏,以及如何处理文件菜单和多文档界面等。本书适合初学者和有经验的开发者,旨在帮助他们快速掌握Qt框架,并创建出功能强大的跨平台桌面应用程序。

    基于Matlab GA优化算法的四工件六机器车间调度解决方案

    内容概要:本文详细介绍了利用Matlab的遗传算法(GA)解决四工件六机器车间调度问题的方法。首先定义了问题背景,即4个工件各有3道工序,共6台机器可供选择,目标是最小化总加工时间。文中重点讲解了GA的关键步骤,包括染色体编码(采用工序+机器的双层编码)、适应度函数设计(考虑机器空闲时间和工件工序进度)、以及交叉变异操作(采用顺序交叉和均匀变异)。通过200代的迭代优化,最终得到最优解,使总耗时从初始的70多个时间单位降低到48个时间单位。此外,文章还提供了甘特图可视化功能,帮助直观展示调度结果。 适合人群:对车间调度问题感兴趣的工程技术人员、研究遗传算法的应用开发者、希望了解Matlab在工业优化中应用的研究人员。 使用场景及目标:适用于制造业车间调度优化场景,旨在通过遗传算法找到最优的工件加工顺序和机器分配方案,从而最小化总加工时间,提高生产效率。 其他说明:文中提供的代码示例可以直接用于实验环境,同时也给出了进一步改进的方向,如引入更多现实因素(如固定工序机器限制)和优化参数设置。

    基于Matlab/Simulink的MPC模型预测控制在三车队列及多车扩展中的应用

    内容概要:本文介绍了利用Matlab/Simulink和Carsim构建的MPC模型预测控制下的三车队列控制系统及其扩展性。项目采用模块化建模方法,通过两个MPC控制器和BTPLF通信策略确保车队稳定行驶。文中详细描述了各个模块的功能,如车辆输入输出模块、MPC控制器、通信策略和参数显示模块,并提供了具体的代码示例和技术细节。此外,还探讨了常见问题的解决方案,如版本兼容性和车型配置问题,以及扩展到更多车辆的方法。 适合人群:从事自动驾驶、车队管理、模型预测控制等领域研究的技术人员和研究人员。 使用场景及目标:①理解和实现基于MPC的车队队列控制;②掌握模块化建模方法和联合仿真的具体步骤;③解决实际应用中的兼容性和性能优化问题。 其他说明:项目包含详细的建模说明文档、源码文件及相关文献,有助于深入理解MPC在车队控制中的应用。

    Java编程语言笔记,用于学习使用

    Java编程语言笔记,其中包括基本语法、多线程、网络编程等高级操作。适合学习使用。

    使用MATLAB显示和记录来自Muse的EEG信号.rar

    1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

    基于ARM的双向DC-DC电源变换器设计:同步BUCK-BOOST电路与智能模式切换

    内容概要:本文详细介绍了基于ARM芯片(STM32G474)的双向DC-DC电源变换器的设计与实现。该变换器通过同步BUCK和BOOST电路的级联实现了自动稳压输出,能够在不同输入电压条件下自动切换工作模式。文中涵盖了硬件拓扑结构、关键元器件选择、PWM控制、模式切换逻辑、ADC采样优化、PID稳压算法以及显示和保护机制等方面的内容。作者还分享了许多实践经验和技术细节,如死区时间设置、过采样技术的应用、硬件SPI通信优化、抗积分饱和处理等。 适合人群:具有一定电力电子和嵌入式开发基础的研发人员,尤其是从事电源管理系统的工程师。 使用场景及目标:适用于需要高效、稳定的双向DC-DC电源变换器的设计场合,如新能源储能系统、便携式电子产品等。目标是帮助读者掌握基于ARM的电源管理系统设计方法,提高电源转换效率和稳定性。 其他说明:文章不仅提供了详细的理论分析和代码实现,还分享了大量实用的经验和调试技巧,有助于读者在实际项目中少走弯路并成功实现类似系统。

    基于python实现的脑电专注度和放松度检测+源码+项目文档+算法接口说明(毕业设计&课程设计&项目开发)

    基于python实现的脑电专注度和放松度检测+源码+项目文档+算法接口说明,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档 基于python实现的脑电专注度和放松度检测+源码+项目文档+算法接口说明,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档 基于python实现的脑电专注度和放松度检测+源码+项目文档+算法接口说明,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档 基于python实现的脑电专注度和放松度检测+源码+项目文档+算法接口说明,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档~

    时间序列预测中CNN、LSTM与CNN-LSTM模型的Python实现及性能比较

    内容概要:本文详细介绍了三种时间序列预测模型——CNN、LSTM及其混合模型CNN-LSTM的实现方法。首先,通过对Excel数据进行读取、预处理(包括归一化、创建滑动窗口、划分训练集和测试集),确保数据符合模型输入要求。接着,分别构建并训练了三个模型,解释了各模型的工作原理及代码实现细节。最后,通过均方误差(MAE)评估模型性能,得出混合模型在大多数情况下表现最佳,但在特定数据集上各有优劣。 适合人群:具备一定机器学习基础,尤其是熟悉深度学习框架(如TensorFlow/Keras)的研究人员和开发者。 使用场景及目标:适用于需要进行时间序列预测的任务,如金融数据分析、气象预报等。目标是帮助读者理解不同模型的特点,并选择合适的模型应用于具体业务场景。 其他说明:文中提供了完整的代码示例,可以直接运行于Jupyter Notebook环境。此外,还讨论了一些常见的错误及解决方法,如维度不匹配等问题。

Global site tag (gtag.js) - Google Analytics