ORACLE终于在10G中提供了对正则表达式的支持,以前那些需要通过LIKE来进行的复杂的匹配就可以通过使用正则表达式更简单的实现。
ORACLE中的支持正则表达式的函数主要有下面四个:
1,REGEXP_LIKE :与LIKE的功能相似
2,REGEXP_INSTR :与INSTR的功能相似
3,REGEXP_SUBSTR :与SUBSTR的功能相似
4,REGEXP_REPLACE :与REPLACE的功能相似
在新的函数中使用正则表达式来代替通配符‘%’和‘_’。
正则表达式由标准的元字符(metacharacters)所构成:
'^' 匹配输入字符串的开始位置,在方括号表达式中使用,此时它表示不接受该字符集合。
'$' 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 'n' 或 'r'。
'.' 匹配除换行符 n之外的任何单字符。
'?' 匹配前面的子表达式零次或一次。
'+' 匹配前面的子表达式一次或多次。
'*' 匹配前面的子表达式零次或多次。
'|' 指明两项之间的一个选择。例子'^([a-z]+|[0-9]+)$'表示所有小写字母或数字组合成的字符串。
'( )' 标记一个子表达式的开始和结束位置。
'[]' 标记一个中括号表达式。
'{m,n}' 一个精确地出现次数范围,m=<出现次数<=n,'{m}'表示出现m次,'{m,}'表示至少出现m次。
num 匹配 num,其中 num 是一个正整数。对所获取的匹配的引用。
字符簇:
[[:alpha:]] 任何字母。
[[:digit:]] 任何数字。
[[:alnum:]] 任何字母和数字。
[[:space:]] 任何白字符。
[[:upper:]] 任何大写字母。
[[:lower:]] 任何小写字母。
[[:punct:]] 任何标点符号。
[[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]。
各种操作符的运算优先级
转义符
(), (?:), (?=), [] 圆括号和方括号
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, anymetacharacter 位置和顺序
| “或”操作
下面通过几个例子来具体说明这几个新函数的使用方法:
SQL> create table sunwg (id varchar2(100));
Table created.
SQL> insert into sunwg values ('<a href="http://sunwgneuqsoft.itpub.net/post/34741/447698">常见SQL访问索引的方式</a>');
1 row created.
SQL> commit;
Commit complete.
SQL> select * from sunwg;
ID
----------------------------------------------------------------------------------------------------
<a href="http://sunwgneuqsoft.itpub.net/post/34741/447698">常见SQL访问索引的方式</a>
1, REGEXP_LIKE
REGEXP_LIKE与LIKE类似,用REGEXP_LIKE能实现的操作大部分都可以用LIKE实现,不过要简单方便得多。
<a>目标:查询表sunwg中是否存在类似与3XX41的记录?
LIKE:
select * from sunwg where id like '%3__41%';
REGEXP_LIKE
select * from sunwg where regexp_like(id,'3..41');
<b>目标:查询表sunwg中是否存在类似与3XX41的记录,并且XX必须是数字?
LIKE:
这个LIKE我就想出来很好的实现办法了,唯一想到就是截取出来后判断该字符串是不是纯数字的。
REGEXP_LIKE
select * from sunwg where regexp_like(id,'3[0-9]{2}41');
用REGEXP_LIKE则可以简单快捷的得到结果。其他几个函数也都有类似的情况,下面的函数就不具体比较差异了,仅仅给出常用的用法。
2, REGEXP_INSTR
<a>目标:查询表sunwg中是否存在类似与3XX41的字符串第一次出现的位置?
SQL> select regexp_instr(id,'3..41',1,1) from sunwg;
REGEXP_INSTR(ID,'3..41',1,1)
----------------------------
46
SQL> select substr(id,46,5) from sunwg;
SUBST
-----
34741
3, REGEXP_SUBSTR
<a>目标:截取出表sunwg中的URL地址?
SQL> select regexp_substr(id,'http[0-9a-zA-Z/:.]+') from sunwg;
REGEXP_SUBSTR(ID,'HTTP[0-9A-ZA-Z/:.]+')
----------------------------------------------------------------------------------------------------
http://sunwgneuqsoft.itpub.net/post/34741/447698
4, REGEXP_REPLACE
<a>目标:替换表sunwg中的URL的地址为http://www.163.com/?
SQL> select regexp_replace(id,'http[0-9a-zA-Z/:.]+','www.163.com') from sunwg;
REGEXP_REPLACE(ID,'HTTP[0-9A-ZA-Z/:.]+','WWW.163.COM')
------------------------------------------------------------------------------------------------------------------------------------------------------
<a href="www.163.com">常见SQL访问索引的方式</a>
从上面的例子可以看得出来这几个支持正则表达式的函数是十分强大的,合理的加以使用一定会使你写出的SQL更加简单高效。
最后,附加点sql中LIKE语句的见解:
LIKE
确定给定的字符串是否与指定的模式匹配。模式可以包含常规字符和通配符字符。模式匹配过程中,常规字符必须与字符串中指定的字符完全匹配。然而,可使用字符串的任意片段匹配通配符。与使用 = 和 != 字符串比较运算符相比,使用通配符可使 LIKE 运算符更加灵活。如果任何参数都不属于字符串数据类型,Microsoft® SQL Server™ 会将其转换成字符串数据类型(如果可能)。
语法
match_expression [ NOT ] LIKE pattern [ ESCAPE escape_character ]
参数
match_expression
任何字符串数据类型的有效 SQL Server 表达式。
pattern
match_expression 中的搜索模式,可以包含下列有效 SQL Server 通配符。
通配符 描述 示例
% 包含零个或更多字符的任意字符串。 WHERE title LIKE '%computer%' 将查找处于书名任意位置的包含单词 computer 的所有书名。
_(下划线) 任何单个字符。 WHERE au_fname LIKE '_ean' 将查找以 ean 结尾的所有 4 个字母的名字(Dean、Sean 等)。
[ ] 指定范围 ([a-f]) 或集合 ([abcdef]) 中的任何单个字符。 WHERE au_lname LIKE '[C-P]arsen' 将查找以arsen 结尾且以介于 C 与 P 之间的任何单个字符开始的作者姓氏,例如,Carsen、Larsen、Karsen 等。
[^] 不属于指定范围 ([a-f]) 或集合 ([abcdef]) 的任何单个字符。 WHERE au_lname LIKE 'de[^l]%' 将查找以 de 开始且其后的字母不为 l 的所有作者的姓氏。
escape_character
字符串数据类型分类中的所有数据类型的任何有效 SQL Server 表达式。escape_character 没有默认值,且必须仅包含一个字符。
结果类型
Boolean
结果值
如果 match_expression 匹配指定模式,LIKE 将返回 TRUE。
注释
当使用 LIKE 进行字符串比较时,模式字符串中的所有字符都有意义,包括起始或尾随空格。如果查询中的比较要返回包含"abc "(abc 后有一个空格)的所有行,则将不会返回包含"abc"(abc 后没有空格)的列所在行。但是可以忽略模式所要匹配的表达式中的尾随空格。如果查询中的比较要返回包含"abc"(abc 后没有空格)的所有行,则将返回以"abc"开始且具有零个或多个尾随空格的所有行。
分享到:
相关推荐
Oracle 数据库正则表达式应用详解 在 Oracle 数据库中,正则表达式是一种强大的模式匹配工具,可以帮助用户快速搜索、替换和验证数据。从 Oracle 10g 开始,Oracle 内建了符合 IEEE POSIX (Portable Operating ...
* 元字符和普通字符:元字符是指在正则表达式中表示特殊含义的字符,如"."、"\"、"?"、"*"、"+"、"|",等等。普通字符是指除元字符外的所有 Unicode 字符。 * 量词:量词用来指定量词的前一个字符出现的次数,如"?",...
### Oracle正则表达式详解(用法+实例) #### 一、正则表达式简介 正则表达式是一种用于匹配字符串中字符组合的工具。它由一个或多个字符及特殊的字符元组成,能够帮助我们执行复杂的字符串搜索和替换任务。在...
ORACLE 正则表达式的使用(REGEXP_LIKE REGEXP_INSTR REGEXP_SUBSTR REGEXP_REPLACE)
position :起始位置,从第几个字符开始正则表达式匹配(默认为1) occurrence :标识第几个匹配组,默认为1 modifier :模式(‘i’不区分大小写进行检索;’c’区分大小写进行检索。默认为’c’) SELECT REGEXP_...
正则表达式是在 Oracle 10g 中添加的新特性,用于匹配字符串中的模式。下面是 ORACLE SQL 正则表达式的相关知识点: 匹配字符 * `[:alnum:]` 匹配任何字母和数字 * `[:alpha:]` 匹配任何字母 * `[:blank:]` 匹配...
字符簇是POSIX正则表达式中一组预定义的字符集合,用于方便地表示常见的字符类型: - `[[:alpha:]]`:任何字母。 - `[[:digit:]]`:任何数字。 - `[[:alnum:]]`:任何字母或数字。 - `[[:space:]]`:任何空白字符。 ...
Oracle的正则表达式在数据库查询和数据处理中扮演着重要的角色,它是Oracle SQL和PL/SQL中的一个强大工具,用于匹配和操作字符串。本文将深入探讨Oracle中的正则表达式,包括其基本语法、常见操作符以及在实际应用中...
Oracle正则表达式还支持更高级的功能,如预定义字符类(如`\d`代表数字,`\w`代表单词字符),分组捕获(使用圆括号`()`定义),非贪婪匹配(使用`?`使量词变为非贪婪),以及反向引用(`\number`引用前面分组的内容...
2. **错误排查**:正则表达式中的错误排查通常比标准SQL语句更加困难。开发者需要熟悉正则表达式的语法和特性,以便能够准确地定位和解决问题。 3. **性能考虑**:尽管正则表达式提供了强大的查询能力,但在某些...
Oracle Database 作为业界领先的数据库产品之一,在其10g版本中引入了对正则表达式(Regular Expression, RE)的支持,这为数据管理和查询带来了更大的灵活性和效率。正则表达式是一种用于文本模式匹配的强大工具,...
元字符在正则表达式中具有特殊意义,如`^`匹配字符串开头,`$`匹配字符串结尾,`.`匹配任意非换行符的字符,`?`表示前面的字符可出现0次或1次,`+`表示1次或多次,`*`表示0次或多次,`|`表示选择,`( )`用于分组,`...
Oracle正则表达式参考手册 ,《Oracle Regular Expressions Pocket Reference 》 Oracle Regular Expressions Pocket Reference is part tutorial and part quick-reference.
Oracle 正则表达式参考手册 regexp_instr regexp_substr regexp_repalce regexp_like
chm格式的Oracle正则表达式参考手册,英文版的,不过英文不是很难! ......解压密码 www.infoxa.com