ORACLE学习笔记系列（10）正则表达式

weishaoxiang

浏览: 98574 次
性别:
来自: 广西

最近访客更多访客>>

temfulX

wwd2010

13552249730

hoodzwh

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

ORCLE

ORACLE学习笔记系列（10）正则表达式


一、元字符：

^	匹配字符串的开头位置	--如果A是字符串的第一个字符，^A 匹配 A
$	匹配字符串的末尾位置	--如果B是字符串的最后一个字符，$B 匹配 B
*	匹配前面的字符0次或多次	--ba*rk可以匹配 brk、bark、baark等等
+	匹配前面的字符1次或多次	--ba+rk可以匹配 bark、baark等等,但是不能匹配brk，a最少有以一次。
?	匹配前面的字符0次或1次	--ba?rk可以匹配 bark、brk等等,但是不能匹配baark。
.	匹配除null以外的任意单个字符	--hob.it中的.可以是任意的单个字符，如：hobsit等等
|	匹配“或”,指明两项之间的一个选择。	--x|y可以匹配x或者y；例子'^([a-z]+|[0-9]+)$'表示所有小写字母或数字组合成的字符串。
\	反斜线字符说明要匹配的字符是一个特殊字符、常量或者后者引用。（后引用重复上一次的匹配）--	\n 匹配换行符； \\ 匹配 \ ；  \( 匹配 ( ；  \) 匹配 )      
\n	这是对前一次匹配命中的一个后引用，其中n是一个正整数	--(.)\1可以匹配两个连续相同的非空字符。(.)可以匹配除null以外的任何单个字符，而\1则重复上一次匹配的内容，即再次匹配相同的字符，因此可以匹配两个连续相同的非空字符

'{n}'	匹配前面的字符恰好是n次，其中n是整数	--hob{2}it可以匹配hobbit
'{m,n}' 一个精确地出现次数范围，m=<出现次数<=n，'{m}'表示出现m次，'{m,}'表示至少出现m次。  其中n，m都是整数	--hob{2,3}it可以匹配hobbit或者hobbbit
'( )' 分组表达式，看作单个子表达式。标记一个子表达式的开始和结束位置。--如：aaa(x|y)可以匹配aaax或者aaay。
'[]'  方括号表示指定一个匹配列表，该列表匹配列表中显示的任何表达式。 
'[^]' 同上面相反，非匹配列表表达式。 
'[abc]'	可以匹配abc中的任何单个字符	--hello[abc]可以匹配helloa,hellob,helloc
'[a-z]'	可以匹配指定范围内的任何单个字符	--hell[a-z]可以匹配hello或者hellz
'[::]'	指定一个字符类，可以匹配该类中的任何字符	
      [:alnum:] 所有的字母和数字字符,可以匹配字符0-9、A-Z、a-z    
      [:alpha:] 所有的字母字符,可以匹配字符A-Z、a-z  
      [:blank:] 可以匹配空格或tab键   
      [:cntrl:] 所有的控制字符(不会打印出来)   
      [:digit:] 所有的数字,可以匹配数字0-9 
      [:graph:] 可以匹配非空字符,所有的[:punct:]、[:upper:]、[:lower:]和[:digit:]字符   
      [:lower:] 可以匹配小写字母a-z 
      [:print:] 与[:graph:]类似，不同之处在于[:print:]包括空格字符   
      [:punct:] 所有的标点符号,可以匹配标点符号.,""""等等   
      [:space:] 所有的空隔字符(不会打印出来)   
      [:upper:] 可以匹配大写字母A-Z   
      [:xdigit:] 所有有效的十六进制字符，相当于[0-9a-fA-F] 
      
 
二、各种操作符的运算优先级： 
\转义符  
(), (?:), (?=), [] 圆括号和方括号  
*, +, ?, {n}, {n,}, {n,m} 限定符  
^, $, anymetacharacter 位置和顺序  

三、Oracle中支持的正则表达式函数：
        （1）REGEXP_LIKE：   与LIKE 的功能相似  
        （2）REGEXP_INSTR：  与INSTR 的功能相似  
        （3）REGEXP_SUBSTR： 与SUBSTR 的功能相似  
        （4）REGEXP_REPLACE：与REPLACE 的功能相似  
        （5）REGEXP_COUNT：  与LENGTH 的功能相似

（1）REGEXP_LIKE 函数  

语法： 
--REGEXP_LIKE 与 LIKE 函数相同，返回布尔类型 
REGEXP_LIKE(srcstr, pattern [,match_option]) 

注： 
   srcstr          源字符串 
   pattern         正则表达式样式  
   match_option    匹配选项（区分大小写） 
   
其中match_option的取值范围如下：
    i：大小写不敏感；
    c：大小写敏感；
    n：点号 . 不匹配换行符号；
    m：多行模式；
    x：扩展模式，忽略正则表达式中的空白字符。
 
create table B
(
  id   NUMBER,
  name VARCHAR2(100)
);

--数据插入    
INSERT INTO B VALUES ('1', '20140107');
INSERT INTO B VALUES ('2', '2014-01-07');
INSERT INTO B VALUES ('3', '2014-01-07 21:15:27');
INSERT INTO B VALUES ('4', '2014年1月7日星期二');
INSERT INTO B VALUES ('5', 'http://weishaoxiang.iteye.com');
INSERT INTO B VALUES ('6', 'weishaoxiang');
INSERT INTO B VALUES ('7', '吉祥如意');
INSERT INTO B VALUES ('8', '088-12345678');
INSERT INTO B VALUES ('9', 'weishaoxiang@163.com');
INSERT INTO B VALUES ('10', '1881234567');
INSERT INTO B VALUES ('11', 'M00588');
INSERT INTO B VALUES ('12', '297187');
INSERT INTO B VALUES ('13', '192.168.0.102');
INSERT INTO B VALUES ('14', 'F5-DE-F3-E7-B9-99');
INSERT INTO B VALUES ('15', 'who are you');
INSERT INTO B VALUES ('16', '來 時  歡   喜 去 時  悲，空在 人間  走一回。');
INSERT INTO B VALUES ('17', '2M00K88');
INSERT INTO B VALUES ('18', 'aaBB');
INSERT INTO B VALUES ('19', 'aaBBff');
INSERT INTO B VALUES ('20', 'GGpp');
INSERT INTO B VALUES ('21', 'LLOVEYOU');
INSERT INTO B VALUES ('22', '^_^ >_< $@$ ');

--查询以 20开头 07结束的记录并且长度是 8位    
SELECT * FROM B WHERE NAME LIKE '20____07';
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '20....07');

--查询以 20开头 07结束的记录并且长度是 8位，并且全部是数字的记录      
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '20[0-9]{4}07');
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '20[[:digit:]]{4}07');

--查询以 29 或者 2m 开头的记录，不区分大小写   
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^2[9m]', 'i');
--查询以 29 或者 2m 开头的记录，区分大小写    
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^2[M9]');

SELECT * FROM B WHERE NOT REGEXP_LIKE(NAME, '^[[:digit:]]+$'); -- 查询不是纯数字的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^[[:digit:]]+$'); -- 查询是纯数字的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^[0-9]+$'); -- 查询是纯数字的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^[^[:digit:]]+$'); -- 查询不含数字的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '[[:digit:]]'); -- 查询含数字的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '[0-9]'); -- 查询含数字的记录

SELECT * FROM B WHERE NOT REGEXP_LIKE(NAME, '^[[:alpha:]]+$'); -- 查询不是纯字母字符的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^[[:alpha:]]+$'); -- 查询是纯字母字符的记录(全中文也会匹配)
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^[^[:alpha:]]+$'); -- 查询不含字母字符的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '[[:alpha:]]'); -- 查询含字母字符的记录

SELECT * FROM B WHERE REGEXP_LIKE(NAME, '[[:alnum:]]'); -- 查询含字母和数字字符的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '[^[:alnum:]]'); -- 查询含字母和数字字符之外其他字符的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^[^[:alnum:]]+$'); -- 查询不含字母和数字字符的记录

SELECT * FROM B WHERE REGEXP_LIKE(NAME, '[[:blank:]]'); -- 查询含空格的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '[[:space:]]'); -- 查询含空格的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '[[:lower:]]'); -- 查询含小写字母的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '[[:upper:]]'); -- 查询含大写字母的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '[[:punct:]]'); -- 查询含标点符号的记录 

SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^[[:lower:]]+$'); -- 查询全小写字母的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^[[:upper:]]+$'); -- 查询全大写字母的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^[a-z]+$'); -- 查询全小写字母的记录
SELECT * FROM B WHERE REGEXP_LIKE(NAME, '^[A-Z]+$'); -- 查询全大写字母的记录



1、验证字符串全部由字母组成 
SELECT CASE
         WHEN REGEXP_LIKE('Google', '^[[:alpha:]]{6}$') THEN
          'Match Found'
         ELSE
          'No Match Found'
       END
  FROM DUAL;
  
在上面这个例子中，通过正则表达式来验证字符串是否由 6 个字母组成。
 
^              表示行的开始 
[[:alpha:]]    表示字母 
{6}            表示匹配的次数，这里表示匹配6次 
$              表示行的结尾 

2、验证字符串全部由小写字母组成 
SELECT CASE 
         WHEN regexp_like('Terminator', '^([[:lower:]]{3,12})$') THEN 
          'Match Found' 
         ELSE 
          'No Match Found' 
       END  
  FROM dual; 
 
这里如果我们把输入字符串改成“terminator”，则结果就是匹配了。
上面的例子中，通过正则表达式来验证字符串是否由 3 到 12 个小写字母组成。
其中： {3,12}   表示匹配次数，最少3次，最多12次 


3、区分大小写 
SELECT CASE 
         WHEN regexp_like('Republic Of India', 'of', 'c') THEN 
          'Match Found' 
         ELSE 
          'No Match Found' 
       END  
  FROM dual; 
 
上面的例子中，通过正则表达式来验证字符串是否包含小写的“of”。
其中： c 表示完全匹配，区分大小写 


4、匹配第 n位置的字符 
SELECT CASE
         WHEN REGEXP_LIKE('ter*minator', '^...[^[:alnum:]]') THEN
          'Match Found'
         ELSE
          'No Match Found'
       END
  FROM DUAL;
 
在上面的例子中，通过正则表达式来验证字符串“ter*minatory”的第 4 位的字符。
其中： 
^              表示行的开始 
.              表示匹配任意一个的字符(… 表示3个任意的字符) 
[^[:alnum:]]   表示匹配不是字母和数字(^ 在方括号内，表示否定) 


5、查找控制字符 
SELECT CASE
         WHEN REGEXP_LIKE('Super' || CHR(13) || 'Star', '[[:cntrl:]]') THEN
          'Match Found'
         ELSE
          'No Match Found'
       END
  FROM DUAL;
 
上面的例子中，通过正则表达式来验证字符串中是否包含控制符。
（13在ASCII码中表示回车符） 

6、验证 SSN 
SELECT CASE
         WHEN REGEXP_LIKE('987-65-4321', '^[0-9]{3}-[0-9]{2}-[0-9]{4}$') THEN
          'Match Found'
         ELSE
          'No Match Found'
       END
  FROM DUAL;
 
其中： 
^          表示行的开始 
[0-9]{3}   表示3个数字 
-          表示连字号“-” 
[0-9]{2}   表示2个数字 
-          表示连字号“-” 
[0-9]{4}   表示4个数字 
$          表示行的结束 


7、验证 email地址 
SELECT CASE
         WHEN REGEXP_LIKE('oracle@163.com',
                          '^([[:alnum:]]+(_?|\.))[[:alnum:]]*@[[:alnum:]]+(\.([[:alnum:]]+)){1,2}$') THEN
          'Match Found'
         ELSE
          'No Match Found'
       END
  FROM DUAL;
  
 
将上面的正则表达式通过字符“@”分为两部分： 
前半部分 ^([[:alnum:]]+(_?|\.))[[:alnum:]]* ，
其中： 
^       表示行的开始 
([[:alnum:]]+(_?|\.)) 表示匹配以1个或多个字符或者数字字符，紧跟着字符“_”或者字符“.”
[[:alnum:]]* 表示匹配0个或者多个字母或者数字字符 

后半部分 [[:alnum:]]+(\.([[:alnum:]]+)){1,2}$，
其中： 
[[:alnum:]]+ 表示匹配1个或者多个字母或者数字字符 
(\.([[:alnum:]]+)){1,2} 表示匹配1个或者2个，“.”加上1个或者多个字母或者数字字符（例如：.com.cn 或者 .co.in） 
$       表示行的结尾 
 
其中“\.”中“\”表示转义符，因为“.”是关键字符，匹配任意字符，所以需要转义符。

（2）REGEXP_INSTR 函数 

REGEXP_INSTR 函数使用正则表达式返回搜索模式的起点和终点。 
REGEXP_INSTR 返回一个整数，指出搜索模式的开始或结束的位置，如果没有发现匹配的值，则返回 0。 
语法： 
--REGEXP_INSTR与INSTR函数相同，返回字符串位置 
REGEXP_INSTR(srcstr, pattern [, position [, occurrence [, return_option [,match_option]]]])  

注：
    srcstr 待匹配的字符串  
    pattern 待匹配的模式  
    position   开始匹配的位置，如果不指定默认为1  
    occurrence 匹配的次数，如果不指定，默认为1  
    return_option 指定返回值的类型，如果该参数为 0，则返回值为匹配位置的第一个字符，如果该值为非0则返回匹配值的最后一个位置。  
    match_option  可以用这个参数来修改一些默认的配置设置。 
 
其中match_option的取值范围如下：
    i：大小写不敏感；
    c：大小写敏感；
    n：点号 . 不匹配换行符号；
    m：多行模式；
    x：扩展模式，忽略正则表达式中的空白字符。

示例：

--从给定字段的第一个字符开始查找 a 字串，返回查找到第一个 a的位置 
SELECT INSTR('avdsdabasdab', 'a', 1, 1) FROM DUAL;

--从给定字段的第一个字符开始查找 a 字串，返回查找到第二个 a的位置 
SELECT INSTR('avdsdabasdab', 'a', 1, 2) FROM DUAL;

--从给定字段的第六个字符开始查找 a 字串，返回查找到第一个 a的位置 
SELECT INSTR('avdsdabasdab', 'a', 6, 1) FROM DUAL;

--如果return_option 为0 则，Oracle 返回第一个字符出现的位置。这是默认值，与INSTR的作用相同 
SELECT REGEXP_INSTR('abc1def', '[[:digit:]]') OUTPUT FROM DUAL;

--如果return_option 为1，则Oracle 返回跟在所搜索字符出现以后下一个字符的位置。 
--例如，下面的查询返回了在串中发现的第一个数字的位置： 
SELECT REGEXP_INSTR('abc1def', '[[:digit:]]', 1, 1, 1) OUTPUT FROM DUAL;

（3）REGEXP_SUBSTR 函数 
 
语法： 
--REGEXP_SUBSTR与SUBSTR函数相同，返回截取的子字符串 
REGEXP_SUBSTR(srcstr, pattern [, position [, occurrence [, match_option]]]) 
注： 
   srcstr          源字符串 
   pattern         正则表达式样式 
   position        开始匹配字符位置（默认值是“1”)
   occurrence      匹配出现次数 （默认值是“1”)
   match_option    匹配选项（区分大小写） 
   
其中match_option的取值范围如下：
    i：大小写不敏感；
    c：大小写敏感；
    n：点号 . 不匹配换行符号；
    m：多行模式；
    x：扩展模式，忽略正则表达式中的空白字符。
   
  
示例：
   
1、从字符串中截取子字符串
SELECT REGEXP_SUBSTR('2014年\01月\10日 Welcome,new YEAR2014', '[[:alnum:]]+') FROM DUAL;
SELECT regexp_substr('2014年\01月\10日 Welcome,new YEAR2014', '[[:alnum:]]+', 1, 2) FROM dual; 
SELECT regexp_substr('2014年\01月\10日 Welcome,new YEAR2014', '[[:alnum:]]+', 1, 4,'i') FROM dual; 
说明：pattern = [[:alnum:]]+ ：表示匹配1个或者多个字母或数字字符
      position = 1 ：表示从源字符串的第一个字符开始查找匹配（默认值是“1”)
      occurrence = 4 : 表示第4次匹配到的字符串 （默认值是“1”)
      match_option = 'i': 表示不区分大小写 
 
SELECT REGEXP_SUBSTR('@@/2013-01-11/ORCL', '@*[[:alnum:]]+') FROM DUAL;
SELECT REGEXP_SUBSTR('1@/2013-01-11/ORCL', '@+[[:alnum:]]*') FROM DUAL;
SELECT REGEXP_SUBSTR('1@/2013-01-11/ORCL', '@+[[:alnum:]]+') FROM DUAL;
SELECT REGEXP_SUBSTR('@1ORACLE/2013-01-11/ORCL125', '[[:digit:]]+$') FROM DUAL;
SELECT REGEXP_SUBSTR('@1ORACLE/2013-01-11/ORCL', '[^[:digit:]]+$') FROM DUAL;
SELECT REGEXP_SUBSTR('oracle@163.com', '[^@]+') FROM DUAL;
SELECT REGEXP_SUBSTR('1ORACLE/2013-01-11/ORCL', '[[:alnum:]]*', 1, 2) FROM DUAL;

说明：需要区别“+”和“*”的区别  
@* 表示匹配0个或者多个@ 
@+ 表示匹配1个或者多个@  
[^@]+ 表示匹配1个或者多个不是“@”的字符
[[:alnum:]]+ 表示匹配1个或者多个字母或数字字符 
[[:alnum:]]* 表示匹配0个或者多个字母或数字字符   
[[:digit:]]+$ 表示匹配1个或者多个数字结尾的字符  
[^[:digit:]]+$ 表示匹配1个或者多个不是数字结尾的字符   

2、匹配重复出现 
查找连续2个大写字母 
SELECT REGEXP_SUBSTR('HELLO,welcome to you!', '([A-Z])\1', 1, 1, 'c')
  FROM DUAL;

说明：
      pattern = ([a-z])\1 ：表示小写字母a-z，\1 表示匹配前面的字符的连续次数
      position = 1 ：表示从源字符串的第一个字符开始查找匹配（默认值是“1”)
      occurrence = 4 : 表示第4次匹配到的字符串 （默认值是“1”)
      match_option = 'c': 表示区分大小写 
  
查找连续3个的数字 
SELECT REGEXP_SUBSTR('19988000555', '([0-9])\1\1') FROM DUAL;
SELECT CASE
         WHEN REGEXP_LIKE('19988000555', '([0-9])\1\1') THEN
          'Match Found'
         ELSE
          'No Match Found'
       END  
  FROM DUAL;
   

3、其他一些匹配样式 
查找网页地址信息 
SELECT REGEXP_SUBSTR('welcome to http://weishaoxiang.iteye.com/blog/1997112',
                     'http://([[:alnum:]]+\.?){3,4}/?') RESULT
  FROM DUAL;
  
说明： 
http://             表示匹配字符串“http://” 
([[:alnum:]]+\.?)   表示匹配1次或者多次字母或数字字符，紧跟0次或1次逗号符 
{3,4}               表示匹配前面的字符最少3次，最多4次 
/?                  表示匹配一个反斜杠字符0次或者1次 

4、提取 csv 字符串中的第三个值 
SELECT REGEXP_SUBSTR('2014年,01月,10日,Welcome,new,YEAR,2014', '[^,]+', 1, 3)  
  FROM DUAL;
  
说明：
      pattern = [^,]+     表示匹配1个或者多个不是逗号的字符
      position = 1 ：表示从源字符串的第一个字符开始查找匹配（默认值是“1”)
      occurrence = 3 : 表示第3次匹配到的字符串 （默认值是“1”) 

5、字符串的列传行 
SELECT REGEXP_SUBSTR('2014年,01月,10日,Welcome,new,YEAR,2014', '[^,]+', 1, LEVEL)  
  FROM DUAL
CONNECT BY LEVEL <= LENGTH('2014年,01月,10日,Welcome,new,YEAR,2014') -
           LENGTH(REPLACE('2014年,01月,10日,Welcome,new,YEAR,2014', ',')) + 1;
           
6、通过 LEVEL 来循环截取匹配到的字符串。 
下面这个例子，查找源字符串中是否包含 kid 、kids 或者 kidding 这三个字符串 
SELECT CASE
         WHEN REGEXP_LIKE('Why does a kid enjoy kidding with kids only?',
                          'kid(s|ding)*',
                          'i') THEN
          'Match Found'
         ELSE
          'No Match Found'
       END  
  FROM DUAL;
   
说明： 
kid          表示字符串kid 
(s|ding)*    表示匹配0次或者多次字符“s”或者“ding” 
i            表示不区分大小写

（4）REGEXP_REPLACE 函数 

REGEXP_REPLACE 函数是用另外一个值来替代串中的某个值。
例如，可以用一个匹配数字来替代字母的每一次出现。
REGEXP_REPLACE 的格式如下所示 
语法： 
--REGEXP_REPLACE与REPLACE函数相同，替换原字符串中的字符内容 
REGEXP_REPLACE(srcstr, pattern [,replacestr [, position [, occurrence [,match_option]]]]) 

注： 
   srcstr          源字符串 
   pattern         正则表达式样式 
   replacestr      替换字符串
   position        开始匹配字符位置（默认值是“1”)
   occurrence      匹配出现次数 （默认值是“1”)
   match_option    匹配选项（区分大小写） 
   
其中match_option的取值范围如下：
    i：大小写不敏感；
    c：大小写敏感；
    n：点号 . 不匹配换行符号；
    m：多行模式；
    x：扩展模式，忽略正则表达式中的空白字符。
    
1、查找替换空格符 
SELECT REGEXP_REPLACE('HELLO,  welcome   to  you!', '[[:blank:]]{2,8}', ' ')
  FROM DUAL;
  
其中：[[:blank:]]{2,8}  表示2到8个空格 
  
SELECT REGEXP_REPLACE('HELLO,  welcome    to  you!', '( ){2,}', ',') 所有连续两个以上的空白改成逗号
  FROM DUAL;

SELECT REGEXP_REPLACE('HELLO,welcome   to      you!', '( )+', ',') 所有连续的空白改成逗号
  FROM DUAL;

SELECT REGEXP_REPLACE('  HELLO,welcome  to you !', '\s+', ',') 所有连续的空白改成逗号
  FROM DUAL;
   
2、格式化字符串 
SELECT REGEXP_REPLACE('04099661234',
                      '([[:digit:]]{3})([[:digit:]]{4})([[:digit:]]{4})',
                      '(\1) \2-\3')  
  FROM DUAL;
 
([[:digit:]]{3}) 表示3个数字   
([[:digit:]]{4}) 表示4个数字  
([[:digit:]]{4}) 表示4个数字  
所以 “(\1) \2-\3” 表示将前3个数字用圆括号，紧跟着一个空格，再跟着中间4个数据，再跟着连字符“-”，最后是后4位的数字。 
 

SELECT REGEXP_REPLACE('04099661234',
                      '^([[:digit:]]{1})([[:digit:]]{2})([[:digit:]]{4})([[:digit:]]{4})$',
                      '+91-\2-\3-\4') AS FORMATTED_PHONE
  FROM DUAL;

 
3、在每两个字符之间插入一个空格符，原字符串中的空格也算一个字符 
SELECT REGEXP_REPLACE('HELLO,welcome to you!', '(.)', '\1 ') FROM DUAL;

（5）REGEXP_COUNT 函数

REGEXP_COUNT 返回在源串中出现的模式的次数，作为对REGEXP_INSTR 函数的补充。
需要注意的是，尽管COUNT 是一个集合函数，它操作的是行组，但REGEXP_COUNT 是一个单行函数，它分别计算每一行。
REGEXP_COUNT 的语法如下所示：  
REGEXP_INSTR(srcstr, pattern [, position [,match_option]])  

注： 
   srcstr          源字符串 
   pattern         正则表达式样式
   position        开始匹配的位置，如果不指定默认为1    
   match_option    匹配选项（区分大小写） 
   
其中match_option的取值范围如下：
    i：大小写不敏感；
    c：大小写敏感；
    n：点号 . 不匹配换行符号；
    m：多行模式；
    x：扩展模式，忽略正则表达式中的空白字符。

REGEXP_COUNT 返回pattern 在srcstr串中出现的次数。如果未找到匹配，则函数返回0。
position 变量告诉Oracle 在源串的什么位置开始搜索。在开始位置之后每出现一次模式，都会使计数结果增加1。

 
示例：

--源字符串中有多少个大写字母 
SELECT REGEXP_COUNT('HELLO,Welcome to you!', '([A-Z])',1,'c') FROM DUAL;

--源字符串中有多少个数据 
SELECT REGEXP_COUNT('a3bc1de5f', '[[:digit:]]')   FROM DUAL;
 
--没有匹配，则返回结果0
SELECT REGEXP_COUNT('HELLO,Welcome to you!', '[[:digit:]]', 1)   FROM DUAL;

--源字符串中包含多少个“O”，不区分大小写
SELECT REGEXP_COUNT('HELLO,Welcome to you!', 'o',1,'i') FROM DUAL;

--源字符串中有多少个空格符
SELECT REGEXP_COUNT('HELLO,  welcome   to  you!', '[[:blank:]]') FROM DUAL; 

--源字符串中有多少个非字母或数字的字符
SELECT REGEXP_COUNT('HELLO, welcome@to$you!', '[^[:alnum:]]') FROM DUAL;

分享到：

ORACLE学习笔记系列（11）字符函数 | ORACLE学习笔记系列（9）通配符和特殊字符

2014-01-11 12:41
浏览 2281
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

ORACLE学习笔记系列（10）正则表达式

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

ORACLE学习笔记系列（10）正则表达式

评论

发表评论

相关推荐

ORACLE学习笔记系列（15）使用扩展的 GROUP BY 子句（四）

ORACLE学习笔记系列（15）使用扩展的 GROUP BY 子句（三）

ORACLE学习笔记系列（15）使用扩展的 GROUP BY 子句（二）

ORACLE学习笔记系列（15）使用扩展的 GROUP BY 子句

ORACLE学习笔记系列（14）聚合函数

ORACLE学习笔记系列（13）转换函数

ORACLE学习笔记系列（12）数字函数

ORACLE学习笔记系列（11）字符函数

ORACLE学习笔记系列（9）通配符和特殊字符

ORACLE学习笔记系列（8）ORACLE中的空值(NULL)和与空值(NULL)有关的函数

ORACLE学习笔记系列（7）SQL语言分类

ORACLE学习笔记系列--目录

ORACLE学习笔记系列（6）Outer Join新旧语法对比分析

ORACLE学习笔记系列（5）连接查询和联合查询

ORACLE学习笔记系列（4）ORACLE优化器

ORACLE学习笔记系列（3）SQLPLUS里的清屏命令

ORACLE学习笔记系列（2）解决 SQLPLUS分析SQL语句出现 'PLAN_TABLE' is old version

ORACLE学习笔记系列（1）如何使用SQLPLUS分析SQL语句

Oracle 多表查询

Oracle 日期时间运算

最近访客更多访客>>