- 浏览: 239331 次
- 性别:
- 来自: 北京
文章分类
最新评论
-
thepastsee:
304572183股票交流 欢迎加入
实时股票 -
345161974:
很不错,我第一个接触的CSS卡片布局效果,多谢
css卡片效果
正则表达式——实例分析(更新2009-03-10)
关键字: 正则表达式
(1)应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
String.prototype.len=function(){return this.replace([^x00-xff]/g,”aa”).length;}
----------------------------------------------------------------------------------------------------------
(2)应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现
String.prototype.trim = function()
{
return this.replace(/(^s*)|(s*$)/g, “”);
}
----------------------------------------------------------------------------------------------------------
(3)应用:利用正则表达式分解和转换IP地址
function IP2V(ip) //IP地址转换成对应数值
{
re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正则表达式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error(”Not a valid IP address!”)
}
}
不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
----------------------------------------------------------------------------------------------------------
(4)应用:从URL地址中提取文件名的javascript程序,如下结果为page1
s=”http://www.9499.net/page1.htm”;
s=s.replace(/(.*/){0,}([^.]+).*/ig,”$2″) ; //Page1.htm
----------------------------------------------------------------------------------------------------------
(5)应用:利用正则表达式限制网页表单里的文本框输入内容
用正则表达式限制只能输入中文:onkeyup=”value=”/blog/value.replace(/[”^u4E00-u9FA5]/g,”) ” onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^u4E00-u9FA5]/g,”))”
用正则表达式限制只能输入全角字符: onkeyup=”value=”/blog/value.replace(/[”^uFF00-uFFFF]/g,”) ” onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^uFF00-uFFFF]/g,”))”
用正则表达式限制只能输入数字:onkeyup=”value=”/blog/value.replace(/[”^d]/g,”) “onbeforepaste= “clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^d]/g,”))”
用正则表达式限制只能输入数字和英文:onkeyup=”value=”/blog/value.replace(/[W]/g,””) “onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^d]/g,”
----------------------------------------------------------------------------------------------------------
(6)利用正则表达式去除字串中重复的字符的算法程序:
var s="abacabefgeeii"
var s1=s.replace(/(.).*1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //结果为:abcefgi
----------------------------------------------------------------------------------------------------------
(7)在字符串中精确查找链接地址
((http|https|ftp):(\/\/|\\\\)((\w)+[.]){1,}(net|com|cn|org|cc|tv|[0-9]{1,3})(((\/[\~]*|\\[\~]*)
(\w)+)|[.](\w)+)*(((([?](\w)+){1}[=]*))*((\w)+){1}([\&](\w)+[\=](\w)+)*)*)
我们知道,链接地址一般以http或者https或者ftp等形式出现。初步总结一下就是,链接地址必须符合如下条件:
条件1
以http://或者https://或者ftp://等开头(当然还有其它形式,这里只列出主要的)
条件2
http://后面必须跟一个单词字符,紧接着单词字符后面的是"."(这样的组合必须出现一次或多次)。紧跟着“.”后面的是域名后缀(如net或者com或者cn等,如果是以IP地址的形式出现就可以是数字)
条件3
出现完整的链接地址后,还可以出现下一级或者更多级的目录(还要注意个人主页的地址有可能出现"~"符号)
条件4
链接地址末尾可以带参数。如典型的页数?PageNo=2&action=display等
现在我们用下面的代码来逐个匹配上面的条件——
1、((http|https|ftp):(\/\/|\\\\) 满足条件1
表示http:// http:\\ https:// https:\\ ftp:// ftp:\\都匹配(在这里考虑了某些用户可能把"//"输成“\\”的易发性错误)
注意:"|"表示“或者”,"\"是转义字符。“\/\/”表示"//",“\\\\”表示"\\"
2、((\w)+[.]){1,}(net|com|cn|org|cc|tv|[0-9]{1,3}) 满足条件2
“((\w)+[.]){1,}”表示一个单词字符加一个点号可以出现1次或者多次(这里考虑了某些用户喜欢省略www而将http://www.w3c.com写成http://w3c.com)
“(net|com|cn|org|cc|tv|[0-9]{1,3})”表示必须要以net或者com或者cn或者org或者cc或者tv或者三位以下的数字结束
[0-9]{1,3}表示三位以下的数字,因为ip地址的任何段不能超过255
3、(((\/[\~]*|\\[\~]*)(\w)+)|[.](\w)+)* 满足条件3
“(\/[\~]*|\\[\~]*)”表示可以出现"/~"或者是"\~",(其中“[\~]*”表示 ~ 可以出现也可以不出现),因为不是每个链接地址都有下一级目录
“(\w)+)|[.](\w)+)”表示必须出现一个单词字符(即目录或者是一个带有扩展名的文件)
注意:最后还有一个“*”表示上面括号内的可以出现也可以不出现,否则就只能匹配有下一级目录的链接地址了。
4、(((([?](\w)+){1}[=]*))*((\w)+){1}([\&](\w)+[\=](\w)+)*)*)满足条件4
“((([?](\w)+){1}[=]*))*((\w)+){1}”表示形如"?PageNo=2"的字符串可以出现也可以不出现,如果出现则只能出现一次(因为不可能有两个“?”号出现)。
“([\&](\w)+[\=](\w)+)*)”表示形如“&action=display”的字符串可以出现也可以不出现(因为并不是每个网页都带有两个以上的参数。
整个“((([?](\w)+){1}[=]*))*((\w)+){1}([\&](\w)+[\=](\w)+)*)*”表示形如“? PageNo=2&action=display”的字符串可以出现也可以不出现(即链接地址可以有参数也可以没有参数)
把上面的组合起来,我们就可以匹配一个比较全面的链接地址了。比用简单的“(http:\/\/\S+)”来匹配一个链接地址要好,读者可以自行行测试比较。当然,这段代码还有很多不足之处,希望大家能够继续改进。
----------------------------------------------------------------------------------------------------------
(8)替代典型的标签:[/b]
我们的目的就是要把成对的替换成<b></b>下面来看我们实现它的模板
(\[b\])(.+)(\[\/b\])
这里用了"(.+)"来配匹到之间的整个字符串,在替代的时候我们要写成这样
str=checkexp(re,str,"<b>$2</b>")
(注意:checkexp是我自定义的函数,将在后面给出。这个函数将把按照我们提供的模板进行替代。)
也许你会问这里出现一个"$2"是什么东东,呵注意了这个$2可是很重要的,它代表了"(.+)"所配匹的整个字符串。
为什么是$2而不是$1、$3呢?因为$1代表(\[b\])所匹配的"[b]"字符串,$3代表(\[\/b\])所匹配的""字符串,显然这里我们需要的是$2而不是$1$3。
----------------------------------------------------------------------------------------------------------
(9)<div class="a">北京</div> <div class="b">上海</div>怎么得到上海
结果:"<div\\s+class=\"b\"\\s*>(.+?)</div>"
----------------------------------------------------------------------------------------------------------
(10)如何用正则表达式判断(第3和第3fsdf)这两种形式为非法,其余组合为合法,前提条件是能输入的只有数字,字母,中文。
var value = "第3fsdf";
var pattern = /^第3(fsdf)?$/;
if(value.match(pattern)){
alert(非法);
}
----------------------------------------------------------------------------------------------------------
(11)匹配一个英文姓名的js 正则表达式
例如: li/ming mi ng/li m i ng / l i
姓和名之间一定得用特殊符号"/"来隔开,姓和名同时可以有多个空格
除了特殊符号"/"以外,任何特殊等号都不可以出现。
/^([a-z\s]+)\/([a-z\s]+)$/i
----------------------------------------------------------------------------------------------------------
(12)<a href="11">11</a><a href="22">22</a>
用正则表达式如何找到第一个<a到第一个</a>之间的内容?
"<a href=\"11\">11</a><a href=\"22\">22</a>".replaceAll("(?i)<a(.*?)>[^<]+</a>","$1")
结果是href="11" href="22"
用“<a.*</a>”只能匹配到最后那个</a>,而没有匹配到第一个</a>的
<a.*</a>
改成
<a.*?</a>
默认情况下为贪婪模式,也就是最大匹配,<a.*</a>会匹配它能找到的最长的字符串,加上?就是懒惰模式,会找到最短的字符串
----------------------------------------------------------------------------------------------------------
(13)要实现下面的功能;
String s="1-4级份开始到福建卡的师傅2-8级份开始到5福建卡的师傅9-14级份开始到福建卡的师傅$";
提取1-4级,2-8级等等这样的字段,放在一个数组中
eg;string[] ss=.....;
ss[0]=1-4级; ss[1]=2-8级; ......
用Java语言写,最好用Java自带的正则表达式库;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
class StringTest{
public static void main(String[] args){
new StringTest().testRegex();
}
public void testRegex(){
String str="1-4级份开始到福建卡的师傅2-8级份开始到5福建卡的师傅9-14级份开始到福建卡的师傅$";
String reg = "(\\d+-\\d+级)";
String[] marches = this.findMarch(str, reg);
System.out.println("Find:"+marches.length);
}
private String[] findMarch(String str,String reg){
Pattern pattern = Pattern.compile(reg);
Matcher matcher = pattern.matcher(str);
List<String> list = new ArrayList<String>();
while(matcher.find()){
System.out.println(matcher.group(1));
list.add(matcher.group(1));
}
String[] marches = new String[list.size()];
for(int i=0; i<list.size(); i++){
marches[i] = list.get(i);
}
return marches;
}
}
----------------------------------------------------------------------------------------------------------
(14)某个非数字字符串后面只跟3个数字
js: /^[^0-9]{1,}[0-9]{3}$/
[^0-9]{1,} 匹配非数字,出现一次以上.
[0-9]{3} 匹配出现三次的数字
java:Pattern p = Pattern.compile("[^0-9]{1,}[0-9]{3}");
----------------------------------------------------------------------------------------------------------
(15)判断字符是否是除了 @ —— , ? “” | ~ % * !之外的其他符号?
import java.util.regex.Pattern;
import java.util.regex.Matcher;
public class testMatch2{
public static boolean checkNameReg(String str) {
String badword = "[^@——,?“”|~%*!]";
Pattern pattern = Pattern.compile(badword);
Matcher matcher = pattern.matcher(str);
return matcher.find();
}
public static void main(String[] args){
String str = "@——";
System.out.println("str match result:"+checkNameReg(str));
String str2 = "开始";
System.out.println("str match result:"+checkNameReg(str2));
}
}
----------------------------------------------------------------------------------------------------------
(16)匹配除078之外的三位数
\\d{3}(?<!078)
----------------------------------------------------------------------------------------------------------
(17)var s = "ab
cd
ef
gh";
现在想把s里面的回车换行转换成$符号。。。。
s.replace(/\n/mg, '$') 或者 s.replace(/\n/g, '$')
----------------------------------------------------------------------------------------------------------
(18)在JS中,求一正则表达式用以识别以下表达式是否合法:
A > B A < B A >= B A <= B A != B
其中 A B 为不是 <,>,= 的任何字符串,而且A B必存在 <,>,>=,<=,!= 两边可以用0到n个空格
如 fddd > fda3 fdafds != dddd fda <= fdsa 合法
fddd ! fda fdsafdsa >= fdee != 不合法
"其中 A B 为不是 <,>,= 的任何字符串"
如果是这样的话,就是[^<>=]+\s*(([<>!]{0,1}=)|[<>=]{1,1})\s*[^<>=]+
如果带!,就是 [^<>!=]+\s*(([<>!]{0,1}=)|[<>=]{1,1})\s*[^<>!=]+
A!=(空格) 被实别为 true 修改为 [^<>=\s]+\s*(([<>!]{0,1}=)|[<>=]{1,1})\s*[^<>=\s]+ 可以
----------------------------------------------------------------------------------------------------------
(19)判断一个字符串是不是以“yyyy-mm-dd”的格式输入的
String patternStr = "^((((19){1}|(20){1})(\\d){2})|(\\d){2})[-\\s]{1}[01]{1}(\\d){1}[-\\s]{1}[0-3]{1}(\\d){1}$";
----------------------------------------------------------------------------------------------------------
(20)String table = "<table>sdafaf<tr></tr>dasdf</table>sadfadfasdf</table>sadfasdfasdfadsf</table>";
假如现在有这么一个字符串。
想截取第一个<table></table>中的内容
Pattern pattern = Pattern.compile("<table>((?!</table>).)*</table>");
----------------------------------------------------------------------------------------------------------
(21)问题描述:
resultStr = "@inproceedings{1031197, author = {S. Alireza Aghili and Divyakant Agrawal and Amr El Abbadi}, title = {Protein structure alignment using geometrical features}, booktitle = {CIKM '04: Proceedings of the thirteenth ACM international conference on Information and knowledge management}, year = {2004}, isbn = {1-58113-874-1}, pages = {148--149}, location = {Washington, D.C., USA}, doi = {http://doi.acm.org/10.1145/1031171.1031197}, publisher = {ACM}, address = {New York, NY, USA}, },"
要将resultStr中{}内部的内容识别出来,并与 = 前的内容匹配。即得到
author的值为S. Alireza Aghili and Divyakant Agrawal and Amr El Abbadi,
title的值为Protein structure alignment using geometrical features,等等。
rs:
String resultStr ="字符串";
Pattern p = Pattern.compile("[\\s\\t]+([\\w\\s]+)=[\\s]+\\{([^}]+)\\}");
Map tmpMap = new HashMap();
Matcher m = p.matcher(resultStr);
while(m.find()){
String key=m.group(1);
String value=m.group(2);
System.out.println(key+"="+value);
tmpMap.put(key,value);
}
GlobalMode obj = new GlobalMode();
obj.setAuthor(tmpMap.get("author"));
obj.setTitle(tmpMap.get("title"));
....
----------------------------------------------------------------------------------------------------------
(22)"**jsunit/**/*.js" 这个类型的正则表达式用JAVA怎么去写.
".*jsunit\\/.*\\/.*\\.js"
----------------------------------------------------------------------------------------------------------
(23)一个奇怪的正则问题
System.out.println("111".matches("(\\d)((?!\\1)\\d)\\3"));
输出false
System.out.println("111".matches("((\\d)((?!\\1)\\d)\\3)"));
怎么会是true
因为前一个正则表达式里,匹配到(?!\1)的时候,第一个捕获分组((\d))已经匹配到内容了,内容是1,而这里的否定正向环视要求这个位置的右边不是1,所以不匹配。
后一个正则表达式里,匹配到(?!\1)的时候,第一个捕获分组尚未匹配完因而内容还是空的,这样这个否定正向环视就不影响后续匹配,最后整个正则表达式就匹配了。
----------------------------------------------------------------------------------------------------------
(24)用正则表达式去检查mail地址时,而mail地址比较怪,用了"-",而"-"恰好是正则里的特殊字符,用\\-去过滤,不成功,给个思路?
public class RegexTest extends TestCase {
public void test() {
String regex = "[a-zA-Z\\-]";
assertTrue(Pattern.compile(regex).matcher("a").matches());
assertTrue(Pattern.compile(regex).matcher("A").matches());
assertTrue(Pattern.compile(regex).matcher("-").matches());
assertFalse(Pattern.compile(regex).matcher("1").matches());
assertFalse(Pattern.compile(regex).matcher(".").matches());
assertFalse(Pattern.compile(regex).matcher(">").matches());
}
}
----------------------------------------------------------------------------------------------------------
(25)如何匹配 任意连续字符
比如 123aa4556 中的aa ,55
import java.util.regex.*;
public class Test {
public static void main(String[] args) {
Pattern p = Pattern.compile("(.)\\1+");
String str = "12333455aaabc677";
Matcher m = p.matcher(str);
while (m.find()) {
System.out.println(str.substring(m.start(), m.end()));
}
}
}
// 输出:
// 333
// 55
// aaa
// 77
----------------------------------------------------------------------------------------------------------
(26)用正则表达式匹配一个insert的SQL语句,能够自动地将变量赋给对应的字段,比如
SQL=“insert into table(item1,item2,item3) values(:item1,:item2,:item3)”
map.put(item1,"111")
map.put(item2,"222")
map.put(item3,"333")
想用正则表达式自动的将SQL语句中的:item1,:item2,:item3替换成map中对应的“111”,"222","333"
String SQL="insert into table(item1,item2,item3) values(:item1,:item2,:item3)";
Map map = new HashMap();
map.put("item1","111");
map.put("item2","222");
map.put("item3","333");
Pattern p=Pattern.compile("(?::)(\\w+)(?:\\b)");
Matcher m=p.matcher(SQL);
StringBuffer result=new StringBuffer();
while (m.find()) {
String key=m.group(1);
m.appendReplacement(result,(String)map.get(key));
}
m.appendTail(result);
String resultSql=result.toString();
System.out.println(resultSql);
----------------------------------------------------------------------------------------------------------
(27)求一个去括号()中间任意字符串的JAVA正则表达式
String s="(Jack)jack1@163.com,"+
"(杰克)jack2@qq.com,"+
"(jack son.()杰克)jack3@qq.com,"+
"(杰克.jack)jack4@qq.com,";
String result= s.replaceAll("\\((?<=\\()[^@]+(?=(\\)[^)]+@))\\)","");
System.out.println("Result:"+result);
----------------------------------------------------------------------------------------------------------
(28)只匹配 15位 或者 18 位
/^\d{15}$|^\d{18}$/
----------------------------------------------------------------------------------------------------------
(29)要写一个判断金额小于等于20,小数位数只能有1位,不是负数的正则表达式
js: /^(?:20(?:\.0)?|1?\d(?:\.\d)?)$/
java: "^(?:20(?:\\.0)?|1?\\d(?:\\.\\d)?)$"
----------------------------------------------------------------------------------------------------------
(30)正则表达式 用来匹配提取aa,bb的值
String src1 = "/ssiwh/vieen/;aa=87211_diweuj;bb=wqqeii_998;qq/;/";
String re1 = "(?<=([aa|bb]=))[^;]+(?=;)";
Pattern p = Pattern.compile(re1);
Matcher m = p.matcher(src1);
while(m.find()){
String tmp = m.group();
System.out.println("结果:"+tmp);
}
----------------------------------------------------------------------------------------------------------
(31)要求是:只能输入0-24之间的数字,最多只允许两位小数。
var re = /(^[0-9]([.][0-9]{1,2})?$)|(^1[0-9]([.][0-9]{1,2})?$)|(^2[0-3]([.][0-9]{1,2})?$)|(^24([.]0{1,2})?$)/;
或者
/^([1](?:[0-9]|)|[2](?:[0-3]|)|[0-9])(?:\.[0-9]{1,2}|)$|^24(?:\.0{1,2}|)$/
关键字: 正则表达式
(1)应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
String.prototype.len=function(){return this.replace([^x00-xff]/g,”aa”).length;}
----------------------------------------------------------------------------------------------------------
(2)应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现
String.prototype.trim = function()
{
return this.replace(/(^s*)|(s*$)/g, “”);
}
----------------------------------------------------------------------------------------------------------
(3)应用:利用正则表达式分解和转换IP地址
function IP2V(ip) //IP地址转换成对应数值
{
re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正则表达式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error(”Not a valid IP address!”)
}
}
不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
----------------------------------------------------------------------------------------------------------
(4)应用:从URL地址中提取文件名的javascript程序,如下结果为page1
s=”http://www.9499.net/page1.htm”;
s=s.replace(/(.*/){0,}([^.]+).*/ig,”$2″) ; //Page1.htm
----------------------------------------------------------------------------------------------------------
(5)应用:利用正则表达式限制网页表单里的文本框输入内容
用正则表达式限制只能输入中文:onkeyup=”value=”/blog/value.replace(/[”^u4E00-u9FA5]/g,”) ” onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^u4E00-u9FA5]/g,”))”
用正则表达式限制只能输入全角字符: onkeyup=”value=”/blog/value.replace(/[”^uFF00-uFFFF]/g,”) ” onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^uFF00-uFFFF]/g,”))”
用正则表达式限制只能输入数字:onkeyup=”value=”/blog/value.replace(/[”^d]/g,”) “onbeforepaste= “clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^d]/g,”))”
用正则表达式限制只能输入数字和英文:onkeyup=”value=”/blog/value.replace(/[W]/g,””) “onbeforepaste=”clipboardData.setData(’text’,clipboardData.getData(’text’).replace(/[^d]/g,”
----------------------------------------------------------------------------------------------------------
(6)利用正则表达式去除字串中重复的字符的算法程序:
var s="abacabefgeeii"
var s1=s.replace(/(.).*1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //结果为:abcefgi
----------------------------------------------------------------------------------------------------------
(7)在字符串中精确查找链接地址
((http|https|ftp):(\/\/|\\\\)((\w)+[.]){1,}(net|com|cn|org|cc|tv|[0-9]{1,3})(((\/[\~]*|\\[\~]*)
(\w)+)|[.](\w)+)*(((([?](\w)+){1}[=]*))*((\w)+){1}([\&](\w)+[\=](\w)+)*)*)
我们知道,链接地址一般以http或者https或者ftp等形式出现。初步总结一下就是,链接地址必须符合如下条件:
条件1
以http://或者https://或者ftp://等开头(当然还有其它形式,这里只列出主要的)
条件2
http://后面必须跟一个单词字符,紧接着单词字符后面的是"."(这样的组合必须出现一次或多次)。紧跟着“.”后面的是域名后缀(如net或者com或者cn等,如果是以IP地址的形式出现就可以是数字)
条件3
出现完整的链接地址后,还可以出现下一级或者更多级的目录(还要注意个人主页的地址有可能出现"~"符号)
条件4
链接地址末尾可以带参数。如典型的页数?PageNo=2&action=display等
现在我们用下面的代码来逐个匹配上面的条件——
1、((http|https|ftp):(\/\/|\\\\) 满足条件1
表示http:// http:\\ https:// https:\\ ftp:// ftp:\\都匹配(在这里考虑了某些用户可能把"//"输成“\\”的易发性错误)
注意:"|"表示“或者”,"\"是转义字符。“\/\/”表示"//",“\\\\”表示"\\"
2、((\w)+[.]){1,}(net|com|cn|org|cc|tv|[0-9]{1,3}) 满足条件2
“((\w)+[.]){1,}”表示一个单词字符加一个点号可以出现1次或者多次(这里考虑了某些用户喜欢省略www而将http://www.w3c.com写成http://w3c.com)
“(net|com|cn|org|cc|tv|[0-9]{1,3})”表示必须要以net或者com或者cn或者org或者cc或者tv或者三位以下的数字结束
[0-9]{1,3}表示三位以下的数字,因为ip地址的任何段不能超过255
3、(((\/[\~]*|\\[\~]*)(\w)+)|[.](\w)+)* 满足条件3
“(\/[\~]*|\\[\~]*)”表示可以出现"/~"或者是"\~",(其中“[\~]*”表示 ~ 可以出现也可以不出现),因为不是每个链接地址都有下一级目录
“(\w)+)|[.](\w)+)”表示必须出现一个单词字符(即目录或者是一个带有扩展名的文件)
注意:最后还有一个“*”表示上面括号内的可以出现也可以不出现,否则就只能匹配有下一级目录的链接地址了。
4、(((([?](\w)+){1}[=]*))*((\w)+){1}([\&](\w)+[\=](\w)+)*)*)满足条件4
“((([?](\w)+){1}[=]*))*((\w)+){1}”表示形如"?PageNo=2"的字符串可以出现也可以不出现,如果出现则只能出现一次(因为不可能有两个“?”号出现)。
“([\&](\w)+[\=](\w)+)*)”表示形如“&action=display”的字符串可以出现也可以不出现(因为并不是每个网页都带有两个以上的参数。
整个“((([?](\w)+){1}[=]*))*((\w)+){1}([\&](\w)+[\=](\w)+)*)*”表示形如“? PageNo=2&action=display”的字符串可以出现也可以不出现(即链接地址可以有参数也可以没有参数)
把上面的组合起来,我们就可以匹配一个比较全面的链接地址了。比用简单的“(http:\/\/\S+)”来匹配一个链接地址要好,读者可以自行行测试比较。当然,这段代码还有很多不足之处,希望大家能够继续改进。
----------------------------------------------------------------------------------------------------------
(8)替代典型的标签:[/b]
我们的目的就是要把成对的替换成<b></b>下面来看我们实现它的模板
(\[b\])(.+)(\[\/b\])
这里用了"(.+)"来配匹到之间的整个字符串,在替代的时候我们要写成这样
str=checkexp(re,str,"<b>$2</b>")
(注意:checkexp是我自定义的函数,将在后面给出。这个函数将把按照我们提供的模板进行替代。)
也许你会问这里出现一个"$2"是什么东东,呵注意了这个$2可是很重要的,它代表了"(.+)"所配匹的整个字符串。
为什么是$2而不是$1、$3呢?因为$1代表(\[b\])所匹配的"[b]"字符串,$3代表(\[\/b\])所匹配的""字符串,显然这里我们需要的是$2而不是$1$3。
----------------------------------------------------------------------------------------------------------
(9)<div class="a">北京</div> <div class="b">上海</div>怎么得到上海
结果:"<div\\s+class=\"b\"\\s*>(.+?)</div>"
----------------------------------------------------------------------------------------------------------
(10)如何用正则表达式判断(第3和第3fsdf)这两种形式为非法,其余组合为合法,前提条件是能输入的只有数字,字母,中文。
var value = "第3fsdf";
var pattern = /^第3(fsdf)?$/;
if(value.match(pattern)){
alert(非法);
}
----------------------------------------------------------------------------------------------------------
(11)匹配一个英文姓名的js 正则表达式
例如: li/ming mi ng/li m i ng / l i
姓和名之间一定得用特殊符号"/"来隔开,姓和名同时可以有多个空格
除了特殊符号"/"以外,任何特殊等号都不可以出现。
/^([a-z\s]+)\/([a-z\s]+)$/i
----------------------------------------------------------------------------------------------------------
(12)<a href="11">11</a><a href="22">22</a>
用正则表达式如何找到第一个<a到第一个</a>之间的内容?
"<a href=\"11\">11</a><a href=\"22\">22</a>".replaceAll("(?i)<a(.*?)>[^<]+</a>","$1")
结果是href="11" href="22"
用“<a.*</a>”只能匹配到最后那个</a>,而没有匹配到第一个</a>的
<a.*</a>
改成
<a.*?</a>
默认情况下为贪婪模式,也就是最大匹配,<a.*</a>会匹配它能找到的最长的字符串,加上?就是懒惰模式,会找到最短的字符串
----------------------------------------------------------------------------------------------------------
(13)要实现下面的功能;
String s="1-4级份开始到福建卡的师傅2-8级份开始到5福建卡的师傅9-14级份开始到福建卡的师傅$";
提取1-4级,2-8级等等这样的字段,放在一个数组中
eg;string[] ss=.....;
ss[0]=1-4级; ss[1]=2-8级; ......
用Java语言写,最好用Java自带的正则表达式库;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
class StringTest{
public static void main(String[] args){
new StringTest().testRegex();
}
public void testRegex(){
String str="1-4级份开始到福建卡的师傅2-8级份开始到5福建卡的师傅9-14级份开始到福建卡的师傅$";
String reg = "(\\d+-\\d+级)";
String[] marches = this.findMarch(str, reg);
System.out.println("Find:"+marches.length);
}
private String[] findMarch(String str,String reg){
Pattern pattern = Pattern.compile(reg);
Matcher matcher = pattern.matcher(str);
List<String> list = new ArrayList<String>();
while(matcher.find()){
System.out.println(matcher.group(1));
list.add(matcher.group(1));
}
String[] marches = new String[list.size()];
for(int i=0; i<list.size(); i++){
marches[i] = list.get(i);
}
return marches;
}
}
----------------------------------------------------------------------------------------------------------
(14)某个非数字字符串后面只跟3个数字
js: /^[^0-9]{1,}[0-9]{3}$/
[^0-9]{1,} 匹配非数字,出现一次以上.
[0-9]{3} 匹配出现三次的数字
java:Pattern p = Pattern.compile("[^0-9]{1,}[0-9]{3}");
----------------------------------------------------------------------------------------------------------
(15)判断字符是否是除了 @ —— , ? “” | ~ % * !之外的其他符号?
import java.util.regex.Pattern;
import java.util.regex.Matcher;
public class testMatch2{
public static boolean checkNameReg(String str) {
String badword = "[^@——,?“”|~%*!]";
Pattern pattern = Pattern.compile(badword);
Matcher matcher = pattern.matcher(str);
return matcher.find();
}
public static void main(String[] args){
String str = "@——";
System.out.println("str match result:"+checkNameReg(str));
String str2 = "开始";
System.out.println("str match result:"+checkNameReg(str2));
}
}
----------------------------------------------------------------------------------------------------------
(16)匹配除078之外的三位数
\\d{3}(?<!078)
----------------------------------------------------------------------------------------------------------
(17)var s = "ab
cd
ef
gh";
现在想把s里面的回车换行转换成$符号。。。。
s.replace(/\n/mg, '$') 或者 s.replace(/\n/g, '$')
----------------------------------------------------------------------------------------------------------
(18)在JS中,求一正则表达式用以识别以下表达式是否合法:
A > B A < B A >= B A <= B A != B
其中 A B 为不是 <,>,= 的任何字符串,而且A B必存在 <,>,>=,<=,!= 两边可以用0到n个空格
如 fddd > fda3 fdafds != dddd fda <= fdsa 合法
fddd ! fda fdsafdsa >= fdee != 不合法
"其中 A B 为不是 <,>,= 的任何字符串"
如果是这样的话,就是[^<>=]+\s*(([<>!]{0,1}=)|[<>=]{1,1})\s*[^<>=]+
如果带!,就是 [^<>!=]+\s*(([<>!]{0,1}=)|[<>=]{1,1})\s*[^<>!=]+
A!=(空格) 被实别为 true 修改为 [^<>=\s]+\s*(([<>!]{0,1}=)|[<>=]{1,1})\s*[^<>=\s]+ 可以
----------------------------------------------------------------------------------------------------------
(19)判断一个字符串是不是以“yyyy-mm-dd”的格式输入的
String patternStr = "^((((19){1}|(20){1})(\\d){2})|(\\d){2})[-\\s]{1}[01]{1}(\\d){1}[-\\s]{1}[0-3]{1}(\\d){1}$";
----------------------------------------------------------------------------------------------------------
(20)String table = "<table>sdafaf<tr></tr>dasdf</table>sadfadfasdf</table>sadfasdfasdfadsf</table>";
假如现在有这么一个字符串。
想截取第一个<table></table>中的内容
Pattern pattern = Pattern.compile("<table>((?!</table>).)*</table>");
----------------------------------------------------------------------------------------------------------
(21)问题描述:
resultStr = "@inproceedings{1031197, author = {S. Alireza Aghili and Divyakant Agrawal and Amr El Abbadi}, title = {Protein structure alignment using geometrical features}, booktitle = {CIKM '04: Proceedings of the thirteenth ACM international conference on Information and knowledge management}, year = {2004}, isbn = {1-58113-874-1}, pages = {148--149}, location = {Washington, D.C., USA}, doi = {http://doi.acm.org/10.1145/1031171.1031197}, publisher = {ACM}, address = {New York, NY, USA}, },"
要将resultStr中{}内部的内容识别出来,并与 = 前的内容匹配。即得到
author的值为S. Alireza Aghili and Divyakant Agrawal and Amr El Abbadi,
title的值为Protein structure alignment using geometrical features,等等。
rs:
String resultStr ="字符串";
Pattern p = Pattern.compile("[\\s\\t]+([\\w\\s]+)=[\\s]+\\{([^}]+)\\}");
Map tmpMap = new HashMap();
Matcher m = p.matcher(resultStr);
while(m.find()){
String key=m.group(1);
String value=m.group(2);
System.out.println(key+"="+value);
tmpMap.put(key,value);
}
GlobalMode obj = new GlobalMode();
obj.setAuthor(tmpMap.get("author"));
obj.setTitle(tmpMap.get("title"));
....
----------------------------------------------------------------------------------------------------------
(22)"**jsunit/**/*.js" 这个类型的正则表达式用JAVA怎么去写.
".*jsunit\\/.*\\/.*\\.js"
----------------------------------------------------------------------------------------------------------
(23)一个奇怪的正则问题
System.out.println("111".matches("(\\d)((?!\\1)\\d)\\3"));
输出false
System.out.println("111".matches("((\\d)((?!\\1)\\d)\\3)"));
怎么会是true
因为前一个正则表达式里,匹配到(?!\1)的时候,第一个捕获分组((\d))已经匹配到内容了,内容是1,而这里的否定正向环视要求这个位置的右边不是1,所以不匹配。
后一个正则表达式里,匹配到(?!\1)的时候,第一个捕获分组尚未匹配完因而内容还是空的,这样这个否定正向环视就不影响后续匹配,最后整个正则表达式就匹配了。
----------------------------------------------------------------------------------------------------------
(24)用正则表达式去检查mail地址时,而mail地址比较怪,用了"-",而"-"恰好是正则里的特殊字符,用\\-去过滤,不成功,给个思路?
public class RegexTest extends TestCase {
public void test() {
String regex = "[a-zA-Z\\-]";
assertTrue(Pattern.compile(regex).matcher("a").matches());
assertTrue(Pattern.compile(regex).matcher("A").matches());
assertTrue(Pattern.compile(regex).matcher("-").matches());
assertFalse(Pattern.compile(regex).matcher("1").matches());
assertFalse(Pattern.compile(regex).matcher(".").matches());
assertFalse(Pattern.compile(regex).matcher(">").matches());
}
}
----------------------------------------------------------------------------------------------------------
(25)如何匹配 任意连续字符
比如 123aa4556 中的aa ,55
import java.util.regex.*;
public class Test {
public static void main(String[] args) {
Pattern p = Pattern.compile("(.)\\1+");
String str = "12333455aaabc677";
Matcher m = p.matcher(str);
while (m.find()) {
System.out.println(str.substring(m.start(), m.end()));
}
}
}
// 输出:
// 333
// 55
// aaa
// 77
----------------------------------------------------------------------------------------------------------
(26)用正则表达式匹配一个insert的SQL语句,能够自动地将变量赋给对应的字段,比如
SQL=“insert into table(item1,item2,item3) values(:item1,:item2,:item3)”
map.put(item1,"111")
map.put(item2,"222")
map.put(item3,"333")
想用正则表达式自动的将SQL语句中的:item1,:item2,:item3替换成map中对应的“111”,"222","333"
String SQL="insert into table(item1,item2,item3) values(:item1,:item2,:item3)";
Map map = new HashMap();
map.put("item1","111");
map.put("item2","222");
map.put("item3","333");
Pattern p=Pattern.compile("(?::)(\\w+)(?:\\b)");
Matcher m=p.matcher(SQL);
StringBuffer result=new StringBuffer();
while (m.find()) {
String key=m.group(1);
m.appendReplacement(result,(String)map.get(key));
}
m.appendTail(result);
String resultSql=result.toString();
System.out.println(resultSql);
----------------------------------------------------------------------------------------------------------
(27)求一个去括号()中间任意字符串的JAVA正则表达式
String s="(Jack)jack1@163.com,"+
"(杰克)jack2@qq.com,"+
"(jack son.()杰克)jack3@qq.com,"+
"(杰克.jack)jack4@qq.com,";
String result= s.replaceAll("\\((?<=\\()[^@]+(?=(\\)[^)]+@))\\)","");
System.out.println("Result:"+result);
----------------------------------------------------------------------------------------------------------
(28)只匹配 15位 或者 18 位
/^\d{15}$|^\d{18}$/
----------------------------------------------------------------------------------------------------------
(29)要写一个判断金额小于等于20,小数位数只能有1位,不是负数的正则表达式
js: /^(?:20(?:\.0)?|1?\d(?:\.\d)?)$/
java: "^(?:20(?:\\.0)?|1?\\d(?:\\.\\d)?)$"
----------------------------------------------------------------------------------------------------------
(30)正则表达式 用来匹配提取aa,bb的值
String src1 = "/ssiwh/vieen/;aa=87211_diweuj;bb=wqqeii_998;qq/;/";
String re1 = "(?<=([aa|bb]=))[^;]+(?=;)";
Pattern p = Pattern.compile(re1);
Matcher m = p.matcher(src1);
while(m.find()){
String tmp = m.group();
System.out.println("结果:"+tmp);
}
----------------------------------------------------------------------------------------------------------
(31)要求是:只能输入0-24之间的数字,最多只允许两位小数。
var re = /(^[0-9]([.][0-9]{1,2})?$)|(^1[0-9]([.][0-9]{1,2})?$)|(^2[0-3]([.][0-9]{1,2})?$)|(^24([.]0{1,2})?$)/;
或者
/^([1](?:[0-9]|)|[2](?:[0-3]|)|[0-9])(?:\.[0-9]{1,2}|)$|^24(?:\.0{1,2}|)$/
发表评论
-
jquery_easyui
2012-01-18 10:06 806dfgdfsgs -
俄罗斯方格——转 javaeye
2012-01-16 11:59 825sdfasdfas -
网站模板_down
2012-01-05 14:15 684xcfadfasdf -
命名规则有利于SEO
2011-12-13 14:00 803转转转 命名规则有利于SEO ... -
ff_chm
2011-10-21 12:47 624sadasdasd -
精通javascript 代码
2011-08-24 17:35 737download download -
escape encodeURI 和encodeURIComponent_转
2011-06-21 17:11 810http://blog.csdn.net/redbednil/ ... -
javascript 讲义_01_事件结束
2011-06-19 09:50 622iiui -
js 验证非常好_转
2011-06-12 08:47 869http://justshare.iteye.com/blog ... -
jquery_demo_ff_bug_xpi
2011-05-26 12:33 651kjkjkj -
netmeetine_
2011-05-17 17:30 683kljlojlkjlkj -
javascript_简洁验证表单
2011-03-31 19:48 681ljkljk -
fck_精简版
2011-03-20 17:13 1052,jkjm -
css_div_灯箱效果
2011-03-05 16:32 831;lk;lk;lk -
QQ空间_html
2011-02-16 12:40 1133dgdgdg -
javascript_优化
2011-02-14 12:49 821Javascript常用优化方法 ... -
ext_p入门___:)
2011-02-05 12:08 615http://www.iteye.com/topic/1799 ... -
dangdang网_html
2011-01-18 00:07 763大家很努力,结果很不错 :) -
jquery_入门实例
2011-01-07 18:36 563kjlkjkl -
ajax_入门实例_
2011-01-07 18:29 558fwerwer
相关推荐
Java正则表达式是Java编程语言中用于处理字符串的强大工具,它允许程序员通过模式匹配来查找、替换或分割文本。...阅读《JAVA正则表达式实例教程.pdf》将帮助你更全面地理解和掌握Java正则表达式。
Java使用正则表达式提取XML节点内容的方法示例主要介绍了Java使用正则表达式提取XML节点内容的方法,结合具体实例形式分析了java针对xml格式字符串的正则匹配相关操作技巧。 一、正则表达式简介 正则表达式是指一...
### 正则表达式实例秀:提升文字处理效率的关键技能 在日常的文字处理工作中,我们经常会遇到需要大量替换或搜索特定格式文本的情况。比如,将文章中的所有网址统一替换为预设格式,或是批量删除含有特定模式的空行...
### 正则表达式经典实例 #### 一、概述 正则表达式是计算机科学领域中一种用于描述字符串模式的强大工具。它广泛应用于文本搜索、数据验证、字符串替换等多种场景。《正则表达式经典实例》这本书深入浅出地介绍了...
总的来说,易语言的正则表达式文本替换功能提供了强大的文本处理能力,对于需要处理和分析文本的程序开发者来说,掌握这项技能能极大地提高工作效率。通过深入理解正则表达式和易语言的相关函数,开发者可以灵活地...
正则表达式,简称为正则,是一种强大的文本处理工具,用于匹配、查找、替换、分析等操作。在编程和数据分析领域,正则表达式扮演着至关重要的角色,尤其是在处理和解析字符串时。《精通正则表达式》与《正则表达式...
正则表达式是一种特殊的字符序列,能够帮助程序员或者用户高效地进行文本分析和处理。在Java中,正则表达式的使用主要依赖于`java.util.regex`包中的类,如`Pattern`和`Matcher`。 首先,我们来看`Pattern`类。这个...
### JAVA正则表达式实例教程知识点详述 #### 一、正则表达式的定义与特点 **1.1 正则表达式是什么?** - 正则表达式(Regular Expression)是一种模式匹配语言,用于文本搜索和替换。它提供了一种简洁而灵活的方式...
- **数据分析**:正则表达式可用于清洗和提取数据,例如从文本中提取电话号码、日期等。 - **网页抓取**:在网页源码中使用正则表达式查找特定信息,辅助网络爬虫工作。 - **文本替换**:使用`re.sub()`可以批量...
在易语言中,这通常涉及到初始化一个类实例,并传入相应的正则表达式字符串。例如,`创建正则表达式`函数可以用来创建一个正则表达式对象,用于后续的匹配和处理。 2. **取正则文本**:这个方法允许获取已创建的...
正则表达式是一种强大的文本处理工具,用于匹配、查找、替换和分析字符串。它通过一套特定的语法,允许用户定义复杂且灵活的模式来描述字符串的结构和内容。以下是一些关于正则表达式的基本概念和常用元字符的详细...
头文件还包含了`regex_t`结构体,它代表一个编译好的正则表达式实例,以及`regmatch_t`结构体,用于存储匹配的结果信息。 使用GUN C的正则表达式库时,开发者需要按照以下步骤进行: 1. **编译正则表达式**:调用`...
2. 创建Xeger实例:通过`new Xeger(regex)`构造函数,传入你的正则表达式。 3. 生成数据:调用`generate()`方法,返回一个符合正则表达式模式的字符串。 4. 验证结果:生成的字符串可以进一步用于测试或分析,确保...
- **案例库**:内置大量预设的正则表达式实例,用户可以直接应用或作为参考。 掌握正则表达式是提升编程技能的重要一步,利用"正则式工具(自动生成正则表达式)"这类软件,不仅可以提高工作效率,也能为开发者带来...
通过学习这个Java正则表达式实例教程,你将掌握如何高效地使用正则表达式进行字符串处理,提升你的Java编程能力。结合提供的PDF文档和下载说明,你可以逐步学习并实践每一个示例,巩固理论知识。同时,访问提供的...
根据给定文件的信息,我们可以深入探讨Java中的正则...通过以上内容,我们对Java中的正则表达式有了较为全面的理解,从理论到实践,从基本语法到高级用法,正则表达式在数据处理、文本分析等方面扮演着不可或缺的角色。