- 浏览: 7065629 次
- 性别:
- 来自: 上海
最新评论
-
autosuggestion:
实现一个智能提示功能需要JavaScript、ajax、数据库 ...
自动提示结果 -
岁月之眸:
...
Java读TXT文件 -
yujian58:
写的好。
在线客服技术方案 -
QQ1067184821:
你好,能不能发个完整的给我呢?1067184821@qq.co ...
Extjs3.2+Json lib动态树与GridPanel简单展现 -
chenhua0725:
能不能发一个完成的包给我呢,谢谢了,83667664@qq.c ...
Extjs3.2+Json lib动态树与GridPanel简单展现
Public Function CheckName(Str)
Checkname=True
Dim Rep,pass
Set Rep=New RegExp ' 建立正则表达式。
Rep.Global=True '设置全局可用性。
Rep.IgnoreCase=True'设置是否区分字符大小写
'设置模式。
Rep.Pattern="[u0009u0020u0022-u0028u002C-u002Eu003A-u003Fu005Bu005Cu0060u007Cu007Eu00FFuE5E5]"
Set pass=Rep.Execute(Str) '对指定的字符串执行正则表达式搜索。
If pass.count<>0 Then CheckName=False
'response.Write(Checkname)
'response.End()
Set Rep=Nothing
End Function
我们在制作网站的时候,尤其是各种电子商务网站,首先都会让用户填写一些表格来获取注册用户的各种信息,因为用户有可能输入各式各样的信息,而有些不符合要求的数据会给我们的后端ASP处理程序带来不必要的麻烦,甚至导致网站出现一些安全问题。因此我们在将这些信息保存到网站的数据库之前,要对这些用户所输入的信息进行数据的合法性校验,以便后面的程序可以安全顺利的执行。所以我们一般会在后端编写一个ASP的校验程序来分析用户输入的数据是否是合法的。
或许有人会问了,使用运行在客户端的JavaScript不是可以更好更快的来校验用户的数据吗?的确,这样在大多的情况下是可以的,为什么是大多情况下呢?因为你编写的JavaScript不一定可以完全正常的同时运行在IE以及Netscape上面,因为微软的Jscript并不全和JavaScript相同,再加上还有一些浏览器不一定和微软以及Netscape兼容的很好,所以很有可能在客户端的Javascript不会精确的校验用户输入的各种数据,而ASP程序是运行在服务器端的,只是和你的服务器的环境有关,无论客户端是什么浏览器,对于你的ASP程序来说都是没有分别的,所以选择使用后端的ASP程序来进行数据合法性的校验是一个好的选择。
在使用ASP来进行后端的数据合法性校验的时候,有些人为满足不同环境下面的数据校验,编写了很多的函数来实现,比如,我们想要校验用户输入的URL 地址是否合法,是可以自己编写一段代码来逐个逐个字符的分析用户输入的信息,要分析的信息量小了,那还比较好办,若是分析的条件千变万化,那可就惨了,不但要编写很长很繁琐的代码,而且运行的效率极其低下,有没有好的解决办法呢?有,那就是VBScritp5.0提供的“正则表达式”对象,只要你的服务器安装了IE5.x,就会带VBScript5.0。其实,“正则表达式”原本是Unix下面的专利,尤其是在Perl语言中使用的最为广泛,正是由于“正则表达式”的强大功能,才使得微软慢慢将正则表达式对象移植到了视窗系统上面,利用
“正则表达式”对象,我们就可以非常方便的对各种数据进行合法性的校验了。
首先,让我们来了解一下究竟什么是VBScript的“正则表达式”对象,我们先来看一段程序:
以下为引用的内容:
Function CheckExp(patrn, strng)
Dim regEx, Match ’ 建立变量。
Set regEx = New RegExp ’ 建立正则表达式。
regEx.Pattern = patrn ’ 设置模式。
regEx.IgnoreCase = true ’ 设置是否区分字符大小写。
regEx.Global = True ’ 设置全局可用性。
Matches = regEx.test(strng) ’ 执行搜索。
CheckExp = matches
End Function
在这段程序程序中,我们看到可以使用“New RegExp”来得到一个正则表达式对象,然后对这个对象进行正则匹配模板的赋值,也就是告诉正则表达式对象,你想要匹配一个什么样子的模板,然后使用方法Test来检测待处理的数据究竟和我们给出的模版是否相匹配,如果不匹配,那就表明待处理的数据不是合法的数据,从而也就实现了数据合法性的校验,我们可以看出,使用一个设计合理的匹配模板,我们可以轻松的校验一批格式类似的数据信息。
然,VBScript5.0中的“正则表达式”对象还有很多的其他的方法和属性,比如方法Replace(),利用他我们就可以很快的实现现在网上很时髦的UBB风格的论坛以及BBS,这不在我们讨论范围之内,以后再加以论述,我们现在就看看在数据校验方面正则表达式对象常用的方法和属性:
常用方法: Execute 方法
描述:对指定的字符串执行正则表达式搜索。
语法:object.Execute(string) Execute 方法的语法包括以下几个部分:
object:必需的。总是一个 RegExp 对象的名称。
string:必需的。要在其上执行正则表达式的文本字符串。
说明:正则表达式搜索的设计模式是通过 RegExp 对象的 Pattern 来设置的。Execute 方法返回一个
Matches 集合,其中包含了在 string 中找到的每一个匹配的 Match 对象。如果未找到匹配,Execute 将返回空的 Matches 集合。
Test方法
描述:对指定的字符串执行一个正则表达式搜索,并返回一个 Boolean 值指示是否找到匹配的模式。
语法:object.Test(string)
Test 方法的语法包括以下几个部分:
object:必需的。总是一个 RegExp 对象的名称。
string:必需的。要执行正则表达式搜索的文本字符串。
说明:正则表达式搜索的实际模式是通过RegExp对象的Pattern属性来设置的。RegExp.Global属性对Test方法没有影响。如果找到了匹配的模式,Test方法返回True;否则返回False。
常用属性: Global属性
描述:设置或返回一个 Boolean 值,该值指明在整个搜索字符串时模式是全部匹配还是只匹配第一个。
语法:object.Global [= True | False ]
object 参数总是 RegExp 对象。如果搜索应用于整个字符串,Global 属性的值为 True,否则其值为 False。默认的设置为 True。
IgnoreCase属性
描述:设置或返回一个Boolean值,指明模式搜索是否区分大小写。
语法:object.IgnoreCase [= True | False ]
object 参数总是一个 RegExp 对象。如果搜索是区分大小写的,则 IgnoreCase 属性为 False;否则为 True。缺省值为 True。
Pattern属性
描述:设置或返回被搜索的正则表达式模式。 这是一个最重要的属性,我们主要是设置这个属性来实现数据校验的。
语法:object.Pattern [= "searchstring"]
Pattern 属性的语法包含以下几个部分:
object:必需的。总是一个 RegExp 对象变量。
searchstring:可选的。被搜索的正则字符串表达式。它可能包含设置部分表格中的各种正则表达式字符。
设置:在书写正则表达式的模式时使用了特殊的字符和序列。下表描述了可以使用的字符和序列,并给出了实例。
字符描述: :将下一个字符标记为特殊字符或字面值。例如"n"与字符"n"匹配。"n"与换行符匹配。序列"\"与""匹配,"("与"("匹配。
^ :匹配输入的开始位置。
$ :匹配输入的结尾。
* :匹配前一个字符零次或几次。例如,"zo*"可以匹配"z"、"zoo"。
+ :匹配前一个字符一次或多次。例如,"zo+"可以匹配"zoo",但不匹配"z"。
? :匹配前一个字符零次或一次。例如,"a?ve?"可以匹配"never"中的"ve"。
.:匹配换行符以外的任何字符。
(pattern) 与模式匹配并记住匹配。匹配的子字符串可以从作为结果的 Matches 集合中使用 Item [0]...[n]取得。如果要匹配括号字符(和 ),可使用"(" 或 ")"。
x|y:匹配 x 或 y。例如 "z|food" 可匹配 "z" 或 "food"。"(z|f)ood" 匹配 "zoo" 或 "food"。
{n}:n 为非负的整数。匹配恰好n次。例如,"o{2}" 不能与 "Bob 中的 "o" 匹配,但是可以与"foooood"中的前两个o匹配。
{n,} :n 为非负的整数。匹配至少n次。例如,"o{2,}"不匹配"Bob"中的"o",但是匹配"foooood"中所有的o。"o{1,}"等价于"o+"。"o{0,}"等价于"o*"。
{n,m} :m 和 n 为非负的整数。匹配至少 n 次,至多 m 次。例如,"o{1,3}" 匹配 "fooooood"中前三个o。"o{0,1}"等价于"o?"。
[xyz] :一个字符集。与括号中字符的其中之一匹配。例如,"[abc]" 匹配"plain"中的"a"。
[^xyz] :一个否定的字符集。匹配不在此括号中的任何字符。例如,"[^abc]" 可以匹配"plain"中的"p".
[a-z] :表示某个范围内的字符。与指定区间内的任何字符匹配。例如,"[a-z]"匹配"a"与"z"之间的任何一个小写字母字符。
[^m-z] :否定的字符区间。与不在指定区间内的字符匹配。例如,"[m-z]"与不在"m"到"z"之间的任何字符匹配。
b :与单词的边界匹配,即单词与空格之间的位置。例如,"erb" 与"never"中的"er"匹配,但是不匹配"verb"中的"er"。
B :与非单词边界匹配。"ea*rB"与"never early"中的"ear"匹配。
d :与一个数字字符匹配。等价于[0-9]。
D :与非数字的字符匹配。等价于[^0-9]。
f :与分页符匹配。
n :与换行符字符匹配。
r :与回车字符匹配。
s :与任何白字符匹配,包括空格、制表符、分页符等。等价于"[ fnrtv]"。
S :与任何非空白的字符匹配。等价于"[^ fnrtv]"。
t :与制表符匹配。
v :与垂直制表符匹配。
w :与任何单词字符匹配,包括下划线。等价于"[A-Za-z0-9_]"。
W :与任何非单词字符匹配。等价于"[^A-Za-z0-9_]"。
num :匹配 num个,其中 num 为一个正整数。引用回到记住的匹配。例如,"(.)1"匹配两个连续的相同的字符。
n:匹配 n,其中n 是一个八进制换码值。八进制换码值必须是 1, 2 或 3 个数字长。
例如,"11" 和 "11" 都与一个制表符匹配。"011"等价于"01" 与 "1"。八进制换码值不得超过 256。否则,只有前两个字符被视为表达式的一部分。允许在正则表达式中使用ASCII码。
xn:匹配n,其中n是一个十六进制的换码值。十六进制换码值必须恰好为两个数字长。例如,"x41"匹配"A"。"x041"等价于"x04" 和 "1"。允许在正则表达式中使用 ASCII 码。
好了,常用的方法和属性就是这些了,上面的语法介绍的已经很详细了,我们就没有必要在罗嗦了,接下来我们来看看在具体的例子里面如何使用这些方法和属性来校验数据的合法性,我们还是举个例子吧,比如,我们想要对用户输入的电子邮件进行校验,那么,什么样的数据才算是一个合法的电子邮件呢?我可以这样输入:uestc95@263.net,当然我也会这样输入:xxx@yyy.com.cn,但是这样的输入就是非法的:xxx@@com.cn或者@xxx.com.cn,等等,所以我们得出一个合法的电子邮件地址至少应当满足以下几个条件:
1. 必须包含一个并且只有一个符号“@”
2. 必须包含至少一个至多三个符号“.”
3. 第一个字符不得是“@”或者“.”
4. 不允许出现“@.”或者.@
5. 结尾不得是字符“@”或者“.”
所以根据以上的原则和上面表中的语法,我们很容易的就可以得到需要的模板如下:"(w)+[@]{1}(w)+[.]{1,3}(w)+"
接下来我们仔细分析一下这个模板,首先“w”表示邮件的开始字符只能是包含下划线的单词字符,这样,满足了第三个条件;“[@]{1}”表示在电子邮件中应当匹配并且只能匹配一次字符“@”,满足了条件一;同样的“[.]{1,3}”表示在电子邮件中至少匹配1个至多匹配3个字符“.” ,满足了第二个条件;模板最后的“(w)+”表示结尾的字符只能是包含下划线在内的单词字符,满足了条件五;模板中间的“(w)+”满足了条件四。
然后,我们就直接调用刚才的那个函数CheckExp("(w)+[@]{1}(w)+[.]{1}(w)+",待校验的字符串)就好了,如果返回True就表示数据是合法的,否则就是不正确的,怎么样,简单吧。我们还可以写出来校验身份证号码的模板:"([0-9]){15}";校验URL的模板:"^http://{1}((w)+[.]){1,3}"等等;我们可以看到,这些模板为我们提供了很好的可重利用的模块,利用自己或者别人提供的各种模板,我们就可以方便快捷的进行数据的合法性校验了,相信你一定会写出非常通用的模板的。
这样,我们只要定制不同的模板,就可以实现对不同数据的合法性校验了。所以,正则表达式对象中最重要的属性就是:“Pattern”属性,只要真正掌握了这个属性,才可以自由的运用正则表达式对象来为我们的数据校验进行服务。
同样的用正则
以下为引用的内容:
string str="<img src=/upimg/allimg/081024/0851350.jpg><img src=/upimg/allimg/081024/0851351.jpg><img src=/upimg/allimg/081024/0851352.jpg>"
Regex reg=new Regex("<imgs+src=(['|"]?)(S+.w+)(1)");
MatchCollection mc = reg.Matches(input);
foreach (Match m in mc)
{
TB_Result.AppendText(String.Format("{0} is matchrn", m.Groups[0]));
for (int i = 0; i < m.Groups.Count; i++)
{
//图片地址应该是m.Groups[2].Value
Response.Write(String.Format("Group[{0}]={1}rn", i, m.Groups[i].Value));
}
}
//有多少个匹配项
Response.Write(mc.Count.ToString());
http://www.corange.cn/archives/2008/10/2120.html
发表评论
-
一个用ASP生成html的新方法
2008-12-07 19:59 853标签: 目前已经有很多生成html的新闻系统,但是都是用的模板 ... -
ASP读取文本并在特定的字符后面写入一段字符串
2008-12-08 10:09 1169http://www.corange.cn/archives/ ... -
是否支持XmlHttp组件的判断
2008-12-08 15:09 1158<% On Error Resume Next Resp ... -
ASP对XML文档中文本的增加、删除、修改、查看
2008-12-08 15:11 1034<% '------------------------ ... -
实践xml缓存技术构建高性能web站点
2008-12-08 20:48 874打造一个高性能稳定的web站点一直是站长和程序员的梦想,本文用 ... -
asp获取文件md5值
2008-12-08 20:49 1335网上asp加密字符的MD5很 ... -
利用ASP获得图象的实际尺寸的示例
2008-12-12 16:32 945<!--#includevirtual=" ... -
asp阻止灌水留言的方法(随机生成的4位认证码)(
2008-12-17 23:34 1090原理:在每次提交留言的时候,要输入随机生成的4位认证码. 以下 ... -
ASP实现SQL语句日期格式的加减运算
2008-12-18 10:09 1485需要按时间查询,可是查询出来的结果显示的不正确。举个例子来说, ... -
ASP循环导入导出数据处理 不使用缓存
2009-01-13 11:30 1015<% '//数据处理部分 dimContent ... -
asp之自动闭合HTML/ubb标签函数+简单注释
2009-01-13 11:34 1186程序代码 FunctioncloseUBB(strCont ... -
aspjpeg 半透明描边的实现函数
2009-01-13 22:36 1376'参数说明 'big 原图路径 ... -
Session对象的集合
2009-01-15 18:13 1094Session StaticObjects 集合 Static ... -
根据IP跳转到用户所在城市
2009-01-20 12:38 1544根据IP跳转到用户所在城市自动识别IP,并跳转到来访问者所在的 ... -
asp实现关键词不区分大小写搜索并高亮显示
2009-03-04 13:25 1362用ASP做搜索很容易,但要实现智能搜索这类就比较累一点,其实任 ... -
远程连接access数据库的几个方法
2009-06-03 21:16 975远程连接access数据库的几个方法: 1.建立VPN(Vir ... -
ASP-server.URLEncode反函数:urldecode
2009-06-08 08:50 1560如果有空格就用%20代替,如果有其它字符就用%ASCII代替, ... -
ASP动态包含文件的改进方法,ASP动态include
2009-06-10 12:30 1846ASP 本身不支持动态包含文件,现在的动态包含是通过 FSO ... -
ASP读取数据库中数据到数组的类
2009-06-10 12:31 1784DbPath = "test.mdb"’数 ... -
ASP中双引号单引号和&连接符使用技巧
2009-06-18 10:11 1425ASP中双引号单引号和&连接符使用技巧 一、ASP中处 ...
相关推荐
当需要从 HTML 内容中提取图片路径时,可以借助正则表达式来实现这一目标。 #### 正则表达式基础 正则表达式是一种强大的文本匹配工具,它允许你查找字符串中的模式,并可以用于替换、提取等操作。对于提取 HTML 中...
在本场景中,我们关注的是如何利用正则表达式从HTML文档中提取`<img>`标签内的`src`属性,即图片链接地址。这在网页抓取、数据挖掘或内容分析等任务中非常常见。 首先,我们需要了解HTML的基本结构。HTML...
html中获取图片 文章中提取图片 正则获取图片 富文本提取图片路径 字符中中获取图片路径 html中获取图片 文章中提取图片 正则获取图片 富文本提取图片路径 字符中中获取图片路径 html中获取图片 文章中提取图片 正则...
本文主要介绍如何使用正则表达式来从文本中提取图片。正则表达式是一种强大的文本处理工具,被广泛应用于搜索、替换以及数据提取等场景。对于网页开发或者数据分析来说,能够熟练地运用正则表达式提取图片是非常有用...
通过以上分析,我们可以清楚地理解如何使用正则表达式和C#来从HTML字符串中提取所有图片的路径。这种方法非常灵活且高效,适用于多种应用场景。此外,还可以根据具体需求进一步优化正则表达式或增加异常处理机制来...
代码中定义了一个名为`RegImg`的函数,它接受一个字符串参数`TheStr`,该参数包含了需要提取图片路径的HTML内容。以下是对该函数中知识点的详细解释: 1. 创建RegExp对象实例:`Set RegEx = New RegExp`,这一行...
在Java编程中,正则表达式是一种强大的文本处理工具,常用于字符串匹配、查找、替换等操作。本问题涉及到如何使用Java中的正则表达式从...在实际应用中,可能需要结合DOM解析库如Jsoup来更准确地解析和提取图片路径。
当需要在HTML文档中提取图片地址时,需要考虑到HTML中的img标签有多种写法,并且可能包含各种属性。因此,编写一个能够准确匹配图片地址的正则表达式是很有挑战性的。 首先,需要明确的是img标签通常用于指定图像的...
在VB(Visual Basic)编程环境中,我们可以实现一个功能强大的程序,用于从网页源码中下载并提取图片。这个过程涉及到两个主要步骤:首先,我们需要获取网页的HTML源代码;然后,利用正则表达式来匹配并提取出其中的...
* 网页解析:可以用于解析网页中的图片地址,并提取图片的相关信息。 * 数据挖掘:可以用于挖掘网页中的图片数据,并分析图片的相关信息。 * 爬虫:可以用于爬虫程序中,用于提取网页中的图片地址,并下载图片。 ...
三、批量提取图片 创建一个新的文件夹,用于存放从各个文件夹中提取的图片。在原始图片文件夹中搜索图片的共同特征(例如"_001"),全选这些图片,然后复制到新的文件夹中。这个步骤可以根据个人习惯使用其他方法...
例如,示例中通过`preg_replace`函数将原始的src路径替换为新的路径,同时还可以去除图片的width和height属性,使图片以默认尺寸显示。 上述方法为开发者提供了一种通过PHP脚本快速处理HTML内容的手段,尤其适用于...
在提取图片路径之前,我们首先需要了解HTML标签中图片信息的基本结构。通常,图片信息被嵌入在标签中,并通过src属性指定图片的地址。例如,在以下HTML代码片段中,包含有两个图片标签: ```html <img src="***"/> ...
在这个特定的实例中,我们关注的是从文章中提取网址和图片名的功能。这在内容抓取、数据分析或者搜索引擎优化(SEO)等领域非常有用。下面将详细解释如何使用C#来实现这个功能。 首先,我们需要解析文章的文本内容...
图片通常以`<img>`标签形式存在,其`src`属性指向图片源。 2. **处理图片**: - 图片的处理是转换中的关键部分。iText支持多种图像格式,如JPEG、PNG等。我们需要将HTML中的图片URL下载下来,并转换成iText能识别...
可以使用`HtmlAgilityPack`库解析HTML,查找img标签并提取src属性值,下载对应的图片,然后更新img标签的src。 3. **创建Word文档**:使用ClosedXML创建一个新的Word文档实例。 4. **写入内容**:将处理过的HTML字符...
在JavaScript中,正则表达式是一种强大的文本处理工具,用于匹配、查找、替换和提取字符串中的模式。在处理HTML字符串时,我们可能需要替换其中的图片地址(img标签的src属性)。本篇文章将深入探讨如何使用...
4. **提取图片URL**: 从匹配到的`<img>`标签中,我们需要获取`src`属性的值。这可以通过再次使用正则表达式或简单的字符串处理函数完成。 以下是一个简单的示例函数,演示如何实现这个功能: ```vbscript ...
1. **解析路径信息**:从`$_FILES`中提取文件路径,并使用字符串操作函数(如`explode()`和`dirname()`)来拆分路径并构建目录结构。 2. **存储逻辑**:可以使用关联数组或自定义类来表示目录树结构。每个节点包含...
这段代码通过匹配`<img>`标签中的`src`属性,并且属性值被引号包围的情况来提取图片地址。 - **第二种模式**: ```vb regEx.Pattern = "*?\ssrc=([^\"']\S*).*?>" Set oMatches = regEx.Execute(sReallyDo) ...