`
hereson
  • 浏览: 1454469 次
  • 性别: Icon_minigender_1
  • 来自: 苏州
社区版块
存档分类
最新评论

VB用正则表达式提取网页中的链接

阅读更多
VBScript code
<!----> Function getUrl(MatchStr As String) As String Dim myReg As RegExp Dim Matches As MatchCollection Dim myMatch As Match Dim strtmp As String Dim strimg As String Set myReg = New RegExp With myReg .IgnoreCase = True .Global = True .Pattern = "http://.+?\s" '取出里面的地址 Set Matches = .Execute(MatchStr) End With For Each myMatch In Matches If Right(myMatch.Value, 2) = """ " Then strtmp = strtmp & Left(myMatch.Value, Len(myMatch.Value) - 2) & vbCrLf Else strtmp = strtmp & Left(myMatch.Value, Len(myMatch.Value) - 1) & vbCrLf End If Next getUrl = strtmp End Function
VBScript code
<!----> Sub GetURL(ByVal s As String) Dim re As RegExp Dim mh As Match Dim mhs As MatchCollection Set re = New RegExp re.Global = True re.Pattern = "href= ""(http(s)?://[\s\S]+?)""" If re.Test(s) = False Then Exit Sub Set mhs = re.Execute(s) For Each mh In mhs Debug.Print mh.SubMatches(0) Next End Sub


用正则的方法就是这样,正则的Pattern写法我也初学,如何写更加精确,可以上网搜索。
上面的代码根据你的示例可以测试通过
分享到:
评论

相关推荐

    正则表达式经典实例

    - **文本处理**:例如,提取网页中的URL链接、识别特定词汇或短语出现的位置等。 - **复杂结构匹配**:例如,在XML或JSON等结构化数据中搜索和提取特定元素。 - **性能优化**:例如,通过调整正则表达式的结构...

    正则表达式,提取网页中的链接地址

     width u201d45%” style=”word-break:break-all”&gt; 江门市蓬江区凤彩工艺厂&lt;/a&gt; 代码如上.我请问如何用正则表达式,把”http://j

    下载网页源码并用正则表达式提取图片vb

    2. 正则表达式提取图片链接: 在VB中,我们可以通过引入`Microsoft VBScript Regular Expressions 5.5`库来使用正则表达式。以下代码展示了如何查找并提取HTML中的`&lt;img&gt;`标签的`src`属性,这些属性通常包含了图片...

    C#.Net使用正则表达式抓取百度百家文章列表

    网页内容通常为HTML格式,正则表达式可以用来从HTML中提取所需信息,如文章标题、链接等。在百度百家的文章列表页,文章标题和链接可能有特定的HTML标签结构,可以通过分析网页源码确定这些结构,然后编写相应的...

    常见的正则表达式VBA、VB适用

    正则表达式是一种强大的文本处理工具,在VBA(Visual Basic for Applications)和VB(Visual Basic)等编程环境中有着广泛的应用。它们可以帮助开发者进行复杂的字符串筛选、判断、查找、替换及提取操作,特别是在...

    超好的资料,正则表达式.doc

    - **文本替换**:在文档中使用正则表达式来识别并替换特定的文字,这对于批量编辑工作特别有用。 - **子字符串提取**:从一段文本中提取符合特定模式的子字符串,比如从HTML文档中提取所有的链接地址。 #### 二、...

    正则表达式集锦

    - 网页抓取过程中提取链接地址。 #### 五、电子邮件地址格式正则表达式 **表达式**: `w+@((w+[.]?)+)` - **解释**: - `w+`:用户名部分。 - `@`:分隔符。 - `((w+[.]?)+)`:域名部分。 **示例代码**: ```...

    VBScript、JavaScript、JS、VC、JAVA、VB超链接正则表达式.rar

    这里我们关注的是VBScript、JavaScript、JS、VC、JAVA、VB这六种编程语言中如何使用正则表达式来处理超链接。超链接通常以HTML的`&lt;a&gt;`标签形式存在,如`&lt;a href="http://example.com"&gt;Example&lt;/a&gt;`。下面将详细介绍...

    ASPNETStripHtmlCode

    - 在C#中,可以使用`System.Text.RegularExpressions.Regex`类来操作正则表达式。 - 正则表达式的语法包括字符集、量词、分组、断言等,用于构建复杂匹配规则。 2. **提取网页标题(title)** - 网页标题通常...

    VB.NET网页源码爬取.zip

    这个VB.NET爬虫示例对于初学者来说是一个很好的学习资源,可以帮助他们理解如何在.NET环境中编写爬虫,以及如何使用正则表达式进行数据提取。同时,对于有经验的开发者,这个示例也可以作为一个快速实现网页信息抓取...

    用正则表达式写的HTML分离函数

    在本例中,作者使用了VBScript中的正则表达式对象来实现HTML标签的去除。具体步骤如下: - **创建正则表达式对象**:`Set objRegExp = New RegExp` - **设置正则表达式属性**: - `IgnoreCase`: 设置为True,表示...

    VB 网页标签提取与过滤

    7. **正则表达式**:除了DOM操作,VB还可以使用正则表达式(RegEx)进行文本匹配和提取。这对于处理复杂或不规则的链接格式非常有用。 8. **异步处理**:考虑到网页加载和解析可能耗时,使用异步编程技术(如`Async...

    VB6网页图片提取演示

    1. **HTML解析**:VB6本身并不支持直接解析HTML,但可以通过第三方库如MSXML或使用WinINET库配合正则表达式来解析HTML源代码,找到图片链接。首先,你需要通过WinINET库发送HTTP请求获取网页源代码,然后解析这个...

    图片下载器 vb 源代码

    在VB中开发图片下载器,可以利用HTTP协议来获取网络资源,同时结合正则表达式或者HTML解析技术来提取图片链接。 首先,我们需要理解HTTP协议,它是互联网上应用最为广泛的一种网络协议,用于从万维网服务器传输超...

    VB简易的网络搜索功能实现

    这里我们简单地使用正则表达式抓取搜索结果的链接: ```vbnet Dim reader As StreamReader = New StreamReader(responseStream, System.Text.Encoding.UTF8) Dim htmlContent As String = reader.ReadToEnd() ' ...

    获取网页信息简单实例

    项目可能包括一个Web页面,用户输入URL,后端代码则使用HTTP请求获取网页内容,然后用正则表达式解析HTML,提取所需信息并显示给用户。 总结来说,ASP.NET提供了强大的工具来获取和处理网页信息。通过`...

    VB编写网页分析工具源代码

    在VB中编写网页分析工具可以帮助我们提取、解析和理解网页中的各种信息,如HTML元素、链接、文本内容等。** 网页分析工具的核心功能通常包括以下几个方面: 1. **网页抓取**:使用VB的HTTP请求库,如Winsock控件或...

    VB网页源代码查看器并分析出URL链接_源码

    VB网页源代码查看器是一款基于Visual Basic(VB)开发的工具,它允许用户查看和分析网页的HTML源代码,同时能够提取出其中的URL链接。这样的工具在网页开发者、搜索引擎优化(SEO)专家以及网络研究人员的工作中具有...

    VB对URL代码href分析,并调用FLVCD获取FLV地址

    本篇文章将深入探讨如何使用VB来解析URL代码中的`href`属性,并利用第三方工具FLVCD来获取FLV视频地址。这涉及到网络编程、网页元素解析以及与外部服务交互等多方面的知识。 首先,`href`是HTML中的一个属性,主要...

Global site tag (gtag.js) - Google Analytics