`

.net正则匹配a标签

 
阅读更多



2009-08-26 16:00:51|  分类: Asp.Net |字号 订阅
//c#通过正则匹配html中的a标签 的方法
public string matchA(string teststr)
    {
        StringBuilder sb = new StringBuilder();
        //关键就是这个里面的这则表达式
        Regex reg = new Regex(@"<\s*a\shref=*[^>]*>([^<]|<(?!/a))*<\s*/a\s*>");
         MatchCollection match = reg.Matches(teststr);
         foreach (Match var in match)
         {
             if (var != null)
             {
                 sb.Append(Server.HtmlEncode(var.Value));
                 sb.Append("<br />");
             }
         }
         return sb.ToString();
    }

//这个是测试方法获取网易首页的a标签所有信息
public void test()
{
        string temp=string.Empty;
        WebRequest webReq = WebRequest.Create(" http://www.163.com");
        WebResponse webRes = webReq.GetResponse();
        Stream resStream = webRes.GetResponseStream();
        StreamReader sr = new StreamReader(resStream, Encoding.Default);
        StringBuilder sb = new StringBuilder();
        while ((temp = sr.ReadLine()) != null)
        {
            sb.Append(temp);
        }
        webRes.Close();
        sr.Close();
       //打印出所有匹配信息
       Response.Write(matchA(sb.ToString()));
   
}


分享到:
评论

相关推荐

    asp.net利用正则在HTML中提取图片路径(asp.net正则表达式过滤出HTML代码中图片路径).txt

    对于提取 HTML 中的图片路径,我们需要设计一个能够匹配 `&lt;img&gt;` 标签并捕获 `src` 属性值的正则表达式。 #### 示例代码分析 下面的示例展示了两种不同的方法来从 HTML 字符串中提取图片路径: ##### 方法一:`...

    asp.net 正则表达式过滤所有html标签

    ### ASP.NET 中使用正则表达式过滤HTML标签的详细解析 在Web开发中,经常需要对用户输入的数据进行处理,特别是在展示用户提交的内容时,为了防止XSS攻击或确保页面的整洁度,去除HTML标签变得至关重要。本文将详细...

    .net正则表达式测试台

    《.NET正则表达式测试台:高效开发与调试利器》 正则表达式是编程领域中用于处理字符串的强大工具,广泛应用于数据验证、文本提取、搜索替换等多个场景。在.NET框架中,正则表达式提供了丰富的功能和高度的灵活性。...

    asp.net常用正则表达式

    正则表达式的语法包括选择器`|`、字符集`[]`、否定字符集`[^...]`、字符范围`[a-z]`、负值字符范围`[^a-z]`、单词边界`\b`和非单词边界`\B`等,这些都是正则表达式的基本构造块,用于创建复杂和灵活的匹配模式。...

    asp.net 正则全文档

    根据提供的信息,我们可以总结出以下关于ASP.NET中的正则表达式的知识点: ### 一、匹配中文字符 **正则表达式**: `[\u4e00-\u9fa5]` 该表达式用于匹配所有中文字符。其中`\u4e00`表示中文的第一个Unicode值,`\...

    asp.net正则表达式

    ### ASP.NET中的正则表达式应用详解 #### 一、正则表达式的概念与作用 正则表达式是一种强大的文本处理工具,在编程语言中广泛应用于字符串的搜索与替换操作。在ASP.NET这样的Web开发框架中,正则表达式能够帮助...

    ASP.NET 正则表达式

    ### ASP.NET中的正则表达式应用 在ASP.NET开发中,正则表达式的使用非常广泛,可以帮助开发者实现复杂的文本处理任务。本文将详细介绍几个在ASP.NET中常用的正则表达式及其应用场景。 #### 图片链接匹配 ```regex...

    C#.Net使用正则表达式抓取百度百家文章列表

    在百度百家的文章列表页,文章标题和链接可能有特定的HTML标签结构,可以通过分析网页源码确定这些结构,然后编写相应的正则表达式进行匹配。 6. **Regex类方法**: - `Match`:用于执行单次匹配,返回一个Match...

    VB_NET字符串和正则表达式参考手册

    《VB.NET字符串和正则表达式参考手册》是一本深入探讨VB.NET编程中字符串操作与正则表达式应用的专业指南。这本书旨在帮助开发者熟练掌握在.NET框架下,尤其是在VB.NET环境中处理字符串和运用正则表达式的技巧。 ...

    VB用正则表达式提取网页中的链接

    在Web页面中,链接通常以`&lt;a href="..."&gt;`的形式存在,通过正则表达式的匹配功能,可以精确识别并捕获这些链接地址,从而实现对网页内容的深度解析和数据提取。 ### 描述解读:“VB用正则表达式提取网页中的链接” ...

    JavaScript实现正则去除a标签并保留内容的方法【测试可用】

    &gt;/`:这部分正则匹配`&lt;a&gt;`标签的开始和结束标签,包括任何属性。`表示开始标签,`表示结束标签,`a`是标签名,`.*?`是非贪婪匹配任意字符(除了换行符),`&gt;`表示标签结束。`/?`允许`a`标签的`/`可选,即匹配`&lt;a&gt;`和...

    全程正则表达式匹配的网络采集程序源代码

    标题中的“全程正则表达式匹配的网络采集程序源代码”揭示了这是一个使用正则表达式进行网络数据抓取的应用程序。在IT领域,网络采集(也称为网络爬虫或网络蜘蛛)是一种自动化技术,用于从万维网中提取大量信息。这...

    asp.net 正则表达式的应用

    评语指出,这种模式可以有效地进行匹配,但同时也提醒了在嵌套标签的情况下可能会出现问题,例如在一个&lt;a&gt;标签内再嵌套另一个&lt;a&gt;标签。 在实际开发中,应用正则表达式时需要注意如下几点: - 正则表达式的语法较为...

    asp.net正则表达式删除指定的HTML标签的代码

    ***开发者在使用正则表达式处理HTML时需要注意正则表达式的一些特性,比如贪婪和非贪婪匹配,以及它们在.NET中的使用方法。在编写正则表达式时,开发者需要精确构造模式来避免错误匹配,同时要考虑到HTML的嵌套特性...

    常用的正则匹配

    ### 常用的正则匹配 在ASP.NET与C#开发中,正则表达式是一种非常实用且强大的工具,可以用于字符串搜索、替换、提取等操作。本文将详细介绍一些常用的正则表达式及其应用场景。 #### 1. 匹配全数字 - **正则表达式...

    Java使用正则表达式提取XML节点内容的方法示例

    Java使用正则表达式提取XML节点内容的方法示例主要介绍了Java使用正则表达式提取XML节点内容的方法,结合具体实例形式分析了java针对xml格式字符串的正则匹配相关操作技巧。 一、正则表达式简介 正则表达式是指一...

    正则表达式匹配各种特殊字符

    标签中的“正则表达式 匹配特殊字符 特殊字符正则表达式”直接提示了文档的内容涉及到正则表达式匹配特殊字符的具体知识点。 在正则表达式中,一些字符有着特殊的含义,比如: - `.` 表示任意单个字符(除换行符外...

    asp.net 去除HTML的标签的一个方法

    去除HTML标签的基本思路是利用正则表达式匹配所有的HTML标签,并用空字符串替换它们。这种方法简单有效,适用于大多数场景。 #### 三、具体实现 在ASP.NET中,可以通过以下方式实现去除HTML标签的功能: ```...

    asp.net常用的正则表达式

    ### ASP.NET 常用正则表达式解析 在 ASP.NET 开发中,正则表达式是一种非常实用的工具,可以用于验证用户输入、搜索文本模式等场景。下面将详细介绍给定文件中的正则表达式及其应用场景。 #### 数字相关的正则...

    .net删除html标签代码

    1. **使用正则表达式**:正则表达式是处理字符串的强大工具,可以用来匹配和替换HTML标签。一个简单的正则表达式可以是`&lt;[^&gt;]*&gt;`,它匹配所有开始和结束的HTML标签。以下是一个示例代码片段: ```csharp using ...

Global site tag (gtag.js) - Google Analytics