`
womendu
  • 浏览: 1513613 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

C#中用正则获取网页链接

阅读更多
usingSystem;
usingSystem.Collections.Generic;
usingSystem.ComponentModel;
usingSystem.Data;
usingSystem.Drawing;
usingSystem.Text;
usingSystem.Windows.Forms;
usingSystem.Text.RegularExpressions;

namespacecs1
...{
publicpartialclassForm1:Form
...{
publicForm1()
...{
InitializeComponent();
this.textBox1.Text="<tr><td><aclass='m'href='http://www.csdn.net'>CSDN</a></td><td><aclass='m'href='http://blog.csdn.net/precipitant'>塞北的雪</a></td><td><aclass='m'href='http://blog.csdn.net/net_lover'>孟子E章</a></td></tr>";
}


privatevoidbutton1_Click(objectsender,EventArgse)
...{
stringinputString=this.textBox1.Text.Trim();
StringBuildersb
=newStringBuilder();
Regexreg
=null;
Matchmch
=null;

reg
=newRegex(@"<a[^<>]*?hrefs*=s*['""s]([^""']*)['""][^<>]*?>(.*?)</a>",RegexOptions.IgnoreCase|RegexOptions.Compiled);
for(mch=reg.Match(inputString);mch.Success;mch=mch.NextMatch())
...{
sb.AppendLine(
"网站:"+mch.Groups[2]);
sb.AppendLine(
"地址:"+mch.Groups[1]);

}

MessageBox.Show(sb.ToString());
}

}

}

分享到:
评论

相关推荐

    C#中 用正则表达式

    根据给定的信息,本文将详细解析C#中如何使用正则表达式,并通过示例代码进一步阐述其应用方法。 ### C#中使用正则表达式的背景与意义 在软件开发过程中,经常需要处理字符串,例如验证用户输入是否符合特定格式...

    c# 使用正则表达式去除字符串中用双引号括起来的千分位号。

    通过使用正则表达式,方便的提取出字符串中用双引号括起来的数字字段,并去掉其千分位号,也可用来去除一对双引号。可以借助贪婪模式,进行最小匹配。 string teststr="2323,232323,fff,\"344,34,734\",34365,65656,...

    C# 正则表达式测试

    - `Replace`:在输入字符串中用另一个字符串替换所有与正则表达式匹配的子串。 - `Split`:将输入字符串分割成子字符串数组,分割依据是正则表达式定义的匹配项。 8. **RegExpDemo**:这个文件很可能是示例代码...

    C#爬取古诗文网古诗.rar

    在解析出诗词信息后,为了获取多页数据,我们需要识别并处理网页中的分页链接。这通常涉及到分析HTML中的链接元素(`&lt;a&gt;`标签),尤其是`href`属性,从中找出指向下一页的URL。我们可以使用正则表达式截取URL路径,...

    C#网页自动登录源码

    7. **正则表达式**:可能用于从网页源代码中提取登录所需的信息,如登录URL、验证码图片链接等。 8. **线程安全**:如果代码设计为多线程运行,需要考虑线程同步和异步操作,以防止并发问题。 9. **异常处理**:...

    正则表达式快速掌握教程.chm

    ^ $ [ ] \ { } ( ) | 需要在正则表达式中用反斜杠\进行转义,以使用其原始含义。 - 转义序列:例如\n代表换行,\t代表制表符。 3. 元字符与边界匹配: - ^匹配输入字符串的开始位置,$匹配输入字符串的结束位置...

    C#开发的蜘蛛爬虫程序

    HttpClient类是C#中用于发送HTTP请求的核心组件,用于爬虫获取网页内容。它可以发送GET、POST等各种HTTP方法的请求,并接收服务器的响应。 **3. HtmlAgilityPack** 处理HTML文档时,HtmlAgilityPack是一个非常有用...

    C#爬虫 测试用,可能不完全

    1. **HttpClient类**:这是C#中用于发送HTTP请求的核心类,可以用来获取网页内容。通过构造不同的HTTP方法(GET、POST等)和参数,我们可以模拟浏览器行为,获取所需数据。 2. **HtmlAgilityPack**:这是一个强大的...

    用户输入一个字符串后,判断该字符串中包含几个汉字

    总结一下,C#中判断字符串中汉字数量的方法主要有两种:一是通过Unicode类别,二是通过正则表达式匹配。具体选择哪种方法取决于实际需求和性能考虑。在处理大量数据时,正则表达式可能会更快,但在某些特定情况下,...

    C#视频小偷程序第一次用C#写小偷

    6. **WebClient或HttpClient类**:C#中用于下载文件的类,可以用来下载视频。 7. **多线程编程**:为了提高效率,可能需要并行下载多个视频,这时需要理解线程和异步编程。 8. **网络爬虫原理**:虽然"小偷"程序不...

    C# OCR识别数字.rar

    这些操作可能在C#代码中用到OpenCV或其他图像处理库实现。 6. **识别引擎**:此项目可能使用了第三方的OCR库,如Tesseract OCR,它支持多种语言和字符集,包括数字和特殊字符。开发者可能需要训练OCR引擎以识别特定...

    C# WinForm RTF TO HTML

    这个项目可能包含了一个名为`MarkupConverter.dll`的动态链接库,它是进行转换的核心组件。这个库可能解析RTF的语法,提取文本和格式信息,并将其转化为HTML代码。 - 转换过程中,关键点在于正确处理RTF中的图片。...

    C#群列表解析mahua字符串

    2. **字符串操作**:C#提供了多种字符串处理方法,如`Split()`用于根据分隔符分割字符串,`Substring()`提取子字符串,`Trim()`去除两端空格,`ToLower()`和`ToUpper()`转换大小写等,这些都会在解析过程中用到。...

    C#编程经验技巧宝典

    102 &lt;br&gt;0162 如何实现C#中用键完成TAB的功能 102 &lt;br&gt;0163 如何限制文本框密码输入长度 102 &lt;br&gt;0164 数据输入为空提示 103 &lt;br&gt;0165 如何设置文本框光标到末尾 103 &lt;br&gt;0166 输入法调整...

    Show Ip 外网ip

    1. **HttpClient类**:C#中用于发送HTTP请求的标准库,可以用来获取特定URL(如`http://checkip.dyndns.org`或`https://api.ipify.org`)的响应,这些网站会返回访问者的外网IP地址。 2. **网络请求**:使用`...

    C# 字符串提取分割(源代码)

    `Split()`方法是C#中用于分割字符串的常用工具。它可以根据一个或多个分隔符将字符串拆分为多个子字符串。例如,如果我们有一行由逗号分隔的值,我们可以使用`Split(',')`来创建一个包含每个值的数组: ```csharp ...

    Wrox.Professional.C#.2012.and.NET.4.5.pdf

    语言集成查询(LINQ)(第11章)是C#中用于数据查询的强大功能,允许在C#代码中以声明式的方式进行数据操作,提高了代码的可读性和效率。 ### 动态语言扩展 动态语言扩展(第12章)讲解了C#中的动态类型和反射机制...

    C#统计字符串里中文汉字个数的方法

    C#统计字符串中汉字数量的方法是一种在编程语言C#中用来分析和处理文本数据的技术。这种方法对于需要进行中文字符分析的软件开发人员来说非常有用,比如在自然语言处理、文本分析或者简单的文本数据统计中。下面详细...

    C#学生信息管理系统

    这通常涉及到LINQ(Language Integrated Query)技术,它是C#中用于数据查询的内置功能。 最后,考虑到多用户的并发访问,系统可能需要实现数据同步和事务处理。这可以通过锁定机制或乐观并发控制来避免数据冲突,...

Global site tag (gtag.js) - Google Analytics