`
lolocomee
  • 浏览: 16463 次
  • 性别: Icon_minigender_1
  • 来自: 广州
最近访客 更多访客>>
社区版块
存档分类
最新评论

C# 采集2-采集,一般过滤

阅读更多

采集网页,我是从网上搜的,确实很多人在这方面已经做了很多,感谢他们的共享资源,让我们工作变得更加快。

 

采集网页源码:这个暂时还没意外就不改了,

 

         /// <summary> 
        /// 取得网页源码 
        /// 对于带BOM的网页很有效,不管是什么编码都能正确识别 
        /// </summary> 
        /// <param name="url">网页地址, </param>  
        /// <returns>返回网页源文件</returns> 
        public static string GetHtmlSource(string url)
        {
            WebClient myWebClient = new WebClient();
            byte[] myDataBuffer = myWebClient.DownloadData(url);
            return Encoding.Default.GetString(myDataBuffer);
        }
 
 /// <summary>
        /// 简单过滤,定位到信息区域有用
        /// </summary>
        /// <param name="code">网页源码</param>
        /// <param name="wordsBegin">开始</param>
        /// <param name="wordsEnd">结束</param>
        /// <returns>主题内容</returns>
        public static string SniffwebCode(string code, string wordsBegin, string wordsEnd)
        {
            string NewsTitle = "";
            Regex regex1 = new Regex("" + wordsBegin + @"(?<title>[\s\S]+?)" + wordsEnd + "", RegexOptions.Compiled | RegexOptions.IgnoreCase);
            for (Match match1 = regex1.Match(code); match1.Success; match1 = match1.NextMatch())
            {
                NewsTitle = match1.Groups["title"].ToString();
            }
            return NewsTitle;
        }
 
分享到:
评论

相关推荐

    c#下使用Directshow进行图像采集

    在C#编程环境中,利用DirectShow进行图像采集是一项常见的任务,尤其在开发视频处理和多媒体应用时。DirectShow是微软提供的一种强大的API,用于构建高质量的媒体处理应用程序,包括视频采集、播放、编辑等。本篇...

    初学者C#视频采集例子

    本资源针对初学者提供了几个C#实现的视频采集示例,这将帮助新手理解如何利用C#进行多媒体处理,特别是视频捕获。下面我们将深入探讨这些知识点。 首先,我们来看"DirectShow"这个子目录。DirectShow是微软开发的一...

    C#采集器

    【C#采集器】是一种基于C#编程语言开发的数据采集工具,主要功能是抓取互联网上的各种网页内容,实现信息的自动化收集与处理。在给定的文件列表中,我们可以看到一些关键的文件,这些文件构成了一个简单的C# Web应用...

    C# 1394接口或者USB相机的采集程序

    标题中的"C# 1394接口或者USB相机...综上所述,这个C#采集程序涉及到了从硬件接口到软件开发的多个层次,涵盖了硬件通信、图像处理、异常处理等多个方面的知识,对于理解和开发类似的图像采集应用具有重要的参考价值。

    文章自动采集系统,C#程序,CSHARP软件

    这意味着用户可以根据自己的需求定义采集规则,例如设定特定的URL模式、关键词过滤条件,甚至自定义爬虫的行为策略,如深度优先还是广度优先。在C#中,我们可以使用配置文件(如XML或JSON)存储这些设置,用户可以...

    C# WinForm DirectShow视频采集及图片抓取实例DxSnap(绝对源码)

    在C# WinForm环境中,我们可以利用DirectShow库来实现视频采集和图片抓取功能。这个实例项目"DxSnap"提供了一个完整的解决方案,帮助开发者了解如何在Windows桌面应用程序中集成视频捕获和图像保存的能力。 首先,...

    C#编写的温度采集上位机程序源码

    《C#实现温度采集上位机程序源码详解》 在现代工业自动化和物联网领域,温度监测是一项至关重要的任务。C#作为一种强大的编程语言,因其易读性、丰富的类库和面向对象特性,常被用于开发上位机软件,实现与硬件设备...

    c#vs2010环境下的USB采集程序Cypress-Suite-USB-3.4.7.rar

    标题中的"C# VS2010环境下的USB采集程序Cypress-Suite-USB-3.4.7"指的是使用C#编程语言,在Microsoft Visual Studio 2010开发环境中,结合Cypress公司提供的Suite USB 3.4.7工具包,进行USB数据采集程序的开发。...

    文章采集系统源码(c#)

    【文章采集系统源码(C#)】是一个基于.NET框架,使用C#语言编写的软件应用,主要用于自动化地从互联网上抓取、处理并存储文章数据。这个系统的核心功能是实现网页内容的智能爬取,将获取到的信息整理后存入SQL ...

    C#实现视频采集卡读写程序源码.rar

    2. **创建过滤器图**:Filter Graph Manager负责连接不同过滤器(如捕获过滤器、解码过滤器、渲染过滤器等),形成一个处理视频流的管道。在C#中,通过IGraphBuilder接口来操作过滤器图。 3. **添加视频采集卡过滤...

    C# form1 ,form2 互相传值

    在C#编程中,Form1和Form2之间的数据传递是一个常见的需求,特别是在开发Windows桌面应用程序时。本主题将深入探讨如何在两个独立的窗体之间有效地传递数据,以实现Form1的TextBox控件值传递到Form2,以及Form2的...

    C#语音通信开源框架,语音处理,杂音过滤。

    本主题聚焦于一个特定的C#语音通信开源框架,它具有强大的语音处理能力,包括杂音过滤和多种编码支持,是构建高效、高质量语音通信系统的关键工具。 标题中的"C#语音通信开源框架"是指该框架是基于C#语言开发的,...

    数据采集系统WEB源码C#版

    2. **GatherAdd11.aspx**:这可能是数据采集任务添加页面,允许管理员输入目标网址、设置爬取规则和其他参数,以便系统知道要从哪些网站获取数据。 3. **OutDataSetting.aspx**:这个名字暗示了这是一个设置数据...

    摄像头采集(WPF+AviCap+C#)

    在本文中,我们将深入探讨如何使用WPF(Windows Presentation Foundation)和AviCap库结合C#来实现摄像头采集功能。WPF是微软.NET框架的一部分,它提供了丰富的用户界面设计工具和功能,而AviCap是Windows API中的一...

    c#+sql2005 信息采集程序源码

    【标题】"C#+SQL2005 信息采集程序源码"是一个基于C#编程语言和SQL Server 2005数据库开发的信息采集系统,主要用于门户网站的数据抓取和管理。该系统的架构采用传统的客户端/服务器(Client/Server,C/S)模式,这...

    C# directShow 视频加水印

    2. **添加Source Filter**: 首先,我们需要一个源过滤器来读取原始视频文件。使用`CoCreateInstance`方法创建`MediaControl`,然后使用`GraphBuilder.RenderFile`方法加载视频文件。 3. **添加Video Renderer ...

    C#+WPF+CEF网站内容采集工具/JS注入控制/HTML内容解析/图片超链接地址过滤/内容导出

    使用C#语言、WPF程序框架、CefSharp开源框架,实现Chrome浏览器,通过浏览器实现网站内容采集。引入HtmlAgilityPack技术,通过XPath路径轻松实现采集。对应网页动态部分或涉及Iframe框架嵌入,涉及Ueditor等,无法...

    C# 以太网抓包

    2. **sharppcap库**:sharppcap是C#对WinPcap/Npcap的封装,提供了易于使用的API,使得开发者可以用高级语言编写抓包程序。它包括类如`PacketCommunicator`,`LiveDeviceList`,`FilterExpression`等,用于捕获、...

    利用VC_开发图像采集卡与图像预处理库.pdf

    ### 利用VC_开发图像采集卡与图像预处理库 #### 一、引言 随着信息技术的发展,图像处理技术已经成为了科学研究和技术应用中的一个重要领域。图像处理的应用范围广泛,从空间技术到显微图像分析,从军事侦察到工业...

    一个VC++编写视频采集ATL控件及C#测试

    2. 视频采集:视频采集是指将视频信号从摄像头、录像机等设备捕获到计算机的过程。在Windows环境下,通常使用DirectShow框架来实现这一功能,因为它提供了丰富的API接口和滤镜图模型,能方便地处理视频输入、输出、...

Global site tag (gtag.js) - Google Analytics