`
zsuxiong
  • 浏览: 20717 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

推荐十个C#开源网络爬虫

阅读更多

1:.Net开源的跨平台爬虫框架 DotnetSpider(Star:449)

下载地址:http://www.17ky.net/soft/479.html

DotnetSpider是开源的.NET跨平台数据采集爬虫框架。

2:俄国牛人写的开源爬虫xNet(Star:121)

下载地址:http://www.17ky.net/soft/756.html

这个一个俄国牛人写的开源工具,为啥说他强悍了,因为他将所有Http协议的底层都实现了一遍,这有啥好处?只要你是写爬虫的,都会遇到一个让人抓狂的问题,就是明明知道自己Http请求头跟浏览器一模一样了,为啥还会获取不到自己想要的数据

3:开源的.net爬虫Abot(Star:1072)

下载地址:http://www.17ky.net/soft/66.html

Abot是一个开源的.net爬虫,速度快,易于使用和扩展

4:C#爬虫引擎内核版SmartSpider(Star:18)

下载地址:http://www.17ky.net/soft/549.html

SmartSpider爬虫引擎内核版,全新的设计理念,真正的极简版本

5:.Net开源的超级爬虫Hawk(Star:1068)

下载地址:http://www.17ky.net/soft/798.html

HAWK是一种数据采集和清洗工具,依据GPL协议开源,能够灵活,有效地采集来自网页,数据库,文件, 并通过可视化地拖拽, 快速地进行生成,过滤,转换等操作。其功能最适合的领域,是爬虫和数据清洗

6:基于C#.NET的简单且高效的网站爬虫(Star:64)

下载地址:http://www.17ky.net/soft/70470.html

Simple-Web-Crawler - 基于C#.NET的简单网页爬虫,支持异步并发、切换代理、操作Cookie、Gzip加速。

7:网络爬虫程序NWebCrawler

下载地址:http://www.17ky.net/soft/9291.html

NWebCrawler是一款开源的C#网络爬虫程序

8:爬虫小新Sinawler

下载地址:http://www.17ky.net/soft/34589.html

国内第一个针对微博数据的爬虫程序!原名“新浪微博爬虫”。 登录后,可以指定用户为起点,以该用户的关注人、粉丝为线索,延人脉关系搜集用户基本信息、微博数据、评论数据。 该应用获取的数据可作为科研、与新浪微博相关的研发等的数据支持,但请勿用于商业用途。该应用基于.NET2.0框架,需SQL SER...

9:多线程web爬虫程序spidernet

下载地址:http://www.17ky.net/soft/34598.html

spidernet是一个以递归树为模型的多线程web爬虫程序, 支持text/html资源的获取. 可以设定爬行深度, 最大下载字节数限制, 支持gzip解码, 支持以gbk(gb2312)和utf8编码的资源; 存储于sqlite数据文件. 源码中TODO:标记描述了未完成功能, 希望提交你...

10:Web爬虫工具NCrawler

下载地址:http://www.17ky.net/soft/34609.html

NCrawler 是一个Web Crawler 工具,它可以让开发人员很轻松的发展出具有Web Crawler 能力的应用程式,并且具有可以延展的能力,让开发人员可以扩充它的功能,以支援其他类型的资源(例如PDF /Word/Excel 等档案或其他资料来源)。 NCrawler 使用多执行绪...

 

分享到:
评论

相关推荐

    C#爬虫开源

    C#爬虫开源是指使用C#编程语言开发的网络爬虫程序,这些程序的源代码对外公开,允许开发者查看、学习甚至修改和分发。开源的意义在于促进技术交流,提高编程技能,以及推动软件的持续改进。在开源社区中,C#爬虫项目...

    开源 爬虫 C#

    这个名为"Hawk"的开源爬虫项目,就是用C#编写的,为开发者提供了一种在.NET环境中实现网络爬虫功能的框架。 Hawk开源爬虫的核心特性可能包括以下几个方面: 1. **多线程与异步处理**:C#的多线程和异步编程模型...

    C#电商平台网络爬虫实用源码20170809

    标题 "C#电商平台网络爬虫实用源码20170809" 提供了我们今天要讨论的核心内容:一个使用C#编程语言编写的网络爬虫,专门用于抓取电商平台上的数据。网络爬虫是一种自动遍历互联网并提取信息的程序,对于电商平台而言...

    c#蜘蛛、网络爬虫源代码

    此外,“喜欢可以下载学习”暗示这个源代码可能是开源的,提供给开发者研究和学习,有助于提升对C#爬虫开发的技能。 标签“C# 蜘蛛、爬虫”进一步明确了主题,C#是编程语言,而“蜘蛛”和“爬虫”是网络数据采集的...

    C# 搜索引擎和网络爬虫的实现

    在IT领域,网络爬虫和搜索引擎是两个非常关键的技术,特别是在大数据分析和信息提取中。本文将深入探讨如何使用C#这一编程语言来实现这两项技术。 首先,让我们从网络爬虫开始。网络爬虫,也称为网页抓取器或蜘蛛,...

    一个开源的C#蜘蛛爬虫程序,看了让你很受启发

    在这个开源的C#蜘蛛爬虫程序中,我们可以深入学习到如何利用C#来实现网络数据的抓取和处理。爬虫是自动化浏览互联网并提取所需信息的一种工具,对于数据分析、市场研究和网站维护等具有重要意义。 首先,我们要理解...

    基于C#的网络爬虫程序设计.zip

    总的来说,“基于C#的网络爬虫程序设计”项目涵盖了C#网络编程、HTML解析、异步编程、模拟浏览器行为、错误处理和数据存储等多个方面,对于想要深入学习C#爬虫开发的开发者来说,是一份宝贵的资源。通过实践这个项目...

    网易云音乐C#爬虫

    在本文中,我们将深入探讨这个爬虫涉及的技术、实现方法以及如何利用C#进行网络爬虫的开发。 首先,我们了解`NeteaseCloudMusicApi`。这是一个Node.js项目,它封装了网易云音乐的API,使其更容易被其他编程语言调用...

    一个开源的C#蜘蛛爬虫程序,看了让你很受启发,【修订了多线程更新UI错误】

    在这个开源的C#蜘蛛爬虫程序中,开发者可以深入理解网络爬虫的基本原理和技术实现,这对于想要涉足网络数据抓取领域的初学者来说是一份很好的学习资料。程序不仅涵盖了HTML解析、爬行策略,还解决了在多线程环境下...

    c# 开源搜索引擎完整的例子

    这个"C# 开源搜索引擎"项目为学习者提供了一个实践搜索引擎开发的完整环境,涵盖了从基础的网络编程到复杂的文本处理和分布式系统设计等多个方面,对于提升C#开发者的技术能力大有裨益。通过研究这个项目,你可以...

    c#网络爬虫程序设计.rar

    - **项目说明.pdf**:这个文件可能是关于如何构建C#网络爬虫的详细指南,包含具体步骤和代码示例。 - 在线教程:MSDN、Stack Overflow、C# Corner等平台有丰富的C#和网络爬虫教程。 - 开源项目:GitHub上有许多...

    (C#开源搜索引擎).rar

    标题中的"(C#开源搜索引擎).rar"表明这是一个与C#编程语言相关的开源搜索引擎项目。开源意味着源代码可供公众查看、使用、修改和分发。这个压缩包可能包含了一个完整的搜索引擎解决方案,供开发者学习、研究或者在...

    C#网络爬虫_网络矿工开源版

    网络矿工是一款基于.Net平台的开源软件,也是网站数据采集软件类型中唯一一款开源软件。尽管开源,但并不会影响软件功能的提供,甚至要比一些商用软件的功能还要丰富。当前提供的主要功能如下: 1. 多任务多线程数据...

    爬虫技术 C# 例子

    本实例将探讨如何使用C#编程语言构建一个基础的网页爬虫。 C#是一种面向对象的编程语言,由微软开发,它拥有丰富的类库和强大的性能,特别适合用于开发复杂的桌面和网络应用程序。在C#中构建爬虫,我们通常会用到`...

    c# 多线程蜘蛛爬虫

    1.CSpider文件夹下是我开始编写前参考的开源代码,结构比较清晰。单线程 2.任务概述是我这次写spider的过程的描述,我做这次spider的目的是完成一项课程设计。 3.整个spider的开发过程为增量式,从最开始的单页搜索...

    网络爬虫源码

    通过阅读和学习这段源码,我们可以深入理解网络爬虫的工作原理,以及如何使用HttpClient和HttpParser这两个工具进行高效、灵活的网络请求和响应处理。同时,这也为我们提供了实践和优化网络爬虫性能的机会,例如提高...

    一个C#写的开源搜索引擎代码

    总的来说,这个C#开源搜索引擎项目集成了多个组件,涵盖了网络爬取、内容处理、索引构建、查询解析和结果展示等多个环节,提供了一个全面的搜索引擎解决方案。对于想要学习和研究搜索引擎技术的开发者来说,这是一个...

    NWEBCRAWLER(C#网络链接爬虫)

    这是一个C#下的开源网络爬虫,你可以更改Fetch函数,以实现自己的应用。 按照你的需求,Fetch函数应该做以下工作: 1、检测抽取出的URL是否是本站的URL,如果是,继续爬行,如果不是,直接丢弃; 2、检测URL是否能...

    开源爬虫java文件.zip

    【描述】中的"开源爬虫java文件.zip"进一步确认了这个项目是一个开源的网络爬虫,使用Java作为实现语言。网络爬虫是用于自动化地抓取互联网信息的程序,通常用于数据挖掘、搜索引擎索引构建或网站分析。Java在爬虫...

    C#网络爬虫

    【C#网络爬虫】 C#网络爬虫是一种利用编程语言C#开发的自动化程序,用于从互联网上抓取和处理大量数据。这种技术在数据分析、市场研究、搜索引擎优化(SEO)等领域广泛应用。C#提供了丰富的类库和工具,如...

Global site tag (gtag.js) - Google Analytics