- 浏览: 68979 次
- 性别:
- 来自: 南京
文章分类
最新评论
get方式获取网页中的链接
<!--more-->var http = require('http');
//定义函数
var getAHref = function(htmlstr){
var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim;
var arr = [];
while(tem=reg.exec(htmlstr)){
arr.push(tem[2]);
}
return arr;
}
var qHref = "http://xxx";//设置被查询的目标网址
var req = http.get(qHref, function(res) {
var pageData = "";
res.setEncoding('utf8');
res.on('error', function (errget) {
//出错处理
});
res.on('data', function (chunk) {
pageData += chunk;
});
res.on('end', function(){
//console.dir(pageData);
var content = pageData;//获取到网页内容
var hrefs=getAHref(content);//获取链接
});
});
转载自:http://www.9958.pw/post/nodejs_get_html_a
发表评论
-
项目管理之如何控制项目进度和质量
2016-07-16 22:37 607控制项目进度和质量首先在整体上要有一个合理清晰的流程,并且在整 ... -
15 个非常棒的 CSS3 效果教程
2016-07-03 20:42 5881. 创建一个漂亮的图标 这个教程将教你如何用纯 C ... -
前20名的不安全密码(需要避免)
2016-07-01 21:41 514下图举例说明了一些人们作出选择密码时最常用的错误,以及如何使你 ... -
js实现图片放大缩小后进行的复杂排序
2016-06-30 21:57 586首先,我们来讲下需求: 1.图片分为大小和小图,大图占四个小 ... -
史上最全ajax(原生JS,javascript版,非jquery)详细注释!
2016-06-29 22:31 810史上最全ajax详细注释!(原生JS,javascript版, ... -
php千万级pv架构经验分享
2016-06-28 22:04 1294转载自:http://www.9958.pw/post/ph ... -
ecshop 时间问题请注意 /data/config.php
2016-06-27 22:43 869ecshop 处理时间,绕来绕去, 后台的时区设置, 并非以 ... -
目前比较流行的二维码的生成
2016-06-26 23:55 586最近比较流行二维码,自己百度了一下发现有一个很不错的实现方法使 ... -
如何阻止移动设备(手机,pad)浏览器双击放大网页?
2016-06-24 22:29 1214现在的手机或平板电脑等移动设备上的浏览器默认都有双击放大的设置 ... -
PHP解决Xss跨域攻击以及sql注入等危险字符串方案类库
2016-06-19 21:45 778由于该模块在项目中的要求是 不能提示任何信息,也不作断点操作, ... -
网站敏感骂人词库及算法(附6仟个敏感词)
2016-06-16 22:07 5888原文:「我今天开着张三丰田去上班 」 strtr:「我今天开 ... -
jQuery制作元素在屏幕中水平垂直居中效果
2016-06-14 21:56 599jQuery.fn.center = function () ... -
纯CSS画的基本图形(矩形、圆形、三角形、多边形、爱心、八卦等)
2016-06-11 21:32 9791、正方形 CSS代码如下: #square { widt ... -
分享一个JQuery写的点击上下滚动的小例子
2016-06-08 22:00 502效果图 演示地址 源码下载 <!--more--> ... -
精美的国外扁平化网页设计作品
2016-06-05 16:02 600Who Wanna <!--more--> ... -
提交您的博客到各大网站
2016-06-03 21:04 384各大搜索引擎网站登录入口: Google收录入口:http:/ ... -
推荐7个 CSS3 制作的创意下拉菜单效果
2016-06-02 22:15 4041. 使用 jQuery 和 CSS3 制作向下滑动的导航菜单 ... -
Dev Http Client(Chrome的HTTP插件)
2016-05-31 22:34 756Dev Http Client(Chrome的HTTP插件) ... -
好的用户界面-界面设计的一些技巧
2016-05-29 16:24 4031 尽量使用单列而不是 ... -
项目组制定的一份页面优化指南
2016-05-27 21:40 3651.文档声明 文档声明必须置于网页的HTML部分的最开始,标签 ...
相关推荐
标题 "Node.js-用node爬取网站图片" 描述了如何使用Node.js这一流行的JavaScript运行环境来抓取网络上的图片资源。在这个过程中,我们将探讨Node.js的基础知识,HTTP请求库的使用,以及如何处理和保存下载的图片。...
在这个项目中,baidudl利用Node.js强大的网络请求处理能力和异步编程模型来实现对百度网盘API的调用,从而获取高速下载链接。 在标签“Node.js开发-HTTP工具”中,我们可以理解到baidudl是一个开发工具,专注于HTTP...
本教程将专注于使用Node.js来编写一个简单的爬虫,其主要任务是抓取网页中的`<a>`标签链接。`<a>`标签在HTML中用于定义超链接,通常表示网页间的跳转链接。 首先,我们需要安装必要的库。Node.js的`axios`库用于...
在本文中,我们将深入探讨如何使用Node.js进行网络数据抓取,特别是针对知乎头像信息的抓取。Node.js是一个基于Chrome V8引擎的JavaScript运行环境,它以其非阻塞I/O模型和事件驱动特性而受到开发者青睐,非常适合...
Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境,它让开发者能够在服务器端使用 JavaScript 进行编程。Node.js 使用了一个事件驱动、非阻塞 I/O 模型,使其轻量且高效,非常适合构建数据密集型的实时应用...
标题 "Node.js-使用RSS分类订阅稀土掘金" 指出我们将探讨如何利用Node.js技术来构建一个RSS订阅系统,特别关注于稀土掘金(Juejin)这个平台的特定分类内容。RSS(Really Simple Syndication)是一种内容发布协议,...
Node.js是一个基于Chrome V8引擎的JavaScript运行环境,它允许开发者使用JavaScript进行服务器端编程。其异步、事件驱动的特性使它在处理I/O密集型任务如网络请求时具有高效性。 ### 2. HTTP模块 在Node.js中,`...
Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境,它允许开发者在服务器端使用 JavaScript 进行编程。这个技术自2009年发布以来,因其高效的I/O处理、非阻塞I/O模型以及丰富的生态系统,被广泛应用于构建...
Node.js 是一种基于 Chrome V8 引擎的 JavaScript 运行环境,它让开发者可以用 JavaScript 来进行服务器端编程。在本教程中,我们将探讨如何利用 Node.js 创建一个简单的爬虫,用于抓取 Cnode 社区的精华帖子的标题...
Node.js是一个基于Chrome V8引擎的JavaScript运行环境,它允许开发者使用JavaScript进行服务器端编程。Node.js具有非阻塞I/O模型和事件驱动的特点,使其在处理高并发场景下表现优秀。 **2. Express框架** 为了简化...
在本文中,我们将深入探讨如何使用Node.js编写一个简单的图片爬虫。Node.js是一个基于Chrome V8引擎的JavaScript运行环境,它允许开发者使用JavaScript进行服务器端编程。在40行代码以内,我们可以创建一个基本的...
在本案例中,我们将探讨如何使用Node.js这个强大的JavaScript运行环境来开发一个小型的网络爬虫,目标是爬取美女图片。Node.js因其非阻塞I/O模型和高效的性能而广受欢迎,尤其适合于构建网络应用和爬虫。 首先,...
在这个"node.js爬虫例子"中,我们看到作者使用了Node.js这一流行的JavaScript运行环境来编写爬虫程序。Node.js因其非阻塞I/O模型和事件驱动的特点,非常适合处理大量并发的网络请求,因此在爬虫开发中被广泛应用。 ...
Node.js是一个基于Chrome V8引擎的JavaScript运行环境,它允许开发者在服务器端使用JavaScript进行编程,具有非阻塞I/O和事件驱动的特性,特别适合构建高效、可扩展的网络应用。 描述 "Download music from saavn....
Node.js是一种基于Chrome V8引擎的JavaScript运行环境,它允许开发者在服务器端使用JavaScript进行编程。这个"node.js学习代码"的压缩包包含了两个实例,分别涉及到图片爬取和网页内容抓取并存储到数据库的操作,是...
在命令行中,使用`npm init`创建一个新的Node.js项目,并通过`npm install cheerio axios`来安装Cheerio和axios库。axios用于发送HTTP请求,而Cheerio则用于解析HTML并提取所需信息。 接下来,创建一个名为`douban-...
**Node.js与IPFS:用JavaScript构建分布式文件系统** IPFS(InterPlanetary File System,星际文件系统)是一种去中心化的、分布式的文件系统,它旨在通过连接全球范围内的计算设备来共享和存储数据,从而提供高效...
Node.js 是一种基于 Chrome V8 引擎的 JavaScript 运行环境,它让开发者能够使用 JavaScript 来进行服务器端编程。在"Node.js-图灵社区样书爬虫"项目中,我们主要会探讨如何利用 Node.js 的能力来构建一个网络爬虫,...
该项目是一个使用Node.js构建的爬虫API接口,主要用于获取各类在线信息,如前端开发日报、知乎日报、热门前端框架排名、福利图片以及搞笑视频和热点新闻资讯。通过这个接口,开发者可以方便地将这些数据集成到自己的...
Node.js是一个基于Chrome V8引擎的JavaScript运行环境,它允许开发者使用JavaScript进行服务器端编程。这个工具可能是通过Instagram的公共API或者通过网页抓取技术来实现图片的下载。 描述 "下载Instagram照片工具...