保证安装好nodeJS以及相应模块
模块安装的命令:npm install 模块名
模块更新的命令:npm update 模块名
模块卸载的命令:npm uninstall 模块名
模块搜索的命令:npm search 模块名
创建一个xxx.js文件,用notepad++ 编写如下代码就行,编写完后进入js文件所在目录,node xxx.js 运行就可以了。
代码:
var http = require('http');
var fs = require('fs');
var cheerio = require('cheerio');
var request = require('request');
var url = '';
var j=0;
//抓取数据
function fetchPage(url){
startRequest(url);
}
function startRequest(url){
//通过url请求数据
request(url,function(error,response,body){
if(!error && response.statusCode== 200){
//console.log(body);
//请求成功
//$=cheerio.load(body);
var $ = cheerio.load(body);
var data=[];
$('.w-goods-area').find('.contentbox').each(function(index,ele){
//var a = $(ele).find('h4').text();
//console.log(a);
console.log('==============================================>>第'+index+'条');
data.push({
name: $(ele).find('h4').text(),
href: 'http:'+$(ele).find('a',target='_blank').attr('href')
});
});
console.log(data);
}
});
}
//循环加载url
for(var i = 1;i<=10;i++){
url = "https://t.nuomi.com/3/cd-0-0-0-642/0-page"+i+"?#j-sort-bar";
fetchPage(url);
console.log('url:'+url);
}
分享到:
相关推荐
[nodejs搭建,express框架,nodejs简单页面抓取,JS正则,canvas光晕效果] 在线:http://wangxinsheng.herokuapp.com/weather [heroku服务器访问国内好像很慢。。。所以抓取页面也特别慢] nodejs抓取页面,js正则提取数据
nodejs视频教程,可以快速帮助你入门nodejs开发中,nodejs不错哦
nodejs爬虫抓取页面内容,简单好用
百度AI 人脸识别帮助类nodejs实现
nodejs的windows安装包
“ node-crawling-framework”是受启发的的爬网和抓取框架。 节点作业服务器也在运行中(基于BullJs的kinda scrapyd等效项)。 功能(尚未经过全面测试和最终确定) 核心工作正常:Crawler,Scraper,Spider,...
nodejs实战视频,一步一步教大家从无到有的过程,需要的朋友,可以下载学习。
nodejs12.14.0 64位 win Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境。 Node.js 使用了一个事件驱动、非阻塞式 I/O 的模型。 [1] Node 是一个让 JavaScript 运行在服务端的开发平台,它让 ...
爬取京东商城上的商品详情页信息,包括价格、图片等内容。
1. 下载 2. 到工作目录 npm install 依赖包 3. 运行项目 node app.js 4. 浏览器打开 localhost:8888 ### 后台依赖包 1. baidu-aip-sdk: 百度语音识别api 2. connect-multiparty: 用于...3. express: nodeJs框架
nodejs14.9.0
NodeJs 要求 v0.10.36 安装 安装package.json提供的依赖项转到node文件夹 npm install 配置 转到文件夹: cpasbien/node/configuration/ 将文件config-orig.json克隆到config.json 自定义值 serverPort:节点 ...
废话不多说,直接给大家贴node.js抓取html页面内容的核心代码了。 具体代码如下所示: var http = require(http); var iconv = require('iconv-lite'); var option = { hostname: stockdata.stock.hexun.com, path:...
appengine-nodejs-quicks 使用自定义运行时的 Google App Engine 托管 VM 上的 node.js 入门项目。 用法 首先克隆这个存储库。 要在开发应用程序服务器中本地运行应用程序: gcloud preview app run . 如果需要...
Node.js 是一个基于Chrome JavaScript 运行时建立的一个平台, 用来方便地搭建快速的 易于扩展的网络应用· Node.js 借助事件驱动, 非阻塞I/O 模型变得轻量和高效, 非常适合 运行在分布式设备 的 数据密集型 的...
nodejs初级教程
对nodejs综合性的讲解
nodeJs 12.22.12-x64-windows版本 nodeJs 12.22.12-x64-windows版本 nodeJs 12.22.12-x64-windows版本 nodeJs 12.22.12-x64-windows版本 nodeJs 12.22.12-x64-windows版本
nodejs 设计模式英文版,本书详细解释了node的一些底层知识和设计的方法
本文中,作者通过NodeJS这一后端技术,实现了批量查询城市地理位置经纬度的功能,对于需要大量处理地理信息数据的开发者来说,具有很好的参考价值。 首先,实现地理位置查询离不开地图API(应用程序编程接口),...