`

nodejs抓取百度糯米

阅读更多
保证安装好nodeJS以及相应模块

模块安装的命令:npm install 模块名
模块更新的命令:npm update 模块名
模块卸载的命令:npm uninstall 模块名
模块搜索的命令:npm search  模块名


创建一个xxx.js文件,用notepad++ 编写如下代码就行,编写完后进入js文件所在目录,node xxx.js  运行就可以了。

代码:
var http = require('http');
var fs = require('fs');
var cheerio = require('cheerio');
var request = require('request');
var url = '';
var j=0;


//抓取数据
function fetchPage(url){
startRequest(url);
}
function startRequest(url){

//通过url请求数据
request(url,function(error,response,body){
if(!error && response.statusCode== 200){
//console.log(body);
//请求成功
//$=cheerio.load(body);

var $ = cheerio.load(body);
var data=[];
$('.w-goods-area').find('.contentbox').each(function(index,ele){
//var a = $(ele).find('h4').text();
//console.log(a);
console.log('==============================================>>第'+index+'条');
data.push({
  name: $(ele).find('h4').text(),
  href: 'http:'+$(ele).find('a',target='_blank').attr('href')
});
});
console.log(data);

}
});

}

//循环加载url
for(var i = 1;i<=10;i++){
url = "https://t.nuomi.com/3/cd-0-0-0-642/0-page"+i+"?#j-sort-bar";
fetchPage(url);
console.log('url:'+url);


}
分享到:
评论

相关推荐

    [nodejs,js]天气预报,nodejs抓取页面,js正则提取数据

    [nodejs搭建,express框架,nodejs简单页面抓取,JS正则,canvas光晕效果] 在线:http://wangxinsheng.herokuapp.com/weather [heroku服务器访问国内好像很慢。。。所以抓取页面也特别慢] nodejs抓取页面,js正则提取数据

    nodejs视频教程百度网盘

    nodejs视频教程,可以快速帮助你入门nodejs开发中,nodejs不错哦

    nodejs爬虫抓取页面内容

    nodejs爬虫抓取页面内容,简单好用

    百度AI 人脸识别帮助类nodejs实现

    百度AI 人脸识别帮助类nodejs实现

    node-crawling-framework:S受Scrapy启发的NodeJs抓取和抓取框架

    “ node-crawling-framework”是受启发的的爬网和抓取框架。 节点作业服务器也在运行中(基于BullJs的kinda scrapyd等效项)。 功能(尚未经过全面测试和最终确定) 核心工作正常:Crawler,Scraper,Spider,...

    node-v10.15.3百度云.txt

    nodejs的windows安装包

    nodejs12140x64.zip

    nodejs12.14.0 64位 win Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境。 Node.js 使用了一个事件驱动、非阻塞式 I/O 的模型。 [1] Node 是一个让 JavaScript 运行在服务端的开发平台,它让 ...

    JD京东爬虫

    爬取京东商城上的商品详情页信息,包括价格、图片等内容。

    基于nodeJS 百度语音识别sdk的语音识别源码

    1. 下载 2. 到工作目录 npm install 依赖包 3. 运行项目 node app.js 4. 浏览器打开 localhost:8888 ### 后台依赖包 1. baidu-aip-sdk: 百度语音识别api 2. connect-multiparty: 用于...3. express: nodeJs框架

    nodejs14.9.0

    nodejs14.9.0

    cpasbien:带有 IOS 客户端的 NodeJs 抓取工具

    NodeJs 要求 v0.10.36 安装 安装package.json提供的依赖项转到node文件夹 npm install 配置 转到文件夹: cpasbien/node/configuration/ 将文件config-orig.json克隆到config.json 自定义值 serverPort:节点 ...

    Nodejs抓取html页面内容(推荐)

    废话不多说,直接给大家贴node.js抓取html页面内容的核心代码了。 具体代码如下所示: var http = require(http); var iconv = require('iconv-lite'); var option = { hostname: stockdata.stock.hexun.com, path:...

    appengine-nodejs-quicks:这用于抓取网络

    appengine-nodejs-quicks 使用自定义运行时的 Google App Engine 托管 VM 上的 node.js 入门项目。 用法 首先克隆这个存储库。 要在开发应用程序服务器中本地运行应用程序: gcloud preview app run . 如果需要...

    nodejs64.exe

    Node.js 是一个基于Chrome JavaScript 运行时建立的一个平台, 用来方便地搭建快速的 易于扩展的网络应用· Node.js 借助事件驱动, 非阻塞I/O 模型变得轻量和高效, 非常适合 运行在分布式设备 的 数据密集型 的...

    nodejs.pdf nodejs初级教程 nodejs初级教程

    nodejs初级教程

    nodejs指南

    对nodejs综合性的讲解

    用NodeJS实现批量查询地理位置的经纬度接口

    本文中,作者通过NodeJS这一后端技术,实现了批量查询城市地理位置经纬度的功能,对于需要大量处理地理信息数据的开发者来说,具有很好的参考价值。 首先,实现地理位置查询离不开地图API(应用程序编程接口),...

    google-search-results-nodejs:在Node.JS中抓取并解析Google搜索结果

    这个Node.JS模块允许您使用抓取和解析Google搜索结果。 除外,您还可以使用此模块访问SerpWow ,和 。 所有方法都支持Promise和节点样式的回调。 安装 您可以使用以下方法安装google-search-results-serpwow: $ ...

    NodeJs技术经典文档

    资源名称:NodeJs技术经典文档资源目录:【】Node.js开发指南_中文正版【】nodejs开发指南pdf及源码及win安装程序【】nodejs手册中文【】NodeJs教程【】umav4simple【】七天学会NodeJS【】七天学会NodeJS【】深入浅...

    nodejs:NodeJS示例项目

    节点js NodeJS示例项目

Global site tag (gtag.js) - Google Analytics