taobao 爬虫方案 -

yellowhat

浏览: 16282 次
性别:
来自: 武汉

最近访客更多访客>>

sni30

cnlinkin

guchina

paderborn1

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

taobao 爬虫方案

博客分类：

taobao
crawler

taobao crawler 爬虫屏蔽

1. taobao, tmall 店铺数据

在官网上我们可以通过 search 接口（https://shopsearch.taobao.com/search?app=shopsearch&q=iphone ）获取前 1020 页数据，界面展示是 100页数据每页数据 20条，即2000条,现在通过

2. item 接口（又称之为商品接口 json）

该接口可以快速的获取店铺商品信息，获取店铺是第 1 步，第2步通过该接口获取所有店铺商品信息，以下展示 2 个接口

（1. old : http://s.m.taobao.com/search?m=api4h5&nick=%E7%92%90%E7%92%90%E5%98%89%E5%98%89&n=40&page=1 ) // 通过店铺昵称

(2. new : http://api.s.m.taobao.com/search.json?m=shopitemsearch&sellerId=263817957&n=40&page=1 ） // 通过卖家 sellerId

以上两个接口可以很轻松的返回店铺所有商品数据，这样对收集店铺数据就显的十分重要，为进一步获取 sku 数据打下关键的基本，他是一个一对多接口 (一个接口多对数据)

3. sku 数据（json 数据）

sku 数据即 detail 数据，在这里可以获取商品的所有信息价格，库存，销量，运费等信息，我们先看一个 pc 端接口

1. pc （ https://mdskip.taobao.com/core/initItemDetail.htm?tmallBuySupport=true&itemId=itemId ） // itemId 即上面获取的店铺 items 所有数据

这个接口直接访问不行，需要添加一定的 http 头消息如 Referer, UpgradeInsecureRequests , CacheControl 等信息，启用 tls 请求即可返回 json 数据

2. mobile 1 ( https://hws.m.taobao.com/cache/wdetail/5.0/?id=39783398037 ）

这是一个非常高效的接口 cache 接口，未有任何校验直接取数如下

这个接口直接请求即可获取详细的 json 数据，这里包括商品价格，sku 信息，销量，运费，支付方式，店铺，促销信息等

3. mobile 2 (tmall: https://detail.m.tmall.com/item.htm?id=39783398037 )

该接口很正常的返回页面数据，在页面数据中，包函完整的 sku 全部信息，这是直接可以解析与处理的，访问一个手机页面未有什么校验直接即可以获取建议添加用户信息检验与加密算法

4. app client

在早期 taobao app 中，曾经有人破解出收费 app key

appKey = "12278902";

secret = "744e7d7e7028b817bd9f8f3c6f28a8d3";

通过这个 appkey 我们可以大方的使用 open.api 了如获取以下信息

分享到：

JAVA 性能

2016-08-17 17:34
浏览 5129
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

taobao 爬虫方案

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

taobao 爬虫方案

评论

发表评论

相关推荐

最近访客更多访客>>