java 求Js网页如何爬取 - ITeye问答

问答首页 → 移动开发技术

0 0

java 求Js网页如何爬取5

http://www.yanglee.com/product/product_Lists.aspx?ptype=105015016005

js网站的爬取，我一般就是看页面上请求后台数据的地址，然后获取JSON数据，

但就是这个网页，怎么爬，获取后台请求的JSON都获取不到啊

问题补充：生成的数据在页面源码里，所以用上面的网址第一页能获取到，但是翻页，改参数什么的就不行了啊

Java 爬虫 java 爬虫

2014年9月24日 12:46

assasszt
17
0 0 5

2个答案按时间排序按投票排序

0 0

js 发送的是ajax
翻页访问的请求地址
http://www.yanglee.com/ajax/ProductSearch.ashx?_=1411884138796&mode=Search&perpage=60&page=1&ProStr=NodeCode%253D%2527105015016005%2527%2520and%2520FlowState%253D99%2520and%2520IsDel%253D0%2520and%2520ProductLevel%253C%253E%2527VIP%2527%2520&strOrder=released%2520desc&ProductState=&jigou=&qixian=&shouyi=&InvestField=&ApplyWay=
如果用程序调可能还需要加这些个Header 参数吧
Referer http://www.yanglee.com/product/product_Lists.aspx?ptype=105015016005

perpage=60&page=1 每页记录数当前页面值

2014年9月28日 14:05

PeTiRo
35
0 1 3

1条评论

0 0

你翻页和修改数据是怎么请求后台的，并且你的前台页面是怎么处理你返回来的数据的

2014年9月26日 11:58

jjjssh
320
0 0 6

2条评论

相关推荐

Java爬虫网页上的所有链接网址.zip_java 网页爬虫_java网页爬虫_爬取所有链接_网页爬虫链接: 运行这个程序时，Java虚拟机（JVM）会加载并执行这个字节码，实现网页链接的爬取功能。总的来说，这个Java爬虫项目专注于获取网页上的所有链接，对于初学者而言，这是一个很好的学习资源，能够帮助理解网络爬虫的...

java爬取各大平台价格: HtmlUnit是一个无头浏览器模拟器，它允许Java程序以JavaScript支持的方式浏览网页。这意味着它可以执行页面上的JavaScript代码，这对于那些依赖动态加载数据的网站来说非常有用。在Java爬虫中，HtmlUnit可以用来...

基于Java的网站资源爬取与转换设计源码: 这些文件详细展示了如何使用Java、CSS、HTML和JavaScript爬取网站的HTML、JS、CSS和图片资源，并将其转换为CHM和PDF文档。该项目使用了HHC将HTML转换为CHM文档，并使用了wkhtmltopdf将HTML转换为PDF文档（支持高清带...

java爬取网页用到的一些jar: 在Java编程语言中，爬取网页是一项常见的任务，主要用于数据抓取、数据分析或者构建智能搜索引擎。这个名为“java爬取网页用到的一些jar”的压缩包很可能是包含了一系列用于网页抓取的Java库。这些库可以帮助开发者...

java爬取京东数据: 此时，需要使用支持JavaScript执行的工具，如Headless Chrome（Puppeteer）或Java的Selenium WebDriver，来模拟浏览器执行JS并获取最终渲染后的页面内容。 6. **处理反爬策略**：京东等大型电商平台通常有反爬策略...

Java爬虫爬取网页数据: Java爬虫爬取网页数据是一种常见的技术，用于自动地从互联网上抓取信息。这个工具提供了方便的方法来解析HTML和XML文档，提取所需的数据。在Java中，我们通常使用库如Jsoup或Apache HttpClient来实现爬虫功能。下面...

Java爬虫Jsoup+httpclient获取动态生成的数据: 在Web开发和数据抓取领域，Java爬虫技术是实现网页自动化信息提取的重要手段。本文主要讲述如何利用Java编程语言中的Jsoup库和HttpClient工具包来获取和解析动态生成的数据，特别是那些通过JavaScript动态加载的数据...

14.（地图数据篇）arcgis地图瓦片数据爬取--java代码.zip: 本主题聚焦于如何使用Java编程语言来爬取ArcGIS地图的瓦片数据。下面将详细阐述这个过程中的关键知识点。首先，"瓦片数据"是地图的一种常见存储方式，它将大范围的地图分割成多个小块，每个小块称为一个瓦片，通常...

Java爬虫进阶：高效爬取CSDN技术文章.zip: 在本压缩包“Java爬虫进阶：高效爬取CSDN技术文章.zip”中，包含了一套关于使用Java编写高效网络爬虫的教程，特别针对CSDN（China Software Developer Network）技术文章的抓取。这个项目不仅提供了源代码，还有说明...

java爬取携程酒店评价信息: 这种参数通常由JavaScript生成，需要我们分析网页源码或者使用如Selenium这样的浏览器自动化工具来模拟真实用户行为获取。有时，可能还需要处理其他动态加载的内容，如Ajax请求。 4. **反反爬策略**：除了eleven...

java爬虫，以爬取sohu新闻为例: 4. **动态加载内容处理**：现代网页常常使用JavaScript来动态加载内容，例如Ajax。对于这类网页，简单的HTTP请求可能无法获取所有数据。此时可能需要用到如Selenium或Puppeteer这样的浏览器自动化工具，模拟用户行为...

java爬取亚马逊的Iphone信息.zip: 3. HtmlUnit：这是一个无头浏览器，能够执行JavaScript，对于那些依赖JavaScript动态加载内容的网页，HtmlUnit能更好地模拟浏览器行为，获取完整数据。在抓取亚马逊这类动态加载的网页时，HtmlUnit可能比纯HTTP请求...

Java爬虫--爬取xx娱乐网的数据，让你的程序不单薄（一）: Java爬虫技术是一种用于自动化获取网页数据的编程技术，它能帮助开发者从互联网上抓取大量信息，从而丰富你的程序内容。在这个项目中，我们将学习如何使用Java来爬取xx娱乐网的数据，并将其存储到MySQL数据库中。...

java爬取亚马逊的Iphone信息: 3. **网页动态加载处理**：现代网页常使用JavaScript进行动态加载，导致初次请求可能无法获取完整信息。对于这种情况，可能需要利用如Selenium这样的工具模拟浏览器行为，或者分析Ajax请求来获取动态内容。 4. **...

Java爬虫小例子，爬取小网站，突破防盗链下载图片: 在IT行业中，Java爬虫是一种常见的技术，用于自动抓取网页信息，包括文本、图片等。这个"Java爬虫小例子"项目展示了如何利用Java来爬取小型网站，特别是那些有防盗链保护的图片资源。防盗链是网站为了防止其他网站...

网页动态抓取: 网页动态抓取是一种技术，主要用于从互联网上获取实时更新或交互式内容，这些内容在静态抓取时可能无法获取到。这项技术对于数据分析、搜索引擎优化（SEO）、内容监控以及网络研究等多个领域都至关重要。首先，...

淘宝天猫商品详情爬取: 此外，有些商品信息可能存储在JavaScript变量或异步加载的数据中，这时可能需要使用Selenium这样的工具模拟浏览器执行JavaScript。如果商品详情数据是JSON格式，比如通过Ajax异步请求获取，我们可以分析网络请求，...

Java爬虫爬取网易汽车车型库: 这可能涉及JavaScript执行，这时我们可以使用Selenium WebDriver，它可以模拟浏览器行为，加载完整页面。不过，网易汽车的车型库如果采用动态加载，也可能使用Ajax请求加载数据，这种情况下，我们需要分析网络请求，...

爬取携程酒店数据CTripSpider.zip: 【酒店管理系统】酒店管理系统是一种用于帮助酒店...Java、Python、Node.js、Spring Boot、Django、Express、MySQL、PostgreSQL、MongoDB、React、Angular、Vue、Bootstrap、Material-UI、Redis、Docker、Kubernetes

jsoup分页爬取网页: **jsoup分页爬取网页** Jsoup是一个Java库，设计用于处理和解析HTML，它提供了...但需要注意，随着网页复杂性的增加，可能需要结合其他工具或库来处理JavaScript动态加载的内容，jsoup本身并不支持执行JavaScript。

Ask-but

我的问答 FAQ | 勋章

相关推荐

已解决问题

未解决问题

排行榜

查看全部排名>>

Global site tag (gtag.js) - Google Analytics