0 0

java 求Js网页如何爬取5

http://www.yanglee.com/product/product_Lists.aspx?ptype=105015016005

js网站的爬取,我一般就是看页面上请求后台数据 的地址,然后获取JSON数据,

但就是这个网页,怎么爬,获取后台请求的JSON都获取不到啊

问题补充:生成的数据在页面源码里,所以用上面的网址 第一页能获取到,但是 翻页,改参数什么的就不行了 啊
2014年9月24日 12:46

2个答案 按时间排序 按投票排序

0 0

js 发送的 是ajax
翻页访问的请求地址
http://www.yanglee.com/ajax/ProductSearch.ashx?_=1411884138796&mode=Search&perpage=60&page=1&ProStr=NodeCode%253D%2527105015016005%2527%2520and%2520FlowState%253D99%2520and%2520IsDel%253D0%2520and%2520ProductLevel%253C%253E%2527VIP%2527%2520&strOrder=released%2520desc&ProductState=&jigou=&qixian=&shouyi=&InvestField=&ApplyWay=
如果 用程序调 可能还需要加这些个Header 参数吧
Referer http://www.yanglee.com/product/product_Lists.aspx?ptype=105015016005

perpage=60&page=1 每页记录数 当前页面值

2014年9月28日 14:05
0 0

你翻页和修改数据是怎么请求后台的,并且你的前台页面是怎么处理你返回来的数据的

2014年9月26日 11:58

相关推荐

    Java爬虫网页上的所有链接网址.zip_java 网页爬虫_java网页爬虫_爬取所有链接_网页爬虫链接

    运行这个程序时,Java虚拟机(JVM)会加载并执行这个字节码,实现网页链接的爬取功能。 总的来说,这个Java爬虫项目专注于获取网页上的所有链接,对于初学者而言,这是一个很好的学习资源,能够帮助理解网络爬虫的...

    基于Java的网站资源爬取与转换设计源码

    这些文件详细展示了如何使用Java、CSS、HTML和JavaScript爬取网站的HTML、JS、CSS和图片资源,并将其转换为CHM和PDF文档。该项目使用了HHC将HTML转换为CHM文档,并使用了wkhtmltopdf将HTML转换为PDF文档(支持高清带...

    java爬取京东数据

    此时,需要使用支持JavaScript执行的工具,如Headless Chrome(Puppeteer)或Java的Selenium WebDriver,来模拟浏览器执行JS并获取最终渲染后的页面内容。 6. **处理反爬策略**:京东等大型电商平台通常有反爬策略...

    java爬取网页用到的一些jar

    在Java编程语言中,爬取网页是一项常见的任务,主要用于数据抓取、数据分析或者构建智能搜索引擎。这个名为“java爬取网页用到的一些jar”的压缩包很可能是包含了一系列用于网页抓取的Java库。这些库可以帮助开发者...

    Java爬虫爬取网页数据

    Java爬虫爬取网页数据是一种常见的技术,用于自动地从互联网上抓取信息。这个工具提供了方便的方法来解析HTML和XML文档,提取所需的数据。在Java中,我们通常使用库如Jsoup或Apache HttpClient来实现爬虫功能。下面...

    Java爬虫Jsoup+httpclient获取动态生成的数据

    在Web开发和数据抓取领域,Java爬虫技术是实现网页自动化信息提取的重要手段。本文主要讲述如何利用Java编程语言中的Jsoup库和HttpClient工具包来获取和解析动态生成的数据,特别是那些通过JavaScript动态加载的数据...

    java爬取各大平台价格

    HtmlUnit是一个无头浏览器模拟器,它允许Java程序以JavaScript支持的方式浏览网页。这意味着它可以执行页面上的JavaScript代码,这对于那些依赖动态加载数据的网站来说非常有用。在Java爬虫中,HtmlUnit可以用来...

    14.(地图数据篇)arcgis地图瓦片数据爬取--java代码.zip

    本主题聚焦于如何使用Java编程语言来爬取ArcGIS地图的瓦片数据。下面将详细阐述这个过程中的关键知识点。 首先,"瓦片数据"是地图的一种常见存储方式,它将大范围的地图分割成多个小块,每个小块称为一个瓦片,通常...

    Java爬虫进阶:高效爬取CSDN技术文章.zip

    在本压缩包“Java爬虫进阶:高效爬取CSDN技术文章.zip”中,包含了一套关于使用Java编写高效网络爬虫的教程,特别针对CSDN(China Software Developer Network)技术文章的抓取。这个项目不仅提供了源代码,还有说明...

    java爬取携程酒店评价信息

    这种参数通常由JavaScript生成,需要我们分析网页源码或者使用如Selenium这样的浏览器自动化工具来模拟真实用户行为获取。有时,可能还需要处理其他动态加载的内容,如Ajax请求。 4. **反反爬策略**:除了eleven...

    java爬虫,以爬取sohu新闻为例

    4. **动态加载内容处理**:现代网页常常使用JavaScript来动态加载内容,例如Ajax。对于这类网页,简单的HTTP请求可能无法获取所有数据。此时可能需要用到如Selenium或Puppeteer这样的浏览器自动化工具,模拟用户行为...

    java爬取亚马逊的Iphone信息.zip

    3. HtmlUnit:这是一个无头浏览器,能够执行JavaScript,对于那些依赖JavaScript动态加载内容的网页,HtmlUnit能更好地模拟浏览器行为,获取完整数据。在抓取亚马逊这类动态加载的网页时,HtmlUnit可能比纯HTTP请求...

    Java爬虫--爬取xx娱乐网的数据,让你的程序不单薄(一)

    Java爬虫技术是一种用于自动化获取网页数据的编程技术,它能帮助开发者从互联网上抓取大量信息,从而丰富你的程序内容。在这个项目中,我们将学习如何使用Java来爬取xx娱乐网的数据,并将其存储到MySQL数据库中。...

    java爬取亚马逊的Iphone信息

    3. **网页动态加载处理**:现代网页常使用JavaScript进行动态加载,导致初次请求可能无法获取完整信息。对于这种情况,可能需要利用如Selenium这样的工具模拟浏览器行为,或者分析Ajax请求来获取动态内容。 4. **...

    Java爬虫小例子,爬取小网站,突破防盗链下载图片

    在IT行业中,Java爬虫是一种常见的技术,用于自动抓取网页信息,包括文本、图片等。这个"Java爬虫小例子"项目展示了如何利用Java来爬取小型网站,特别是那些有防盗链保护的图片资源。防盗链是网站为了防止其他网站...

    网页动态抓取

    网页动态抓取是一种技术,主要用于从互联网上获取实时更新或交互式内容,这些内容在静态抓取时可能无法获取到。这项技术对于数据分析、搜索引擎优化(SEO)、内容监控以及网络研究等多个领域都至关重要。 首先,...

    Java爬虫爬取网易汽车车型库

    这可能涉及JavaScript执行,这时我们可以使用Selenium WebDriver,它可以模拟浏览器行为,加载完整页面。不过,网易汽车的车型库如果采用动态加载,也可能使用Ajax请求加载数据,这种情况下,我们需要分析网络请求,...

    java爬虫爬取数据

    这对于爬取依赖JavaScript渲染或者需要登录才能访问的网站非常有用。 在实际应用中,Java爬虫的开发流程通常包括以下步骤: 1. 分析目标网站结构:了解网站的URL模式、数据存储方式等。 2. 设计爬虫框架:根据需求...

    jsoup分页爬取网页

    **jsoup分页爬取网页** Jsoup是一个Java库,设计用于处理和解析HTML,它提供了...但需要注意,随着网页复杂性的增加,可能需要结合其他工具或库来处理JavaScript动态加载的内容,jsoup本身并不支持执行JavaScript。

    java爬取天涯社区

    在本项目"java爬取天涯社区"中,我们将探讨如何使用Java语言来编写一个简单的网络爬虫,以抓取天涯社区中的帖子数据。 首先,我们需要了解Java爬虫的基本构建模块。这通常包括以下几个部分: 1. **HTTP请求库**:...

Global site tag (gtag.js) - Google Analytics