- 浏览: 374628 次
- 性别:
- 来自: 四川
文章分类
- 全部博客 (247)
- 数据库以及sql (11)
- java (48)
- 爬虫学习 (20)
- java编程 (28)
- python编程以及安装和配置 (27)
- oracle数据库 (32)
- mongodb基本操作 (4)
- linux学习 (7)
- easyUI (2)
- nodeJs (8)
- python学习 (16)
- 其他 (13)
- hadoop (1)
- svn (1)
- 汉字 (1)
- windows (2)
- jsp (5)
- fiddler (1)
- ETL (1)
- teamviewer (1)
- maven (4)
- GIT (2)
- datagrip (1)
- ocr (1)
- redis (3)
- mysql (3)
- linux (1)
- 数据服务 (0)
最新评论
public static void main(String[] args) {
String keyword = "鼠标";
keyword=UrlEncoded.encodeString(keyword);
System.out.println(keyword);
System.out.println(System.currentTimeMillis());
String urlStr = "https://www.amazon.cn/s/ref=sr_pg_1?rh=i%3Aaps%2Ck%3A%E9%BC%A0%E6%A0%87&page=1&keywords=%E9%BC%A0%E6%A0%87&ie=UTF8&qid=1535523044";
try {
String html =getHttpHeaders(urlStr);
Document doc = Jsoup.parse(html);
Elements els = doc.select("div.s-item-container");
String goodName ="";
String goodUrl ="";
String goodPrice ="";
for (Element e : els) {
goodName= e.getElementsByAttributeValue("class", "a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal").attr("title");
goodUrl= e.getElementsByAttributeValue("class", "a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal").attr("href");
goodPrice= e.getElementsByAttributeValue("class", "a-size-base a-color-price s-price a-text-bold").text();
if(goodPrice.contains("¥")){
goodPrice=goodPrice.replace("¥", "");
}
if(goodName.length()>0){
System.out.println("goodName="+goodName);
System.out.println("goodUrl="+goodUrl);
System.out.println("goodPrice="+goodPrice);
}
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
public static void trustEveryone() {
try {
HttpsURLConnection
.setDefaultHostnameVerifier(new HostnameVerifier() {
public boolean verify(String hostname,
SSLSession session) {
return true;
}
});
SSLContext context = SSLContext.getInstance("TLS");
context.init(null, new X509TrustManager[] { new X509TrustManager() {
public void checkClientTrusted(X509Certificate[] chain,
String authType) throws CertificateException {
}
public void checkServerTrusted(X509Certificate[] chain,
String authType) throws CertificateException {
}
public X509Certificate[] getAcceptedIssuers() {
return new X509Certificate[0];
}
} }, new SecureRandom());
HttpsURLConnection.setDefaultSSLSocketFactory(context
.getSocketFactory());
} catch (Exception e) {
// e.printStackTrace();
}
}
public static String getHttpHeaders(String urlStr) {
try {
URL url = new URL(urlStr);
trustEveryone();
Connection conn = HttpConnection.connect(url);
conn.timeout(10000);
// 默认是 GET方式
conn.header("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8");
conn.header("Accept-Encoding", "gzip, deflate, br");
conn.header("Accept-Language", "zh-CN,zh;q=0.9");
conn.header("Cache-Control", "max-age=0");
conn.header("Connection", "keep-alive");
conn.header("Cookie", "session-id=459-7685866-4114631; ubid-acbcn=462-7605214-6740260; x-wl-uid=1/8WbnRRWqUmuHEwnk0vv/5QUwLPz7ExJ8sDDXwii/B7q7Q7du4lfbGND+N96grUw6aQQqTgRWjU=; session-token=\"61BROo0R3lWTferrCdSW7uhrLZsEr2nenTtEcaRYw5gdaQSPQTdVCZcBY4Z0m5aG3dYjFa9ig743cQQN1d/OFW215SCO+iS21Y8D1Gtf5HEPvdlzUxTlXuDJS1+MHRB7+DYx9NNXQagHg+lb6Rsz3ZIuTyd+HfSEmuoJMTuVUnxNbFcW/5CoeB+bWzkX9UmOa7StU6t/s+ak5O6uulcWZ+MTPx7lsF0KJfc+9CY3d6g/esAYdddvWA==\"; session-id-time=2082729601l; csm-hit=tb:XHNG7XF4GSF6CRHXT26C+sa-Q9YXGCPZY9WTMWCPRN2W-5JG052ATG7KJSS01Y89P|"+System.currentTimeMillis()+"&adb:adblk_yes");
conn.header("Host", "www.amazon.cn");
conn.header("Upgrade-Insecure-Requests", "1");
conn.header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.62 Safari/537.36");
conn.ignoreContentType(true);
conn.execute();
String html=conn.get().html();
//System.out.println( html);
return html;
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
return "请求的页面不存在或链接错误 !!!";
}
String keyword = "鼠标";
keyword=UrlEncoded.encodeString(keyword);
System.out.println(keyword);
System.out.println(System.currentTimeMillis());
String urlStr = "https://www.amazon.cn/s/ref=sr_pg_1?rh=i%3Aaps%2Ck%3A%E9%BC%A0%E6%A0%87&page=1&keywords=%E9%BC%A0%E6%A0%87&ie=UTF8&qid=1535523044";
try {
String html =getHttpHeaders(urlStr);
Document doc = Jsoup.parse(html);
Elements els = doc.select("div.s-item-container");
String goodName ="";
String goodUrl ="";
String goodPrice ="";
for (Element e : els) {
goodName= e.getElementsByAttributeValue("class", "a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal").attr("title");
goodUrl= e.getElementsByAttributeValue("class", "a-link-normal s-access-detail-page s-color-twister-title-link a-text-normal").attr("href");
goodPrice= e.getElementsByAttributeValue("class", "a-size-base a-color-price s-price a-text-bold").text();
if(goodPrice.contains("¥")){
goodPrice=goodPrice.replace("¥", "");
}
if(goodName.length()>0){
System.out.println("goodName="+goodName);
System.out.println("goodUrl="+goodUrl);
System.out.println("goodPrice="+goodPrice);
}
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
public static void trustEveryone() {
try {
HttpsURLConnection
.setDefaultHostnameVerifier(new HostnameVerifier() {
public boolean verify(String hostname,
SSLSession session) {
return true;
}
});
SSLContext context = SSLContext.getInstance("TLS");
context.init(null, new X509TrustManager[] { new X509TrustManager() {
public void checkClientTrusted(X509Certificate[] chain,
String authType) throws CertificateException {
}
public void checkServerTrusted(X509Certificate[] chain,
String authType) throws CertificateException {
}
public X509Certificate[] getAcceptedIssuers() {
return new X509Certificate[0];
}
} }, new SecureRandom());
HttpsURLConnection.setDefaultSSLSocketFactory(context
.getSocketFactory());
} catch (Exception e) {
// e.printStackTrace();
}
}
public static String getHttpHeaders(String urlStr) {
try {
URL url = new URL(urlStr);
trustEveryone();
Connection conn = HttpConnection.connect(url);
conn.timeout(10000);
// 默认是 GET方式
conn.header("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8");
conn.header("Accept-Encoding", "gzip, deflate, br");
conn.header("Accept-Language", "zh-CN,zh;q=0.9");
conn.header("Cache-Control", "max-age=0");
conn.header("Connection", "keep-alive");
conn.header("Cookie", "session-id=459-7685866-4114631; ubid-acbcn=462-7605214-6740260; x-wl-uid=1/8WbnRRWqUmuHEwnk0vv/5QUwLPz7ExJ8sDDXwii/B7q7Q7du4lfbGND+N96grUw6aQQqTgRWjU=; session-token=\"61BROo0R3lWTferrCdSW7uhrLZsEr2nenTtEcaRYw5gdaQSPQTdVCZcBY4Z0m5aG3dYjFa9ig743cQQN1d/OFW215SCO+iS21Y8D1Gtf5HEPvdlzUxTlXuDJS1+MHRB7+DYx9NNXQagHg+lb6Rsz3ZIuTyd+HfSEmuoJMTuVUnxNbFcW/5CoeB+bWzkX9UmOa7StU6t/s+ak5O6uulcWZ+MTPx7lsF0KJfc+9CY3d6g/esAYdddvWA==\"; session-id-time=2082729601l; csm-hit=tb:XHNG7XF4GSF6CRHXT26C+sa-Q9YXGCPZY9WTMWCPRN2W-5JG052ATG7KJSS01Y89P|"+System.currentTimeMillis()+"&adb:adblk_yes");
conn.header("Host", "www.amazon.cn");
conn.header("Upgrade-Insecure-Requests", "1");
conn.header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.62 Safari/537.36");
conn.ignoreContentType(true);
conn.execute();
String html=conn.get().html();
//System.out.println( html);
return html;
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
return "请求的页面不存在或链接错误 !!!";
}
发表评论
-
根据百度加密url, 获取真实url
2018-08-06 10:46 0public static void main(String[ ... -
fiddler 抓取 手机https 数据包 完美解决
2018-08-03 12:43 3054转:https://jingyan.baidu.com ... -
无忧代理IP
2018-07-30 16:19 0http://api.ip.data5u.com/dynami ... -
无所不能的四种请求方式(天下武功为怪不破)
2018-07-26 11:50 862package com.teamdev.jxbrowser.c ... -
post请求加json参数方式二
2018-07-24 14:02 2102package com.teamdev.jxbrowser.c ... -
post请求加json参数或xml参数
2018-07-20 18:21 1269import java.io.BufferedReader; ... -
jd编号
2017-11-02 17:59 549京东店铺:https://mall.jd.com/index- ... -
清除google缓存
2017-10-26 11:20 6911.进入 chrome://net-internals/#dn ... -
adb server is out of date. killing... 本地连接夜神模拟器失败、超时
2017-06-19 10:43 1518原因:1.模拟器器设置了代理;2.主要是模拟器和sdk 的ad ... -
fiddler抓取的https请求 数据乱码问题解决方案
2017-06-09 09:44 7288参考地址:http://blog.csdn.net/SomeO ... -
chromium.Browser 禁止加载图片,提升加载速度
2017-05-25 11:29 1207package com.teamdev.jxbrowser.c ... -
chrome 禁止加载网页图片 解决办法
2017-05-25 11:18 23541.在谷歌浏览器中输入:chrome://settings/c ... -
开源爬虫框架的优缺点?
2017-03-22 14:46 827开源爬虫框架各有什么优缺点? 作者:老夏 开发网络爬 ... -
反爬虫
2017-03-17 10:34 6961. 伪装user agent User agen ... -
爬虫被封禁原因
2017-03-17 09:37 1552爬虫被封禁常见原因 1. ... -
App数据抓取
2017-03-17 09:32 1111思路: 通过fiddler抓包 ... -
八爪鱼规则学习
2017-03-08 13:44 8561.八爪鱼采集器是任何一个需要从网页获取信息的人都必备的采集工 ... -
java模拟jquery请求动作(模拟点击、选择下拉)
2016-12-29 14:40 4088package com.teamdev.jxbrowser.c ... -
httpclient
2016-11-01 16:37 775package com.teamdev.jxbrowser.c ... -
jsoup + json 解析网页
2016-11-01 16:25 1303package com.teamdev.jxbrowser.c ...
相关推荐
数据库在这里是指用于存储亚马逊评论数据的系统,可能包括用户信息、商品信息、评论内容、评分等。在TP框架中,通常会使用MySQL或类似的SQL数据库,通过ORM(对象关系映射)技术,将数据库操作与业务逻辑解耦,使得...
盲信号分离算法的实现和应用 大家来看看,应该对大家有点用 不错的
这个名称包含了制造商ID、产品ID、序列号等信息,用于唯一标识USB设备。 3. **VISA读写操作**:使用VISA读函数(VI Read)和写函数(VI Write)来与USB设备进行数据交换。读函数用于从设备接收数据,写函数则将数据...
在Python编程语言中,"UnirColecciones_YMx"这个标题可能指的是合并或整合不同集合(collections)的操作。在Python中,集合可以是列表、元组、字典或者其他可迭代对象。描述虽然简洁,但我们可以从中推断,这个主题...
首先,"YMX-KCB-Remote_远控键盘_V1.0_原理图.sch" 是用PADS9.5软件绘制的电路原理图。PADS9.5是一款专业的电路设计软件,它允许设计者创建、编辑和模拟电路布局。原理图是设计的基础,它展示了电路中各个元器件的...
vx(ymx095616)接单,定制需求汽车can网络测试用例
vx(ymx095616),接定制需求单 CAN网络管理autosar测试用例模板
vx(ymx095616)接单,定制需求汽车can网络测试用例 CAN网关测试用例
vx(ymx095616)接单,定制需求汽车can网络测试用例 适合CAN网络UDS测试
vx(ymx095616)接单,定制需求汽车can网络测试用例 LIN通信测试用例模板
该连接器主要技术参数非等效采用美军标MIL-C-26482G. 供航空,航海及其他密封容器中电子设备与电源.电气间连接,导线与电缆间电气连接用。连接方式为螺纹连接锁紧机构,使用方便。插座采用玻璃烧结工艺,气密封性高,...
【此为下载链接,无需积分,自取即可】 potato下载土豆聊天最新版,地址会一直维护方便大家! 小技巧:依次点击app中的 我的-关于Potato-开发者中心-点击右上角选项可以下载不同操作系统的软件版本(打不开切换手机...
6. 旋转体体积:第六部分涉及求解由曲线2yx和线ymx m所围成图形绕ymx旋转形成的旋转体体积。这需要利用圆盘法或环法计算体积,将二维曲线绕轴旋转得到的三维形状的体积转化为积分形式。 7. 二阶导数与积分...
在这个网页设计中,HTML被用来创建章节标题、段落、链接和图像等元素,确保了信息的清晰呈现。 2. **CSS(Cascading Style Sheets)**:CSS用于控制网页的样式和布局。在"武侠小说网"中,CSS可能被用来定义字体、...
7. 一次函数12ymx的图象经过第一、三、四象限,意味着m>0。 8. 对于一次函数21yx,由于斜率为正,所以y随x的增大而增大。 9. 一次函数y=kx+b过(-1,4),且与y=-2x+3的y轴交点关于x轴对称,得b=2,k=6,所以...
在提供的压缩包文件"ymx_day03_xlistview_下拉刷新上拉加载"中,可能包含了示例代码、教程文档等内容,可以帮助开发者更好地理解和使用XListView。对于初学者来说,研究这些示例和文档将有助于快速掌握这一组件的...
4. 反比例函数:问题4中提到了形如ymx的函数,是反比例函数,反比例函数的图象通常位于第一和第三象限或第二和第四象限,取决于m的符号。 5. 平行四边形性质:问题6涉及平行四边形的周长和对角线性质,平行四边形的...
- YMX:代表整个工区十字排列的线数。理想情况下,这个数值应该大于NX和NY的乘积。 文章中还提到了该研究的作者陈冕,他是来自河南省煤田地质局物探测量队的工程师,研究方向是煤田地震勘探。 综上所述,TDNFK去噪...
在【YMX-源程序-C语言-验证过-无感矢量(全)】这个压缩包中,包含的文件可能是完整的C语言源代码,已经过验证,意味着这些代码已经在实际环境中进行了测试,确保了功能的正确性和稳定性。学习和研究这些源代码,...
亚马逊美国站测评师邮箱联系方式,含10000个专业测评师!