`

采集ymx商品信息

阅读更多
public static void main(String[] args) {
String keyword = "鼠标";
keyword=UrlEncoded.encodeString(keyword);
System.out.println(keyword);

System.out.println(System.currentTimeMillis());
    String urlStr = "https://www.amazon.cn/s/ref=sr_pg_1?rh=i%3Aaps%2Ck%3A%E9%BC%A0%E6%A0%87&page=1&keywords=%E9%BC%A0%E6%A0%87&ie=UTF8&qid=1535523044";
    try {
    String html =getHttpHeaders(urlStr);
    Document doc = Jsoup.parse(html);
    Elements els = doc.select("div.s-item-container");
    String goodName ="";
    String goodUrl ="";
    String goodPrice ="";
    for (Element e : els) {
    goodName= e.getElementsByAttributeValue("class", "a-link-normal s-access-detail-page  s-color-twister-title-link a-text-normal").attr("title");
    goodUrl= e.getElementsByAttributeValue("class", "a-link-normal s-access-detail-page  s-color-twister-title-link a-text-normal").attr("href");
    goodPrice= e.getElementsByAttributeValue("class", "a-size-base a-color-price s-price a-text-bold").text();
    if(goodPrice.contains("¥")){
    goodPrice=goodPrice.replace("¥", "");
    }
    if(goodName.length()>0){
    System.out.println("goodName="+goodName);
    System.out.println("goodUrl="+goodUrl);
    System.out.println("goodPrice="+goodPrice);
    }
   
    }

    } catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
       
    } 
     
public static void trustEveryone() {
try {
HttpsURLConnection
.setDefaultHostnameVerifier(new HostnameVerifier() {
public boolean verify(String hostname,
SSLSession session) {
return true;
}
});
SSLContext context = SSLContext.getInstance("TLS");
context.init(null, new X509TrustManager[] { new X509TrustManager() {
public void checkClientTrusted(X509Certificate[] chain,
String authType) throws CertificateException {
}

public void checkServerTrusted(X509Certificate[] chain,
String authType) throws CertificateException {
}

public X509Certificate[] getAcceptedIssuers() {
return new X509Certificate[0];
}
} }, new SecureRandom());
HttpsURLConnection.setDefaultSSLSocketFactory(context
.getSocketFactory());
} catch (Exception e) {
// e.printStackTrace();
}
}

public static String getHttpHeaders(String  urlStr) {
try {
URL url = new URL(urlStr);
trustEveryone();
Connection conn = HttpConnection.connect(url);
conn.timeout(10000);
// 默认是 GET方式
conn.header("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8");
conn.header("Accept-Encoding", "gzip, deflate, br");
conn.header("Accept-Language", "zh-CN,zh;q=0.9");
conn.header("Cache-Control", "max-age=0");
conn.header("Connection", "keep-alive");
conn.header("Cookie", "session-id=459-7685866-4114631; ubid-acbcn=462-7605214-6740260; x-wl-uid=1/8WbnRRWqUmuHEwnk0vv/5QUwLPz7ExJ8sDDXwii/B7q7Q7du4lfbGND+N96grUw6aQQqTgRWjU=; session-token=\"61BROo0R3lWTferrCdSW7uhrLZsEr2nenTtEcaRYw5gdaQSPQTdVCZcBY4Z0m5aG3dYjFa9ig743cQQN1d/OFW215SCO+iS21Y8D1Gtf5HEPvdlzUxTlXuDJS1+MHRB7+DYx9NNXQagHg+lb6Rsz3ZIuTyd+HfSEmuoJMTuVUnxNbFcW/5CoeB+bWzkX9UmOa7StU6t/s+ak5O6uulcWZ+MTPx7lsF0KJfc+9CY3d6g/esAYdddvWA==\"; session-id-time=2082729601l; csm-hit=tb:XHNG7XF4GSF6CRHXT26C+sa-Q9YXGCPZY9WTMWCPRN2W-5JG052ATG7KJSS01Y89P|"+System.currentTimeMillis()+"&adb:adblk_yes");
conn.header("Host", "www.amazon.cn");
conn.header("Upgrade-Insecure-Requests", "1");
conn.header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.62 Safari/537.36");
conn.ignoreContentType(true);
conn.execute();
String html=conn.get().html();
//System.out.println( html);
return html;
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}

return "请求的页面不存在或链接错误 !!!";
}
分享到:
评论

相关推荐

    亚马逊评论,新接口,TP架构,带数据库,ymx.vip.tar.gz

    数据库在这里是指用于存储亚马逊评论数据的系统,可能包括用户信息、商品信息、评论内容、评分等。在TP框架中,通常会使用MySQL或类似的SQL数据库,通过ORM(对象关系映射)技术,将数据库操作与业务逻辑解耦,使得...

    ymx.rar_分离算法_盲信号分离

    盲信号分离算法的实现和应用 大家来看看,应该对大家有点用 不错的

    USB通信的Labview

    这个名称包含了制造商ID、产品ID、序列号等信息,用于唯一标识USB设备。 3. **VISA读写操作**:使用VISA读函数(VI Read)和写函数(VI Write)来与USB设备进行数据交换。读函数用于从设备接收数据,写函数则将数据...

    UnirColecciones_YMx

    在Python编程语言中,"UnirColecciones_YMx"这个标题可能指的是合并或整合不同集合(collections)的操作。在Python中,集合可以是列表、元组、字典或者其他可迭代对象。描述虽然简洁,但我们可以从中推断,这个主题...

    18.5-400KW变频器远控键盘板PADS9.5原理图PROTEL99SE PCB图、BOM、制板工艺说明文件.zip

    首先,"YMX-KCB-Remote_远控键盘_V1.0_原理图.sch" 是用PADS9.5软件绘制的电路原理图。PADS9.5是一款专业的电路设计软件,它允许设计者创建、编辑和模拟电路布局。原理图是设计的基础,它展示了电路中各个元器件的...

    CAN通信测试用例模板.xlsx

    vx(ymx095616)接单,定制需求汽车can网络测试用例

    CAN网络管理autosar测试用例模板.xlsx

    vx(ymx095616),接定制需求单 CAN网络管理autosar测试用例模板

    CAN网关测试用例模板.xlsx

    vx(ymx095616)接单,定制需求汽车can网络测试用例 CAN网关测试用例

    CAN UDS测试用例模板.xlsx

    vx(ymx095616)接单,定制需求汽车can网络测试用例 适合CAN网络UDS测试

    LIN通信测试用例模板

    vx(ymx095616)接单,定制需求汽车can网络测试用例 LIN通信测试用例模板

    MX系列气密封圆形连接器

    该连接器主要技术参数非等效采用美军标MIL-C-26482G. 供航空,航海及其他密封容器中电子设备与电源.电气间连接,导线与电缆间电气连接用。连接方式为螺纹连接锁紧机构,使用方便。插座采用玻璃烧结工艺,气密封性高,...

    potato土豆聊天最新版下载(跟随官网更新,地址网盘自取)

    【此为下载链接,无需积分,自取即可】 potato下载土豆聊天最新版,地址会一直维护方便大家! 小技巧:依次点击app中的 我的-关于Potato-开发者中心-点击右上角选项可以下载不同操作系统的软件版本(打不开切换手机...

    第三周训练题1

    6. 旋转体体积:第六部分涉及求解由曲线2yx和线ymx m所围成图形绕ymx旋转形成的旋转体体积。这需要利用圆盘法或环法计算体积,将二维曲线绕轴旋转得到的三维形状的体积转化为积分形式。 7. 二阶导数与积分...

    武侠小说网

    在这个网页设计中,HTML被用来创建章节标题、段落、链接和图像等元素,确保了信息的清晰呈现。 2. **CSS(Cascading Style Sheets)**:CSS用于控制网页的样式和布局。在"武侠小说网"中,CSS可能被用来定义字体、...

    2013届中考数学 知识点训练题30 一次函数

    7. 一次函数12ymx的图象经过第一、三、四象限,意味着m>0。 8. 对于一次函数21yx,由于斜率为正,所以y随x的增大而增大。 9. 一次函数y=kx+b过(-1,4),且与y=-2x+3的y轴交点关于x轴对称,得b=2,k=6,所以...

    xlistview_下拉刷新上拉加载

    在提供的压缩包文件"ymx_day03_xlistview_下拉刷新上拉加载"中,可能包含了示例代码、教程文档等内容,可以帮助开发者更好地理解和使用XListView。对于初学者来说,研究这些示例和文档将有助于快速掌握这一组件的...

    福建省泉州市实验中学2018-2019学年八年级下学期期中数学试题.pdf

    4. 反比例函数:问题4中提到了形如ymx的函数,是反比例函数,反比例函数的图象通常位于第一和第三象限或第二和第四象限,取决于m的符号。 5. 平行四边形性质:问题6涉及平行四边形的周长和对角线性质,平行四边形的...

    TDNFK去噪在煤田地震数据处理中的应用.pdf

    - YMX:代表整个工区十字排列的线数。理想情况下,这个数值应该大于NX和NY的乘积。 文章中还提到了该研究的作者陈冕,他是来自河南省煤田地质局物探测量队的工程师,研究方向是煤田地震勘探。 综上所述,TDNFK去噪...

    汇川MD380变频器源代码

    在【YMX-源程序-C语言-验证过-无感矢量(全)】这个压缩包中,包含的文件可能是完整的C语言源代码,已经过验证,意味着这些代码已经在实际环境中进行了测试,确保了功能的正确性和稳定性。学习和研究这些源代码,...

    亚马逊美国站测评师邮箱

    亚马逊美国站测评师邮箱联系方式,含10000个专业测评师!

Global site tag (gtag.js) - Google Analytics