最新文章列表

jsoup使用选择器语法来查找元素

jsoup elements对象支持类似于Jquery的选择器语法,来实现非常强大和灵活的查找功能。 使用Element.select(String selector) 和 Elements.select(String selector) 方法实现: 这个select 方法在Document, Element,或Elements对象中都可以使用。且是上下文相关的,因此可实现指定元素的过滤,或者 ...
El_Nino 评论(0) 有2624人浏览 2013-03-05 00:39

Jsoup解析URL或网页内容开发指南

参考开发示例文档:http://www.open-open.com/jsoup/ JSOUP简介:jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。 jsoup的主要功能如下: 1.从一个URL,文件或字符串中解析HTML; 2.使用DOM或CSS选择器 ...
boonya 评论(0) 有2482人浏览 2013-03-04 10:51

jsoup抓取国际化的网站,显示英文,没设置头信息

Document document = Jsoup.connect(url).timeout(10000) .header("accept-language", "zh-cn") .get();
sassds 评论(0) 有1555人浏览 2013-02-26 14:20

jsoup网页内容抓取分析(2)

     针对上一篇写的内容很简单,只是给大家抛出了有一个工具可以用来分析网页的内容,做java搜索爬虫使用,实际的使用并没有怎么介绍,现在这 ...
cjp1989 评论(14) 有20348人浏览 2013-02-22 10:18

Jsoup网页内容抓取分析(1)

     在Java 程序在解析HTML 文档时,大家应该晓得htmlparser 这个开源项目,我也是使用过,不过这个程序到了2006年就没有更新了。由于我的基础较差,对于扩展自定义的标签还是不太懂,还是有超时问题困扰,偶然的机会中发现有jsoup,而且更新到了1.72版,使用起来还是很容易上手的。下面写些使用心得:         jsoup is a Java library for w ...
cjp1989 评论(17) 有7958人浏览 2013-02-19 09:00

获取文章中的图片

  瀑布流的功能开发完了,感觉还不错,地址是:http://www.656463.com/waterfall,其中也有一些知识点,和大家分享一下。既然是瀑布流,就会涉及到图片,在这里我是获取本站文章中的图片,所以本节就是用jsoup获取文章中的图片   jsoup简单介绍 jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API ...
hyneng 评论(0) 有1136人浏览 2013-01-30 09:48

使用Jsoup抓取百度的android apk

http://as.baidu.com/a/asgame?cid=102&s=1   此链接为百度安卓应用的页面   分析页面源码,写出适当的程序来获取想要的内容。(百度的页面写的非常规则,喜欢看这种页面)   把内容入库,再通过编写down方法。。。。后面的就不说了。   主要是对Jsoup的学习。   下面是已经试验过的例子: 准确率90%+     需要导入 ...
simple1024 评论(4) 有4560人浏览 2013-01-06 13:40

httpclient主之,jsoup辅之

这段代码是上次不记得在哪里看到的,然后自动动手写了一下,没办法注明出处了,如有雷同还请谅解,嘿嘿 public static void main(String[] args) throws ClientProtocolException, IOException { String getUrl = "http://www.baidu.com/"; Http ...
whmwg 评论(0) 有1242人浏览 2012-12-20 08:40

jsoup能够用来解析xml吗?

体验完jsoup之后想到xml格式和html差不多,jsoup能够用来解析xml格式的数据吗?试一试就知道…… 我们来解析这个xml.xml文件: <?xml version="1.0" encoding="UTF-8"?> <books> <book id="12"> <name& ...
whmwg 评论(2) 有3873人浏览 2012-12-20 08:39

使用jsoup解析百度“今日热门搜索排行榜”

百度“今日热门搜索排行榜” javabean实体类,这个就不说了: public class HotSearch implements Serializable { private String rank;//排名 private String keyword;//关键词 private String detailLink;//关键词链接地址 private String t ...
whmwg 评论(0) 有941人浏览 2012-12-19 16:44

记录一下jsoup解析html(4)

接下来看一下“可操作HTML元素、属性、文本”的功能 反正html就是一些元素、属性、文本的集合,有时候我们解析某个html也许想要修改其中的属性和文本,当然你要改变元素标签名也行,就是先删除某个元素然后再添加,嘿嘿,百度百科如是说 首先看那些简单的小例子说明一下: doc.select("a").attr("rel", "nofollow&qu ...
whmwg 评论(0) 有892人浏览 2012-12-19 15:36

记录一下jsoup解析html(3)

就是对Jsoup官网文档Selector类中选择器语法的中文说明,摘自百度百科,感谢javayuan920的贡献,直接上图:
whmwg 评论(0) 有597人浏览 2012-12-19 15:02

记录一下jsoup解析html(2)

首先看一下org.jsoup.nodes所有类的继承关系,其中比较常用的就是Element和Document两个类 现在来看一下“使用DOM或CSS选择器来查找、取出数据”的功能 (1)DOM方式 使用DOM即直接操作html dom对象来查找、取出数据,和javascript中操作html dom类似,只不过jsoup有它自己的方法,看官方文档可以看到,截取Element类中的部分方法: ...
whmwg 评论(0) 有1293人浏览 2012-12-19 14:51

记录一下jsoup解析html(1)

首先说一下html解析,在百度搜索“html解析”,其中开源中国给出的html解析方法数不胜数,这里截图一张 这么多解析方法到底采用哪一个呢,废话,当然是jsoup了,搜索引擎遛了一大圈,发现对jsoup的评价还挺高的,这就是“记录一下jsoup解析html”的由来了,嘿嘿 jsoup主要功能如下,摘自百度百科: 1. 从一个URL、文件或字符串中解析HTML;    2. 使用DOM或CSS ...
whmwg 评论(1) 有1774人浏览 2012-12-19 11:44

iText实现直接把URL网页内容生成PDF

    目录: 概述 软件要求 实现过程   详见:http://www.micmiu.com/opensource/expdoc/itext-url-pdf/       ---
sjsky 评论(0) 有3402人浏览 2012-11-28 10:44

jsoup方式解决跨域

客户端: <html> <head> <meta http-equiv="content-Type" content="text/html;charset=UTF-8"> <title>跨域</title> <script type="text/javascript" src ...
lionlx 评论(1) 有6132人浏览 2012-11-23 09:22

基于jsoup的网页爬虫

前阵子做了个网页抓取工具,可扩展性较差,今天发现google 的一个开源网页抓取工具jsoup,写了个测试,与大家分享下 package com.gump.net.html.test; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.js ...
ganliang13 评论(0) 有2544人浏览 2012-11-05 23:43

针对商品信息抽取-雏形程序-java语言

第一次在iteye上写博客,这个程序是根据公司的需求+个人的想法=针对商品信息抽取的第一个版本 源代码地址:https://github.com/txf7337/dabao-spider 基本配置  jdbc数据库  //mysql测试过  文件下载,文字识别的线程数以及线程爬取的间隔  任务周期  文件保存目录 代理的配置  <host>主机名  <port>端 ...
txf_7337 评论(0) 有17796人浏览 2012-10-16 15:01

jsoup解析html

jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据 jsoup的主要功能如下:从一个URL,文件或字符串中解析HTML; 使用DOM或CSS选择器来查找、取出数据; 可操作HTML元素、属性、文本; jsoup解析Jsoup提供一系列的静态解析方法生成 ...
chenlong_1988 评论(0) 有4119人浏览 2012-09-16 17:39

JSOUP教程:JSOUP选择器语法说明

jsoup 是一款基于Java 的HTML解析器,可直接解析某个URL地址或HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。jsoup的强大在于它对文档元素的检索,Select方法将返回一个Elements集合,并提供一组方法来抽取和处理结果,要掌握Jsoup首先要熟悉它的选择器语法。1、Selector选择器基本语法 t ...
chenlong_1988 评论(0) 有31595人浏览 2012-09-16 17:37

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics