`

jodd jerry 解析html

 
阅读更多
http://jodd.org/doc/jerry/index.html
 
http://www.oschina.net/code/snippet_12_7758
 
public class AllMusicNewReleases {
02   
03     public static void main(String[] args) throws IOException {
04   
05         // download the page super-efficiently
06         File file = new File(SystemUtil.getTempDir(), "allmusic.html");
07         NetUtil.downloadFile("http://allmusic.com", file);
08   
09         // create Jerry, i.e. document context
10         Jerry doc = Jerry.jerry(FileUtil.readString(file));
11   
12         // parse
13         doc.$("div#new_releases div.list_item").each(new JerryFunction() {
14             public boolean onNode(Jerry $thisint index) {
15                 System.out.println("-----");
16                 System.out.println($this.$("div.album_title").text());
17                 System.out.println($this.$("div.album_artist").text().trim());
18                 return true;
19             }
20         });
21     }
22 }
分享到:
评论

相关推荐

    Jodd工具集-其他

    jodd-lagarto HTML/XML解析器,包含Jerry和CSSelly,让你像jQuery一样筛选HTML节点 jodd-lagarto-web Lagarto的Web扩展,包含Decora、HtmlStapler等等 jodd-proxetta 帮你实现动态代理,获取函数参数名 jodd-dboom ...

    Java常用工具包Jodd.zip

    madvoc 一个MVC框架jodd-petite 一个依赖注入容器jodd-lagarto HTML/XML解析器,包含Jerry和CSSelly,让你像jQuery一样筛选HTML节点jodd-lagarto-web Lagarto的Web扩展,包含Decora、HtmlStapler等等jodd-proxetta ...

    jodd-lagarto:Java HTML解析器套件

    乔德·拉加托(Jodd Lagarto) :glowing_star: Java HTML解析器套件。 :house_with_garden: 网站: :red_heart_selector: 对于开发人员,由开发人员执行。 :lizard: 概述Lagarto Suite是用Java编写HTML / XML解析器...

    Java常用工具包 Jodd.7z

    4. **Jodd-Lagarto**: 这是一个HTML解析器,基于LagartoDOMBuilder,可以解析HTML文档并生成DOM树。开发者可以使用它来解析网页内容,提取信息,或者进行DOM操作。 5. **Jodd-Jerry**: 基于Jodd-Lagarto,Jodd-...

    Jodd&Jerry写的一个简单爬虫示例程序.zip

    解析内容: 爬虫对获取的HTML进行解析,提取有用的信息。常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到...

Global site tag (gtag.js) - Google Analytics