http://jodd.org/doc/jerry/index.html
http://www.oschina.net/code/snippet_12_7758
public class AllMusicNewReleases {
|
03 |
public static void main(String[] args) throws IOException {
|
05 |
// download the page super-efficiently
|
06 |
File file = new File(SystemUtil.getTempDir(), "allmusic.html" );
|
07 |
NetUtil.downloadFile( "http://allmusic.com" , file);
|
09 |
// create Jerry, i.e. document context
|
10 |
Jerry doc = Jerry.jerry(FileUtil.readString(file));
|
13 |
doc.$( "div#new_releases div.list_item" ).each( new JerryFunction() {
|
14 |
public boolean onNode(Jerry $ this , int index) {
|
15 |
System.out.println( "-----" );
|
16 |
System.out.println($ this .$( "div.album_title" ).text());
|
17 |
System.out.println($ this .$( "div.album_artist" ).text().trim());
|
分享到:
相关推荐
jodd-lagarto HTML/XML解析器,包含Jerry和CSSelly,让你像jQuery一样筛选HTML节点 jodd-lagarto-web Lagarto的Web扩展,包含Decora、HtmlStapler等等 jodd-proxetta 帮你实现动态代理,获取函数参数名 jodd-dboom ...
madvoc 一个MVC框架jodd-petite 一个依赖注入容器jodd-lagarto HTML/XML解析器,包含Jerry和CSSelly,让你像jQuery一样筛选HTML节点jodd-lagarto-web Lagarto的Web扩展,包含Decora、HtmlStapler等等jodd-proxetta ...
乔德·拉加托(Jodd Lagarto) :glowing_star: Java HTML解析器套件。 :house_with_garden: 网站: :red_heart_selector: 对于开发人员,由开发人员执行。 :lizard: 概述Lagarto Suite是用Java编写HTML / XML解析器...
4. **Jodd-Lagarto**: 这是一个HTML解析器,基于LagartoDOMBuilder,可以解析HTML文档并生成DOM树。开发者可以使用它来解析网页内容,提取信息,或者进行DOM操作。 5. **Jodd-Jerry**: 基于Jodd-Lagarto,Jodd-...
解析内容: 爬虫对获取的HTML进行解析,提取有用的信息。常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到...