可以实现和点点网音乐分享功能暂时还没做界面,先留下代码
package com;
/**
* 歌曲实体
* @author hanfei
*
*/
public class Song {
private String title;
private String songUrl;
private String flashUrl;
private String image;
public String getTitle() {
return title;
}
public void setTitle(String title) {
this.title = title;
}
public String getFlashUrl() {
return flashUrl;
}
public void setFlashUrl(String flashUrl) {
this.flashUrl = flashUrl;
}
public void setSongUrl(String songUrl) {
this.songUrl = songUrl;
}
public String getSongUrl() {
return songUrl;
}
public void setImage(String image) {
this.image = image;
}
public String getImage() {
return image;
}
}
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
/**
* 抓取工具类
* @author hanfei
*
*/
public class SongUtil {
/**
* 根据关键词搜索歌曲
*
* @param key
* 关键词
* @return
* @throws IOException
*/
public static List<Song> seachXiaMiSongs(String key) throws IOException {
Document doc = Jsoup.connect("http://www.xiami.com/ajax/search-index")
.data("query", "Java").data("key", key)
.userAgent("Mozilla")
.cookie("auth", "token")
.timeout(6000)
.get();
String content = doc.html();
content = content.substring(content.indexOf("<ul>") + 4, content
.indexOf("</ul>"));
doc = Jsoup.parse(content);
System.out.print(doc.html());
Elements links = doc.select("a[href]");
System.out.println("sssssssssss" + links.size());
List<Song> list = new ArrayList();
for (Element link : links) {
Song song = new Song();
String linkHref = link.attr("href");
String linkText = link.text();
song.setSongUrl(linkHref);
song.setTitle(linkText);
list.add(song);
System.out.println(linkHref + "---" + linkText);
}
return list;
}
/**
* 获取歌曲的封面图片地址
* @param song
* @return
* @throws IOException
*/
public static Song getXiamiSongDetail(Song song) throws IOException {
Document doc = Jsoup
.connect("http://www.xiami.com" + song.getSongUrl())
.data("query", "Java").userAgent("Mozilla")
.cookie("auth", "token")
.timeout(6000)
.get();
Element e = doc.getElementById("albumCover");
Element img = e.select("img").get(0);
String imagSrc = img.attr("src");
System.out.print(imagSrc);
song.setImage(imagSrc);
return song;
}
/**
* 获取歌曲的播放地址
* @param songUrl eg:/song/1769908356
* @return
*/
public static String getFlashPlayerUrl(String songUrl) {
String[] d = songUrl.split("/");
System.out.print(d.length);
return "http://www.xiami.com/widget/0_" + d[2] + "/singlePlayer.swf";
}
public static void main(String args[]) throws IOException {
/*
* Document doc =
* Jsoup.connect("http://www.xiami.com/ajax/search-index")
*
* .data("query", "Java").data("key", "爱")
*
* .userAgent("Mozilla")
*
* .cookie("auth", "token")
*
* .timeout(6000)
*
* .get(); String content = doc.html();
*
* content = content.substring(content.indexOf("<ul>") + 4,
* content.indexOf("</ul>"));
*
* doc = Jsoup.parse(content); System.out.print(doc.html()); Elements
* links = doc.select("a[href]"); System.out.println("sssssssssss" +
* links.size()); for (Element link : links) { String linkHref =
* link.attr("href"); String linkText = link.text();
* System.out.println(linkHref + "---" + linkText); }
*/
seachXiaMiSongs("爱");
// String s=getFlashPlayerUrl("/song/1769908356");
// System.out.print(s);
// http://www.xiami.com/widget/0_1769908356/singlePlayer.swf
}
}
分享到:
相关推荐
使用jsoup抓取一个页面,把...最近我试了一下用 JSOUP 抓取虾米音乐网站的虾米歌单中的歌曲歌词,把抓取的内容存储到mysql数据库中。用过都知道JSOUP 是支持css select (CSS选择器),后续可以改进为定时任务处理。
在这个Java实现网页抓取的项目中,我们将探讨如何利用Java编程语言来抓取网页内容。下面将详细介绍这个过程涉及的关键知识点。 1. **网络基础知识**:首先,理解HTTP协议是必要的,它是互联网上应用最广泛的一种...
在Java编程语言中,实现一个能抓取网站URL并提供分析功能的系统涉及到多个关键知识点。这个系统通常被称为网络爬虫或网页抓取工具,它能够自动遍历互联网上的页面,提取所需信息,并进行一定程度的分析。以下是一些...
这些工具通常能解析虾米音乐的URL,抓取音频流并将其转换为本地文件。然而,这种方式可能涉及版权问题,用户在使用时应确保遵循法律法规,尊重艺术家和版权所有者的权益。 接下来,我们关注一下LongKeyMusic这个...
在Android开发中,数据抓取是一项重要的技能,尤其在实现在线音乐搜索和播放功能时。本项目通过使用jsoup库,展示了如何从虾米音乐网站抓取相关歌曲数据,包括专辑图片、歌词以及歌曲的播放路径等关键信息。jsoup是...
通过以上步骤,我们成功地使用Java实现了对51job网站上Java职位需求量的抓取。这一过程中涉及到了网络请求的发送、HTTP协议的使用、正则表达式的匹配等多个方面的知识。掌握了这些技能后,不仅可以用于抓取51job网站...
java抓取微信公众号最近10篇文章,基于微信搜狗搜索实现。java源码.git 仓库 http://git.oschina.net/hcxy/WechatSpider
【虾米网音乐爬虫】是一种专门用于从虾米音乐网站上抓取音乐资源的程序。这个爬虫软件能够帮助用户实现单曲、整张专辑以及排行榜热门歌曲的批量下载功能,极大地提升了音乐爱好者获取数字音乐的便利性。在本文中,...
这个"java网页抓取demo"项目提供了实现这一功能的实例代码。项目中的jar包是实现网页抓取的关键依赖库,包括Apache Commons Logging和HTTP Client。 Apache Commons Logging是Java的日志记录工具,它为应用程序提供...
Java Web网站抓取其他网站内容是一项常见的技术需求,主要用于数据挖掘、信息聚合或者自动化测试等场景。本篇文章将深入探讨如何使用Java在Web环境中抓取其他网站的数据。 首先,我们需要了解的是网页抓取的基本...
本项目是一个基于Java实现的网站抓取程序,利用多线程技术和HTML解析技术,同时具备防屏蔽功能,以高效、稳定的方式从目标网站获取数据。 首先,我们要理解Java在编程中的地位。Java是一种跨平台的面向对象的编程...
Java网页抓取数据是互联网数据挖掘的一个重要领域,它允许开发者通过编程方式获取网页上的信息,从而实现自动化分析、监控或构建智能应用。在Java中,我们通常使用HTTP客户端库和HTML解析工具来实现这一目标。本文将...
java实现在线抓取网易云用户信息,支持在线抓取网易云用户信息,用户头像,昵称,电话等等;抓取网易云音乐热门歌手及其歌曲、专辑等信息保存到数据库;使用HttpClient和Jsoup进行模拟请求并对网页进行解析;使用...
使用java语言,实现从某目录下,抓取所有的文件,组成完整的文件路径。
Java抓取https网页数据,解决peer not authenticated异常。导入eclipse就能运行,带有所用的jar包(commons-httpclient-3.1.jar,commons-logging.jar,httpclient-4.2.5.jar,httpcore-4.2.4.jar)
在Java编程环境中,生成网页快照是一项常见的需求,主要用于数据抓取、网页存档或测试自动化等场景。这里我们关注的焦点是如何利用Java实现整张网页的快照功能。通过标题"java 实现整张网页快照"和描述,我们可以...
以上是Java网页抓取数据的基本知识框架,实践中还需要根据具体需求和目标网站的特点进行灵活调整。`WebpageCaptureDemo`可能是一个示例项目,包含了上述部分或全部技术的应用,通过阅读和学习这个示例,可以更好地...
4. 法律合规:尊重网站的robots.txt文件,遵循网站的抓取政策,避免侵犯版权或隐私。 最后,持续学习和跟踪最新的网络爬虫技术,如Selenium用于处理JavaScript渲染的页面,或者Scrapy这样的高级爬虫框架,能够帮助...
它通常会利用网络爬虫技术来抓取虾米音乐网站上的歌曲链接。Python的requests库可以用来发送HTTP请求,获取网页内容。BeautifulSoup或PyQuery等库则用于解析HTML页面,找到隐藏在网页代码中的MP3链接。这些链接可能...
在IT领域,网络数据抓取是一项重要的技能,特别是在大数据分析、搜索引擎优化和市场研究中。本文将详细讨论如何使用Java语言来抓取网页数据,包括两种主要方法:直接抓取原网页内容和处理网页中的JavaScript返回数据...