- 上一篇完成了百度MP3大类和小类的解析抽取,进一步需要进行歌曲资源抽取。例如抽取某个歌手的所有热歌,这里需要注意一点:url中如果包含有中文字符或者其他的一些特殊字符,例如空格,需要进行处理否则无法连接到网页(使用URLConnection)。比如http://mp3.baidu.com/singerlist/周杰伦.html 。这里使用了一下代码进行处理:
- try{
-
mOnlineURL=mOnlineURL.replaceAll("/","_").replace(":","_");
-
mOnlineURL=(URLEncoder.encode(mOnlineURL,"UTF-8").replace("___","://").replace("_","/"));
-
returnmatch(newURL(mOnlineURL),rex,otherColums);
-
}catch(MalformedURLExceptione){
try {
mOnlineURL = mOnlineURL.replaceAll("/", "_").replace(":", "_");
mOnlineURL = (URLEncoder.encode(mOnlineURL, "UTF-8").replace("___", "://").replace("_", "/"));
return match(new URL(mOnlineURL), rex, otherColums);
} catch (MalformedURLException e) {
经过以上url的处理,给出歌手的正则表达式:
- Matchermatcher=Pattern
- .compile(
-
"<ahref=/"#/"class=/"p/"onclick=/"returnplayAll//((//d*?)//)/">.*?</a>.*?target=/"_blank/">(.*?)</a>")
- .matcher(sb);
Matcher matcher = Pattern
.compile(
"<a href=/"#/" class=/"p/" onclick=/"return playAll//((//d*?)//)/">.*?</a>.*?target=/"_blank/">(.*?)</a>")
.matcher(sb);
得到如下的结果:
- 14辑-美人啊bonamana完整版
- 2sorry,sorryposter
- 3the2ndasiatourconcertalbumsupersh
- 4the2ndasiatourconcertalbumsupersh
- 5the2ndasiatourconcertalbumsupersh
- 6the2ndasiatourconcertalbumsupersh
- 7supershow1stasiatouralbum
- 84辑-美人啊bonamana完整版
- 9美人啊bonamana
1 4辑-美人啊bonamana完整版
2 sorry, sorry poster
3 the 2nd asia tour concert album super sh
4 the 2nd asia tour concert album super sh
5 the 2nd asia tour concert album super sh
6 the 2nd asia tour concert album super sh
7 super show 1st asia tour album
8 4辑-美人啊bonamana完整版
9 美人啊bonamana
这时只需两个参数(歌曲名和歌手)就可以通过百度给的api得到歌曲资源,见http://cloud21.javaeye.com/blog/611914中关于api的使用。
- <result>
-
<count>5</count>
- −
-
<url>
- −
-
<encode>
- http://zhangmenshiting.baidu.com/service/k2eZl25omWqWa5lnZpyZa2Jol5mZappuamtsZmtomWlfn6NndK6ap5WXcGyWZm5vYmplmW1ncGhqmGRlmJlsmpdkmGybnGpoaWqUZ5s2
-
</encode>
- −
-
<decode>
-
b5fc92b2e9f31fb316ded4c6999262b1.mp3?xcode=8a077182e81909f11cc5bf2e8ff3088a3f
-
</decode>
-
<type>8</type>
-
<lrcid>915420</lrcid>
-
</url>
- −
-
<url>
-
<encode>http://bbs.snrx.net/mp3/mZenlaOdsK2WpZg0.mp3</encode>
-
<decode>hetangyuese.mp3</decode>
-
<type>1</type>
-
<lrcid>915420</lrcid>
-
</url>
- −
-
<url>
- −
-
<encode>
- http://file.qlteacher.com/upload/cz2010/medias/1008/06/YmdlZ2pubmlhMg$$.mp3
-
</encode>
-
<decode>152358710.mp3</decode>
-
<type>1</type>
-
<lrcid>915420</lrcid>
-
</url>
- −
-
<url>
-
<encode>http://www.yxdlc.com/music/ajI$.mp3</encode>
-
<decode>9.mp3</decode>
-
<type>1</type>
-
<lrcid>915420</lrcid>
-
</url>
- −
-
<url>
-
<encode>http://lt.dd-99.com/mp3/lGhsbW5obWqTYzM$.mp3</encode>
-
<decode>c6999262b1.mp3</decode>
-
<type>1</type>
-
<lrcid>915420</lrcid>
-
</url>
-
</result>
<result>
<count>5</count>
−
<url>
−
<encode>
http://zhangmenshiting.baidu.com/service/k2eZl25omWqWa5lnZpyZa2Jol5mZappuamtsZmtomWlfn6NndK6ap5WXcGyWZm5vYmplmW1ncGhqmGRlmJlsmpdkmGybnGpoaWqUZ5s2
</encode>
−
<decode>
b5fc92b2e9f31fb316ded4c6999262b1.mp3?xcode=8a077182e81909f11cc5bf2e8ff3088a3f
</decode>
<type>8</type>
<lrcid>915420</lrcid>
</url>
−
<url>
<encode>http://bbs.snrx.net/mp3/mZenlaOdsK2WpZg0.mp3</encode>
<decode>hetangyuese.mp3</decode>
<type>1</type>
<lrcid>915420</lrcid>
</url>
−
<url>
−
<encode>
http://file.qlteacher.com/upload/cz2010/medias/1008/06/YmdlZ2pubmlhMg$$.mp3
</encode>
<decode>152358710.mp3</decode>
<type>1</type>
<lrcid>915420</lrcid>
</url>
−
<url>
<encode>http://www.yxdlc.com/music/ajI$.mp3</encode>
<decode>9.mp3</decode>
<type>1</type>
<lrcid>915420</lrcid>
</url>
−
<url>
<encode>http://lt.dd-99.com/mp3/lGhsbW5obWqTYzM$.mp3</encode>
<decode>c6999262b1.mp3</decode>
<type>1</type>
<lrcid>915420</lrcid>
</url>
</result>
得到这个xml档案后,使用以下程序进行解析并组合出一条url(每次只挑选第一个url作为歌曲资源,这里不是很合理,理想的挑选方法时ping出所有歌曲资源的响应速度并选择响应速度最快的歌曲资源作为最终资源)
- publicstaticStringparserToUrl(Stringname,Stringartist){
-
Stringurl="";
-
try{
- Stringorginurl=Parameter.MUSIC_PATH_REX.replace(
-
"("+MediaStore.OnLine.NAME+")",URLEncoder.encode(name,"UTF-8")).replace(
-
"("+MediaStore.OnLine.ARTIST+")",URLEncoder.encode(artist,"UTF-8"));
-
Log.v(OnlineParser.class.getName(),orginurl);
-
URLConnectionconnection=(newURL(orginurl)).openConnection();
-
connection.setConnectTimeout(10000);
-
connection.addRequestProperty("User-Agent","Chrome/5.0.37");
- connection.connect();
- InputStreamstr=connection.getInputStream();
-
- DocumentBuilderdocBuilder=DocumentBuilderFactory.newInstance()
- .newDocumentBuilder();
- Documentdoc=docBuilder.parse(str);
-
NodeListnodelist=doc.getElementsByTagName("url");
-
for(inti=0;i<nodelist.getLength();){
- NodeListchildren=nodelist.item(i).getChildNodes();
-
Stringencode=children.item(0).getTextContent();
-
Stringdecode=URLEncoder.encode(children.item(1).getTextContent(),"UTF-8");
-
url=encode.substring(0,encode.lastIndexOf("/")+1)+decode;
-
returnurl;
- }
-
}catch(MalformedURLExceptione){
- e.printStackTrace();
-
}catch(IOExceptione){
- e.printStackTrace();
-
}catch(ParserConfigurationExceptione){
- e.printStackTrace();
-
}catch(SAXExceptione){
- e.printStackTrace();
- }
-
returnurl;
- }
-
-
publicclassParameter{
-
publicstaticfinalStringMUSIC_PATH_REX="http://box.zhangmen.baidu.com/x?op=12&count=1&title=("+MediaStore.OnLine.NAME+")$$("+MediaStore.OnLine.ARTIST+")$$$$";
- }
public static String parserToUrl(String name, String artist) {
String url = "";
try {
String orginurl = Parameter.MUSIC_PATH_REX.replace(
"(" + MediaStore.OnLine.NAME + ")", URLEncoder.encode(name,"UTF-8")).replace(
"(" + MediaStore.OnLine.ARTIST + ")",URLEncoder.encode(artist,"UTF-8"));
Log.v(OnlineParser.class.getName(), orginurl);
URLConnection connection = (new URL(orginurl)).openConnection();
connection.setConnectTimeout(10000);
connection.addRequestProperty("User-Agent", "Chrome/5.0.37");
connection.connect();
InputStream str = connection.getInputStream();
DocumentBuilder docBuilder = DocumentBuilderFactory.newInstance()
.newDocumentBuilder();
Document doc = docBuilder.parse(str);
NodeList nodelist = doc.getElementsByTagName("url");
for (int i = 0; i < nodelist.getLength();) {
NodeList children = nodelist.item(i).getChildNodes();
String encode = children.item(0).getTextContent();
String decode =URLEncoder.encode(children.item(1).getTextContent(),"UTF-8");
url = encode.substring(0, encode.lastIndexOf("/")+1)+decode;
return url;
}
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
}
return url;
}
/////////
public class Parameter {
public static final String MUSIC_PATH_REX="http://box.zhangmen.baidu.com/x?op=12&count=1&title=("+MediaStore.OnLine.NAME+")$$("+MediaStore.OnLine.ARTIST+")$$$$";
}
- StreamStarter:android源码中的音乐播放器已经实现了在线播放的功能,该类就是StreamStarter。这里需要的注意的是当启动该activity时,要设置以下数据
- Uriuri=getIntent().getData();
Uri uri = getIntent().getData();
将歌曲的url资源植入次activity。
虽然实现了在线播放,可存在一个问题当离开播放界面后歌曲也自动停止播放,明明已经启动了后台的service......可能是未创建缓冲数据,在研究研究(待续)
分享到:
相关推荐
Java 中的 URLEncoder 和 URLDecoder 类 在 Java 中,URLEncoder 和 URLDecoder 是两个非常重要的类,它们用于处理 URL 编码和解码问题。在本文中,我们将深入探讨这两个类的使用方法、特点和应用场景。 一、...
pathBuilder.append(entry.getKey()).append("=").append(URLEncoder.encode(entry.getValue())).append("&"); } //http://192.168.12.100:8080/videoweb/video/manage.do?method=save&name=xxx&timelength=90& ...
URLDecoder 和 URLEncoder 的使用与区别 URLDecoder 和 URLEncoder 是 Java 中两个重要的类,它们用于完成普通字符串和 application/x-www-form-urlencoded MIME 字符串之间的相互转换。在 Web 开发中,字符串之间...
### URLEncoder与URLDecoder的应用 在Java编程语言中,`URLEncoder`与`URLDecoder`是处理URL编码和解码的两个重要工具类。它们主要应用于对字符串进行编码或解码,确保这些字符串能够安全地在网络上传输。尤其是在...
在Java Micro Edition (J2ME)环境中,开发者可能会遇到一个问题:标准Java API中的一些功能可能并未包含在其中,比如`URLEncoder`和`URLDecoder`类。这两个类在标准Java SE环境中用于对URL字符串进行编码和解码,以...
C++ 版本UrlEncoder编码解码工具:支持ANSIC和UTF8格式,是URLEncoderHTML 格式编码的实用工具类。详情参照文章:...
支持UTF8、16、32编解码。
writer.write("username=" + URLEncoder.encode(username, "UTF-8") + "&password=" + URLEncoder.encode(password, "UTF-8")); writer.flush(); writer.close(); outputStream.close(); int responseCode = ...
4. 兼容性:虽然J2ME的API可能与标准Java SE有所不同,但URLEncoder和URLDecoder的基本功能在大多数J2ME实现中都是可用的。然而,由于不同设备和平台的差异,测试和适配仍然是必要的。 5. 注意URL规范:在处理URL时...
Android 中解决中文文件名下载乱码问题 在 Android 应用程序中,下载服务器上的中文文件名文件时,可能会出现乱码问题。本文将介绍如何解决 Android 下载中文文件名问题,确保文件名正确地下载到 Android 设备上。 ...
urlencoder 在Node.js中实现Java Land URLEncoder安装$ npm install urlencoder 例子超级简单: var encoder = require ( 'urlencoder' ) ;encoder . encode ( '哈哈' ) ;执照麻省理工学院
在Android客户端中,我们可以使用URLEncoder.encode()方法对需要传输的中文参数进行编码。URLEncoder.encode()方法可以将字符串编码为application/x-www-form-urlencoded MIME格式,这样可以确保中文字符被正确地...
4. **Phone Number编码**:`PhoneNumber`类主要用于处理国际电话号码的编码和格式化,但这个功能在Android中可能用得不多,因为Android框架内已经包含了对电话号码处理的支持。 5. **Charset编码**:虽然Java标准库...
在Android客户端向服务器提交请求时,遇到中文乱码问题是一个常见的困扰。...在本例中,使用`URLEncoder`和`URLDecoder`进行编码和解码,有效地解决了Android客户端与Tomcat服务器之间的中文乱码问题。
在Java编程语言中,`URLDecoder`和`URLEncoder`是两个非常重要的工具类,主要用于处理URL中的中文字符和其他特殊字符。这两个类位于`java.net`包下,可以帮助开发者进行字符串编码和解码,确保数据在网络传输过程中...
在Android中,可以使用`URLEncoder.encode()`函数对参数进行编码。 3. XML布局文件: `activity_main.xml`和`activity_successful.xml`是Android的布局文件,定义了用户界面的结构。`activity_main.xml`可能是用于...
在本项目中,我们主要探讨的是如何在Android应用程序中集成百度翻译API,实现在线文本翻译功能。这是一个适合初学者和进阶开发者学习的实例,它展示了如何将第三方服务与Android应用相结合,以及如何处理网络请求和...
4. **处理网络响应**: 在Android中,网络请求通常在后台线程执行,以避免阻塞UI。你可以使用AsyncTask、Handler/Looper或Retrofit等库实现异步处理。当请求完成,通过回调或事件总线(如EventBus)将结果传递给主线...
`URLEncoder.encode()` 和 `URLDecoder.decode()` 是Java标准库中的两个关键方法,分别用于对URL参数进行编码和解码,以确保数据能够正确无误地在网络间传输。 **`URLEncoder.encode()`** 方法接受两个参数:需要...