`
sunlightcs
  • 浏览: 75400 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论

通过JAVA获取优酷、土豆、酷6、6间房等视频

阅读更多
通过JAVA获取优酷、土豆、酷6、6间房、56视频,现在很多社会网站都有这个功能,用户输入优酷、土豆、酷6、6间房、56视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长。
比如:新浪微博就有这个功能,当用户输入优酷、土豆、酷6、6间房、56视频网址后,就能获取到相应的视频地址及视频的缩略图。

代码如下:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
* 视频工具类
* @author sunlightcs
* 2011-4-6
* http://hi.juziku.com/sunlightcs/
*/
public class VideoUtil {
	
	/**
	 * 获取视频信息
	 * @param url
	 * @return
	 */
	public static Video getVideoInfo(String url){
		Video video = new Video();
		
		if(url.indexOf("v.youku.com")!=-1){
			try {
				video = getYouKuVideo(url);
			} catch (Exception e) {
				video = null;
			}
		}else if(url.indexOf("tudou.com")!=-1){
			try {
				video = getTudouVideo(url);
			} catch (Exception e) {
				video = null;
			}
		}else if(url.indexOf("v.ku6.com")!=-1){
			try {
				video = getKu6Video(url);
			} catch (Exception e) {
				video = null;
			}
		}else if(url.indexOf("6.cn")!=-1){
			try {
				video = get6Video(url);
			} catch (Exception e) {
				video = null;
			}
		}else if(url.indexOf("56.com")!=-1){
			try {
				video = get56Video(url);
			} catch (Exception e) {
				video = null;
			}
		}
		
		return video;
	}
	
	
	/**
	 * 获取优酷视频
	 * @param url  视频URL
	 */
	public static Video getYouKuVideo(String url) throws Exception{
		Document doc = getURLContent(url);
		
		/**
		 *获取视频缩略图 
		 */
		String pic = getElementAttrById(doc, "s_sina", "href");
		int local = pic.indexOf("pic=");
		pic = pic.substring(local+4);
		
		/**
		 * 获取视频地址
		 */		
		String flash = getElementAttrById(doc, "link2", "value");
		
		/**
		 * 获取视频时间
		 */	
		String time = getElementAttrById(doc, "download", "href");
		String []arrays = time.split("\\|");
		time = arrays[4];
		
		Video video = new Video();
		video.setPic(pic);
		video.setFlash(flash);
		video.setTime(time);
		
		return video;
	}
	
	
	/**
	 * 获取土豆视频
	 * @param url  视频URL
	 */
	public static Video getTudouVideo(String url) throws Exception{
		Document doc = getURLContent(url);
		String content = doc.html();
		int beginLocal = content.indexOf("<script>document.domain");
		int endLocal = content.indexOf("</script>");
		content = content.substring(beginLocal, endLocal);
		
		/**
		 * 获取视频地址
		 */	
		String flash = getScriptVarByName("iid_code", content);
		flash = "http://www.tudou.com/v/" + flash + "/v.swf";
		
		/**
		 *获取视频缩略图 
		 */
		String pic = getScriptVarByName("thumbnail", content);
		
		/**
		 * 获取视频时间
		 */	
		String time = getScriptVarByName("time", content);

		Video video = new Video();
		video.setPic(pic);
		video.setFlash(flash);
		video.setTime(time);
		
		return video;
	}
	
	
	/**
	 * 获取酷6视频
	 * @param url  视频URL
	 */
	public static Video getKu6Video(String url) throws Exception{
		Document doc = getURLContent(url);
		
		/**
		 * 获取视频地址
		 */
		Element flashEt = doc.getElementById("outSideSwfCode");
		String flash = flashEt.attr("value");
		
		/**
		 * 获取视频缩略图
		 */
		Element picEt = doc.getElementById("plVideosList");
		String time = null;
		String pic = null;
		if(picEt!=null){
			Elements pics = picEt.getElementsByTag("img");
			pic = pics.get(0).attr("src");
			
			/**
			 * 获取视频时长
			 */
			Element timeEt = picEt.select("span.review>cite").first(); 
			time = timeEt.text();
		}else{
			pic = doc.getElementsByClass("s_pic").first().text();
		}
		
		Video video = new Video();
		video.setPic(pic);
		video.setFlash(flash);
		video.setTime(time);
		
		return video;
		
	}
	
	
	/**
	 * 获取6间房视频
	 * @param url  视频URL
	 */
	public static Video get6Video(String url) throws Exception{
		Document doc = getURLContent(url);
		
		/**
		 * 获取视频缩略图
		 */
		Element picEt = doc.getElementsByClass("summary").first();
		String pic = picEt.getElementsByTag("img").first().attr("src");
		
		/**
		 * 获取视频时长
		 */
		String time = getVideoTime(doc, url, "watchUserVideo");
		if(time==null){
			time = getVideoTime(doc, url, "watchRelVideo");
		}
		
		/**
		 * 获取视频地址
		 */
		Element flashEt = doc.getElementById("video-share-code");
		doc = Jsoup.parse(flashEt.attr("value"));  
		String flash = doc.select("embed").attr("src");
		
		Video video = new Video();
		video.setPic(pic);
		video.setFlash(flash);
		video.setTime(time);
		
		return video;
	}
	
	
	/**
	 * 获取56视频
	 * @param url  视频URL
	 */
	public static Video get56Video(String url) throws Exception{
		Document doc = getURLContent(url);
		String content = doc.html();
		
		/**
		 * 获取视频缩略图
		 */
		int begin = content.indexOf("\"img\":\"");
		content = content.substring(begin+7, begin+200);
		int end = content.indexOf("\"};");
		String pic = content.substring(0, end).trim();
		pic = pic.replaceAll("\\\\", "");		
		
		/**
		 * 获取视频地址
		 */
		String flash = "http://player.56.com" + url.substring(url.lastIndexOf("/"), url.lastIndexOf(".html")) + ".swf";
		
		Video video = new Video();
		video.setPic(pic);
		video.setFlash(flash);
		
		return video;
	}

	/**
	 * 获取6间房视频时长    
	 */
	private static String getVideoTime(Document doc, String url, String id) {
		String time = null;
		
		Element timeEt = doc.getElementById(id); 
		Elements links = timeEt.select("dt > a");
		
		
		for (Element link : links) {
		  String linkHref = link.attr("href");
		  if(linkHref.equalsIgnoreCase(url)){
			  time = link.parent().getElementsByTag("em").first().text();
			  break;
		  }
		}
		return time;
	}
	
			
	/**
	 * 获取script某个变量的值
	 * @param name  变量名称
	 * @return   返回获取的值 
	 */
	private static String getScriptVarByName(String name, String content){
		String script = content;
		
		int begin = script.indexOf(name);
		
		script = script.substring(begin+name.length()+2);
		
		int end = script.indexOf(",");
		
		script = script.substring(0,end);
		
		String result=script.replaceAll("'", "");
		result = result.trim();
		
		return result;
	}
	
	
	/**
	 * 根据HTML的ID键及属于名,获取属于值
	 * @param id  HTML的ID键
	 * @param attrName  属于名
	 * @return  返回属性值
	 */
	private static String getElementAttrById(Document doc, String id, String attrName)throws Exception{
		Element et = doc.getElementById(id);
		String attrValue = et.attr(attrName);
		
		return attrValue;
	}
	
	
	
	/**
	 * 获取网页的内容
	 */
	private static Document getURLContent(String url) throws Exception{
		Document doc = Jsoup.connect(url)
		  .data("query", "Java")
		  .userAgent("Mozilla")
		  .cookie("auth", "token")
		  .timeout(6000)
		  .post();
		return doc;
	}
	
	
	public static void main(String[] args) {
		//String url = "http://v.youku.com/v_show/id_XMjU0MjI2NzY0.html";
		//String url = "http://www.tudou.com/programs/view/pVploWOtCQM/";
		//String url = "http://v.ku6.com/special/show_4024167/9t7p64bisV2A31Hz.html";
		//String url = "http://v.ku6.com/show/BpP5LeyVwvikbT1F.html";
		//String url = "http://6.cn/watch/14757577.html";
		String url = "http://www.56.com/u64/v_NTkzMDEzMTc.html";
		Video video = getVideoInfo(url);
		System.out.println("视频缩略图:"+video.getPic());
		System.out.println("视频地址:"+video.getFlash());
		System.out.println("视频时长:"+video.getTime());
	}
}


全文请访问:人人编程
分享到:
评论
13 楼 yhh 2013-05-25  
有没有什么能够解析视频内容的啊,要想知道视频的具体内容,通过页面源码,总是很被动,格式的改变,以及其他很多的小网站,总不能一一去看吧,而且还有动态加载的。
12 楼 sunlightcs 2011-04-15  
dingoo 写道
这个是不是要分析网页结构的啊,如果这些网站改版之后是不是也要修改一下代码?

是的,网页结构改变了,代码也要跟着改了。
11 楼 dingoo 2011-04-14  
这个是不是要分析网页结构的啊,如果这些网站改版之后是不是也要修改一下代码?
10 楼 java_user 2011-04-14  
这样只能把那个播放器下载过来
9 楼 sunlightcs 2011-04-14  
mercyblitz 写道
估计要投新手帖子了!



哈哈  我写的帖子都是新手帖了。
8 楼 sunlightcs 2011-04-14  
handby123 写道
求创新 
个人觉得思想的交流比整一堆代码有意思



嗯,是了。   主要是要实现这个功能,不写代码也不行了。
7 楼 handby123 2011-04-14  
求创新 
个人觉得思想的交流比整一堆代码有意思
6 楼 mercyblitz 2011-04-13  
估计要投新手帖子了!
5 楼 genggeng 2011-04-13  
一看标题就觉得会用Jsoup
4 楼 rox 2011-04-13  
谢谢,自己也需要这方面的功能。
3 楼 sunlightcs 2011-04-13  
jkvast 写道
随便看了下,挑了下youku的,
楼主只不过是到优酷页面取
<input type="text" id="link2" value="http://player.youku.com/player.php/Type/Folder/Fid/5738387/Ob/1/Pt/0/sid/XMjU4NDcwMzM2/v.swf" />

id为link2的这个input的value

但这个地址只不过是优酷的一个flash播放器而已

所以 视频是无法下载的

其他视频网站没看过

呵呵 所以 不知道楼主 这段代码有什么意义

如果可以 也最多只是个转帖视频的工具

所以楼主的标题含糊不清,我还以为是下载呢。。。 呵呵

最后说下,最新版的迅雷7已经支持优酷的视频文件真实地址嗅探了,改天瞧瞧


这个工具是做视频分享的时候用的,像t.sina.com.cn
2 楼 jkvast 2011-04-13  
随便看了下,挑了下youku的,
楼主只不过是到优酷页面取
<input type="text" id="link2" value="http://player.youku.com/player.php/Type/Folder/Fid/5738387/Ob/1/Pt/0/sid/XMjU4NDcwMzM2/v.swf" />

id为link2的这个input的value

但这个地址只不过是优酷的一个flash播放器而已

所以 视频是无法下载的

其他视频网站没看过

呵呵 所以 不知道楼主 这段代码有什么意义

如果可以 也最多只是个转帖视频的工具

所以楼主的标题含糊不清,我还以为是下载呢。。。 呵呵

最后说下,最新版的迅雷7已经支持优酷的视频文件真实地址嗅探了,改天瞧瞧
1 楼 sunlightcs 2011-04-13  
单个获取视频的类,在我博客里有了,呵呵

相关推荐

    JAVA获取视频缩略图

    在Java编程环境中,获取视频缩略图是一项常见的需求,尤其在多媒体应用或者视频分享平台中。这个过程涉及到多媒体处理和图像操作的知识。本文将详细解释如何在Java中实现这一功能,以及相关的技术点。 首先,Java...

    Java 获取视频时长、格式、大小需要的jar

    在Java编程环境中,有时我们需要处理多媒体文件,特别是视频文件,比如获取视频的时长、格式以及文件大小等信息。为了实现这些功能,开发者通常会依赖第三方库。在本例中,我们关注的是名为"jave-1.0.2"的库,它是一...

    Java获取文件分辨率,大小等基本信息Demo

    在Java编程语言中,获取文件的基本信息,如分辨率、大小等,是常见的文件操作任务,尤其是在处理多媒体文件,如视频时。本示例Demo提供了两种方法来实现这一目标,使用了两个不同的库:xuggle-xuggler-5.4.jar 和 ...

    java ipmi,vxipmi 通过java获取服务器信息,温度、风扇、内存等

    6. **异常处理**:在获取和处理服务器信息时,需要考虑网络问题、认证失败、传感器无响应等情况。Java程序应该包含适当的错误处理代码,以捕获和处理可能出现的异常。 7. **实时监控**:为了持续监控服务器状态,...

    java使用Xuggler获得视频时长,分辨率,高宽,码率等信息

    总的来说,Xuggler为Java开发者提供了一个强大且灵活的工具,用于处理和分析音视频文件,包括获取视频的时长、分辨率、高宽比和码率等关键信息。通过熟练掌握Xuggler的使用,你可以轻松地构建出能够处理多媒体文件的...

    Java实现简单在线播放器——支持优酷和土豆

    Java实现简单在线播放器——支持优酷和土豆 。原理很简单。纠结的是要知道土豆跟优酷是的视频播放需要哪些参数。更多请参看http://blog.csdn.net/cannel_2020/article/details/7953257 或 者...

    Java利用FFmpeg解析视频,截图,获取视频播放时间

    3. **获取视频播放时间**:视频的总播放时间可以通过解析ffprobe输出的元数据获取。在JSON格式的输出中,找到"time_base"和"duration"字段,将它们转换为秒,就可以得到视频的总时长。 以下是一个简单的Java示例,...

    java获取文件创建时间

    在Java 7中引入了新的文件I/O API,即`java.nio.file`包,这使得开发人员能够更方便地操作文件系统,并且可以通过这些API获取文件的元数据,包括创建时间。 ##### 示例代码 以下是一个使用Java 7及以上版本来获取...

    java 获取客户端ip mac地址

    在Java Web开发中,有时我们需要获取客户端的IP地址甚至是MAC地址,以便进行安全验证、用户行为追踪等操作。本文将详细介绍如何通过Java来实现这一功能。 #### 一、获取客户端 IP 地址 获取客户端的IP地址通常在...

    javaCV将socket获取的视频流推到流媒体(RTMP)服务器jar

    JavaCV 是一个强大的Java库,它为Java程序员提供了与...以上就是使用JavaCV将通过Socket获取的视频流推送到RTMP服务器涉及的核心技术点。在实际开发中,开发者需要理解这些技术,并结合具体需求进行相应的编程实现。

    java获取电子称重量数据

    综上所述,Java获取电子称重量数据涉及了Java串口通信、通信协议的理解与实现、异常处理和性能优化等多个方面的知识。通过正确的技术选型和严谨的编程实践,我们可以构建可靠的系统来无缝地集成电子秤设备,实现称重...

    Java获取系统CPU、内存、硬盘等系统信息

    在Java编程中,获取系统资源的信息是常见...总的来说,Java虽然不能直接提供获取所有系统资源的通用方法,但通过标准库和其他辅助工具,我们可以获取到CPU、内存和硬盘等关键信息,为系统监控和性能优化提供数据支持。

    JAVA通过url获取网页内容

    "JAVA 通过 URL 获取网页内容" JAVA 通过 URL 获取网页内容是 Java 编程语言中的一种常见操作。通过使用 URL 类和 URLConnection 类,Java 程序可以连接到远程服务器,获取指定 URL 的内容。本文将详细介绍如何使用...

    java中通过request获取IP以及MAC地址.java

    获取用户请求IP地址 根据IP地址获取mac地址

    java获取民族代码 名称

    java获取民族 提供了根据名称代码获得民族对象 mzu.xml存储了56个民族的信息

    java获取当前windows进程pid

    功能:获取java进程pid 进程可根据该pid调用exec自杀 注意事项:不能改变PidTool.java所在的包,否则需要重行生成dll。 编译命令中 "-PidTool.dll" 改为 "-FePidTool.dll",我整漏了! 使用方法: 1.javac PidTool...

    通过Java反射机制获取JavaBean对象

    1.通过Java反射机制获取JavaBean对象。 2.通过JavaBean全路径字符串获取JavaBean对象。 3.获取JavaBean注解信息

    java通过ip获取mac地址的工具

    java中通过ip获取远程客户端的mac地址,支持跨平台

    Java获取视频时间JAR包

    "Java获取视频时间JAR包"正是为了解决这个问题而设计的,它提供了一个Java库,允许开发者通过简单的API调用来获取视频文件的时长。下面将详细介绍这个JAR包的用途、工作原理以及如何在Java项目中使用它。 首先,让...

    kettle通过java脚本获取数据库的值

    kettle通过java脚本获取数据库的值..................................................................

Global site tag (gtag.js) - Google Analytics