`
xin73678
  • 浏览: 34103 次
  • 性别: Icon_minigender_1
  • 来自: 江苏
社区版块
存档分类
最新评论

[Java]通过Java获取土豆视频

    博客分类:
  • Java
阅读更多
import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.net.MalformedURLException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;


/**
* 获取土豆网视频
* @author sunlightcs
* 2011-3-31
* http://hi.juziku.com/sunlightcs/
*/
public class TudouTest {

	public static void main(String[] args) throws Exception{		
		Document doc = getURLContent();
		String content = doc.html();
		int beginLocal = content.indexOf("<script>document.domain");
		int endLocal = content.indexOf("</script>");
		content = content.substring(beginLocal, endLocal);
		
		String flashUrl = getScriptVarByName("iid_code", content);
		flashUrl = "http://www.tudou.com/v/" + flashUrl + "/v.swf";
		System.out.println("视频地址:"+flashUrl);
		
		
		String pic = getScriptVarByName("thumbnail", content);
		System.out.println("视频缩略图:"+pic);
		
		
		String time = getScriptVarByName("time", content);
		System.out.println("视频时长:"+time);

		
	}
	
	/**
	 * 获取script某个变量的值
	 * @param name  变量名称
	 * @return   返回获取的值 
	 */
	private static String getScriptVarByName(String name, String content){
		String script = content;
		
		int begin = script.indexOf(name);
		
		script = script.substring(begin+name.length()+2);
		
		int end = script.indexOf(",");
		
		script = script.substring(0,end);
		
		String result=script.replaceAll("'", "");
		result = result.trim();
		
		return result;
	}
	
	
	/**
	 * 获取土豆网页的内容
	 */
	private static Document getURLContent() throws MalformedURLException, IOException, UnsupportedEncodingException {
		Document doc = Jsoup.connect("http://www.tudou.com/programs/view/pVploWOtCQM/")
		  .data("query", "Java")
		  .userAgent("Mozilla")
		  .cookie("auth", "token")
		  .timeout(3000)
		  .post();
		return doc;
	}

}

 需使用jsoup-1.5.2.jar

分享到:
评论

相关推荐

    通过java获取土豆视频

    ### 通过Java获取土豆视频的关键知识点 #### 一、项目背景与目的 在当前互联网环境中,视频内容成为了信息传播的重要载体之一。对于开发者而言,能够有效地抓取和处理这些视频内容变得尤为重要。本示例主要介绍了...

    java获取视频

    * 获取土豆网视频 */ public class TudouTest { public static void main(String[] args) throws Exception { Document doc = getURLContent(); String content = doc.html(); // 提取视频地址 int begin...

    基于Java的视频会议系统(程序)

    - **音视频采集与渲染**:通过Java API与硬件交互,获取和显示音视频数据。 - **带宽管理**:根据网络状况动态调整音视频流的质量,优化用户体验。 - **加密与安全**:使用SSL/TLS等加密技术保护数据传输的安全,...

    JAVA豆瓣爬虫.rar

    在本项目中,我们主要关注的是使用Java编程语言构建一个豆瓣电影信息爬虫。这个爬虫的主要任务是抓取电影的详细信息以及相关的用户评论,然后利用jieba分词库对抓取到的数据进行分词处理,最后将处理后的数据写入...

    Java利用JXL读写Excel

    在这个例子中,我们首先通过`Workbook.getWorkbook()`方法打开一个Excel文件,然后获取第一个Sheet,接着遍历所有行和列,打印出每个单元格的内容。 **写入Excel文件** 写入Excel文件则涉及到创建新的`Workbook`、`...

    传智播客Java_SE基础毕向东老师全程笔记

    - **高性能**:通过JIT编译器优化代码执行速度。 - **分布式**:支持网络通信和分布式计算。 - **动态性**:运行时可加载和卸载类库。 - **多线程**:支持并发执行。 - **安全性**:具有安全沙箱机制,防止恶意...

    简易java开源订销管理系统-javainfo-project

    4. **API接口**:前后端通过RESTful API进行通信,定义了资源的获取、创建、更新和删除等操作。这些接口使用HTTP协议,状态码和JSON格式的数据交换,保证了良好的可扩展性和跨平台性。 5. **安全控制**:系统会集成...

    远程获取图片并和生成的二维码拼接

    通过发送GET请求到图片的URL,我们可以获取到图片的二进制数据,然后将其保存为本地文件。以下是一个简单的例子: ```python import requests url = 'https://example.com/image.jpg' response = requests.get...

    JAVA中级考试 题库 50道经典计算题编程

    8. **反射**:通过Class对象获取类的信息,动态创建对象,修改私有属性和方法等。 9. **泛型**:泛型类、泛型方法、通配符的使用,理解类型擦除。 10. **枚举与注解**:枚举的特性,自定义注解及其处理器。 11. *...

    实现获取视频的缩略图(ThumbnailUtils),并且播放_Android.rar

    2. 使用`ThumbnailUtils`类:这个类主要用于创建视频的缩略图,但需要注意的是,它并不直接从视频文件中提取,而是通过解码视频的一小部分生成缩略图。例如: ```java MediaExtractor extractor = new ...

    UrlRewriter Java v2.0 RC1-urlrewriterjava-project

    同时,由于它是开源项目,社区的活跃度和贡献也是其持续发展的重要保障,用户可以通过参与社区获取技术支持和解决问题。 总的来说,UrlRewriter Java v2.0 RC1是Java Web开发者的一个强大工具,它可以帮助构建更...

    JAVA第一个案例ELTS开发

    这里我们探讨的是“JAVA第一个案例ELTS开发”,这是一个针对初学者设计的项目,旨在帮助他们理解Java的基本语法和编程逻辑,并且通过实践来加深对Java语言的理解。ELTS(可能是错误的缩写,因为没有明确的IT领域术语...

    图片浏览小程序(java+applet)-project

    【标题解析】 "图片浏览小程序(java+applet)-project" 这个标题表明这是一个使用Java编程...通过学习和分析这个项目,开发者不仅能掌握Java Applet的基本应用,还能提升图像处理、GUI编程和项目组织管理等方面的能力。

    JAVA文件压缩与解压缩实践-project

    本项目“JAVA文件压缩与解压缩实践_project”旨在通过实际的代码示例来帮助开发者掌握这一技能。Java提供了多种库来实现这一功能,其中最常用的是Java的内置库`java.util.zip`。 1. **Java内置库`java.util.zip`**...

    图书管理系统(java+mssql)-project

    Java可以通过JDBC连接数据库,执行复杂SQL语句获取数据,再由报表工具如JasperReports或iText生成可视化报告。 七、性能优化 为了提升系统性能,可以进行数据库索引优化、缓存策略设置、数据库连接池管理等。例如...

    基于PHP的解析无广告土豆播放地址php版源码.zip

    该压缩包文件“基于PHP的解析无广告土豆播放地址php版源码.zip”包含的是一个使用PHP编程语言编写的程序,其主要目的是解析无广告的土豆视频播放链接。土豆网是一家提供在线视频服务的网站,但其视频播放时可能会带...

    基于Java的两个通用安全模块的设计与实现-project

    这个模块的核心在于提供对敏感数据进行加密和解密的能力,以防止数据在传输或存储过程中被非法获取。常见的加密算法如AES(高级加密标准)、RSA(公钥加密技术)和SHA(安全哈希算法)等可能被用到。在实现时,可以...

    JAVA环境配置+考试题目+Android studio配置与入门教程.docx

    Java中的字符串操作包括拼接、获取长度、转换大小写、替换字符等功能。 ```java public class Li422 { public static void main(String[] args) { String w = "nanjingshifan"; String m = "zhongbeixueyuan"; ...

    计算学生总评(含源码)java

    在Java编程中,给定的代码是一个简单的学生成绩管理系统,用于计算和显示学生的总评成绩。这个系统包含以下几个核心知识点: 1. **面向对象编程**:整个程序基于面向对象的设计思想,定义了两个类:`MainStudent` ...

    Java网络爬虫(蜘蛛)源码-zhizhu-project

    Java网络爬虫,也被称为“蜘蛛”,是一种自动化程序,用于抓取互联网上的... 在进行网络爬虫开发时,必须遵守网站的robots.txt协议,尊重网站的版权,避免对目标服务器造成过大负担,必要时需获取网站所有者的许可。

Global site tag (gtag.js) - Google Analytics