import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.net.MalformedURLException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
/**
* 获取土豆网视频
* @author sunlightcs
* 2011-3-31
* http://hi.juziku.com/sunlightcs/
*/
public class TudouTest {
public static void main(String[] args) throws Exception{
Document doc = getURLContent();
String content = doc.html();
int beginLocal = content.indexOf("<script>document.domain");
int endLocal = content.indexOf("</script>");
content = content.substring(beginLocal, endLocal);
String flashUrl = getScriptVarByName("iid_code", content);
flashUrl = "http://www.tudou.com/v/" + flashUrl + "/v.swf";
System.out.println("视频地址:"+flashUrl);
String pic = getScriptVarByName("thumbnail", content);
System.out.println("视频缩略图:"+pic);
String time = getScriptVarByName("time", content);
System.out.println("视频时长:"+time);
}
/**
* 获取script某个变量的值
* @param name 变量名称
* @return 返回获取的值
*/
private static String getScriptVarByName(String name, String content){
String script = content;
int begin = script.indexOf(name);
script = script.substring(begin+name.length()+2);
int end = script.indexOf(",");
script = script.substring(0,end);
String result=script.replaceAll("'", "");
result = result.trim();
return result;
}
/**
* 获取土豆网页的内容
*/
private static Document getURLContent() throws MalformedURLException, IOException, UnsupportedEncodingException {
Document doc = Jsoup.connect("http://www.tudou.com/programs/view/pVploWOtCQM/")
.data("query", "Java")
.userAgent("Mozilla")
.cookie("auth", "token")
.timeout(3000)
.post();
return doc;
}
}
需使用jsoup-1.5.2.jar
分享到:
相关推荐
### 通过Java获取土豆视频的关键知识点 #### 一、项目背景与目的 在当前互联网环境中,视频内容成为了信息传播的重要载体之一。对于开发者而言,能够有效地抓取和处理这些视频内容变得尤为重要。本示例主要介绍了...
* 获取土豆网视频 */ public class TudouTest { public static void main(String[] args) throws Exception { Document doc = getURLContent(); String content = doc.html(); // 提取视频地址 int begin...
- **音视频采集与渲染**:通过Java API与硬件交互,获取和显示音视频数据。 - **带宽管理**:根据网络状况动态调整音视频流的质量,优化用户体验。 - **加密与安全**:使用SSL/TLS等加密技术保护数据传输的安全,...
在本项目中,我们主要关注的是使用Java编程语言构建一个豆瓣电影信息爬虫。这个爬虫的主要任务是抓取电影的详细信息以及相关的用户评论,然后利用jieba分词库对抓取到的数据进行分词处理,最后将处理后的数据写入...
在这个例子中,我们首先通过`Workbook.getWorkbook()`方法打开一个Excel文件,然后获取第一个Sheet,接着遍历所有行和列,打印出每个单元格的内容。 **写入Excel文件** 写入Excel文件则涉及到创建新的`Workbook`、`...
- **高性能**:通过JIT编译器优化代码执行速度。 - **分布式**:支持网络通信和分布式计算。 - **动态性**:运行时可加载和卸载类库。 - **多线程**:支持并发执行。 - **安全性**:具有安全沙箱机制,防止恶意...
4. **API接口**:前后端通过RESTful API进行通信,定义了资源的获取、创建、更新和删除等操作。这些接口使用HTTP协议,状态码和JSON格式的数据交换,保证了良好的可扩展性和跨平台性。 5. **安全控制**:系统会集成...
通过发送GET请求到图片的URL,我们可以获取到图片的二进制数据,然后将其保存为本地文件。以下是一个简单的例子: ```python import requests url = 'https://example.com/image.jpg' response = requests.get...
8. **反射**:通过Class对象获取类的信息,动态创建对象,修改私有属性和方法等。 9. **泛型**:泛型类、泛型方法、通配符的使用,理解类型擦除。 10. **枚举与注解**:枚举的特性,自定义注解及其处理器。 11. *...
2. 使用`ThumbnailUtils`类:这个类主要用于创建视频的缩略图,但需要注意的是,它并不直接从视频文件中提取,而是通过解码视频的一小部分生成缩略图。例如: ```java MediaExtractor extractor = new ...
同时,由于它是开源项目,社区的活跃度和贡献也是其持续发展的重要保障,用户可以通过参与社区获取技术支持和解决问题。 总的来说,UrlRewriter Java v2.0 RC1是Java Web开发者的一个强大工具,它可以帮助构建更...
这里我们探讨的是“JAVA第一个案例ELTS开发”,这是一个针对初学者设计的项目,旨在帮助他们理解Java的基本语法和编程逻辑,并且通过实践来加深对Java语言的理解。ELTS(可能是错误的缩写,因为没有明确的IT领域术语...
【标题解析】 "图片浏览小程序(java+applet)-project" 这个标题表明这是一个使用Java编程...通过学习和分析这个项目,开发者不仅能掌握Java Applet的基本应用,还能提升图像处理、GUI编程和项目组织管理等方面的能力。
本项目“JAVA文件压缩与解压缩实践_project”旨在通过实际的代码示例来帮助开发者掌握这一技能。Java提供了多种库来实现这一功能,其中最常用的是Java的内置库`java.util.zip`。 1. **Java内置库`java.util.zip`**...
Java可以通过JDBC连接数据库,执行复杂SQL语句获取数据,再由报表工具如JasperReports或iText生成可视化报告。 七、性能优化 为了提升系统性能,可以进行数据库索引优化、缓存策略设置、数据库连接池管理等。例如...
该压缩包文件“基于PHP的解析无广告土豆播放地址php版源码.zip”包含的是一个使用PHP编程语言编写的程序,其主要目的是解析无广告的土豆视频播放链接。土豆网是一家提供在线视频服务的网站,但其视频播放时可能会带...
这个模块的核心在于提供对敏感数据进行加密和解密的能力,以防止数据在传输或存储过程中被非法获取。常见的加密算法如AES(高级加密标准)、RSA(公钥加密技术)和SHA(安全哈希算法)等可能被用到。在实现时,可以...
Java中的字符串操作包括拼接、获取长度、转换大小写、替换字符等功能。 ```java public class Li422 { public static void main(String[] args) { String w = "nanjingshifan"; String m = "zhongbeixueyuan"; ...
在Java编程中,给定的代码是一个简单的学生成绩管理系统,用于计算和显示学生的总评成绩。这个系统包含以下几个核心知识点: 1. **面向对象编程**:整个程序基于面向对象的设计思想,定义了两个类:`MainStudent` ...
Java网络爬虫,也被称为“蜘蛛”,是一种自动化程序,用于抓取互联网上的... 在进行网络爬虫开发时,必须遵守网站的robots.txt协议,尊重网站的版权,避免对目标服务器造成过大负担,必要时需获取网站所有者的许可。