视频地址挖掘抓取

pan_这名还行

浏览: 44039 次
性别:
来自: 郑州

最近访客更多访客>>

linkenhougong

Wally1985

zhangding0808

xxy380

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

java

数据挖掘

年前做的视频地址挖掘工具，不知道现在关键标签还对不对，放上来算是个温习吧
代码又臭又长，现在看了很汗颜...，本人菜鸟，轻拍砖

	//得到视频标题
    public String getVideoTitle(String beginTitleStr,int beginTextNum,String endTitleStr){
		int beginTitleNum =  videoStr.indexOf(beginTitleStr,beginTextNum)+beginTitleStr.length();
		int endTitleNum = videoStr.indexOf(endTitleStr,beginTitleNum);
		String videoTitle = new ToolsSubString().mySubString(videoStr,beginTitleNum,endTitleNum);		
		return videoTitle;
    }

	//得到视频地址ID
    public String getVideoId(String beginIdStr,int beginTextNum,String endIdStr){
		int beginIdNum = videoStr.indexOf(beginIdStr,beginTextNum)+beginIdStr.length();
		int endIdNum = videoStr.indexOf(endIdStr,beginIdNum);
		String videoId = new ToolsSubString().mySubString(videoStr,beginIdNum,endIdNum);
		return videoId;
    }
    
    //抓取土豆网视频信息的方法
    public void catchTudouVideo(int neadCatchNum,String beginSearchVideoNumStr){
    	//抓取内容定位
		String endSearchVideoNumStr = "</em>";
		String beginTextStr = "<a class=\"inner\" target=\"new";
		String beginIdStr = "href=\"http://www.tudou.com/programs/view/";
		String endIdStr = "/\"";
		String beginTitleStr = "title=\"";		
		String endTitleStr = "\"";
		int beginTextNum = 0;
		
		//得到搜索到视频个数，循环得到视频信息		
		int searchVideoNum = getVideoNum(neadCatchNum,beginSearchVideoNumStr, endSearchVideoNumStr);
		for(int i=0;i<searchVideoNum;i++){
			//内容定位
			beginTextNum = videoStr.indexOf(beginTextStr,beginTextNum)+beginTextStr.length();
			
			//得到视频信息
			String videoTitle = getVideoTitle(beginTitleStr, beginTextNum, endTitleStr);
			String videoId = getVideoId(beginIdStr, beginTextNum, endIdStr);					
			String videoUrl = "http://www.tudou.com/v/"+videoId+"/v.swf";

			//创建video对象保存视频信息，并添加到video集合，为存入数据库做准备
			VideoEntity video = new VideoEntity(videoTitle,"土豆网",videoUrl);
			videoList.add(video);
		}
    }

分享到：

TableLayout常用细节

2011-03-08 12:18
浏览 3309
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

视频地址挖掘抓取

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

视频地址挖掘抓取

评论

发表评论

相关推荐

获得文本文件编码格式

最近访客更多访客>>