Python下载网易公开课脚本 - bosshida - ITeye博客

`

bosshida

浏览: 220778 次
性别:
来自: 广州

最近访客更多访客>>

PowerNTT

cigogo

TangoHuang

屌丝码农

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

microwindlab：你不应该加 --shell 参数，因为 --shell run ...
由mongodb的维护引发的 grep,awk,sed 与管道的应用
Jerryhome：楼主超牛，值得好好学习
windows系统下的进程监测程序--实现过程记录
xb_91674981：学习一下，模式在程序设计是很重要
《大话设计模式》一书的所有代码和UML类图
Jason(aijun)：正在学习，非常感谢分享。
《大话设计模式》一书的所有代码和UML类图
wurb_travelsky：正在看这本书，C#的代码倒也不影响阅读
《大话设计模式》一书的所有代码和UML类图

Python下载网易公开课脚本

博客分类：

python

阅读更多

import urllib2,re

basePath = r'e:\\open163\\'
fileFormat = r'.mp4'
pageUrl = r"http://v.163.com/special/Khan/european.html"
limitPat = r'<table class="m-clist" id="list2" style="display:none">.*?</table>'
needPat = r'<tr class="u-(even|odd)">\s*<td class="u-ctitle">\s*(.*?)\s*<a.*?>(.*?)</a>.*?<a class="refbtn" href="(.*?)".*?>.*?</tr>'

print 'get page:', pageUrl
content = urllib2.urlopen(pageUrl).read()
mat = re.search(limitPat, content, re.S)
limitContent = mat.group()
for each in re.findall(needPat, limitContent, re.S):
	filename = basePath+each[1]+each[2]+fileFormat
	print 'creatint file:', filename
	curMp4 = open(filename, 'wb')
	print 'fetching url:', each[3],'......'
	mp4 = urllib2.urlopen(each[3]).read()
	curMp4.write(mp4)
	curMp4.close()
	print 'file done!'

也不复杂，修改python源码里的pageUrl为你想抓取的那一页的所有视频的URL，默认会保存在E:\\open163目录下。

分享到：

android的【qq通讯录】导出短信，在iphone ... | python的一些记录

2013-05-16 09:35
浏览 1642
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

抓取网易公开课并下载: 自动抓取网易公开课的下载链接，并改名下载保存到本地目录 Download links automatically crawl Netease open class, and renamed the download is saved to a local directory

基于Python的Linux网易公开课简易客户端设计源码: 首先，项目中的5个Python脚本是整个客户端的核心，它们通过执行特定任务，如解析课程列表、下载课程资料等，来实现客户端的主要功能。Python作为一种高级编程语言，以其简洁的语法和强大的功能库著称，非常适合进行...

Python 控制 PDU 实现 AC 测试脚本（源码）: Python 控制 PDU 实现 AC 测试脚本（源码）！ Python 控制 PDU 实现 AC 测试脚本（源码）！ Python 控制 PDU 实现 AC 测试脚本（源码）！ Python 控制 PDU 实现 AC 测试脚本（源码）！ Python 控制 PDU 实现 AC ...

基于python的monkey自动化脚本: 【Python的Monkey自动化脚本】 Monkey测试是一种模拟用户随机操作的应用程序稳定性测试方法，它通过发送大量的随机事件（如点击、滑动、按键等）到Android应用，来检测应用程序在极端或不可预见的用户交互下的行为...

Python+App代码脚本基础全套Python+App代码脚本基础全套Python+App代码脚本基础全套Python+App: Python+App代码脚本基础全套Python+App代码脚本基础全套Python+App代码脚本基础全套Python+App代码脚本基础全套Python+App代码脚本基础全套Python+App代码脚本基础全套Python+App代码脚本基础全套Python+App代码脚本...

python游戏项目脚本大全.zip: python游戏项目脚本大全 python游戏项目脚本大全 python游戏项目脚本大全 python游戏项目脚本大全 python游戏项目脚本大全 python游戏项目脚本大全 python游戏项目脚本大全 python游戏项目脚本大全 python游戏项目...

自动下载喜马拉雅的Python脚本。: 标题中的“自动下载喜马拉雅的Python脚本”是指利用Python编程语言编写的一段程序，它的主要功能是自动化地从喜马拉雅平台下载音频资源。喜马拉雅是中国一个知名的在线音频分享平台，提供了丰富的有声书、音乐、电台...

Python监控DB服务器信息脚本: Python 监控 DB 服务器信息脚本本文档将详细讲解 Python 监控 DB 服务器信息脚本的实现原理和技术要点。本脚本基于 Python 2.* 版本，使用 dns.resolver 包来监控 DB 服务器的信息，并通过 smtp 发送警告信息或...

Python实现王者荣耀AI脚本，训练模型: 在本文中，我们将深入探讨如何使用Python来实现一个王者荣耀AI脚本，并训练自己的模型。Python作为一门强大且灵活的编程语言，广泛应用于数据科学、机器学习以及游戏开发领域。通过结合人工智能技术，我们可以构建出...

批量下载快手视频的脚本 Python+操作教程.zip: 本教程将详述如何使用Python脚本来批量下载快手平台的视频。这个教程包含了一个名为"Kwai_download_script-master"的Python脚本项目，以及一份"使用教程.txt"，为用户提供清晰的操作步骤。首先，我们需要理解...

Python哨兵影像自动下载脚本: （1）可支持离线产品下载。下载这些“离线”产品，将触发它们从LTA检索。过一段时间，所请求的产品将可以通过原始URL下载。（2）可以断点续传，点运行后可以不用管了（3）可提供矢量范围检索格式（4）需要安装...

下载Android源代码的Python脚本: 下载Android源代码的Python脚本，原文的链接： http://blog.csdn.net/a_flying_bird/article/details/25505019 直接从网页上拷贝Python代码的时候，每行前面会多4个空格，导致脚本没法执行。为此，还需要编一个小...

在.Net6中调用IronPython实现动态执行脚本: 在.NET 6中调用IronPython来实现动态执行脚本是一项强大的功能，它允许程序员在运行时编写和执行Python代码，极大地增强了应用的灵活性。IronPython是一个开源的Python实现，它能够无缝集成到.NET环境中，使得.NET...

100个python脚本合集，适合学习，生活日常等等: 实例68 Python批量新建文件夹并保存日志信息实例52 Pandas提取指定数据并保存在原Excel工作簿中实例61 Python制作图形用户界面(GUI)让操作可视化实例69 Python保留格式复制多个excel工作表到汇总表并生成目录 ...

基于python实现的大麦抢票脚本: Python 3.6+ Chromedriver.exe Chrome 浏览器安装好后需将chromedriver.exe放置于Chrome浏览器目录下 pip install selenium 参数设置在config.json中输入相应配置信息，具体说明如下： sess: 场次优先级列表，如本...

Python正方教务系统抢课脚本: Python正方教务系统抢课脚本仅用于学习和参考使用

30个Python入门脚本下载: 在"30个Python入门脚本下载"中，你可以找到一系列的Python源码，涵盖了Python编程的基础概念，有助于快速掌握这门语言。 1. **文件操作**： - `c26_Read and write using pickle.py`：Pickle模块是Python中的序列...

大麦网抢票脚本【Python脚本】: Python脚本，使用Selenium 模拟浏览器操作。在使用 Chrome 浏览器，用户可以使用鼠标滑动、按键点击以及键盘输入，作为信号输入设备向浏览器传达指令，浏览器收到指令后执行渲染。这里提到的 Selenium WebDriver ...

基于python的王者荣耀脚本: 不过，王者荣耀目前并没有公开API，因此大多数脚本需要依赖于屏幕抓取和图像识别。 5. **异常处理与优化**：在编写脚本时，需要考虑到可能出现的各种异常情况，如游戏界面改变、网络延迟等。通过加入异常处理机制，...

Python-何用Python代替Bash脚本指南: 然而，随着Python的普及和功能增强，越来越多的开发者开始考虑使用Python来替代Bash脚本。Python提供了更强大的数据处理能力、更好的可读性和维护性，以及丰富的第三方库支持。下面，我们将深入探讨为何以及如何用...

Global site tag (gtag.js) - Google Analytics