最近迷上了看《那时汉朝》,在网上找手机电子书,无奈,塔读的收费,网页连载的倒是免费,但是不适合手机看,太麻烦,倒是可以吧连载的复制下来,整合成txt文档,放在手机里,看着方便,但是就拿《那时汉朝》来说,连载的就600多节,这要是复制粘贴肯定累死人了,为了方便,下面的这个程序变产生了.
程序功能:把连载的小说自动从网上下载到本地,生成txt文档
使用之前需要安装Python的环境,而且要分析写连载网站是否具有规则,没有规则是无法使用此程序的,呵呵,没那么智能
# -*- coding: UTF-8 -*- import httplib import re import string conn = httplib.HTTPConnection("网址") conn.request("GET","/连载章节目录网页地址") r1 = conn.getresponse() p = re.compile(r"<a.*?</A>") aList = p.findall(r1.read()) f = open("nashihanchao/那时汉朝.txt", "w") articalList = [] for e in aList: href = re.compile(r"read_.*?html") hrefList = href.findall(e) if hrefList: title = re.compile(r"第\d*?节") titleList = title.findall(e) titleNumRegx = re.compile("\d*") titleNum = titleNumRegx.findall(titleList[0]) articalList.append({'name': string.atoi(titleNum[2]),'href':hrefList[0]}) articalList.sort(key=lambda obj:obj.get('name'), reverse=False) for e in articalList: print "loading",e.get('name'),e.get('href') conn.request("GET",e.get('href')) r = conn.getresponse() contentRegx = re.compile(r"<TD CLASS=ART>[\w\W]*?</TD>") contentList = contentRegx.findall(r.read()) content = contentList[0] content = content.replace("<TD CLASS=ART>","") content = content.replace("</TD>","") content = content.replace("<br><br><br>","\n") content = content.replace("<br><br>","\n") content = content.replace("<br>","\n") content = content.replace(" ","\n") print >>f,content f.close() conn.close()
相关推荐
流光网络小说连载系统v1.0是一款基于ASP(Active Server Pages)开发的网络文学发布平台,主要用于在线连载和管理小说。ASP是一种由微软公司推出的服务器端脚本环境,允许Web开发者创建动态交互式网页。这个系统的...
概述:生死守护是一个长篇小说连载,讲述的是龙兴市市委市政府决定修建一条通往龙泉机场的路,并任命吴浙县县长辛一飞为龙兴市委常委、副市长,负责打通这条路。这条路的修通对龙兴市的城市建设、经济建设、文化建设...
奇文小说连载系统模板是一个专为在线发布和管理小说连载设计的前端代码框架。这个系统模板主要用于构建一个功能完备、用户友好的平台,使作者能够方便地上传、更新和管理他们的小说作品,同时让读者可以轻松浏览、...