bm2htm.py mybatis.txt
# -*- coding: cp936 -*-
# 先将 bookmark 转码: unicode -> gbk
import os, sys
import re
if len(sys.argv) ==2:
f1 = sys.argv[1]
else:
print 'usage: bm2htm.py file1.txt '
sys.exit(4)
if not os.path.exists(f1):
print 'ERROR: %s not found\n' % f1
sys.exit(4)
fn,ext = os.path.splitext(f1)
if ext !='.txt':
print 'ERROR: %s ext is not .txt\n' % f1
sys.exit(4)
fp = open(f1,'r')
f2 = fn +'.htm'
fp2 = open(f2,'w')
fp2.write('<html>\n')
fp2.write(' <head>\n')
fp2.write(' <base target="top"/>\n')
fp2.write(' <meta http-equiv="Content-Type" content="text/html; charset=GBK">\n')
fp2.write(' <title>深入浅出 MyBatis技术原理与实战 </title>\n')
fp2.write(' </head>\n')
fp2.write('<body>\n')
# set 参数
path ='mybatis'
pre ='m' # prefix
pat = re.compile("^[1-9A-Z]")
end = 272 # page max value
for line in fp:
t = line.strip().replace(' ',' ').split() # A1A1
if line.strip() =='':
fp2.write('\n')
continue
if re.match(pat,line):
if len(t)>=3:
d = int(t[-1])
aline = ' <li>%s %s <a href="get.php?dir=%s&pre=%s&end=%d&i=%d">%s</a></li>\n' % (t[0],t[1],path,pre,end,d,t[-1])
else:
aline = ' <li>%s %s </li>\n' % (t[0],t[1])
fp2.write(aline)
elif len(t)==2:
d = int(t[-1])
aline = ' <li>%s <a href="get.php?dir=%s&pre=%s&end=%d&i=%d">%s</a></li>\n' % (t[0],path,pre,end,d,t[1])
fp2.write(aline)
elif len(t)>=3:
d = int(t[-1])
aline = '</ul>\n<ul>%s %s <a href="get.php?dir=%s&pre=%s&end=%d&i=%d">%s</a>\n' % (t[0],t[1],path,pre,end,d,t[-1])
fp2.write(aline)
else:
aline = '</ul>\n<ul>'+line
fp2.write(aline)
#
fp.close()
fp2.write('</ul>\n')
fp2.write('</body>\n')
fp2.write('</html>\n')
fp2.close()
分享到:
相关推荐
使用Python脚本将的书签和历史记录转换为。 Chrome已经内置了用于书签的功能(选择“书签”→“书签管理器”,然后单击“组织”并选择“导出书签...”)。 我编写此脚本是为了能够在cron脚本中执行此转换。 安装 ...
标题中的“合并多个RTF文件转换成PDF并添加书签1”指的是一个自动化流程,它涉及使用Python脚本来合并多个富文本格式(RTF)文件,然后将合并后的文档转换为PDF,并在PDF中添加书签以便于导航。这个过程对于整理和归档...
总之,通过Python3结合BeautifulSoup和json库,我们可以高效地将谷歌浏览器导出的HTML收藏夹转换为易于处理和分析的JSON格式,便于后续的数据分析和操作。这种方法不仅适用于个人收藏夹管理,还可以在大数据项目中...
将Firefox书签从JSON转换为HTML格式(可以在其他浏览器中导入) 经过Python 2.4-3.3测试。 对于Python <2.6,需要模块simplejson( )。 用法 python json2html.py json_bookmark_input [html_bookmark_output] ...
通过这个库,开发者可以轻松地在不同格式之间进行转换,或者将书签数据整合到自己的应用程序中。 此外,"bookmarks-parser-0.1.2"可能还包括一些额外的功能,比如书签的排序、去重、搜索等,这些都是在处理大量书签...
6. **网页渲染**:对于更复杂的网页显示,开发者可能使用了Webkit(如`PyQt5.QtWebEngine`)或其他内嵌的HTML渲染引擎,它们可以将HTML、CSS和JavaScript转换为用户友好的视图。 7. **用户交互**:浏览器需要响应...
CHM转HTML”指的是利用特定工具和技术将Microsoft Word(通常以.doc或.docx格式保存)的文档转换为CHM(Microsoft Compiled HTML Help)格式,以及将CHM文件转换为HTML网页。这种转换方法对于创建离线帮助系统、技术...
在Python中,浏览器的“渲染”功能可能通过将HTML文本转换为字符串并在文本控制台或GUI窗口中显示来实现。对于更复杂的渲染,可能需要使用如`html2text`库将HTML转换为Markdown,然后再显示。 7. **错误处理**: ...
在构建简易浏览器的过程中,我们可能先使用Qt Designer创建界面布局,然后导出为.ui文件,再用PyQt的uic模块将其转换为.py文件,这样就能在Python程序中使用了。 接着,我们需要理解如何使用PyQt的QWebView或...
Python 3.7.4rc2 的 epub 版帮助文档将整个文档转换为一个可导航的电子书,用户可以在设备上享受类似于纸质书的阅读体验。EPUB 支持文本重排,可以根据设备屏幕大小调整显示,方便在不同尺寸的屏幕上阅读。此外,...
为了将Chrome书签转换为Markdown格式,我们需要了解Markdown的基本语法,例如如何表示标题、列表等元素。 ##### 2.3 文件操作 在实现过程中,还需要涉及到文件的读写操作。Python提供了多种方式来进行文件操作,...
书签-html2markdown 将Chrome / IE / Firefox格式的书签列表转换为Markdown表,以简化管理和处理。 阶段1 容错盲目解析Chrome书签导出文件以查找H3以指示文件夹带有HREF属性的标签,用于将URL添加到书签。 阶段2 ...
在Python编程环境中,将doc文档转换为pdf格式是常见的需求,尤其在文件处理或文档转换的场景中。本文提供了一种使用Python实现该功能的方法,主要依赖于Microsoft Office的COM接口,通过`win32com.client`模块来操作...
19. python3 的默认编码是 unicode,可以通过 encode 与 decode 来进行转换。 20. Web 信息提取的三种基本思路是:基于字符串匹配的 Web 信息提取方法、基于 HTML 结构的 Web 信息提取方法、基于统计的 Web 信息...
7. **转换和导出**:将PDF转换为其他格式,如HTML、纯文本或图像格式。 8. **水印和页眉页脚**:可以添加自定义水印或页眉页脚,增强PDF的视觉效果或版权保护。 **Python开发语言** Python是面向对象的、动态类型...
在实际开发过程中,如果你的项目涉及大量的HTML帮助文档,可能还需要了解如何自动化这个过程,例如使用批处理脚本或者编程语言(如Python、JavaScript等)来批量处理HTML文件的转换。 总的来说,将HTML转换为CHM是...
例如,可以使用Python的`sqlite3`库来读取Firefox的书签数据库,然后将数据转换为HTML或其他格式,以便于备份和分享。对于Chrome,可以解析`Bookmarks`文件,同样生成HTML备份。 书签备份工具的开发不仅可以帮助...
7. **注释与书签**:支持添加、删除和修改PDF的注释和书签,为PDF文档添加交互性。 8. **安全性**:提供了设置和解除PDF密码的功能,保护文档的安全。 **安装与使用** 在Python环境中,安装PyMuPDF通常是通过pip...
AoikBookmarksToFiles-0.1.1-py2.py3-none-any.whl.zip 是一个包含Python软件包的压缩文件,主要用于将书签转换为文件。这个软件包的版本号是0.1.1,它支持Python 2和Python 3环境,适用于任何平台(none-any)。该...