`
belldeep
  • 浏览: 40462 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

python : 书签 转换为 HTML

阅读更多
bm2htm.py mybatis.txt
# -*- coding: cp936 -*-
# 先将 bookmark 转码: unicode -> gbk
import os, sys
import re

if len(sys.argv) ==2:
    f1 = sys.argv[1]
else:
    print 'usage: bm2htm.py file1.txt '
    sys.exit(4)

if not os.path.exists(f1):
    print 'ERROR: %s not found\n' % f1
    sys.exit(4)

fn,ext = os.path.splitext(f1)
if ext !='.txt':
    print 'ERROR: %s ext is not .txt\n' % f1
    sys.exit(4)

fp = open(f1,'r')
f2 = fn +'.htm'
fp2 = open(f2,'w')
fp2.write('<html>\n')
fp2.write('  <head>\n')
fp2.write('   <base target="top"/>\n')
fp2.write('    <meta http-equiv="Content-Type" content="text/html; charset=GBK">\n')
fp2.write('    <title>深入浅出 MyBatis技术原理与实战 </title>\n')
fp2.write('  </head>\n')
fp2.write('<body>\n')
# set 参数
path ='mybatis'
pre ='m'  # prefix
pat = re.compile("^[1-9A-Z]")
end = 272 # page max value

for line in fp:
    t = line.strip().replace(' ',' ').split()  # A1A1
    if line.strip() =='':
        fp2.write('\n')
        continue
    if re.match(pat,line):        
        if len(t)>=3:
            d = int(t[-1])
            aline = '  <li>%s  %s  <a href="get.php?dir=%s&pre=%s&end=%d&i=%d">%s</a></li>\n' % (t[0],t[1],path,pre,end,d,t[-1])
        else:
            aline = '  <li>%s  %s </li>\n' % (t[0],t[1])            
        fp2.write(aline)
    elif len(t)==2:
        d = int(t[-1])
        aline = '  <li>%s <a href="get.php?dir=%s&pre=%s&end=%d&i=%d">%s</a></li>\n' % (t[0],path,pre,end,d,t[1])
        fp2.write(aline)
    elif len(t)>=3:
        d = int(t[-1])
        aline = '</ul>\n<ul>%s  %s  <a href="get.php?dir=%s&pre=%s&end=%d&i=%d">%s</a>\n' % (t[0],t[1],path,pre,end,d,t[-1])
        fp2.write(aline)    
    else:
        aline = '</ul>\n<ul>'+line
        fp2.write(aline)
#
fp.close()
fp2.write('</ul>\n')
fp2.write('</body>\n')
fp2.write('</html>\n')
fp2.close()

分享到:
评论

相关推荐

    chrome-export:Python脚本可将Google Chrome浏览器的书签和历史记录转换为标准HTML-ish书签文件格式

    使用Python脚本将的书签和历史记录转换为。 Chrome已经内置了用于书签的功能(选择“书签”→“书签管理器”,然后单击“组织”并选择“导出书签...”)。 我编写此脚本是为了能够在cron脚本中执行此转换。 安装 ...

    合并多个RTF文件转换成PDF并添加书签1

    标题中的“合并多个RTF文件转换成PDF并添加书签1”指的是一个自动化流程,它涉及使用Python脚本来合并多个富文本格式(RTF)文件,然后将合并后的文档转换为PDF,并在PDF中添加书签以便于导航。这个过程对于整理和归档...

    Python3 谷歌浏览器收藏夹导出数据转化JSON

    总之,通过Python3结合BeautifulSoup和json库,我们可以高效地将谷歌浏览器导出的HTML收藏夹转换为易于处理和分析的JSON格式,便于后续的数据分析和操作。这种方法不仅适用于个人收藏夹管理,还可以在大数据项目中...

    json2html-bookmarks:将Firefox书签从JSON转换为HTML格式(可以在其他浏览器中导入)

    将Firefox书签从JSON转换为HTML格式(可以在其他浏览器中导入) 经过Python 2.4-3.3测试。 对于Python &lt;2.6,需要模块simplejson( )。 用法 python json2html.py json_bookmark_input [html_bookmark_output] ...

    Python库 | bookmarks-parser-0.1.2.tar.gz

    通过这个库,开发者可以轻松地在不同格式之间进行转换,或者将书签数据整合到自己的应用程序中。 此外,"bookmarks-parser-0.1.2"可能还包括一些额外的功能,比如书签的排序、去重、搜索等,这些都是在处理大量书签...

    Python制作简易浏览器.rar

    6. **网页渲染**:对于更复杂的网页显示,开发者可能使用了Webkit(如`PyQt5.QtWebEngine`)或其他内嵌的HTML渲染引擎,它们可以将HTML、CSS和JavaScript转换为用户友好的视图。 7. **用户交互**:浏览器需要响应...

    一种制作帮助文档的方法——world转CHM,CHM转HTML

    CHM转HTML”指的是利用特定工具和技术将Microsoft Word(通常以.doc或.docx格式保存)的文档转换为CHM(Microsoft Compiled HTML Help)格式,以及将CHM文件转换为HTML网页。这种转换方法对于创建离线帮助系统、技术...

    Python 简易浏览器.zip

    在Python中,浏览器的“渲染”功能可能通过将HTML文本转换为字符串并在文本控制台或GUI窗口中显示来实现。对于更复杂的渲染,可能需要使用如`html2text`库将HTML转换为Markdown,然后再显示。 7. **错误处理**: ...

    基于PyQt的自制简易浏览器(Python).zip

    在构建简易浏览器的过程中,我们可能先使用Qt Designer创建界面布局,然后导出为.ui文件,再用PyQt的uic模块将其转换为.py文件,这样就能在Python程序中使用了。 接着,我们需要理解如何使用PyQt的QWebView或...

    python-3.7.4rc2中文帮助文档的四种格式.rar

    Python 3.7.4rc2 的 epub 版帮助文档将整个文档转换为一个可导航的电子书,用户可以在设备上享受类似于纸质书的阅读体验。EPUB 支持文本重排,可以根据设备屏幕大小调整显示,方便在不同尺寸的屏幕上阅读。此外,...

    python导出chrome书签到markdown文件的实例代码

    为了将Chrome书签转换为Markdown格式,我们需要了解Markdown的基本语法,例如如何表示标题、列表等元素。 ##### 2.3 文件操作 在实现过程中,还需要涉及到文件的读写操作。Python提供了多种方式来进行文件操作,...

    bookmarks-html2markdown:将ChromeIEFirefox格式的书签列表转换为Markdown表,以简化管理和处理

    书签-html2markdown 将Chrome / IE / Firefox格式的书签列表转换为Markdown表,以简化管理和处理。 阶段1 容错盲目解析Chrome书签导出文件以查找H3以指示文件夹带有HREF属性的标签,用于将URL添加到书签。 阶段2 ...

    Python实现将doc转化pdf格式文档的方法

    在Python编程环境中,将doc文档转换为pdf格式是常见的需求,尤其在文件处理或文档转换的场景中。本文提供了一种使用Python实现该功能的方法,主要依赖于Microsoft Office的COM接口,通过`win32com.client`模块来操作...

    《Python爬虫大数据采集与挖掘》期末考试考题汇总带答案.doc

    19. python3 的默认编码是 unicode,可以通过 encode 与 decode 来进行转换。 20. Web 信息提取的三种基本思路是:基于字符串匹配的 Web 信息提取方法、基于 HTML 结构的 Web 信息提取方法、基于统计的 Web 信息...

    Python库 | pdfiocext-1.0-py3-none-any.whl

    7. **转换和导出**:将PDF转换为其他格式,如HTML、纯文本或图像格式。 8. **水印和页眉页脚**:可以添加自定义水印或页眉页脚,增强PDF的视觉效果或版权保护。 **Python开发语言** Python是面向对象的、动态类型...

    html转化成chm

    在实际开发过程中,如果你的项目涉及大量的HTML帮助文档,可能还需要了解如何自动化这个过程,例如使用批处理脚本或者编程语言(如Python、JavaScript等)来批量处理HTML文件的转换。 总的来说,将HTML转换为CHM是...

    书签备份

    例如,可以使用Python的`sqlite3`库来读取Firefox的书签数据库,然后将数据转换为HTML或其他格式,以便于备份和分享。对于Chrome,可以解析`Bookmarks`文件,同样生成HTML备份。 书签备份工具的开发不仅可以帮助...

    Python库 | PyMuPDF-1.16.17-cp38-cp38-win32.whl

    7. **注释与书签**:支持添加、删除和修改PDF的注释和书签,为PDF文档添加交互性。 8. **安全性**:提供了设置和解除PDF密码的功能,保护文档的安全。 **安装与使用** 在Python环境中,安装PyMuPDF通常是通过pip...

    AoikBookmarksToFiles-0.1.1-py2.py3-none-any.whl.zip

    AoikBookmarksToFiles-0.1.1-py2.py3-none-any.whl.zip 是一个包含Python软件包的压缩文件,主要用于将书签转换为文件。这个软件包的版本号是0.1.1,它支持Python 2和Python 3环境,适用于任何平台(none-any)。该...

Global site tag (gtag.js) - Google Analytics