半月前,考虑做一个在线阅读页面。需要用来pdf2htmlEX(https://github.com/coolwanglu/pdf2htmlEX ,开源工具),刚开始一直编译不过去。今天记录一点小问题:关于字体识别。
如果系统没有安装字体时,pdf2htmlEX会默认隐藏该字段内容。转换的html没有内容。
通过修改源码:
./src/HTMLRenderer/font.cc // TODO: this function is called when some font is unable to process, may use the name there as a hint void HTMLRenderer::export_remote_default_font(long long fn_id) { f_css.fs << "." << CSS::FONT_FAMILY_CN << fn_id << "{font-family:sans-serif;visibility:visible;}" << endl; // f_css.fs << "." << CSS::FONT_FAMILY_CN << fn_id << "{font-family:sans-serif;visibility:hidden;}" << endl; }
,再编译之后,就能显示字体内容了。
来看下效果:
这是原pdf文档:
下面是转换后的:
相关推荐
pdf2htmlEX支持将PDF文件中的文本、图像和链接等内容都转换成HTML格式,并保留原文档的布局和格式。 pdf2htmlEX为用户提供了丰富的配置选项,可以根据用户的需求进行相应的设置。用户可以指定输出文件的名称、页面...
本文将深入探讨如何在.NET框架下,利用C#编程语言和开源工具pdf2htmlEX来实现这个功能。 PDF(Portable Document Format)是一种广泛使用的文件格式,它能保持文档的原始布局和样式。然而,为了在Web环境中更好地...
在HTML转PDF的过程中,QPrinter被用来设置PDF输出的参数,如纸张大小、方向等,QPainter则负责将网页内容绘制到打印机对象上。 4. **C++编程**:这个项目是用C++语言实现的,C++是一种强大的、面向对象的编程语言,...
XPDF还包含了`pdf2htmlEX`工具,它可以将PDF文档转换成HTML格式,保持原有的页面布局和图像。这对于想要在网页上展示PDF内容或者需要对PDF进行在线阅读的用户来说是一个很好的解决方案。HTML版本的文档可以在各种...
2. **分页渲染**:PDF.js将PDF文档分割成单独的页面,并逐个在浏览器中渲染。用户可以平滑滚动查看文档。 3. **高质量渲染**:通过使用矢量图形和高质量的图像处理,PDF.js能保持原始PDF文档的清晰度和细节。 4. *...
本篇文章将深入探讨如何在VB6.0环境中实现Base64编码到PDF文件的转换过程,并对给定代码片段进行详细分析,以便更好地理解和应用这一技术。 ### 一、Base64编码简介 Base64是一种二进制到文本的编码方法,常用于在...
Java HTML 转 PDF 插件是用于将HTML文档转换为PDF格式的工具,这在很多场景下非常有用,比如报告生成、电子书制作、网页保存等。在Java开发环境中,有多种库和框架可以实现这个功能,如iText、Flying Saucer、PDFBox...
其中,iTextSharp主要用于PDF文档的创建和编辑,而wkhtmltopdf是一个基于WebKit的工具,它可以将HTML页面渲染成高质量的PDF。PDFSharp则提供了创建、编辑和操作PDF文档的C#接口。 在这个压缩包中,我们看到有以下几...
标题中的“OFD批量转换PDF源代码”指出这是一个关于将OFD文件批量转换为PDF格式的程序源代码。OFD(Open Fixed-layout Document)是中国国家标准的电子文档格式,主要用于存储固定版面的文档,如政府文件、发票等。...
2. **Aspose Excel 转 PDF/HTML** 对于Excel文档,Aspose.Cells API允许开发人员将工作簿(.xls, .xlsx)转换成PDF或HTML。转换时,样式、公式、图表和数据透视表都将被保留。同样,调用`Workbook`对象的`save`方法...
在IT行业中,文档格式转换是一项常见的任务,尤其是将Word文档转换为PDF。Word文档和PDF在不同的场景下各有优势,Word适合编辑和创作,而PDF则适用于保持文档格式不变的阅读和分发。本示例关注的是如何在不依赖...
CHM2PDF是一款实用的工具,专门用于将CHM(Microsoft Compiled HTML Help)格式的文件转换为PDF(Portable Document Format)文件。CHM文件通常用于技术文档和电子书,而PDF则是广泛接受的标准,适用于跨平台查看和...
代码使用需要pdf2docx三方包实现,为了在前台打印更多日志,将三方包中的Converter类进行了改进,将def __init__(self, pdf_file:str, password:str=None) 参数增加了func回调函数def __init__(self, pdf_file:str, ...
然后,使用PDF生成库如PDFlib、Qoppa Software的gPDF或poppler库将解析出的数据转换成PDF格式。 6. **流程概述**: - 解析Office文件:使用合适的库读取.docx, .xlsx或.pptx文件的内容,提取文本、图片、样式等...
在使用`mutool.exe`进行PDF转图片时,你需要首先确保已经下载并安装了MuPDF。你可以从官方网站获取最新版本的MuPDF,它通常包含一个名为`mutool.exe`的可执行文件。然后,通过命令行界面,你可以调用这个工具进行...
在实现"Word转Jpg"的过程中,通常会利用Windows API或第三方库来读取Word文档内容,并将其渲染为图像。对于PDF文档,可能需要使用专门的PDF解析库,如Ghostscript或iText,来获取页面内容并转换成图像。 在这个项目...
《编译原理》课程是计算机科学与技术专业的必修课程。本课程主要介绍程序设计语言编译程序构造的基本原理和设计方法,包括:编译程序概述、高级语言及其语法描述、词法分析、语法分析、属性文法和语法制导翻译、语义...
此库特别强调对PNG图像格式的支持,这意味着开发者可以方便地将PNG图片集成到生成的PDF文件中,提升文档的视觉效果和专业性。同时,它还提供了静态编译功能,使得生成的程序更轻便、独立,无需额外的运行库支持,...
标题"word转pdf.rar"暗示了我们要讨论的核心话题:如何用Java通过Aspose.Words将Word(.doc或.docx)文件转换成PDF。这个压缩包包含两个关键文件:"aspose-words-18.6-jdk16-11.jar"是Aspose.Words的Java库,而"Doc2...
PDF转图片技术是一种将PDF文档转换为图像格式(如JPEG或PNG)的技术,这在许多场景下非常有用,比如预览、打印、分享或者在线显示。开源库PdfiumLib是Google Chrome的Pdfium项目的C++版本,允许开发者在自己的应用...