结论:5页文件每页用时153.4ms,1430页文件每页用时141.4ms,差别并不明显。
0. 运行环境
既然是利用Microsoft Office word,所以理所当然需要运行在Windows下。测试用的Office版本:2010。
1.需要的辅助工具:
由于java环境无法直接调用ActiveX,所以借助于开源的jacob。版本: 1.17。
2.代码准备:
这里只列举几个关键步骤吧,完整代码就不列举了,可以自行组合。
2.1 创建Word的ActiveX对象
ActiveXComponent app = new ActiveXComponent("Word.Application"); app.setProperty("Visible", false);
2.2 打开word文档
Dispatch docs = app.getProperty("Documents").toDispatch(); Dispatch doc = Dispatch.call(docs, "Open", in, // FileName false, // ConfirmConversions true // ReadOnly ).toDispatch();
2.3 输出为PDF文档
Dispatch.call(doc, "SaveAs", out, // FileName 17);
2.4 关闭文档
Dispatch.call(doc, "Close", false); doc.safeRelease();
2.5 关闭ActiveX
if (docs != null) { docs.safeRelease(); } if (app != null) { app.invoke("Quit", 0); app.safeRelease(); }
3. 转换效率
场景1:word文件大小:18.7k,5页。生成pdf后123k。生成的文件不都是相同大小,这个问题还有待研究。处理1024个文件,用时:785555ms,13分5秒。平均每个文件用时:767.1ms。
场景2:word文件大小:2.27m,1430页。生成pdf是13.3m。pdf文件还是大小不一。处理4个文件,用时:808589ms,13分28秒。平均每个文件用时:202147ms。
可以看出,场景1的5页文件每页用时153.4ms,场景2的1430页文件每页用时141.4ms,差别并不明显。
相关推荐
- 使用转换工具:生成Word文档后,我们需要一个转换工具将Word转换为PDF。常见的工具有iText、Apache PDFBox或者Java的第三方库如Aspose.Words。这里以Apache PDFBox为例,它提供了一个名为`PDDocument`的类来处理...
在Java编程环境中,将文档(如Excel、Word、PDF、PPT)转换为图片是一种常见的需求,这在处理大量文档预览、数据可视化或者移动设备兼容性问题时尤其有用。以下是一些关于如何使用Java实现这种转换的关键知识点: 1...
有时我们需要在Web环境中将PDF转换为Word,以便进行编辑或适应不同的系统需求。本篇将详细介绍如何使用Java实现在Web项目中进行这样的转换。 首先,我们要理解PDF(Portable Document Format)是一种静态的、不可...
综上所述,这个项目展示了如何利用Java的开源库和标准API来构建一个独立且可移植的跨平台打印解决方案,能够处理多种文件格式,包括PDF、Word文档和图片。这对于需要在不同环境中进行文档打印的Java应用来说,具有很...
对于Excel转PDF,步骤类似,只是替换`"Word.Application"`为`"Excel.Application"`,并且可能需要调整保存参数以适应Excel文件的特性。 除了Jacob,还有其他Java库如Apache POI和iText可以用来处理这种转换,但它们...
5. **生成OFD文件**:利用OFD SDK的JAVA API,将上述XML数据和资源写入OFD文件中,完成转换。 在实际操作中,需要注意以下几点: - **字体兼容性**:由于PDF可能使用各种字体,而OFD要求使用国标GB2312、GBK或UTF-8...
3. Word到PDF转换:利用iText或PDFBox等库将处理后的Word内容转换为PDF格式。 4. 错误排查和修复:针对生成PDF过程中可能出现的问题进行调试和优化。 理解并掌握这些技术,可以帮助开发者实现高效且灵活的文档自动...
在Java开发环境中,将Word文档转换为PDF是常见的需求,特别是在处理报告、文档共享或跨平台兼容性问题时。Apache POI和iText是两个常用的库,分别用于处理Microsoft Office格式(如Word)和PDF文档。本示例将介绍...
"ppt,word, excel, pdf 互转换所需要的jar.rar" 提供的资源是一个Java Archive (JAR) 文件,它包含了一组库,可以支持开发者在应用程序中实现不同文件格式之间的转换。JAR 文件是一种归档格式,用于收集多个Java类...
在数字化办公环境中,将Word文档转换为PDF格式是常见需求,尤其是为了确保文档在不同设备上的一致性显示。Office 2007及后续版本内置了直接转换为PDF的功能,极大地简化了这一过程。 **1. 安装Office 2007** 首先...
在IT行业中,将Word文档转换为PDF格式并实现在线预览功能是一项常见的需求,尤其在Web应用中。这个压缩包“word转PDF然后实现在线预览的功能.rar”提供了一个技术解决方案,下面我们将深入探讨其中涉及的关键知识点...
基于Java的Word转PDF工具,能够方便地将Microsoft Word文档转换为PDF格式,这在跨平台的文档共享、打印预览以及确保一致的视觉效果时特别有用。在描述中提到了几个关键特性: 1. **自带字体库**:这意味着该工具...
通过以上的步骤和技巧,你可以使用`iReport`有效地创建和导出PDF及Word文档,满足不同场景的需求。尽管过程中可能遇到一些挑战,但只要掌握了基本操作和解决方法,就能够高效地完成任务。在实际工作中,不断实践和...
LaTeX到Word的转换可能需要先将LaTeX编译为PDF,然后使用PDF到Word的转换工具,或者将LaTeX公式转换为MathML,再用Apache POI写入Word文档。 5. **实际应用** - 这些转换在教育、科研和出版等领域有广泛应用。例如...
在实际操作中,将Word文档转换为PDF的原因可能包括保持格式的一致性、防止内容被轻易编辑或为了适应不同的设备和操作系统。这个过程可以通过各种工具实现,包括免费和付费的在线服务,以及利用编程语言编写的自定义...
在IT行业中,经常需要处理各种类型的文件,例如Word文档、PDF和图片等。有时,我们需要将这些不同格式的文件合并到一个文档中,以便于阅读、管理和分享。本篇文章将详细讲解如何使用Java编程语言来实现这个功能,将...
总的来说,Jacob-1.15是一个强大的工具,使得Java开发者能够方便地在应用程序中集成文档处理功能,特别是需要在Java应用中创建、编辑或转换Word和PDF文件的场景。尽管存在一些挑战,但它为开发者提供了一个有效的...
- 最后,使用Word的`SaveAs`方法,将文档保存为PDF格式。这个过程需要设置正确的文件路径和保存类型。 2. **图片转PDF**: - 对于图片转PDF,由于Jacob主要针对Office文档,不直接支持图片操作。但你可以先将图片...
标题“word_pdf操作jar.zip”指的是一个压缩包文件,该文件包含了处理Word和PDF文档转换的Java类库。这个压缩包可能是一个集合,用于帮助开发者实现文档格式的互换,如将Word文档转换为PDF,或者将PDF转换为图片等。...
在IT行业中,转换文档格式是一项常见的任务,尤其是在处理Word文档和PDF文档时。"word转PDF相关JAR包.zip"这个压缩包提供了Java开发者所需的一些关键库,使得在应用程序中实现Word到PDF的转换成为可能。以下是这些库...