java word转html
word自带另存为html
一.用jacob转
JACOB - Java COM Bridge
JACOB一个Java-COM中间件.通过这个组件你可以在Java应用程序中调用COM组件和Win32程序库。
示例代码自己搜索
优点:调用原生接口,效果好。
缺点:只能在windows上用。
二.用apache openoffice转
OpenOffice.org 是一套跨平台的办公室软件套件,能在 Windows、Linux、MacOS X (X11)和 Solaris 等操作系统上执行。它与各个主要的办公室软件套件兼容。OpenOffice.org 是自由软件,任何人都可以免费下载、使用及推广它。
优点:
1.转换简单,调用一个方法
2.转换效果良好。
3.windows,linux都可用。
缺点:
1.得安装openoffice,100多M,
3.aix上似乎不能用。
示例代码后续补充
三.用apache poi转
Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。
结构:
HSSF - 提供读写Microsoft Excel格式档案的功能。
XSSF - 提供读写Microsoft Excel OOXML格式档案的功能。
HWPF - 提供读写Microsoft Word格式档案的功能。
HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
HDGF - 提供读写Microsoft Visio格式档案的功能。
优点:
1.转换相对简单,调用一个方法
2.转换效果良好。
3.windows,linux都可用。aix上应该也支持。
4.03,07格式都支持。
缺点:
转07格式时,table没边框,有待解决。
doc中含有emf图片可以转,docx中有emf图片有问题
poi完美word03转html(表格、图片、样式)
http://chembo.iteye.com/blog/1510536
应用POI,word2007转html
http://happyqing.iteye.com/blog/2086450
office to html (1) 支持03,07 和excel
http://blog.163.com/bai_yubo@yeah/blog/static/141551715201322231735622/
自己解析word,转html,难度较大,格式较差
Java引用POI实现Word转Html方法
http://blog.csdn.net/cornfieldc01/article/details/6339801
求poi将word转换为html文件的例子
http://bbs.csdn.net/topics/330193031
相关推荐
word合并全家桶,包括横页和竖页兼容合并,里面包含使用文件格式转换,rtf转换为标准的word格式或者其他类型转换,jacob合并word案例及jar包,docx4j合并word案例及jar包,还有poi合并,以及Plutext-Enterprise-3.3.0.6...
标题中的 "[jacob]---------------->java 实现 word 转换为html jacob" 提示我们,这个压缩包文件包含了一个使用Java编程语言,并利用Jacob库将Microsoft Word文档转换为HTML格式的示例代码。Jacob是Java和COM...
Java 使用 Jacob 库将 Office 文件转换为 HTML 是一个常见的需求,尤其在自动化处理文档或在线预览场景中。Jacob(Java and COM Bridge)是一个 Java 库,它允许 Java 应用程序通过 COM(Component Object Model)...
Java Word转PDF是一种常见的文档格式转换需求,在许多业务场景中都有应用,比如报告生成、文档共享等。在Java中,可以使用第三方库如Apache POI处理Word文档,但要将Word转换为PDF,通常需要借助像JACOB这样的库。...
本项目“java将word转图片转pdf_jacob.zip”是关于利用Java进行文档格式转换的一个实例,主要涉及的技术点包括Java与Microsoft Office文档的交互以及图片和PDF的生成。 首先,我们需要了解Java中的Jacob库。Jacob...
总结,通过结合iTextPDF和Jacob这两个库,Java开发者可以在Word文档中添加图片水印,从而实现对文档的个性化定制和保护。这种方法需要对Java、COM组件以及Word API有一定的理解,但是一旦掌握,就可以灵活地处理各种...
### Java 使用 JACOB 将 Word 转换为 HTML 的详细解析 #### 一、JACOB 简介 JACOB (Java COM Bridge) 是一个 Java 库,它允许 Java 应用程序调用 COM 组件。通过 JACOB,开发者可以轻松地在 Java 应用程序中集成 ...
本示例主要讲解如何使用Java编程语言,结合Jacob库实现Word文档(doc、docx格式)批量转换为纯文本(txt)文件。Jacob库是Java和Microsoft COM接口之间的一个桥梁,允许Java程序调用微软的Office应用,如Word,进行...
总的来说,这个基于Java的Word转HTML工具利用了Jacob库的强大功能,实现了Word文档向HTML的高效转换,同时保留了文档的复杂结构和视觉效果。这在数据迁移、文档共享或者网络发布等场景下具有很高的实用价值。用户只...
本教程将详细介绍如何使用Java中的Apache POI库将Microsoft Word文档转换为HTML,以及如何利用Jacob库将Word文档转换为PDF和HTML。Apache POI是Java中用于读写Microsoft Office格式文件的库,而Jacob则是与Windows ...
"通过jacob实现word转为HTML"这个主题就是关于如何利用Java的一个库——Jacob来完成这项工作。Jacob是一个Java到COM桥接库,允许Java程序调用Windows COM组件,如Microsoft Office,从而实现对Office文档的操作。 ...
"POI"和"Jacob"是两个重要的Java库,分别用于处理不同的Office任务。 1. **Apache POI**: 这是Apache软件基金会的一个开源项目,专门用于处理Microsoft的Office文件格式,如`.xls`(Excel 97-2003)和`.xlsx`...
在实际项目中,还可以考虑其他替代方案,如Apache POI,这是一个专门处理Microsoft Office格式的Java库,虽然它不直接支持Word到HTML的转换,但可以通过解析Word文档并手动构建HTML结构来实现。另一种方法是使用...
完整项目包括所有jar包,完美支持html转word,并解决图片断网不能访问的问题。调用HtmlToWord类测试即可,注意修改调用文件的路径,因里面用到jacob,需要将jacob.dll拷贝到项目所在jre\bin目录下面
Jacob库在Java编程环境中是一个非常实用的工具,它允许开发者通过COM接口与Microsoft Office应用程序进行交互,例如Word、Excel和PowerPoint。在这个场景中,我们使用Jacob来实现Word文档到PDF的转换,以保持格式的...
总的来说,Apache POI和Jacob是Java开发者处理Word文档的两个强大工具。Apache POI适用于基本的读写操作,而Jacob则在需要调用底层Windows API进行复杂操作时发挥作用。通过这些库,你可以构建出能够与Word文档无缝...
本篇将详细介绍如何在Java环境下实现Word转HTML,并且保留目录结构的功能。 首先,我们需要理解整个过程分为两个主要步骤: 1. **将Word转换为HTML** - 有两种常见的方法:使用Word自带的API(如Jacob库)或者...
本教程将详细介绍如何使用Java结合Jacob库将Microsoft Word文档转换为PDF格式,确保转换后的文件保持原格式的完美性。Jacob是一个Java到COM桥接库,允许Java应用程序访问COM组件,如Microsoft Office。 首先,我们...
Jacob库为Java开发者提供了一个与Microsoft Office交互的解决方案,允许在Java应用程序中操纵Word文档。Jacob库实际上是Java和COM(Component Object Model)之间的桥梁,使得Java能够调用Windows平台上的Office API...
java Jacob完美实现word添加图片水印(内附源码及jar包)。 公司最近让搞Word文档添加水印,所有下载的文档需要添加公司印章,搞了好多天才实现,利用Jacob完美实现word添加图片水印(注意需要把dll文件放到jdk的bin...