-
谁做过把word转为HTML?5
谁做过把word转为HTML?
现在有个需求:
因为word在非windows平台或没有装office的平台上在浏览器中是打不开的。
为了让office能在浏览器中显示,先需要把word等office转为在浏览器中能够正确显示
的格式。如要求word中的表格,公式,图片都能显示。
用java实现。
有谁有这方面的经验。现在是用的poi开源包。提取文字没问题,就是表格,图片等显示
顺序有问题。如应该在段落中间的表格或图片,显示到了段落的下方。这样如果表格图
片多的话,就很混乱。还有,显示面临的问题是,用此开源包(poi)要么提取全部文
字,要么提取全部表格,要么提取全部图片。不能边读文件遇到表格提去表格,遇到图
片提取图片。
最好别用jacob(因为里面用的用到了windows组件)
哪位大侠做过这方面的?请指教,感激!
问题补充:
这么做的目的是希望在没有安装ms office,和在linux系统下也可以浏览word文档。
所以需要把word转换为HTML。因此凡是用到response.setContentType("application/vnd.ms-word"); 类似的方法或调用了windows组件需要IE的支持的方法。在linux都会存在问题。望高手门继续指教。2008年11月04日 13:14
4个答案 按时间排序 按投票排序
-
现在poi3.8提供将word转化为Html了哦,不过若是word中有表格的,显示时有点问题,你的问题解决了吗?我现在不知道如何解决表格问题了哦!
2012年9月23日 14:06
-
楼主的意思是要在后台直接转换为html吧?
import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException; import com.artofsolving.jodconverter.DocumentConverter; import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection; import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection; import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter; //"C:\Program Files\OpenOffice.org 2.2\program\soffice" -headless -accept="socket,port=8100;urp;" public class WordConvertor { public static boolean convert(String wordpath,String savePath) { // int port = SocketOpenOfficeConnection.DEFAULT_PORT; OpenOfficeConnection conn = new SocketOpenOfficeConnection(); try { conn.connect(); DocumentConverter converter = new OpenOfficeDocumentConverter(conn); File inputFile = new File(wordpath); File outputFile = new File(savePath); converter.convert(inputFile, outputFile); conn.disconnect(); return true; } catch (Exception e) { e.printStackTrace(); return false; //Logger.getLogger(D2P_JDOConvertor.class.getName()).log(Level.SEVERE, null, ex); } } public static boolean updateLinks(String htmlSrc, String srcLink, String desLink){ System.out.println("htmlSrc :"+htmlSrc); System.out.println("srcLink :"+srcLink); System.out.println("desLink :"+desLink); FileOutputStream out=null; FileInputStream in=null; try { if(htmlSrc.endsWith(".html")){ File file=new File(htmlSrc); if(!file.exists()||file.isDirectory()){ return false; } in = new FileInputStream(file); int lengh = in.available(); byte bytes[] = new byte[lengh]; in.read(bytes); if(file.exists()&&file.isFile()){ file.delete(); String tempContent=new String(bytes); tempContent=tempContent.replaceAll(srcLink,desLink); File fileWriting=new File(htmlSrc); out = new FileOutputStream(fileWriting);//建立文件输出流 byte tag_bytes[] = tempContent.getBytes(); out.write(tag_bytes); return true; }else{ return false; } }else{ return false; } } catch (FileNotFoundException e) { // TODO Auto-generated catch block e.printStackTrace(); return false; } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); return false; } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); return false; } finally{ try { in.close(); out.close(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); return false; } } } //"E:\Program Files\OpenOffice.org 2.2\program\soffice" -headless -accept="socket,port=8100;urp;" }
要在服务器端安装openoffice,记得还要将监听服务打开。2008年11月05日 10:18
-
response.setContentType("application/vnd.ms-word");
File file =new File("D:/test.doc");
FileInputStream in= new FileInputStream(file);
byte[] buffer=new byte[in.available()];
in.read(buffer);
response.getOutputStream().write(buffer);
response.getOutputStream().flush();
这样就可以直接在浏览器里面打开啦。。2008年11月04日 14:20
相关推荐
Word转为HTML工具是一种实用的软件或在线服务,它能够帮助用户将Microsoft Word文档转换成HTML格式,以便在网页上发布或进行电子邮件通讯等用途。这个过程涉及到多种技术和概念,包括文档格式转换、文本解析以及HTML...
js把word转成html js把word转成html js把word转成html js把word转成html
"通过jacob实现word转为HTML"这个主题就是关于如何利用Java的一个库——Jacob来完成这项工作。Jacob是一个Java到COM桥接库,允许Java程序调用Windows COM组件,如Microsoft Office,从而实现对Office文档的操作。 ...
Java程序把Word文档直接转换成Html文件 Java程序把Word文档直接转换成Html文件是通过使用Java和COM组件实现的。COM组件是Windows操作系统中的一种组件对象模型,它允许不同的应用程序之间进行交互。在本文中,我们...
java使用poi将word转为html
标题和描述中提到的"实现word文件转换成html文件实现在线打开预览word文件",这是一个关于将Microsoft Word文档转换为HTML格式,以便在网页上预览的技术问题。下面将详细介绍这个过程涉及的关键知识点。 1. **...
1、Word模板转html模板的操作步骤(图示例+操作描述,13张图); 2、由上述生成的html模板通过java代码生成pdf; 3、示例有本地模板和远程模板之分,可杜绝pdf标题丢失的问题; 4、资源概要:先阅读README.md文档,然后...
在IT行业中,转换文档格式是一项常见的任务,尤其在需要在网络上展示内容时,将Microsoft Word文档转化为HTML格式变得尤为重要。Word转HTML的目的是为了让内容能在网页上以原貌展示,同时保持良好的可读性和兼容性。...
### C#读取Word文档并转换为HTML格式 在日常工作中,我们经常需要处理各种文档格式的转换,尤其是在Web开发领域,将Word文档转换成HTML格式可以方便地嵌入到网页中展示。本文将详细介绍如何使用C#语言来实现这一...
能够便捷的把word文档转化为html页面显示的内容
在Java开发中,有时我们需要将Microsoft Word文档转换为HTML格式,以便在网络上发布或者进行其他处理。这个过程可以通过Apache POI库来实现,该库允许Java程序员读取、创建和修改MS Office格式的文件,包括Word文档...
将HTML转换为Word文档的需求在数据处理、报告生成或网页内容导出时经常出现。Apache POI是Java库,专门用于处理Microsoft Office格式的文件,如Word(.doc和.docx)、Excel(.xls和.xlsx)等。在这个小例子中,我们...
在IT行业中,文档处理是一项常见的任务,特别是在需要跨平台共享或者网络展示时,将Word文档转换为HTML格式显得尤为重要。本篇文章将详细讲解如何利用Apache POI库进行Word内容提取及Word转HTML的过程,以及涉及的...
本示例主要涉及的是将HTML文件转换为Word文档,具体使用的是Java库——docx4j。这个库提供了强大的功能,可以方便地进行XML、XSL-FO到OpenXML(包括.docx和.xlsx)的转换。下面我们将深入探讨这个过程。 首先,`...
在现代Web应用中,将HTML页面转换为可下载的Word文档是一种常见的需求,尤其是在数据导出、报告生成或在线编辑场景下。本文将详细介绍如何利用JavaScript实现这一功能,并结合提供的压缩包文件,解析其核心技术和...
Java POI库是一个强大的工具,专门用于处理Microsoft Office格式的文件,包括Word(.doc和.docx)文档。在这个特定的场景中,我们利用POI将Word文档转换为HTML格式,以便于在网页上展示或者进行其他Web相关的操作。...
Java中的Apache POI库是一个强大的工具,用于读取、创建和修改Microsoft Office格式的文件,包括Word(.doc和.docx)文档。在本案例中,我们关注的是如何使用POI将Word文档转换为HTML格式。这个过程对于在网络上展示...
Apache POI 是一个开源项目,专门用于处理微软的Office文档格式,如Word(.doc, .docx)、Excel(.xls, .xlsx)等。在本案例中,我们关注的是如何使用Apache POI将Word文档转换为HTML格式,并且保持原有的样式、表格...
在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...
java将.docx文件和.doc文件转为html文件的工具类。。。