0 0

谁做过把word转为HTML?5

谁做过把word转为HTML?
现在有个需求:
因为word在非windows平台或没有装office的平台上在浏览器中是打不开的。
为了让office能在浏览器中显示,先需要把word等office转为在浏览器中能够正确显示
的格式。如要求word中的表格,公式,图片都能显示。
用java实现。
有谁有这方面的经验。现在是用的poi开源包。提取文字没问题,就是表格,图片等显示
顺序有问题。如应该在段落中间的表格或图片,显示到了段落的下方。这样如果表格图
片多的话,就很混乱。还有,显示面临的问题是,用此开源包(poi)要么提取全部文
字,要么提取全部表格,要么提取全部图片。不能边读文件遇到表格提去表格,遇到图
片提取图片。
最好别用jacob(因为里面用的用到了windows组件)
哪位大侠做过这方面的?请指教,感激!

问题补充:
这么做的目的是希望在没有安装ms office,和在linux系统下也可以浏览word文档。
所以需要把word转换为HTML。因此凡是用到response.setContentType("application/vnd.ms-word"); 类似的方法或调用了windows组件需要IE的支持的方法。在linux都会存在问题。望高手门继续指教。
2008年11月04日 13:14

4个答案 按时间排序 按投票排序

0 0

现在poi3.8提供将word转化为Html了哦,不过若是word中有表格的,显示时有点问题,你的问题解决了吗?我现在不知道如何解决表格问题了哦!

2012年9月23日 14:06
0 0

如果不是在程序里面打开,在word另存为就可以改,如果是程序就同上

2008年11月07日 11:05
0 0

楼主的意思是要在后台直接转换为html吧?

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;

import com.artofsolving.jodconverter.DocumentConverter;
import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection;
import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection;
import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter;
//"C:\Program Files\OpenOffice.org 2.2\program\soffice" -headless -accept="socket,port=8100;urp;"
public class WordConvertor {
	public static boolean convert(String wordpath,String savePath) {
	      // int port = SocketOpenOfficeConnection.DEFAULT_PORT;  
	        OpenOfficeConnection conn = new SocketOpenOfficeConnection();           
	        try {
	            conn.connect();  
	            DocumentConverter converter = new OpenOfficeDocumentConverter(conn);  
	   
	            File inputFile = new File(wordpath);
	            File outputFile = new File(savePath);
	  
	            converter.convert(inputFile, outputFile);  
	            conn.disconnect();
	            return true;
	        } catch (Exception e) {  
	        	e.printStackTrace();
	        	return false;
	            //Logger.getLogger(D2P_JDOConvertor.class.getName()).log(Level.SEVERE, null, ex);  
	        }  
	    }
	public static boolean updateLinks(String htmlSrc, String srcLink, String desLink){
		
		System.out.println("htmlSrc :"+htmlSrc);
		System.out.println("srcLink :"+srcLink);
		System.out.println("desLink :"+desLink);
		FileOutputStream out=null;
		FileInputStream in=null;
		try {
			if(htmlSrc.endsWith(".html")){
				File file=new File(htmlSrc);
				 if(!file.exists()||file.isDirectory()){
					 return false;
				 }
				 in = new FileInputStream(file);
				 
				 int lengh = in.available();
				 byte bytes[] = new byte[lengh]; 
				 in.read(bytes); 
				 
				 
				 if(file.exists()&&file.isFile()){
					 file.delete();
					 String tempContent=new String(bytes); 
					 tempContent=tempContent.replaceAll(srcLink,desLink); 
					 
					 File fileWriting=new File(htmlSrc);
					 out = new FileOutputStream(fileWriting);//建立文件输出流 
					 byte tag_bytes[] = tempContent.getBytes(); 
					 out.write(tag_bytes); 
					 return true;
				 }else{
					 return false;
				 }
			}else{
				return false;
			}
			
		} catch (FileNotFoundException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
			return false;
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
			return false;
		} catch (Exception e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
			return false;
		} finally{
			try {
				in.close();
				out.close();
			} catch (IOException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
				return false;
			}
		}
	}
//"E:\Program Files\OpenOffice.org 2.2\program\soffice" -headless -accept="socket,port=8100;urp;"


}

要在服务器端安装openoffice,记得还要将监听服务打开。

2008年11月05日 10:18
0 0

response.setContentType("application/vnd.ms-word");
File file =new File("D:/test.doc");
FileInputStream in= new FileInputStream(file);
byte[] buffer=new byte[in.available()];
in.read(buffer);
response.getOutputStream().write(buffer);
response.getOutputStream().flush();
这样就可以直接在浏览器里面打开啦。。

2008年11月04日 14:20

相关推荐

    word转为html工具

    Word转为HTML工具是一种实用的软件或在线服务,它能够帮助用户将Microsoft Word文档转换成HTML格式,以便在网页上发布或进行电子邮件通讯等用途。这个过程涉及到多种技术和概念,包括文档格式转换、文本解析以及HTML...

    js把word转成html

    js把word转成html js把word转成html js把word转成html js把word转成html

    通过jacob实现word转为HTML

    "通过jacob实现word转为HTML"这个主题就是关于如何利用Java的一个库——Jacob来完成这项工作。Jacob是一个Java到COM桥接库,允许Java程序调用Windows COM组件,如Microsoft Office,从而实现对Office文档的操作。 ...

    Java程序把Word文档直接转换成Html文件

    Java程序把Word文档直接转换成Html文件 Java程序把Word文档直接转换成Html文件是通过使用Java和COM组件实现的。COM组件是Windows操作系统中的一种组件对象模型,它允许不同的应用程序之间进行交互。在本文中,我们...

    java使用poi将word转为html

    java使用poi将word转为html

    实现word文件转换成html文件实现在线打开预览word文件

    标题和描述中提到的"实现word文件转换成html文件实现在线打开预览word文件",这是一个关于将Microsoft Word文档转换为HTML格式,以便在网页上预览的技术问题。下面将详细介绍这个过程涉及的关键知识点。 1. **...

    word文档生成html模板(freemarker)再转为pdf示例代码

    1、Word模板转html模板的操作步骤(图示例+操作描述,13张图); 2、由上述生成的html模板通过java代码生成pdf; 3、示例有本地模板和远程模板之分,可杜绝pdf标题丢失的问题; 4、资源概要:先阅读README.md文档,然后...

    word转化HTML预览

    在IT行业中,转换文档格式是一项常见的任务,尤其在需要在网络上展示内容时,将Microsoft Word文档转化为HTML格式变得尤为重要。Word转HTML的目的是为了让内容能在网页上以原貌展示,同时保持良好的可读性和兼容性。...

    C#读取word并转为html格式

    ### C#读取Word文档并转换为HTML格式 在日常工作中,我们经常需要处理各种文档格式的转换,尤其是在Web开发领域,将Word文档转换成HTML格式可以方便地嵌入到网页中展示。本文将详细介绍如何使用C#语言来实现这一...

    word转为html架包

    能够便捷的把word文档转化为html页面显示的内容

    word转html java

    在Java开发中,有时我们需要将Microsoft Word文档转换为HTML格式,以便在网络上发布或者进行其他处理。这个过程可以通过Apache POI库来实现,该库允许Java程序员读取、创建和修改MS Office格式的文件,包括Word文档...

    java html转换word

    将HTML转换为Word文档的需求在数据处理、报告生成或网页内容导出时经常出现。Apache POI是Java库,专门用于处理Microsoft Office格式的文件,如Word(.doc和.docx)、Excel(.xls和.xlsx)等。在这个小例子中,我们...

    word内容提取 word转html-POI wps doc docx转html

    在IT行业中,文档处理是一项常见的任务,特别是在需要跨平台共享或者网络展示时,将Word文档转换为HTML格式显得尤为重要。本篇文章将详细讲解如何利用Apache POI库进行Word内容提取及Word转HTML的过程,以及涉及的...

    java将html文件生成word文件

    本示例主要涉及的是将HTML文件转换为Word文档,具体使用的是Java库——docx4j。这个库提供了强大的功能,可以方便地进行XML、XSL-FO到OpenXML(包括.docx和.xlsx)的转换。下面我们将深入探讨这个过程。 首先,`...

    通过Js实现Html转换成Word下载

    在现代Web应用中,将HTML页面转换为可下载的Word文档是一种常见的需求,尤其是在数据导出、报告生成或在线编辑场景下。本文将详细介绍如何利用JavaScript实现这一功能,并结合提供的压缩包文件,解析其核心技术和...

    java poi把word文档转化为html,支持doc。

    Java POI库是一个强大的工具,专门用于处理Microsoft Office格式的文件,包括Word(.doc和.docx)文档。在这个特定的场景中,我们利用POI将Word文档转换为HTML格式,以便于在网页上展示或者进行其他Web相关的操作。...

    java使用poi将word文档转为html

    Java中的Apache POI库是一个强大的工具,用于读取、创建和修改Microsoft Office格式的文件,包括Word(.doc和.docx)文档。在本案例中,我们关注的是如何使用POI将Word文档转换为HTML格式。这个过程对于在网络上展示...

    poi将word转换成html、样式 表格 图片处理

    Apache POI 是一个开源项目,专门用于处理微软的Office文档格式,如Word(.doc, .docx)、Excel(.xls, .xlsx)等。在本案例中,我们关注的是如何使用Apache POI将Word文档转换为HTML格式,并且保持原有的样式、表格...

    基于java的word转html

    在本项目中,"基于java的word转html" 提供了一个工具,利用Java的强大力量将Microsoft Word文档(.doc和.docx格式)转换为HTML格式。这个转换过程能够保留原始Word文档中的各种元素,如图片、表格、链接以及目录,...

    java将word转为html文件工具类

    java将.docx文件和.doc文件转为html文件的工具类。。。

Global site tag (gtag.js) - Google Analytics