精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2009-07-05
最后修改:2009-07-05
java解析Office文档最有名的开源包当属Apache的Poi,目前的版本已支持Office 2007文档解析,同时向下兼容。 import java.io.File; import org.apache.poi.POITextExtractor; import org.apache.poi.extractor.ExtractorFactory; public class DocxParser { /** * @param args */ public static void main(String[] args) { try { File inputFile = new File("D:\\test.docx"); //File inputFile = new File("D:\\test.pptx"); //File inputFile = new File("D:\\test.xlsx"); //File inputFile = new File("D:\\test.xls"); //File inputFile = new File("D:\\test.doc"); //File inputFile = new File("D:\\test.ppt"); POITextExtractor extractor = ExtractorFactory .createExtractor(inputFile); System.out.println("Document Text: "); System.out.println("===================="); System.out.println(extractor.getText()); System.out.println("===================="); } catch (Exception ex) { ex.printStackTrace(); } } }
我的包如下:
可从下列的URL下载最新包:
Log4j在Java WebApp的配置 http://fonter.iteye.com/blog/418570 J2ME to android之学习笔记 http://fonter.iteye.com/blog/416112 安装Jar提示“jar文件无效”的另一个奇怪原因 http://fonter.iteye.com/blog/414188
声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
浏览 5424 次