- 浏览: 142802 次
- 性别:
- 来自: 上海
文章分类
最新评论
-
ling凌yue月:
Yes,it's good!
JavaScript实现ReplaceAll 方法 -
lj1214388:
请问楼主,我导入了struts-jquery-plugin 的 ...
Jquery Ui 日期控件
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.usermodel.Paragraph;
import org.apache.poi.hwpf.usermodel.Range;
import org.apache.poi.hwpf.usermodel.Table;
import org.apache.poi.hwpf.usermodel.TableCell;
import org.apache.poi.hwpf.usermodel.TableIterator;
import org.apache.poi.hwpf.usermodel.TableRow;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import org.apache.poi.POIXMLDocument;
import org.apache.poi.POIXMLTextExtractor;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
public class ExportDocImpl
{
public void testWord(){
try{
FileInputStream in = new FileInputStream("D:\\2003.doc");//载入文档
POIFSFileSystem pfs = new POIFSFileSystem(in);
HWPFDocument hwpf = new HWPFDocument(pfs);
Range range = hwpf.getRange();//得到文档的读取范围
TableIterator it = new TableIterator(range);
//迭代文档中的表格
while (it.hasNext()) {
Table tb = (Table) it.next();
//迭代行,默认从0开始
for (int i = 0; i < tb.numRows(); i++) {
TableRow tr = tb.getRow(i);
//迭代列,默认从0开始
for (int j = 0; j < tr.numCells(); j++) {
TableCell td = tr.getCell(j);//取得单元格
//取得单元格的内容
for(int k=0;k<td.numParagraphs();k++){
Paragraph para =td.getParagraph(k);
String s = para.text();
} //end for
} //end for
} //end for
} //end while
}catch(Exception e){
e.printStackTrace();
}
}//end method
public static void main(String[] args){
ExportDocImpl ExportDocImpl = new ExportDocImpl();
ExportDocImpl.testWord1();
}
public void testWord1(){
try {
//word 2003: 图片不会被读取
InputStream is = new FileInputStream(new File("D:\\2003.doc"));
WordExtractor ex = new WordExtractor(is);
String str1 = ex.getText();
str1 = str1.replaceAll("", ";");
String text2003 = str1;
System.out.println(text2003);
//word 2007 图片不会被读取, 表格中的数据会被放在字符串的最后
OPCPackage opcPackage = POIXMLDocument.openPackage("D:\\2007.docx");
POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);
String str = extractor.getText();
str = str.replaceAll(" ", ";");
String text2007 = str;
System.out.println(text2007);
} catch (Exception e) {
e.printStackTrace();
}
}
}
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import org.apache.poi.POIXMLDocument;
import org.apache.poi.POIXMLTextExtractor;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
/**
* POI 读取 word 2003 和 word 2007 中文字内容的测试类<br />
* @createDate 2009-07-25
* @author Carl He
*/
public class ParseTable {
public static void main(String[] args) {
try {
//word 2003: 图片不会被读取
InputStream is = new FileInputStream(new File("d:\\2003.doc"));
WordExtractor ex = new WordExtractor(is);
String text2003 = ex.getText();
System.out.println(text2003);
//word 2007 图片不会被读取, 表格中的数据会被放在字符串的最后
OPCPackage opcPackage = POIXMLDocument.openPackage("d:\\2007.docx");
POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);
String text2007 = extractor.getText();
System.out.println(text2007);
} catch (Exception e) {
e.printStackTrace();
}
}
}
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import org.apache.poi.hwpf.extractor.WordExtractor;
public class ParseWord {
public static void main(String[] args) {
File file = new File("d:\\hello.doc");
try {
FileInputStream fis = new FileInputStream(file);
WordExtractor wordExtractor = new WordExtractor(fis);
System.out.println(wordExtractor.getText());
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
发表评论
-
Goole 地图 根据经纬度获取地址
2012-12-10 22:40 828package com.jueyue; import jav ... -
百度地图根据地址获取经纬度
2012-12-10 21:31 8436package com.jueyue; import jav ... -
Java对象的序列化和反序列化实践
2012-12-10 19:52 648当两个进程在进行 ... -
HttpClient 实现访问 HTTPS
2012-11-08 11:24 0避免HttpClient的”javax.net.ssl.SSL ... -
实现一个线程池
2012-05-17 22:40 798public class SjgxrwStartQuest e ... -
通过 HttpClient 下载 文件
2011-10-27 13:49 1009需要有的Jar; * commons-httpclie ... -
Java 文件拷贝
2011-10-26 18:26 783public static void saveFiles(S ... -
生成jar文件的方法
2011-10-13 01:20 716JAR --Java Archive File,顾 ... -
文件下载
2011-08-30 13:58 711public ModelAndView downloadFil ... -
根据Map 动态生成一个类 动态打印
2011-07-15 23:28 909import java.lang.reflect.Field; ... -
Java实现类排序
2011-07-12 16:07 897用Java实现类排序 如下步骤: 1 待排序的类实现 ... -
web service(axis)例子HelloService步骤说明
2011-07-12 11:36 9601.将axis1.1目录下webapps下的axis包拷贝到t ... -
解决一台机器同时运行多个Tomcat服务
2011-07-12 10:07 882如果不加任何修改,在一台服务器上同时运行两个Tomcat服务显 ... -
Java 解析 PDF, pdfbox读取PDF内容
2011-07-04 20:59 6361import java.io.ByteArrayOutputS ... -
Java 页面表格导出Word
2011-06-21 10:28 1766StringBuffer sb = new StringBuf ... -
Java 页面表格导出Word
2011-06-21 10:25 1325StringBuffer sb = new StringBuf ... -
利用lucene对整个数据库建立索引(lucene,SQL,JDBC)(
2011-06-16 23:38 1065导言: 如果要对整个数据库做精确查询或模糊查询,我们怎么才可 ... -
Java Mail 收发邮件
2011-06-15 22:24 855import javax.mail.Address;impor ... -
Java对象序列化
2011-03-09 22:47 722被序列化的类要implements Serializab ... -
JavaScript 为Select添加节点
2011-03-01 09:53 973function addOption(){ var ...
相关推荐
通过Java读取word表格中的内容,将内容存到数据库中,将Word中的图片存到硬盘中
### Java解析Word文件的关键知识点 #### 一、POI库介绍 - **定义与来源**:POI是Apache软件基金会的Jakarta项目中的一个子项目,它提供了一组API,用于处理Microsoft Office格式的文件(如Word、Excel)。POI支持...
标题中的"Java 解析WORD_POI word_java pio_pressureulb_word解析"指出了主要的技术点:使用Java的Apache POI库解析Word文档。Apache POI提供了一个名为HWPF(Horrible Word Processor Format)的API用于处理旧版的....
Java读取Word文档中指定位置(可以自己自定义位置)的表格数据或文本内容 * @param filePath 文档路径 * @param start 指定位置开始读取表格数据的该位置上的字符串 * @param end 指定位置开始结束读取表格数据的该...
总之,Java解析Word2007文档涉及的主要知识点是使用Apache POI库,尤其是其XWPF模块,通过理解Open XML结构和使用相应的API来实现读取、写入和操作Word文档的功能。在实际应用中,还需要结合其他库和最佳实践来提高...
注意,处理Word中的复杂元素,如图片和公式,可能需要额外的库,如`Apache POI-OOXML-Schemas`和`org.xhtmlrenderer`来解析和渲染。公式通常需要转换为MathML或LaTeX格式,然后在HTML中使用JavaScript库如`MathJax`...
在使用Apache POI时,你需要先在项目中引入对应的jar包,这正是“java 解析Word,Excel的jar包”的描述所指。你可以通过Maven或Gradle等构建工具将Apache POI库添加为项目的依赖,或者直接将压缩包解压后的jar文件...
标题中的“poi解析word文档”指的是使用Apache POI库来处理Microsoft Word(.doc或.docx)文件。Apache POI是Java中一个流行的库,它允许开发者读取、写入和修改Microsoft Office格式的文件,包括Word、Excel和...
本文将详细讲解如何使用Java实现Word文件的导出,并结合提供的资源进行解析。 首先,Java导出Word文件通常有两种方式:一是使用Apache POI库,二是使用JODConverter库。Apache POI是广泛使用的开源库,它允许Java...
对于.docx格式的Word文档,Apache POI提供了XWPF(XML Word Processing)API,它可以操作Word文档中的文本、表格、图片等元素。 以下是一个基本的步骤,展示如何使用Java和Apache POI通过XML解析生成Word文档: 1....
java获取多Word文档中表格顺序不变的表格数据 读取文档中的表格数据 * @param filePath 文档路径 * @param tablePoint 查看的表格的ID(第几个表格),若多文档调用该方法处理,需表格位置一致。 * @param total...
本文将详细介绍如何利用C#编程语言实现在Word文档中动态创建表格,并将数据写入到表格中的过程。 #### 前置知识与工具介绍 在开始之前,我们需要对以下概念有所了解: 1. **Microsoft Word API**:这是Microsoft ...
在Java开发中,实现Word表格指定位置盖章并设置章悬浮于文字之上,涉及到的技术主要包括Apache POI库的使用、图像处理以及Word文档对象模型的理解。Apache POI是Java中用于处理Microsoft Office格式文件(如DOCX)的...
5. **表格处理**:创建和编辑Word文档中的表格是Java2Word的一个强项。你可以指定表格的行数、列数,设置单元格的合并,以及单元格内的文本样式。 6. **读取文档**:Java2Word也提供了读取现有Word文档的功能。通过...
在Java编程环境中,实现Word表格指定位置盖印并设置印章悬浮于文字之上,涉及到的技术主要包括Apache POI库的使用、图像处理以及Word文档的操作。Apache POI是Java中广泛使用的微软Office文档处理库,它允许开发者...
通过使用Apache POI,我们可以解析Word文档中的内容,包括文本、表格等。 以下是一个基本步骤: 1. 引入Apache POI库:在Java项目中添加Apache POI依赖,通常通过Maven或Gradle完成。 2. 打开Word文件:使用POI API...
在Java编程环境中,读取Word文档的页码是一项常见的任务,尤其在处理大量文档数据时。这个场景下,我们通常会使用Apache POI库,这是一个强大的API,专门用于处理Microsoft Office格式的文件,包括Word(.doc和.docx...
在Java编程环境中,读取和操作Microsoft Word文档通常需要依赖外部库,Apache POI就是其中最常用的一个。Apache POI是一个开源项目,它允许开发者使用Java处理Microsoft Office格式的文件,包括Word(.doc和.docx)...
例如,你可以创建一个`.ftl`文件,其中包含表格的定义,然后在表格中插入动态数据。 当涉及到多表格的复杂Word文档时,我们需要在FTL模板中定义多个表格,并在运行时填充这些表格的数据。FreeMarker支持多种数据...
在Java开发中,实现Word文档的在线预览是一项常见的需求,尤其在企业级应用中,例如文档管理系统或者协同办公平台。这项功能可以让用户无需下载原始文件就能查看文档内容,提高工作效率并减少服务器存储压力。本资源...