package document;
import interfaces.ICommon;
import java.io.File;
import java.io.InputStream;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import common.AddTxt;
/**
* 将excel中的内容复制到txt中
*
* @author DanielCooger <a href="mailto:tangjunfeng52099@gmail.com">daniel</a>
*/
public class Xlsx implements ICommon{
private String date = new SimpleDateFormat("yyyyMMddHHmmss")
.format(new Date());
// 新建txt文件
private String xlsx = "d:\\doc\\XLSX" + date + ".txt";
// xls源文件
private String path = "d:\\doc";
/**
* 得到xlsx中的内容
*/
public boolean readText(String file) throws Exception{
String text = null;
try {
// 解压Book1.xlsx
ZipFile xlsxFile = new ZipFile(new File(file));
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
// 先读取sharedStrings.xml这个文件备用
ZipEntry sharedStringXML = xlsxFile.getEntry("xl/sharedStrings.xml");
InputStream sharedStringXMLIS = xlsxFile.getInputStream(sharedStringXML);
Document sharedString = dbf.newDocumentBuilder().parse(sharedStringXMLIS);
NodeList str = sharedString.getElementsByTagName("t");
String sharedStrings[] = new String[str.getLength()];
for (int n = 0; n < str.getLength(); n++) {
Element element = (Element) str.item(n);
sharedStrings[n] = element.getTextContent();
}
// 找到解压文件夹里的workbook.xml,此文件中包含了这张工作表中有几个sheet
ZipEntry workbookXML = xlsxFile.getEntry("xl/workbook.xml");
InputStream workbookXMLIS = xlsxFile.getInputStream(workbookXML);
Document doc = dbf.newDocumentBuilder().parse(workbookXMLIS);
// 获取一共有几个sheet
NodeList nl = doc.getElementsByTagName("sheet");
for (int i = 0; i < nl.getLength(); i++) {
Element element = (Element) nl.item(i);// 将node转化为element,用来得到每个节点的属性.
// 接着就要到解压文件夹里找到对应的name值的xml文件,比如在workbook.xml中有<sheet
// name="Sheet1" sheetId="1" r:id="rId1" /> 节点
// 那么就可以在解压文件夹里的xl/worksheets下找到sheet1.xml,这个xml文件夹里就是包含的表格的内容
ZipEntry sheetXML = xlsxFile.getEntry("xl/worksheets/"+ element.getAttribute("name").toLowerCase() + ".xml");
InputStream sheetXMLIS = xlsxFile.getInputStream(sheetXML);
Document sheetdoc = dbf.newDocumentBuilder().parse(sheetXMLIS);
NodeList rowdata = sheetdoc.getElementsByTagName("row");
for (int j = 0; j < rowdata.getLength(); j++) {
// 得到每个行
// 行的格式:
/*
* <row r="1" spans="1:3">r表示第一行,spans表示有几列 <c r="A1"
* t="s">/
* /r表示该列的列表,t="s"个人认为是表示这个单元格的内容可以在sharedStrings.xml这个文件里找到
* ,对应的节点 下标就是v节点的值,即0,若没有t属性,则v的值就是该单元格的内容 <v>0</v> </c> <c
* r="B1" t="s"> <v>1</v> </c> <c r="C1" t="s"> <v>2</v>
* </c> </row>
*/
Element row = (Element) rowdata.item(j);
// 根据行得到每个行中的列
NodeList columndata = row.getElementsByTagName("c");
for (int k = 0; k < columndata.getLength(); k++) {
Element column = (Element) columndata.item(k);
NodeList values = column.getElementsByTagName("v");
Element value = (Element) values.item(0);
if (column.getAttribute("t") != null & column.getAttribute("t").equals("s")) {
// 如果是共享字符串则在sharedstring.xml里查找该列的值
// System.out.print(sharedStrings[Integer.parseInt(value.getTextContent())]);
text+=sharedStrings[Integer.parseInt(value.getTextContent())];
} else {
// System.out.print(value.getTextContent());
text+=value.getTextContent();
}
}
}
}
if(new AddTxt().addtxt(path,xlsx,text,true)){
System.out.println("ok");
return true;
}else{
return false;
}
} catch (Exception e) {
e.printStackTrace();
return false;
}
}
}
分享到:
相关推荐
Apache POI通过解析这些XML文件,为我们提供了读写xlsx文件的能力。 在开始之前,确保你的开发环境已安装了Eclipse 3.7.2和JRE 6,并且已经将Apache POI库添加到项目的类路径中。Apache POI的jar文件通常包含在`lib...
在Java编程中,读取本地的.xls和.xlsx文件通常涉及到数据处理、数据分析或者报表生成等场景。这些文件格式是Microsoft Excel用于存储表格数据的标准格式,.xls是早期版本的Excel文件,而.xlsx则是较新的XML格式,...
以下是一个基本的Java代码示例,演示如何使用Apache POI读取`.xls`和`.xlsx`文件: ```java import org.apache.poi.ss.usermodel.*; import org.apache.poi.xssf.usermodel.XSSFWorkbook; import org.apache.poi....
在Java编程环境中,读取Excel文件是常见的任务,特别是在数据处理和分析的场景下。`jxl`库是一个广泛使用的第三方库,它允许开发者轻松地读取、写入和修改Excel文件。本篇文章将深入探讨如何利用`jxl.jar`包来实现这...
因此,我们可以使用Java的ZipInputStream和ZipEntry类来读取.xlsx文件。 转换的核心库是Apache POI,这是一个用于读写Microsoft Office格式档案的Java API。POI提供了对Excel文件(包括.xlsx)的全面支持,让我们...
在Java中,如果你需要生成或操作Excel文件,尤其是.xlsx格式(这是Excel 2007及以上版本使用的Open XML格式),那么Apache POI库就是首选工具。下面将详细介绍如何使用Java POI库来生成Excel(xlsx)文件。 首先,...
通过以上介绍,你应该了解了如何使用Java读取.xls和.xlsx文件的基本方法,以及涉及的相关知识点。在具体实践中,可能还需要根据需求进行更复杂的操作,如处理公式、样式、图表等,但这已经为你打下了坚实的基础。
总结来说,解决Java读取Excel内存溢出问题,关键在于合理利用资源、优化代码逻辑以及选择适合的API,如Apache POI的SXSSF。通过这些方法,我们可以在不显著增加系统资源负担的情况下,高效地处理大Excel文件。
总结起来,Java读取Excel数据涉及的主要知识点有:Apache POI库的使用,包括`.xls`和`.xlsx`格式的处理;Android环境下的兼容性考虑,可能需要使用`jxl`库;以及如何通过Java代码遍历Excel文件的行和单元格,获取并...
标题中的“poi读取xlsx和xls”指的是使用Apache POI库来处理Microsoft Office的两种不同文件格式:Excel的.xlsx(基于OpenXML标准)和.xls(基于老版的BIFF格式)。Apache POI是一个流行的Java库,它允许开发人员在...
该项目包含了项目所需要的jar包以及测试案例。项目使用环境为eclipse jdk1.8 1.poi.Testpoi为测试用例;...3.解决了javadbf读取dbf文件表头和数据乱码问题,com.webadmin.util.dbf.DBFReaderTest为测试用例。
标题"java读取excel之xlsl超大文件"所涉及的核心知识点是优化大量数据的读取策略。在Java中,可以使用Apache POI的SXSSF API(Streaming Usermodel API)来实现这种优化。与常规的XSSF API不同,SXSSF允许我们以流的...
Java POI库是一个广泛使用的开源项目,专门用于处理Microsoft Office格式的文件,包括Excel的.xls和.xlsx文件。在本示例中,我们关注的是如何利用Java POI来根据模板生成.xlsx格式的Excel文件。这个过程涉及到对...
Apache POI是一个流行的开源Java API,专为Microsoft Office文件格式提供读写功能,包括Excel。 首先,要开始这个项目,你需要在你的Android工程中添加Apache POI库。由于POI是一个Java库,不直接支持Android,所以...
在“java读取Excel的实例”中,我们可能使用Apache POI库来实现以下关键步骤: 1. **引入依赖**:首先,我们需要在项目的Maven或Gradle配置文件中引入Apache POI的相关依赖。如果是Maven项目,可以在`pom.xml`中...
### Java读取Excel POI方法详解 #### 一、POI简介及背景 Apache POI 是一个用于处理 Microsoft Office 格式文件的开源库,它提供了读取、写入和修改这些文件的功能。POI 项目中最常用的部分是 HSSF 和 XSSF,分别...
该代码可以处理100万数据量的excel文件,xlsx文件数据量太大,用普通的读法会报内存溢出错误,所以用官网提供的方法,一条一条的读取大excel文件,本例子从这点出发,组装excel里读取的单条数据为list,在根据需求...
在Java编程环境中,处理`.xlsx`格式的文件通常涉及到Microsoft Excel的数据操作,这些文件是由Microsoft Office的Excel程序创建的,但也可以用其他工具或编程语言进行读写。`.xlsx`文件是基于Open XML标准,存储在...
- **兼容性测试**:生成的xlsx文件需要在不同的Excel版本和程序中能正确打开和读取。 通过这种方式,我们可以灵活地处理大数据量的导出任务,同时避免了直接使用POI可能带来的性能问题。在实际开发中,这种方法可以...
Java操作Excel (.xlsx)主要涉及的是Apache POI库的使用,这是一个开源的Java API,用于处理Microsoft Office格式的文件,包括Excel的XLS和XLSX格式。在本项目中,我们利用POI来实现对.xlsx文件的读取和写入功能。...