HSSF是POI工程对Excel 97(-2007)文件操作的纯Java实现
XSSF是POI工程对Excel 2007 OOXML (.xlsx)文件操作的纯Java实现
从POI 3.8版本开始,提供了一种基于XSSF的低内存占用的API----SXSSF
SXSSF通过一个滑动窗口来限制访问Row的数量从而达到低内存占用的目录,XSSF可以访问所有行。旧的行数据不再出现在滑动窗口中并变得无法访问,与此同时写到磁盘上。
在自动刷新的模式下,可以指定窗口中访问Row的数量,从而在内存中保持一定数量的Row。当达到这一数量时,在窗口中产生新的Row数据,并将低索引的数据从窗口中移动到磁盘中。
或者,滑动窗口的行数可以设定成自动增长的。它可以根据需要周期的根据一次明确的flushRow(int keepRows)调用来进行修改。
注意:针对 SXSSF Beta 3.8下,会有临时文件产生,比如:
poi-sxssf-sheet4654655121378979321.xml
文件位置:java.io.tmpdir这个环境变量下的位置
Windows 7下是C:\Users\xxxxxAppData\Local\Temp
Linux下是 /var/tmp/
要根据实际情况,看是否删除这些临时文件
官方也提供了一些解决方式:
https://issues.apache.org/bugzilla/show_bug.cgi?id=53493
与XSSF的对比
在一个时间点上,只可以访问一定数量的数据
不再支持Sheet.clone()
不再支持公式的求值
特性汇总
分享到:
相关推荐
在"poi-3.8-POI-HSSF和POI-XSSF和SXSSF.rar"这个压缩包中,主要涵盖了POI项目对Excel文件处理的三个关键组件:HSSF、XSSF和SXSSF。 1. HSSF (Horrible Spreadsheet Format):这是POI项目早期开发的一个API,用于...
首先,Apache POI提供了三种主要的接口来操作Excel文件:HSSF(Horrible Spreadsheet Format)用于处理老版本的.xls文件,XSSF(XML Spreadsheet Format)用于处理.xlsx文件,而SXSSF(Streaming Usermodel API)则...
excel实现大数据量输出,xlsx是必选格式,目前poi中对xssf消耗内存情况,给出sxssf方法进行处理,但是如果输出格式中包含图形和格式的复杂文本情况,如何有效实现,之前一直没有一个较好的方式; 本文中提出,用hssf...
excel实现大数据量输出,xlsx是必选格式,目前poi中对xssf消耗内存情况,给出sxssf方法进行处理,但是如果输出格式中包含图形和格式的复杂文本情况,如何有效实现,之前一直没有一个较好的方式; 本文中提出,用hssf...
### HSSF与XSSF的主要区别: 1. **文件格式支持**:HSSF支持.xls格式,这是Excel的老式二进制格式。XSSF则支持.xlsx格式,这是Office 2007之后引入的基于XML的文件格式。 2. **内存消耗**:XSSF在处理大型工作簿时...
HSSF,XSSF和XSSF类 Apache POI主类通常以HSSF , XSSF或SXSSF开头。 HSSF –是POI项目对Excel '97(-2007)文件格式的纯Java实现。 例如 , 。 XSSF –是POI项目对Excel 2007 OOXML(.xlsx)文件格式的纯Java实现...
4. POI API核心组件:除了HSSF, XSSF和SXSSF之外,Apache POI还提供了其他核心组件,如HWPF(用于处理Word文档),HDGF(处理PowerPoint演示文稿),HPBF(处理Publisher文件),以及一系列通用的低级别模型和解析器...
在IT行业中,Apache POI 是一个非常著名的Java库,它允许开发者读取、写入以及操作Microsoft Office格式的文件,尤其是...理解HSSF、XSSF和SXSSF的区别及其应用场景,将有助于开发出更高效、更健壮的Excel处理程序。
合理利用HSSF、XSSF和SXSSF API,结合良好的编程实践,能够构建高效且可靠的Excel处理工具。在实际项目中,应根据具体需求选择合适的API,并注意内存管理和异常处理,以确保程序的稳定性和性能。
4. **POI-SS**: 这是HSSF、XSSF和SXSSF的通用接口,为开发者提供了一种独立于具体实现的编程模型。 5. **POI-HWPF**: 处理老版Word文档(.doc)的API。 6. **POI-ODF**: 此组件提供了对OpenDocument格式(.odt、....
- 使用适当的API(HSSF/XSSF/SXSSF)取决于文件格式和内存限制。 - 避免一次性加载大量数据到内存,利用SXSSF进行流式处理。 - 注意处理大文件时可能出现的内存溢出问题,及时释放不再需要的对象。 - 编写单元...
在处理大型Excel文件时,传统的HSSF和XSSF模型可能会遇到性能瓶颈,因为它们将整个工作簿加载到内存中。为了解决这个问题,POI提供了SXSSF(Streaming Usermodel API)和XSSFEventUserModel API。这里的主题是利用...
XSSF和SXSSF更适合大数据量操作。 - 性能优化:对于大文件,使用SXSSF的事件模型可以显著降低内存占用,但需要更复杂的编程模式。 通过上述信息,开发者可以利用Apache POI进行各种Excel操作,无论是简单的数据...
- 为了保证内存效率,尤其是在处理大型Excel文件时,建议使用SXSSF(Streaming Usermodel API)代替HSSF和XSSF。SXSSF在内存中仅保留有限的行数,其余行写入磁盘,适合大数据量处理。 - 谨慎处理Excel公式,因为...
它提供了一个低级别的模型(HSSF for .xls, XSSF for .xlsx)和一个更高层次的事件模型(SXSSF)。HSSF和XSSF将整个工作簿存储在内存中,适合小到中等大小的数据集,但对大型文件来说,内存消耗过大,容易引发OOM。...
- **流式读写**: 为了提高性能,可以使用低级别的事件模型API,如EventRecordFactory(对于HSSF)和SXSSF事件模型(对于XSSF),它们不需一次性加载整个文件到内存。 5. **示例代码**: - 创建Excel工作表: ```...
本文将深入探讨使用HSSF(用于处理老版本的BIFF8格式的Excel,即97-2003版)和XSSF(用于处理XML格式的新版Excel,2007及以上版本)时可能遇到的问题以及解决方案。 1. **内存管理**: - **问题**:处理大型Excel...
HSSF和SXSSF(内存优化版本)是POI提供的接口,用于读写xls文件,而XSSF和SXSSF(同样有内存优化版本)用于.xlsx文件。此外,Sheet、Row、Cell等类提供了对工作表、行和单元格的访问和操作。 在实际应用中,读取...
- 主要组件:HSSF(处理老版Excel .xls格式),XSSF(处理Excel .xlsx格式),SXSSF(提供内存效率高的处理大型Excel文件)。 2. **XSSF工作原理**: - XSSF使用XML序列化技术存储数据,这使得文件可以包含大量...
1. **流式处理(Streaming User Model API)**:POI提供了SXSSF(Streaming Usermodel API)作为替代传统的HSSF和XSSF。SXSSF以滑动窗口的方式存储最近使用的行在内存中,其余数据写入磁盘,从而极大地降低了内存...