解决的问题:
由于公司有上千个文档,如WORD、EXCEL、PPT等,目前存放都是以文件系统的方法,就是用SVN进行管理,用目录存放,非常不方便查找文件。
那么,结合网上找到一些朋友写的算法,然后在此基础上进行了补充:可以通过要查找的内容,来得到符合条件的文件。
一、使用顺序:
1、首先配置索引存放目录,默认是:D:\\doc\\index,如果没创建目录,程序会自动创建:Constants.DIRECTORY_INDEX_PATH
2、指定要搜索的文件所在目录:Constants.DIRECTORY_FILE_PATH
3、创建索引:运行 Indexer.java 中的main方法
4、开始查找内容:运行 Searcher.java 的main方法
A、支持office2003-2010的EXCEL、WORD、PPT查找,并还支持PDF
B、创建索引时,支持文件递归查找
C、支持屏蔽指定目录创建索引,如有些目录不想加进来
D、支持目录查找
二、存在问题
1、待支持的文件类型,如:TXT、SQL、VISIO等,大家有空可以继续扩展,前2个很简单
2、文件查找算法存在一些问题:Searcher.java searcher方法,有些搜索词不能查出来,如提供的测试文件:51CTO下载-ORACLE__SQL语句教学.pdf,
搜索内容:子查询使用主查询的数据
源代码地址:
http://ishare.iask.sina.com.cn/f/69219507.html
- 大小: 48.7 KB
分享到:
相关推荐
资源中包括工具类、jacob.jar和jacob-1.18-x64.dll(64位)、jacob-1.18-x86.dll(32位) 在使用jacob时,我们需要将jacob-1.18-x64.dll或jacob-1.18-x86.dll放到jdk的bin目录下或者jdk/jre的bin目录下才可以使用。
在Java编程环境中,将文档(如Excel、Word、PDF、PPT)转换为图片是一种常见的需求,这在处理大量文档预览、数据可视化或者移动设备兼容性问题时尤其有用。以下是一些关于如何使用Java实现这种转换的关键知识点: 1...
实现word excel ppt转为pdf,并提供转格式后删除原来的文件。(需要使用jcom)
本篇文章将深入探讨如何使用Java将Office Word、PDF、Excel和PPT文件转换为HTML文件。 首先,我们需要了解的是,Java中的文件转换通常依赖于第三方库,因为Java标准库并不直接支持这些特定的转换功能。以下是一些...
本教程将详细介绍如何使用Free Spire.Office for Java库为Word、PPT和PDF文档添加文本水印,以及如何利用Apache POI库为Excel文档实现相同功能。 1. **Free Spire.Office for Java** Free Spire.Office for Java是...
本主题主要关注如何使用JAVA编程语言将常见的办公软件格式,如Word(.doc)、Excel(.xls)、PowerPoint(.ppt)以及图像文件(如.tif)转换为统一的PDF格式。PDF(Portable Document Format)因其跨平台兼容性和...
本项目是一个基于Spring Boot框架实现的实用工具,用于将Microsoft Office的三种常见文件格式——Word(.docx)、Excel(.xlsx)和PowerPoint(.pptx)转换为PDF格式。这个小Demo提供了完整的功能,无需任何水印,...
jacob操作WPS、Office对应Word、Excel、PPT生成PDF,采用版本为jaco1.7X。
JAVA 读取 WORD_EXCEL_POWERPOINT_PDF 文件的方法是使用 Apache POI 库来实现的。POI 库是一个开放源代码的 Java 库,提供了对 Microsoft Office 文件格式的读写能力。 读取 WORD 文件 在读取 WORD 文件时,需要...
总结来说,Java代码实现的Word、Excel和PPT转PDF工具类是通过使用Apache POI库读取Office文件,再结合iText、PDFBox或Aspose等库生成PDF,从而完成文件格式的转换。这种转换有助于确保文档在各种环境下的统一展示,...
总之,“word,excel,ppt转换成pdf项目的依赖jar”是一个基于Java的解决方案,通过集成Apache POI、iText和PDFBox等库,实现了Office文档到PDF的高效转换。如果你在Java环境中处理文件转换,这个项目可以作为一个有...
从给定的代码片段和描述来看,我们正在探讨如何使用Java来解析并提取PDF、Word、PPT和Excel文档中的文本信息。这是一个在文档管理和数据处理领域非常实用的技术,尤其是在需要自动化处理大量文档的情况下。 ### ...
"Word、Excel、PPT、PDF在线预览解决方案" 提供了一种高效便捷的方式,让用户无需下载文件即可查看各种类型的文档,提高了用户体验,同时也保障了数据安全。下面我们将详细探讨这些文档格式的在线预览技术。 首先,...
在Unity引擎中,显示Word、Excel、PDF以及PPT等文件是一个常见的需求,尤其是在开发教育、文档查看或者信息展示类的应用时。然而,需要注意的是,由于Android平台原生并不支持这些文件类型的直接显示,因此在Unity中...
### Java通过URL在线预览Word、Excel、PPT、PDF、TXT文档的关键技术与实现 #### 一、概述 在互联网应用中,实现对不同格式文档(如Word、Excel、PPT、PDF、TXT等)的在线预览功能是一项常见但重要的需求。这不仅...
标题中的“poi将word、PPT、Excel转pdf实现在线预览的jar包”涉及到的是Apache POI库在Java开发中的应用,以及如何利用它来处理Microsoft Office文档并转换为PDF格式,以便进行在线预览。Apache POI是Java平台上用于...
Java 使用 Jacob 将微软 Office 中 Word、Excel、PPT 转成 PDF 摘要:本篇文章主要介绍了使用 Java 语言和 Jacob 库将微软 Office 中的 Word、Excel 和 PPT 文件转换为 PDF 文件。该方法可以满足一定的参考价值,感...
在Java编程环境中,实现Word、PPT和Excel等文件格式之间的转换是一项常见的需求,尤其是在企业级应用中。这里的关键技术是使用开源项目OpenOffice提供的API,它提供了与Microsoft Office兼容的文档处理能力。...
"文件在线预览及OFFICE(word,excel,ppt)的在线编辑"这一主题涉及的技术点主要包括文件预览技术、OFFICE文档处理、以及集成到Web应用中的策略。以下是对这些知识点的详细说明: 1. **文件在线预览**: 文件在线预览...