最近几天公司要求使用Lucene将索引文件创建到ftp上,查询时也从ftp上的索引文件进行取数据,开始在网上搜了很多,发现了一篇文章是说这个的,但是把其中的代码复制了还有问题并且也不行,文章最后说的源代码也找不到,联系了作者也没有回应,不过文章说得还算清楚,把大概的原理进行了阐述,其中主要为:
继承Directory类并参照FSDirectory类进行改造,本地磁盘文件采用的就是FSDirectory类实现的,现在采用Apache的一个项目Commons-VFS来解决将索引文件创建到ftp服务器上的问题,可以到comms-VFS的官网了解使用需要哪些jar包,以及对那些文件系统给予了支持。
以ftp为例:
1、需要jar包:
需要common-net-x-x.jar包和common-logging-x.jar还有commons-vfs本身的jar包commons-vfs-2.0.zip中的jar包commons-vfs2-2.0.jar
2、API使用例子,获取FileObject,类似于本地磁盘的File类一样
FileSystemManager fsManager = VFS.getManager();FileObject jarFile = fsManager.resolveFile("jar:lib/aJarFile.jar");
其中红色部分为URI,改为ftp的URI即可,现在为jar的URI
格式为:URI Format
ftp://[ username[: password]@] hostname[: port][ absolute-path]
Examples
- ftp://myusername:mypassword@somehost/pub/downloads/somefile.tgz
3、利用commons-net包中ToNetASCIIOutputStream中write方法写到ftp上的文件,根据ip、port、相对路径
写到本地磁盘采用native方法写
需要修改jar中对于RANDOM_ACCESS_WRITE的支持.
相关推荐
它定义了客户端和服务器之间交互的规则,包括如何登录、列出目录、上传和下载文件等。 2. **搜索引擎原理**: 站内搜索引擎主要基于全文检索技术,包括索引建立、查询解析和结果排序等步骤。首先,系统会遍历FTP...
1. **分词和索引**:Lucene首先对文本进行分词,生成一系列的关键词,然后创建倒排索引,使得搜索时能快速定位到包含特定关键词的文档。 2. **高效查询**:通过倒排索引,Lucene可以在微秒级别内完成复杂查询,包括...
《搜索引擎Lucene+Heritrix(第二版)3》是一本深入探讨搜索引擎技术的专业书籍,主要聚焦于两个关键组件:Apache Lucene和Heritrix。Lucene是Java开发的全文检索库,而Heritrix是一款开源的网络爬虫工具。这两者在...
"饮水思源BBS和渔网FTP"是一个学习资源,主要涵盖了两个方面:基于Lucene的BBS(Bulletin Board System,电子公告板)搜索引擎和FTP(File Transfer Protocol,文件传输协议)搜索引擎。这个资源对于想要了解和入门...
总结,基于ASP.NET的新闻发布系统结合了ASP.NET的Web开发优势和C#的编程灵活性,实现了新闻的发布、展示和搜索等一系列功能。在实际开发过程中,还需要考虑系统的性能优化、安全性防护以及用户体验等多个方面,以...
由于lib库部分未包含在这个压缩包中,你需要从其他来源下载Heritrix和Lucene的库文件。这些库通常包含了运行项目所必需的类和方法,包括网络通信、解析HTML、构建索引等。确保获取的版本与代码示例兼容,否则可能会...
- **信息检索的技术过程**:讲解信息单元的标引、标引表达式的组织和索引文件等。 - **检索表达式及其制定**:解释检索表达式的概念、布尔检索技术、检索模型的概念过程等。 - **扩展布尔检索技术**:如截词检索、...
Solr是一种基于Lucene的开源搜索服务器,它提供了一个分布式索引引擎和搜索引擎API,允许用户在应用中实现强大的全文搜索功能。在技术文档《sorl的安装与配置详解.pdf》中,详细介绍了如何在CentOS 7操作系统上安装...
它基于Lucene构建,提供了一个分布式、多用户环境,支持RESTful接口,便于进行数据索引、查询和分析。Elasticsearch的核心特性包括: 1. 分布式:支持跨多个节点的数据分布,能自动处理节点间的通信和数据复制,...
Elasticsearch 是一个基于Lucene的分布式全文搜索引擎,设计用于实时、可扩展的数据存储和搜索。它不仅支持结构化数据,也支持非结构化数据的处理,如日志、文档等。在大数据和实时分析领域,Elasticsearch因其高...
FTP的目标是:(1)提高文件的共享性(计算机程序和/或数据),(2)鼓励间接地(通过程序)使用远程计算机,(3)保护用户因主机之间的文件存储系统导致的变化,(4)为了可靠和高效地传输,虽然用户可以在终端上...
- 同样,调整其他服务端口,如FTP和RMI,以保持网络服务的清晰性 ### 6. 设置Solr分离部署 - 安装单独的Solr服务器,解压并配置Solr的Alfresco核心 - 更新Alfresco的`alfresco-global.properties`文件,指定新的...
AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...
AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...
AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...
AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...
AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...
AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...
AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...
AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...