`

eclipse 导入 lucence源码

 
阅读更多

 

另外一种导入方法,直接导入开发版本即可:

 

https://lucene.apache.org/core/developer.html

 

 

 

 

在网上搜了几个都是过时的讲述,还是从google上找到了一个邮件,虽然写的很简陋但是真的好使了。

 

步骤很简单:

1. 下载 lucence 源码:

    https://lucene.apache.org/core/index.html

     点击下载,在点击对应的镜像url之后会看到类似ftp的东西,选择对应的源码。例如我选择的是:

     http://mirrors.cnnic.cn/apache/lucene/java/5.1.0/

     lucene-5.1.0-src.tgz

     之后解压。

     

2.   打开eclipse,创建一个普通的java工程,里面是空的,只有src空目录。

 

3.   右击 src,选择import, 选择 General-->File System 然后点击对话框下面的Next。进入另外一个对话框,在这个选择框里选择 刚才解压的目录,然后选择 core/src/java  这个目录。然后点击对话框最下面的Finish即可。这时候顺利的话就会成功导入了。

 



 

 

 

4. 好,那么然后呢?

我在导入的时候看到有部分有红色的叉,仔细看是说不支持jre 1.7之下的环境,需要切换成jre1.7环境,由于已经装了jre1.7 ,由于eclipse 创建项目时默认是低版本的,所以有这个问题,点击他的提示之后就自动修复好了。至此,lucence core就导入完事了。

那么,问题来了,lucence还有许多文件我还没导啊,原来解压的那个文件夹下面有一堆的文件夹呢。

别急,看完core之后就可以一个个使用类似方法导入一点点看了。

在core/src/java下有一个overview.html 可以看到:

 

The Lucene API is divided into several packages:

  • {@link org.apache.lucene.analysis} defines an abstract {@link org.apache.lucene.analysis.Analyzer Analyzer} API for converting text from a {@link java.io.Reader} into a {@link org.apache.lucene.analysis.TokenStream TokenStream}, an enumeration of token {@link org.apache.lucene.util.Attribute Attribute}s.  A TokenStream can be composed by applying {@link org.apache.lucene.analysis.TokenFilter TokenFilter}s to the output of a {@link org.apache.lucene.analysis.Tokenizer Tokenizer}.  Tokenizers and TokenFilters are strung together and applied with an {@link org.apache.lucene.analysis.Analyzer Analyzer}.  analyzers-common provides a number of Analyzer implementations, including StopAnalyzer and the grammar-based StandardAnalyzer.
  • {@link org.apache.lucene.codecs} provides an abstraction over the encoding and decoding of the inverted index structure, as well as different implementations that can be chosen depending upon application needs.
  • {@link org.apache.lucene.document} provides a simple {@link org.apache.lucene.document.Document Document} class.  A Document is simply a set of named {@link org.apache.lucene.document.Field Field}s, whose values may be strings or instances of {@link java.io.Reader}.
  • {@link org.apache.lucene.index} provides two primary classes: {@link org.apache.lucene.index.IndexWriter IndexWriter}, which creates and adds documents to indices; and {@link org.apache.lucene.index.IndexReader}, which accesses the data in the index.
  • {@link org.apache.lucene.search} provides data structures to represent queries (ie {@link org.apache.lucene.search.TermQuery TermQuery} for individual words, {@link org.apache.lucene.search.PhraseQuery PhraseQuery} for phrases, and {@link org.apache.lucene.search.BooleanQuery BooleanQuery} for boolean combinations of queries) and the {@link org.apache.lucene.search.IndexSearcher IndexSearcher} which turns queries into {@link org.apache.lucene.search.TopDocs TopDocs}. A number of QueryParsers are provided for producing query structures from strings or xml.
  • {@link org.apache.lucene.store} defines an abstract class for storing persistent data, the {@link org.apache.lucene.store.Directory Directory}, which is a collection of named files written by an {@link org.apache.lucene.store.IndexOutput IndexOutput} and read by an {@link org.apache.lucene.store.IndexInput IndexInput}.  Multiple implementations are provided, including {@link org.apache.lucene.store.FSDirectory FSDirectory}, which uses a file system directory to store files, and {@link org.apache.lucene.store.RAMDirectory RAMDirectory} which implements files as memory-resident data structures.
  • {@link org.apache.lucene.util} contains a few handy data structures and util classes, ie {@link org.apache.lucene.util.FixedBitSet FixedBitSet} and {@link org.apache.lucene.util.PriorityQueue PriorityQueue}.

 

 

 

 

  • 大小: 39 KB
  • 大小: 44.7 KB
分享到:
评论

相关推荐

    lucene 2.4.1源码在eclipse调试运行通过

    为了调试Lucene源码,我们需要在代码中设置断点,然后启动调试模式。 1. 在需要调试的代码行号前单击,会出现一个红点,表示设置了断点。 2. 右键点击项目,选择“Run As” -> “Java Application”。 3. Eclipse将...

    lucene-4.0.0-src.zip 【Lucene 4.0.0源码包src , source】

    1. **导入源码**:解压`lucene-4.0.0-src.zip`,然后在Eclipse中选择"File" > "Import" > "Existing Projects into Workspace",导入Lucene项目。 2. **配置构建路径**:确保所有依赖的JAR文件已添加到项目的构建...

    lucene 3.4源码包,适用于XP,WIN7系统

    总的来说,Lucene 3.4.0源码包是一个宝贵的教育资源,对于希望提升搜索技术能力的开发者来说,无论是 XP 还是 WIN7 系统,都可以轻松导入到Eclipse环境中进行学习和实践。通过深入研究,不仅可以提高开发效率,还能...

    IK Analyzer 2012FF_hf1_IK分词lucene4.0_源码

    1. **安装与配置**:将源码导入到开发环境中,如Eclipse或IntelliJ IDEA,然后根据项目需求配置相应的词典路径和分词模式。 2. **构建词典**:根据业务场景,创建或修改词典文件,增加专业术语或行业词汇,以提高...

    Lucene+HighLighter高亮显示实例

    在开发过程中,我们可以借助Eclipse这样的IDE,通过创建项目,配置Maven依赖,导入Lucene库,编写代码并运行测试。`.classpath`、`.mymetadata`、`.project`、`.settings`等文件是Eclipse项目配置文件,它们记录了...

    solr(solr-9.0.0-src.tgz)源码

    - 使用IDE如IntelliJ IDEA或Eclipse导入源码,可以方便地调试和开发Solr插件。 - 测试框架如SolrTestCaseJ4用于编写单元测试和集成测试,确保代码质量。 6. **高级特性** - ** faceting(分面搜索)**: 提供了对...

    java(结合lucene)版的公交搜索系统_javaso毕业设计—(包含完整源码可运行).rar

    6. **开发环境与工具**:开发者可能使用Eclipse或IntelliJ IDEA作为Java开发环境,利用Maven或Gradle管理依赖,Git进行版本控制,以及JUnit进行单元测试。 7. **文件结构**:压缩包中的文件可能包括源码文件、配置...

    apache-nutch-1.16.rar 已编译好的版本,可以直接导入eclipse、idea

    Nutch 1.16是该项目的一个稳定版本,已经预先编译完成,方便开发者直接在Eclipse或IntelliJ IDEA这样的集成开发环境中导入使用,无需自行配置和编译源代码。 **Nutch的组成部分** 1. **Web爬虫**:Nutch的爬虫负责...

    nutch爬虫+java+eclipse

    然后,下载Nutch源码(如nutch2.2.1-src),导入Eclipse作为Java项目。配置项目的构建路径,确保包含所有必要的依赖库,如Hadoop和Lucene。 3.2 编译和构建:使用Eclipse的编译工具对Nutch源码进行编译。这通常包括...

    vsm向量空间模型java实现(源码)

    2. **设置依赖**: 如果源码依赖了其他库(如Apache Lucene等),确保已添加相应的JAR文件到项目的类路径中。 3. **运行代码**: 编译并运行源码中的示例或测试类,查看VSM的实现是否正确。 **应用场景** VSM在多个...

    育儿论坛.zip包含源码+数据库sql+安装方式

    开发工具:IDEA 或 Eclipse Java版本:JDK 1.8 服务器:tomcat8.5 数据库:MySQL 5.6 系统采用技术:Spring 5.0 + SpringMVC + JSP + Jdbc + Ehcache + Lucene(搜索) +jQuery + Ajax +面向接口编程 ...

    elasticsearch6.6.1源码

    Elasticsearch 6.6.1源码分析 Elasticsearch是一个开源的、分布式、全文检索的搜索引擎,它以其高效、灵活和可扩展性而受到广大开发者和企业的青睐。...将源码导入IDEA或Eclipse,可以更方便地进行调试和学习。

    JSP网上商店源码

    开发者可以利用Maven或Gradle进行项目构建和依赖管理,确保所有必要的库都能正确导入。此外,为了保证代码质量和可维护性,良好的编程规范和设计模式的运用至关重要。 总结来说,"JSP网上商店源码"是一个涵盖全面的...

    Nutch 安装ppt

    本文介绍了 Nutch 的基本概念、架构以及如何在 Eclipse 中导入和配置 Nutch。同时,还探讨了如何与 Solr 整合以及如何使用 Lucene 进行文本索引和搜索。通过本文的学习,可以帮助读者更好地理解 Nutch 的工作原理和...

    testLucene:Lucene 测试

    2. **导入项目**:将`testLucene-master`导入IDE,如IntelliJ IDEA或Eclipse。 3. **理解源码**:分析项目中的关键类,如`Indexer`(负责索引构建)、`Searcher`(负责执行查询)和`Analyzer`实现。 4. **运行示例...

    java毕业设计之抑抑心理交流平台源码.zip

    3. 开发环境:使用IDEA或Eclipse,导入项目后,根据提供的"java环境说明.docx"和"java环境及部署说明.zip"文件进行环境配置,包括添加依赖、配置数据库连接等。 四、核心功能实现 1. 用户模块:包括用户注册、登录...

    elasticsearch_5.3.0源代码

    1. 导入项目:将解压后的elasticsearch-5.3目录导入到Eclipse中,配置好JDK和Maven环境,即可开始源码阅读。 2. 构建与运行:通过Maven的生命周期管理,可以编译源码、运行测试、打包项目。 3. 调试与日志:Elastic...

    Solr项目源码及solr资源包

    3. **项目结构**:导入Eclipse的项目可能包括以下部分:源代码(src/main/java),包含了使用Spring Data Solr编写的业务逻辑和数据访问层;资源文件(src/main/resources),可能包含Solr配置文件如schema.xml和...

    Java论坛系统巡云轻论坛采用JAVA+MYSQL架构,自适应手机端和电脑端,界面简洁,性能高效.rar

    巡云轻论坛系统包含论坛、问答模块。采用JAVA+MYSQL架构,自适应手机端...4.在Eclipse中打开src\test\java\forum\Init.java执行main方法,将SQL导入到数据库,然后重启Tomcat即可正常运行。管理员初始账号admin 密码1234

    Java论坛系统巡云轻论坛采用JAVA+MYSQL架构,自适应手机端和电脑端,界面简洁,性能高效 .rar

    巡云轻论坛系统包含论坛、问答模块。采用JAVA+MYSQL架构,自适应手机端...4.在Eclipse中打开src\test\java\forum\Init.java执行main方法,将SQL导入到数据库,然后重启Tomcat即可正常运行。管理员初始账号admin 密码1234

Global site tag (gtag.js) - Google Analytics