Solr 分词器(analyzer)是怎么传到Luence的 -

kobe学java

浏览: 263773 次
性别:
来自: 苏州

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Solr 分词器(analyzer)是怎么传到Luence的

博客分类：

Solr 分词器(analyzer)是怎么传到Luence的

(2011-11-02 17:41:48)

转载▼

标签：

Solr的分词器我们都知道，是配置在schema.xml配置文件中，不同的fieldType我们都可以给他配置分词器。Solr有两个地方分别是创建索引(INDEX)和查询(query),通过Solr的源码如下：

          if (queryAnalyzer==null) queryAnalyzer=analyzer;
          if (analyzer==null) analyzer=queryAnalyzer;
          if (analyzer!=null) {
            ft.setAnalyzer(analyzer);
            ft.setQueryAnalyzer(queryAnalyzer);
          }
   queryAnalyzer 为查询时用到的分词器，    analyzer为建索引时用到的分词器。从上面可以看出，如果我们没有配查询的分词  器，则用创建的分词器，同理，如果创建时的分词器为空，则用查询的分词器。如果两个都为空，就是没有分词器了。
注意，这里的analyzer和queryAnalyzer 都是TokenizerChain，里面包含了一个分词器的链。

主要问题是，Solr是在什么时候用到这些分词器的呢，通过调试，发现，Solr是在DirectUpdateHandler2的addDoc(AddUpdateCommand cmd)方法里面的两行代码如下：
synchronized (this) {
        // adding document -- prep writer
        openWriter();
        tracker.addedDocument( cmd.commitWithin );
} // end
addDoc方法是我们新建索引时调用的。openWriter是打开indexWriter，这里会判断indexWriter是否为空，如果为空则会创建一个createMainIndexWriter实例，代码如下：
if (writer==null) {
      writer = createMainIndexWriter("DirectUpdateHandler2", false);  //这里就是new一个SolrIndexWriter实例
}
createMainIndexWriter方法就是new一个SolrIndexWriter实例，会传一个schema给SolrIndexWriter通过构造函数。
SolrIndexWriter继承luence的IndexWriter，创建indexWriter时会把schema的analyzer传给IndexWriterConfig。
这样luence的indexWriter就分词器就保存在IndexWriterConfig上。

分享到：

spring security 密码编码器 | Solr Replication (复制) 索引和文件的工作 ...

2012-03-14 08:13
浏览 1108
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Solr 分词器(analyzer)是怎么传到Luence的

Solr 分词器(analyzer)是怎么传到Luence的

solr

分词器

luence

it

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Solr 分词器(analyzer)是怎么传到Luence的

Solr 分词器(analyzer)是怎么传到Luence的

solr

分词器

luence

it

评论

发表评论

相关推荐

提高nutch爬取效率

CommonsHttpSolrServer

利用SOLR搭建企业搜索平台 之十（数据库数据导入到solr）

利用SOLR搭建企业搜索平台 之九（solr的查询语法）

利用SOLR搭建企业搜索平台 之八（solr 实现去掉重复的搜索结果，打SOLR-236_collapsing.patch补丁）

利用SOLR搭建企业搜索平台 之五（solrj）

Solr solrconfig.xml的翻译

使用Apache Solr对数据库建立索引

解决DataImportHandler从数据库导入大量数据而内存溢出的问题

Solr 创建索引的原理 源码分析

Solr Replication (复制) 索引和文件的工作机制

Solr 查询中fq参数的解析原理

SOLR的分布式部署

Solr 删除数据的几种方式

Solr Data Import 快速入门

使用 solr php 的输出

Solr Multicore 结合 Solr Distributed Searching 切分大索引来搜索

Solr Multicore 试用小记

Solr1.4.0源码分析二 Solr分布式搜索中URL的正确用法和原理

lucene应用

最近访客更多访客>>

利用SOLR搭建企业搜索平台之十（数据库数据导入到solr）

利用SOLR搭建企业搜索平台之九（solr的查询语法）

利用SOLR搭建企业搜索平台之八（solr 实现去掉重复的搜索结果，打SOLR-236_collapsing.patch补丁）

利用SOLR搭建企业搜索平台之五（solrj）

Solr 创建索引的原理源码分析