`
peigang
  • 浏览: 171604 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

solr3.5 schema.xml解析

    博客分类:
  • solr
 
阅读更多

schema.xml中注释比较详细,这里简单概括介绍一下,结构参考example/solr/conf/schema.xml

<types>: fields类别定义,对应solr内部类别实现。需要重点注意的是solr.TextField类型的索引查询设置,整个结构如下:

 

1、

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<!-- in this example, we will only use synonyms at query time
<filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
-->
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
 

其中text_general为类别名称,analyzer又分为index和query,对于中文应用需要修改配置中文分词组件,比如IKAnalyzer文档中已经包含的了配置的说明,具体步骤请参考帮助文档。

2、

<fields>则是应用中所有涉及到的fields属性的定义,如:

 

<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>

根据 以上1、 中定义的 text_general类型配置属性。

3、

<uniqueKey>id</uniqueKey>
 

设置主键,solr必须有一个主键,一般为id也可以自行定义。

4、
   

<defaultSearchField>content</defaultSearchField>
<solrQueryParser defaultOperator="OR"/>

默认检索的field,检索格式化方式为or。

 5、

 

<dynamicField name="*_i" type="integer" indexed="true" stored="true"/>

定义动态filed,如上所示,当提交传入的filed后缀为_i的filed,都会自动映射为   type="integer",也可以前缀方式定义。

总结:

solr作为企业及的全文检索服务器,并且也在最新的nutch1.4中被作为唯一的索引方式。相信solr可以承担重任。

 

分享到:
评论

相关推荐

    apache-solr-3.5.0.tgz

    `schema.xml`则定义了字段类型和字段信息,是Solr理解输入数据的关键。 3. **与Tomcat整合**:Tomcat是一个流行的Java应用服务器,常被用来部署Solr。整合过程涉及在Tomcat的webapps目录下解压Solr包,配置Solr的...

    Solr3.5开发应用指导

    ### Solr3.5开发应用指导 #### 一、概述 **1.1 企业搜索引擎方案选型** 在选择企业搜索引擎方案时,考虑到多种因素,包括但不限于开发成本、可维护性和后期扩展性等。常见的几种方案包括: 1. **基于Lucene自行...

    solr_3.5_配置及应用

    `schema.xml` 用于定义字段类型和字段,它是 Solr 索引数据的基础。 3. **启动 Solr**:通过运行 `bin/solr start` 命令启动 Solr 服务器,或者在 Tomcat 或其他 Servlet 容器中部署 `dist/solr.war` 文件。 4. **...

    Apache-Solr-Reference-Guide-v3.5

    - **显示配置文件**:可以查看和编辑Solr的配置文件,如 `schema.xml` 和 `solrconfig.xml`。 - **字段分析**:测试分析器、分词器和过滤器对文本的处理效果。 - **模式浏览器**:提供了一种图形化方式来浏览索引...

    开源企业搜索引擎SOLR的 应用教程

    解析Solr返回的XML格式响应。 - **4.5.3 ChangingotherConnectionSettings** 调整与Solr连接的其他设置。 - **4.5.4 EmbeddedSolrServer** 用于在应用程序内部嵌入Solr实例。 #### 五、Solr的实际应用测试报告 ...

    solr教材-PDF版

    - **1.2.2 Schema(模式)**:Solr中的模式文件(schema.xml)用于定义索引的字段、字段类型以及它们的行为。这是构建高效索引的基础。 - **1.2.3 查询**:Solr支持复杂的查询语言,包括全文检索、布尔运算符、短语...

    SOLR的应用教程

    主要讨论schema.xml和solrconfig.xml这两个核心配置文件的作用和配置项。 **三、Solr的应用** 3.1 SOLR应用概述 介绍Solr的应用场景和使用流程。 3.2 一个简单的例子 包括Solr Schema设计、构建索引和搜索测试。 ...

    开源企业搜索引擎SOLR的应用教程

    - **4.5.2 Setting XML Response Parser**:设置响应解析器来解析Solr服务器返回的结果。 - **4.5.3 Changing other Connection Settings**:调整与Solr服务器连接相关的其他设置。 - **4.5.4 EmbeddedSolrServer**...

    Solrj 中文教程

    - **4.5.2 Setting XMLResponseParser**:解析Solr返回的XML响应。 - **4.5.3 Changing other Connection Settings**:如何修改SolrJ的连接设置。 - **4.5.4 EmbeddedSolrServer**:在应用程序内部嵌入Solr服务器。 ...

Global site tag (gtag.js) - Google Analytics