schema.xml中注释比较详细,这里简单概括介绍一下,结构参考example/solr/conf/schema.xml
<types>: fields类别定义,对应solr内部类别实现。需要重点注意的是solr.TextField类型的索引查询设置,整个结构如下:
1、
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<!-- in this example, we will only use synonyms at query time
<filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
-->
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
其中text_general为类别名称,analyzer又分为index和query,对于中文应用需要修改配置中文分词组件,比如IKAnalyzer文档中已经包含的了配置的说明,具体步骤请参考帮助文档。
2、
<fields>则是应用中所有涉及到的fields属性的定义,如:
<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>
根据 以上1、 中定义的
text_general类型配置属性。
3、
<uniqueKey>id</uniqueKey>
设置主键,solr必须有一个主键,一般为id也可以自行定义。
4、
<defaultSearchField>content</defaultSearchField>
<solrQueryParser defaultOperator="OR"/>
默认检索的field,检索格式化方式为or。
5、
<dynamicField name="*_i" type="integer" indexed="true" stored="true"/>
定义动态filed,如上所示,当提交传入的filed后缀为_i的filed,都会自动映射为 type="integer",也可以前缀方式定义。
总结:
solr作为企业及的全文检索服务器,并且也在最新的nutch1.4中被作为唯一的索引方式。相信solr可以承担重任。
分享到:
相关推荐
`schema.xml`则定义了字段类型和字段信息,是Solr理解输入数据的关键。 3. **与Tomcat整合**:Tomcat是一个流行的Java应用服务器,常被用来部署Solr。整合过程涉及在Tomcat的webapps目录下解压Solr包,配置Solr的...
### Solr3.5开发应用指导 #### 一、概述 **1.1 企业搜索引擎方案选型** 在选择企业搜索引擎方案时,考虑到多种因素,包括但不限于开发成本、可维护性和后期扩展性等。常见的几种方案包括: 1. **基于Lucene自行...
`schema.xml` 用于定义字段类型和字段,它是 Solr 索引数据的基础。 3. **启动 Solr**:通过运行 `bin/solr start` 命令启动 Solr 服务器,或者在 Tomcat 或其他 Servlet 容器中部署 `dist/solr.war` 文件。 4. **...
- **显示配置文件**:可以查看和编辑Solr的配置文件,如 `schema.xml` 和 `solrconfig.xml`。 - **字段分析**:测试分析器、分词器和过滤器对文本的处理效果。 - **模式浏览器**:提供了一种图形化方式来浏览索引...
解析Solr返回的XML格式响应。 - **4.5.3 ChangingotherConnectionSettings** 调整与Solr连接的其他设置。 - **4.5.4 EmbeddedSolrServer** 用于在应用程序内部嵌入Solr实例。 #### 五、Solr的实际应用测试报告 ...
- **1.2.2 Schema(模式)**:Solr中的模式文件(schema.xml)用于定义索引的字段、字段类型以及它们的行为。这是构建高效索引的基础。 - **1.2.3 查询**:Solr支持复杂的查询语言,包括全文检索、布尔运算符、短语...
主要讨论schema.xml和solrconfig.xml这两个核心配置文件的作用和配置项。 **三、Solr的应用** 3.1 SOLR应用概述 介绍Solr的应用场景和使用流程。 3.2 一个简单的例子 包括Solr Schema设计、构建索引和搜索测试。 ...
- **4.5.2 Setting XML Response Parser**:设置响应解析器来解析Solr服务器返回的结果。 - **4.5.3 Changing other Connection Settings**:调整与Solr服务器连接相关的其他设置。 - **4.5.4 EmbeddedSolrServer**...
- **4.5.2 Setting XMLResponseParser**:解析Solr返回的XML响应。 - **4.5.3 Changing other Connection Settings**:如何修改SolrJ的连接设置。 - **4.5.4 EmbeddedSolrServer**:在应用程序内部嵌入Solr服务器。 ...