solr schema.xml配置总结

fhqllt

浏览: 1064510 次
性别:
来自: 郑州

最近访客更多访客>>

wenyan1232

小覃Smile

yjqzou

wt_7628

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

solr

schema.xml 在solr/conf/目录下，类似于数据表配置文件。

为了改进性能，可以采取以下几种措施：

1. 将所有只用于搜索的，而不需要作为查询结果的field（特别是一些比较大的field）的stored设置为false。

2. 将不需要被用于搜索的，而只是作为查询结果返回的field的indexed设置为false。

3. 删除所有不必要的copyField声明，根据需要决定是否进行存储。

4. 为了索引字段的最小化和搜索的效率，将所有的 text fields的index都设置成false，然后使用copyField将他们都复制到一个总的 text field上，然后对他进行搜索。

5. 使用尽可能高的Log输出等级，减少日志量。可以在solr/admin 中的 LOGGING 进行设置。

特珠说明：

1. 高高是基于分词的，所有存储需要高亮显示的字段一定要分词（text）才能高亮显示。

2. 排序字段是不能当查询过滤的条件。

文本主要配置项：

1. field 类型定义

重点是中文分词的添加

2. field 各属性定义

name type类型 indexed是否建立索引 stored是否存储 required 是否必填项 multiValued多值存储

3. 唯一key

文档的唯一标识，必须填写这个field（除非该field被标记required="false"），否则solr建立索引报错。

4. 默认搜索字段 field

如果搜索参数中没有指定具体的field，那么这个做为默认的域。

5. 搜索参数短语间逻辑

配置搜索参数短语间的逻辑，可以是"AND|OR"。

备注： AND是交集，OR是并集

6. 复制字段

将多个字段的值复制至一个字段中，如果被复制的字段都设置为stored，那个这个字段务必不要设置成stored=true

7. 自定义评分器

SolrSimilarity 是继承 DefaultSimilarity的子类，或者实现评分器接口的类。

分享到：

solr 中文分词filedType定义 | solr中使用IKAnalysizer 基于配置的自定义 ...

2012-11-04 21:23
浏览 10225
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论