lucene中关于正向信息的获取——FielldCache -

suichangkele

浏览: 203732 次
性别:
来自: 北京

最近访客更多访客>>

jieyuan_cg

z9780420

jzhfmm

geeksun

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

lucene中关于正向信息的获取——FielldCache

博客分类：

lucene
solr

lucene 正向信息

之前写完了docValue的内容，但是如何获取docValue呢？或者将这个问题在宽泛一些，如何获取doc的正向信息，很简单，就是FieldCache，FieldCache采取了一个单利模式，他有一个实现类叫做FieldCacheImpl。所有的获取正向信息的操作都是通过这个类的getxxx方法，在这个通用的方法里面，所有的逻辑都是一样，如果一个域有docValue，则优先会的dcoValues，如果没有则读取这个域的词典表，unInvert，即将倒排表读取到内存中，然后每个doc再进行计算，将每个doc和每个term对应起来，然后再一个大Map中存起来。从效果上来看，在第一次读取的时候，如果没有docValue则会很慢，而且即使读取到内存中也是很消耗资源的，所以在facet、sort的时候，还是建议将对应的类做docValue，这样会更快。

看一下源码吧，这里以getInts为例：

public Ints getInts(AtomicReader reader, String field, IntParser parser, boolean setDocsWithField) throws IOException {
	final NumericDocValues valuesIn = reader.getNumericDocValues(field);//优先读取docValue，
	if (valuesIn != null) {//如果没有docValue，则使用
		// Not cached here by FieldCacheImpl (cached instead
		// per-thread by SegmentReader):
		return new Ints() {
			@Override
			public int get(int docID) {
				return (int) valuesIn.get(docID);
			}
		};
	} else {//如果没有docValue，
		final FieldInfo info = reader.getFieldInfos().fieldInfo(field);
		if (info == null) {//没有这个域
			return Ints.EMPTY;
		} else if (info.hasDocValues()) {//有docValue，报错
			throw new IllegalStateException("Type mismatch: " + field + " was indexed as " + info.getDocValuesType());
		} else if (!info.isIndexed()) {//没有建立索引，则无法读取词典表，返回empty
			return Ints.EMPTY;
		}
		return (Ints) caches.get(Integer.TYPE).get(reader, new CacheKey(field, parser), setDocsWithField);//这个就是读取词典表。
	}
}

最关键的就是最后一行，从cache中获得int类型的对象，在FiledCacheImpl初始化的时候，就会向一个很大的map中写入很多对象，作为代理类，然后再读取的时候再从词典表中读取具体的term，然后再放入到原来的map中缓存起来，这样就完成了再没有docValue的情况下正向信息的获取。

分享到：

solr的facet源码解读（二）——facet.fiel ... | solr的facet源码解读（一）——facet.quer ...

2018-02-18 17:48
浏览 912
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene中关于正向信息的获取——FielldCache

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene中关于正向信息的获取——FielldCache

评论

发表评论

相关推荐

FST源代码解读6——FST的读取

FST源代码解读5——FST的压缩

FST源代码解读4——结束添加

FST源代码解读3——编译节点

FST源代码解读2——FST的生成

FST源代码解读1——FST是什么

packedints总结

lucene中的PackedInts源码解读(3)-PACKED格式

lucene中的PackedInts源码解读(2)-Packed64SingleBlock

lucene中的PackedInts源码解读-1

SpanQuery的得分

lucene的spanNearQuery（二）——不带有顺序的

solr的facet源码解读（四）——facet.field之非数字单值域类型

solr的facet源码解读（三）——facet.field之数字单值域类型

solr的facet源码解读（二）——facet.field

solr的facet源码解读（一）——facet.query

solr对docValue的使用

lucene中的docValue实现源码解读（十二）——总结

lucene中的docValue实现源码解读（十一）——SortedSet的读取

lucene中的docValue实现源码解读（十）——SortedSet的写入

最近访客更多访客>>