lucene中的docValue实现源码解读（九）——SortedNumericDocValue的读取 -

suichangkele

浏览: 204564 次
性别:
来自: 北京

最近访客更多访客>>

jieyuan_cg

z9780420

jzhfmm

geeksun

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

lucene中的docValue实现源码解读（九）——SortedNumericDocValue的读取

博客分类：

lucene

lucene sortedNumericDocValue docvalue 存储格式

再看具体的读取过程之前，先看一下SortedNumericDocValue接口的功能吧，

public abstract class SortedNumericDocValues {
  
  /** Sole constructor. (For invocation by subclass  constructors, typically implicit.) */
  protected SortedNumericDocValues() {}

  /**  定位到某个doc */
  public abstract void setDocument(int doc);
  
  /** 返回当前的doc的第几个数字 */
  public abstract long valueAt(int index);
  
  /** 当前的doc的值的个数 */
  public abstract int count();
}

可以发现，其实SortedNumericDocValue提供的接口的功能很少，仅仅是得到某个doc的所有的数字。通过上一篇博客，自己也能猜出他的实现原理。

下面看看真正的读取操作，方法在Lucene410DocValuesProducer.getSortedNumeric(FieldInfo)：

public SortedNumericDocValues getSortedNumeric(FieldInfo field) throws IOException {
	SortedSetEntry ss = sortedNumerics.get(field.number);
	NumericEntry numericEntry = numerics.get(field.number);
	final LongValues values = getNumeric(numericEntry);
	if (ss.format == SORTED_SINGLE_VALUED) {//所有的doc的值只有一个的情况。忽略
		final Bits docsWithField = getMissingBits(numericEntry.missingOffset);
		return DocValues.singleton(values, docsWithField);
	} else if (ss.format == SORTED_WITH_ADDRESSES) {//
		//读取第二部分，即每个doc的第一个值是所有的值的第多少个。
		final MonotonicBlockPackedReader ordIndex = getOrdIndexInstance(field, ordIndexes.get(field.number));
		return new SortedNumericDocValues() {
			
			long startOffset;
			long endOffset;

			@Override
			public void setDocument(int doc) {
				startOffset = ordIndex.get(doc);//要查找的doc的值的偏移量
				endOffset = ordIndex.get(doc + 1L);//要查找的doc的下一个doc的开始位置，也就是这个doc的结束位置
			}

			@Override
			public long valueAt(int index) {//读取当前的doc的第n个值。
				return values.get(startOffset + index);
			}

			@Override
			public int count() {//当前的doc一共多少个值
				return (int) (endOffset - startOffset);
			}
		};
	} else {
		throw new AssertionError();
	}
}

可以发现，读取SortedNumericDocValue其实是很简单的，用第二部分确定某个doc的值的开始位置和结束位置，也就是偏移量，然后再根据偏移量读取某个doc的值。

分享到：

lucene中的docValue实现源码解读（十）—— ... | lucene中的docValue实现源码解读（八）—— ...

2018-02-14 12:34
浏览 880
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene中的docValue实现源码解读（九）——SortedNumericDocValue的读取

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene中的docValue实现源码解读（九）——SortedNumericDocValue的读取

评论

发表评论

相关推荐

FST源代码解读6——FST的读取

FST源代码解读5——FST的压缩

FST源代码解读4——结束添加

FST源代码解读3——编译节点

FST源代码解读2——FST的生成

FST源代码解读1——FST是什么

packedints总结

lucene中的PackedInts源码解读(3)-PACKED格式

lucene中的PackedInts源码解读(2)-Packed64SingleBlock

lucene中的PackedInts源码解读-1

SpanQuery的得分

lucene的spanNearQuery（二）——不带有顺序的

solr的facet源码解读（四）——facet.field之非数字单值域类型

solr的facet源码解读（三）——facet.field之数字单值域类型

solr的facet源码解读（二）——facet.field

lucene中关于正向信息的获取——FielldCache

solr对docValue的使用

lucene中的docValue实现源码解读（十二）——总结

lucene中的docValue实现源码解读（十一）——SortedSet的读取

lucene中的docValue实现源码解读（十）——SortedSet的写入

最近访客更多访客>>