`
muxiaolin
  • 浏览: 30851 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

zoie学习

 
阅读更多

这个蹩脚的家伙我还没运行起来过,官网的资料少的可怜,代码结构不清晰,包划分让我蛋疼。

 

读了里面的代码,也是相当蹩脚(个人感觉),但是以上的认识不是藐视这个家伙,是恨铁不成钢啊。

 

zoie最核心的的部分可能就是  docid-uid的映射,和FilterIndexReader.这个思路很巧妙。但是也不能算是完美。


ZoieMergePolicy也是个不错的东西,已被划归Lucene3.3。如果你对lucene有些研究,建议还是看看这个家伙,对扩展

 

思路有些帮助。

 

我结合现在的项目,按照zioe的主要思路做了个引擎,觉得要比zoie要更优化点,加了nosql的库和缓存。

 

以前缓存的策略困扰了大半年,现在也终于找到好的思路。

 

lucene4.0也加入了zoie的filter的思路,每天都checkout下lucene4.0的代码,查看我最关心的这部分,目前为止还没有

 

开发到这。

 

lucene也开始关心NRT这块,使用一个后台线程来重建searcher,和zoie异曲同工的作用。

 

好像zoie用maven构建的,build总有问题,还有,好像zoie的工程师有华人,为啥不把中文文档好好写写,nnd。

 

分享到:
评论

相关推荐

    Lucene5学习之增量索引(Zoie)

    总结起来,Lucene5学习之增量索引(Zoie)涉及到的关键技术点包括: 1. 基于Lucene的增量索引解决方案:Zoie系统。 2. 主从复制架构:Index Provider和Index User的角色。 3. 数据变更追踪:通过变更日志实现增量索引...

    Zoie实时搜索架构

    Zoie项目提供的"Zoie – Realtime search on top of Lucene"这一资源,就是了解和学习Zoie的重要参考资料。 总结起来,Zoie实时搜索架构是对Lucene的一次重要优化和扩展,它在实时性、分布性和高性能三个方面展现了...

    zoie, 实时搜索/索引系统.zip

    zoie, 实时搜索/索引系统 什么是 ZoieZoie是用Java编写的实时搜索/索引系统。维基维基在以下位置可用:http://linkedin.jira.com/wiki/display/ZOIE/Home问题问题在以下位置跟踪:http://link

    lucene5+zoie实现近实时索引

    《Lucene 5 + Zoie 实现近实时索引详解》 在当今大数据时代,搜索引擎技术扮演着至关重要的角色,而Lucene作为一款强大的全文搜索引擎库,被广泛应用于各种信息检索系统。然而,传统的Lucene在处理大规模数据时,...

    ewhine_search:ewhine 搜索系统使用 zoie

    The ewhine search system use zoie. #安装 git clone :jimrok/ewhine_search.git cd ewhine_search java -jar server.jar 如果在Mac的控制台下,使用 java -Dfile.encoding=UTF-8 -jar server.jar #索引 在ewhine_...

    zoieleung0309.github.io

    通过对"zoieleung0309.github.io-master"压缩包的探索,我们可以深入学习以上提到的CSS知识点,并可能发现更多实际应用中的技巧和最佳实践。此外,如果该网站包含源码,还可以研究作者如何运用这些技术构建实际的...

    lucene of lietu

    Zoie 是 LinkedIn 支持的一个开源实时搜索引擎项目,专门针对需要高时效性的搜索场景,如 Twitter 消息和新闻搜索。Zoie 在 Lucene 的基础上进行了优化,确保了以下特性: 1. **即时索引**:一旦文档加入索引,就...

    吴一男:网易通用搜索优化之道

    - 搜索索引和检索引擎基于开源项目Lucene构建,而实时索引采用了Zoie技术。 - 数据接入可能利用DataStream进行同步,支持HTTP/REST API和Java SDK等多种服务接口。 - 系统配置管理使用了Zookeeper工具,以实现...

    搜索实时更新系统架构介绍.pptx

    - 个性化搜索考虑用户的个人偏好,通过学习搜索日志分析,调整排序模型,提供个性化的搜索结果。 - 关联商品搜索服务则是将相关商品一起展示,增加用户购买的可能性。 5. **查询规划与语言模型**: - Query规划...

    zoieboyd.github.io

    这个项目可能包含了用户Zoie Boyd的个人信息、作品集、博客文章或者其他相关的内容。 【描述】"zoieboyd.github.io" 的描述没有给出具体的细节,但从一般的GitHub网页实践来看,这可能是Zoie Boyd利用GitHub Pages...

    张琨:教育社交平台的web架构分享

    例如FeedSystem是基于开源的key-value数据库Redis构建的,而Instantsearchserver是基于zoie进行开发的。NoticeSystem则利用了mochiweb的高效通信特性,采用了Erlang编程语言。MQserver使用了RabbitMQ作为基础的异步...

    CSDN TUP第二期:王鹏云演讲PPT

    - **Zoie**:基于Lucene构建,来自LinkedIn,适用于中小规模的实时搜索需求。 - **Sphinx**:自1.10-beta版本起支持实时搜索功能,被广泛应用于craigslist、netlog等网站。 通过以上分析可以看出,实时搜索不仅是一...

    j2ee面试考察点.pdf

    3. **实时搜索设计**:如Zoie系统,结合内存和磁盘,提供快速的搜索响应。 4. **Lucene TF/IDF公式**:TF(Term Frequency)衡量词频,IDF(Inverse Document Frequency)衡量词的重要性,共同决定文档相关性。 5....

    计算机网络 实验2 Wireshark的安装与基本操作

    实验2 Wireshark的安装与基本操作 1. 实验目的 学习 Wireshark 的基本操作,抓取和分析有线局域网的数据包,熟悉一些应用层命令和协议。

    垂直搜索-您不知道的秘密 -solr中国-风雨V1.1

    - **Solr**、**Elasticsearch**、**Zoie**、**BoCo**等:基于Lucene开发的搜索引擎解决方案,各有特色。 - **Sphinx**:一款高性能的全文检索引擎,适用于大数据量的实时搜索。 - **Xapian**:一种高度可扩展的全文...

    计算机网络 实验5 传输介质 双绞线

    实验5 传输介质 1. 实验目的 (1) 了解双绞线的结构; (2) 了解制作双绞线的标准; (3) 熟悉双绞线的制作。 2. 实验内容简要描述 (1) 阅读有关双绞线制作的文档,明确双绞线制作要求;...(2) 双绞线制作直通线,用专用...

    计算机网络 实验1 常用网络命令的使用

    计算机网络 实验1 常用网络命令的使用 1. 实验目的 (1) 掌握 ping、ipconfig、tracert、netstat、ARP、nslookup、net 等命令含义和基本用法; (2) 学会运用 ping、ipconfig、tracert、netstat、ARP、nslookup、net ...

    web前端+javascript+模态框

    javascript封装一个模态框:头(标题、关闭按钮)、内容、尾(操作按钮:取消和确定)。标题可以自定义,默认值是“标题”; 内容区域可以是文本或者富文本,操作按钮可以控制显隐和显示文案; ...

Global site tag (gtag.js) - Google Analytics