一般网站(假设用 Lucene )要做更新频率比较高的,常见的是大小索引包,大的索引包是旧数据索引,小索引包是新数据索引。更新主要集中在小索引包这里,因为索引小,所以完成索引到能提供搜索的时间是比较短。
但是有时候也不能满足一些高并发的网站高更新需求,高更新要求指的是:用户可能提交了信息后,希望提交后,就能搜索到。这个用lucene的可能就有点吃力。这类一般修改的也很多。
这样可能就需要考虑自建,于是就需要考虑以下几个因素:
1:索引:索引通常是倒排,一个termid最多包含多少个docid呢?以新索引来看应该不会多的很,如果很多,那么可以定期写一个索引,顶多到时候并发到三个地方(旧索引(磁盘),新索引(很新,还在内存),新索引(旧,写到磁盘))搜索。
2:锁:降低锁的粒度,比如建立多个termid的锁。
3:排序:一般是按照score和时间,score可以在最小化范围后进行积分计算,比如归并,快排等。时间就有点麻烦,假如只是时间递增排序或者递减排序,那么就是做个按照时间排的堆索引,但是如果还提供某个时间段,那就需要按照时间段(比如分,比如秒来排序),如果很复杂还要设计时间排序索引的结构,比如用AVL,RB树等。
4:操作:建立独立的更新和删除结构。
5:定时更新到磁盘。
以上未经实证,只是本人无聊猜想。如有雷同,纯属巧合。
欢迎拍砖,人身攻击免了。
分享到:
相关推荐
哥德巴赫猜想,这是一个源自18世纪,由普鲁士数学家克里斯蒂安·哥德巴赫提出的重要未解问题,也是数论领域的一个著名难题。该猜想表明,任何大于2的偶数都可以表示为两个质数(素数)的和。简单来说,就是"每个大于...
2022年高考历史命题猜想:专题07 西方人文精神的发展(命题猜想) 教师版.docx
智能汽车终极猜想:电动汽车与特斯拉的“噩梦”.pdf
中国快递行业启示与猜想:迎接供应链“大时代”.pdf
### 数学猜想:基于数学事实的合情推理—反事实推理 #### 一、数学猜想的概念与重要性 数学猜想是一种重要的思维活动,它是指基于现有的数学事实与知识,通过观察、实验、分析、比较、联想、类比、归纳等多种方式...
2022年高考历史命题猜想:专题17 历史上重大改革回眸 教师版.docx
2022年高考历史命题猜想:专题18 近代社会的民主思想与实践 教师版.docx
1157:哥德巴赫猜想 时间限制: 1000 ms 内存限制: 65536 KB 提交数: 14300 通过数: 8298 【题目描述】 哥德巴赫猜想的命题之一是:大于6 的偶数等于两个素数之和。编程将6~100所有偶数表示成两个素数之和。 【输入...
2022年高考历史命题猜想:专题10 近代中国的思想解放潮流与三民主义 教师版.docx
2022年高考历史命题猜想:专题11 世界资本主义经济政策的调整和创新 教师版.docx
2022年高考历史命题猜想:专题08 近代中国反侵略、求民主的潮流 教师版.docx
2022年高考历史命题猜想:专题17 历史上重大改革回眸 原卷版Word版无答案.docx
2022年高考历史命题猜想:专题12 社会主义由理想到现实和苏联的社会主义 教师版.docx
2022年高考历史命题猜想:专题18 近代社会的民主思想与实践 原卷版Word版无答案.docx
中国快递行业启示与猜想:迎接供应链“大时代”-20200409-华泰证券-23页.pdf
2022年高考历史命题猜想:专题08 近代中国反侵略、求民主的潮流 原卷版Word版无答案.docx
2022年高考历史命题猜想:专题13 二战后世界政治格局的多极化和经济全球化的趋势 教师版.docx
本文将基于"无人驾驶未来猜想:从高精地图聊起-2018040-15页.zip"中的内容,深入探讨高精地图在无人驾驶技术中的应用与重要性。 高精地图,全称为高精度地图,是专门为自动驾驶车辆设计的一种特殊地图类型。它远远...
哥德巴赫猜想是数论领域的一个著名未解决问题,由18世纪的普鲁士数学家克里斯蒂安·哥德巴赫提出。这个猜想简单来说就是:任何大于2的偶数都可以表示为两个质数(素数)之和。虽然至今为止这个猜想尚未得到数学上的...
标题中的"C++代码 角谷猜想计算过程"指的是利用C++编程语言实现角谷猜想的算法。角谷猜想,也称为“冰雹序列”或“3n+1猜想”,是由日本数学家角谷静夫提出的一个未解问题。这个猜想是这样的:对于任意一个正整数n,...