浏览 2680 次
锁定老帖子 主题:大数据量的查询词缓存
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2009-05-21
最后修改:2009-05-21
对简易搜索引擎的查询关键字建立缓存,将所有查询词都保存下来,并记录词频,当超过存储容量时,会根据词频替换掉词频小的查询词。数据量大,要用到磁盘存储。 初步思路: 对查询词进行分类,对每个类别的查询词进行排序,得到top-k个放入内存缓存。 分类:用hash,不过要自己重写hashcode函数 是否要用到归并排序? 索引? 如何存储? 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2009-06-17
看过了 不错!但不是自己想要的哦!
现在的也在搞数据库的架构啊!很多东西要学习啊!还好javaeye是个不错的网站! |
|
返回顶楼 | |
发表时间:2009-06-21
今年百度之星复赛的第一题就是这个问题,不过限定内存1M
|
|
返回顶楼 | |