论坛首页 综合技术论坛

大数据量的查询词缓存

浏览 2680 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2009-05-21   最后修改:2009-05-21
问题描述:
对简易搜索引擎的查询关键字建立缓存,将所有查询词都保存下来,并记录词频,当超过存储容量时,会根据词频替换掉词频小的查询词。数据量大,要用到磁盘存储。

初步思路:
对查询词进行分类,对每个类别的查询词进行排序,得到top-k个放入内存缓存。

分类:用hash,不过要自己重写hashcode函数

是否要用到归并排序?

索引?

如何存储?
   发表时间:2009-06-17  
看过了 不错!但不是自己想要的哦!

现在的也在搞数据库的架构啊!很多东西要学习啊!还好javaeye是个不错的网站!
0 请登录后投票
   发表时间:2009-06-21  
今年百度之星复赛的第一题就是这个问题,不过限定内存1M
0 请登录后投票
论坛首页 综合技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics