论坛首页 综合技术论坛

查找文章中的关键字,面试题

浏览 5058 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2013-11-04   最后修改:2013-11-04
比如一篇10万字的文章,存在关键字1000个,关键字长度最长为6.比如“政治”,“军事国界”这类的关键字1000个。
要你写出查找的算法。面试题啦,最近面试的一家给出的。
我的思路大致如下:

New 一个size为1500的HashMap,然后把关键字做为key和value放入这个Map中。
逐个字符的读取文章的字符,从第一个字符开始,顺取6个,分为6个字符串,
在Map中查找是否关键字,是则记录相应的关键字。
第二个字符同样处理。

这样的话如果有10万字,大约要查找60万次这样子。

面试的技术提示我,这样太耗性能了,用平衡二叉树来解决。

等待大牛出现。总能给我惊喜。
   发表时间:2013-11-04   最后修改:2013-11-04
最近ITEYE冷淡的就有点像就业。感叹!
0 请登录后投票
   发表时间:2013-11-08  
使用分词软件,统计每个词的频度,剔除一些噪声词之后,取出现次数最高的1000个词。
0 请登录后投票
   发表时间:2013-11-08  
等待大牛出现
0 请登录后投票
论坛首页 综合技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics