论坛首页 招聘求职论坛

数据结构和算法的设计

浏览 7068 次
精华帖 (0) :: 良好帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2010-10-11   最后修改:2010-10-11
有1W个敏感词汇,要把文件中的包含敏感词汇的文字替换为其他,该怎么设计数据结构和算法,循环肯定效率很低,请指点回答...谢谢
   发表时间:2010-10-11  
1W个敏感词汇。。。以后还会不断壮大。。。
0 请登录后投票
   发表时间:2010-10-11  
diunei 写道
1W个敏感词汇。。。以后还会不断壮大。。。


对 请大家给点想法...
0 请登录后投票
   发表时间:2010-10-11  
相关文章这里不是有吗, http://www.iteye.com/topic/336577

哈哈,别说我光转帖不干正事,只是让我自己来描述一遍也不过如此,这些都是已经有人做过一些实践, 可以参考之:)
0 请登录后投票
   发表时间:2010-10-13  
搜索引擎不就是这么干的嘛
0 请登录后投票
   发表时间:2010-10-13  
这种需求要先感谢国家
0 请登录后投票
   发表时间:2010-10-13  
基于自动机的KMP算法,而自动机由正则表达式产生。

而因为正则是不依赖于编译的,所以可以动态添加。
0 请登录后投票
   发表时间:2010-10-13  
AC自动机。。。。。
0 请登录后投票
   发表时间:2010-10-13  
xhdwell 写道
这种需求要先感谢国家

+1
0 请登录后投票
   发表时间:2010-10-13  
lucene 高亮功能 可以完美解决
0 请登录后投票
论坛首页 招聘求职版

跳转论坛:
Global site tag (gtag.js) - Google Analytics