阅读 7066 次
发表时间:2010-10-11
有1W个敏感词汇,要把文件中的包含敏感词汇的文字替换为其他,该怎么设计数据结构和算法,循环肯定效率很低,请指点回答...谢谢
发表时间:2010-10-11
1W个敏感词汇。。。以后还会不断壮大。。。
发表时间:2010-10-11
diunei 写道
1W个敏感词汇。。。以后还会不断壮大。。。


对 请大家给点想法...
发表时间:2010-10-11
相关文章这里不是有吗, http://www.iteye.com/topic/336577

哈哈,别说我光转帖不干正事,只是让我自己来描述一遍也不过如此,这些都是已经有人做过一些实践, 可以参考之:)
发表时间:2010-10-13
搜索引擎不就是这么干的嘛
发表时间:2010-10-13
这种需求要先感谢国家
发表时间:2010-10-13
基于自动机的KMP算法,而自动机由正则表达式产生。

而因为正则是不依赖于编译的,所以可以动态添加。
发表时间:2010-10-13
AC自动机。。。。。
发表时间:2010-10-13
xhdwell 写道
这种需求要先感谢国家

+1
发表时间:2010-10-13
lucene 高亮功能 可以完美解决
Global site tag (gtag.js) - Google Analytics