阅读 12729 次
发表时间:2010-10-07
一亿个有序URL 怎么实现效率最高的模糊查询算法?

譬如
数据
http://www.aaa.com
http://www.aab.com
http://www.aac.com
http://www.abc.com
http://www.ade.com
http://www.bde.com

输入aa 查询出第1,2,3条
输入de 查询出第5,6条
发表时间:2010-10-07
正则?   
发表时间:2010-10-07
treemap 写道
正则?   

是算法.用正则的话会不会比全遍历还慢?
发表时间:2010-10-07
luence
发表时间:2010-10-08
treemap 写道
luence


我想要算法.....
发表时间:2010-10-08
最后就变成了从类似于
aaa
aab
aac
abc
ade
bde的一亿个string中模糊查找,而且是已经排好序的
发表时间:2010-10-08
kmp || 自动机  +  折半查找
发表时间:2010-10-08
二分法                        
发表时间:2010-10-08
我爱小白 写道
二分法                        

mxswl 写道
kmp || 自动机  +  折半查找


怎么分???

URL只是排列有序.但是包含的字符可不是全有序的.

http://www.aaa.com/hello.jsp
http://www.aab.com/cba.jsp
http://www.aac.com
http://www.abc.com
http://www.ade.com
http://www.bde.com/aa.jsp

搜索aa结果为1,2,3,6 怎么折半?
发表时间:2010-10-08
ouchxp 写道
我爱小白 写道
二分法                        

mxswl 写道
kmp || 自动机  +  折半查找


怎么分???

URL只是排列有序.但是包含的字符可不是全有序的.

http://www.aaa.com/hello.jsp
http://www.aab.com/cba.jsp
http://www.aac.com
http://www.abc.com
http://www.ade.com
http://www.bde.com/aa.jsp

搜索aa结果为1,2,3,6 怎么折半?

说的也是啊, 忘了是字符串, 字符串可以用kmp算法来试试看吧
Global site tag (gtag.js) - Google Analytics