最新文章列表

bloomfilter【布隆过滤器】

从今天开始仔细学习学习大数据量处理相关的算法,这是第一个算法,布隆过滤器   适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集 基本原理及要点: 对于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数组置1, 查找时如果发现所有hash函数对应位都是1说明存在,很明显这个过程并不保证查找的 结果是100%正确的。同时也不支持删除一个已经插入的关键字, ...
madbluesky 评论(0) 有2483人浏览 2012-02-24 18:17

Bloom Filter备忘

写这个纯属备忘,外加一点感悟.   Bloom Filter是一种去重的算法.   就是将庞大的需要去重的数据,进行Bloom Filter算法,首先新建一个庞大的数组a[],那么每条数据会按照hash算法,得到自己的hash值,然后在这个hash值为x的数组位置 a[x]标志为1,每个数据进行一次Bloom Filter,如果a[x]位置为1,那么表示已经有值,表示是重复数据. 完 ...
xbcoil 评论(0) 有1030人浏览 2011-10-10 16:49

用Java实现Bloom Filter

正好在“问答”和“论坛”中看到关于Bloom Filter的帖子,学习研究了一把,自娱自乐就写了一种实现。不多说,直接上代码,代码尽量写得具备可读性,不多解释了。关于Bloom Filter可以参考http://www.google.com.hk/ggblog/googlechinablog/2007/07/bloom-filter_7469.html import java.io.By ...
chen_yongkai 评论(4) 有4108人浏览 2011-09-09 17:09

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics