BloomFilter(布隆过滤器)

543089122

浏览: 154810 次
性别:
来自: 武汉

最近访客更多访客>>

JevonZhang8

chenhaibo0806999

lycjtkl

竹林闲人

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

数据结构与算法

bitset bloomfilter

package sunfa;

import java.util.BitSet;
import java.util.Random;

/**
 * BloomFilter(布隆过滤器)
 * http://www.cnblogs.com/allensun/archive/2011/02/16/1956532.html
 * 
 */
public class BloomFilter {
	private int DEFAULT_SIZE = 1 << 6;
	private BitSet bitSet = null;// java.util.BitSet的最小长度是1<<6

	public BloomFilter() {
		init();
	}

	public BloomFilter(int cmp) {
		this.DEFAULT_SIZE = cmp;
		init();
	}

	private void init() {
		bitSet = new BitSet(DEFAULT_SIZE);
	}

	public int size() {
		return bitSet.size();
	}

	private static int oldHash(int h) {
		h += ~(h << 9);
		h ^= (h >>> 14);
		h += (h << 4);
		h ^= (h >>> 10);
		return h;
	}

	static int indexFor(int h, int length) {
		return h & (length - 1);
	}

	public void add(Object o) {
		int i = indexFor(oldHash(o.hashCode()), DEFAULT_SIZE);
		bitSet.set(i);
	}

	public boolean contians(Object o) {
		int i = indexFor(oldHash(o.hashCode()), DEFAULT_SIZE);
		return bitSet.get(i);
	}

	public String toString() {
		String s = "[";
		for (int i = 0; i < bitSet.size(); i++) {
			if (bitSet.get(i))
				s += i + ",";
		}
		s += "]";
		return s;
	}

	public static void main(String[] args) {
		BloomFilter bloom = new BloomFilter();
		System.out.println("bloomFilter.size:" + bloom.size());
		Random ran = new Random();
		int count = 100;
		for (int i = 0; i < count; i++) {
			int n =  ran.nextInt(100);
			System.out.print("before:" + n + "," + bloom.contians(n));
			bloom.add(n);
			System.out.println("==>after:" + n + "," + bloom.contians(n));
		}
		System.out.println();
		System.out.println(bloom.toString());
	}

//幂算法
	public static int power(int b, int e) {
		if (b == 0 || b == 1 || e == 0) {
			return 1;
		}
		if (1 == e)
			return b;
		int n = e >> 1;
		int tmp = power(b, n);
		if (0 == (e & 1))
			return tmp * tmp;
		else
			return tmp * tmp * b;
	}
}

分享到：

关于：一道腾讯面试题:从大量数字中取出to ... | Timer和ScheduledExecutorService区别

2011-10-11 19:30
浏览 1123
评论(0)
分类:行业应用
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

BloomFilter(布隆过滤器)

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

BloomFilter(布隆过滤器)

评论

发表评论

相关推荐

答复: 百度一面算法题(常数时间内求栈中最大值)

<转>李开复：算法的力量

简单_分治算法

由HashMap的实现联想到的

简单_随机平衡二叉树(Treap)

关于递归和尾递归的原理

关于Swing打印二叉树

简单_伸展树(Splay tree)

简单_Trie树与三叉Trie树

简单_快速选择算法(RANDOMIZED-SELECT)

字符匹配算法(KMP)

简单_堆排序算法

简单_插入排序(Insertion-sort)

简单_二叉堆

关于：一道腾讯面试题:从大量数字中取出top100

图解双链表

简单_快速排序

简单_二分法算法

简单_基本二叉树(BST)

简单_单链表

最近访客更多访客>>