分类:
算法 Java SE
2012-08-09 21:50
338人阅读
收藏
举报
(1)BitSet类 大小可动态改变, 取值为true或false的位集合。用于表示一组布尔标志。
此类实现了一个按需增长的位向量。位 set 的每个组件都有一个 boolean 值。用非负的整数将 BitSet 的位编入索引。可以对每个编入索引的位进行测试、设置或者清除。通过逻辑与、逻辑或和逻辑异或操作,可以使用一个 BitSet 修改另一个 BitSet 的内容。
默认情况下,set 中所有位的初始值都是 false。
每个位 set 都有一个当前大小,也就是该位 set 当前所用空间的位数。注意,这个大小与位 set 的实现有关,所以它可能随实现的不同而更改。位 set 的长度与位 set 的逻辑长度有关,并且是与实现无关而定义的。
除非另行说明,否则将 null 参数传递给 BitSet 中的任何方法都将导致 NullPointerException。 在没有外部同步的情况下,多个线程操作一个 BitSet 是不安全的。
|
|
(2) 构造函数: BitSet() or BitSet(int nbits)
(3) 一些方法
public void set(int pos): 位置pos的字位设置为true。
public void set(int bitIndex, boolean value) 将指定索引处的位设置为指定的值。
public void clear(int pos): 位置pos的字位设置为false。
public void clear() : 将此 BitSet 中的所有位设置为 false。
public int cardinality() 返回此 BitSet 中设置为 true 的位数。
public boolean get(int pos): 返回位置是pos的字位值。
public void and(BitSet other): other同该字位集进行与操作,结果作为该字位集的新值。
public void or(BitSet other): other同该字位集进行或操作,结果作为该字位集的新值。
public void xor(BitSet other): other同该字位集进行异或操作,结果作为该字位集的新值。
public void andNot(BitSet set) 清除此 BitSet 中所有的位,set - 用来屏蔽此 BitSet 的 BitSet
public int size(): 返回此 BitSet 表示位值时实际使用空间的位数。
public int length() 返回此 BitSet 的“逻辑大小”:BitSet 中最高设置位的索引加 1。
public int hashCode(): 返回该集合Hash 码, 这个码同集合中的字位值有关。
public boolean equals(Object other): 如果other中的字位同集合中的字位相同,返回true。
public Object clone() 克隆此 BitSet,生成一个与之相等的新 BitSet。
public String toString() 返回此位 set 的字符串表示形式。
例1:标明一个字符串中用了哪些字符import java.util.BitSet;
public class WhichChars{
private BitSet used = new BitSet();
public WhichChars(String str){
for(int i=0;i< str.length();i++)
used.set(str.charAt(i)); // set bit for char
}
public String toString(){
String desc="[";
int size=used.size();
for(int i=0;i< size;i++){
if(used.get(i))
desc+=(char)i;
}
return desc+"]";
}
public static void main(String args[]){
WhichChars w=new WhichChars("How do you do");
System.out.println(w);
}
}
运行:C:\work>java WhichChars[ Hdouwy]
2.java.util.BitSet
研究(存数海量数据时的一个途径)
java.util.BitSet可以按位存储。
计算机中一个字节(byte)占8位(bit),我们java中数据至少按字节存储的,
比如一个int占4个字节。
如果遇到大的数据量,这样必然会需要很大存储空间和内存。
如何减少数据占用存储空间和内存可以用算法解决。
java.util.BitSet就提供了这样的算法。
比如有一堆数字,需要存储,source=[3,5,6,9]
用int就需要4*4个字节。
java.util.BitSet可以存true/false。
如果用java.util.BitSet,则会少很多,其原理是:
1,先找出数据中最大值maxvalue=9
2,声明一个BitSet bs,它的size是maxvalue+1=10
3,遍历数据source,bs[source[i]]设置成true.
最后的值是:
(0为false;1为true)
bs [0,0,0,1,0,1,1,0,0,1]
3, 5,6, 9
这样一个本来要int型需要占4字节共32位的数字现在只用了1位!
比例32:1
这样就省下了很大空间。
看看测试例子
-
packagecom;
-
-
importjava.util.BitSet;
-
-
publicclassMainTestThree{
-
-
/**
-
*@paramargs
-
*/
-
publicstaticvoidmain(String[]args){
-
BitSetbm=newBitSet();
-
System.out.println(bm.isEmpty()+"--"+bm.size());
-
bm.set(0);
-
System.out.println(bm.isEmpty()+"--"+bm.size());
-
bm.set(1);
-
System.out.println(bm.isEmpty()+"--"+bm.size());
-
System.out.println(bm.get(65));
-
System.out.println(bm.isEmpty()+"--"+bm.size());
-
bm.set(65);
-
System.out.println(bm.isEmpty()+"--"+bm.size());
-
}
-
-
}
输出:
true--64
false--64
false--64
false
false--64
false--128
说明默认的构造函数声明一个64位的BitSet,值都是false。
如果你要用的位超过了默认size,它会再申请64位,而不是报错。
-
packagecom;
-
-
importjava.util.BitSet;
-
-
publicclassMianTestFour{
-
-
/**
-
*@paramargs
-
*/
-
publicstaticvoidmain(String[]args){
-
BitSetbm1=newBitSet(7);
-
System.out.println(bm1.isEmpty()+"--"+bm1.size());
-
-
BitSetbm2=newBitSet(63);
-
System.out.println(bm2.isEmpty()+"--"+bm2.size());
-
-
BitSetbm3=newBitSet(65);
-
System.out.println(bm3.isEmpty()+"--"+bm3.size());
-
-
BitSetbm4=newBitSet(111);
-
System.out.println(bm4.isEmpty()+"--"+bm4.size());
-
}
-
-
}
输出:
true--64
true--64
true--128
true--128
说明你申请的位都是以64为倍数的,就是说你申请不超过一个64的就按64算,超过一个不超过
2个的就按128算。
-
packagecom;
-
-
importjava.util.BitSet;
-
-
publicclassMainTestFive{
-
-
/**
-
*@paramargs
-
*/
-
publicstaticvoidmain(String[]args){
-
int[]shu={2,42,5,6,6,18,33,15,25,31,28,37};
-
BitSetbm1=newBitSet(MainTestFive.getMaxValue(shu));
-
System.out.println("bm1.size()--"+bm1.size());
-
-
MainTestFive.putValueIntoBitSet(shu,bm1);
-
printBitSet(bm1);
-
}
-
-
//初始全部为false,这个你可以不用,因为默认都是false
-
publicstaticvoidinitBitSet(BitSetbs){
-
for(inti=0;i<bs.size();i++){
-
bs.set(i,false);
-
}
-
}
-
//打印
-
publicstaticvoidprintBitSet(BitSetbs){
-
StringBufferbuf=newStringBuffer();
-
buf.append("[\n");
-
for(inti=0;i<bs.size();i++){
-
if(i<bs.size()-1){
-
buf.append(MainTestFive.getBitTo10(bs.get(i))+",");
-
}else{
-
buf.append(MainTestFive.getBitTo10(bs.get(i)));
-
}
-
if((i+1)%8==0&&i!=0){
-
buf.append("\n");
-
}
-
}
-
buf.append("]");
-
System.out.println(buf.toString());
-
}
-
//找出数据集合最大值
-
publicstaticintgetMaxValue(int[]zu){
-
inttemp=0;
-
temp=zu[0];
-
for(inti=0;i<zu.length;i++){
-
if(temp<zu[i]){
-
temp=zu[i];
-
}
-
}
-
System.out.println("maxvalue:"+temp);
-
returntemp;
-
}
-
//放值
-
publicstaticvoidputValueIntoBitSet(int[]shu,BitSetbs){
-
for(inti=0;i<shu.length;i++){
-
bs.set(shu[i],true);
-
}
-
}
-
//true,false换成1,0为了好看
-
publicstaticStringgetBitTo10(booleanflag){
-
Stringa="";
-
if(flag==true){
-
return"1";
-
}else{
-
return"0";
-
}
-
}
-
-
}
输出:
maxvalue:42
bm1.size()--64
[
0,0,1,0,0,1,1,0,
0,0,0,0,0,0,0,1,
0,0,1,0,0,0,0,0,
0,1,0,0,1,0,0,1,
0,1,0,0,0,1,0,0,
0,0,1,0,0,0,0,0,
0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0
]
这样便完成了存值和取值。
注意它会对重复的数字过滤,就是说,一个数字出现过超过2次的它都记成1.
出现的次数这个信息就丢了
分享到:
相关推荐
由于long的基本操作(如按位或、按位与、按位异或)在Java中是原子的,因此在单线程环境下,我们可以直接对BitSet进行位操作而不用担心数据不一致的问题。但是,当多个线程同时修改BitSet时,由于这些操作不是原子的...
1. 每个BitSet中的位都有一个true或false的值。 2. 位的索引是从0开始的非负整数。 3. 可以通过索引检查、设置或清除个别位。 4. 通过逻辑与(AND)、逻辑或(OR)和逻辑异或(XOR)操作来修改另一个BitSet的内容。 ...
在Java8之前,接口中只能包含抽象方法。那么这有什么样弊端呢?比如,想再Collection接口中添加一个spliterator抽象方法,那么也就意味着之前所有实现Collection接口的实现类,都要重新实现spliterator这个方法才行...
Java BitSet 是 Java 中的一个重要类,它实现了一个按需增长的位向量。BitSet 的每一个组件都有一个 boolean 值,用非负的整数将 BitSet 的位编入索引。可以对每个编入索引的位进行测试、设置或者清除。通过逻辑与、...
RoaringBitmap, 在Java中,一个更好的压缩 bitset RoaringBitmap Bitsets,也称为位图,通常用作快速数据结构。 不幸的是,他们可以使用太多的内存。 为了补偿,我们经常使用压缩位图。咆哮位图是压缩位图,它比传统...
java bitset 高级数据结构 源码解析 适合 0-3 年开发人员,进阶、面试必备知识!
java基础之BitSet - 副本
基于JDK1.8的BitSet 源码分析, 描述了实现的原理 个方法的含义 虽然没有写出实际的测试代码 但是只要是细度了我的这个分析 在使用的时候就不是问题了
bitset源码Java源码分析 基础集合列表 ArrayList (done) Vector (done) LinkedList (done) Stack (done) ReferenceQueue (done) ArrayDeque (done) Set HashSet (done) TreeSet (done) LinkedHashSet (done) BitSet ...
Java编程中的HashSet和BitSet详解 HashSet和BitSet是Java编程中两个常用的集合类,它们都可以用来存储大量的数据,但它们之间有着明显的差异。那么,为什么Apache Commons作者选择使用BitSet代替HashSet呢?在本文...
bitset源码Java 这是 Java Bitset 类的字对齐压缩变体。 我们提供 64 位和 32 位类似 RLE 的压缩方案。 它可用于实现位图索引。 它所依赖的 EWAH 格式用于运行 GitHub 的 git 实现。 字对齐压缩的目标不是实现最佳...
java bitset 源码 最后更新于20180424 (Toc generated by ) 数据结构 队列 非阻塞队列:ConcurrentLinkedQueue(无界线程安全),采用CAS机制(compareAndSwapObject原子操作)。 阻塞队列:ArrayBlockingQueue(有界...
那么words[wordIndex]值将是1111,表示整数0、1、2、3、4在bitset中存在。 在查询时,我们可以使用bitset索引来快速查询数据。例如,如果我们要查询“北京市18岁的女生”,那么我们可以使用bitset索引来快速查询...
Java中的锁和同步类 公平锁 & 非公平锁 悲观锁 乐观锁 & CAS ABA 问题 CopyOnWrite容器 RingBuffer 可重入锁 & 不可重入锁 互斥锁 & 共享锁 死锁 操作系统 计算机原理 CPU 多级缓存 进程 线程 协程 Linux 设计模式 ...
java bitset源码 目前进度(171/237) LeetCode做题笔记 Add two numbers:给定一个数集合和一个数,已知集合中有两个数的和是给定数,求这两个加数的index 方法1:暴力,n^2时间复杂度,不推荐 方法2:快速排序nlogn...
在标题提及的 "javabitset源码-montysolr:Solr天体物理数据系统" 中,我们可以推测这个项目可能是在Solr(一个流行的全文搜索引擎)中使用BitSet来处理天体物理数据。下面我们将深入探讨Java BitSet以及它如何应用于...
在Java中,BitSet提供了多种方法来操作位集合,例如`set(int index)`用于设置指定位置的位为true,`clear(int index)`则将位设为false,`get(int index)`用来检查某个位是否为true,`cardinality()`返回BitSet中true...
bitset 源码 all-kinds-book 主要包含 java 大数据 数据仓库 数据分析 第三方组件 面试题 数据结构与算法 设计模式 软件设计 等文档 ,可以访问我们的官网查看更多内容 [人在地上跑 牛在天上飞](#人在地上跑 牛在...
2.在 Java 中,String, BitSet, Date, 和 File 等类都对 equals 方法进行了重写,对两个 String 对象而言,值相等意味着它们包含同样的字符序列。 五、Java 中的 hashCode 和 equals 方法 1.在 Java 中,hashCode ...
JAVA SE学习精华集锦 Java SE(Java Standard Edition)是Java平台的核心部分,它提供了用于开发和部署桌面、服务器以及嵌入式应用的基础工具和框架。以下是对标题和描述中涉及的一些关键知识点的详细说明: 1. **...