`

java中的BitSet学习 java中的BitSet学习

 
阅读更多

java中的BitSet学习

分类: 算法 Java SE 338人阅读 评论(0) 收藏 举报

(1)BitSet类
大小可动态改变, 取值为true或false的位集合。用于表示一组布尔标志。

此类实现了一个按需增长的位向量。位 set 的每个组件都有一个 boolean 值。用非负的整数将 BitSet 的位编入索引。可以对每个编入索引的位进行测试、设置或者清除。通过逻辑与、逻辑或和逻辑异或操作,可以使用一个 BitSet 修改另一个 BitSet 的内容。

默认情况下,set 中所有位的初始值都是 false。

每个位 set 都有一个当前大小,也就是该位 set 当前所用空间的位数。注意,这个大小与位 set 的实现有关,所以它可能随实现的不同而更改。位 set 的长度与位 set 的逻辑长度有关,并且是与实现无关而定义的。

除非另行说明,否则将 null 参数传递给 BitSet 中的任何方法都将导致 NullPointerException。 在没有外部同步的情况下,多个线程操作一个 BitSet 是不安全的。

(2) 构造函数: BitSet() or BitSet(int nbits)

(3) 一些方法
public void set(int pos): 位置pos的字位设置为true。
public void set(int bitIndex, boolean value) 将指定索引处的位设置为指定的值。
public void clear(int pos): 位置pos的字位设置为false。
public void clear() : 将此 BitSet 中的所有位设置为 false。
public int cardinality() 返回此 BitSet 中设置为 true 的位数。
public boolean get(int pos): 返回位置是pos的字位值。
public void and(BitSet other): other同该字位集进行与操作,结果作为该字位集的新值。
public void or(BitSet other): other同该字位集进行或操作,结果作为该字位集的新值。
public void xor(BitSet other): other同该字位集进行异或操作,结果作为该字位集的新值。
public void andNot(BitSet set) 清除此 BitSet 中所有的位,set - 用来屏蔽此 BitSet 的 BitSet
public int size(): 返回此 BitSet 表示位值时实际使用空间的位数。
public int length() 返回此 BitSet 的“逻辑大小”:BitSet 中最高设置位的索引加 1。
public int hashCode(): 返回该集合Hash 码, 这个码同集合中的字位值有关。
public boolean equals(Object other): 如果other中的字位同集合中的字位相同,返回true。
public Object clone() 克隆此 BitSet,生成一个与之相等的新 BitSet。
public String toString() 返回此位 set 的字符串表示形式。

例1:标明一个字符串中用了哪些字符
import java.util.BitSet;
public class WhichChars{
   private BitSet used = new BitSet();
   public WhichChars(String str){
      for(int i=0;i< str.length();i++)
        used.set(str.charAt(i));  // set bit for char
   }
    public String toString(){
         String desc="[";
         int size=used.size();
          for(int i=0;i< size;i++){
             if(used.get(i))
                 desc+=(char)i;
            }
             return desc+"]";
         }
    public static void main(String args[]){
        WhichChars w=new WhichChars("How do you do");
        System.out.println(w);
    }
   }
运行:
C:\work>java WhichChars

[ Hdouwy]


2.java.util.BitSet 研究(存数海量数据时的一个途径)

java.util.BitSet可以按位存储。
计算机中一个字节(byte)占8位(bit),我们java中数据至少按字节存储的,
比如一个int占4个字节。
如果遇到大的数据量,这样必然会需要很大存储空间和内存。
如何减少数据占用存储空间和内存可以用算法解决。
java.util.BitSet就提供了这样的算法。
比如有一堆数字,需要存储,source=[3,5,6,9]
用int就需要4*4个字节。
java.util.BitSet可以存true/false。
如果用java.util.BitSet,则会少很多,其原理是:
1,先找出数据中最大值maxvalue=9
2,声明一个BitSet bs,它的size是maxvalue+1=10
3,遍历数据source,bs[source[i]]设置成true.

最后的值是:
(0为false;1为true)
bs [0,0,0,1,0,1,1,0,0,1]
3, 5,6, 9

这样一个本来要int型需要占4字节共32位的数字现在只用了1位!
比例32:1

这样就省下了很大空间。

看看测试例子

  1. packagecom;
  2. importjava.util.BitSet;
  3. publicclassMainTestThree{
  4. /**
  5. *@paramargs
  6. */
  7. publicstaticvoidmain(String[]args){
  8. BitSetbm=newBitSet();
  9. System.out.println(bm.isEmpty()+"--"+bm.size());
  10. bm.set(0);
  11. System.out.println(bm.isEmpty()+"--"+bm.size());
  12. bm.set(1);
  13. System.out.println(bm.isEmpty()+"--"+bm.size());
  14. System.out.println(bm.get(65));
  15. System.out.println(bm.isEmpty()+"--"+bm.size());
  16. bm.set(65);
  17. System.out.println(bm.isEmpty()+"--"+bm.size());
  18. }
  19. }

输出:
true--64
false--64
false--64
false
false--64
false--128

说明默认的构造函数声明一个64位的BitSet,值都是false。
如果你要用的位超过了默认size,它会再申请64位,而不是报错。

  1. packagecom;
  2. importjava.util.BitSet;
  3. publicclassMianTestFour{
  4. /**
  5. *@paramargs
  6. */
  7. publicstaticvoidmain(String[]args){
  8. BitSetbm1=newBitSet(7);
  9. System.out.println(bm1.isEmpty()+"--"+bm1.size());
  10. BitSetbm2=newBitSet(63);
  11. System.out.println(bm2.isEmpty()+"--"+bm2.size());
  12. BitSetbm3=newBitSet(65);
  13. System.out.println(bm3.isEmpty()+"--"+bm3.size());
  14. BitSetbm4=newBitSet(111);
  15. System.out.println(bm4.isEmpty()+"--"+bm4.size());
  16. }
  17. }


输出:
true--64
true--64
true--128
true--128

说明你申请的位都是以64为倍数的,就是说你申请不超过一个64的就按64算,超过一个不超过
2个的就按128算。

  1. packagecom;
  2. importjava.util.BitSet;
  3. publicclassMainTestFive{
  4. /**
  5. *@paramargs
  6. */
  7. publicstaticvoidmain(String[]args){
  8. int[]shu={2,42,5,6,6,18,33,15,25,31,28,37};
  9. BitSetbm1=newBitSet(MainTestFive.getMaxValue(shu));
  10. System.out.println("bm1.size()--"+bm1.size());
  11. MainTestFive.putValueIntoBitSet(shu,bm1);
  12. printBitSet(bm1);
  13. }
  14. //初始全部为false,这个你可以不用,因为默认都是false
  15. publicstaticvoidinitBitSet(BitSetbs){
  16. for(inti=0;i<bs.size();i++){
  17. bs.set(i,false);
  18. }
  19. }
  20. //打印
  21. publicstaticvoidprintBitSet(BitSetbs){
  22. StringBufferbuf=newStringBuffer();
  23. buf.append("[\n");
  24. for(inti=0;i<bs.size();i++){
  25. if(i<bs.size()-1){
  26. buf.append(MainTestFive.getBitTo10(bs.get(i))+",");
  27. }else{
  28. buf.append(MainTestFive.getBitTo10(bs.get(i)));
  29. }
  30. if((i+1)%8==0&&i!=0){
  31. buf.append("\n");
  32. }
  33. }
  34. buf.append("]");
  35. System.out.println(buf.toString());
  36. }
  37. //找出数据集合最大值
  38. publicstaticintgetMaxValue(int[]zu){
  39. inttemp=0;
  40. temp=zu[0];
  41. for(inti=0;i<zu.length;i++){
  42. if(temp<zu[i]){
  43. temp=zu[i];
  44. }
  45. }
  46. System.out.println("maxvalue:"+temp);
  47. returntemp;
  48. }
  49. //放值
  50. publicstaticvoidputValueIntoBitSet(int[]shu,BitSetbs){
  51. for(inti=0;i<shu.length;i++){
  52. bs.set(shu[i],true);
  53. }
  54. }
  55. //true,false换成1,0为了好看
  56. publicstaticStringgetBitTo10(booleanflag){
  57. Stringa="";
  58. if(flag==true){
  59. return"1";
  60. }else{
  61. return"0";
  62. }
  63. }
  64. }



输出:
maxvalue:42
bm1.size()--64
[
0,0,1,0,0,1,1,0,
0,0,0,0,0,0,0,1,
0,0,1,0,0,0,0,0,
0,1,0,0,1,0,0,1,
0,1,0,0,0,1,0,0,
0,0,1,0,0,0,0,0,
0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0
]

这样便完成了存值和取值。
注意它会对重复的数字过滤,就是说,一个数字出现过超过2次的它都记成1.

出现的次数这个信息就丢了

分享到:
评论

相关推荐

    对java的BitSet的多线程并发的探索

    由于long的基本操作(如按位或、按位与、按位异或)在Java中是原子的,因此在单线程环境下,我们可以直接对BitSet进行位操作而不用担心数据不一致的问题。但是,当多个线程同时修改BitSet时,由于这些操作不是原子的...

    java 原生包 BitSet 源码

    1. 每个BitSet中的位都有一个true或false的值。 2. 位的索引是从0开始的非负整数。 3. 可以通过索引检查、设置或清除个别位。 4. 通过逻辑与(AND)、逻辑或(OR)和逻辑异或(XOR)操作来修改另一个BitSet的内容。 ...

    javabitset源码-Java8-learning:学习Java8新特性

    在Java8之前,接口中只能包含抽象方法。那么这有什么样弊端呢?比如,想再Collection接口中添加一个spliterator抽象方法,那么也就意味着之前所有实现Collection接口的实现类,都要重新实现spliterator这个方法才行...

    浅谈Java BitSet使用场景和代码示例

    Java BitSet 是 Java 中的一个重要类,它实现了一个按需增长的位向量。BitSet 的每一个组件都有一个 boolean 值,用非负的整数将 BitSet 的位编入索引。可以对每个编入索引的位进行测试、设置或者清除。通过逻辑与、...

    RoaringBitmap, 在Java中,一个更好的压缩 bitset.zip

    RoaringBitmap, 在Java中,一个更好的压缩 bitset RoaringBitmap Bitsets,也称为位图,通常用作快速数据结构。 不幸的是,他们可以使用太多的内存。 为了补偿,我们经常使用压缩位图。咆哮位图是压缩位图,它比传统...

    java bitset 源码解析.rtf

    java bitset 高级数据结构 源码解析 适合 0-3 年开发人员,进阶、面试必备知识!

    java基础之BitSet - 副本.md

    java基础之BitSet - 副本

    BitSet 源码分析.txt

    基于JDK1.8的BitSet 源码分析, 描述了实现的原理 个方法的含义 虽然没有写出实际的测试代码 但是只要是细度了我的这个分析 在使用的时候就不是问题了

    javabitset源码-JerrySoundCode:杰瑞声码

    bitset源码Java源码分析 基础集合列表 ArrayList (done) Vector (done) LinkedList (done) Stack (done) ReferenceQueue (done) ArrayDeque (done) Set HashSet (done) TreeSet (done) LinkedHashSet (done) BitSet ...

    Java编程中的HashSet和BitSet详解

    Java编程中的HashSet和BitSet详解 HashSet和BitSet是Java编程中两个常用的集合类,它们都可以用来存储大量的数据,但它们之间有着明显的差异。那么,为什么Apache Commons作者选择使用BitSet代替HashSet呢?在本文...

    javabitset源码-javaewah:JavaBitSet类的压缩替代品

    bitset源码Java 这是 Java Bitset 类的字对齐压缩变体。 我们提供 64 位和 32 位类似 RLE 的压缩方案。 它可用于实现位图索引。 它所依赖的 EWAH 格式用于运行 GitHub 的 git 实现。 字对齐压缩的目标不是实现最佳...

    javabitset源码-java_master:后端架构师技术图谱

    java bitset 源码 最后更新于20180424 (Toc generated by ) 数据结构 队列 非阻塞队列:ConcurrentLinkedQueue(无界线程安全),采用CAS机制(compareAndSwapObject原子操作)。 阻塞队列:ArrayBlockingQueue(有界...

    使用bitset实现毫秒级查询(实例讲解)

    那么words[wordIndex]值将是1111,表示整数0、1、2、3、4在bitset中存在。 在查询时,我们可以使用bitset索引来快速查询数据。例如,如果我们要查询“北京市18岁的女生”,那么我们可以使用bitset索引来快速查询...

    javabitset源码-Study:学习

    Java中的锁和同步类 公平锁 & 非公平锁 悲观锁 乐观锁 & CAS ABA 问题 CopyOnWrite容器 RingBuffer 可重入锁 & 不可重入锁 互斥锁 & 共享锁 死锁 操作系统 计算机原理 CPU 多级缓存 进程 线程 协程 Linux 设计模式 ...

    javabitset源码-myleetcode:所有LeetCode问题的记录

    java bitset源码 目前进度(171/237) LeetCode做题笔记 Add two numbers:给定一个数集合和一个数,已知集合中有两个数的和是给定数,求这两个加数的index 方法1:暴力,n^2时间复杂度,不推荐 方法2:快速排序nlogn...

    javabitset源码-montysolr:Solr天体物理数据系统

    在标题提及的 "javabitset源码-montysolr:Solr天体物理数据系统" 中,我们可以推测这个项目可能是在Solr(一个流行的全文搜索引擎)中使用BitSet来处理天体物理数据。下面我们将深入探讨Java BitSet以及它如何应用于...

    Java海量数据处理BitSetmd,学习代码d

    在Java中,BitSet提供了多种方法来操作位集合,例如`set(int index)`用于设置指定位置的位为true,`clear(int index)`则将位设为false,`get(int index)`用来检查某个位是否为true,`cardinality()`返回BitSet中true...

    javabitset源码-all-kinds-book:java大数据sparkflinkredishivehbasekafka面试题数据结构

    bitset 源码 all-kinds-book 主要包含 java 大数据 数据仓库 数据分析 第三方组件 面试题 数据结构与算法 设计模式 软件设计 等文档 ,可以访问我们的官网查看更多内容 [人在地上跑 牛在天上飞](#人在地上跑 牛在...

    java基础面试题.doc

    2.在 Java 中,String, BitSet, Date, 和 File 等类都对 equals 方法进行了重写,对两个 String 对象而言,值相等意味着它们包含同样的字符序列。 五、Java 中的 hashCode 和 equals 方法 1.在 Java 中,hashCode ...

    JAVA SE学习精华集锦

    JAVA SE学习精华集锦 Java SE(Java Standard Edition)是Java平台的核心部分,它提供了用于开发和部署桌面、服务器以及嵌入式应用的基础工具和框架。以下是对标题和描述中涉及的一些关键知识点的详细说明: 1. **...

Global site tag (gtag.js) - Google Analytics