`
liaokang.java
  • 浏览: 155437 次
  • 性别: Icon_minigender_1
  • 来自: 湖南
社区版块
存档分类
最新评论

HashSet介绍

    博客分类:
  • java
阅读更多
(1) 为啥要用HahSet?
    假如我们现在想要在一大堆数据中查找X数据。LinkedList的数据结构就不说了,查找效率低的可怕。ArrayList哪,如果我们不知道X的位置序号,还是一样要全部遍历一次直到查到结果,效率一样可怕。HashSet天生就是为了提高查找效率的。

(2) hashCode 散列码
     散列码是由对象导出的一个整数值。在Object中有一个hashCode方法来得到散列码。基本上,每一个对象都有一个默认的散列码,其值就是对象的内存地址。但也有一些对象的散列码不同,比如String对象,它的散列码是对内容的计算结果:

Java代码 
//String对象的散列码计算   
String str="hello";   
int hash=0;   
for(int i=0;i<length();i++)   
    hash=31*hash+charAt(i);  
    
   那么下面散列码的结果不同也就好解释了。s和t都还是String对象,散列码由内容获得,结果一样。sb和tb是StringBuffer对象,自身没有hashCode方法,只能继承Object的默认方法,散列码是对象地址,当然不一样了。

Java代码 
String s=new String("OK");//散列码: 3030   
String t="Ok";  /散列码: 3030  
StringBuffer sb=new StringBuffer(s);  //散列码:20526976   
StringBuffer tb=new StringBuffer(t);  //散列码:20527144  


(3)HashSet 散列表的内部结构
      HashSet是个链表数组。每一个数组元素就是一个列表,我们称为散列表元 。

(4)HashSet 如何add机制
      假如我们有一个数据(散列码76268),而此时的HashSet有128个散列单元,那么这个数据将有可能插入到数组的第108个链表中(76268%128=108)。但这只是有可能,如果在第108号链表中发现有一个老数据与新数据equals()=true的话,这个新数据将被视为已经加入,而不再重复丢入链表。 那么数据的散列码我知道,但HashSet的散列单元大小如何指定那?
    Java默认的散列单元大小全部都是2的幂,初始值为16(2的4次幂)。假如16条链表中的75%链接有数据的时候,则认为加载因子达到默认的0.75。HahSet开始重新散列,也就是将原来的散列结构全部抛弃,重新开辟一个散列单元大小为32(2的5次幂)的散列结果,并重新计算各个数据的存储位置。以此类推下去.....

(5)为什么HashSet查找效率提高了。
      知道了HashSet的add机制后,查找的道理一样。直接根据数据的散列码和散列表的数组大小计算除余后,就得到了所在数组的位置,然后再查找链表中是否有这个数据即可。
      查找的代价也就是在链表中,但是真正一条链表中的数据很少,有的甚至没有。几乎没有什么迭代的代价可言了。所以散列表的查找效率建立在散列单元所指向的链表中的数据要少 。

(6) hashCode方法必须与equals方法必须兼容
     如果我们自己定义了一个类,想对这个类的大量对象组织成散列表结构便于查找。有一点一定要注意:就是hashCode方法必须与equals方法相兼容。

Java代码 
//hashCode与equals方法的兼容
public class Employee{
       public int id;
       public String name="";
       //相同id对象具有相同散列码
       public int hashCode(){ 
              return id;
       }
       //equals必须比较id
        public boolean equals(Employee x){
              if(this.id==x.id) return true;
              else return false;
       }
}     
   
   为什么要这样,因为HashSet不允许相同元素(equals==ture)同时存在在结构中。假如employeeX(1111,“张三”)和employee(1111,"李四"),而Employee.equals比较的是name。这样的话,employeeX和employeeY的equals不相等。它们会根据相同的散列码1111加入到同一个散列单元所指向的列表中。这种情况多了,链表的数据将很庞大,散列冲突将非常严重,查找效率会大幅度的降低。
(6) 总结一下
    1、HashSet不能重复存储equals相同的数据 。原因就是equals相同,数据的散列码也就相同(hashCode必须和equals兼容)。大量相同的数据将存放在同一个散列单元所指向的链表中,造成严重的散列冲突,对查找效率是灾难性的。

    2、HashSet的存储是无序的 ,没有前后关系,他并不是线性结构的集合。

    3、hashCode必须和equals必须兼容, 这也是为了第1点。

分享到:
评论

相关推荐

    hashset类的使用

    本篇将详细介绍Java语言中HashSet类的使用,包括其继承结构、构造函数、常用方法以及实例演示。 首先,HashSet类继承自AbstractSet类,并实现了Set接口。这意味着HashSet同时具备了Set集合的特性,如不允许包含重复...

    treemap treeset hashset hashmap 简要介绍

    这些集合类各自有着独特的特性和应用场景,下面将对它们进行详细介绍。 ### TreeMap `TreeMap`是基于红黑树(Red-Black tree)实现的Sorted Map(排序映射)。它实现了`Map`接口,并且提供了一些额外的方法,如`...

    HashSet类的用法.pdf

    ### HashSet类的用法 #### 一、概述 `HashSet`是Java集合框架的一部分,它实现了`Set`接口。...以上是对`HashSet`类的基本用法及特性的一个详细介绍。希望这些内容能帮助读者更好地理解和使用`HashSet`。

    源码解析jdk7.0集合:HashSet的底层实现原理.pdf

    下面就详细介绍HashSet的实现原理。 首先,HashSet是Set接口的一个实现类,它用于存储唯一性的对象集合。所谓唯一性,指的是HashSet中不允许出现重复的元素,同时,它也允许存储null值。Set集合的特点是无序的,也...

    HashSet工作原理_动力节点Java学院整理

    下面我们来详细介绍 HashSet 的工作原理。 HashSet 的实现 HashSet 的实现是基于 HashMap 的,它使用 HashMap 来保存所有元素。HashSet 的源代码中有一个私有的变量 `map`,它是一个 `HashMap,Object&gt;`,用于保存...

    Java编程中的HashSet和BitSet详解

    在本文中,我们将详细介绍HashSet和BitSet的差异,并解释为什么BitSet更适合某些场景。 HashSet是Java集合框架中的一种集合类,它实现了Set接口,提供了快速的元素查找和插入操作。HashSet的主要特点是它可以自动地...

    c# HashSet的扩容机制需要注意的

    在本文中,我们将详细介绍 HashSet 的扩容机制,包括背景、扩容机制的实现细节、风险分析等方面的内容。 背景 HashSet 的扩容机制是为了解决内存和 CPU 使用问题。当一个项目进了大客户之后,搞得我们对内存和 CPU...

    Java面试题之HashSet的实现原理

    下面我们将详细介绍HashSet的实现原理。 首先,HashSet是Set的一个实现,所以它保证了其中没有重复的元素。在HashSet中,最重要的一个操作就是查找,而HashSet专门对快速查找进行了优化。HashSet使用的是散列函数,...

    通过实例学习Java集合框架HashSet

    本文将通过实例代码详细介绍HashSet的使用和特点,帮助读者更好地掌握HashSet的使用。 一、元素不能重复 HashSet的主要特点是元素不能重复,即同一个元素不能在HashSet中出现多次。例如,在示例1中,我们添加了两...

    详解Java中HashSet和TreeSet的区别

    本文将详细介绍 HashSet 和 TreeSet 的区别,帮助大家更好地理解和使用这些集合类。 HashSet HashSet 是一个基于哈希表的集合类,它的主要特点是不能保证元素的排列顺序,顺序有可能发生变化。它不是一个同步的...

    Java HashSet集合存储遍历学生对象代码实例

    在本文中,我们将通过一个实例,介绍如何使用Java HashSet集合来存储和遍历学生对象,并解决添加重复元素的问题。 知识点1: HashSet集合的特点 HashSet集合是一种基于哈希表的集合实现,它的特点是: * 不存储...

    C# ArrayList、HashSet、HashTable、List、Dictionary的区别详解

    本文将介绍 C# 中的 ArrayList、HashSet、HashTable、List、Dictionary 等集合类的区别和应用场景。 ArrayList 是一个可变长数组,可以将任意多的数据添加到 ArrayList 中。其内部维护的数组,当长度不足时,会自动...

    something:他山之石,可以攻玉

    集合I/O多线程NIOjava基础知识点整理jvmspring 相关MYSQL分布式存储检索java源码学习集合Linkedlist详解Vector详解Stack详解Map构架HashMap详解HashMap put逻辑总结HashMap与HashTable比较HashSet介绍I/...

    Java集合框架源码剖析:HashSet 和 HashMap

    总体介绍  之所以把HashSet和HashMap放在一起讲解,是因为二者在Java里有着相同的实现,前者仅仅是对后者做了一层包装,也是说HashSet里面有一个HashMap(适配器模式)。因此本文将重点分析HashMap。  HashMap...

    链表去重内容介绍.zip

    1. 哈希表法(HashSet) 这种方法的核心思想是使用一个哈希表(在Java中是HashSet)来存储已经访问过的元素。遍历链表,对于每个元素,检查它是否已经在哈希表中。如果不在,将其添加到哈希表中,并保留在链表中;...

    毕向东1406

    毕向东老师可能详细介绍了HashSet依赖于对象的hashCode()和equals()方法来判断元素是否已经存在。当调用add()方法时,如果新添加的对象与现有元素的hashCode相匹配,并且equals()返回true,那么该元素不会被添加,...

    对于java集合类的一个简单介绍

    ArrayList和LinkedList是List接口的两个常用的实现类,而HashSet和TreeSet是Set接口的两个常用的实现类。Iterator是一种设计模式,提供了遍历集合的能力。Collection接口是Java集合类中最高级的接口,提供了基本的...

    Java基础学习25.pdf

    通过以上内容的介绍,读者应能更深入地理解Java集合框架中的Set接口及其各种实现的内部原理,并掌握如何在Java编程中使用这些集合来解决实际问题。同时,还应该对并发集合类有所了解,以及如何在多线程环境下安全地...

    ypjh001#-#04.Set集合1

    1.HashSet集合介绍 2.HashSet集合存储数据的结构(哈希表) 3.HashSet存储自定义类型元素 5.TreeSet集合 1.特点 2.演示 1

Global site tag (gtag.js) - Google Analytics