(1) 为啥要用HahSet?
假如我们现在想要在一大堆数据中查找X数据。LinkedList的数据结构就不说了,查找效率低的可怕。ArrayList哪,如果我们不知道X的位置序号,还是一样要全部遍历一次直到查到结果,效率一样可怕。HashSet天生就是为了提高查找效率的。
(2) hashCode 散列码
散列码是由对象导出的一个整数值。在Object中有一个hashCode方法来得到散列码。基本上,每一个对象都有一个默认的散列码,其值就是对象的内存地址。但也有一些对象的散列码不同,比如String对象,它的散列码是对内容的计算结果:
//String对象的散列码计算
String str="hello";
int hash=0;
for(int i=0;i<length();i++)
hash=31*hash+charAt(i);
那么下面散列码的结果不同也就好解释了。s和t都还是String对象,散列码由内容获得,结果一样。sb和tb是StringBuffer对象,自身没有hashCode方法,只能继承Object的默认方法,散列码是对象地址,当然不一样了。
String s=new String("OK");//散列码: 3030
String t="Ok"; /散列码: 3030
StringBuffer sb=new StringBuffer(s); //散列码:20526976
StringBuffer tb=new StringBuffer(t); //散列码:20527144
(3) HashSet 散列表的内部结构
HashSet是个链表数组。每一个数组元素就是一个列表,我们称为散列表元
。
(4) HashSet 如何add机制
假如我们有一个数据(散列码76268),而此时的HashSet有128个散列单元,那么这个数据将有可能插入到数组的第108个链表中(76268%128=108)。但这只是有可能,如果在第108号链表中发现有一个老数据与新数据equals()=true的话,这个新数据将被视为已经加入,而不再重复丢入链表。
那么数据的散列码我知道,但HashSet的散列单元大小如何指定那?
Java默认的散列单元大小全部都是2的幂,初始值为16(2的4次幂)。假如16条链表中的75%链接有数据的时候,则认为加载因子达到默认的0.75。HahSet开始重新散列,也就是将原来的散列结构全部抛弃,重新开辟一个散列单元大小为32(2的5次幂)的散列结果,并重新计算各个数据的存储位置。以此类推下去.....
(5) 为什么HashSet查找效率提高了。
知道了HashSet的add机制后,查找的道理一样。直接根据数据的散列码和散列表的数组大小计算除余后,就得到了所在数组的位置,然后再查找链表中是否有这个数据即可。
查找的代价也就是在链表中,但是真正一条链表中的数据很少,有的甚至没有。几乎没有什么迭代的代价可言了。所以散列表的查找效率建立在散列单元所指向的链表中的数据要少
。
(6) hashCode方法必须与equals方法必须兼容
如果我们自己定义了一个类,想对这个类的大量对象组织成散列表结构便于查找。有一点一定要注意:就是hashCode方法必须与equals方法向兼容。
//hashCode与equals方法的兼容
public class Employee{
public int id;
public String name="";
//相同id对象具有相同散列码
public int hashCode(){
return id;
}
//equals必须比较id
public boolean equals(Employee x){
if(this.id==x.id) return true;
else return false;
}
}
为什么要这样,因为HashSet不允许相同元素(equals==ture)同时存在在结构中。假如employeeX(1111,“张三”)和employee(1111,"李四"),而Employee.equals比较的是name。这样的话,employeeX和employeeY的equals不相等。它们会根据相同的散列码1111加入到同一个散列单元所指向的列表中。这种情况多了,链表的数据将很庞大,散列冲突将非常严重,查找效率会大幅度的降低。
(6) 总结一下
1、HashSet不能重复存储equals相同的数据
。原因就是equals相同,数据的散列码也就相同(hashCode必须和equals兼容)。大量相同的数据将存放在同一个散列单元所指向的链表中,造成严重的散列冲突,对查找效率是灾难性的。
2、HashSet的存储是无序的
,没有前后关系,他并不是线性结构的集合。
3、hashCode必须和equals必须兼容,
这也是为了第1点。
分享到:
相关推荐
5. **集合框架**:JAVA集合框架是存放和操作对象的容器,包括List、Set、Map等接口以及ArrayList、HashSet、HashMap等实现类。学习笔记会详细介绍它们的使用场景和操作方法。 6. **IO流**:JAVA的输入/输出流系统...
这份“java基础——————试题库”资源旨在帮助学习者系统地复习和深入理解Java的基础知识,确保他们能够全方位地掌握这一强大的编程工具。下面将详细阐述Java的基础知识点。 1. **Java简介** - Java是由Sun ...
本示例主要探讨的是Java集合类的简单使用,通过一个名为`CollectionsTest.java`的文件进行演示。这篇博客文章可能详细解释了如何创建、操作和理解Java集合类的基本概念。 首先,Java集合框架主要包括接口和实现这些...
Java集合框架是处理数据集合的重要工具,包括ArrayList、LinkedList、HashSet、HashMap等。这些类提供了存储和操作对象的不同方式。实例会教你如何创建和操作这些集合,以及如何利用它们实现数据结构,如队列和栈。 ...
10. **集合框架**:ArrayList、LinkedList、HashSet、HashMap等常用集合类的使用,以及泛型的理解。 11. **多线程**:创建和管理线程,同步机制,如synchronized关键字和wait/notify机制。 12. **网络编程**:Socket...
集合框架是Java中处理数据集合的重要工具,包括List、Set、Queue和Map等接口,以及ArrayList、LinkedList、HashSet、HashMap等具体实现。它们提供了各种操作数据的方法,如添加、删除、查找等。 文件和I/O流在实际...
《JAVA入门到精通——30天学通JAVA》是一本专为初学者设计的Java编程教程,旨在帮助读者在短短的30天内快速掌握Java编程基础,从而踏入编程世界的大门。Java作为一种广泛应用于互联网、移动应用、企业级开发等领域的...
10. **Java集合框架**:Java集合框架包括List、Set、Queue和Map接口,以及ArrayList、LinkedList、HashSet、HashMap等实现类。框架提供了丰富的操作方法,便于对数据进行增删改查。 通过学习以上知识点,初学者可以...
- **容器**:ArrayList、LinkedList、HashSet、HashMap等是Java集合框架中的常见容器,它们各自有不同的特点和适用场景。 - **迭代器**:用于遍历集合中的元素,提供hasNext()和next()方法。 - **泛型**:Java 5...
Java集合类是Java编程中非常重要的组成部分,它们提供了一种组织和管理数据的方式。Java集合框架主要由两个核心接口——`Collection`和`Map`构建。`Collection`接口又派生出三个子接口:`Set`、`List`和`Queue`。而`...
在嗖嗖移动大厅项目中,我们可能需要存储和管理大量的用户信息、服务信息等,这时候,集合类就能派上用场。例如,ArrayList用于顺序存储,HashMap则通过键值对提供快速查找。 再者,**集合框架**是Java编程中的重要...
### JAVA编程高级——集合类知识点详解 #### 一、Java中的集合类概述 在Java编程中,集合类是一个非常重要的概念,它主要用于存储和管理对象的集合。与数组相比,集合提供了更多的灵活性,例如动态调整大小的能力...
10. **集合框架**:了解ArrayList、LinkedList、HashSet、HashMap等集合类,以及它们之间的区别和使用场景。 11. **泛型**:泛型提供类型安全,防止在集合中存储不兼容的对象,同时减少类型转换的麻烦。 12. **多...
java.util.HashSet类是Java语言中的一种集合类,该类的定义、字段属性、构造函数、添加元素、删除元素、查找元素、遍历元素等都会被详细解析。 java.util.LinkedHashMap类是Java语言中的一种哈希表,该类的定义、...
Java集合框架提供了各种数据结构(如数组、链表、队列、堆栈、树等)和算法,如ArrayList、LinkedList、HashMap、HashSet等。 十、IO流 Java的IO流处理能力强,可以读写文件、网络通信等。分为字节流和字符流,以及...
Java集合框架是Java SE API的一个核心部分,它提供了一种有效地存储、管理和处理对象的方式。集合框架包括接口(如List、Set、Map)和实现这些接口的类(如ArrayList、HashSet、HashMap)。这些接口定义了操作集合的...
* 每种集合类中都提供它独有的 API 函数,在程序中使用正确集合类可以提高开发的效率 2. 集合的输出 * 使用迭代器(Iterator 接口)将集合对象实例转换成 Iterator 对象实例,然后利用 Iterator 中的函数进行输出 * ...
尽管在Java集合框架中,HashMap和HashSet更为常见,但Hashtable因其线程安全的特性在多线程环境中仍有一定应用。 接着,`StringStack1.java`可能定义了一个名为StringStack的类,这个类实现了栈的基本操作。栈是一...
Java集合框架是存储和管理对象的重要工具,如ArrayList、LinkedList、HashMap、HashSet等。面试中会考察对各种集合类的性能特点、操作方法和适用场景的理解,以及如何在实际问题中合理选择和使用。 四、多线程 Java...