`
youyu4
  • 浏览: 442103 次
社区版块
存档分类
最新评论

java -- HashSet

 
阅读更多

java -- HashSet

 

   HashSet 是一个没有重复元素的集合。

 

 

优点

 

  • 没有重复元素
  • 元素可以为null
  • 操作很简单,更像是对HashMap做了一次“封装”,而且只使用了HashMap的key来实现各种特性。

 

 

缺点

 

  • 不能保证元素的顺序
  • 非同步的,也就是会出现fail-fast

 

 

 

工作原理

 

    根据源码,HashSet的底层是HashMap,其中利用的是Key,而Value会在内部new一个object。

 

    源码如下:

package java.util;

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{
    static final long serialVersionUID = -5024744406713321676L;

    // HashSet是通过map(HashMap对象)保存内容的
    private transient HashMap<E,Object> map;

    // PRESENT是向map中插入key-value对应的value
    // 因为HashSet中只需要用到key,而HashMap是key-value键值对;
    // 所以,向map中添加键值对时,键值对的值固定是PRESENT
    private static final Object PRESENT = new Object();

    // 默认构造函数
    public HashSet() {
        // 调用HashMap的默认构造函数,创建map
        map = new HashMap<E,Object>();
    }

    // 带集合的构造函数
    public HashSet(Collection<? extends E> c) {
        // 创建map。
        // 为什么要调用Math.max((int) (c.size()/.75f) + 1, 16),从 (c.size()/.75f) + 1 和 16 中选择一个比较大的树呢?        
        // 首先,说明(c.size()/.75f) + 1
        //   因为从HashMap的效率(时间成本和空间成本)考虑,HashMap的加载因子是0.75。
        //   当HashMap的“阈值”(阈值=HashMap总的大小*加载因子) < “HashMap实际大小”时,
        //   就需要将HashMap的容量翻倍。
        //   所以,(c.size()/.75f) + 1 计算出来的正好是总的空间大小。
        // 接下来,说明为什么是 16 。
        //   HashMap的总的大小,必须是2的指数倍。若创建HashMap时,指定的大小不是2的指数倍;
        //   HashMap的构造函数中也会重新计算,找出比“指定大小”大的最小的2的指数倍的数。
        //   所以,这里指定为16是从性能考虑。避免重复计算。
        map = new HashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16));
        // 将集合(c)中的全部元素添加到HashSet中
        addAll(c);
    }

    // 指定HashSet初始容量和加载因子的构造函数
    public HashSet(int initialCapacity, float loadFactor) {
        map = new HashMap<E,Object>(initialCapacity, loadFactor);
    }

    // 指定HashSet初始容量的构造函数
    public HashSet(int initialCapacity) {
        map = new HashMap<E,Object>(initialCapacity);
    }

    HashSet(int initialCapacity, float loadFactor, boolean dummy) {
        map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);
    }

    // 返回HashSet的迭代器
    public Iterator<E> iterator() {
        // 实际上返回的是HashMap的“key集合的迭代器”
        return map.keySet().iterator();
    }

    public int size() {
        return map.size();
    }

    public boolean isEmpty() {
        return map.isEmpty();
    }

    public boolean contains(Object o) {
        return map.containsKey(o);
    }

    // 将元素(e)添加到HashSet中
    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

    // 删除HashSet中的元素(o)
    public boolean remove(Object o) {
        return map.remove(o)==PRESENT;
    }

    public void clear() {
        map.clear();
    }

    // 克隆一个HashSet,并返回Object对象
    public Object clone() {
        try {
            HashSet<E> newSet = (HashSet<E>) super.clone();
            newSet.map = (HashMap<E, Object>) map.clone();
            return newSet;
        } catch (CloneNotSupportedException e) {
            throw new InternalError();
        }
    }

    // java.io.Serializable的写入函数
    // 将HashSet的“总的容量,加载因子,实际容量,所有的元素”都写入到输出流中
    private void writeObject(java.io.ObjectOutputStream s)
        throws java.io.IOException {
        // Write out any hidden serialization magic
        s.defaultWriteObject();

        // Write out HashMap capacity and load factor
        s.writeInt(map.capacity());
        s.writeFloat(map.loadFactor());

        // Write out size
        s.writeInt(map.size());

        // Write out all elements in the proper order.
        for (Iterator i=map.keySet().iterator(); i.hasNext(); )
            s.writeObject(i.next());
    }


    // java.io.Serializable的读取函数
    // 将HashSet的“总的容量,加载因子,实际容量,所有的元素”依次读出
    private void readObject(java.io.ObjectInputStream s)
        throws java.io.IOException, ClassNotFoundException {
        // Read in any hidden serialization magic
        s.defaultReadObject();

        // Read in HashMap capacity and load factor and create backing HashMap
        int capacity = s.readInt();
        float loadFactor = s.readFloat();
        map = (((HashSet)this) instanceof LinkedHashSet ?
               new LinkedHashMap<E,Object>(capacity, loadFactor) :
               new HashMap<E,Object>(capacity, loadFactor));

        // Read in size
        int size = s.readInt();

        // Read in all elements in the proper order.
        for (int i=0; i<size; i++) {
            E e = (E) s.readObject();
            map.put(e, PRESENT);
        }
    }
}

 

 

 

构造方法

 

// 默认构造函数
public HashSet() 

// 带集合的构造函数
public HashSet(Collection<? extends E> c) 

// 指定HashSet初始容量和加载因子的构造函数
public HashSet(int initialCapacity, float loadFactor) 

// 指定HashSet初始容量的构造函数
public HashSet(int initialCapacity) 

// 指定HashSet初始容量和加载因子的构造函数,dummy没有任何作用
HashSet(int initialCapacity, float loadFactor, boolean dummy)

 

 

 

主要API

 

boolean         add(E object)
void            clear()
Object          clone()
boolean         contains(Object object)
boolean         isEmpty()
Iterator<E>     iterator()
boolean         remove(Object object)
int             size()

 

 

 

 

遍历方式

 

通过Iterator遍历HashSet

 

  • 根据iterator()获取HashSet的迭代器。
  • 遍历迭代器获取各个元素。
// 假设set是HashSet对象
for(Iterator iterator = set.iterator();
       iterator.hasNext(); ) { 
    iterator.next();
} 

 

 

通过for-each遍历HashSet

 

  • 根据toArray()获取HashSet的元素集合对应的数组。
  • 遍历数组,获取各个元素。
// 假设set是HashSet对象,并且set中元素是String类型
String[] arr = (String[])set.toArray(new String[0]);
for (String str:arr)
    System.out.printf("for each : %s\n", str);

 

 

 

 

插入、修改、存储数据

 

    无论是查询,存取,修改的速度都非常快。

 

 

 

 

调整容量

 

  • 默认初始容量为16
  • 加载因子为0.75:即当 元素个数 超过 容量长度的0.75倍 时,进行扩容
  • 扩容增量:原容量的 1 倍
  • 如 HashSet的容量为16,一次扩容后是容量为32

 

 

 

并发处理

 

    因为是非线程安全的,所以在多线程情况下,还是会出现fail-fast。

分享到:
评论

相关推荐

    java集合-HashSet的使用

    HashSet 是 Java 中的一个集合类,它实现了 Set 接口并提供了基于哈希表的无序、不重复元素的集合。具体来说,它是通过哈希表(实际上是一个 HashMap 实例)来存储元素的。 以下是 HashSet 的一些主要特点: 无序...

    计算机后端-Java-Java核心基础-第24章 集合01 22. HashSet中元素的添加过程.avi

    计算机后端-Java-Java核心基础-第24章 集合01 22. HashSet中元素的添加过程.avi

    20220424-笔记-HashSet扩容机制

    20220424-笔记-HashSet扩容机制

    java72-java-advance源代码.zip

    2. **集合框架**:可能包含对ArrayList、LinkedList、HashSet、HashMap等集合类的高级用法,比如泛型、迭代器、并发容器如ConcurrentHashMap的使用。 3. **IO/NIO/BIO**:Java的输入输出流、非阻塞I/O和生物I/O在...

    java-version--VSM.rar_VSM JAVA_java VSM_java-version--VSM_vsm_文件

    1. **集合框架**:为了处理多个文件和存储词汇信息,Java的ArrayList或HashSet等集合类可能会被用到。 2. **IO操作**:Java的FileInputStream和BufferedReader等类用于读取文件内容。 3. **文本预处理**:在计算...

    java-SE-demo Java学习资料 自习资料练习

    集合框架是Java处理数据集合的重要工具,包括List、Set、Map等接口以及ArrayList、LinkedList、HashSet、HashMap等实现类。学习如何根据需求选择合适的集合类型,以及如何使用迭代器、泛型等高级特性,能提升代码的...

    java HashSet 集合排序

    java HashSet 集合排序,需要通过利用TreeSet集合排序。2013-10-30。

    《精通JAVA----JDK》

    11. **集合框架**:包括ArrayList、LinkedList、HashSet、HashMap等,是存储和操作对象的主要工具。掌握它们的特性和使用场景,能有效提升代码的效率和可维护性。 12. **泛型**:泛型引入了类型参数的概念,增强了...

    backmanager-Java-basic

    4. **集合框架**:深入理解ArrayList、LinkedList、HashMap、HashSet等集合类的内部原理和使用场景,以及它们之间的相互关系。 5. **多线程**:学习如何创建和管理线程,理解同步和互斥的概念,掌握synchronized...

    course-java-basic-example-master.zip

    5. **集合框架**:了解ArrayList、LinkedList、HashSet、HashMap等集合类的使用,以及它们在不同场景下的选择。 6. **输入输出**:包括标准输入输出流和文件I/O操作,以及更高级的IO流如缓冲流、对象流等。 7. **...

    最适合初学java--java学习资料PDF格式

    6. **集合框架**:ArrayList, LinkedList, HashSet, HashMap等是Java集合框架的核心类,它们提供了存储和操作对象的高效方式。 7. **IO流**:Java的输入输出流系统强大,支持对文件、网络、内存等进行读写操作。 8...

    JAVA-API帮助文档(中文版)

    ArrayList、LinkedList、HashSet、HashMap等都是常见的集合实现,它们各自有特定的性能特性和使用场景。例如,ArrayList适合快速访问,而LinkedList适合频繁插入和删除。 2. **多线程**:Java通过Thread类和...

    java-sample-3_java_

    4. **集合框架**:Java提供了丰富的集合类,如ArrayList、LinkedList、HashSet、HashMap等,它们是存储和操作对象的主要工具。 5. **输入/输出流**:Java的IO流系统支持读写文件、网络通信等,包括字节流、字符流、...

    java-se代码练习学习 Java学习资料

    4. **集合框架**:Java集合框架是存储和管理对象的重要工具,包括ArrayList、LinkedList、HashSet、HashMap等。这些数据结构的使用可以提升代码的效率和可维护性。 5. **IO流**:Java的输入输出流库允许读写文件、...

    21天学会Java--教案

    数组是存储相同类型元素的固定大小的序列,而集合框架则是更灵活的数据结构,如ArrayList、LinkedList、HashSet、HashMap等。学习者将学习如何声明、初始化和操作数组,以及如何使用集合框架处理复杂的数据存储需求...

    java--基础程序知识.rar

    - Java集合框架提供了各种数据结构,如ArrayList、LinkedList、HashSet、HashMap等,用于存储和操作对象。 - **泛型**:在集合类中使用泛型可以限制元素类型,提高代码安全性。 5. **输入/输出流** - Java的I/O...

    SUN-JAVA-SCJP认证考试

    考生会学习ArrayList、LinkedList、HashSet、HashMap等各种集合类的使用,以及泛型、迭代器、比较器等相关概念。此外,这个模块可能还会讲解Java的网络编程和数据库连接,如Socket通信和JDBC API的使用。 综上所述...

    core-Java-volume1--example-code.rar_core java 1 code

    此外,集合框架是Java标准库的重要组成部分,包括List、Set、Map等接口以及ArrayList、LinkedList、HashSet、HashMap等实现类。示例代码会解释如何创建和操作这些集合,以及如何使用迭代器和泛型来增强代码的灵活性...

    Java-EE实验报告.docx

    2. 熟练运用Java中的工具类,如String类,以及集合框架,如ArrayList、HashSet和TreeSet。 3. 通过设计Student类,实现对象数组排序,使用compareTo方法进行比较。 4. 使用日历类创建日历,回顾Swing编程。 5. 学习...

Global site tag (gtag.js) - Google Analytics