JAVA Set 不重复实现原理 - - ITeye博客

`

paldosfan

浏览: 29949 次
性别:
来自: 北京

最近访客更多访客>>

mingkongeye

Nicksxs

756423432

archer.huang

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

JAVA Set 不重复实现原理

阅读更多

Set 不重复实现原理
http://softbeta.iteye.com/blog/1185602

博客分类： java
java
Java中的set是一个不包含重复元素的集合，确切地说，是不包含e1.equals(e2)的元素对。Set中允许添加null。Set不能保证集合里元素的顺序。
在往set中添加元素时，如果指定元素不存在，则添加成功。也就是说，如果set中不存在(e==null ? e1==null : e.queals(e1))的元素e1,则e1能添加到set中。
下面以set的一个实现类HashSet为例，简单介绍一下set不重复实现的原理：
Java代码
import java.util.HashSet;
import java.util.Iterator;
import java.util.Set;

/**
* @version 1.0
* @author Oliver
* @since 1.0
*/
publicclass HashSetTest
{
    //自定义MyString类
    staticclass MyString{
        String value;

        public MyString(String value)
        {
            this.value = value;
        }
    }
    publicstaticvoid main(String[] args)
    {
        //创建一个HashSet对象
        Set<Object> set = new HashSet<Object>();
        //创建连个String对象
        String s1 = new String("a");
        String s2 = new String("a");
        //创建连个MyString对象
        MyString s3 = new MyString("a");
        MyString s4 = new MyString("a");
        //添加元素
        set.add(s1);
        set.add(s2);
        set.add(s3);
        set.add(s4);
        //看看对象的equals
        System.out.println("s1.equals(s2):"+s1.equals(s2));
        System.out.println("s3.equals(s4):"+s3.equals(s4));
        //打印几个大小及里面的元素
        System.out.println("set size:"+set.size());
        for(Iterator<Object> it=set.iterator();it.hasNext();){
            System.out.println(it.next());
        }
    }
}

运行程序，输出结果：
s1.equals(s2):true
s3.equals(s4):false
set size:3
oliver.examination.part1.HashSetTest$MyString@4f1d0d
a
oliver.examination.part1.HashSetTest$MyString@1fc4bec
也许你已经看出关键来了，没错就是equals方法。这么说还是不恰当，准确的说应该是equals和hashcode方法。
java.lnag.Object中对hashCode的约定：
1. 在一个应用程序执行期间，如果一个对象的equals方法做比较所用到的信息没有被修改的话，则对该对象调用hashCode方法多次，它必须始终如一地返回同一个整数。
2. 如果两个对象根据equals(Object o)方法是相等的，则调用这两个对象中任一对象的hashCode方法必须产生相同的整数结果。
3. 如果两个对象根据equals(Object o)方法是不相等的，则调用这两个对象中任一个对象的hashCode方法，不要求产生不同的整数结果。但如果能不同，则可能提高散列表的性能。
根据第一条，s1和s2返回的hashcode值是一样的。
在HashSet中，基本的操作都是有HashMap底层实现的，因为HashSet底层是用HashMap存储数据的。当向HashSet中添加元素的时候，首先计算元素的hashcode值，然后用这个（元素的hashcode）%（HashMap集合的大小）+1计算出这个元素的存储位置，如果这个位置位空，就将元素添加进去；如果不为空，则用equals方法比较元素是否相等，相等就不添加，否则找一个空位添加。
会后，附赠HashSet源码中文注释版,摘自javaeye：http://xifangyuhui.javaeye.com/blog/798796
Java代码
public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{
    static final long serialVersionUID = -5024744406713321676L;

    // 底层使用HashMap来保存HashSet中所有元素。
    private transient HashMap<E,Object> map;

    // 定义一个虚拟的Object对象作为HashMap的value，将此对象定义为static final。
    private static final Object PRESENT = new Object();

    /**
     * 默认的无参构造器，构造一个空的HashSet。
     *
     * 实际底层会初始化一个空的HashMap，并使用默认初始容量为16和加载因子0.75。
     */
    public HashSet() {
    map = new HashMap<E,Object>();
    }

    /**
     * 构造一个包含指定collection中的元素的新set。
     *
     * 实际底层使用默认的加载因子0.75和足以包含指定
     * collection中所有元素的初始容量来创建一个HashMap。
     * @param c 其中的元素将存放在此set中的collection。
     */
    public HashSet(Collection<? extends E> c) {
    map = new HashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16));
    addAll(c);
    }

    /**
     * 以指定的initialCapacity和loadFactor构造一个空的HashSet。
     *
     * 实际底层以相应的参数构造一个空的HashMap。
     * @param initialCapacity 初始容量。
     * @param loadFactor 加载因子。
     */
    public HashSet(int initialCapacity, float loadFactor) {
    map = new HashMap<E,Object>(initialCapacity, loadFactor);
    }

    /**
     * 以指定的initialCapacity构造一个空的HashSet。
     *
     * 实际底层以相应的参数及加载因子loadFactor为0.75构造一个空的HashMap。
     * @param initialCapacity 初始容量。
     */
    public HashSet(int initialCapacity) {
    map = new HashMap<E,Object>(initialCapacity);
    }

    /**
     * 以指定的initialCapacity和loadFactor构造一个新的空链接哈希集合。
     * 此构造函数为包访问权限，不对外公开，实际只是是对LinkedHashSet的支持。
     *
     * 实际底层会以指定的参数构造一个空LinkedHashMap实例来实现。
     * @param initialCapacity 初始容量。
     * @param loadFactor 加载因子。
     * @param dummy 标记。
     */
    HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);
    }

    /**
     * 返回对此set中元素进行迭代的迭代器。返回元素的顺序并不是特定的。
     *
     * 底层实际调用底层HashMap的keySet来返回所有的key。
     * 可见HashSet中的元素，只是存放在了底层HashMap的key上，
     * value使用一个static final的Object对象标识。
     * @return 对此set中元素进行迭代的Iterator。
     */
    public Iterator<E> iterator() {
    return map.keySet().iterator();
    }

    /**
     * 返回此set中的元素的数量（set的容量）。
     *
     * 底层实际调用HashMap的size()方法返回Entry的数量，就得到该Set中元素的个数。
     * @return 此set中的元素的数量（set的容量）。
     */
    public int size() {
    return map.size();
    }

    /**
     * 如果此set不包含任何元素，则返回true。
     *
     * 底层实际调用HashMap的isEmpty()判断该HashSet是否为空。
     * @return 如果此set不包含任何元素，则返回true。
     */
    public boolean isEmpty() {
    return map.isEmpty();
    }

    /**
     * 如果此set包含指定元素，则返回true。
     * 更确切地讲，当且仅当此set包含一个满足(o==null ? e==null : o.equals(e))
     * 的e元素时，返回true。
     *
     * 底层实际调用HashMap的containsKey判断是否包含指定key。
     * @param o 在此set中的存在已得到测试的元素。
     * @return 如果此set包含指定元素，则返回true。
     */
    public boolean contains(Object o) {
    return map.containsKey(o);
    }

    /**
     * 如果此set中尚未包含指定元素，则添加指定元素。
     * 更确切地讲，如果此 set 没有包含满足(e==null ? e2==null : e.equals(e2))
     * 的元素e2，则向此set 添加指定的元素e。
     * 如果此set已包含该元素，则该调用不更改set并返回false。
     *
     * 底层实际将将该元素作为key放入HashMap。
     * 由于HashMap的put()方法添加key-value对时，当新放入HashMap的Entry中key
     * 与集合中原有Entry的key相同（hashCode()返回值相等，通过equals比较也返回true），
     * 新添加的Entry的value会将覆盖原来Entry的value，但key不会有任何改变，
     * 因此如果向HashSet中添加一个已经存在的元素时，新添加的集合元素将不会被放入HashMap中，
     * 原来的元素也不会有任何改变，这也就满足了Set中元素不重复的特性。
     * @param e 将添加到此set中的元素。
     * @return 如果此set尚未包含指定元素，则返回true。
     */
    public boolean add(E e) {
    return map.put(e, PRESENT)==null;
    }

    /**
     * 如果指定元素存在于此set中，则将其移除。
     * 更确切地讲，如果此set包含一个满足(o==null ? e==null : o.equals(e))的元素e，
     * 则将其移除。如果此set已包含该元素，则返回true
     * （或者：如果此set因调用而发生更改，则返回true）。（一旦调用返回，则此set不再包含该元素）。
     *
     * 底层实际调用HashMap的remove方法删除指定Entry。
     * @param o 如果存在于此set中则需要将其移除的对象。
     * @return 如果set包含指定元素，则返回true。
     */
    public boolean remove(Object o) {
    return map.remove(o)==PRESENT;
    }

    /**
     * 从此set中移除所有元素。此调用返回后，该set将为空。
     *
     * 底层实际调用HashMap的clear方法清空Entry中所有元素。
     */
    public void clear() {
    map.clear();
    }

    /**
     * 返回此HashSet实例的浅表副本：并没有复制这些元素本身。
     *

分享到：

ARRAYLIST VECTOR LINKEDLIST 区别与用法

2012-04-03 19:22
浏览 7220
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

计算机二级公共基础知识模拟试题及答案详解.pdf: 计算机二级公共基础知识模拟试题及答案详解.pdf

电子工程领域的语音发射机电路设计与实现: 内容概要：本文档详细介绍了语音发射机的设计与实现，涵盖了从硬件电路到具体元件的选择和连接方式。文档提供了详细的电路图，包括电源管理、信号处理、音频输入输出接口以及射频模块等关键部分。此外，还展示了各个引脚的功能定义及其与其他组件的连接关系，确保了系统的稳定性和高效性能。通过这份文档，读者可以全面了解语音发射机的工作原理和技术细节。适合人群：对电子工程感兴趣的初学者、从事嵌入式系统开发的技术人员以及需要深入了解语音发射机制的专业人士。使用场景及目标：适用于希望构建自己的语音发射设备的研究人员或爱好者，帮助他们掌握相关技术和实际操作技能。同时，也为教学机构提供了一个很好的案例研究材料。其他说明：文档不仅限于理论讲解，还包括具体的实施步骤，使读者能够动手实践并验证所学知识。

易语言注册机源码详解：单线程架构下的接码、滑块验证与IP代理实现: 内容概要：本文详细介绍了用易语言编写的单线程全功能注册机源码，涵盖了接码平台对接、滑块验证处理、IP代理管理以及料子导入等多个核心功能。文章首先展示了主框架的初始化配置和事件驱动逻辑，随后深入探讨了接码平台（如打码兔）的API调用及其返回数据的处理方法。对于滑块验证部分，作者分享了如何利用易语言的绘图功能模拟真实用户的操作轨迹，并提高了验证通过率。IP代理模块则实现了智能切换策略，确保代理的有效性和稳定性。此外，料子导入功能支持多种格式的数据解析和去重校验，防止脏数据污染。最后，文章提到了状态机设计用于控制注册流程的状态持久化。适合人群：有一定编程基础，尤其是熟悉易语言的开发者和技术爱好者。使用场景及目标：适用于希望深入了解易语言注册机开发的技术细节，掌握接码、滑块验证、IP代理等关键技术的应用场景。目标是帮助读者理解并优化现有注册机的功能，提高其稳定性和效率。其他说明：文中提到的部分技术和实现方式可能存在一定的风险，请谨慎使用。同时，建议读者在合法合规的前提下进行相关开发和测试。

计算机绘图实用教程第三章.pdf: 计算机绘图实用教程第三章.pdf

计算机辅助设计—AutoCAD 2018中文版基础教程各章CAD图纸及相关说明汇总.pdf: 计算机辅助设计—AutoCAD 2018中文版基础教程各章CAD图纸及相关说明汇总.pdf

计算机类电子书集合PDF: C++相关书籍，计算机相关书籍，linux相关及http等计算机学习、面试书籍。

计算机二级mysql数据库程序设计练习题(一).pdf: 计算机二级mysql数据库程序设计练习题(一).pdf

计算机发展史.pdf: 计算机发展史.pdf

计算机二级课件.pdf: 计算机二级课件.pdf

计算机概论第三讲：计算机组成.pdf: 计算机概论第三讲：计算机组成.pdf

端侧算力网络白皮书：6G时代终端算力资源高效利用与应用场景解析: 内容概要：本文档由中国移动通信集团终端有限公司、北京邮电大学、中国信息通信研究院和中国通信学会共同发布，旨在探讨端侧算力网络（TCAN）的概念、架构、关键技术及其应用场景。文中详细分析了终端的发展现状、基本特征和发展趋势，阐述了端侧算力网络的定义、体系架构、功能架构及其主要特征。端侧算力网络通过整合海量泛在异构终端的算力资源，实现分布式多级端侧算力资源的高效利用，提升网络整体资源利用率和服务质量。关键技术涵盖层次化端算力感知图模型、资源虚拟化、数据压缩、多粒度多层次算力调度、现场级AI推理和算力定价机制。此外，还探讨了端侧算力网络在智能家居、智能医疗、车联网、智慧教育和智慧农业等领域的潜在应用场景。适合人群：从事通信网络、物联网、边缘计算等领域研究和开发的专业人士，以及对6G网络和端侧算力网络感兴趣的学者和从业者。使用场景及目标：适用于希望深入了解端侧算力网络技术原理、架构设计和应用场景的读者。目标是帮助读者掌握端侧算力网络的核心技术，理解其在不同行业的应用潜力，推动端侧算力网络技术的商业化和产业化。其他说明：本文档不仅提供了端侧算力网络的技术细节，还对其隐私与安全进行了深入探讨

学习java的心得体会.docx: 学习java的心得体会.docx

计算机二级考试(南开100题齐全).pdf: 计算机二级考试(南开100题齐全).pdf

计算机二级C语言考试通关宝典：全面解析核心知识点与解题技巧: 内容概要：本文详细介绍了计算机二级C语言考试的内容和备考方法。首先概述了计算机二级考试的意义及其在计算机技能认证中的重要性，重点讲解了C语言的基础语法，包括程序结构、数据类型、运算符和表达式等。接着深入探讨了进阶知识，如函数、数组、指针、结构体和共用体的应用。最后分享了针对选择题、填空题和编程题的具体解题技巧，强调了复习方法和实战演练的重要性。适合人群：准备参加计算机二级C语言考试的学生和技术爱好者。使用场景及目标：①帮助考生系统地掌握C语言的核心知识点；②提供有效的解题策略，提高应试能力；③指导考生制定合理的复习计划，增强实战经验。其他说明：本文不仅涵盖了理论知识，还提供了大量实例代码和详细的解释，有助于读者更好地理解和应用所学内容。此外，文中提到的解题技巧和复习建议对实际编程也有很大帮助。

论文格式及要求.doc: 论文格式及要求.doc

三菱FX3U与台达变频器RS485通信程序设置及应用实例: 内容概要：本文详细介绍了如何使用三菱FX3U PLC及其485BD通信板与四台台达VFD-M系列变频器进行通信的设置与应用。主要内容涵盖硬件连接注意事项、通信参数配置、RS指令的应用、CRC校验算法的实现以及频率给定和状态读取的具体方法。文中提供了多个实用的编程示例，展示了如何通过梯形图和结构化文本编写通信程序，并讨论了常见的调试技巧和优化建议。此外，还提到了系统的扩展性和稳定性措施，如增加温度传感器通信功能和应对电磁干扰的方法。适合人群：从事工业自动化领域的工程师和技术人员，尤其是那些熟悉三菱PLC和台达变频器的使用者。使用场景及目标：适用于需要实现多台变频器联动控制的工业应用场景，旨在提高生产效率和系统可靠性。通过学习本文，读者可以掌握如何构建稳定的RS485通信网络，确保变频器之间的高效协同工作。其他说明：本文不仅提供了详细的理论指导，还包括了许多来自实际项目的经验教训，帮助读者避免常见错误并提升编程技能。

计算机服务规范.pdf: 计算机服务规范.pdf

Discuz-X3.2-TC-UTF8.zip: Discuz_X3.2_TC_UTF8.zip LNMP搭建安装包

2023年房地产行业研究报告：缓解竣工下行加速的两大改革.pdf: 2023年房地产行业研究报告：缓解竣工下行加速的两大改革

win32汇编环境,网络编程入门之十五: win32汇编环境,网络编程入门之十五

Global site tag (gtag.js) - Google Analytics