- 浏览: 87614 次
- 性别:
- 来自: 西安
最新评论
-
xuhang1128:
good
Spring源码解析 BeanPostProcessor的实现 -
zhudaokun:
呵呵……好帖,收藏一下
Spring源码解析1 IOC容器的初始化
散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。
。
hashCode 散列码
散列码是由对象导出的一个整数值。在Object中有一个hashCode方法来得到散列码。
基本上,每一个对象都有一个默认的散列码,其值就是对象的内存地址。但也有一些对象的散列码不同,
比如String对象,它的散列码是对内容的计算结果:
//String对象的散列码计算 String str="hello"; int hash=0; for(int i=0;i<length();i++) hash=31*hash+charAt(i);
那么下面散列码的结果不同也就好解释了。s和t都还是String对象,散列码由内容获得,结果一样。
sb和tb是StringBuffer对象,自身没有hashCode方法,只能继承Object的默认方法,散列码是对象地址,当然不一样了。
String s=new String("OK");//散列码: 3030 String t="Ok"; /散列码: 3030 StringBuffer sb=new StringBuffer(s); //散列码:20526976 StringBuffer tb=new StringBuffer(t); //散列码:20527144
HashSet 散列表的内部结构
HashSet是个链表数组。每一个数组元素就是一个列表,我们称为散列表元 .
数组并不保存键本身。而是通过键对象生成一个数字,将其作为数组的下标。这个数字就是散列码。然后根据数组下标等于散列码找到对应的散列表元,然后在线性遍历该链表找到对应的键值。如果散列函数好的话,数组的每个位置就只有较少的值。因此,不是查询整个list而是快速的跳到数组的某个位置,只是对很少的元素进行比较。
HashSet 如何add机制
假如我们有一个数据(散列码76268),而此时的HashSet有128个散列单元,那么这个数据将有可能插入到数组的第108个链表中(76268%128=108)。但这只是有可能,如果在第108号链表中发现有一个老数据与新数据equals()=true的话,这个新数据将被视为已经加入,而不再重复丢入链表。
那么数据的散列码我知道,但HashSet的散列单元大小如何指定那?
Java默认的散列单元大小全部都是2的幂,初始值为16(2的4次幂)。假如16条链表中的75%链接有数据的时候,则认为加载因子达到默认的0.75。HahSet开始重新散列,也就是将原来的散列结构全部抛弃,重新开辟一个散列单元大小为32(2的5次幂)的散列结果,并重新计算各个数据的存储位置。以此类推下去.....
知道了HashSet的add机制后,查找的道理一样。直接根据数据的散列码和散列表的数组大小计算除余后,就得到了所在数组的位置,然后再查找链表中是否有这个数据即可。
查找的代价也就是在链表中,但是真正一条链表中的数据很少,有的甚至没有。几乎没有什么迭代的代价可言了。所以散列表的查找效率建立在散列单元所指向的链表中的数据要少 。
总结:
1、HashSet不能重复存储equals相同的数据 。原因就是equals相同,数据的散列码也就相同(hashCode必须和equals兼容)。大量相同的数据将存放在同一个散列单元所指向的链表中,造成严重的散列冲突,对查找效率是灾难性的。
2、HashSet的存储是无序的 ,没有前后关系,他并不是线性结构的集合。
3、hashCode必须和equals必须兼容, 这也是为了第1点。
package containers; import java.util.*; //一个简单的散列Map public class SimpleHashMap <K,V> extends AbstractMap<K,V>{ static final int size=997; LinkedList<MapEntry<K, V>>[] buckets=new LinkedList[size]; public V put(K key,V value){ V oldValue=null; int index=Math.abs(key.hashCode())%size; if(buckets[index]==null){ buckets[index]=new LinkedList<MapEntry<K, V>>(); } LinkedList<MapEntry<K, V>> bucket=buckets[index]; MapEntry<K, V> pair=new MapEntry<K, V>(key,value); boolean found=false; ListIterator<MapEntry<K,V>> it=buckets[index].listIterator(); while(it.hasNext()){ MapEntry<K,V> iPair=it.next(); if(iPair.getKey().equals(key)){ oldValue=iPair.getValue(); it.set(pair); found=true; break; } } if(!found){ buckets[index].add(pair); } return oldValue; } public V get(Object key){ int index=Math.abs(key.hashCode())%size; if(buckets[index]==null) return null; for(MapEntry<K,V> iPair:buckets[index]){ if(iPair.getKey().equals(key)){ return iPair.getValue(); } } return null; } @Override public Set<java.util.Map.Entry<K, V>> entrySet() { Set<java.util.Map.Entry<K, V>> set=new HashSet<Entry<K,V>>() ; for(LinkedList<MapEntry<K,V>> bucket:buckets){ if(bucket==null) continue; else for(MapEntry<K,V> mPair:bucket){ set.add(mPair); } } return set; } public static void main(String[] args) { SimpleHashMap<String, String> m=new SimpleHashMap<String,String>(); String[] str="A B C D E F G H J K L M N O P Q R S T U V W X Y Z 0 1 2 3 4 5 6 7 8 9 ! @ # $ % ^ & * ( ) - + _ = | \\ / . > < ,".split(" "); Map<String,String> map=new HashMap<String,String>(); for(int i=1;i<=str.length;i++){ map.put(Integer.toString(i), str[i-1]); } m.putAll(map); System.out.println(m); long startTime=System.nanoTime(); System.out.println(m.get("9")); System.out.println(m.get("20")); System.out.println(m.get("30")); long estimatedTime=System.nanoTime()-startTime; System.out.println(estimatedTime);//165386 } }
一个未经过散列的Map
package containers; import java.util.*; public class SlowMap<K,V> extends AbstractMap<K,V> { private List<K> keys=new ArrayList<K>(); private List<V> values=new ArrayList<V>(); public V put(K key,V value){ V oldValue=get(key); if(!keys.contains(key)){ keys.add(key); values.add(value); }else{ values.set(keys.indexOf(key),value); } return oldValue; } public V get(Object key){ if(keys.contains(key)){ return values.get(keys.indexOf(key)); }else{ return null; } } public Set<java.util.Map.Entry<K, V>> entrySet() { Set<Map.Entry<K, V>> set=new HashSet<Map.Entry<K, V>>(); Iterator<K> ki=keys.iterator(); Iterator<V> vi=values.iterator(); while(ki.hasNext()){ set.add(new MapEntry(ki.next(),vi.next())); } return set; } public static void main(String[] args) { SlowMap<String,String> m=new SlowMap<String,String>(); String[] str="A B C D E F G H J K L M N O P Q R S T U V W X Y Z 0 1 2 3 4 5 6 7 8 9 ! @ # $ % ^ & * ( ) - + _ = | \\ / . > < ,".split(" "); Map<String,String> map=new HashMap<String,String>(); for(int i=1;i<=str.length;i++){ map.put(Integer.toString(i), str[i-1]); } m.putAll(map); System.out.println(m); long startTime=System.nanoTime(); System.out.println(m.get("9")); System.out.println(m.get("20")); System.out.println(m.get("30")); long estimatedTime=System.nanoTime()-startTime; System.out.println(estimatedTime);//187057 } }
MapEntry.java文件
package containers; import java.util.Map.Entry; public class MapEntry<K,V> implements Entry<K,V> { private K key; private V value; @Override public K getKey() { return key; } @Override public V getValue() { return value; } @Override public V setValue(V v) { V result=value; value=v; return result; } public int hashCode(){ return (key==null?0:key.hashCode())^(value==null?0:value.hashCode()); } public boolean equals(Object o){ if(!(o instanceof MapEntry)) return false; MapEntry me=(MapEntry)o; return (key==null?me.getKey()==null:key.equals(me.getKey()))&& (value==null?me.getValue()==null:value.equals(me.getValue())); } public String toString(){ return key+"="+value; } public MapEntry(K k,V v){ this.key=k; this.value=v; } }
发表评论
-
MapReduce
2011-03-07 11:55 18661.什么是MapReduce? MapRedu ... -
java Web
2010-10-20 19:55 62response.sendRedirect(): Web服务 ... -
JDK动态代理
2010-10-05 14:12 2412注意在使用JDK提供的动态代理要求我们的目标对象必须实现接 ... -
java的反射机制
2010-10-05 11:16 1688反射:运行时类型 如果你不知道某个对象的确切类型,RTT ... -
如何判断两个类之间的差异
2010-08-16 09:35 1036代码实现 package net.mindview.util ... -
持有对象Arrays.asList异常解决办法
2010-08-08 17:50 1286添加一组元素 package com.day1; im ... -
java编程思想 IO13 源码 文件解压缩
2010-05-09 15:21 1607package com.io; import java.io ... -
java编程思想 IO12 源码 文件加锁
2010-05-09 12:37 1876package com.io; import java.io ... -
java编程思想 IO11 源码 内存映射访问与性能
2010-05-08 21:32 1880package com.io; import java. ... -
java编程思想 IO10 文件操作源码
2010-05-08 16:05 1248package com.dirlist; import ... -
java编程思想 IO9 文件操作源码
2010-05-06 22:00 1022缓冲器的详细应用: package com.dirlist; ... -
java编程思想 IO8 文件操作源码
2010-05-06 20:24 1014通道与缓冲器的探究 pa ... -
java编程思想 IO7 文件操作源码
2010-05-06 09:42 1395希望大家留言一起讨论 ... -
java编程思想 IO6 文件操作源码
2010-05-05 23:26 1673package com.dirlist; import ... -
java编程思想 IO5 文件操作源码
2010-05-05 11:24 1434package com.dirlist; import ... -
java编程思想 IO4源码
2010-05-03 17:24 838目录的检查及创建 package com.dirlist; ... -
java编程思想 IO3源码
2010-05-03 16:27 1217利用策略设计模式来进行目录的遍历和文件的过滤 package ... -
java编程思想 IO2源码
2010-05-03 15:32 1175package net.mindview.util; impo ... -
java静态内部类
2010-05-03 11:31 2067引用别人的博客 在一 ... -
java编程思想 IO1源码
2010-05-03 09:48 1340目录列表器与目录过滤器的运用 package com.dirl ...
相关推荐
### HashMap与HashTable和HashSet的区别 #### 一、概述 在Java集合框架中,`HashMap`, `HashTable` 和 `HashSet` 是三个重要的数据结构,它们分别实现了`Map`接口和`Set`接口,提供了不同的功能来满足不同的编程...
在Java编程语言中,集合框架是处理数据的重要组成部分,其中`HashSet`和`TreeSet`是两种常用的Set接口实现类。它们各自具有独特的特性和用途,理解它们的区别对于编写高效且正确的代码至关重要。 首先,`HashSet`是...
由于HashMap的内部实现是基于散列表的,因此HashSet的查找和插入操作的时间复杂度都近似为O(1),前提是散列函数能将元素分布均匀。 关于HashSet与HashMap的区别,在底层数据结构上,二者都基于哈希表,但存储的方式...
- **指定初始容量和加载因子的构造函数**:`HashSet(int initialCapacity, float loadFactor)` 设置初始容量和加载因子,用于控制HashMap何时进行扩容。 ### HashSet的主要API - `add(E object)`:将指定的元素添加...
在实际应用中,HashSet因其存储元素的唯一性和对元素添加、删除、查询的高效性而广泛应用。然而,需要注意的是,由于HashSet的无序性,元素插入顺序并不会被保留。如果需要一个有序集合,可以考虑使用LinkedHashSet...
更正式地说,set 不包含满足e1.equals(e2) 的元素对 e1 和 e2,并且最多包含一个 null 元素。正如其名称所暗示的,此接口模仿了数学上的 set 抽象。 HashSet与TreeSet都是基于Set接口的实现类。其中TreeSet是Set的...
`HashSet`通过调用对象的`hashCode()`方法来获取哈希码,然后根据哈希码将对象映射到哈希表的一个位置。 - **`equals`方法**:当`HashSet`检测到两个对象的哈希码相同时,会进一步调用这两个对象的`equals()`方法来...
HashSet和TreeSet是Java集合框架中的两种重要数据结构,它们都是Set接口的实现类,用于存储不重复的元素。在编程实践中,理解它们的区别和应用场景至关重要。 HashSet是基于HashMap实现的,它不保证元素的顺序,...
自己写的例子,关于HashSet遍历和HashMap遍历的. 感谢大家参考
- 当`HashSet`中的元素为自定义类型时,必须正确地重写`equals()`和`hashCode()`方法以确保元素的唯一性和性能。 以上是对`HashSet`类的基本用法及特性的一个详细介绍。希望这些内容能帮助读者更好地理解和使用`...
Java散列存储是一种高效的数据组织方式,主要用于存储和检索数据,尤其在Java中,它体现在如HashSet、HashMap、LinkedHashSet、LinkedHashMap以及HashTable等数据结构中。这些数据结构利用散列函数来加速查找过程,...
在添加元素时,HashSet会调用对象的hashCode()方法生成哈希码,然后根据哈希码快速定位元素在HashMap中的位置。如果已有元素占据了这个位置,那么会调用equals()方法来判断新元素是否与已存在元素相等。如果equals()...
当向HashSet中添加元素时,它会调用元素类的`hashCode()`方法生成一个散列码,这个散列码用于快速定位元素在内部数组的位置。如果两个元素的散列码相同,那么HashSet会进一步调用`equals()`方法来检查它们是否实际上...
3. HashSet 要求放入的对象必须实现 hashCode() 方法,放入的对象,是以 hashCode 码作为标识的,而具有相同内容的 String 对象,hashCode 是一样的,所以放入的内容不能重复。但是同一个类的对象可以放入不同的实例...
HashSet和TreeSet使用方法的区别解析 HashSet和TreeSet都是Java集合框架中的Set接口实现,用于存储不重复的元素。但是,它们在使用方法和实现机理上有很大的区别。 首先,从使用方法上讲,HashSet和TreeSet都可以...
对于 HashSet 而言,它是基于 HashMap 实现的,HashSet 底层采用 HashMap 来保存所有元素,因此 HashSet 的实现比较简单,查看 HashSet 的源代码,可以看到如下代码:
哈希函数将元素转换为一个整数(哈希码),这个哈希码用于快速定位元素,实现快速查找、插入和删除操作。 当我们在HashSet中添加一个元素时,Java会先计算该元素的哈希码,然后根据哈希码决定该元素在底层HashMap中...
在Java编程语言中,ArrayList和HashSet是两种常用的集合类,它们各自有其特性和应用场景。在实际开发中,理解它们的差异以及如何有效地利用它们是非常重要的。本篇将深入探讨ArrayList与HashSet的区别,并分析...
Java编程中的HashSet和BitSet详解 HashSet和BitSet是Java编程中两个常用的集合类,它们都可以用来存储大量的数据,但它们之间有着明显的差异。那么,为什么Apache Commons作者选择使用BitSet代替HashSet呢?在本文...