jdk源码解析之——java.util源码详解

yuan198906030

浏览: 19969 次
性别:
来自: 广州

最近访客更多访客>>

qi2008

xianyulao

redwhiteblack

zjxzjx123

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

源码解析

java.util包的util自然指的就是utility（实用），就是说，这个包中定义的class和interface为我们提供了一些实用的工具可以辅助我们的开发。

那么这个包中最主要的以及最重要的就是collection框架，就是我们不管开发什么项目都会用到的”类集”。我们用类集来存放和提取数据，使我们的开发高效有序。

我们不太去赘述用法，而是通过源码来了解collection框架的基本实现，来使得我们更了解用法。

首先，我们来了解一下collection这个框架。

我们常常使用的集合，其实是分为两大类的：Collection<E>与Map<K,V>。

Collection<E>：

Collection 层次结构中的根接口。Collection 表示一组对象，这些对象也称为 collection 的元素。

一些 collection 允许有重复的元素（如：List），而另一些则不允许（如：Set）。一些 collection 是有序的（如：SortedSet），而另一些则是无序的（如：ArrayList）。

Collection是没有构造函数的，它只是一个提供了通用方法的interface。

Collection<E>又根据是否有重复值分为两大类Set<E>与List<E>。Set<E>与List<E>同样是interface。

Map<K,V>：

将键映射到值的对象。一个映射不能包含重复的键；每个键最多只能映射到一个值。

下面，我们就从源码角度去看看collection的实现。（推荐使用IDE查看源代码，如：eclipse中的outline，对查看代码帮助很大）

一、List<E>:

List<E>接口的实现子类主要有两个：ArrayList<E>和LinkedList<E>。即List有顺序实现和链式实现。(写到这就默默想到，当时数据结构课上学习的C++STL很是类似)。

(1)ArrayList<E>

实现：通过成员变量和构造函数

Java代码  
private static final int DEFAULT_CAPACITY = 10;  
private transient Object[] elementData;   //ArrayList维护的Object数组  
private int size;  
//指定初始长度的构造函数  
public ArrayList(int initialCapacity) {  
    super();  
    if (initialCapacity < 0)  
        throw new IllegalArgumentException("Illegal Capacity: "+  
                                           initialCapacity);  
    this.elementData = new Object[initialCapacity];  
}  
//不带参数的构造函数  
public ArrayList() {  
    super();  
    this.elementData = EMPTY_ELEMENTDATA;  
}  
//指定使用Collection初始化的构造函数  
public ArrayList(Collection<? extends E> c) {  
    elementData = c.toArray();  
    size = elementData.length;  
    if (elementData.getClass() != Object[].class)  
        elementData = Arrays.copyOf(elementData, size, Object[].class);  
}  

ArrayList是由Object数组实现的，并且默认的长度是“DEFAULT_CAPACITY = 10”。当使用不带参数的构造函数时，底层默认是长度为10的Object[]。

这时候就有一个问题了，当向ArrayList里面添加元素，使得Object数组不够用怎么办？

Java代码  
private void grow(int minCapacity) {  
    // overflow-conscious code  
    int oldCapacity = elementData.length;  
    int newCapacity = oldCapacity + (oldCapacity >> 1);  
    if (newCapacity - minCapacity < 0)  
        newCapacity = minCapacity;  
    if (newCapacity - MAX_ARRAY_SIZE > 0)  
        newCapacity = hugeCapacity(minCapacity);  
    // minCapacity is usually close to size, so this is a win:  
    elementData = Arrays.copyOf(elementData, newCapacity);  
}  
private static int hugeCapacity(int minCapacity) {  
    if (minCapacity < 0) // overflow  
        throw new OutOfMemoryError();  
    return (minCapacity > MAX_ARRAY_SIZE) ?  
        Integer.MAX_VALUE :  
        MAX_ARRAY_SIZE;  
}  

ArrayList在使用add方法时，会首先检查是否越界，如果越界，最终会使用grow方法。获得一个新长度的Object数组，将原数组拷贝到当中，再add新元素。

获得新长度的算法是：

Java代码  
int newCapacity = oldCapacity + (oldCapacity >> 1);  //根据原数组的长度来确定新数组的长度  

看完ArrayList的实现，我们就不去看ArrayList的基本操作add()与remove()了，无非是一些数组的移位、拷贝操作。

总结：

1）ArrayList使用数组实现的，本质上，ArrayList是对象引用的一个变长数组。

2）因此ArrayList又称为顺序表，正是因为是用数组实现的，对于随机存取比较方便；而插入和删除操作，需要移动大量的元素，缺点。

(2)LinkedList<E>

实现：链式表，顾名思义，是通过引用实现的，因此必然存在数据节点，以及对数据节点的引用。

Java代码  
/*LinkedList的内部类，数据节点Node<E>*/  
  
private static class Node<E> {  
        E item;  
        Node<E> next;   //对后一个节点的引用  
        Node<E> prev;   //对前一个节点的引用  
  
        Node(Node<E> prev, E element, Node<E> next) {  
            this.item = element;  
            this.next = next;  
            this.prev = prev;  
        }  
    }  

操作：LinkedList实现比较容易，操作的实现也就是引用的变化，不再赘述。

总结：

关于 ArrayList 与 LinkedList 的比较分析:

（a)ArrayList 底层采用数组实现，LinkedList 底层采用双向链表实现。

（b)当执行插入或者删除操作时，采用 LinkedList 比较好。

（c)当执行搜索操作时，采用 ArrayList 比较好。

二、Map<K,V>

我们先看Map再看Set。Map使用两个基本操作：get( )和put( )。

Map最常用的实现子类时HashMap<K,V>。

实现：

首先，我们看到的是：

Java代码  
transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;    //存放元素的“数组”  

数组中存放的是Entry<K,V>。

Map中所有的键值都存放到了一个个的Entry中。相当于一个Bean。

Java代码  
static class Entry<K,V> implements Map.Entry<K,V> {  
        final K key;  
        V value;  
        Entry<K,V> next;  
        int hash;  
}  

很类似与LinkedList，但是很奇怪，为什么要把节点放到数组中呢？为什么有了引用"Entry<K,V> next"还需要数组呢？为什么有个特殊的变量"int hash"呢？

显然，HashMap的实现是数组与LinkedList的“结合”。（也就是数组与链表相结合的）

看下面的代码：能够基本了解这种数据结构。

Java代码  
void addEntry(int hash, K key, V value, int bucketIndex) {  
    if ((size >= threshold) && (null != table[bucketIndex])) {  
        resize(2 * table.length);          //重新设置数组的大小  
        hash = (null != key) ? hash(key) : 0;  //得到新的hash值  
        bucketIndex = indexFor(hash, table.length);  //得到新的索引  
    }  
  
    createEntry(hash, key, value, bucketIndex);    //构建新的Entry  
}  
void createEntry(int hash, K key, V value, int bucketIndex) {  
    Entry<K,V> e = table[bucketIndex];  
    table[bucketIndex] = new Entry<>(hash, key, value, e);  
    size++;  
}  

当addEntry时，可能会重新修改数组的大小，再将Entry存放到数组中。可是是怎么存放的呢？

Java代码  
Entry<K,V> e = table[bucketIndex];   //取出原来的Entry  
table[bucketIndex] = new Entry<>(hash, key, value, e); //将原来的Entry被引用到新的Entry的next，再讲新的Entry放到数组里面。  

1、先取出原来的Entry

2、将原来的Entry被引用到新的Entry的next，再讲新的Entry放到数组里面。

于是图形如下：（盗用一下网上用的很多的这张图片:"拉链法"。来源：图片上有水印）

现在只是知道的大致的数据结构是像上面那样的，但是HashMap如何通过一个“数组”来实现存取操作的呢？

操作：

put()操作：

Java代码  
int hash = hash(key);  
int i = indexFor(hash, table.length);  
//put时，得到索引  
  
static int indexFor(int h, int length) {  
    return h & (length-1);   //HashMap存取时，都需要计算当前key应该对应Entry[]数组哪个元素，即计算数组下标  
}  

当向 HashMap 中 put 一对键值时，它会根据 key 的 hashCode 值计算出一个位置，该位置就是此对象准备往数组中存放的位置。(如果Key相同，会覆盖成新的Value)

具体操作：

如果该位置没有对象存在，就将此对象直接放进数组当中；如果该位置已经有对象存在了，则顺着此存在的对象的链开始寻找（Entry 类有一个 Entry 类型的 next 成员变量，指向了该对象的下一个对象），如果此链上有对象的话，再去使用 equals 方法进行比较，如果对此链上的某个对象的 equals 方法比较为 false，则将该对象放到数组当中，然后将数组中该位置以前存在的那个对象链接到此对象的后面。

get()操作类似，不再去解释了。

我们再回过去看一下构造函数：

这是jdk1.6之前的实现：

Java代码  
public HashMap(int initialCapacity, float loadFactor) {  
        .....  
        // Find a power of 2 >= initialCapacity  
        int capacity = 1;  
        while (capacity < initialCapacity)  
            capacity <<= 1;  
        this.loadFactor = loadFactor;  
        threshold = (int)(capacity * loadFactor);  
        table = new Entry[capacity];  
        init();  
    }  

jdk1.7：（与1.6类似）

Java代码  
public HashMap(int initialCapacity, float loadFactor) {  
        //........  
        //........  
        this.loadFactor = loadFactor;   //获得负载因子(根据负载因子的大小决定负载的能力)  
        //装填因子 = key的个数 / 散列表的长度  
        threshold = initialCapacity;   //threshold是再散列时的大小(capacity * load factor)  
        init();  
    }  

负载因子loadFactor的理解为：HashMap中的数据量/HashMap的总容量(initialCapacity),当loadFactor达到指定值或者0.75时候，HashMap的总容量自动扩展一倍，以此类推。

下面就是总容量扩容的实现：

Java代码  
void resize(int newCapacity) {  
        Entry[] oldTable = table;  
        int oldCapacity = oldTable.length;  
        //...  
        Entry[] newTable = new Entry[newCapacity];  
        transfer(newTable, initHashSeedAsNeeded(newCapacity));  
        table = newTable;  
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);  
    }  
  
    void transfer(Entry[] newTable, boolean rehash) {  
        int newCapacity = newTable.length;  
        for (Entry<K,V> e : table) {  
            while(null != e) {  
                Entry<K,V> next = e.next;  
                if (rehash) {  
                    e.hash = null == e.key ? 0 : hash(e.key);  
                }  
                int i = indexFor(e.hash, newCapacity);  
                e.next = newTable[i];  
                newTable[i] = e;  
                e = next;  
            }  
        }  
    }  

三、Set<E>

最后我们看一下Set<E>的常用子类HashSet<E>的实现。

实现：还是先看构造函数和成员变量：

Java代码  
private transient HashMap<E,Object> map;  
public HashSet() {  
        map = new HashMap<>();  
    }  

一目了然，原来HashSet使用HashMap来实现的，所以我们要先说Map再说Set。

HashSet用HashMap来实现，将元素存放在Map的Key中，因此Map中存放的元素是不可以重复的。而Value当中存放的是默认的Object。

相应的HashSet也给出了一个可以修改装载能力的构造函数：

Java代码  
public HashSet(int initialCapacity, float loadFactor) {  
        map = new HashMap<>(initialCapacity, loadFactor);  
    }  

最后是HashSet的操作：

Java代码  
public boolean add(E e) {  
        return map.put(e, PRESENT)==null;  
    }  
  
public boolean remove(Object o) {  
        return map.remove(o)==PRESENT;  
    }  

实现也因此比较简单。

那么Collection框架就介绍到这里了。

分享到：

JAVA为什么要配置环境变量，怎样配置 | Spring解决Hibernate session 关闭

2014-04-24 15:00
浏览 604
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论