`
qindongliang1922
  • 浏览: 2184493 次
  • 性别: Icon_minigender_1
  • 来自: 北京
博客专栏
7265517b-f87e-3137-b62c-5c6e30e26109
证道Lucene4
浏览量:117546
097be4a0-491e-39c0-89ff-3456fadf8262
证道Hadoop
浏览量:125936
41c37529-f6d8-32e4-8563-3b42b2712a50
证道shell编程
浏览量:59932
43832365-bc15-3f5d-b3cd-c9161722a70c
ELK修真
浏览量:71305
社区版块
存档分类
最新评论

JDK8中ArrayList的工作原理剖析

    博客分类:
  • JAVA
阅读更多

ArrayList也是在Java开发中使用频率非常高的一个类,内部是基于数组的动态管理的方式来实现的。数组在内存里面是一块连续的存储空间,其优势是基于下标的随机访问和遍历是非常高效的。

JDK8源码中的ArrayList类结构定义如下:

````
 class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
````


(1)继承了AbstractList实现了List接口是一个数组队列拥有了List基本的的增删改查功能

(2)实现了RandomAccess接口拥有随机读写的功能

(3)实现了Cloneable接口可以被克隆

(4)实现了Serializable了接口并重写了序列化和反序列化方法,使得ArrayList可以拥有更好的序列化的性能。



ArrayList中的成员变量和几个构造方法如下:

````java
 //定义的序列化id,主要是为了标识不同版本的兼容性    
 private static final long serialVersionUID = 8683452581122892189L;
 //默认的数组存储容量
  private static final int DEFAULT_CAPACITY = 10;
  //当指定数组的容量为0的时候使用这个变量赋值
  private static final Object[] EMPTY_ELEMENTDATA = {};
  //默认的实例化的时候使用此变量赋值
  private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
  //真正存放数据的对象数组,并不被序列化
  transient Object[] elementData;
  //数组中的真实元素个数它小于或等于elementData.length
  private int size;
  //数组中最大存放元素的个数 
  private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

    //构造函数一,如果指定容量就分配指定容量的大小
    //没有指定就使用EMPTY_ELEMENTDATA赋值
      public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }    
    
    //构造函数二,使用默认的DEFAULTCAPACITY_EMPTY_ELEMENTDATA赋值
        public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }
    
    //构造一个传入的集合,作为数组的数据
        public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }


````


在了解了它的成员变量和构造函数之后,我们再来看下几个常用的方法:

(一)添加

添加有两个方法,第一个add(E e)方法的调用链涉及5个方法,分别如下:

````
  //1
    public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }
    
    //2
        private void ensureCapacityInternal(int minCapacity) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }

        ensureExplicitCapacity(minCapacity);
    }
    //3
        private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }
    
    //4
        private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
    
    //5
        private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }
    
````
这里一步步分析,在调用了add(E e)的方法第一步,我们看到了它调用了ensureCapacityInternal(size + 1)方法,在这个方法里面首先判断了数组是不是一个长度为0的空数组,如果是的话就给它容量赋值为默认的容量大小也就是10,然后调用了ensureExplicitCapacity方法,这个方法里面记录了modCount+1之后,并判断了当前的容量是否小于数组当前的长度,如果大于当前数组的长度就开始进行扩容操作调用方法 grow(minCapacity),扩容的长度是增加了原来数组数组的一半大小,然后并判断了是否达到了数组扩容的上限并赋值,接着把旧数组的数据拷贝到扩容后的新数组里面再次赋值给旧数组,最后把新添加的元素赋值给了扩容后的size+1的位置里面。


接着看第2个add方法:

````
    public void add(int index, E element) {
        rangeCheckForAdd(index);//是否越界

        ensureCapacityInternal(size + 1);  // Increments modCount!!
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);
        elementData[index] = element;
        size++;
    }
````


这里面用到了 System.arraycopy方法,参数含义如下:

(原数组,原数组的开始位置,目标数组,目标数组的的开始位置,拷贝的个数)

(注:如果想了解关于Java里面数组拷贝的几种方式,请参考我的上一篇文章。)

这里面主要是给指定位置添加一个元素,ArrayList首先检查是否索引越界,如果没有越界,就检查是否需要扩容,然后将index位置之后的所有数据,整体拷贝到index+1开始的位置,然后就可以把新加入的数据放到index这个位置,而index前面的数据不需要移动,在这里我们可以看到给指定位置插入数据ArrayList是一项大动作比较耗性能。




(二)移除

(1)根据下标移除

````java
    public E remove(int index) {
        //检查是否越界
        rangeCheck(index);
        //记录修改次数
        modCount++;
        //获取移除位置上的值
        E oldValue = elementData(index);
        //获取要移动元素的个数
        int numMoved = size - index - 1;
        if (numMoved > 0)
        //拷贝移动的所有数据到index位置上
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        //把size-1的位置的元素赋值null,方便gc
        elementData[--size] = null; // clear to let GC do its work
        //最终返回旧的数据
        return oldValue;
    }
````


(2)根据元素移除
````
    public boolean remove(Object o) {
    //等于null值的移除
        if (o == null) {
         //遍历数组
            for (int index = 0; index < size; index++)
            //找到集合里面第一个等于null的元素
                if (elementData[index] == null) {
                //然后移除
                    fastRemove(index);
                    return true;
                }
        } else {
        //非null情况下,遍历每一个元素通过equals比较
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                //然后移除
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }

//该方法与通过下标移除的原理一样,整体左移
    private void fastRemove(int index) {
        modCount++;
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work
    }

````



remove方法与add(int index, E element)正好是一个相反的操作过程,移除一个元素,会影响到一批数据的位置移动,所以也是比较耗性能的。


(三)查询

````
    public E get(int index) {
      //检查是否越界
        rangeCheck(index);
        //返回指定位置上的元素
        return elementData(index);
    }
````


(四)修改

````
    public E set(int index, E element) {
    //检查是否越界
        rangeCheck(index);
        //获取旧的元素值
        E oldValue = elementData(index);
        //新元素赋值
        elementData[index] = element;
        //返回旧的元素值
        return oldValue;
    }
````


(五)清空方法
````
    public void clear() {
        modCount++;

        // clear to let GC do its work
        for (int i = 0; i < size; i++)
            elementData[i] = null;

        size = 0;
    }
````

clear方法是把每个元素的值赋值为null,便于gc回收


(六)瘦身方法
````
    public void trimToSize() {
        modCount++;
        if (size < elementData.length) {
            elementData = (size == 0)
              ? EMPTY_ELEMENTDATA
              : Arrays.copyOf(elementData, size);
        }
    }
````
该方法主要将数组空间缩减,去掉数组里面的null值。
Arrays.copyOf方法参数含义:(原数组,拷贝的个数)

(七)是否包含
````java
    public boolean contains(Object o) {
        return indexOf(o) >= 0;
    }
    
        public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }
````
这里面主要是分两种情况null值的遍历和非null的遍历遍历,如果查询到就返回下标位置,否则就返回-1,然后与0相比,大于0就存在,小于0就是不存在。


总结:


本文介绍了JDK8中的ArrayList的工作原理和常用方法分析,此外ArrayList非线程安全,所以需要多线程的场景下,请使用jdk自带并发List结构或者Guava,Apache Common等工具包提供的List集合。基于数组实现的List在随机访问和遍历的效率比较高,但在插入指定和删除指定元素的时候效率比较低,而这正好和链表相反,链表的的查询和随机遍历效率较低,但插入和删除指定位置元素的效率比较高,这也是为什么HashMap中同时使用两种数据结构来优势互补的原因。



有什么问题可以扫码关注微信公众号:我是攻城师(woshigcs),在后台留言咨询。 技术债不能欠,健康债更不能欠, 求道之路,与君同行。


0
1
分享到:
评论

相关推荐

    JDK1.6中Arraylist,Vector,LinkedList源码

    在JDK 1.6中,ArrayList提供了线程不安全的高效操作,适合于非并发环境下的高性能读写操作。其优点在于随机访问快速,因为数组支持索引直接访问;缺点是插入和删除元素需要移动后续元素,效率较低。 Vector与...

    ArrayList源码分析(含jdk1.8).pdf

    在了解ArrayList的源码分析时,我们主要探讨其在Java Development Kit (JDK) 1.8中的实现。ArrayList是一个非常重要的集合框架,用于动态数组的实现,其功能类似于数组,但可以在运行时动态调整大小。它是一个非线程...

    jdk17中文说明文档

    8. **新特性实验(JEPs):** JDK 17可能包含一些实验性的Java增强提案(JEPs),例如新的垃圾回收器、语言特性等。 通过这份"jdk-17中文api.CHM"文档,开发者可以全面了解和掌握JDK 17的各个方面,无论是初学者...

    java_jdk8源码

    - 如Runnable、Callable、Comparator等接口在JDK8中被标记为函数式接口,可以用于Lambda表达式。查看这些接口的源码有助于理解如何定义和使用函数式接口。 5. **Optional类** - Optional是为了解决空指针异常问题...

    关于 ArrayList get(0)的异常JDK源码跟进

    通过阅读和分析JDK源码,我们可以深入理解ArrayList的工作原理,这对于排查和解决实际问题非常有帮助。在遇到类似问题时,可以先检查索引是否合法,再检查ArrayList是否已添加元素,最后结合源码分析异常产生的具体...

    jdk源码阅读一:ArrayList

    通过深入分析ArrayList的源码,我们可以更好地理解其工作原理以及优化策略。这些知识点对于开发高效稳定的Java程序至关重要。对于需要频繁访问和修改的数据集,使用ArrayList可以带来性能上的显著提升。然而,在多...

    jdk8u-jdk-master

    3. Stream API:Stream API是Java 8中的一个重大改进,提供了对集合数据的高效、声明性处理方式。通过链式调用,可以实现过滤、映射、聚合等多种操作。 4. 默认方法:接口中可以定义带有实现的方法,这使得接口可以...

    JDK13 API 中文 文档.CHM

    **JDK13 API中文文档**是Java开发者的重要参考资料,它包含了JDK13版本中的所有公共类、接口、枚举、注解等编程元素的详细说明,为开发者提供了全面的API函数用法和功能解释。这篇文档是中文版,方便了中文使用者...

    JavaJDK1.7chm中文版

    这个版本的JDK包含了编译器、JVM(Java虚拟机)、调试工具、性能分析工具等一系列组件,使得开发者能够编写、运行、测试和调试Java程序。"JavaJDK1.7chm中文版"则是一个针对中国用户特别制作的版本,它包含了完整的...

    jdk的部分源码(jdk)

    通过源码,我们可以学习这些类和接口的实现,例如ArrayList和HashMap的工作原理,线程同步的细节,以及Socket通信的底层实现。 4. **异常处理**: 源码中展示了Java如何处理异常,包括检查性异常和运行时异常。理解...

    ArrayList源码分析

    下面是一个简单的手写 `ArrayList` 类的示例,用于更好地理解 `ArrayList` 的内部工作原理: ```java package com.itmayiedu; import java.util.Arrays; public class ExtArrayList { // ArrayList 底层使用的是...

    jdk11.src.zip

    "jdk11.src.zip"这个压缩包提供了JDK11的源代码,这对于开发者来说是一份极其宝贵的资源,能够帮助我们深入了解Java语言和JVM的工作原理,提升我们的编程技巧和问题解决能力。 首先,我们来看看标签中的"jdk",...

    jdk源码 jdk源码

    这些API可能包含特定平台的实现细节,对于理解JDK的内部工作原理很有帮助,但不建议在公开的代码中直接使用,因为它们可能会在未来的JDK版本中发生变化。 6. **javax**: 这个目录包含了Java扩展的API,包括一些与...

    jdk1.7 jdk1.7 jdk1.7

    在给定的标题“jdk1.7 jdk1.7 jdk1.7”中,反复提及的“1.7”指的是Java的第七个主要版本,也被称为Java 7。这个版本在2011年发布,为开发者带来了许多新特性和改进,旨在提高开发效率和程序性能。 **一、JDK 1.7的...

    jdk1.6 源码jdk1.6 源码

    深入理解JDK 1.6的源码对于Java开发者来说至关重要,因为它揭示了语言核心库的工作原理,有助于优化代码、理解和解决潜在问题。 1. **Java虚拟机(JVM)**:JDK 1.6中的JVM是Java程序执行的基础,它的主要职责是...

    JDK_AIP1.7源码.rar

    在给定的压缩包“JDK_AIP1.7源码.rar”中,我们主要关注的是JDK 1.7版本的源代码,这对于理解Java语言的工作原理、深入学习Java API以及进行高级编程和性能优化至关重要。 1. **Java虚拟机(JVM)** - JVM是Java...

    jdk源码jdk1.8.0_181

    3. **Date与Time API**:JDK8重构了日期和时间API,位于`java.time`包下,如LocalDate、LocalTime、LocalDateTime等,源码揭示了它们的内部工作原理。 4. **方法引用和构造器引用**:这些新特性使得代码更加简洁,...

    JDK1.5中文API文档,html格式

    本篇将详细介绍JDK 1.5中文API文档的主要内容,以及这些API如何在实际编程中发挥作用。 ### 类与接口 JDK 1.5引入了泛型(Generics),这是一种强大的类型系统增强,允许开发者在定义类、接口和方法时指定类型参数...

Global site tag (gtag.js) - Google Analytics