`
Yinny
  • 浏览: 295010 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论

Java源码解读之util.ArrayList

阅读更多
ArrayList是List接口的一个可变长数组实现。实现了所有List接口的操作,并允许存储null值。除了没有进行同步,ArrayList基本等同于Vector。在Vector中几乎对所有的方法都进行了同步,但ArrayList仅对writeObject和readObject进行了同步,其它比如add(Object)、remove(int)等都没有同步。

1.存储

  ArrayList使用一个Object的数组存储元素。

private transient Object elementData[];

  ArrayList实现了java.io.Serializable接口,这儿的transient标示这个属性不需要自动序列化。下面会在writeObject()方法中详细讲解为什么要这样作。

  2.add和remove

public boolean add(Object o)
{
 ensureCapacity(size + 1);
 // Increments modCount!! elementData[size++] = o;
 return true;
}

  注意这儿的ensureCapacity()方法,它的作用是保证elementData数组的长度可以容纳一个新元素。在“自动变长机制”中将详细讲解。

public Object remove(int index)
{
 RangeCheck(index);
 modCount++;
 Object oldValue = elementData[index];
 int numMoved = size - index - 1;
 if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved);
 elementData[--size] = null; // Let gc do its work return oldValue;
}

  RangeCheck()的作用是进行边界检查。由于ArrayList采用一个对象数组存储元素,所以在删除一个元素时需要把后面的元素前移。删除一个元素时只是把该元素在elementData数组中的引用置为null,具体的对象的销毁由垃圾收集器负责。

  modCount的作用将在下面的“iterator()中的同步”中说明。

  注:在前移时使用了System提供的一个实用方法:arraycopy(),在本例中可以看出System.arraycopy()方法可以对同一个数组进行操作,这个方法是一个native方法,如果对同一个数组进行操作时,会首先把从源部分拷贝到一个临时数组,在把临时数组的元素拷贝到目标位置。

  3.自动变长机制

  在实例化一个ArrayList时,你可以指定一个初始容量。这个容量就是elementData数组的初始长度。如果你使用:

ArrayList list = new ArrayList();

  则使用缺省的容量:10。

public ArrayList() { this(10); }

  ArrayList提供了四种add()方法,

public boolean add(Object o)

public void add(int index, Object element)

public boolean addAll(Collection c)

public boolean addAll(int index, Collection c)

  在每一种add()方法中,都首先调用了一个ensureCapacity(int miniCapacity)方法,这个方法保证elementData数组的长度不小于miniCapacity。ArrayList的自动变长机制就是在这个方法中实现的。

public void ensureCapacity(int minCapacity)
{ modCount++;
 int oldCapacity = elementData.length;
 if (minCapacity > oldCapacity)
 {
  Object oldData[] = elementData;
  int newCapacity = (oldCapacity * 3)/2 + 1;
  if (newCapacity < minCapacity) newCapacity = minCapacity;
  elementData = new Object[newCapacity];
  System.arraycopy(oldData, 0, elementData, 0, size);
  }
}

  从这个方法实现中可以看出ArrayList每次扩容,都扩大到原来大小的1.5倍。

  每种add()方法的实现都大同小异,下面给出add(Object)方法的实现:

public boolean add(Object o)
{
 ensureCapacity(size + 1);
 // Increments modCount!! elementData[size++] = o;
 return true;
}


4.iterator()中的同步

  在父类AbstractList中定义了一个int型的属性:modCount,记录了ArrayList结构性变化的次数。

protected transient int modCount = 0;

  在ArrayList的所有涉及结构变化的方法中都增加modCount的值,包括:add()、remove()、addAll()、removeRange()及clear()方法。这些方法每调用一次,modCount的值就加1。

  注:add()及addAll()方法的modCount的值是在其中调用的ensureCapacity()方法中增加的。

  AbstractList中的iterator()方法(ArrayList直接继承了这个方法)使用了一个私有内部成员类Itr,生成一个Itr对象(Iterator接口)返回:

public Iterator iterator() { return new Itr(); }

  Itr实现了Iterator()接口,其中也定义了一个int型的属性:expectedModCount,这个属性在Itr类初始化时被赋予ArrayList对象的modCount属性的值。

int expectedModCount = modCount;

  注:内部成员类Itr也是ArrayList类的一个成员,它可以访问所有的AbstractList的属性和方法。理解了这一点,Itr类的实现就容易理解了。

  在Itr.hasNext()方法中:

public boolean hasNext() { return cursor != size(); }

  调用了AbstractList的size()方法,比较当前光标位置是否越界。

  在Itr.next()方法中,Itr也调用了定义在AbstractList中的get(int)方法,返回当前光标处的元素:

public Object next()
{
 try
 {
  Object next = get(cursor);
  checkForComodification();
  lastRet = cursor++;
  return next;
 }
 catch(IndexOutOfBoundsException e)
 {
  checkForComodification();
  throw new NoSuchElementException();
 }
}

  注意,在next()方法中调用了checkForComodification()方法,进行对修改的同步检查:

final void checkForComodification()
{
 if (modCount != expectedModCount) throw new ConcurrentModificationException(); }

  现在对modCount和expectedModCount的作用应该非常清楚了。在对一个集合对象进行跌代操作的同时,并不限制对集合对象的元素进行操作,这些操作包括一些可能引起跌代错误的add()或remove()等危险操作。在AbstractList中,使用了一个简单的机制来规避这些风险。这就是modCount和expectedModCount的作用所在。

  5.序列化支持


  ArrayList实现了java.io.Serializable接口,所以ArrayList对象可以序列化到持久存储介质中。 ArrayList的主要属性定义如下:

private static final long serialVersionUID = 8683452581122892189L;

private transient Object elementData[];

private int size;

  可以看出serialVersionUID和size都将自动序列化到介质中,但elementData数组对象却定义为transient了。也就是说ArrayList中的所有这些元素都不会自动系列化到介质中。为什么要这样实现?因为elementData数组中存储的“元素”其实仅是对这些元素的一个引用,并不是真正的对象,序列化一个对象的引用是毫无意义的,因为序列化是为了反序列化,当你反序列化时,这些对象的引用已经不可能指向原来的对象了。所以在这儿需要手工的对ArrayList的元素进行序列化操作。这就是writeObject()的作用。

private synchronized void writeObject(java.io.ObjectOutputStream s) throws java.io.IOException
{
// Write out element count, and any hidden stuff s.defaultWriteObject();
// Write out array length s.writeInt(elementData.length);
// Write out all elements in the proper order.
for (int i=0; i<size; i++) s.writeObject(elementData[i]);
}

  这样元素数组elementData中的所以元素对象就可以正确地序列化到存储介质了。

  对应的readObject()也按照writeObject()方法的顺序从输入流中读取:
private synchronized void readObject(java.io.ObjectInputStream s) throws java.io.IOException, ClassNotFoundException
{
// Read in size, and any hidden stuff s.defaultReadObject();
// Read in array length and allocate array
int arrayLength = s.readInt();
elementData = new Object[arrayLength];
// Read in all elements in the proper order.
for (int i=0; i<size; i++) elementData[i] = s.readObject(); }


总结:知道了具体的实现机理之后就能了解了别人的设计思想,怎么来实现,性能并发等是怎么考虑的,学习算法数据结构的实际使用情况,最后就是你在用的时候会能把它用得最恰到好处,而且也可以在遇到问题的时候更快速定位,最后是能把它的一些思想用在后面编程中
分享到:
评论
1 楼 Yinny 2011-08-17  
1:根本不存在一个动态增长的容器供我们使用。所谓集合就是在内部定义一个一定大小的数组,这个数组的容量也就是Capacity属性,如果没有设置,默认是一个0长度的数组。当开始添加第一个数据时,数组的长度会被设为4。
2:当我们调用ADD方法为集合添加元素时,它会判断集合内部的数组是否已填充满,如果填充满了,就会实例化一个新的数组,数组容量为原数组容量的2倍。然后把原数组中的数据COPY到新的数组中,然后原数组会成为垃圾回收的对象被GC收集。
3:如果数据量不大或能基本能确定大小的情况下,尽量使用数组而不是集合,因为多次创建新数组并COPY数据会对性能造成损伤(虽然微乎其微)。

相关推荐

    JAVA 知识库

    ##### 1.4 Java源码解读之util.ArrayList 这一节可能是对`java.util.ArrayList`内部实现原理的分析。`ArrayList`是Java集合框架中的一个重要组成部分,它实现了`List`接口,提供了一种动态数组的形式来存储元素。该...

    java源码文档src

    `java.text`和`java.util.Locale`包提供了国际化和本地化的支持,源码解读能帮助开发者为不同地区和语言的用户提供定制服务。 总之,Java源码文档src是Java开发者不可或缺的学习资源,它揭示了Java平台的内在工作...

    Java rt.jar 源码分析

    8. 国际化与本地化:`java.text`和`java.util.Locale`提供了国际化支持,通过源码可以学习如何处理不同地区的语言和格式。 通过阅读和理解rt.jar的源码,不仅可以提高我们的编程技能,还能使我们对Java平台的工作...

    java源码解读-java-src:java源码解读

    Java源码解读是Java开发人员深入理解平台工作原理和编程模型的重要途径。在这个"java-src:java源码解读"项目中,我们可以探索Java的核心库,包括JVM(Java虚拟机)、集合框架、并发机制、I/O流、网络编程等多个关键...

    Java SE 源码 Java SE 源码

    源码解读能揭示反射在动态类型语言特性中的作用。 7. **集合框架**:Java集合框架包括数组、列表、队列、映射等数据结构,如`ArrayList`、`HashMap`等。源码揭示了这些数据结构的实现细节,对于优化和定制自己的...

    java程序源码

    Java源码是程序员用Java语言编写的程序文本,它包含了类、方法和变量等元素,这些元素在编译后会转换成字节码,可以在任何支持Java的平台上运行。 源码文件通常使用".java"扩展名,但在提供的压缩包中,我们看到了...

    java Util

    在阅读博客文章(链接已给出,但无法访问)时,可能涉及了更多关于Java Util的深入分析或源码解读,如类的实现原理、性能优化等。对于`util2`和`util`这两个文件,可能是示例代码或者自定义的工具类库,它们可以...

    Java并发编程实践源码

    《Java并发编程实践》是一本深入探讨Java多线程与并发编程的经典著作,其源码提供了丰富的示例,帮助读者理解和应用并发编程的核心概念。在这些文件中,我们可以看到多种并发设计模式和策略的实际运用,下面将逐一...

    设计模式实战、jdk源码|simple-demo.zip

    本资源主要围绕“设计模式实战”与“JDK源码解读”展开,帮助我们深入理解并运用设计模式,提升代码质量与可维护性。 首先,我们要明白设计模式的分类。设计模式分为三大类:创建型模式(如单例模式、工厂方法模式...

    javajdk1.8源码-Java-source-reading:jdk1.8源代码分析

    缓慢更新一些个人学习java相关源码过程中的笔记,在这里你将不可避免地看到以下情况: 个别不懂/没想好的地方留空待补全 限于个人水平出现的解读错误 编辑错误 排版不统一 如发现有错,欢迎指正! 如果对你有用,...

    JDK源码选读

    源码解读有助于理解TCP和UDP连接的建立、数据传输过程。 7. **反射API**:`java.lang.reflect`包包含用于运行时动态访问和修改类的API。通过源码学习,我们可以掌握如何通过反射创建对象、调用方法、访问字段,以及...

    Java装逼指南.pdf

    以下是对该文档中提到的一些核心概念和知识点的深入解读。 ### 第一部分:基本语法 #### 1. 关键字 - **static**:用于定义静态变量、方法或内部类。静态成员属于类本身,而不是类的实例。 - **final**:用于声明...

    javajdk源码学习-javaSource:JDK源码学习

    5. **I/O流**:`java.io`和`java.nio`包提供了输入输出功能,源码解读有助于理解缓冲区操作、字符编码转换以及不同类型的流(如字节流、字符流)的工作方式。 6. **反射与动态代理**:`java.lang.reflect`包中的类...

    javajdk源码-jdk8-base-source-code:jdk8中的java.base的源码学习

    源码解读能揭示其灵活性和潜在风险。 7. **日期时间API**:在JDK8中,引入了新的`java.time`包,包含`LocalDate`、`LocalTime`、`LocalDateTime`等类,提供了更强大和友好的日期时间处理功能。 8. **函数式编程**...

    javajdk源码-java-source:jdk源代码

    1. **Java核心API**:Java源码包含了大量核心类库,如`java.lang`、`java.util`、`java.io`等,这些库为开发者提供了基本的数据类型、异常处理、集合框架、I/O流操作等功能。通过阅读源码,我们可以了解这些类和接口...

    java详细笔记

    - 学习和掌握Java.util和Java.io等核心包中的类,如ArrayList、LinkedList、HashMap、Scanner等,以及日期时间API、正则表达式和集合排序等功能。 9. **工具** - **JDK**:Java开发工具包,包含了编译器javac、...

    jdk-source:jdk原始码学习

    源码解读能揭示反射的实现细节,以及动态代理的生成过程。 7. **模块系统(Project Jigsaw)**:从Java 9开始,JDK引入了模块化系统,这改变了类的加载方式。学习这部分源码有助于理解模块间的依赖关系和封装性。 ...

    My-Java-Programs:包含各种Java程序的存储库

    "My-Java-Programs" 这个标题明确表示这是一个关于Java编程的项目,很可能是一个代码仓库或者源码集合。"包含各种Java程序的存储库" 暗示这里包含了多种类型的Java应用程序,可能是从基础的练习到复杂的系统应用。 ...

Global site tag (gtag.js) - Google Analytics