JAVA数据结构
线性表,链表,哈希表是常用的数据结构,在进行Java开发时,JDK已经为我们提供了一系列相应的类来实现基本的数据结构。这些类均在java.util包中。本文试图通过简单的描述,向读者阐述各个类的作用以及如何正确使用这些类。
Collection
├List
│├LinkedList
│├ArrayList
│└Vector
│ └Stack
└Set
Map
├Hashtable
├HashMap
└WeakHashMap
Collection接口
Collection是最基本的集合接口,一个Collection代表一组Object,即Collection的元素(Elements)。一些Collection允许相同的元素而另一些不行。一些能排序而另一些不行。Java SDK不提供直接继承自Collection的类,Java SDK提供的类都是继承自Collection的“子接口”如List和Set。
所有实现Collection接口的类都必须提供两个标准的构造函数:无参数的构造函数用于创建一个空的Collection,有一个Collection参数的构造函数用于创建一个新的Collection,这个新的Collection与传入的Collection有相同的元素。后一个构造函数允许用户复制一个Collection。
如何遍历Collection中的每一个元素?不论Collection的实际类型如何,它都支持一个iterator()的方法,该方法返回一个迭代子,使用该迭代子即可逐一访问Collection中每一个元素。典型的用法如下:
Iterator it = collection.iterator(); // 获得一个迭代子
while(it.hasNext()) {
Object obj = it.next(); // 得到下一个元素
}
由Collection接口派生的两个接口是List和Set。
主要方法:
boolean add(Object o)添加对象到集合
boolean remove(Object o)删除指定的对象
int size()返回当前集合中元素的数量
boolean contains(Object o)查找集合中是否有指定的对象
boolean isEmpty()判断集合是否为空
Iterator iterator()返回一个迭代器
boolean containsAll(Collection
c)查找集合中是否有集合c中的元素
boolean addAll(Collection
c)将集合c中所有的元素添加给该集合
void clear()删除集合中所有元素
void removeAll(Collection
c)从集合中删除c集合中也有的元素
void retainAll(Collection
c)从集合中删除集合c中不包含的元素
List接口
List是有序的Collection,使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引(元素在List中的位置,类似于数组下标)来访问List中的元素,这类似于Java的数组。
和下面要提到的Set不同,List允许有相同的元素。
除了具有Collection接口必备的iterator()方法外,List还提供一个listIterator()方法,返回一个ListIterator接口,和标准的Iterator接口相比,ListIterator多了一些add()之类的方法,允许添加,删除,设定元素,还能向前或向后遍历。
实现List接口的常用类有LinkedList,ArrayList,Vector和Stack。
主要方法:
void add(int index,Object
element)在指定位置上添加一个对象
boolean addAll(int index,Collection
c)将集合c的元素添加到指定的位置
Object get(int
index)返回List中指定位置的元素
int indexOf(Object
o)返回第一个出现元素o的位置.
Object removeint(int
index)删除指定位置的元素
Object set(int index,Object
element)用元素element取代位置index上的元素,返回被取代的元素
LinkedList类
LinkedList实现了List接口,允许null元素。此外LinkedList提供额外的get,remove,insert方法在LinkedList的首部或尾部。这些操作使LinkedList可被用作堆栈(stack),队列(queue)或双向队列(deque)。
注意LinkedList没有同步方法。如果多个线程同时访问一个List,则必须自己实现访问同步。一种解决方法是在创建List时构造一个同步的List:
List list = Collections.synchronizedList(new
LinkedList(...));
ArrayList类
ArrayList实现了可变大小的数组。它允许所有元素,包括null。ArrayList没有同步。
size,isEmpty,get,set方法运行时间为常数。但是add方法开销为分摊的常数,添加n个元素需要O(n)的时间。其他的方法运行时间为线性。
每个ArrayList实例都有一个容量(Capacity),即用于存储元素的数组的大小。这个容量可随着不断添加新元素而自动增加,但是增长算法并没有定义。当需要插入大量元素时,在插入前可以调用ensureCapacity方法来增加ArrayList的容量以提高插入效率。
和LinkedList一样,ArrayList也是非同步的(unsynchronized)。
主要方法:
Boolean add(Object
o)将指定元素添加到列表的末尾
Boolean add(int index,Object
element)在列表中指定位置加入指定元素
Boolean addAll(Collection
c)将指定集合添加到列表末尾
Boolean addAll(int index,Collection
c)在列表中指定位置加入指定集合
Boolean
clear()删除列表中所有元素
Boolean
clone()返回该列表实例的一个拷贝
Boolean contains(Object
o)判断列表中是否包含元素
Boolean ensureCapacity(int
m)增加列表的容量,如果必须,该列表能够容纳m个元素
Object get(int
index)返回列表中指定位置的元素
Int indexOf(Object
elem)在列表中查找指定元素的下标
Int size()返回当前列表的元素个数
Vector类
Vector非常类似ArrayList,但是Vector是同步的。由Vector创建的Iterator,虽然和ArrayList创建的Iterator是同一接口,但是,因为Vector是同步的,当一个Iterator被创建而且正在被使用,另一个线程改变了Vector的状态(例如,添加或删除了一些元素),这时调用Iterator的方法时将抛出ConcurrentModificationException,因此必须捕获该异常。
Stack
类
Stack继承自Vector,实现一个后进先出的堆栈。Stack提供5个额外的方法使得Vector得以被当作堆栈使用。基本的push和pop方法,还有peek方法得到栈顶的元素,empty方法测试堆栈是否为空,search方法检测一个元素在堆栈中的位置。Stack刚创建后是空栈。
Set接口
Set是一种不包含重复的元素的Collection,即任意的两个元素e1和e2都有e1.equals(e2)=false,Set最多有一个null元素。
很明显,Set的构造函数有一个约束条件,传入的Collection参数不能包含重复的元素。
请注意:必须小心操作可变对象(Mutable Object)。如果一个Set中的可变元素改变了自身状态导致Object.equals(Object)=true将导致一些问题。
Map接口
请注意,Map没有继承Collection接口,Map提供key到value的映射。一个Map中不能包含相同的key,每个key只能映射一个value。Map接口提供3种集合的视图,Map的内容可以被当作一组key集合,一组value集合,或者一组key-value映射。
主要方法:
boolean equals(Object
o)比较对象
boolean remove(Object
o)删除一个对象
put(Object key,Object
value)添加key和value
Hashtable类
Hashtable继承Map接口,实现一个key-value映射的哈希表。任何非空(non-null)的对象都可作为key或者value。
添加数据使用put(key, value),取出数据使用get(key),这两个基本操作的时间开销为常数。
Hashtable通过initial capacity和load factor两个参数调整性能。通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大load factor可以节省空间但相应的查找时间将增大,这会影响像get和put这样的操作。
使用Hashtable的简单示例如下,将1,2,3放到Hashtable中,他们的key分别是”one”,”two”,”three”:
Hashtable numbers = new Hashtable();
numbers.put(“one”, new Integer(1));
numbers.put(“two”, new Integer(2));
numbers.put(“three”, new Integer(3));
要取出一个数,比如2,用相应的key:
Integer n = (Integer)numbers.get(“two”);
System.out.println(“two = ” + n);
由于作为key的对象将通过计算其散列函数来确定与之对应的value的位置,因此任何作为key的对象都必须实现hashCode和equals方法。hashCode和equals方法继承自根类Object,如果你用自定义的类当作key的话,要相当小心,按照散列函数的定义,如果两个对象相同,即obj1.equals(obj2)=true,则它们的hashCode必须相同,但如果两个对象不同,则它们的hashCode不一定不同,如果两个不同对象的hashCode相同,这种现象称为冲突,冲突会导致操作哈希表的时间开销增大,所以尽量定义好的hashCode()方法,能加快哈希表的操作。
如果相同的对象有不同的hashCode,对哈希表的操作会出现意想不到的结果(期待的get方法返回null),要避免这种问题,只需要牢记一条:要同时复写equals方法和hashCode方法,而不要只写其中一个。
Hashtable是同步的。
HashMap类
HashMap和Hashtable类似,不同之处在于HashMap是非同步的,并且允许null,即null value和null key。,但是将HashMap视为Collection时(values()方法可返回Collection),其迭代子操作时间开销和HashMap的容量成比例。因此,如果迭代操作的性能相当重要的话,不要将HashMap的初始化容量设得过高,或者load factor过低。
WeakHashMap类
WeakHashMap是一种改进的HashMap,它对key实行“弱引用”,如果一个key不再被外部所引用,那么该key可以被GC回收。
总结
如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问元素,应该使用ArrayList。
如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。
要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashCode方法。
尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变。这就是针对抽象编程。
分享到:
相关推荐
### Java数据结构复习资料知识点详解 #### 一、绪论 **1. 计算机科技的两大支柱** - **数据结构**: 是一门研究非数值计算的程序设计问题中计算机的操作对象及其之间的关系和操作的学科。 - **算法**: 是一系列...
Java数据结构复习主要聚焦在二叉树这一重要概念上,它是计算机科学中处理复杂数据组织的一种方式。二叉树的逻辑结构是非线性的,意味着它不是简单的线性序列,而是由节点构成,每个节点最多有两个子节点,通常称为左...
Java数据结构是计算机科学中的重要课程,主要探讨如何有效地存储和组织数据,以便进行高效的操作。这门课程通常包括数组、链表、栈、队列、树、图、哈希表等多种数据结构,并深入讲解它们的特性、操作方法以及在实际...
以上就是Java数据结构测试题中涉及的主要知识点,它们涵盖了数据结构、软件工程、面向对象编程和多线程等多个方面,这些都是Java开发者必备的基础知识。理解并掌握这些内容对于编写高效、安全的Java代码至关重要。
根据提供的文件信息,以下是关于数据结构和Java数据结构期末考试的相关知识点整理: 一、算法分析基础: 算法分析是计算机科学的基础,涉及对算法性能的评估。增长函数用于表示问题大小n与算法的性能之间的关系,它...
本压缩包“数据结构复习代码”包含了用于学习数据结构的相关代码,非常适合正在学习或复习数据结构的人士。 数据结构主要分为两大类:线性结构和非线性结构。线性结构包括数组、链表、栈和队列。数组是最基础的数据...
数据结构复习资料-java数据结构期末考试.doc 本文档是关于 java 数据结构的复习资料,涵盖了算法分析、集合概述、栈等知识点。下面是对这些知识点的详细解释: 算法分析 算法分析是计算机科学的基础,它研究的是...
《数据结构(java版)》是一本专为Java程序员设计的教科书,旨在深入探讨如何在Java编程环境中高效地组织和管理数据。数据结构是计算机科学中的核心概念,它研究了如何存储、检索和操作数据,以实现算法的最优性能。在...
数据结构复习整理 本篇文章主要介绍了数据结构的几个重要知识点,包括顺序表、单链表、带头结点的单链表等数据结构的算法实现。这些算法涵盖了插入、删除、统计元素个数、求和等操作。 1. 顺序表插入算法: 在...
在“广工数据结构复习及试卷”中,我们可预期涵盖了一些关键概念和算法,这对于准备考试或进一步理解这门学科至关重要。 1. **数组**:数组是最基础的数据结构,它是一系列相同类型元素的集合,通过索引访问。了解...
Java语言的基本结构包括变量、数据类型、运算符、控制流语句、方法、数组、类、继承、接口、异常处理等。 1. Java语言的基本特点: Java语言是面向对象的,它具有封装、继承、多态性等特点。Java语言是平台独立的...
数据结构是计算机科学中至关重要的基础概念,它研究如何在计算机中组织和管理数据,以便高效地进行存储、检索和处理。本题涉及到的主要知识点包括数据的存储结构、算法的时间复杂度、数据结构的类型、操作队列和栈的...
殷人昆教授的数据结构复习资料是一份极具价值的学习资源,尤其对于准备数据结构考试的学生来说,它能提供全面而深入的理解。 1. **数据结构基本概念**:数据结构不仅仅是关于数据的存储,它包括数组、链表、栈、...
在本复习资料中,重点讲述了算法分析和数据结构,特别是时间复杂度和空间复杂度,以及Java中的集合和栈。 算法分析是理解程序性能的关键。它关注的是算法在处理特定问题规模(用n表示)时所需的时间和空间资源。...
总的来说,这份资源是学习Java数据结构的宝贵财富。它不仅提供了理论知识的讲解,还有实践操作的指导,以及自我评估的工具。无论是初学者还是希望深入研究的开发者,都可以从中获益匪浅,提升自己的编程能力和问题...
Java数据结构是编程领域中的重要概念,特别是在设计高效算法和优化程序性能时。在这个主题下,哈夫曼树(Huffman Tree),也称为最优二叉树,是一个关键的知识点,常用于数据压缩和编码。哈夫曼树是通过哈夫曼编码...
### Java基础复习笔记09数据结构-哈夫曼树 #### 1. 哈夫曼树概述 哈夫曼树是一种特殊的二叉树,它在计算机科学领域有着广泛的应用,尤其是在数据压缩方面。哈夫曼树也被称为最优二叉树,其构建原则是使得带权路径...
8. 实验与编程:能够熟练运用C++或Java等编程语言实现上述数据结构和算法,熟悉并掌握算法的调试技巧。 复习过程中,除了理论学习,还需要通过大量的习题来巩固和提升。可以尝试解答历年的考研真题,模拟题,以及...
6. **数据结构设计与实现**:如何根据问题需求设计合适的数据结构,并用C++或Java等编程语言实现,是考研中常考的实践环节。 7. **算法分析与设计**:学习如何分析算法的时间复杂度和空间复杂度,评估算法效率,...