这篇文章主要论述了Set是如何实现"没有重复元素"(no duplicate elements)的,以及阐述了什么是“重复”(duplicate),是相同的地址空间?是equals的返回值为true?是compareTo的返回值为0 ?还是有相同的hashCode?本文还给出了在什么情况下使用什么样的Set的建议。
注:本文不涉及范型。
1、树形结构:
public interface Set extends Collection{}
public abstract class AbstractSet extends AbstractCollection implements Set{}
public class CopyOnWriteArraySetextends AbstractSetimplements Serializable{}
public abstract class EnumSet>extends AbstractSetimplements Cloneable, Serializable{}
public class HashSetextends AbstractSetimplements Set, Cloneable, Serializable{}
public final class JobStateReasonsextends HashSetimplements PrintJobAttribute{}
public class LinkedHashSetextends HashSetimplements Set, Cloneable, Serializable{}
public class TreeSetextends AbstractSetimplements SortedSet, Cloneable, Serializable{}
可以看出,可以实例化的类为:CopyOnWriteArraySet,HashSet,LinkedHashSet,TreeSet。
2、Set是如何实现元素唯一性的
javadoc中对Set的描述第一段如下:“A collection that contains no duplicate elements. More formally, sets contain no pair of elements e1 and e2 such that e1.equals(e2), and at most one null element. As implied by its name, this interface models the mathematical set abstraction.”
这段话是对是错,请看下面分析。
要进行下面的论述,我们先了解一下Map。Map中的元素是“键-值”对,其中“键”必须是唯一的。TreeSet和HashSet就是利用这个特性实现“no duplicate elements”。它把set中的元素作为Map中的“键”,从而保持元素的唯一性。这些键在Map中又是如何区分的呢?不同的Map有不同的做法,而且区别很大。
下面我们分别就TreeSet、HashSet和CopyOnWriteArraySet进行论述:
2.1、TreeSet部分:
以下以TreeSet为例进行分析。
请看TreeSet的部分实体:
public class TreeSet extends AbstractSet
implements SortedSet, Cloneable, java.io.Serializable
{
// The backing Map
private transient SortedMap m;
// The keySet view of the backing Map
private transient Set keySet;
// Dummy value to associate with an Object in the backing Map
//这是每个键所指的对像
private static final Object PRESENT = new Object();
//constructor
private TreeSet(SortedMap m) {
this.m = m;
keySet = m.keySet();
}
public TreeSet() {
this(new TreeMap());
}
//以下省略..........
}
可以看到TreeSet使用了SortedMap作为其Map保存“键-值”对,而这个SortedMap的真正实体是TreeMap。
请看示例程序1:
import java.util.*;
public class SetTest1 {
public static void main(String[] args){
Set set = new TreeSet();
set.add(new SetElement1("aa"));
set.add(new SetElement1("bb"));
}
static class SetElement1{
String s;
public SetElement1(String s){
this.s = s;
}
public String toString(){
return s;
}
public boolean equals(Object obj) {
return s.equals(((SetElement1)obj).s);
}
}
}
该程序能够正常编译,但是运行时会抛出异常java.lang.ClassCastException。为什么?
请看示例程序2:
import java.util.*;
public class SetTest2 {
public static void main(String[] args){
Set set = new TreeSet();
set.add(new SetElement2("aa"));
set.add(new SetElement2("aa"));
set.add(new SetElement2("bb"));
System.out.println(set);
}
static class SetElement2 implements Comparable{
String s;
public SetElement2(String s){
this.s = s;
}
public String toString(){
return s;
}
public int compareTo(Object o){
return s.compareTo(((SetElement2)o).s);
}
public boolean equals(Object obj) {
return s.equals(((SetElement2)obj).s);
}
}
}
运行结果:
[aa, bb]
这正是我们所期望的结果。那“示例程序1”和“示例程序2”有什么区别?
是因为SetElement2实现了Comparable接口,而SetElement1没有。SetElement2实现Comparable接口有什么用呢?因为在TreeSet的add方法中需要比较两个元素的“值”。请看TreeMap中的compare方法:
private int compare(K k1, K k2) {
return (comparator==null ? ((Comparable)k1).compareTo(k2) : comparator.compare((K)k1, (K)k2));
}
可见这个方法先把要比较的元素down cast成Comparable类型。这里就可以解释“示例程序1”中为什么会抛出异常java.lang.ClassCastException,因SetElement1没有实现Comparable接口,当然就不能down cast成Comparable。可见,要用TreeSet来做为你的Set,那么Set中所装的元素都必须实现了Comparable接口。
说到这里,你是不是想到了TreeSet中是采用Comparable接口中的compareTo方法来判断元素是否相同(duplicate),而不是采用其他类似equals之类的东东来判断。
请看示例程序3:
import java.util.Set;
import java.util.*;
public class SetTest3 {
public static void main(String[] args){
Set set = new HashSet();
set.add(new SetElement3("aa"));
set.add(new SetElement3("aa"));
set.add(new SetElement3("bb"));
System.out.println(set);
}
static class SetElement3 implements Comparable{
String s;
public SetElement3(String s){
this.s = s;
}
public String toString(){
return s;
}
public int compareTo(Object o){
//return s.compareTo(((SetElement3)o).s);
return -1;
}
public boolean equals(Object obj) {
return s.equals(((SetElement3)obj).s);
}
}
}
运行结果:
[bb, aa, aa]
看到没有,有两个“aa”!!这是因为compareTo返回值始终是"-1",也就是说“把任何元素都看成不同”。
综上所述,你是否对javadoc中对Set功能的描述有了怀疑?!
2.2、HashSet部分:
以下以HashSet为例进行分析。
从Hashset类的主体部分:
public class HashSet extends AbstractSet implements Set, Cloneable, java.io.Serializable
{
static final long serialVersionUID = -5024744406713321676L;
private transient HashMap map;
// Dummy value to associate with an Object in the backing Map
//这是每个键所指的对像
private static final Object PRESENT = new Object();
public HashSet() {
map = new HashMap();
}
public boolean add(E o) {
return map.put(o, PRESENT)==null;
}
//以下省略..........
}
public HashSet() {
map = new HashMap();
}
可以看到HashSet使用了HashMap作为其Map保存“键-值”对。
请看示例程序4:
import java.util.*;
public class SetTest4 {
public static void main(String[] args){
Set set = new HashSet();
set.add(new SetElement4("aa"));
set.add(new SetElement4("aa"));
set.add(new SetElement4("bb"));
System.out.println(set);
}
static class SetElement4{
String s;
public SetElement4(String s){
this.s = s;
}
public String toString(){
return s;
}
public boolean equals(Object obj) {
return s.equals(((SetElement4)obj).s);
}
}
}
运行结果:
[bb, aa, aa]
没有“示例程序1”中的java.lang.ClassCastException,但是运行结果似乎不对,因为有两个“aa”。
请看示例程序5:
import java.util.*;
public class SetTest5 {
public static void main(String[] args){
Set set = new HashSet();
set.add(new SetElement5("aa"));
set.add(new SetElement5("aa"));
set.add(new SetElement5("bb"));
System.out.println(set);
}
static class SetElement5{
String s;
public SetElement5(String s){
this.s = s;
}
public String toString(){
return s;
}
public boolean equals(Object obj) {
return s.equals(((SetElement5)obj).s);
}
public int hashCode() {
//return super.hashCode();
return s.hashCode();
}
}
}
运行结果:
[bb, aa]
这就对了。“示例程序4”和“示例程序5”有什么区别?是SetElement5重写了hashCode方法。
可见HashSet中是采用了比较元素hashCode & equals的方法来判断元素是否相同(duplicate),而不是采用其他类似equals之类的东东来判断。
说了这么多,那java类库中到底有没有根据equals来判断元素是否相同(duplicate)的Set呢?请看下文。
2.2、CopyOnWriteArraySet部分:
类CopyOnWriteArraySet是java.util.concurrent包中的一个类,所以它是线程安全的。
CopyOnWriteArraySet是使用CopyOnWriteArrayList作为其盛放元素的容器。当往CopyOnWriteArrayList添加新元素,它都要遍历整个List,并且用equals来比较两个元素是否相同。
请看示例程序6:
<!--
Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/
--> import java.util.*;
import java.util.concurrent.*;
public class SetTest6 {
public static void main(String[] args){
Set set = new CopyOnWriteArraySet();
set.add(new SetElement6("aa"));
set.add(new SetElement6("aa"));
set.add(new SetElement6("bb"));
System.out.println(set);
}
static class SetElement6{
String s;
public SetElement6(String s){
this.s = s;
}
public String toString(){
return s;
}
public boolean equals(Object obj) {
return s.equals(((SetElement6)obj).s);
}
}
}
运行结果:
[aa, bb]
好了,一切搞定!!
3、总结:
Javadoc中的一些描述可能是不准确的,大家要当心了!
Set中实现元素互异的各种方法差异很大,大致可以分为三种:使用equals,使用hashCode,使用compareTo。但是我还没有发现采用“判断地址空间是否相同”来判断元素是否相同的类,当然我们可以用现有的三种方法来实现“判断地址空间是否相同”。
综上所述,我们可以总结出使用Set的三种不同的情形:(以下假设元素类为Element)
A、如果想使用Element的equals方法来判断元素是否相同,那么可以使用CopyOnWriteArraySet来构造类的实体。
B、如果Element实现了Comparable接口,而且想使用compareTo方法来判断元素是否相同,那么可以使用TreeSet来构造类的实体。
C、如果想使用判断hashCode && equals是否相同的方法来判断元素是否相同,那么可以使用HashSet来构造类的实体。
相关推荐
### Java中Set和Get方法的理解 #### 一、引言 在Java编程中,`set`和`get`方法是非常常见的编程模式,特别是在面向对象编程(OOP)中。这两个方法通常用于封装类的属性,从而提供了对这些属性的访问和修改的方式。...
这也就意味着,在Set中,每个元素都是唯一的。 ### Set接口的关键特性 1. **不允许重复元素**:这是Set最显著的特点,它确保了集合中所有元素的唯一性。 2. **无序性**:大多数Set实现(如HashSet)不保证元素的...
#### 五、Set中“重复”的定义 对于`Set`来说,“重复”的定义取决于具体的实现方式: - 对于`HashSet`而言,如果两个元素具有相同的哈希码并且`equals`方法返回`true`,那么这两个元素被认为是重复的。 - 对于`...
// java中对象容器主要有Set,List和Map三个接口类。 // 迭代器(Iterator)模式,又叫做游标(Cursor)模式。 // GOF给出的定义为:提供一种方法访问一个容器(container)对象中的各个元素, // 而又不需暴露该...
HashSet集合保证元素一致性
在Java编程中,Set接口是集合框架的一部分,它继承自Collection接口,主要用于存储不包含重复元素的集合。Set接口的实现类主要有HashSet、TreeSet和LinkedHashSet,它们各自有不同的特性和使用场景。 1. **HashSet*...
在Java中,Set接口是集合框架的一部分,它代表了不包含重复元素的无序集合。本篇将深入探讨Java中Set接口及其相关的实现类,以及如何在实际编程中运用。 Set接口继承自Collection接口,其主要特性是元素的唯一性,...
它们将Set中的元素作为Map的键,因为Map的键是唯一的。 - 在`TreeSet`中,元素的比较是通过自然排序(Comparable)或比较器(Comparator)进行的,以决定元素的顺序和唯一性。 - `HashSet`中,元素的唯一性依赖于...
_java中Set与Map排序输出到Writer详解及实例_ Java中,Set和Map都是常用的集合类型,但是它们的输出顺序并不是按key的顺序排列的。这篇文章将介绍如何将Java中的Set和Map排序输出到Writer,并提供了相关的代码实现...
Java中Set&List的迭代器实现步骤解析 Java中Set和List的迭代器实现步骤解析是Java编程语言中一个重要的知识点。迭代器是一种设计模式,用于遍历集合中的元素。在Java中,Set和List是两种常用的集合类型,它们都可以...
内容概要:本文详细介绍了 Java 中 Set 接口及其三种典型实现——HashSet、TreeSet 和 LinkedHashSet 的基本用法与特性的对比。首先概述了 Set 接口中常见的操作,如增删查改及遍历,接着探讨了无序性、唯一性和可变...
在Java编程语言中,`IntSet`是一种特殊的集合类,专用于存储整数。它类似于标准的`java.util.Set`接口,但只处理基本类型`int`,而非包装类`Integer`。`IntSet`的设计目标是提高性能,因为与对象相比,基本类型的...
java set 去重
在Java编程中,遍历并删除集合(如List或Set)中的元素是一项常见的操作,但如果不正确地执行,可能会导致`ConcurrentModificationException`异常。这个异常通常在尝试修改正在迭代的集合时出现,因为Java的集合迭代...
标题“JAVA_SET_enviroment”暗示了我们讨论的主题与设置Java开发环境有关,特别是关于配置Java环境变量的步骤。在编程领域,尤其是Java开发中,正确地设置环境变量是至关重要的,因为它们指定了系统如何找到并执行...
js中终于有了自己的List,类似于java中的List对象,本文件是源码,亲测有如下方法:add()、has(key)、size()、values()、并集union(Set)、子集subset(Set)、差集difference(Set)、交集intersection(Set)、remove(key...
在Java编程语言中,数据结构的使用是至关重要的,其中包括List、Set和Array。这三种数据结构各有特点,适用于不同的场景。理解它们之间的相互转换能够帮助我们更好地管理和操作数据。以下将详细介绍Java中List、Set...
10.javaSet 接口及其实现类.zip10.javaSet 接口及其实现类.zip10.javaSet 接口及其实现类.zip10.javaSet 接口及其实现类.zip10.javaSet 接口及其实现类.zip10.javaSet 接口及其实现类.zip10.javaSet 接口及其实现类....
Java中的Set集合简单汇总解析 Set接口简介: Set接口是Java集合框架中的一个重要接口,它继承自Collection接口,并没有对Collection接口进行功能上的扩充。Set接口的主要特点是元素无序,并且都会以某种规则保证...