`
qindongliang1922
  • 浏览: 2188691 次
  • 性别: Icon_minigender_1
  • 来自: 北京
博客专栏
7265517b-f87e-3137-b62c-5c6e30e26109
证道Lucene4
浏览量:117664
097be4a0-491e-39c0-89ff-3456fadf8262
证道Hadoop
浏览量:126072
41c37529-f6d8-32e4-8563-3b42b2712a50
证道shell编程
浏览量:60032
43832365-bc15-3f5d-b3cd-c9161722a70c
ELK修真
浏览量:71400
社区版块
存档分类
最新评论

理解Java集合框架里面的的transient关键字

    博客分类:
  • JAVA
 
阅读更多

在分析HashMap和ArrayList的源码时,我们会发现里面存储数据的数组都是用transient关键字修饰的,如下:

HashMap里面的:

````
 transient Node<K,V>[] table;
````


ArrayList里面的:
````
 transient Object[] elementData
````


既然用transient修饰,那就说明这个数组是不会被序列化的,那么同时我们发现了这两个集合都自定义了独自的序列化方式:

先看HashMap自定义的序列化的代码:
````
//1
    private void writeObject(java.io.ObjectOutputStream s)
        throws IOException {
        int buckets = capacity();
        // Write out the threshold, loadfactor, and any hidden stuff
        s.defaultWriteObject();
        s.writeInt(buckets);
        s.writeInt(size);
        internalWriteEntries(s);
    }
//2    
 public void internalWriteEntries(java.io.ObjectOutputStream s) throws IOException {
        Node<K,V>[] tab;
        if (size > 0 && (tab = table) != null) {
            for (int i = 0; i < tab.length; ++i) {
                for (Node<K,V> e = tab[i]; e != null; e = e.next) {
                    s.writeObject(e.key);
                    s.writeObject(e.value);
                }
            }
        }
    } 
    
````
再看HashMap自定义的反序列化的代码:
````
//1
   private void readObject(java.io.ObjectInputStream s)
        throws IOException, ClassNotFoundException {
        // Read in the threshold (ignored), loadfactor, and any hidden stuff
        s.defaultReadObject();
        reinitialize();
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new InvalidObjectException("Illegal load factor: " +
                                             loadFactor);
        s.readInt();                // Read and ignore number of buckets
        int mappings = s.readInt(); // Read number of mappings (size)
        if (mappings < 0)
            throw new InvalidObjectException("Illegal mappings count: " +
                                             mappings);
        else if (mappings > 0) { // (if zero, use defaults)
            // Size the table using given load factor only if within
            // range of 0.25...4.0
            float lf = Math.min(Math.max(0.25f, loadFactor), 4.0f);
            float fc = (float)mappings / lf + 1.0f;
            int cap = ((fc < DEFAULT_INITIAL_CAPACITY) ?
                       DEFAULT_INITIAL_CAPACITY :
                       (fc >= MAXIMUM_CAPACITY) ?
                       MAXIMUM_CAPACITY :
                       tableSizeFor((int)fc));
            float ft = (float)cap * lf;
            threshold = ((cap < MAXIMUM_CAPACITY && ft < MAXIMUM_CAPACITY) ?
                         (int)ft : Integer.MAX_VALUE);
            @SuppressWarnings({"rawtypes","unchecked"})
                Node<K,V>[] tab = (Node<K,V>[])new Node[cap];
            table = tab;

            // Read the keys and values, and put the mappings in the HashMap
            for (int i = 0; i < mappings; i++) {
                @SuppressWarnings("unchecked")
                    K key = (K) s.readObject();
                @SuppressWarnings("unchecked")
                    V value = (V) s.readObject();
                putVal(hash(key), key, value, false, false);
            }
        }
    }
    
    
    
````


这里面我们看到HashMap的源码里面自定义了序列化和反序列化的方法,序列化方法主要是把当前HashMap的buckets数量,size和里面的k,v对一一给写到了对象输出流里面,然后在反序列化的时候,再从流里面一一的解析出来,然后又重新恢复出了HashMap的整个数据结构。


接着我们看ArrayList里面自定义的序列化的实现:

````
    private void writeObject(java.io.ObjectOutputStream s)
        throws java.io.IOException{
        // Write out element count, and any hidden stuff
        int expectedModCount = modCount;
        s.defaultWriteObject();

        // Write out size as capacity for behavioural compatibility with clone()
        s.writeInt(size);

        // Write out all elements in the proper order.
        for (int i=0; i<size; i++) {
            s.writeObject(elementData[i]);
        }

        if (modCount != expectedModCount) {
            throw new ConcurrentModificationException();
        }
    }
    
````
然后反序列化的实现:

````
        private void readObject(java.io.ObjectInputStream s)
        throws java.io.IOException, ClassNotFoundException {
        elementData = EMPTY_ELEMENTDATA;

        // Read in size, and any hidden stuff
        s.defaultReadObject();

        // Read in capacity
        s.readInt(); // ignored

        if (size > 0) {
            // be like clone(), allocate array based upon size not capacity
            ensureCapacityInternal(size);

            Object[] a = elementData;
            // Read in all elements in the proper order.
            for (int i=0; i<size; i++) {
                a[i] = s.readObject();
            }
        }
    }
````


ArrayList里面也是把其size和里面不为null的数据给写到流里面,然后在反序列化的时候重新使用数据把数据结构恢复出来。



那么问题来了,为什么他们明明都实现了Serializable接口,已经具备了自动序列化的功能,为啥还要重新实现序列化和反序列化的方法呢?



(1)HashMap中实现序列化和反序列化的原因:


在HashMap要定义自己的序列化和反序列化实现,有一个重要的因素是因为hashCode方法是用native修饰符修饰的,也就是用它跟jvm的运行环境有关,Object类中的hashCode源码如下:
````
 public native int hashCode();

````


也就是说不同的jvm虚拟机对于同一个key产生的hashCode可能是不一样的,所以数据的内存分布可能不相等了,举个例子,现在有两个jvm虚拟机分别是A和B,他们对同一个字符串x产生的hashCode不一样:

所以导致:

在A的jvm中它的通过hashCode计算它在table数组中的位置是3

在B的jvm中它的通过hashCode计算它在table数组中的位置是5

这个时候如果我们在A的jvm中按照默认的序列化方式,那么位置属性3就会被写入到字节流里面,然后通过B的jvm来反序列化,同样会把这条数据放在table数组中3的位置,然后我们在B的jvm中get数据,由于它对key的hashCode和A不一样,所以它会从5的位置取值,这样以来就会读取不到数据。



如何解决这个问题,首先导致上面问题的主要原因在于因为hashCode的不一样从而可能导致内存分布不一样,所以只要在序列化的时候把跟hashCode有关的因素比如上面的位置属性给排除掉,就可以解决这个问题。

最简单的办法就是在A的jvm把数据给序列化进字节流,而不是一刀切把数组给序列化,之后在B的jvm中反序列化时根据数据重新生成table的内存分布,这样就来就完美解决了这个问题。



(2)ArrayList中实现序列化和反序列化的原因:

在ArrayList中,我们知道数组的长度会随着数据的插入而不断的动态扩容,每次扩容都需要增加原数组一半的长度,这而一半的长度极端情况下都是null值,所以在序列化的时候可以把这部分数据排除出去,从而节省时间和空间:
````
     for (int i=0; i<size; i++) {
            s.writeObject(elementData[i]);
        }
````

注意ArrayList在序列化的时候用的size来遍历原数组中的元素,而并不是elementData.length也就是数组的长度,而size的大小就是数组里面非null元素的个数,所以这里才采用了自定义序列化的方式。


到这里细心的朋友可能有个疑问:HashMap中也就是采用的动态数组扩容为什么它在序列化的时候用的是table.length而不是size呢,这其实很容易回答在HashMap中table.length必须是2的n次方,而且这个值会决定了好几个参数的值,所以如果也把null值给去掉,那么必须要重新的估算table.length的值,有可能造成所有数据的重新分布,所以最好的办法就是保持原样。

注意上面的null值,指的是table里面Node元素是null,而并不是HashMap里面的key等于null,而key是Node里面的一个字段。



总结:


本文主要介绍了在HashMap和ArrayList中其核心的数据结构字段为什么用transient修饰并分别介绍了其原因,所以使用序列化时,应该谨记effective java中的一句话:当一个对象的物理表示方法与它的逻辑数据内容有实质性差别时,使用默认序列化形式有N种缺陷,所以应该尽可能的根据实际情况重写序列化方法。

有什么问题可以扫码关注微信公众号:我是攻城师(woshigcs),在后台留言咨询。 技术债不能欠,健康债更不能欠, 求道之路,与君同行。






0
0
分享到:
评论

相关推荐

    java关键字,适合新手的ppt

    Java是一种广泛使用的面向对象的编程语言,其设计目标是具有高度...理解并熟练运用这些关键字将有助于构建正确的程序逻辑,并为后续深入学习Java的面向对象特性、异常处理、多线程、集合框架等高级主题奠定坚实的基础。

    2021年Java题库选择题汇总.doc

    本资源摘要信息涵盖了 Java 编程语言的多个方面,涵盖了集合框架、Graphic 绘图、基本数据类型、多线程编程、文件输入/输出、swing 组件等多个领域,旨在帮助开发者更好地理解和掌握 Java 编程语言。

    Java基础教程完整版

    本章节主要讲解Java集合框架的上半部分,包括集合框架的概述、Collection接口、List接口、Set接口、Map接口等。 Java学习系列(八):Java面向对象之集合框架详解(下) 本章节主要讲解Java集合框架的下半部分,...

    Java面试小抄第一版 By 库森.pdf

    Java集合框架: 23. List和List区别:前者是T的子类型的集合,后者是T的父类型的集合。 Java异常处理: 24. Error和Exception的区别:Error表示严重错误,Exception表示可恢复的异常。 25. 受检查异常和非受检查...

    JAVA面试题(多个公司).pdf

    - `ArrayList`、`List` 是Java集合框架的一部分,用于存储列表数据。 14. Java图形界面绘制: - `Graphics` 和 `Graphics2D` 是用于图形绘制的类。 15. Java文件操作: - 展示了如何读取文件内容。 16. Java...

    Java高级资深核心知识全面解析.pdf

    Java作为一门广泛使用的编程语言,其高级...Java序列化中,可以通过transient关键字排除字段。 总之,Java高级资深核心知识全面解析涵盖了从基础到高级的各个层面,是Java开发者提升技能和准备面试的重要参考资料。

    ArrayList的底层原理Java系列2021.pdf

    ArrayList作为Java中最为常用的集合之一,其设计和实现体现了Java集合框架的灵活性和效率。然而,开发者在使用ArrayList时需要格外注意其线程安全问题,尤其是在多线程环境下,必须采取措施来保证数据的一致性和安全...

    effectice java第二版

    9. **序列化**:介绍了如何使类支持序列化,理解transient关键字的作用,以及如何实现自己的序列化版本ID。 10. **代码优化**:探讨了性能优化的策略,如避免过度优化,理解对象创建和垃圾收集的过程,以及使用...

    Java核心技术 卷II 高级特性 第9版(英文)

    本书全面覆盖了Java平台的高级特性,包括多线程、网络编程、高级I/O、反射、序列化、安全、JVM内部以及Java集合框架等核心内容。 1. **多线程**:Java提供了丰富的多线程支持,包括Thread类和Runnable接口,以及...

    2021年Java大厂面试题整理大全

    三、集合框架 1. List、Set、Queue:理解这些接口的特性,以及ArrayList、LinkedList、HashSet、LinkedHashSet、PriorityQueue等实现类的内部工作原理。 2. Map接口:了解HashMap、TreeMap、LinkedHashMap的区别,...

    java面试宝典4

    在Java集合框架中,如果要实现对象的比较,通常有两种方式: - 实现`Comparable`接口:这是对象自身定义比较逻辑的方式,比如`String`类就实现了这个接口,可以比较字符串的自然顺序。 - 实现`Comparator`接口:...

    java_性能调优.pdf

    在《java_性能调优.pdf》这份文档中,我们可以提取出一系列关于Java性能调优的知识点,包括但不限于Java语言基础、集合框架、异常处理、设计模式、JDBC使用、I/O操作、多线程编程、JVM内存管理、JSP和Servlet等。...

    Java_英文面试题_经典

    Collection API是Java集合框架的一部分,它是一组类和接口,用于操作对象集合。相比于传统的Vector、Array和Hashtable,Collection API更灵活、功能更强且更规范。主要的类包括HashSet、HashMap、ArrayList、...

    java提高篇(二一)-----ArrayList.pdf

    在了解和使用ArrayList之前,应当熟悉Java集合框架的基础知识,以及数组的动态增长机制。 知识点一:ArrayList的定义和基本特性 ArrayList是一个可以动态增长和缩减的数组实现。它允许所有的元素,包括null。...

    30道英文Java面试题附英文答案(1-15)

    答:Java集合框架是一个接口和类的集合,提供了一种组织和管理对象的统一方式。主要组件包括接口(如List、Set和Map)和实现这些接口的类(如ArrayList、HashSet和HashMap)。它还包括工具类(如Collections和...

    java笔试及答案1111111

    9. **动态数组**:ArrayList是Java集合框架中的动态数组,可以在程序运行时调整大小。 10. **GUI组件**:在Java图形用户界面编程中,Label通常用于显示不可修改的文本信息,而Button用于交互操作,TextArea用于显示...

    经典的java面试题

    3. **Java标准库**:Java的标准库包括多个包,如`java.lang`(基础类库,如`String`和`System`)、`java.util`(提供集合框架、日期和时间设施等)、`java.io`(输入/输出功能)、`java.sql`(数据库连接)、`java....

    程序员面试秘籍【Java基础细节】

    【Java基础细节】是程序员面试过程中至关重要的一部分,涵盖了语言特性、数据结构、算法、集合框架、多线程、网络编程等多个领域。以下是一些关键的知识点: 1. **Java语言特性**:理解基本语法,包括类、对象、...

    java面试题大全

    以上只是Java面试中的一部分常见问题和知识点,面试通常还会涉及异常处理、集合框架、IO流、设计模式、JVM内存模型、并发控制(synchronized、Lock等)、Spring框架、数据库操作、性能优化等多个方面。理解并掌握...

Global site tag (gtag.js) - Google Analytics