`
lihong11
  • 浏览: 456150 次
  • 性别: Icon_minigender_2
  • 来自: 湖南
社区版块
存档分类
最新评论

Java的序列化算法与分析

阅读更多
Java的序列化算法与分析

序列化算法一般会按步骤做如下事情:

◆将对象实例相关的类元数据输出。

◆递归地输出类的超类描述直到不再有超类。

◆类元数据完了以后,开始从最顶层的超类开始输出对象实例的实际数据值。

◆从上至下递归输出实例的数据

我们用另一个更完整覆盖所有可能出现的情况的例子来说明:

class parent implements Serializable {          int parentVersion = 10;   }       class contain implements Serializable{          int containVersion = 11;   }   public class SerialTest extends parent implements Serializable {          int version = 66;          contain con = new contain();              public int getVersion() {                 return version;          }          public static void main(String args[]) throws IOException {                 FileOutputStream fos = new FileOutputStream("temp.out");                 ObjectOutputStream oos = new ObjectOutputStream(fos);                 SerialTest st = new SerialTest();                 oos.writeObject(st);                 oos.flush();                 oos.close();          }   }
这个例子是相当的直白啦。SerialTest类实现了Parent超类,内部还持有一个Container对象。

序列化后的格式如下:

AC ED 00 05 73 72 00 0A 53 65 72 69 61 6C 54 65

73 74 05 52 81 5A AC 66 02 F6 02 00 02 49 00 07

76 65 72 73 69 6F 6E 4C 00 03 63 6F 6E 74 00 09

4C 63 6F 6E 74 61 69 6E 3B 78 72 00 06 70 61 72

65 6E 74 0E DB D2 BD 85 EE 63 7A 02 00 01 49 00

0D 70 61 72 65 6E 74 56 65 72 73 69 6F 6E 78 70

00 00 00 0A 00 00 00 42 73 72 00 07 63 6F 6E 74

61 69 6E FC BB E6 0E FB CB 60 C7 02 00 01 49 00

0E 63 6F 6E 74 61 69 6E 56 65 72 73 69 6F 6E 78

70 00 00 00 0B

我们来仔细看看这些字节都代表了啥。开头部分,见颜色:

AC ED: STREAM_MAGIC. 声明使用了序列化协议.
00 05: STREAM_VERSION. 序列化协议版本.
0x73: TC_OBJECT. 声明这是一个新的对象. 
序列化算法的第一步就是输出对象相关类的描述。例子所示对象为SerialTest类实例,因此接下来输出SerialTest类的描述。见颜色:

0x72: TC_CLASSDESC. 声明这里开始一个新Class。
00 0A: Class名字的长度.
53 65 72 69 61 6c 54 65 73 74: SerialTest,Class类名.
05 52 81 5A AC 66 02 F6: SerialVersionUID, 序列化ID,如果没有指定,则会由算法随机生成一个8byte的ID.
0x02: 标记号. 该值声明该对象支持序列化。
00 02: 该类所包含的域个数。
接下来,算法输出其中的一个域,int version=66;见颜色:

0x49: 域类型. 49 代表"I", 也就是Int.
00 07: 域名字的长度.
76 65 72 73 69 6F 6E: version,域名字描述.
然后,算法输出下一个域,contain con = new contain();这个有点特殊,是个对象。描述对象类型引用时需要使用JVM的标准对象签名表示法,见颜色:

0x4C: 域的类型.
00 03: 域名字长度.
63 6F 6E: 域名字描述,con
0x74: TC_STRING. 代表一个new String.用String来引用对象。
00 09: 该String长度.
4C 63 6F 6E 74 61 69 6E 3B: Lcontain;, JVM的标准对象签名表示法.
0x78: TC_ENDBLOCKDATA,对象数据块结束的标志
.接下来算法就会输出超类也就是Parent类描述了,见颜色:

0x72: TC_CLASSDESC. 声明这个是个新类.
00 06: 类名长度.
70 61 72 65 6E 74: parent,类名描述。
0E DB D2 BD 85 EE 63 7A: SerialVersionUID, 序列化ID.
0x02: 标记号. 该值声明该对象支持序列化.
00 01: 类中域的个数.
下一步,输出parent类的域描述,int parentVersion=100;同见颜色:

0x49: 域类型. 49 代表"I", 也就是Int.
00 0D: 域名字长度.
70 61 72 65 6E 74 56 65 72 73 69 6F 6E: parentVersion,域名字描述。
0x78: TC_ENDBLOCKDATA,对象块结束的标志。
0x70: TC_NULL, 说明没有其他超类的标志。.
到此为止,算法已经对所有的类的描述都做了输出。下一步就是把实例对象的实际值输出了。这时候是从parent Class的域开始的,见颜色:

00 00 00 0A: 10, parentVersion域的值.
还有SerialTest类的域:

00 00 00 42: 66, version域的值.
再往后的bytes比较有意思,算法需要描述contain类的信息,要记住,现在还没有对contain类进行过描述,见颜色:

0x73: TC_OBJECT, 声明这是一个新的对象.
0x72: TC_CLASSDESC声明这里开始一个新Class.
00 07: 类名的长度.
63 6F 6E 74 61 69 6E: contain,类名描述.
FC BB E6 0E FB CB 60 C7: SerialVersionUID, 序列化ID.
0x02: Various flags. 标记号. 该值声明该对象支持序列化
00 01: 类内的域个数。
.输出contain的唯一的域描述,int containVersion=11;

0x49: 域类型. 49 代表"I", 也就是Int..
00 0E: 域名字长度.
63 6F 6E 74 61 69 6E 56 65 72 73 69 6F 6E: containVersion, 域名字描述.
0x78: TC_ENDBLOCKDATA对象块结束的标志.
这时,序列化算法会检查contain是否有超类,如果有的话会接着输出。

0x70:TC_NULL,没有超类了。
最后,将contain类实际域值输出。

00 00 00 0B: 11, containVersion的值.
OK,我们讨论了java序列化的机制和原理,希望能对同学们有所帮助。

分享到:
评论

相关推荐

    java序列化原理与算法

    #### Java序列化算法透析 Java序列化的核心是将对象转换为字节流,这涉及到一系列复杂的操作步骤。 ##### 序列化算法示例 为了更好地理解序列化的过程,我们可以通过一个简单的例子来进行说明。 ```java import ...

    Protocol Buffer序列化对比Java序列化.

    - Protocol Buffer:PB在序列化和反序列化时通常比Java序列化更快,因为它的数据格式更加紧凑,且解析算法优化。 - Java序列化:Java序列化虽然方便,但生成的数据量较大,且序列化和反序列化速度相对较慢。 2. ...

    json序列化与反序列化处理代码(java版本)

    极好的序列化与发序列化代码。可以处理array集合,数组或者单个对象等的序列化与反序列化。

    Java序列化的机制和原理

    Java序列化是Java平台提供的一种将对象转换为字节流,以便存储、在网络上传输或者在后续时间重新创建相同对象的机制。这是Java编程中一个非常重要的概念,尤其是在分布式环境和持久化存储中。让我们深入探讨一下Java...

    FST:快速Java序列化的替代品

    1. **高性能**:FST通过优化的序列化算法和字节码处理,实现了比Java默认序列化快几倍的速度。这在处理大量数据或者高并发场景下,能显著提升系统性能。 2. **小内存开销**:FST在序列化过程中能够减少无用的元数据...

    时间序列算法java实现

    时间序列算法是统计学和数据分析领域中的一个重要概念,尤其在预测和建模中扮演着关键角色。Java作为一种广泛使用的编程语言,提供了丰富的库和工具来实现时间序列算法。本篇文章将深入探讨时间序列预测的基本原理,...

    论文研究-一个基于JSON的对象序列化算法.pdf

    提出了一种基于JSON的对象序列化算法,该算法通过分析JSON文法并建立对象导航图,透明地将Java对象序列化成JSON表达式,使客户端能够很好地利用JavaScript引擎来解析JSON响应,有效地解决了解析XML所造成的缺陷。

    Java SE编程入门教程 java序列化(共14页).pptx

    Java SE编程入门教程 java序列化(共14页).pptx Java SE编程入门教程 java异常(共57页).pptx Java SE编程入门教程 java正则(共8页).pptx Java SE编程入门教程 properties(共3页).pptx Java SE编程入门教程 ...

    加快Java的文件序列化速度

    - 序列化后,可以使用GZip或LZ4等压缩算法压缩字节流,减小存储空间,同时可能提高序列化速度。 8. **选择合适的序列化格式**: - JSON、XML等文本格式的序列化速度较慢,而二进制格式(如protobuf、msgpack)...

    Java反序列化实战.pdf

    ### Java反序列化实战知识点详解 #### 一、反序列化概述 - **定义**:在计算机科学领域,反序列化是指将字节流或文本流等数据转换回其原始对象结构的过程。这一过程通常与序列化相对应,序列化是将对象的状态转化...

    Java 序列化的秘密(高清PDF中文版)

    ### Java序列化的秘密 #### 为什么需要序列化 在探讨序列化之前,我们需要理解序列化产生的背景及其必要性。简而言之,Java程序本质上是由进程和内存构成的系统,在这个系统中,进程根据定义好的类生成一系列实例...

    一个基于JSON的对象序列化算法

    ### 基于JSON的对象序列化算法 #### 摘要 随着Web应用程序系统的不断发展,XML作为数据交换格式被广泛采用,特别是在基于Ajax(异步JavaScript和XML)的技术框架下。然而,作为一种结构化的文档,XML在服务器端与...

    java遗传算法寻找最优路径

    ### Java遗传算法寻找最优路径 #### 一、遗传算法概览 ...综上所述,这段Java代码通过遗传算法成功地实现了寻找最优路径的目标,通过对代码的具体分析我们可以更加深入地理解遗传算法的基本思想及其实现细节。

    JAVA图形化界面银行家算法

    【JAVA图形化界面银行家算法】是一个利用NETBEANS开发平台构建的应用程序,它直观地展示了操作系统中的银行家算法。银行家算法是为避免系统出现死锁而设计的一种策略,尤其在多进程环境下,资源分配的安全性至关重要...

    学生管理系统(序列化和反序列化)

    优化序列化算法和存储格式,比如使用高效的序列化库,可以提高系统的性能。 6. **安全性**:序列化也带来了一些安全风险,因为任何能够访问序列化文件的人都可能试图反序列化并篡改数据。在实际应用中,应确保对...

    JAVA序列化和反序列化的底层实现原理解析

    这就需要Java序列化与反序列化了! 序列化的好处有两个:一是实现了数据的持久化,通过序列化可以把数据永久地保存到硬盘上(通常存放在文件里);二是,利用序列化实现远程通信,即在网络上传送对象的字节序列。总...

    算法分析Java代码

    本资源“算法分析Java代码”是一个针对算法学习者的宝贵资料,它提供了多种算法的Java实现,包括动态规划、回溯法和分支限界法。这些方法是计算机科学中的重要工具,广泛应用于优化问题、搜索问题以及复杂问题的求解...

    Java序列化的机制和原理[归类].pdf

    Java序列化是Java平台提供的一种将对象转换为字节流,以便存储、网络传输或持久化数据的标准机制。它在Java开发中起着至关重要的作用,特别是在分布式系统和跨进程通信中,因为对象需要在网络之间传输。以下是关于...

    数据结构与算法分析(java版内含源代码)

    本书《数据结构与算法分析(Java版)》深入探讨了这一领域,为读者提供了丰富的理论知识和实践代码,是学习和提升这方面技能的重要资源。 在数据结构方面,书中可能涵盖了以下知识点: 1. 基本数据结构:如数组、...

Global site tag (gtag.js) - Google Analytics