自从第一个Java版本开始,很多开发人员一直都在尝试让Java获得最少和C/C++一样的表现。JVM提供商尽他们最大的努力去实现一些新的JIT算法,但是还是有很多需要做的,特别是在我们使用Java的方法上。
例如,在对象<->文件序列化上就差距很大--尤其在读写内存对象上。我将就这个主题做一些解释和分享。
所有的测试都是在下面这个对象上执行的:
1
|
public
class
TestObject
implements
Serializable {
|
3
|
private
long
longVariable;
|
4
|
private
long
[] longArray;
|
5
|
private
String stringObject;
|
6
|
private
String secondStringObject;
|
为了简单起见,我将只贴出写入方法(尽管读取类似),完整的源码在我的GitHub上可以找到(http://github.com/jkubrynski/serialization-tests
)
最标准的java序列化(我们都是从这里学起的)是这样的:
01
|
public
void
testWriteBuffered(TestObject test, String fileName)
throws
IOException {
|
02
|
ObjectOutputStream objectOutputStream =
null
;
|
04
|
FileOutputStream fos =
new
FileOutputStream(fileName);
|
05
|
BufferedOutputStream bos =
new
BufferedOutputStream(fos);
|
06
|
objectOutputStream =
new
ObjectOutputStream(bos);
|
07
|
objectOutputStream.writeObject(test);
|
09
|
if
(objectOutputStream !=
null
) {
|
10
|
objectOutputStream.close();
|
提升标准序列化速度的最简单方法时使用RandomAccessFile对象:
01
|
public
void
testWriteBuffered(TestObject test, String fileName)
throws
IOException {
|
02
|
ObjectOutputStream objectOutputStream =
null
;
|
04
|
RandomAccessFile raf =
new
RandomAccessFile(fileName,
"rw"
);
|
05
|
FileOutputStream fos =
new
FileOutputStream(raf.getFD());
|
06
|
objectOutputStream =
new
ObjectOutputStream(fos);
|
07
|
objectOutputStream.writeObject(test);
|
09
|
if
(objectOutputStream !=
null
) {
|
10
|
objectOutputStream.close();
|
更高深点的技术是使用Kryo
框架,新旧版本的差距是很大的,我做过测试。因为性能比较上并没有体现出特别引人注意的差异,所以我将使用2.x版本,因为它对用户更友好而且更快些。
01
|
private
static
Kryo kryo =
new
Kryo();
|
03
|
public
void
testWriteBuffered(TestObject test, String fileName)
throws
IOException {
|
04
|
Output output =
null
;
|
06
|
RandomAccessFile raf =
new
RandomAccessFile(fileName,
"rw"
);
|
07
|
output =
new
Output(
new
FileOutputStream(raf.getFD()), MAX_BUFFER_SIZE);
|
08
|
kryo.writeObject(output, test);
|
10
|
if
(output !=
null
) {
|
最后一个方案是在Martin Thompson的文章中提到的(Native C/C++ Like Performance For Java Object Serialisation
),介绍了怎样在Java中像C++那样和内存打交道。
01
|
public
void
testWriteBuffered(TestObject test, String fileName)
throws
IOException {
|
02
|
RandomAccessFile raf =
null
;
|
04
|
MemoryBuffer memoryBuffer =
new
MemoryBuffer(MAX_BUFFER_SIZE);
|
05
|
raf =
new
RandomAccessFile(fileName,
"rw"
);
|
06
|
test.write(memoryBuffer);
|
07
|
raf.write(memoryBuffer.getBuffer());
|
08
|
}
catch
(IOException e) {
|
TestObject写入方法如下:
01
|
public
void
write(MemoryBuffer unsafeBuffer) {
|
02
|
unsafeBuffer.putLong(longVariable);
|
03
|
unsafeBuffer.putLongArray(longArray);
|
05
|
boolean
objectExists = stringObject !=
null
;
|
06
|
unsafeBuffer.putBoolean(objectExists);
|
08
|
unsafeBuffer.putCharArray(stringObject.toCharArray());
|
10
|
objectExists = secondStringObject !=
null
;
|
11
|
unsafeBuffer.putBoolean(objectExists);
|
13
|
unsafeBuffer.putCharArray(secondStringObject.toCharArray());
|
直接内存缓冲区类(已简化了的,仅仅为了展示这个思想)
01
|
public
class
MemoryBuffer {
|
03
|
public
static
final
Unsafe unsafe = UnsafeUtil.getUnsafe();
|
05
|
private
final
byte
[] buffer;
|
07
|
private
static
final
long
byteArrayOffset = unsafe.arrayBaseOffset(
byte
[].
class
);
|
08
|
private
static
final
long
longArrayOffset = unsafe.arrayBaseOffset(
long
[].
class
);
|
几个小时的Caliper
测试结果如下:
|
Full trip [ns] |
Standard deviation [ns] |
Standard |
207307 |
2362 |
Standard on RAF |
42661 |
733 |
KRYO 1.x |
12027 |
112 |
KRYO 2.x |
11479 |
259 |
Unsafe |
8554 |
91 |
在最后我们可以得出一些结论:
- Unsafe序列化比标准的java.io.Serizlizable快了23倍
- 使用RandomAccessFile可以使标准的有缓冲序列化加速将近4倍
- Kryo-dynamic序列化大约比手写实现的直接缓冲满了35%
最后,就像我们看到的那样,还是没有绝对的答案。对于我们中的大多数人来说,获得3000ns(0.003ms)的速度提升是不值得为每个需要序列化的对象来写单独实现的。在标准的方案中,我们大多数选择Kryo
。然而,在惜时如金的低延时系统中,这个选择将会是完全不同的。
分享到:
相关推荐
自从第一个Java版本开始,很多开发人员一直都在尝试让Java获得最少和C/C++一样的表 现。JVM提供商尽他们最大的努力去实现一些新的JIT算法,但是还是有很多需要做的,特别 是在我们使用Java的方法上。
其中,Java源文件构成了框架的核心逻辑部分,而XML和JSON文件可能被用来配置序列化规则和反序列化策略。Git忽略文件对于版本控制来说是必不可少的,它能够确保项目在使用Git作为版本控制系统时,一些不必要跟踪的...
它们允许序列化和反序列化Java对象,使得对象能在网络间传输。 5. **NIO(New Input/Output)**: Java NIO(非阻塞I/O)提供了一种新的方式来处理I/O操作,尤其是对于高并发的网络应用。它使用Channel和Selector...
在大数据处理场景中,Hadoop序列化是一个重要的技术,它关系到数据在网络中传输、以及在Hadoop文件系统中存储时的效率和性能。序列化是指把对象转换为字节流的过程,反序列化则是将字节流恢复成对象的过程。Hadoop...
YAML配置文件则提供了一种更为简洁的数据序列化格式,便于配置数据的阅读和维护。HTML页面和JavaScript文件共同构成了用户交互的前端界面,使得用户可以方便地管理和操作文件传输任务。 此外,该项目还包含了一个...
在当今数据爆炸的时代,高效的文件压缩技术对于节约存储空间、加快数据传输速度都至关重要。基于Java语言的Huffman文件编解码与可视化树设计源码,不仅仅是一个软件开发项目,更是一个教育工具和技术创新的体现,它...
MessagePack就是一种高效、跨语言的数据序列化库,它专为速度和效率而设计,特别适合处理大数据量的场景。 **MessagePack简介** MessagePack是一种轻量级的二进制序列化格式,它的目标是比JSON更快、更小。在保持...
该框架在技术栈上集成了Spring、ShardingSphere、MyBatis以及Redis,并通过创新性地将对象序列化并异步存储到队列中,实现了对游戏分布式存储的优化。 首先,Spring作为一个成熟的Java应用框架,其提供的轻量级和...
protoc jar文件用于编译.proto文件,将定义的协议消息类型转换为Java类,而Java运行时库则是在应用程序中处理序列化和反序列化的必要依赖。 在Android开发中,protobuf被广泛应用于服务器与客户端之间的数据交换,...
SER序列化文件用于Java对象的序列化和反序列化操作,保证了数据持久化的需要。Java源文件则是SDK功能实现的核心,包含了所有必要的Java类和接口定义,是开发者关注的重点。 整体来看,文档不仅是关于代码的简单说明...
这些文件共同构成了一个基础模块,它能够支持Spring容器初始化、配置文件读取、分页处理、Protobuf序列化、反射操作等关键功能。 Spring容器初始化是Java企业级开发中的一个重要环节,它负责创建和管理应用中的对象...
3. **FastJson**:FastJson是阿里巴巴开源的一款高性能的JSON库,用于JSON的序列化和反序列化。在爬虫项目中,FastJson可以帮助将抓取到的JSON格式数据快速转换为Java对象,便于存储和后续处理。同时,它也能将Java...
属性文件和SER文件则通常包含项目配置信息和序列化数据。 TJFramework的设计理念是通过提供一套可复用的模板和库,减少开发中常见任务的代码编写量,从而加快开发速度。同时,由于框架是基于Java核心,它自然地继承...
Git忽略文件则是版本控制中定义不纳入版本管理的文件列表,而YAML配置文件则用于简化数据序列化过程,JAR库文件则包含了Java程序运行所需的一些库。 Java源文件主要负责后端逻辑的实现,包括但不限于数据库的连接、...
- 序列化:默认情况下,spymemcached使用Java序列化。但你可以自定义序列化策略,比如使用Gson或Jackson库进行JSON序列化,以提高性能和可读性。 - 批量操作:支持批量设置、获取和删除键值对,减少网络往返次数,...
而15个FLAT文件则可能负责项目中的数据存储或者通信协议,FLAT是一种数据序列化协议,用于优化数据交换格式。XML配置文件在软件开发中通常用于定义配置参数,这里应该是为了定制kcg生成代码的灵活配置,以便适应不同...
- 使用Java的`ObjectOutputStream`和`ObjectInputStream`类可以序列化和反序列化对象,将棋盘状态保存到文件中,然后在需要时读取。保存时,将棋盘、棋子、玩家等核心对象写入文件;加载时,从文件读取这些信息恢复...
这些Java文件覆盖了网站的各个业务模块,例如用户注册登录、商品浏览、购物车管理、订单处理等,这些模块共同构成了一个完整的在线购物体验。用户可以通过网站轻松地浏览商品、将商品加入购物车、进行结算以及查看...
Java的序列化、Base64编码或自定义的打包格式都可以用于此目的。 5. **异常处理**:在文件传输过程中可能出现各种错误,如网络中断、文件不存在等,因此需要适当的异常处理机制。 6. **状态同步**:多线程环境下,...