`
sbpya
  • 浏览: 615615 次
  • 性别: Icon_minigender_1
  • 来自: 杭州,长沙
社区版块
存档分类
最新评论

程序员必读--关于Java占用内存的研究

    博客分类:
  • Java
阅读更多
最近对程序占用内存方面做了一些优化,取得了不错的效果,总结了一些经验
简要说一下,相信会对大家写出优质的程序有所帮助
下面的论述针对32位系统,对64位系统不适用,后叙

经常你写了一个程序,一测试,功能没问题,一看内存占用也不多,就不去考虑其它的东西了。但可能程序使用了一个什么数据结构,会当数据规模变大时,内存占用激增。

基本&&关键的问题是,Java里各种东东占多少内存?????????

对于primitive类型,有8个
byte short int long float double char boolean 它们的长度分别是
1 2 4 8 4 8 2 1
这个不罗嗦了,举例来说
long[] data=new long[1000];
占用内存 8*1000 bytes
此外,data本身是一个Object,也占用内存若干,后叙,当然它针对 8*1000来说,忽略不计

再说Object的占用,在说这个之前,先说说引用,一惯的说法是
Java里没有指针了,只有引用,引用是安全的

这个说法没错,但是从机理上来说,引用就是指针,只是jvm对指针的使用检查和限制很多,这个引用/指针变得很安全

直接来结论:一个引用占4byte ,在32位系统上

Object obj=null; //4byte
Object[] objs=new Object[1000]; //至少4*1000byte

你看我定义了一个 obj,还是null,就占4byte
定义了一个 objs,1000个元素,但都是null啊,就都每个占4byte
是的!!!!!
虽然obj==null,但它已经是 一个引用,或者说一个指针了
指针也要占地方啊!!!!啊!!!!啊!!!!
接下来,直接给另一个结论: Object占8byte,注意,纯Object

Object obj=new Object(); //多少????

8byte?? 错!! 12byte,忘了还有一个引用,8byte是Object的内容
记住 Object obj=new Object(); 占12byte

Object[] objs=new Object[1000];
for(int i=0;i<1000;i++) {
objs[i]=new Object();
}

至少占用 12*1000 bytes

推论: Object占12bytes,似乎和上面的结论矛盾??!!
没有!! 不管Object,没有被垃圾回收之前,总得被别人引用吧?
总的有指针指它吧? 既然指,那个引用or指针就要占地方啊 4byte
加起来是12byte,反正一个Object至少 12bytes

还是直接给结论,推导的过程我就都包办了,咱不是脏活累活抢着干么!!
一个Integer占 16 bytes

这时您可能会有疑问,Integer=Object+int,就是:
public class Integer {
public int value;
}
Integer应该占 8+4=12 bytes啊
你说的有道理,但是jvm对所有的Object有限制!!
这个限制被我发现了,就是不管什么Object占的空间,要是8的倍数
12不是8的倍数,只能是16了!!!

推论:Byte也占16bytes!!!!!!!!!!!

问:
Byte[] bytes=new Byte[1000];
占用空间多少?
答: 约为(至少为) (16+4)*1000 bytes
好家伙!!!!!!!!


论题:数组空间占用怎么算?
我这里直接给结论了,推导这个花了更长的时间:
对于数组来说,数组这个Object有一个length属性,数组的元素相当于其成员
public class Array {
public int length;
//... 其它成员
}
对于数组,我们不是直接可以取length属性么,源于此

public byte[] bytes=new byte[1000];
System.out.println(bytes.length); // 看,有length属性
上面的bytes换算过来是:
public class Array {
public int length;
public byte byte0;
public byte byte1;
...
public byte byte999;
}
上面的bytes占用的内存是:
4+[8+4 + 1*1000] = 4+ [1012]=4+1016=1020
4是 bytes这个引用,8是Object基占的,4是length属性占的
1000是1000个成员占的,本来是 1012,但要求是8的倍数,变成 1016了
总共是 1020
再如:
byte[] bytes=new byte[4];
的内存占用是:
4+[8+4+4*1]=4+[16]=20;

byte[] bytes=new byte[3]; 也是 20

对于元素是Object的数组,Object也是当作其成员,(注意只有引用这个数组的空间,这个可以推到普通Class上)

Byte[] bytes=new Byte[1000];
这个 bytes的定义相当于:
public class Array {
public int length;
public Byte byte0;
.....
public Byte byte999;
}
占用空间是:
4+[8+4+4*1000]+16*1000= 4+ 4016 + 16000 = 你自己算吧

推论:千万不要用 Byte[] 有20倍的差距!!!!!!!


你可能一下子没明白过来,没关系多琢磨一下,对于普通的class来说
,内容占用就是基加成员的占用,Object成员只记引用
public class Abc {
public int n;
public byte b;
public Object obj;
}
它的内容占用是: [8+4+1+4]=24
所以 Abc one=new Abc()的占用是 4+24=28
提醒:对于 Abc的成员 obj没有计,如果要计入的话,循环这个过程就可以了。(琢磨一下)

举例:

public class Abc {
public byte b;
public Object obj=null;
}

public class Def {
public int n;
public byte b;
public Abc obj=new Abc();
}
问:
Def one=new Def(); //占多少?
答:
4+[8+4+1+4]+[8+1+4]=4+24+16=44


public class Abc {
public byte b;
public Object obj=null;
}

public class Def {
public int n;
public byte b;
public Abc[] objs=new Abc[100];
{
for(int i=0;i<10;i++) {
objs[i]=new Abc();
}
}
}
问:
Def one=new Def(); //占多少?
答:
kao,一下我也算不出来,不过我写了程序,可以算出来,你给它一个Object,它就能递归的算出总共占了多少内存,这个程序不复杂,你也可以写出来。我等机会合适了再放出。

单独说一下String,String的结构是:
public class String {
private final char value[];
private final int offset;
private final int count;
private int hash; // Default to 0
}
所以,不考虑那个char[]的占用,一个String最少占用 [8+4+4+4+4]=24bytes
加上引用,共28bytes
所以
String s="";
占用28bytes!!!!! 尽管它的长度为0
如果精确的算,加上引用一个String的占用是
4+24+[8+4+2*length]
String s=""; 的占用是 28+16= 44
String s="ab" 的占用是 28+16= 44
String s="abc" 的占用是 28+24 = 52

要说的是,String是常用的类,这么看,String耗内存很多,所以jvm有优化,同样的内容尽量重用,所以除了28是必须的外,那个char[] 很可能一样
比方说
String[] s=new String[1000];
for(int i=0;i<1000;i++) {
s[i]=new String("abcdefasdjflksadjflkasdfj");
}
的占用的数量级是 28*1000,那 1000个字符串本身基本上不占内存,只有一份!!!!!!
反正String 至少是 28,最多也可能是28!!!!!!!!


比较占内存的数据结构,这个很重要:
基本上就是 primitive的包装

实例:
我以前用一个
Hashtable的结构,有100万个元素
改为String[]+int[]后,内存占用改观不少,速度也很快
100万的String[] 快排一下,也就2秒多,查找用2分,和hash也差不多少

完!


说明:
1。 以上结论适用于32位系统,对于64位系统,有很多不同。反正结论是虽然64位系统能用的内容更多了,但相同的程序占用内存也多了不少
2。 上面讨论的是类的实例占用的内存,没有考虑静态变量的占用。 静态变量引用的是算在Class数据里的,内容的占用和实例无关,单独计算就可以了
3。 以上没有考虑 Class本身占的内存。 Class本身也需要占地方啊,就是类的结构,以及静态变量的引用的占用。但是这个占用是静态的,不随实例变多而变多的。也不好统计出来,想统计的话,看jvm源码里jclass的表示
分享到:
评论

相关推荐

    JAVA程序员必读基础篇

    "JAVA程序员必读基础篇"是一份专为新手设计的入门教程,旨在帮助学习者建立起坚实的Java编程基础。 首先,Java语言的核心概念包括:类、对象、封装、继承和多态。这些是面向对象编程的基本要素。类是对象的模板,...

    java程序员入门必读网文(来源于互联网)

    - **变量与数据类型**:Java中的基本数据类型包括整型、浮点型、字符型和布尔型,理解它们的用法和内存占用是学习Java的第一步。 - **类与对象**:Java是一种面向对象的语言,理解和创建类以及对象是核心概念。 -...

    深入理解Java虚拟机(第二版)_java_

    这本书涵盖了从内存管理、类加载机制、字节码执行到垃圾收集算法等多个关键领域,为Java程序员提供了深入洞察Java平台运行机制的宝贵知识。 首先,我们来谈谈Java虚拟机(JVM)。JVM是Java程序的核心运行环境,它...

    Java深度历险(重要必读)

    9. **Java虚拟机(JVM)**:深入理解JVM的工作原理,包括类加载、内存模型、垃圾回收策略等,能够帮助优化程序性能,减少内存占用。 10. **Java泛型**:泛型的引入增强了代码的类型安全性,减少了类型转换的麻烦。...

    java面试必备_初级java工程师_java开发

    - **定义**:GC是一种自动管理内存的技术,它会在程序运行时自动识别不再使用的对象,并释放其占用的内存空间,从而避免内存泄漏。 - **原因**:为了避免程序员手动管理内存所带来的复杂性和错误,提高程序的健壮...

    Java虚拟机规范中文版

    Java虚拟机(JVM)是Java编程语言的核心组成部分,它为Java程序提供了运行环境,使得Java代码能够在不同的操作系统上无缝运行,实现了“一次编写...这本书详细阐述了JVM的各个层面,是每一个Java程序员进阶的必读之作。

    The Java Language Specification 3rd

    《Java语言规范第三版》不仅涵盖了以上知识点,还深入讨论了这些概念的细节,如类型转换的规则、异常的传播机制、线程的生命周期等,是每一个Java程序员进阶的必读经典。通过阅读这本书,开发者可以对Java有更深入的...

    深入java虚拟机(原书第2版)

    《深入Java虚拟机》是Java开发者必读的经典之作,它详细揭示了Java虚拟机(JVM)的工作原理和内部机制,帮助程序员理解并优化Java应用程序的性能。原书第二版在第一版的基础上进行了更新和扩展,涵盖了更多现代JVM的...

    算法导论書

    总之,《算法导论》是每一位希望深入理解计算机科学的程序员必读的书籍。通过结合Java语言进行实践,不仅可以提升编程技能,还能帮助你更好地理解和运用各种算法,解决实际问题。无论是对于学术研究还是职业发展,...

    现代编译原理-c语言描述(虎书)

    编译原理是计算机科学中的一个重要分支,它研究如何将高级编程语言(如C、Java等)转换为机器可以理解的低级指令集。这一过程分为多个阶段:词法分析、语法分析、语义分析、优化以及目标代码生成。以下是对这些主要...

    The Unicode Standard

    - **Java**:Java编程语言内置了对Unicode的支持。 - **Python**:自Python 3起,默认字符串类型就是Unicode。 - **SQL**:现代SQL数据库管理系统都支持Unicode字符集。 #### 六、Unicode的发展历程 自从1991年...

Global site tag (gtag.js) - Google Analytics