`
tianlihu
  • 浏览: 314062 次
  • 性别: Icon_minigender_1
  • 来自: 石家庄
社区版块
存档分类
最新评论

创建String对象过程中【内存分配】的终极权威详尽解释

阅读更多
原文链接

前不久,一个IBM面试题的帖子引发了很多关于创建String对象过程中的内存分配的讨论,既然大家对这个问题这么感兴趣,那么这篇帖子就通过深入Java虚拟机(JVM)解读其内部指令流程,来分析创建String对象的几种情况下的内存分配过程。

先来了解一下JVM运行时数据区的内存模型。
《深入Java虚拟机》书中是这样描述的:JVM运行时数据区的内存模型由五部分组成:
【1】方法区
【2】堆
【3】Java栈
【4】PC寄存器
【5】本地方法栈

对于String s = "hello" ,它的虚拟机指令:
Java code 0:   ldc     #16; //string hello    2:   astore_13:   return

对于上面虚拟机指令,其各自的指令流程在《深入Java虚拟机》这样描述到(结合上面实例):

ldc指令格式:ldc,index
ldc指令过程:
要执行ldc指令,jvm首先查找index所指定的常量池入口,在index指向的常量池入口,jvm将会查找constant_integer_info,constant_float_info和constant_string_info入口。如果还没有这些入口,jvm会解析它们。而对于上面的hahajvm会找到constant_string_info入口,同时,将把指向被拘留String对象(由解析该入口的进程产生)的引用压入操作数栈。

astore_1指令格式:astore_1
astore_1指令过程:
要执行astore_1指令,jvm从操作数栈顶部弹出一个引用类型或者returnaddress类型值,然后将该值存入由索引1指定的局部变量中,即将引用类型或者returnaddress类型值存入局部变量1。

return 指令的过程:
从方法中返回,返回值为void。

谈一下我个人理解:
从上面的ldc指令的执行过程可以得出:s的值是来自被拘留string对象(由解析该入口的进程产生)的引用,即可以理解为是从被拘留string对象的引用复制而来的,故我个人的理解是s的值是存在栈当中。上面是对于s值得分析,接着是对于"hello"值的分析,我们知道,对于string s = "hello" 其中"hello"值在java程序编译期就确定下来了的。简单一点说,就是haha的值在程序编译成class文件后,就在class文件中生成了(大家可以用ue编辑器或其它文本编辑工具在打开class文件后的字节码文件中看到这个hello值)。执行java程序的过程中,第一步是class文件生成,然后被jvm装载到内存执行。那么jvm装载这个class到内存中,其中的hello这个值,在内存中是怎么为其开辟空间并存储在哪个区域中呢?

说到这里,我们不妨先来了解一下jvm常量池这个结构,《深入Java虚拟机》书中有这样的描述:

常量池
虚拟机必须为每个被装载的类型维护一个常量池。常量池就是该类型所用到常量的一个有序集和,包括直接常量(string,integer和floating point常量)和对其他类型,字段和方法的符号引用。对于string常量,它的值是在常量池中的。而jvm中的常量池在内存当中是以表的形式存在的,对于string类型,有一张固定长度的constant_string_info表用来存储文字字符串值,注意:该表只存储文字字符串值,不存储符号引用。说到这里,对常量池中的字符串值的存储位置应该有一个比较明了的理解了。

在介绍完jvm常量池的概念后,接着谈开始提到的"hello"的值的内存分布的位置。对于haha的值,实际上是在class文件被jvm装载到内存当中并被引擎在解析ldc指令并执行ldc指令之前,jvm就已经为haha这个字符串在常量池的constant_string_info表中分配了空间来存储hello这个值。既然hello这个字符串常量存储在常量池中,根据《深入java虚拟机》书中描述:常量池是属于类型信息的一部分,类型信息也就是每一个被转载的类型,这个类型反映到jvm内存模型中是对应存在于jvm内存模型的方法区中,也就是这个类型信息中的常量池概念是存在于在方法区中,而方法区是在jvm内存模型中的堆中由jvm来分配的。所以,hello的值是应该是存在堆空间中的。

而对于string s = new string("hello") ,它的jvm指令:
Java code 0:   new     #16; //class string 3:   dup4:   ldc     #18; //string hello 6:   invokespecial   #20; //method java/lang/string."":(ljava/lang/string;)v 9:   astore_110:  return

对于上面虚拟机指令,其各自的指令流程在《深入java虚拟机》这样描述到(结合上面实例):

new指令格式:new indexbyte1,indexbyte2
new指令过程:
要执行new指令,jvm通过计算(indextype1 < <8)|indextype2生成一个指向常量池的无符号16位索引。然后jvm根据计算出的索引查找常量池入口。该索引所指向的常量池入口必须为constant_class_info。如果该入口尚不存在,那么jvm将解析这个常量池入口,该入口类型必须是类。jvm从堆中为新对象映像分配足够大的空间,并将对象的实例变量设为默认值。最后jvm将指向新对象的引用objectref压入操作数栈。

dup指令格式:dup
dup指令过程:
要执行dup指令,jvm复制了操作数栈顶部一个字长的内容,然后再将复制内容压入栈。本指令能够从操作数栈顶部复制任何单位字长的值。但绝对不要使用它来复制操作数栈顶部任何两个字长(long型或double型)中的一个字长。上面例中,即复制引用objectref,这时在操作数栈存在2个引用。

ldc指令格式:ldc,index
ldc指令过程:
要执行ldc指令,jvm首先查找index所指定的常量池入口,在index指向的常量池入口,jvm将会查找constant_integer_info,constant_float_info和constant_string_info入口。如果还没有这些入口,jvm会解析它们。而对于上面的haha,jvm会找到constant_string_info入口,同时,将把指向被拘留string对象(由解析该入口的进程产生)的引用压入操作数栈。

invokespecial指令格式:invokespecial,indextype1,indextype2
invokespecial指令过程:对于该类而言,该指令是用来进行实例初始化方法的调用。鉴于该指令篇幅,具体可以查阅《深入java虚拟机》中描述。上面例子中,即通过其中一个引用调用string类的构造器,初始化对象实例,让另一个相同的引用指向这个被初始化的对象实例,然后前一个引用弹出操作数栈。

astore_1指令格式:astore_1
astore_1指令过程:
要执行astore_1指令,jvm从操作数栈顶部弹出一个引用类型或者returnaddress类型值,然后将该值存入由索引1指定的局部变量中,即将引用类型或者returnaddress类型值存入局部变量1。

return 指令的过程:
从方法中返回,返回值为void。

要执行astore_1指令,jvm从操作数栈顶部弹出一个引用类型或者returnaddress类型值,然后将该值存入由索引1指定的局部变量中,即将引用类型或者returnaddress类型值存入局部变量1。

通过上面6个指令,可以看出,string s = new string("hello");中的hello存储在堆空间中,而s则是在操作数栈中。
上面是对s和haha值的内存情况的分析和理解;那对于string s = new string("hello");语句,到底创建了几个对象呢?
我的理解:这里"hello"本身就是常量池中的一个对象,而在运行时执行new string()时,将常量池中的对象复制一份放到堆中,并且把堆中的这个对象的引用交给s持有。所以这条语句就创建了2个string对象。


下面是一些string相关的常见问题:
String中的final用法和理解
final stringbuffer a = new stringbuffer("111");
final stringbuffer b = new stringbuffer("222");
a=b;//此句编译不通过
final stringbuffer a = new stringbuffer("111");
a.append("222");//编译通过
可见,final只对引用的"值"(即内存地址)有效,它迫使引用只能指向初始指向的那个对象,改变它的指向会导致编译期错误。至于它所指向的对象的变化,final是不负责的。


String 常量池问题的几个例子
下面是几个常见例子的比较分析和理解:
【1】
Java code String a = "a1";String b = "a" + 1;System.out.println((a == b)); //result = true String a = "atrue";String b = "a" + "true";System.out.println((a == b)); //result = true String a = "a3.4";String b = "a" + 3.4;System.out.println((a == b)); //result = true

分析:jvm对于字符串常量的"+"号连接,将程序编译期,jvm就将常量字符串的"+"连接优化为连接后的值,拿"a" + 1来说,经编译器优化后在class中就已经是a1。在编译期其字符串常量的值就确定下来,故上面程序最终的结果都为true。

【2】
Java code String a = "ab";String bb = "b";String b = "a" + bb;System.out.println((a == b)); //result = false

分析:jvm对于字符串引用,由于在字符串的"+"连接中,有字符串引用存在,而引用的值在程序编译期是无法确定的,即"a" + bb无法被编译器优化,只有在程序运行期来动态分配并将连接后的新地址赋给b。所以上面程序的结果也就为false。

【3】
Java code String a = "ab";final String bb = "b";String b = "a" + bb;System.out.println((a == b)); //result = true

分析:和[3]中唯一不同的是bb字符串加了final修饰,对于final修饰的变量,它在编译时被解析为常量值的一个本地拷贝存储到自己的常量池中或嵌入到它的字节码流中。所以此时的"a" + bb和"a" + "b"效果是一样的。故上面程序的结果为true。

【4】
Java code String a = "ab";final String bb = getbb();String b = "a" + bb;System.out.println((a == b)); //result = false  private static string getbb() {return "b";}

分析:jvm对于字符串引用bb,它的值在编译期无法确定,只有在程序运行期调用方法后,将方法的返回值和"a"来动态连接并分配地址为b,故上面程序的结果为false。

通过上面4个例子可以得出得知:
string  s  =  "a" + "b" + "c"; 
就等价于string s = "abc"; 

string  a  =  "a"; 
string  b  =  "b"; 
string  c  =  "c"; 
string  s  =  a  +  b  +  c; 
这个就不一样了,最终结果等于: 
stringbuffer temp = new stringbuffer(); 
temp.append(a).append(b).append(c); 
string s = temp.tostring();
由上面的分析结果,可就不难推断出string 采用连接运算符(+)效率低下原因分析,形如这样的代码:
Java code public class test {public static void main (String args[]) {String s = null;for (int i = 0; i < 100; i++) {s += "a";}}}

每做一次 + 就产生个stringbuilder对象,然后append后就扔掉。下次循环再到达时重新产生个stringbuilder对象,然后 append 字符串,如此循环直至结束。 如果我们直接采用 stringbuilder 对象进行 append 的话,我们可以节省 n - 1 次创建和销毁对象的时间。所以对于在循环中要进行字符串连接的应用,一般都是用stringbuffer或stringbulider对象来进行append操作。

string对象的intern方法理解和分析:
Java code public class test4 {private static String a = "ab";public static void main (String[] args){String s1 = "a";String s2 = "b";String s = s1 + s2;System.out.println(s == a);//false     System.out.println(s.intern() == a);//true     }}

这里用到java里面是一个常量池的问题。对于s1+s2操作,其实是在堆里面重新创建了一个新的对象,s保存的是这个新对象在堆空间的的内容,所以s与a的值是不相等的。而当调用s.intern()方法,却可以返回s在常量池中的地址值,因为a的值存储在常量池中,故s.intern和a的值相等。



分享到:
评论

相关推荐

    创建string对象过程的内存分配:

    本文将详细介绍创建 `String` 对象过程中涉及的不同内存区域,以及不同创建方式下内存分配的过程。 #### 二、内存分配概述 在Java中,创建 `String` 对象时,主要涉及以下几种内存区域: 1. **常量池** (Constant ...

    String创建对象

    字面量创建的`String`对象会共享内存,而通过构造函数创建的则会在堆中分配新的内存空间。 10. **String局部变量与成员变量**: 在方法内部声明的`String`变量是局部变量,其生命周期仅限于该方法。作为类的成员...

    String对象的内存分析

    本篇文章将深入探讨`String`对象的内存分析,包括栈、堆、常量池以及静态存储的概念,并通过具体的示例来解析不同情况下`String`对象的创建和内存分配。 首先,了解Java内存的基本结构。Java内存分为以下几个区域:...

    String类创建对象问题

    ### String类创建对象问题 #### 一、String 类与常量池、字符串池的基本概念 在 Java 中,`String` 类并不属于八种基本数据类型之一,而是作为一个对象存在。这意味着 `String` 对象默认值为 `null`。尽管如此,`...

    String对象创建问题

    在Java编程语言中,`String`对象的创建是开发者经常遇到的问题,因为它涉及到内存管理和效率。`String`类在Java中被广泛使用,因为它代表不可变的字符序列,这使得它在很多场景下非常安全。这里我们将深入探讨`...

    c++结构体string无法用malloc分配内存

    当我们尝试在结构体中使用`std::string`时,必须注意内存分配的方式,因为`std::string`具有动态内存管理特性。 标题中提到的问题是关于“c++结构体string无法用malloc分配内存”。这是因为`malloc()`函数仅分配...

    java内存分配和String类型的深度解析Java开发J

    在Java开发中,理解内存分配机制有助于优化程序性能,避免内存泄漏和溢出问题。同时,对String类型的深入理解能帮助开发者编写出更高效、更健壮的代码。通过合理利用String的特点,可以显著提升程序的运行效率,减少...

    java对象创建过程

    ### Java对象创建过程详解 ...总结而言,Java对象的创建过程涉及类加载、内存分配、初始化等多个环节,每个环节都扮演着重要的角色。深入理解这些基础知识有助于开发者编写更高效、更健壮的Java应用程序。

    在实例化对象的过程中需要在内存中开辟空间,这其中就包括栈内存和对内存。

    #### 三、对象创建过程中的内存分配 当我们创建一个对象时,Java虚拟机(JVM)会在内存中为该对象分配空间。例如: ```java class Person { String name; int age; public void tell() { System.out.println(...

    java内存分配情况

    对于String对象,其文字值存储在常量池中,而String对象本身则存储在堆中。常量池的使用可以减少重复对象的创建,提高内存利用率。 Java内存管理的关键点还包括以下几点: - **对象引用**:当一个对象仅被一个栈上...

    java中Object对象String对象的解析.pdf

    使用字面值赋值方式创建的 String 对象会被存储在 String 池中, String 池是一个特殊的存储区域,用于存储字符串常量。使用 new 关键字创建的 String 对象则会被存储在堆中。 在比较 String 对象时,需要使用 ...

    String型的不可变性

    第一种形式用 new() 来创建对象的,它会存放在堆中,每调用一次就会创建一个新的对象。第二种形式是先在栈中创建一个对 String 类的对象引用变量 str,然后查找栈中有没有存放"abc",如果没有,则将"abc"存放进栈,...

    用new创建对象和直接定义的区别

    在编程世界中,创建对象是实现面向对象编程的基础。本文将深入探讨两种常见的对象创建方式:使用`new`关键字创建对象和直接定义对象。这两种方法虽然最终都能创建类的实例,但它们在内存分配、作用域和生命周期等...

    JAVA面试题解惑系列(二)——到底创建了几个String对象-JAVA程序员JAVA工程师面试必看.pdf,这是一份不错的文件

    本文将深入探讨 JAVA 中 String 对象的创建机制,解答常见的面试题目,并探索 String 对象池的概念和机制。 一、String 对象的创建方式 在 JAVA 中,String 对象可以通过多种方式创建,包括使用 new 关键字、使用...

    String类运算符重载(采用动态内存分配)

    这里,我们创建了一个新的`String`对象`result`,然后将当前对象与`other`对象相加,最后返回结果。注意,`+=`运算符通常用于在已有对象上进行操作,而不是创建新对象,所以我们还需要重载`+=`运算符: ```cpp ...

    java内存分配详解

    2. **非常量池**:通过`new String()`方式创建的字符串对象不会存储在字符串常量池中,而是直接在堆内存中创建。这种方式下的字符串是独立的副本,不会与其他相同内容的字符串共享内存。 #### 四、String.intern() ...

    java内存分配机制详解

    本文旨在详细介绍Java内存分配机制中的几个关键概念:寄存器、栈、堆、静态域、常量池及其在Java运行时环境中的角色与功能。 #### 二、Java内存分配机制概述 Java内存分配主要涉及以下几个区域: 1. **寄存器**:...

    Java内存分配原理精讲

    - **栈**:速度快、内存分配和释放效率高,但生存周期固定,不适合存储大对象或生命周期较长的对象。 - **堆**:提供动态内存分配的能力,适合存储生命周期不确定的大对象。但由于需要垃圾回收机制,访问速度相对较...

Global site tag (gtag.js) - Google Analytics