`
talentluke
  • 浏览: 604801 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

通过JVM原理理解字符串的比较

 
阅读更多

http://developer.51cto.com/art/201003/189520.htm

 

Java中的字符串也是一连串的字符,但是与许多其他的计算机语言将字符串作为字符数组处理不同,Java将字符串作为String类型对象来处理。将字符串作为内置的对象处理允许Java提供十分丰富的功能特性以方便处理字符串。

JVM运行时数据区的内存模型由五部分组成:

(1)方法区
(2)堆
(3)JAVA栈
(4)PC寄存器
(5)本地方法栈

对于String s = "haha" ,它的虚拟机指令:

  1. 0:   ldc        "16; //String haha      
  2. 2:   astore_1   
  3. 3:   return 

ldc指令格式:

ldc,index

ldc指令过程:要执行ldc指令,JVM首先查找index所指定的常量池入口,在index指向的JVM常量池入口,JVM将会查找 CONSTANT_Integer_info,CONSTANT_Float_info和CONSTANT_String_info入口。如果还没有这些 入口,JVM会解析它们。而对于上面的hahaJVM会找到CONSTANT_String_info入口,同时,将把指向被拘留String对象(由解 析该入口的进程产生)的引用压入操作数栈。

astore_1指令格式:

astore_1

astore_1指令过程:要执行astore_1指令,JVM从操作数栈顶部弹出一个引用类型或者returnAddress类型值,然后将该值存入由索引1指定的局部变量中,即将引用类型或者returnAddress类型值存入局部变量1。

return 指令的过程:

从上面的ldc指令的执行过程可以得出:s的值是来自被拘留String对象(由解析该入口的进程产生)的引用,即可以理解为是从被拘留 String对象的引用复制而来的,故我个人的理解是s的值是存在栈当中。上面是对于s值得分析,接着是对于"haha"值的分析,我们知道,对于 String s = "haha" 其中"haha"值在JAVA程序编译期就确定下来了的。简单一点说,就是haha的值在程序编译成class文件后,就在class文件中生成了(大家 可以用UE编辑器或其它文本编辑工具在打开class文件后的字节码文件中看到这个haha值)。执行JAVA程序的过程中,第一步是class文件生 成,然后被JVM装载到内存执行。那么JVM装载这个class到内存中,其中的haha这个值,在内存中是怎么为其开辟空间并存储在哪个区域中呢?

JVM常量池

虚拟机必须为每个被装载的类型维护一个常量池。常量池就是该类型所用到常量的一个有序集和,包括直接常量(string,integer和 floating point常量)和对其他类型,字段和方法的符号引用。对于String常量,它的值是在常量池中的。而JVM常量池在内存当中是以表的形式存在的,对于 String类型,有一张固定长度的CONSTANT_String_info表用来存储文字字符串值,注意:该表只存储文字字符串值,不存储符号引用。 说到这里,对JVM常量池中的字符串值的存储位置应该有一个比较明了的理解了。

在介绍完JVM常量池的概念后,接着谈开始提到的"haha"的值的内存分布的位置。对于haha的值,实际上是在class文件被JVM装载到内 存当中并被引擎在解析ldc指令并执行ldc指令之前,JVM就已经为haha这个字符串在常量池的CONSTANT_String_info表中分配了 空间来存储haha这个值。

既然haha这个字符串常量存储在常量池中,常量池是属于类型信息的一部分,类型信息也就是每一个被转载的类型,这个类型反映到JVM内存模型中是 对应存在于JVM内存模型的方法区中,也就是这个类型信息中的JVM常量池概念是存在于在方法区中,而方法区是在JVM内存模型中的堆中由JVM来分配 的。所以,haha的值是应该是存在堆空间中的。而对于String s = new String("haha") ,它的JVM指令:

  1. 0:   new             "16; //class String  
  2. 3:   dup  
  3. 4:   ldc             "18; //String haha  
  4. 6:   invokespecial   "20; //Method java/lang/String."":(Ljava/lang/String;)V  
  5. 9:   astore_1  
  6. 10:  return 

new指令格式:new indexbyte1,indexbyte2

new指令过程:

要执行new指令,Jvm通过计算(indextype1<<8)|indextype2生成一个指向常量池的无符号16位索引。然后 JVM根据计算出的索引查找JVM常量池入口。该索引所指向的常量池入口必须为CONSTANT_Class_info。如果该入口尚不存在,那么JVM 将解析这个常量池入口,该入口类型必须是类。JVM从堆中为新对象映像分配足够大的空间,并将对象的实例变量设为默认值。最后JVM将指向新对象的引用 objectref压入操作数栈。

dup指令格式:dup

dup指令过程:

要执行dup指令,JVM复制了操作数栈顶部一个字长的内容,然后再将复制内容压入栈。本指令能够从操作数栈顶部复制任何单位字长的值。但绝对不要 使用它来复制操作数栈顶部任何两个字长(long型或double型)中的一个字长。上面例中,即复制引用objectref,这时在操作数栈存在2个引 用。

ldc指令格式:ldc,index

ldc指令过程:

要执行ldc指令,JVM首先查找index所指定的常量池入口,在index指向的JVM常量池入口,JVM将会查找 CONSTANT_Integer_info,CONSTANT_Float_info和CONSTANT_String_info入口。如果还没有这些 入口,JVM会解析它们。而对于上面的haha,JVM会找到CONSTANT_String_info入口,同时,将把指向被拘留String对象(由 解析该入口的进程产生)的引用压入操作数栈。

invokespecial指令格式:invokespecial,indextype1,indextype2

invokespecial指令过程:对于该类而言,该指令是用来进行实例初始化方法的调用。上面例子中,即通过其中一个引用调用String类的构造器,初始化对象实例,让另一个相同的引用指向这个被初始化的对象实例,然后前一个引用弹出操作数栈。

astore_1指令格式:astore_1

astore_1指令过程:

要执行astore_1指令,JVM从操作数栈顶部弹出一个引用类型或者returnAddress类型值,然后将该值存入由索引1指定的局部变量中,即将引用类型或者returnAddress类型值存入局部变量1。

return 指令的过程:

从方法中返回,返回值为void,要执行astore_1指令,JVM从操作数栈顶部弹出一个引用类型或者returnAddress类型值,然后将该值存入由索引1指定的局部变量中,即将引用类型或者returnAddress类型值存入局部变量1。

通过上面6个指令,可以看出,String s = new String("haha");中的haha存储在堆空间中,而s则是在操作数栈中。上面是对s和haha值的内存情况的分析和理解;那对于String s = new String("haha");语句,到底创建了几个对象呢?这里"haha"本身就是JVM常量池中的一个对象,而在运行时执行new String()时,将JVM常量池中的对象复制一份放到堆中,并且把堆中的这个对象的引用交给s持有。所以这条语句就创建了2个String对象。下面 是一些String相关的常见问题: 

 

String中的final用法和理解

  1. final StringBuffer a = new StringBuffer("111");  
  2. final StringBuffer b = new StringBuffer("222");  
  3. a=b;//此句编译不通过  
  4. final StringBuffer a = new StringBuffer("111");  
  5. a.append("222");//编译通过 

可见,final只对引用的"值"(即内存地址)有效,它迫使引用只能指向初始指向的那个对象,改变它的指向会导致编译期错误。至于它所指向的对象的变化,final是不负责的。

String 常量池问题的几个例子

下面是几个常见例子的比较分析和理解:

  1. String a = "a1";   
  2. String b = "a" + 1;   
  3. System.out.println((a == b)); //result = true 
  4. String a = "atrue";   
  5. String b = "a" + "true";   
  6. System.out.println((a == b)); //result = true 
  7. String a = "a3.4";   
  8. String b = "a" + 3.4;   
  9. System.out.println((a == b)); //result = true 

分析:JVM对于字符串常量的"+"号连接,将程序编译期,JVM就将常量字符串的"+"连接优化为连接后的值,拿"a" + 1来说,经编译器优化后在class中就已经是a1。在编译期其字符串常量的值就确定下来,故上面程序最终的结果都为true。

  1. String a = "ab";   
  2. String bb = "b";   
  3. String b = "a" + bb;   
  4. System.out.println((a == b)); //result = false 

分析:JVM对于字符串引用,由于在字符串的"+"连接中,有字符串引用存在,而引用的值在程序编译期是无法确定的,即"a" + bb无法被编译器优化,只有在程序运行期来动态分配并将连接后的新地址赋给b。所以上面程序的结果也就为false。

  1. String a = "ab";   
  2. final String bb = "b";   
  3. String b = "a" + bb;   
  4. System.out.println((a == b)); //result = true 

分析:和[3]中唯一不同的是bb字符串加了final修饰,对于final修饰的变量,它在编译时被解析为常量值的一个本地拷贝存储到自己的常量池中或嵌入到它的字节码流中。所以此时的"a" + bb和"a" + "b"效果是一样的。故上面程序的结果为true。

  1. String a = "ab";   
  2. final String bb = getBB();   
  3. String b = "a" + bb;   
  4. System.out.println((a == b)); //result = false   
  5. private static String getBB() {  
  6. return "b";   

分析:JVM对于字符串引用bb,它的值在编译期无法确定,只有在程序运行期调用方法后,将方法的返回值和"a"来动态连接并分配地址为b,故上面程序的结果为false。通过上面4个例子可以得出得知:

  1. String  s  =  "a" + "b" + "c";     
  2. 就等价于String s = "abc";     
  3. String  a  =  "a";     
  4. String  b  =  "b";     
  5. String  c  =  "c";     
  6. String  s  =   a  +  b  +  c;    

这个就不一样了,最终结果等于: 
 

  1. StringBuffer temp = new StringBuffer();     
  2. temp.append(a).append(b).append(c);     
  3. String s = temp.toString(); 

由上面的分析结果,可就不难推断出String 采用连接运算符(+)效率低下原因分析,形如这样的代码:

  1. public class Test {  
  2. public static void main(String args[]) {  
  3. String s = null;  
  4. for(int i = 0; i < 100; i++) {  
  5. s += "a";  
  6. }  
  7. }  

每做一次 + 就产生个StringBuilder对象,然后append后就扔掉。下次循环再到达时重新产生个StringBuilder对象,然后 append 字符串,如此循环直至结束。 如果我们直接采用 StringBuilder 对象进行 append 的话,我们可以节省 N - 1 次创建和销毁对象的时间。所以对于在循环中要进行字符串连接的应用,一般都是用StringBuffer或StringBulider对象来进行 append操作。String对象的intern方法理解和分析:

  1. public class Test4 {  
  2. private static String a = "ab";   
  3. public static void main(String[] args){  
  4. String s1 = "a";  
  5. String s2 = "b";  
  6. String s = s1 + s2;  
  7. System.out.println(s == a);//false  
  8. System.out.println(s.intern() == a);//true    
  9. }  

这里用到Java里面是一个常量池的问题。对于s1+s2操作,其实是在堆里面重新创建了一个新的对象,s保存的是这个新对象在堆空间的的内容,所 以s与a的值是不相等的。而当调用s.intern()方法,却可以返回s在JVM常量池中的地址值,因为a的值存储在常量池中,故s.intern和a 的值相等。

分享到:
评论
1 楼 xfxlch 2014-01-01  
      

相关推荐

    jvm原理及调优

    ### JVM原理及调优 #### 一、JVM概述 JVM(Java Virtual Machine,Java虚拟机)是Java编程语言的基础,它作为一种软件层面的抽象计算机,能够在多种操作系统平台上执行Java字节码程序。Java编译器的目标是生成能够...

    Java 字符串

    三、字符串比较 Java提供多种方法来比较字符串: 1. `equals()`:比较字符串的内容是否相等,忽略大小写可使用`equalsIgnoreCase()`。 2. `compareTo()`:根据字典顺序比较字符串,返回值表示字符串的相对位置,0...

    jvm课程ppt

    在实际项目中,优化JVM可能涉及减少Full GC频率、提高对象分配效率、优化字符串池、处理内存泄漏等方面。理解JVM的工作原理,结合性能监控数据,能有效提升系统性能和稳定性。 通过深入学习本课程的PPT,你将能够...

    8 StringTable(字符串常量池).md,学习代码

    当一个字符串被创建时,JVM会首先检查池中是否存在相同的字符串,如果存在,则直接引用该字符串,否则将其添加到池中。这种机制被称为字符串的"intern"操作。 ### 字符串常量池的使用 1. **字符串字面量的创建**:...

    JVM如何理解Java泛型类.doc

    这使得`Pair&lt;String&gt;`成为一个专门用于存储字符串对的类。 #### 三、创建泛型对象的注意事项 在创建泛型对象时,需要注意以下几点: 1. **显式指定类型**:当创建泛型对象时,最好明确指定类型参数`T`的具体类型...

    JVM执行子系统原理

    - **字面量**:如文本字符串、声明为final的常量值等。 - **符号引用**:类和接口的全限定名、字段的名称和描述符、方法的名称和描述符等。 **访问标志** - **位置**:常量池结束之后,紧接着的2字节代表访问...

    深入理解JVM & G1 GC

    4. 开启String去重复功能:`-XX:+UseStringDeduplication`可以减少字符串占用的空间。 5. 监控与日志:开启`-XX:+PrintGCDetails`和`-XX:+PrintAdaptiveSizePolicy`,了解GC行为并进行调整。 在实际应用中,了解和...

    图解JVM的内存结构及字符串常量池方法详解.docx

    通过对JVM内存结构的理解,开发者可以更好地进行性能调优,比如通过设置合适的堆大小,或者通过分析堆dump文件找出内存泄露的根源。 在实际开发中,我们还需要关注JVM的其他重要概念,如类加载机制(加载、验证、...

    JVM调优实践 ⼀、JVM调优准备⼯作 实验报告 pdf

    字符串常量池是为了解决大量重复字符串导致的内存浪费问题,通过引用共享同一字符串实例,提高内存利用率。在JDK 6及之前,字符串常量池位于永久代;JDK 7及以后,移到堆中。 理解JVM内存区域的工作方式对于进行...

    Java 中的字符串常量池详解

    当程序创建一个字符串对象,特别是通过字面量的形式,如`String str = "example"`,JVM会检查字符串常量池中是否存在相同内容的字符串。如果不存在,JVM会创建一个新的字符串对象,并将其引用放入常量池。如果已存在...

    monkey老师的jvm 调优

    7. **字符串池与常量池**:理解字符串池与常量池的区别和交互,以及如何通过 `-XX:UseStringDeduplication` 参数减少内存占用。 8. **GC日志分析**:通过开启GC日志 (`-XX:+PrintGCDetails`),可以详细记录每次垃圾...

    JVM 底层原理最全知识总结

    Java 虚拟机(JVM)是 Java 平台的核心组成部分,它是负责运行 Java 字节码的...通过对这些 JVM 底层原理的深入理解,开发者可以更好地进行性能调优,解决内存溢出、死锁等问题,从而提升 Java 应用的稳定性和性能。

    java11-jvm白皮书

    1. 字符串常量池:Java 11优化了字符串常量池的实现,提高了字符串操作的效率。 2. 动态编译:JIT(Just-In-Time)编译器在Java 11中进一步优化,能够更早地识别并编译热点代码,提高程序运行速度。 3. 模块系统:...

    openjdk8u60+jvm jdk源码+jvm源码

    5. **字符串常量池(String Pool)**:在 OpenJDK 8 中,字符串常量池位于堆内存中,它存储了所有字符串字面量和字符串对象的引用,以实现字符串的共享和重复利用。 6. **并发与多线程(Concurrency and ...

    jvm原理面试

    在面试中,深入理解JVM原理对于成为一名优秀的Java开发者至关重要。以下是对JVM核心概念、工作原理以及面试中常见问题的详细阐述。 1. **JVM结构** JVM主要由以下几个组件构成: - **类加载器**:负责加载类文件...

    JVM指令手册_jvm指令手册_

    `JVM指令手册`是深入理解JVM内部工作原理的重要参考资料,它详细列出了JVM所支持的所有操作指令,这对于Java开发者提升技能、进行性能优化以及排查问题具有极高的价值。以下是一些关键的JVM指令及相关的知识点: 1....

    06-VIP-JVM调优实战及常量池详解(预习)1

    总的来说,理解和优化JVM的内存管理和字符串常量池是提升Java应用程序性能的关键。通过深入分析GC日志,我们可以找出潜在的性能问题,并通过调整JVM参数来改善。同时,了解常量池的工作机制,有助于我们更好地管理...

    JVM常量池教程吐血整理干货.md

    - **字符串字面量的处理**:当程序尝试创建一个新的字符串字面量时,JVM首先会检查字符串常量池中是否存在该字符串。如果存在,则返回已存在的字符串对象;如果不存在,则创建一个新的字符串对象并将其放入字符串...

    Java中的字符串常量池详细介绍

    Java中的字符串常量池是Java虚拟机...总之,理解Java中的字符串常量池及其工作原理对于优化代码性能、减少内存消耗至关重要。开发者应合理利用`String`的字面量创建和`intern()`方法,以达到最佳的内存管理和程序效率。

    JVM课件(云析学院JVM课程课件)

    字面量包括文本字符串和声明为final的常量值等,而符号引用包括类或接口的符号引用、字段的符号引用、类中方法的符号引用等。常量池项以不同的类型存在,比如CONSTANT_Utf8_info、CONSTANT_Integer_info、CONSTANT_...

Global site tag (gtag.js) - Google Analytics