`
Dustin
  • 浏览: 314350 次
  • 性别: Icon_minigender_1
  • 来自: 广州/成都
社区版块
存档分类
最新评论

理解java String

阅读更多
     要理解 java中String的运作方式,必须明确一点:String是一个非可变类(immutable)。什么是非可变类呢?简单说来,非可变类的实例是不能被修改的,每个实例中包含的信息都必须在该实例创建的时候就提供出来,并且在对象的整个生存周期内固定不变。java为什么要把String设计为非可变类呢?你可以问问 james Gosling :)。但是非可变类确实有着自身的优势,如状态单一,对象简单,便于维护。其次,该类对象对象本质上是线程安全的,不要求同步。此外用户可以共享非可变对象,甚至可以共享它们的内部信息。(详见 《Effective java》item 13)。String类在java中被大量运用,甚至在class文件中都有其身影,因此将其设计为简单轻便的非可变类是比较合适的。

一、创建。
    好了,知道String是非可变类以后,我们可以进一步了解String的构造方式了。创建一个Stirng对象,主要就有以下两种方式:

java 代码
  1. String str1 = new String("abc");    
  2. Stirng str2 = "abc";  

     虽然两个语句都是返回一个String对象的引用,但是jvm对两者的处理方式是不一样的。对于第一种,jvm会马上在heap中创建一个String对象,然后将该对象的引用返回给用户。对于第二种,jvm首先会在内部维护的strings pool中通过String的 equels 方法查找是对象池中是否存放有该String对象,如果有,则返回已有的String对象给用户,而不会在heap中重新创建一个新的String对象;如果对象池中没有该String对象,jvm则在heap中创建新的String对象,将其引用返回给用户,同时将该引用添加至strings pool中。注意:使用第一种方法创建对象时,jvm是不会主动把该对象放到strings pool里面的,除非程序调用 String的intern方法。看下面的例子:

java 代码
  1. String str1 = new String("abc"); //jvm 在堆上创建一个String对象   
  2.   
  3.  //jvm 在strings pool中找不到值为“abc”的字符串,因此   
  4.  //在堆上创建一个String对象,并将该对象的引用加入至strings pool中   
  5.  //此时堆上有两个String对象   
  6. Stirng str2 = "abc";   
  7.   
  8.  if(str1 == str2){   
  9.          System.out.println("str1 == str2");   
  10.  }else{   
  11.          System.out.println("str1 != str2");   
  12.  }   
  13.   //打印结果是 str1 != str2,因为它们是堆上两个不同的对象   
  14.   
  15.   String str3 = "abc";   
  16.  //此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”   
  17.  //因此直接返回str2指向的对象给str3,也就是说str2和str3是指向同一个对象的引用   
  18.   if(str2 == str3){   
  19.          System.out.println("str2 == str3");   
  20.   }else{   
  21.          System.out.println("str2 != str3");   
  22.   }   
  23.  //打印结果为 str2 == str3  

   再看下面的例子:

java 代码
  1. String str1 = new String("abc"); //jvm 在堆上创建一个String对象   
  2.   
  3. str1 = str1.intern();   
  4. //程序显式将str1放到strings pool中,intern运行过程是这样的:首先查看strings pool   
  5. //有没“abc”对象的引用,没有,则在堆中新建一个对象,然后将新对象的引用加入至   
  6. //strings pool中。执行完该语句后,str1原来指向的String对象已经成为垃圾对象了,随时会   
  7. //被GC收集。   
  8.   
  9. //此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”   
  10. //因此直接返回str1指向的对象给str2,也就是说str2和str1引用着同一个对象,   
  11. //此时,堆上的有效对象只有一个。   
  12. Stirng str2 = "abc";   
  13.   
  14.  if(str1 == str2){   
  15.          System.out.println("str1 == str2");   
  16.  }else{   
  17.          System.out.println("str1 != str2");   
  18.  }   
  19.   //打印结果是 str1 == str2   
  20.   

 

    为什么jvm可以这样处理String对象呢?就是因为String的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响。


二、串接(Concatenation)。
     java程序员应该都知道滥用String的串接操作符是会影响程序的性能的。性能问题从何而来呢?归根结底就是String类的非可变性。既然String对象都是非可变的,也就是对象一旦创建了就不能够改变其内在状态了,但是串接操作明显是要增长字符串的,也就是要改变String的内部状态,两者出现了矛盾。怎么办呢?要维护String的非可变性,只好在串接完成后新建一个String 对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而来了。
    为了解决这个问题,jdk为String类提供了一个可变的配套类,StringBuffer。使用StringBuffer对象,由于该类是可变的,串接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上有很大的提高。针对单线程,jdk 5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。

三、String的长度
   我们可以使用串接操作符得到一个长度更长的字符串,那么,String对象最多能容纳多少字符呢?查看String的源代码我们可以得知类String中是使用域 count 来记录对象字符的数量,而count 的类型为 int,因此,我们可以推测最长的长度为 2^32,也就是4G。
    不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。为什么呢?因为在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。如果超出这个数量,在编译的时候编译器会报错。

分享到:
评论
12 楼 anders0913 2007-01-17  
越是简单越是基础的东西,越能看出水平。
11 楼 dwangel 2007-01-07  
jianfeng008cn 写道


两种定义方式下,string的最大长度还不一致哦?


不是string得最大长度不一样,是直接在java 文件里声明,然后编译到class文件里的string受到字符处理得内部条件得限制而已。
10 楼 Dustin 2007-01-06  
引用
两种定义方式下,string的最大长度还不一致哦?


String的最大长度不存在不一致问题,理论上它最多能表示2^32个字符。只要是在源文件上定义,由于class文件规范的原因,长度都只能是65534。
9 楼 jianfeng008cn 2007-01-06  
引用
我们可以使用串接操作符得到一个长度更长的字符串,那么,String对象最多能容纳多少字符呢?查看String的源代码我们可以得知类String中是使用域 count 来记录对象字符的数量,而count 的类型为 int,因此,我们可以推测最长的长度为 2^32,也就是4G。
    不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。为什么呢?因为在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。如果超出这个数量,在编译的时候编译器会报错。


两种定义方式下,string的最大长度还不一致哦?
8 楼 zwhua 2007-01-06  
受教了,不错!
7 楼 kernel 2007-01-06  
顶一个。。。
6 楼 歆渊 2007-01-06  
写得确实不错!

String在内存的长度也受它内部维护的 char[] 数组的最大元素个数影响, Java的数组下标只能是有符号的int, 所以理论的最大个数应该是 2^31

另外我见过很多人把Java String跟Java 传值 还是 传址 调用混淆起来考人, 有C++基础的初学者基本都会被搞蒙, 而实际上跟传值还是传址完全两码事. 如果能结合到这篇文章里一起写写的话, 真是一篇很好的精华文章.

考人的代码比如:
 void func(String s)
 {
   s += "tail";
 }

 void test()
 {
   String a = "abc";
   func(a);
   System.out.println(a); // 问这里输出什么
 }

5 楼 lighter 2007-01-05  
看到楼主写的java String这一方面的内容,突然想到了以前看的一本书
也是写基础方面的,里面的内容个人感觉也不错:
<<java面向对象程序设计教程>>李发致写的,里面的第四章和第五章个人感觉说得比较好.....
4 楼 Dustin 2007-01-05  
to 刑天战士:当时看《深入java虚拟机》有所感触写的,搬家的时候把它贴过来了。刚刚过来,首次发帖,还不是清楚怎么运作,以后一定多多学习
to ahuaxuan: 谢谢提醒
3 楼 ahuaxuan 2007-01-05  
论坛上其实有不少类似的贴子,都是讲String类的,比如说:http://www.iteye.com/post/190112
2 楼 刑天战士 2007-01-05  
String是非可变类的最大优势在于不用同步。

PS:写的不错啊(如果是原创的话),干嘛投新手贴阿
1 楼 bigshell 2007-01-05  
写得不错~

相关推荐

    深入理解 Java String#intern() 内存模型.docx

    "深入理解 Java String#intern() 内存模型" Java String#intern() 内存模型是 Java 语言中一个重要的概念,.string#intern() 方法是 Java 字符串常量池中一个重要的组件。字符串常量池是一个固定大小的 HashMap,桶...

    深入理解JavaString#intern()内存模型Ja

    深入理解`String#intern()`方法对于优化内存使用和理解Java的内存模型至关重要。`intern()`方法是一个非常特殊的函数,它将字符串常量池(String Constant Pool)的概念引入到我们的讨论中。 字符串常量池是Java...

    java String 数据结构

    这是因为`String`在Java中被实现为一个特殊的类,存储在一个连续的字符数组中,这个特性对于理解它的内部工作原理以及如何有效地使用它至关重要。下面将详细探讨`String`类的数据结构、常用方法以及适用于初学者的...

    java基础String类选择题练习题

    根据提供的信息,我们可以总结出这份Java基础String类选择题练习题主要聚焦于String及StringBuffer类的使用。尽管具体的题目内容未给出,但从所展示的信息中可以推断出该练习题集涵盖了以下几方面的知识点: ### 一...

    java String的深入理解

    Java String 深入理解 Java String 是 Java 语言中最基本的数据类型之一,然而,许多开发者对 String 的理解仅停留在表面,今天我们将深入了解 Java String 的内部机理和使用方法。 Java 字符串池 Java 字符串池...

    Java String与Byte类型转换

    在Java编程中,String对象和Byte...总之,Java中的String与Byte类型的转换是编程中不可或缺的部分,尤其在网络编程中,理解这两种类型之间的转换方式及其在网络数据交换中的作用,对于编写高效、可靠的程序至关重要。

    java String类的实现

    Java中的`String`类是编程中最常用的类之一,它在Java的`java.lang`包中...对于初学者来说,理解这些基本操作和原理是掌握Java字符串处理的关键。通过深入学习和实践,你可以更好地利用`String`类来处理各种文本数据。

    Java String对象的经典问题

    ### Java String对象的经典问题 #### 一、String 类与对象机制概述 在Java中,`String`类是一个非常重要的类,它提供...通过以上分析可以看出,深入理解`String`类和对象机制对于编写高效、可靠的Java程序至关重要。

    Java String 字符串创建理解 equels和\"==\" 差异

    在Java编程语言中,字符串(String)是一个非常基础且...总之,理解Java中的字符串创建机制和"=="与equals()的区别,是写出高效、正确代码的关键。在实际开发中,我们应该根据具体情况选择合适的字符串创建和比较方式。

    深入了解java 中的String

    深入了解Java中的String类是至关重要的,因为String在Java编程中占据着极其重要的位置。下面将对给定的信息进行深入分析: ### 1. String 类是 final 的,不可被继承 在Java中,`String` 类被声明为 `final` 类型...

    java String 与各种进制字符之间的转换

    在Java编程语言中,...总之,理解和掌握Java中String与各种进制字符之间的转换对于日常编程至关重要。通过熟练运用上述方法,可以轻松处理与进制相关的任务,无论是处理用户输入、解析文件内容还是与其他系统交互。

    深入理解Java String#intern()内存模型

    大家知道,Java中string.intern()方法调用会先去字符串常量池中查找相应的字符串,如果字符串不存在,会在字符串常量池中创建该字符串然后再返回。  字符串常量池是一个固定大小的HashMap,桶的数量默认是1009, ...

    Java 之 String 类型

    在Java编程语言中,String类型扮演着至关重要的角色。...在实际开发中,理解和熟练运用这些知识点,能够有效地编写出高效、安全的Java代码。同时,对于字符串的操作,还需要注意线程安全问题,尤其是在多线程环境中。

    我们一起学Java之String

    Java中的String类是一个重要的数据类型,用于存储和操作字符串数据。String类的特点是不可变性,也就是说,一旦String对象被创建,其值就无法改变。这一特性对于Java内存管理有着重要影响,因为String对象会存储在...

    java String类常用方法练习小结

    理解并熟练使用`String`类的方法对于Java开发者来说至关重要。通过实践,你可以更好地掌握字符串操作,从而编写出更加高效和优雅的代码。记得在处理字符串时考虑到其不可变性,并根据需要选择合适的方法来完成任务。

    小心String的陷阱——深入剖析Java中String的处理机制

    深入理解Java中`String`的处理机制对于避免陷阱至关重要。`String`的不可变性和`String Pool`的存在是为了提升性能和安全性,但同时也要求开发者在创建和使用`String`对象时采取正确的方法,以避免不必要的性能损耗...

    java String Vector简单初学者代码

    Java中的String、Vector和Scanner是三个非常基础且重要的概念,对于初学者来说,理解它们的用法和原理是学习Java编程的关键步骤。 首先,我们来深入理解`String`类。在Java中,`String`是一个不可变的字符序列,这...

    Java中String判断值为null或空及地址是否相等的问题

    总结来说,理解Java中`null`、空字符串`""`的区别,以及如何安全地进行比较,是编写健壮代码的关键。同时,了解字符串对象的内存地址和内容相等性的差异,可以帮助我们更好地理解和调试程序。在实际开发中,应始终...

    java中String_十六进制String_byte[]之间相互转换

    ### Java中String、十六进制String与byte[]之间的相互转换 在Java开发中,字符串(String)、十六进制表示的字符串以及字节数组(byte[])之间的转换是非常常见的需求,尤其是在处理网络通信、文件读写等场景下。...

    java中的String类常用方法解析(一)

    以上就是`String`类的一些常见方法,理解并熟练使用它们对于提升Java编程效率至关重要。在实际开发中,开发者通常会结合这些方法来处理字符串,实现各种文本操作。通过阅读和分析`TestString.java`文件,我们可以...

Global site tag (gtag.js) - Google Analytics