String是一个非可变类(immutable class),其实现采用Copy On Write技术。简单说来,非可变类的实例是不能被修改的,每个实例中包含的信息都必须在该实例创建的时候就提供出来,并且在对象的整个生存周期内固定不变。非可变类有着自身的优势,如状态单一,对象简单,便于维护;其次,该类的对象本质上是线程安全的,不要求同步。此外用户可以共享非可变对象,甚至可以共享它们的内部信息。
4.1 String对象的创建
创建一个String 对象,主要就有以下两种方式:
String str1 = new String("abc");
String str2 = "abc";
对于第一种,JVM会在heap中创建一个String对象,然后将该对象的引用返回给用户。对于第二种,JVM首先会在内部维护的strings pool中通过String的 equals 方法查找是对象池中是否存放有该String对象,如果有,则返回已有的String对象给用户,而不会在heap中重新创建一个新的String对象;如果对象池中没有该String对象,JVM则在heap中创建新的String对象,将其引用返回给用户,同时将该引用添加至strings pool中。
注意:使用第一种方法创建对象时,JVM是不会主动把该对象放到strings pool里面的,除非程序调用 String的intern方法。看下面的例子:
String str1 = new String("abc"); //JVM 在堆上创建一个String对象
// jvm 在strings pool中找不到值为“abc”的字符串,因此
// 在堆上创建一个String对象,并将该对象的引用加入至strings pool中
// 此时堆上有两个String对象
String str2 = "abc";
if(str1 == str2)
{
System.out.println("str1 == str2");
}
else
{
System.out.println("str1 != str2");
}
//打印结果是 str1 != str2,因为它们是堆上两个不同的对象
String str3 = "abc";
// 此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”
// 因此直接返回str2指向的对象给str3,也就是说str2和str3是指向同一个对象的引用
if(str2 == str3)
{
System.out.println("str2 == str3");
}
else
{
System.out.println("str2 != str3");
}
// 打印结果为 str2 == str3
再看下面的例子:
String str1 = new String("abc"); //JVM 在堆上创建一个String对象
str1 = str1.intern();
// 程序显式将str1放到strings pool中,intern运行过程是这样的:首先查看strings pool
// 有没“abc”对象的引用,没有,则在堆中新建一个对象,然后将新对象的引用加入至
// strings pool中。执行完该语句后,str1原来指向的String对象已经成为垃圾对象了。
// 此时,JVM发现strings pool中已有“abc”对象了,因为“abc”equals “abc”
// 因此直接返回str1指向的对象给str2,也就是说str2和str1引用着同一个对象,
// 此时,堆上的有效对象只有一个。
String str2 = "abc";
if(str1 == str2)
{
System.out.println("str1 == str2");
}
else
{
System.out.println("str1 != str2");
}
//打印结果是 str1 == str2
为什么JVM可以这样处理String对象呢?就是因为String的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响。
4.2 JVM对String常量的处理和优化
4.2.1 JVM对String的处理
class Test
{
publicstaticvoid main(String[] args)
{
/*
* 1.字面上的 "Hi" 字符串将被自动 intern 到虚拟机的字符串池中.
* 2.不是字面上的String对象,通过调用intern()方法,被intern到虚拟机的字符串池中.
*
* 虚拟机的字符串池由类 String 私有地维护。
*/
String a = "Hi";
String b = "Hi";
String c = new String("Hi");
System.out.println(a == b);// true
System.out.println(a == c);// false
c = c.intern();
System.out.println(a == c);// true
/*
* 创建了两个对象
* 1.字面"AA" ——被intern到虚拟机字符串池中了。
* 2.new 操作符创建的 对象
*
* 由AA != AA.intern()可以看出:String AA = new String("AA");创建了两个对象。
*/
String AA = new String("AA");
System.out.println(AA == "AA");// false
System.out.println(AA == AA.intern());// false
System.out.println("AA" == AA.intern());// true
/*
* JAVA 规范中的例子:
*/
String hello = "Hello", lo = "lo";
System.out.println((hello == "Hello") + " "); //true
System.out.println((hello == ("Hel" + "lo")) + " "); //true
System.out.println((hello == ("Hel" + lo)) + " "); //false--lo为非literal的
System.out.println(hello == ("Hel" + lo).intern());//true
}
}
4.2.2编译器对String常量表达式的优化
4.2.2.1 问题代码
String a = "ab";
String b = "a" + "b";
System.out.println((a == b));
打印结果会是什么?一般答案会是以下几种:
(1)true
"a" + "b"的结果就是"ab",这样a,b都是"ab"了,内容一样所以"相等",结果true
一般java新人如是答。
(2)false
"a" + "b"会生成新的对象"ab",但是这个对象和String a = "ab";不同,(a == b)是比较对象引用,因此不相等,结果false 对java的String有一定了解的通常这样回答。
(3)true
String a = "ab";创建了新的对象"ab"; String b = "a" + "b";没有创建新的对象,而是从JVM字符串常量池中获取之前已经存在的"ab"对象。因此a,b具有对同一个string对象的引用,两个引用相等,结果true 能回答出这个答案的,基本已经是高手了,对java中的string机制比较了解。很遗憾,这个答案,是错误的,或者说,压根没有这么回事.
(4).true
String b = "a" + "b";编译器将这个"a" + "b"作为常量表达式,在编译时进行优化,直接取结果"ab",这样这个问题退化
String a = "ab";
String b = "ab";
System.out.println((a == b));
String b = "ab";没有创建新的对象,而是从JVM字符串常量池中获取之前已经存在的"ab"对象。因此a,b具有对同一个string对象的引用,两个引用相等,结果true
4.2.2.2.编译器优化证明过程
这里有一个疑问就是String不是基本类型,像 int secondsOfDay = 24 * 60 * 60; 这样的表达式是常量表达式,编译器在编译时直接计算容易理解,而"a" + "b" 这样的表达式,string是对象不是基本类型,编译器会把它当成常量表达式来优化吗?
下面简单证明我的推断,首先编译这个类:
public class Test {
private String a = "aa";
}
复制class文件备用,然后修改为
public class Test {
private String a = "a" + "a";
}
再次编译,用ue之类的文本编辑器打开,察看二进制内容,可以发现,两个class文件完全一致,连一个字节都不差.
真相大白了.根本不存在运行期的处理String b = "a" + "b";这样的代码的问题,编译时就直接优化掉了。
4.2.2.3.扩展应用
下面进一步探讨,什么样的String + 表达式会被编译器当成常量表达式?
(1) String + String被正式是ok的
(2) String + int 被正式也是ok的
String a = "a1";
String b = "a" + 1;
System.out.println((a == b)); //result = true
(3) String + boolean被正式也是ok的
String a = "atrue";
String b = "a" + true;
System.out.println((a == b)); //result = true
(4) (3) String + double被正式也是ok的
String a = "a3.4";
String b = "a" + 3.4;
System.out.println((a == b)); //result = true
可见编译器对string + 基本类型是当成常量表达式直接求值来优化的。
(5) 再注意看这里的String都是"**"这样的,我们换成变量来试试:
String a = "ab";
String bb = "b";
String b = "a" + bb;
System.out.println((a == b)); //result = false
这个好理解,"a" + bb中的bb是变量,不能进行优化。
(6) 再修改一下,把bb作为常量变量:
String a = "ab";
final String bb = "b";
String b = "a" + bb;
System.out.println((a == b)); //result = true
竟然又是true,编译器的优化好厉害啊!
(7) 考虑下面这种情况:
privatestatic String getBB()
{
return"b";
}
publicstaticvoid main(String[] args)
{
String a = "ab";
final String bb = getBB();
String b = "a" + bb;
System.out.println((a == b)); //result = false
}
看来java(包括编译器和jvm)对String的优化,真的是到了极点了,String这个所谓的"对象",完全不可以看成一般的对象,java对String的处理近乎于基本类型,最大限度的优化了几乎能优化的地方。
4.3 String串接(Concatenation)。
滥用String的串接操作符是会影响程序的性能的。归根结底就是String类的非可变性。既然String对象都是非可变的,但是串接操作明显是要增长字符串的,也就是要改变String的内部状态,两者出现了矛盾。所以要维护String的非可变性,只好在串接完成后新建一个String 对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而来了。
为了解决这个问题,JDK为String类提供了一个可变的配套类,StringBuffer。
使用StringBuffer对象,由于该类是可变的,串接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上有很大的提高。
针对单线程,JDK5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。
4.4 String的长度
查看String的源代码我们可以得知类String中是使用int域 count 来记录对象字符的数量,因此,我们可以推测最长的长度为 2^32,也就是4G。
不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。原因是在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。如果超出这个数量,在编译的时候编译器会报错。
4.5 String参数传递问题
publicclass StringTest
{
staticvoid func(String s)
{
s += "tail";
}
staticvoid test()
{
String a = "abc";
func(a);
System.out.println(a);
}
publicstaticvoid main(String[] args)
{
test();
}
}
程序运行结果:
abc
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/lcj8/archive/2008/11/29/3410477.aspx
分享到:
相关推荐
通过HSDB来了解String值的真身在哪里 通过HSDB来了解String值的真身在哪里这篇文章主要是通过HSDB工具来分析Java中的String值在内存中的存储情况。HSDB是一个强大的Java虚拟机(JVM)分析工具,可以帮助开发者更好...
Java String 使用详解是 Java 编程语言中最基础也是最重要的一部分,对于 Java 程序员来说,了解 String 类的使用方法是必不可少的。本文将详细介绍 Java String 的使用方法,包括 String 对象的初始化、字符串的...
首先,让我们了解String和Byte类型的基本概念。String是Java中的一个不可变类,用于表示字符串,它是基于Unicode字符集的。Byte类型是Java的八种基本数据类型之一,用于存储8位二进制值,范围是-128到127。 1. **...
在本实验报告中,我们将实现 Java 中的 String 类,并了解其实现原理。 String 类是 Java 中一个非常重要的类,它提供了字符串操作的各种方法。在这里,我们将基于 ArrayList 实现可以深度复制的栈结构,并实现 ...
了解String类的特性、创建方式以及常用的API方法对于编写高效的Java代码至关重要。 1. String的特性: - 不可变性:这意味着一旦创建了一个String对象,就不能修改它的内容。对String的任何操作(如添加、删除或...
对于想要深入了解string类的使用者,可以通过以下途径加深理解和实践: - 访问东北林业大学ACM内部培训资料,了解string的学习目标。 - 参考博客《寒假培训——string》,获取更多string类的例题和题解。 - 练习使用...
首先,让我们深入了解String类型。在Redis中,String是最基本的数据类型,可以存储字符串、整数或浮点数。例如,你可以设置一个键为"user_age",值为"25"的键值对,表示用户的年龄。此外,Redis提供了丰富的命令操作...
了解 String 的特点和使用方法是 Java 开发者必备的技能之一。下面我们将对 10 个 Java 经典的 String 面试题进行详细解答。 1. String 是基本数据类型吗? 答案:String 不是基本数据类型。Java 中的基本数据类型...
学会使用string class 对string class众多函数的分类与总结,适合新手了解string class的具体使用 穿插大量样例代码,内容翔实
字符串是 Java 中最重要的类,了解 String 的用法是 Java 开发者的必备知识。本文将从多个角度介绍 String 的用法,包括字符串的不可变性、字符串常量池、+号和 StringBuilder 等。 字符串的不可变性 String 类是 ...
该资源有助于C++学习者从实现原理的层面进一步了解string类,为后续对string类灵活使用打下一个良好的基础;C++库中的string类接口较多,读者也可在此资源的基础上继续实现相关接口,并编写相应的测试代码进行测试。
"String split函数的使用技巧" String split函数是 Java 中 String 类的一种常用函数,用于将一个字符串分割为子字符串,并将...通过了解 String split函数的使用技巧和注意点,可以更好地使用该函数实现开发需求。
首先,让我们了解String类的基本构造。String对象可以通过多种方式创建,例如使用字面量、构造函数或者通过StringBuffer/StringBuilder。例如: ```java String str = "Hello, World!"; String str2 = new String(...
java jdk中string类的源码 ,了解string类的书写,定义和声明
在String方面,我们需要了解String的基本概念,如String的创建、String的immutable性质等。String是Java语言中最基本的数据类型之一,用于表示字符串。String对象是immutable的,创建后不能修改。 在Struts2方面,...
标题与描述中提到的知识点是关于C#编程语言中`String`与`string`的区别,以及`string`类型的...通过以上分析,我们可以深入了解C#中`String`与`string`的区别及其使用细节,这对于提高代码质量和程序性能具有重要意义。
深入了解Java中的String类是至关重要的,因为String在Java编程中占据着极其重要的位置。下面将对给定的信息进行深入分析: ### 1. String 类是 final 的,不可被继承 在Java中,`String` 类被声明为 `final` 类型...
首先,我们需要了解String类型在三菱PLC中的应用。String是一种可变长度的字符序列,通常用于存储文本信息,如设备标识、错误代码或者生产日期等。在三菱PLC中,String的处理不同于常规的数字或布尔变量,需要特别的...
开发者可以通过打开`.sln`文件在Visual Studio等IDE中查看和运行代码,了解具体实现细节。 总的来说,HexString和Base64String的转换是编程中常见的任务,理解它们的工作原理和转换过程对于任何IT从业者来说都是...