要理解 java中String的运作方式,必须明确一点:String是一个非可变类(immutable)。什么是非可变类呢?简单说来,非可变类的实例是不能被修改的,每个实例中包含的信息都必须在该实例创建的时候就提供出来,并且在对象的整个生存周期内固定不变。java为什么要把String设计为非可变类呢?你可以问问 james Gosling :)。但是非可变类确实有着自身的优势,如状态单一,对象简单,便于维护。其次,该类对象对象本质上是线程安全的,不要求同步。此外用户可以共享非可变对象,甚至可以共享它们的内部信息。(详见《Effective java》item 13)。String类在java中被大量运用,甚至在class文件中都有其身影,因此将其设计为简单轻便的非可变类是比较合适的。
一、创建。
好了,知道String是非可变类以后,我们可以进一步了解String的构造方式了。创建一个Stirng对象,主要就有以下两种方式:
java 代码
String str1 = new String("abc");
Stirng str2 = "abc";
虽然两个语句都是返回一个String对象的引用,但是jvm对两者的处理方式是不一样的。对于第一种,jvm会马上在heap中创建一个String对象,然后将该对象的引用返回给用户。对于第二种,jvm首先会在内部维护的strings pool中通过String的 equels 方法查找是对象池中是否存放有该String对象,如果有,则返回已有的String对象给用户,而不会在heap中重新创建一个新的String对象;如果对象池中没有该String对象,jvm则在heap中创建新的String对象,将其引用返回给用户,同时将该引用添加至strings pool中。注意:使用第一种方法创建对象时,jvm是不会主动把该对象放到strings pool里面的,除非程序调用 String的intern方法。看下面的例子:
java 代码
String str1 = new String("abc"); //jvm 在堆上创建一个String对象
//jvm 在strings pool中找不到值为“abc”的字符串,因此
//在堆上创建一个String对象,并将该对象的引用加入至strings pool中
//此时堆上有两个String对象
Stirng str2 = "abc";
if(str1 == str2){
System.out.println("str1 == str2");
}else{
System.out.println("str1 != str2");
}
//打印结果是 str1 != str2,因为它们是堆上两个不同的对象
String str3 = "abc";
//此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”
//因此直接返回str2指向的对象给str3,也就是说str2和str3是指向同一个对象的引用
if(str2 == str3){
System.out.println("str2 == str3");
}else{
System.out.println("str2 != str3");
}
//打印结果为 str2 == str3
再看下面的例子:
java 代码
String str1 = new String("abc"); //jvm 在堆上创建一个String对象
str1 = str1.intern();
//程序显式将str1放到strings pool中,intern运行过程是这样的:首先查看strings pool
//有没“abc”对象的引用,没有,则在堆中新建一个对象,然后将新对象的引用加入至
//strings pool中。执行完该语句后,str1原来指向的String对象已经成为垃圾对象了,随时会
//被GC收集。
//此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”
//因此直接返回str1指向的对象给str2,也就是说str2和str1引用着同一个对象,
//此时,堆上的有效对象只有一个。
Stirng str2 = "abc";
if(str1 == str2){
System.out.println("str1 == str2");
}else{
System.out.println("str1 != str2");
}
//打印结果是 str1 == str2
为什么jvm可以这样处理String对象呢?就是因为String的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响。
二、串接(Concatenation)。
java程序员应该都知道滥用String的串接操作符是会影响程序的性能的。性能问题从何而来呢?归根结底就是String类的非可变性。既然String对象都是非可变的,也就是对象一旦创建了就不能够改变其内在状态了,但是串接操作明显是要增长字符串的,也就是要改变String的内部状态,两者出现了矛盾。怎么办呢?要维护String的非可变性,只好在串接完成后新建一个String 对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而来了。
为了解决这个问题,jdk为String类提供了一个可变的配套类,StringBuffer。使用StringBuffer对象,由于该类是可变的,串接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上有很大的提高。针对单线程,jdk 5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。
三、String的长度
我们可以使用串接操作符得到一个长度更长的字符串,那么,String对象最多能容纳多少字符呢?查看String的源代码我们可以得知类String中是使用域 count 来记录对象字符的数量,而count 的类型为 int,因此,我们可以推测最长的长度为 2^32,也就是4G。
不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。为什么呢?因为在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。如果超出这个数量,在编译的时候编译器会报错。
分享到:
相关推荐
字符串在Java中的表现形式主要有两种:`String`和`StringBuffer`(或者`StringBuilder`)。它们之间的主要区别在于可变性、性能和使用场景。 1. **不可变性**: `String`类是不可变的,这意味着一旦创建了一个`...
在Java编程语言中,`String`与`StringBuffer`是两个重要的字符串处理类,它们各自具有独特的特性和用途,尤其在面试或笔试中常被提及作为考察应聘者对Java基础知识掌握程度的重要知识点。 ### `String`类:不可变性...
这里可以看出,虽然两种方式都可以实现字符串拼接,但是使用 StringBuffer 的方式在多线程环境中更安全。 3. **循环中的字符串拼接** ```java // 使用 String 拼接 String s = "s1"; s += "s2"; s += "s3"; ...
Java提供了两种主要的方式来创建字符串:通过`String`类的构造方法和使用`StringBuilder`或`StringBuffer`类。以下是对这些知识点的详细解释: 1. **String类**: - **不可变性**:Java中的`String`对象是不可变的...
在Java编程语言中,`String`和`StringBuffer`是用来处理文本字符串的两种不同类,它们各有特点并适用于不同的场景。理解它们之间的区别对于优化代码性能至关重要。 首先,`String`类代表的是不可变的字符串。这意味...
使用`+=`时,每次操作都会创建新的字符串对象,而`StringBuffer`则是在原对象上进行修改,从而避免了不必要的对象创建。 ### 总结 - 在单线程环境中,简单字符串操作使用`String`即可。 - 对于需要频繁修改的字符串...
为了解决这个问题,Java提供了`String.intern()`方法,允许程序强制检查字符串池,将通过`new`关键字创建的字符串对象与池中的字符串进行比较。如果池中已有相同的字符串,`intern()`方法会返回池中的引用,否则会将...
在编程领域,尤其是在使用C++、Java或C#等面向对象的语言时,经常需要将字符串数组转换为单一的string类型。这种操作在处理数据输入、输出或者格式化时非常常见。下面我们将详细讨论如何在不同语言中实现这个过程,...
在Java编程语言中,字符串处理是常见的需求,而对于字符串的操作,Java提供了两个常用类:String和StringBuffer。虽然两者都用于处理文本数据,但它们在实现和性能上有着本质的区别。 首先,String类是不可变的。这...
2. **字符串创建**:Java中有两种创建字符串的方式,通过字面量`"text"`或通过`new String()`构造函数。值得注意的是,字面量方式创建的字符串会存储在常量池中,而使用构造函数会创建堆内存中的新对象。 3. **字符...
Java中有两种方式创建字符串:通过`new`关键字或使用字符串字面量。 - 使用`new`关键字:`String str = new String("Hello");` - 字符串字面量:`String str = "Hello";` 这种方式创建的字符串会存储在常量池中。...
在Java中,字符串比较有两种方式:使用"=="运算符和调用`equals()`方法。"=="运算符比较的是两个字符串对象的引用,看它们是否指向内存中的同一个位置。而`equals()`方法则比较字符串的内容是否相同。在这个实验中,...
这种方式会首先在堆中创建一个`String`对象,然后根据字符串字面量在常量池中可能创建第二个对象(如果常量池中不存在的话)。 字符串的本质是`char`数组,即`char[]`,例如: ```java String str = "laofu"; // ...
在Java编程语言中,String和StringBuffer类都用于处理字符串,但它们在处理字符串拼接时有着显著的区别。本文将详细解析这两个类在拼接字符串时的行为差异。 首先,我们来了解一下String类。String对象在Java中是不...
Java中有两种创建字符串的方式:`new String()`构造器和字面量`"..."`。字面量方式会创建一个常量字符串,存储在字符串池中;而构造器则会在堆上创建对象。 2. **字符串不可变性**: Java中的字符串是不可变的,...
创建字符串对象主要有两种方式: 1. 通过字符串字面量:例如`"Hello"`,这种方式下,如果字符串已经在常量池中,JVM不会创建新的对象。 2. 使用`new`关键字:如`new String("Hello")`,这会在堆内存中创建新的字符串...
Java提供了两种主要的字符串类:`String`和`StringBuffer`。本章主要讨论`String`类,它主要用于不可变的字符串操作。 1. `String`类: - `String`类表示Unicode字符的序列,这意味着它可以处理各种语言的文字。 ...
- 创建字符串的方式有两种:通过字面量(如`String str = "Hello"`)或通过构造函数(如`String str = new String("Hello")`)。 - 字符串常用方法包括`length()`获取长度,`charAt(int index)`访问特定字符,`...
在 Java 中,String 和 StringBuffer 是两种不同的字符串类。String 是 immutable 的,即不能被修改,而 StringBuffer 是 mutable 的,可以被修改。例如,在 Stringtest4 中,我们使用了 StringBuffer 来append 字符...
这意味着每次对String对象进行修改(如拼接操作)都会创建一个新的String对象,这种特性在处理少量字符串操作时是足够的,但在频繁的字符串连接操作中可能会导致大量的内存开销,因为每次操作都会生成新的对象。...