论坛首页 Java企业应用论坛

java编译器对string常量表达式的处理和优化

浏览 11162 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2007-01-18  
首先把问题摆出来,先看这个代码

String a = "ab";
String b = "a" + "b";
System.out.println((a == b));

打印结果会是什么?类似这样的问题,有人考过我,我也拿来考过别人(蛮好玩的,大家也可以拿来问人玩),一般答案会是以下几种:

1.true
    "a" + "b" 的结果就是"ab",这样a,b都是"ab"了,内容一样所以"相等",结果true
    一般java新人如是答。
2.false
    "a" + "a"会生成新的对象"aa",但是这个对象和String a = "ab";不同,(a == b)是比较对象引用,因此不相等,结果false
    对java的String有一定了解的通常这样回答。
3.true
    String a = "ab";创建了新的对象"ab"; 再执行String b = "a" + "b";结果b="ab",这里没有创建新的对象,而是从JVM字符串常量池中获取之前已经存在的"ab"对象。因此a,b具有对同一个string对象的引用,两个引用相等,结果true.
    能回答出这个答案的,基本已经是高手了,对java中的string机制比较了解。
    很遗憾,这个答案,是不够准确的。或者说,根本没有运行时计算b = "a" + "b";这个操作.实际上运行时只有String b = "ab";
    3的观点适合解释以下情况:
    String a = "ab";
    String b = "ab";
    System.out.println((a == b));
    如果String b = "a" + "b";是在运行期执行,则3的观点是无法解释的。运行期的两个string相加,会产生新的对象的。(本文后面对此有解释)

4.true
    下面是我的回答:编译优化+ 3的处理方式 = 最后的true
    String b = "a" + "b";编译器将这个"a" + "b"作为常量表达式,在编译时进行优化,直接取结果"ab",这样这个问题退化
    String a = "ab";
    String b = "ab";
    System.out.println((a == b));
    然后根据3的解释,得到结果true

    这里有一个疑问就是String不是基本类型,像
int secondsOfDay = 24 * 60 * 60;
    这样的表达式是常量表达式,编译器在编译时直接计算容易理解,而"a" + "b" 这样的表达式,string是对象不是基本类型,编译器会把它当成常量表达式来优化吗?
    下面简单证明我的推断,首先编译这个类:
public class Test {
    private String a = "aa";
}
       复制class文件备用,然后修改为
public class Test {
    private String a = "a" + "a";
}
    再次编译,用ue之类的文本编辑器打开,察看二进制内容,可以发现,两个class文件完全一致,连一个字节都不差.
    ok,真相大白了.根本不存在运行期的处理String b = "a" + "b";这样的代码的问题,编译时就直接优化掉了。


下面进一步探讨,什么样的string + 表达式会被编译器当成常量表达式?
String b = "a" + "b";
这个String + String被正式是ok的,那么string + 基本类型呢?

String a = "a1";
String b = "a" + 1;
System.out.println((a == b));  //result = true

String a = "atrue";
String b = "a" + true;
System.out.println((a == b));  //result = true

String a = "a3.4";
String b = "a" + 3.4;
System.out.println((a == b));  //result = true
  
可见编译器对string + 基本类型是当成常量表达式直接求值来优化的。

再注意看这里的string都是"**"这样的,我们换成变量来试试:
String a = "ab";
String bb = "b";
String b = "a" + bb;
System.out.println((a == b));   //result = false
这个好理解,"a" + bb中的bb是变量,不能进行优化。这里很很好的解释了为什么3的观点不正确,如果String+String的操作是在运行时进行的,则会产生新的对象,而不是直接从jvm的string池中获取。

再修改一下,把bb作为常量变量:
String a = "ab";
final String bb = "b";
String b = "a" + bb;
System.out.println((a == b));   //result = true
竟然又是true,编译器的优化好厉害啊,呵呵,考虑下面这种情况:
String a = "ab";
final String bb = getBB();
String b = "a" + bb;
System.out.println((a == b));    //result = false
private static String getBB() {
return "b";
}
看来java(包括编译器和jvm)对string的优化,真的是到了极点了,string这个所谓的"对象",完全不可以看成一般的对象,java对string的处理近乎于基本类型,最大限度的优化了几乎能优化的地方。

另外感叹一下,string的+号处理,算是java语言里面唯一的一个"运算符重载"(接触过c++的人对这个不会陌生)吧?
   发表时间:2007-01-18  
是否所有的编译器都会这么优化?
0 请登录后投票
   发表时间:2007-01-18  
惭愧,我只用过sun的编译器,jdk1.5是通过的,jdk1.4没有实测,不过猜测应该是ok的,毕竟这个很基础的,应该很早的版本就会优化的。

至于其他厂商的java编译器,请其他兄弟帮忙验证一下。
0 请登录后投票
   发表时间:2007-01-18  
第三点其实是正确的哦, 你所说的问题在于"a"+"b"是什么时候被执行的,但是并不能解释引用a为什么是==引用b的,其实你想说的是string的+操作是在编译期执行,这个确实是你正确的,从你的例子中也可以看出来。

但是如果要解释a==b是true这个问题还是要用第3点解释哦,所以第3点并没有错,这是千真万确的,但是你对+操作的执行时期的描述也是正确的,这两个应该是一个整体,而不是对立的。

String a = "ab";
String b = "ab";
System.out.println((a == b));
问题还是那样,结果为什么是true,必须用第3点来解释,而且这也是深入浅出jvm中的观点。

0 请登录后投票
   发表时间:2007-01-18  
一直听传闻说法是:

SUN JDK 的 javac 是优化最多的, 编译速度也慢.
IBM jikes 编译速度快, 但没什么优化.
Eclipse JDT Compiler 是从 VA4J Compiler 演化来的, 增量编译很强, 优化也有, 相对JDK少.
GNU GCJ 不清楚, 不过还不成熟, 研究意义似乎不大.

不过我也没怎么接触过jikes, 楼主有空不妨用别的编译器试试.
0 请登录后投票
   发表时间:2007-01-18  
ahuaxuan 写道
第三点其实是正确的哦, 你所说的问题在于"a"+"b"是什么时候被执行的,但是并不能解释引用a为什么是==引用b的,其实你想说的是string的+操作是在编译期执行,这个确实是你正确的,从你的例子中也可以看出来。

但是如果要解释a==b是true这个问题还是要用第3点解释哦,所以第3点并没有错,这是千真万确的,但是你对+操作的执行时期的描述也是正确的,这两个应该是一个整体,而不是对立的。

String a = "ab";
String b = "ab";
System.out.println((a == b));
问题还是那样,结果为什么是true,必须用第3点来解释,而且这也是深入浅出jvm中的观点。


恩,就是这个意思,我的表述不是很清晰。
我所说的第三点错,并不是说第三点的解释方式有问题,而是第三点阐述的"a"+"b"是运行期被执行不正确,而是第4点钟的编译器执行优化。
第三点中阐述的jvm对string的处理我没有异议,呵呵,所以我在第4点中根本没有解释
String a = "ab";
String b = "ab";
System.out.println((a == b));
结果为什么是true,因为基本能想到第3点或第4点人,肯定非常清楚这里的true是怎么来的,呵呵。

第4点,其实是建立在第3点阐述的jvm对string的处理机制的基础上的。先执行4优化,再执行3的机制,最后才能得到true这么一个结果。

奇怪的是,n多阐述3的人,都没有提到4。我就一直奇怪,如果没有4的优化,3的结论是怎么做出来的?这个一直让我困惑 
0 请登录后投票
   发表时间:2007-01-18  
修改了一下文档的内容,将3的阐述改的清楚了一些。

实际这里存在两个问题
1.   3解释下面为true的问题
String a = "ab";
String b = "ab";
System.out.println((a == b));
   但是3的错误在于3中认为在运行期String b = "a"+"b";可以等同于String b = "ab";
2.   4通过编译器优化的解释解决了
String b = "a"+"b";等同于String b = "ab";的问题
0 请登录后投票
   发表时间:2007-01-18  
还有对于jvm对string的处理和优化,我的感觉(还不确定,请大家指正)是这样,jvm里面的string池,似乎只使用于两个情况:

1.在编译后的*.class文件里面定义的"abc"这样的"直接"常量
   对于new String(), String + String/基本类型,toString()方法之类生成的string不是从string池里面取,而是直接生成新的string类。
2.调用string的intern()方法
   这个算是"强制"加入池吧
0 请登录后投票
   发表时间:2007-01-18  
String这个东西也挺搞的,看了这个帖子,才知道我昨天做了一道题目错了。:(
立即写了个小程序测试:
	public static void main(String[] args) {
		String s1 = "ab";
		String s2="a"+"b";
		System.out.println((s1==s2)+":"+(s1.equals(s2)));
		StringBuffer sb1=new StringBuffer("ab");
		StringBuffer sb2=new StringBuffer().append("a").append("b");
		System.out.println((sb1==sb2)+":"+(sb1.equals(sb2)));
	}

结果是
true:true
false:false

对于StringBuffer,只有引用相同,==和equals()才会成立。我看了equals()源码,直接就是返回==比较的结果。
对于String,正如楼主的编译器优化的说法,我再写了一个程序:
	private static String getString(){
		return "b";
	}
	public static void main(String[] args) {
		String s1 = "ab";
		String s2="a"+getString();
		System.out.println((s1==s2)+":"+(s1.equals(s2)));
	}

结果:
false:true

这个程序运行时产生的String对象是equals的,但==不成立。

0 请登录后投票
   发表时间:2007-01-18  
s1==s2.intern()应该是true
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics