代码优化畅谈:
代码优化,是程序员到了一定境界后,要研究的一个很重要的方向。可能有些人觉得没用,他们认为在一些细小的地方有什么好修改的,改与不改对于代码的运行效率会有什么太大的影响?咱不好对人家的观点多做评价,以一个大家都用过的一个软件为例,淘宝网,淘宝网,尤其是在双11的时时候,全国同时在线人数有多少人,这样的程序固然会有一些硬件上的保障和一些行之有效的软件框架的采纳,但是我相信他们在代码优化上一定是做了很大的工作才能达到现在这样的效果,据我了解,阿里在JVM上已经做出了很大的优化。如果项目着眼于尽快无BUG上线,那么此时可以抓大放小,代码的细节可以不精打细磨;但是如果有足够的时间开发、维护代码,这时候就必须考虑每个可以优化的细节了,一个一个细小的优化点累积起来,对于代码的运行效率绝对是有提升的。
代码优化的目标:
在空间角度上,压缩空间:即压缩代码的存储空间,我认为最重要的一点就是代码复用;
在时间角度上,压缩时间:即压缩代码的运行时间,提高代码运行的效率。
代码优化细节:
1、尽量指定类、方法的final修饰符。
带有final修饰符的类是不可派生的。在Java核心API中,有许多应用final的例子,例如java.lang.String,整个类都是final的。为类指定final修饰符可以让类不允许被继承,为方法指定final修饰符可以让方法不允许被重写。如果指定了一个类为final,则该类所有的方法都是final的。Java编译器会寻找机会内联所有的final方法,内联对于提升Java运行效率作用重大,具体参见Java运行期优化。这种方式能够使性能平均提高50%。
2、尽量重用对象。
特别是String对象的使用,出现字符串连接时应该使用StringBuilder/StringBuffer代替。由于JVM不仅要花时间生成对象,以后可能还需要花时间对这些对象进行垃圾回收和处理,因此,生成过多的对象将会给程序的性能带来很大的影响。String类型和StringBuffer类型的主要性能区别其实在于String是不可变的对象, 因此在每次对String类型进行改变的时候其实都等同于生成了一个新的String对象,然后将指针指向新的String对象,所以经常改变内容的字符串最好不要用String,因为每次生成对象都会对系统性能产生影响,特别当内存中无引用对象多了以后,JVM的GC就会开始工作,那速度一定会变慢的。而如果是使用StringBuffer类则结果就不一样了,每次操作结果都会对StringBuffer对象本身进行操作,而不是像String类型那样先生成新的对象,然后再改变对象引用。所以在一般情况下推荐使用StringBuffer,特别是字符串对象经常改变的情况下。但是在某些特殊情况下,String对象的字符串拼接其实是被JVM解释成了StringBuffer对象的拼接,所以这些时候采用String对象的速度并不会比StringBuffer对象慢,特别是在以下的字符串对象生成过程中,采用String类型的效率远远比StringBuffer型快:
String s = "This is only a" + " simple" + " test";
StringBuffer sb = new StringBuilder("This is only a").append(" simple").append(" test");
前者比后者生成的对象要快很多,在这个时候StringBuffer居然速度上根本一点都不占优势。这是JVM的一个处理机制,JVM在看到String s = "This is only a" + " simple" + " test";时,就是当作String s = "This is only a simple test";,因此当然不需要太多的时间了。但是这里要注意的是,如果你的字符串是来自另外的String对象的话,速度就没那么快了,如:
String s2 = "This is only a";
String s3 = " simple";
String s4 = " test";
String s1 = s2 +s3 + s4;
这时候JVM会规规矩矩的按照原来的方式去处理。
java.lang.StringBuilder是一个可变的字符序列,它是在JDK1.5新增的。此类提供一个与StringBuffer兼容的API,但不保证同步。该类被设计用作StringBuffer的一个简易替换,用在字符串缓冲区被单个线程使用的时候(这种情况很普遍)。如果不是多线程的环境下,推荐优先采用StringBuilder,因为在大多数实现中,StringBuilder比StringBuffer要快。两者的方法基本相同。
3、尽可能使用局部变量。
调用方法时传递的参数以及在调用中创建的临时变量都保存在栈中速度较快,其他变量,如静态变量、实例变量等,都在堆中创建,速度较慢。另外,栈中创建的变量,随着方法的运行结束,这些变量就没了,不需要额外的垃圾回收。
4、及时关闭流。
Java编程过程中,进行数据库连接、I/O流操作时务必小心,在使用完毕后,及时关闭以释放资源。因为对这些大对象的操作会给系统造成很大的资源开销,稍有不慎,将会导致严重的后果。
5、尽量减少对变量的重复计算。
明确一个概念,对方法的调用,即使方法中只有一句语句,也是有消耗的,包括创建栈帧、调用方法时保护现场、调用方法完毕时恢复现场等。所以例如下面的操作:
for (int i = 0; i < list.size(); i++)
{...}
建议替换为:
for (int i = 0, int length = list.size(); i < length; i++)
{...}
这样,在list.size()很大的时候,就减少了很多的消耗。
6、尽量采用懒加载的策略,即在需要的时候才开始创建,还未开始需要的时候先不创建。
例如:
String str = "aaa";
if(i == 1)
{
list.add(str);
}
建议替换为:
if(i == 1)
{
String str = "aaa";
list.add(str);
}
7、慎用异常。
异常对性能是不利影响的。抛出异常首先要创建一个新的对象,Throwable接口的构造函数调用名为fillInStackTrace()的本地同步方法,fillInStackTrace()方法检查堆栈,收集调用跟踪信息。只要有异常被抛出,JVM就必须调整调用堆栈,因为在处理过程中创建了一个新的对象。异常只能用于错误处理,不应该用来控制程序流程。
8、不要在循环中使用try…catch…,应该把其放在最外层,除非逼不得已。
9、如果能预先估计到待添加的内容长度,为底层以数组方式实现的集合、工具类指定初始长度。
比如ArrayList、LinkedLlist、StringBuilder、StringBuffer、HashMap、HashSet等等,以StringBuilder为例:
(1)StringBuilder() // 默认分配16个字符的空间
(2)StringBuilder(int size) // 默认分配size个字符的空间
(3)StringBuilder(String str) // 默认分配16个字符+str.length()个字符空间
可以通过类(这里指的不仅仅是上面的StringBuilder)的来设定它的初始化容量,这样可以明显地提升性能。比如StringBuilder吧,length表示当前的StringBuilder能保持的字符数量。因为当StringBuilder达到最大容量的时候,它会将自身容量增加到当前的2倍再加2,无论何时只要StringBuilder达到它的最大容量,它就不得不创建一个新的字符数组然后将旧的字符数组内容拷贝到新字符数组中,这是十分耗费性能的一个操作。试想,如果能预估到字符数组中大概要存放5000个字符而不指定长度,最接近5000的2次幂是4096,每次扩容加的2不管,那么:
(1)在4096 的基础上,再申请8194个大小的字符数组,加起来相当于一次申请了12290个大小的字符数组,如果一开始能指定5000个大小的字符数组,就节省了一倍以上的空间;
(2)把原来的4096个字符拷贝到新的的字符数组中去。
这样,既浪费内存空间又降低代码运行效率。所以,给底层以数组实现的集合、工具类设置一个合理的初始化容量是很明智的,这会带来立竿见影的效果。但是,注意,像HashMap这种是以数组+链表实现的集合,别把初始大小和你估计的大小设置得一样,因为一个table上只连接一个对象的可能性几乎为0。初始大小建议设置为2的N次幂,如果能估计到有2000个元素,设置成new HashMap(128)、new HashMap(256)都可以。
10、当复制大量数据时,使用System.arraycopy()命令。
11、乘法和除法使用移位操作。
例如:
for(val = 0; val < 100000; val += 5)
{
a = val * 8;
b = val / 2;
}
用位移运算可以极大地提高性能,因为在计算机底层,对位的操作是最方便、最快的,因此建议修改为:
for(val = 0; val < 100000; val += 5)
{
a = val << 3;
b = val >> 1;
}
位移运算虽然快,但是可能会降低代码的可读性,因此为了后期增加开发人员及维护方便,最好加上相应的注释。
12、循环内不要不断创建对象引用。
例如:
for(int i = 1; i <= count; i++)
{
Object obj = new Object();
}
这种做法会导致内存中有count个Object对象引用存在,count很大的话,就会极耗费堆内存,建议修改为:
Object obj = null;
for(int i = 0; i <= count; i++)
{
obj = new Object();
}
这样写,内存中只有一份Object对象引用,只是每次new Object()的时候,Object对象引用指向不同的Object罢了,但是内存中只有一份,这样就大大节省了内存空间。建议在思考这一环节的时候,与懒加载做一下对比,或许能更好的理解。
13、基于效率和类型检查的考虑,应该尽可能使用Array,无法确定数组大小时才使用ArrayList。
14、尽量使用HashMap、ArrayList、StringBuilder,除非线程安全需要,否则不推荐使用Hashtable、Vector、StringBuffer,后三者由于使用了同步机制会导致性能开销。
15、不要将数组声明为public static final。
因为这毫无意义,这样只是定义了引用为static final,数组的内容还是可以随意改变的,将数组声明为public更是一个安全漏洞,这意味着这个数组可以被外部类所改变。
16、尽量在合适的场合使用单例模式。
使用单例可以减轻加载的负担、缩短加载的时间、提高加载的效率,但并不是所有地方都适用于单例,简单来说,单例主要适用于以下三个方面:
(1)控制资源的使用,通过线程同步来控制资源的并发访问;
(2)控制实例的产生,以达到节约资源的目的;
(3)控制数据的共享,在不建立直接关联的条件下,让多个不相关的进程或线程之间实现通信。
17、尽量避免随意使用静态变量。
要知道,当某个对象被定义为static的变量所引用,那么gc通常是不会回收这个对象所占有的堆内存的,如:
public class A
{
private static B b = new B();
}
此时静态变量b的生命周期与A类相同,如果A类不被卸载,那么引用B指向的b对象会常驻内存,直到程序终止。
18、及时清除不再需要的会话。
为了清除不再活动的会话,许多应用服务器都有默认的会话超时时间,一般为30分钟。当应用服务器需要保存更多的会话时,如果内存不足,那么操作系统会把部分数据转移到磁盘,应用服务器也可能根据MRU(最近最频繁使用)算法把部分不活跃的会话转储到磁盘,甚至可能抛出内存不足的异常。如果会话要被转储到磁盘,那么必须要先被序列化,在大规模集群中,对对象进行序列化的代价是很昂贵的。因此,当会话不再需要时,应当及时调用HttpSession的invalidate()方法清除会话。
19、实现RandomAccess接口的集合比如ArrayList,应当使用最普通的for循环而不是foreach循环来遍历。
这是JDK推荐给用户的。JDK API对于RandomAccess接口的解释是:实现RandomAccess接口用来表明其支持快速随机访问,此接口的主要目的是允许一般的算法更改其行为,从而将其应用到随机或连续访问列表时能提供良好的性能。实际经验表明,实现RandomAccess接口的类实例,假如是随机访问的,使用普通for循环效率将高于使用foreach循环;反过来,如果是顺序访问的,则使用Iterator会效率更高。可以使用类似如下的代码作判断:
if(list instanceof RandomAccess)
{
for (int i = 0; i < list.size(); i++)
{}
}
else{
Iterator<?> iterator = list.iterable();
while(iterator.hasNext())
{
iterator.next();
}
}
foreach循环的底层实现原理就是迭代器Iterator,参见Java语法糖1:可变长度参数以及foreach循环原理。所以后半句”反过来,如果是顺序访问的,则使用Iterator会效率更高”的意思就是顺序访问的那些类实例,使用foreach循环去遍历。
20、使用同步代码块替代同步方法。
这点在多线程模块中的synchronized锁方法块一文中已经讲得很清楚了,除非能确定一整个方法都是需要进行同步的,否则尽量使用同步代码块,避免对那些不需要进行同步的代码也进行了同步,影响代码执行效率。
21、将常量声明为static final,并以大写命名。
这样在编译期间就可以把这些内容放入常量池中,避免运行期间计算生成常量的值。另外,将常量的名字以大写命名也可以方便区分出常量与变量。
22、不要创建一些不使用的对象,不要导入一些不使用的类。
这毫无意义,如果代码中出现”The value of the local variable i is not used”、”The import java.util is never used”,那么请删除这些无用的内容。
23、程序运行过程中避免使用反射。
反射是Java提供给用户一个很强大的功能,功能强大往往意味着效率不高。不建议在程序运行过程中使用尤其是频繁使用反射机制,特别是Method的invoke方法,如果确实有必要,一种建议性的做法是将那些需要通过反射加载的类在项目启动的时候通过反射实例化出一个对象并放入内存,用户只关心和对端交互的时候获取最快的响应速度,并不关心对端的项目启动花多久时间。
24、使用数据库连接池和线程池。
这两个池都是用于重用对象的,前者可以避免频繁地打开和关闭连接,后者可以避免频繁地创建和销毁线程。
25、使用带缓冲的输入输出流进行IO操作。
带缓冲的输入输出流,即BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStream,这可以极大地提升IO效率。
26、元素需要顺序插入和随机访问比较多的场景推荐使用ArrayList,元素需要删除和中间插入比较多的场景推荐使用LinkedList。这个,理解ArrayList和LinkedList的原理就知道了。
27、不要让public方法中有太多的形参。
public方法即对外提供的方法,如果给这些方法太多形参的话主要有两点坏处:
(1)违反了面向对象的编程思想,Java讲求一切都是对象,太多的形参,和面向对象的编程思想并不契合;
(2)参数太多势必导致方法调用的出错概率增加。
至于这个”太多”指的是多少个,3、4个吧。比如我们用JDBC写一个insertStudentInfo方法,有10个学生信息字段要插如Student表中,可以把这10个参数封装在一个实体类中,作为insert方法的形参。
28、字符串变量和字符串常量equals的时候将字符串常量写在前面。
这是一个比较常见的小技巧了,如果有以下代码:
String str = "123";
if(str.equals("123"))
{
...
}
建议修改为:
String str = "123";
if("123".equals(str))
{
...
}
这么做主要是可以避免空指针异常。
29、在Java中if(i == 1)和if(1 == i)是没有区别的,但从阅读习惯上讲,建议使用前者。
”if(i == 1)”和”if(1== i)”到底有没有区别?
在C/C++中,”if(i == 1)”判断条件成立,是以0与非0为基准的,0表示false,非0表示true,如果有这么一段代码:
int i = 2;
if(i == 1)
{
...
}
else
{
...
}
C/C++判断”i==1”不成立,所以用0表示,即false。但是如果:
int i = 2;
if(i = 1)
{
...
}
else
{
...
}
万一程序员一个不小心,把”if(i == 1)”写成”if(i = 1)”,这样就有问题了。在if之内将i赋值为1,if判断里面的内容非0,返回的就是true了,但是明明i为2,比较的值是1,应该返回的false。这种情况在C/C++的开发中是很可能发生的并且会导致一些难以理解的错误产生,所以,为了避免开发者在if语句中不正确的赋值操作,建议将if语句写为:
int i = 2;
if(1 == i)
{
...
}
else
{
...
}
这样,即使开发者不小心写成了”1 = i”,C/C++编译器也可以第一时间检查出来,因为我们可以对一个变量赋值i为1,但是不能对一个常量赋值1为i。
但是,在Java中,C/C++这种”if(i = 1)”的语法是不可能出现的,因为一旦写了这种语法,Java就会编译报错”Type mismatch: cannot convert from int to boolean”。但是,尽管Java的”if(i == 1)”和”if(1 == i)”在语义上没有任何区别,但是从阅读习惯上讲,建议使用前者会更好些。
30、不要对数组使用toString()方法。
看一下对数组使用toString()打印出来的是什么:
public static void main(String[] args)
{
int[] is = new int[]{1, 2, 3};
System.out.println(is.toString());
}
结果是:
[I@18a992f
本意是想打印出数组内容,却有可能因为数组引用is为空而导致空指针异常。不过虽然对数组toString()没有意义,但是对集合toString()是可以打印出集合里面的内容的,因为集合的父类AbstractCollections重写了Object的toString()方法。
31、不要对超出范围的基本数据类型做向下强制转型。
这绝不会得到想要的结果:
public static void main(String[] args)
{
long l = 12345678901234L;
int i = (int)l;
System.out.println(i);
}
我们可能期望得到其中的某几位,但是结果却是:
1942892530
解释一下。Java中long是8个字节64位的,所以12345678901234在计算机中的表示应该是:
0000 0000 0000 0000 0000 1011 0011 1010 0111 0011 1100 1110 0010 1111 1111 0010
一个int型数据是4个字节32位的,从低位取出上面这串二进制数据的前32位是:
0111 0011 1100 1110 0010 1111 1111 0010
这串二进制表示为十进制1942892530,所以就是我们上面控制台上输出的内容。从这个例子上还能顺便得到两个结论:
(1)整型默认的数据类型是int,long l = 12345678901234L,这个数字已经超出了int的范围了,所以最后有一个L,表示这是一个long型数。顺便说一下,浮点型的默认类型是double,所以定义float的时候要写成”float f = 3.5f”。
(2)接下来再写一句”int ii = l + i;”会报错,因为long + int是一个long,不能赋值给int。
32、公用的集合类中不使用的数据一定要及时remove掉。
如果一个集合类是公用的(也就是说不是方法里面的属性),那么这个集合里面的元素是不会自动释放的,因为始终有引用指向它们。所以,如果公用集合里面的某些数据不使用而不去remove掉它们,那么将会造成这个公用集合不断增大,使得系统有内存泄露的隐患。
33、把一个基本数据类型转为字符串,基本数据类型.toString()是最快的方式、String.valueOf(数据)次之、数据+""这种方式最慢。
把一个基本数据类型转为字符串一般有三种方式,我有一个Integer型数据i,可以使用i.toString()、String.valueOf(i)、i+""三种方式,三种方式的效率如何,看一个测试:
public static void main(String[] args)
{
int loopTime = 50000;
Integer i = 0;
long startTime = System.currentTimeMillis();
for (int j = 0; j < loopTime; j++)
{
String str = String.valueOf(i);
}
System.out.println("String.valueOf():" + (System.currentTimeMillis() - startTime) + "ms");
startTime = System.currentTimeMillis();
for (int j = 0; j < loopTime; j++)
{
String str = i.toString();
}
System.out.println("Integer.toString():" + (System.currentTimeMillis() - startTime) + "ms");
startTime = System.currentTimeMillis();
for (int j = 0; j < loopTime; j++)
{
String str = i + "";
}
System.out.println("i + \"\":" + (System.currentTimeMillis() - startTime) + "ms");
}
运行结果为:
String.valueOf():11ms Integer.toString():5ms i + "":25ms
所以以后遇到把一个基本数据类型转为String的时候,优先考虑使用toString()方法。至于为什么,很简单:
(1)String.valueOf()方法底层调用了Integer.toString()方法,但是会在调用前做空判断。
(2)Integer.toString()方法就不说了,直接调用了。
(3)i + ""底层使用了StringBuilder实现,先用append方法拼接,再用toString()方法获取字符串。
三者对比下来,明显是2最快、1次之、3最慢。
34、使用最有效率的方式去遍历Map。
遍历Map的方式有很多,通常场景下我们需要的是遍历Map中的Key和Value,那么推荐使用的、效率最高的方式是:
public static void main(String[] args)
{
HashMap<String, String> hm = new HashMap<String, String>();
hm.put("111", "222");
Set<Map.Entry<String, String>> entrySet = hm.entrySet();
Iterator<Map.Entry<String, String>> iter = entrySet.iterator();
while (iter.hasNext())
{
Map.Entry<String, String> entry = iter.next();
System.out.println(entry.getKey() + "\t" + entry.getValue());
}
}
如果你只是想遍历一下这个Map的key值,那用”Set keySet = hm.keySet();”会比较合适一些。
35、对资源的close()操作建议分开操作。
例如:
try
{
XXX.close();
YYY.close();
}
catch (Exception e)
{ ... }
建议修改为:
try
{
XXX.close();
}
catch (Exception e)
{ ... }
try
{
YYY.close();
}
catch (Exception e)
{ ... }
虽然有些麻烦,却能避免资源泄露。第一段代码的隐患:如果没有修改过的代码,万一XXX.close()抛异常了,那么就进入了catch块中了,YYY.close()不会执行,YYY这块资源就不会回收了,一直占用着,这样的代码一多,是可能引起资源句柄泄露的。而改为上面的写法之后,就保证了无论什么情况下XXX和YYY都会被close掉。
相关推荐
代码优化,一个很重要的课题。可能有些人觉得没用,一些细小的地方有什么好修改的,改与不改对于代码的运行效率有什么影响呢?这个问题我是这么考虑的,像大海里面的鲸鱼一样,它吃一条小虾米有用吗?没用,但是,吃...
代码 基于遗传算法的优化计算——建模自变量降维代码代码 基于遗传算法的优化计算——建模自变量降维代码代码 基于遗传算法的优化计算——建模自变量降维代码代码 基于遗传算法的优化计算——建模自变量降维代码代码...
### 编译原理实验报告-目标代码的优化 #### 实验背景及意义 在软件开发过程中,提升程序的运行效率是至关重要的。编译器作为连接高级语言与机器语言的关键工具,其性能优化能力直接影响到最终程序的执行效率。本...
在C6000系列处理器的C代码优化中,有许多关键点值得我们深入探讨和总结。C6000系列是德州仪器(TI)推出的一系列高性能浮点数字信号处理器,广泛应用于通信、图像处理等领域。针对这类处理器的C语言编程,优化技巧...
代码 GA优化后的RBF神经网络优化分析代码代码 GA优化后的RBF神经网络优化分析代码代码 GA优化后的RBF神经网络优化分析代码代码 GA优化后的RBF神经网络优化分析代码代码 GA优化后的RBF神经网络优化分析代码代码 GA...
3. 目标处理器优化:针对特定的处理器进行代码优化,可以显著提升代码执行效率。这可能包括使用处理器特定的指令集、减少内存访问、或者使用代码替换库(Code Replacement Libraries, CRL)。CRL允许用户自定义特定...
根据给定的文件信息,以下是对.NET代码优化的总结和归纳的知识点。 .NET技术框架自2002年首次推出以来,已经经历了多个版本的更新和优化。在.NET框架中,C#语言作为主要的编程语言,拥有丰富的类库和运行时优化机制...
《代码优化:有效使用内存》是由(美)Kris Kaspersky编写,电子工业出版社出版的一本书籍。系统深入地介绍了各种代码优化编程技术。全书分为4章。第1章集中介绍如何确定程序中消耗CPU时钟最多的热点代码的所谓程序剖析...
代码 基于线性整数规划离散型优化问题代码代码 基于线性整数规划离散型优化问题代码代码 基于线性整数规划离散型优化问题代码代码 基于线性整数规划离散型优化问题代码代码 基于线性整数规划离散型优化问题代码代码 ...
代码 离散型遗传算法求解组合优化代码代码 离散型遗传算法求解组合优化代码代码 离散型遗传算法求解组合优化代码代码 离散型遗传算法求解组合优化代码代码 离散型遗传算法求解组合优化代码代码 离散型遗传算法求解...
代码 基于遗传算法的Bp神经网络优化算法代码代码 基于遗传算法的Bp神经网络优化算法代码代码 基于遗传算法的Bp神经网络优化算法代码代码 基于遗传算法的Bp神经网络优化算法代码代码 基于遗传算法的Bp神经网络优化...
编译原理 代码优化 详细介绍编译原理的代码优化方法
本文将对C++代码优化方法进行详细总结,帮助开发者深入理解并应用这些技术。 1. **编译器优化** 编译器在编译时能够自动进行一些优化,如O0到O3的不同优化级别。O2和O3通常能提供较好的性能提升,但可能会影响调试...
这个“优化算法测试函数MATLAB代码完整版”压缩包提供了全面的资源,包括代码、数据以及算法的详细描述,旨在帮助用户理解和应用各种优化算法。 首先,MATLAB是一个强大的数学计算软件,广泛用于科学计算、图像处理...
reduce优化总结的代码文件夹
祁宇 深入应用C++11 代码优化与工程级应用.pdf
总结,"Windows优化大师"的源代码是一个宝贵的教育资源,它展示了C#在系统优化工具开发中的应用,以及如何通过面向对象设计实现复杂功能。通过对源代码的学习和研究,开发者不仅可以提升编程技能,还可以为自己的...
本篇文章将详细探讨C代码优化的策略,主要围绕"速度优化"这一主题。 一、算法优化 1. **选择合适的数据结构**:数据结构的选择对程序性能有直接影响。例如,数组访问速度快于链表,哈希表用于查找效率高。 2. **...
深入应用C++11代码优化与工程级应用.带书签。完美