`
chenhaodejia
  • 浏览: 114612 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

有关代码结构的优化若干

阅读更多
避免建立对象

世界上没有免费的对象。虽然GC为每个线程都建立了临时对象池,可以使创建对象的代价变得小一些,但是分配内存永远都比不分配内存的代价大。

如果你在用户界面循环中分配对象内存,就会引发周期性的垃圾回收,用户就会觉得界面像打嗝一样一顿一顿的。

所以,除非必要,应尽量避免尽力对象的实例。下面的例子将帮助你理解这条原则:

当你从用户输入的数据中截取一段字符串时,尽量使用substring函数取得原始数据的一个子串,而不是为子串另外建立一份拷贝。这样你就有一个新的String对象,它与原始数据共享一个char数组。
如果你有一个函数返回一个String对象,而你确切的知道这个字符串会被附加到一个StringBuffer,那么,请改变这个函数的参数和实现方式,直接把结果附加到StringBuffer中,而不要再建立一个短命的临时对象。
一个更极端的例子是,把多维数组分成多个一维数组。

int数组比Integer数组好,这也概括了一个基本事实,两个平行的int数组比(int,int)对象数组性能要好很多。同理,这试用于所有基本类型的组合。
如果你想用一种容器存储(Foo,Bar)元组,尝试使用两个单独的Foo[]数组和Bar[]数组,一定比(Foo,Bar)数组效率更高。(也有例外的情况,就是当你建立一个API,让别人调用它的时候。这时候你要注重对API借口的设计而牺牲一点儿速度。当然在API的内部,你仍要尽可能的提高代码的效率)

总体来说,就是避免创建短命的临时对象。减少对象的创建就能减少垃圾收集,进而减少对用户体验的影响。

使用本地方法

当你在处理字串的时候,不要吝惜使用String.indexOf(), String.lastIndexOf()等特殊实现的方法(specialty methods)。这些方法都是使用C/C++实现的,比起Java循环快10到100倍。

使用实类比接口好

假设你有一个HashMap对象,你可以将它声明为HashMap或者Map:

Map myMap1 = new HashMap();
HashMap myMap2 = new HashMap();
哪个更好呢?

按照传统的观点Map会更好些,因为这样你可以改变他的具体实现类,只要这个类继承自Map接口。传统的观点对于传统的程序是正确的,但是它并不适合嵌入式系统。调用一个接口的引用会比调用实体类的引用多花费一倍的时间。

如果HashMap完全适合你的程序,那么使用Map就没有什么价值。如果有些地方你不能确定,先避免使用Map,剩下的交给IDE提供的重构功能好了。(当然公共API是一个例外:一个好的API常常会牺牲一些性能)

用静态方法比虚方法好

如果你不需要访问一个对象的成员变量,那么请把方法声明成static。虚方法执行的更快,因为它可以被直接调用而不需要一个虚函数表。另外你也可以通过声明体现出这个函数的调用不会改变对象的状态。

不用getter和setter

在很多本地语言如C++中,都会使用getter(比如:i = getCount())来避免直接访问成员变量(i = mCount)。在C++中这是一个非常好的习惯,因为编译器能够内联访问,如果你需要约束或调试变量,你可以在任何时候添加代码。

在Android上,这就不是个好主意了。虚方法的开销比直接访问成员变量大得多。在通用的接口定义中,可以依照OO的方式定义getters和setters,但是在一般的类中,你应该直接访问变量。

将成员变量缓存到本地

访问成员变量比访问本地变量慢得多,下面一段代码:

Java代码

1 for (int i = 0; i < this.mCount; i++)  

2     dumpItem(this.mItems[i]); 


最好改成这样:

Java代码

3 int count = this.mCount;  

4 Item[] items = this.mItems;  

5 for (int i = 0; i < count; i++)  

6     dumpItems(items[i]); 


(使用"this"是为了表明这些是成员变量)

另一个相似的原则是:永远不要在for的第二个条件中调用任何方法。如下面方法所示,在每次循环的时候都会调用getCount()方法,这样做比你在一个int先把结果保存起来开销大很多。

Java代码

7 for (int i = 0; i < this.getCount(); i++)  

8     dumpItems(this.getItem(i)); 


同样如果你要多次访问一个变量,也最好先为它建立一个本地变量,例如:

Java代码

9 protected void drawHorizontalScrollBar(Canvas canvas, int width, int height) {  

10     if (isHorizontalScrollBarEnabled()) {  

11         int size = mScrollBar.getSize(false);  

12         if (size <= 0) {  

13             size = mScrollBarSize;  

14         }  

15         mScrollBar.setBounds(0, height - size, width, height);  

16         mScrollBar.setParams(computeHorizontalScrollRange(),computeHorizontalScrollOffset(),computeHorizontalScrollExtent(), false);  

17         mScrollBar.draw(canvas);  

18     }  

19 } 



这里有4次访问成员变量mScrollBar,如果将它缓存到本地,4次成员变量访问就会变成4次效率更高的栈变量访问。

另外就是方法的参数与本地变量的效率相同。

使用常量

让我们来看看这两段在类前面的声明:

Java代码

20 static int intVal = 42;  

21 static String strVal = "Hello, world!"; 


必以其会生成一个叫做<clinit>的初始化类的方法,当类第一次被使用的时候这个方法会被执行。方法会将42赋给intVal,然后把一个指向类中常量表的引用赋给strVal。当以后要用到这些值的时候,会在成员变量表中查找到他们。

下面我们做些改进,使用“final"关键字:

Java代码

22 static final int intVal = 42;  

23 static final String strVal = "Hello, world!"; 


现在,类不再需要<clinit>方法,因为在成员变量初始化的时候,会将常量直接保存到类文件中。用到intVal的代码被直接替换成42,而使用strVal的会指向一个字符串常量,而不是使用成员变量。

将一个方法或类声明为"final"不会带来性能的提升,但是会帮助编译器优化代码。举例说,如果编译器知道一个"getter"方法不会被重载,那么编译器会对其采用内联调用。

你也可以将本地变量声明为"final",同样,这也不会带来性能的提升。使用"final"只能使本地变量看起来更清晰些(但是也有些时候这是必须的,比如在使用匿名内部类的时候)(xing:原文是 or you have to, e.g. for use in an anonymous inner class)

谨慎使用foreach

foreach可以用在实现了Iterable接口的集合类型上。foreach会给这些对象分配一个iterator,然后调用 hasNext()和next()方法。你最好使用foreach处理ArrayList对象,但是对其他集合对象,foreach相当于使用 iterator。

下面展示了foreach一种可接受的用法:

Java代码

24 public class Foo {  

25     int mSplat;  

26     static Foo mArray[] = new Foo[27];   

27  

28     public static void zero() {  

29         int sum = 0;  

30         for (int i = 0; i < mArray.length; i++) {  

31             sum += mArray[i].mSplat;  

32         }  

33     }  

34  

35     public static void one() {  

36         int sum = 0;  

37         Foo[] localArray = mArray;  

38         int len = localArray.length;  

39         for (int i = 0; i < len; i++) {  

40         sum += localArray[i].mSplat;  

41         }  

42     }   

43  

44     public static void two() {  

45         int sum = 0;  

46         for (Foo a: mArray) {  

47             sum += a.mSplat;  

48         }  

49     }  

50 } 



在zero()中,每次循环都会访问两次静态成员变量,取得一次数组的长度。
retrieves the static field twice and gets the array length once for every iteration through the loop.

在one()中,将所有成员变量存储到本地变量。
pulls everything out into local variables, avoiding the lookups.

two()使用了在java1.5中引入的foreach语法。编译器会将对数组的引用和数组的长度保存到本地变量中,这对访问数组元素非常好。但是编译器还会在每次循环中产生一个额外的对本地变量的存储操作(对变量a的存取)这样会比one()多出4个字节,速度要稍微慢一些。

综上所述:foreach语法在运用于array时性能很好,但是运用于其他集合对象时要小心,因为它会产生额外的对象。

避免使用枚举

枚举变量非常方便,但不幸的是它会牺牲执行的速度和并大幅增加文件体积。例如:

public class Foo {public enum Shrubbery { GROUND, CRAWLING, HANGING }}

会产生一个900字节的.class文件(Foo$Shubbery.class)。在它被首次调用时,这个类会调用初始化方法来准备每个枚举变量。每个枚举项都会被声明成一个静态变量,并被赋值。然后将这些静态变量放在一个名为"$VALUES"的静态数组变量中。而这么一大堆代码,仅仅是为了使用三个整数。

这样:

Shrubbery shrub = Shrubbery.GROUND;会引起一个对静态变量的引用,如果这个静态变量是final int,那么编译器会直接内联这个常数。

一方面说,使用枚举变量可以让你的API更出色,并能提供编译时的检查。所以在通常的时候你毫无疑问应该为公共API选择枚举变量。但是当性能方面有所限制的时候,你就应该避免这种做法了。

有些情况下,使用ordinal()方法获取枚举变量的整数值会更好一些,举例来说,将:

Java代码

51 for (int n = 0; n < list.size(); n++) {  

52     if (list.items[n].e == MyEnum.VAL_X)// do stuff 1 

53     else if (list.items[n].e == MyEnum.VAL_Y)// do stuff 2 

54 } 



替换为:

Java代码

55 int valX = MyEnum.VAL_X.ordinal();  

56 int valY = MyEnum.VAL_Y.ordinal();  

57 int count = list.size();  

58 MyItem items = list.items();  

59 for (int n = 0; n < count; n++) {  

60     int valItem = items[n].e.ordinal();  

61     if (valItem == valX)// do stuff 1 

62     else if (valItem == valY)// do stuff 2 

63 } 



会使性能得到一些改善,但这并不是最终的解决之道。

将与内部类一同使用的变量声明在包范围内

请看下面的类定义:

Java代码

64 public class Foo {  

65     private int mValue;   

66     public void run() {  

67         Inner in = new Inner();  

68         mValue = 27;  

69         in.stuff();  

70     }  

71  

72     private void doStuff(int value) {  

73         System.out.println("Value is " + value);  

74     }  

75  

76     private class Inner {  

77         void stuff() {  

78             Foo.this.doStuff(Foo.this.mValue);  

79         }  

80     }  

81 } 



这其中的关键是,我们定义了一个内部类(Foo$Inner),它需要访问外部类的私有域变量和函数。这是合法的,并且会打印出我们希望的结果"Value is 27"。

问题是在技术上来讲(在幕后)Foo$Inner是一个完全独立的类,它要直接访问Foo的私有成员是非法的。要跨越这个鸿沟,编译器需要生成一组方法:

Java代码

82 static int Foo.access$100(Foo foo) {  

83     return foo.mValue;  

84 }  

85  

86 static void Foo.access$200(Foo foo, int value) {  

87     foo.doStuff(value);  

88 } 



内部类在每次访问"mValue"和"doStuff"方法时,都会调用这些静态方法。就是说,上面的代码说明了一个问题,你是在通过接口方法访问这些成员变量和函数而不是直接调用它们。在前面我们已经说过,使用接口方法(getter、setter)比直接访问速度要慢。所以这个例子就是在特定语法下面产生的一个“隐性的”性能障碍。

通过将内部类访问的变量和函数声明由私有范围改为包范围,我们可以避免这个问题。这样做可以让代码运行更快,并且避免产生额外的静态方法。(遗憾的是,这些域和方法可以被同一个包内的其他类直接访问,这与经典的OO原则相违背。因此当你设计公共API的时候应该谨慎使用这条优化原则)

避免使用浮点数

在奔腾CPU出现之前,游戏设计者做得最多的就是整数运算。随着奔腾的到来,浮点运算处理器成为了CPU内置的特性,浮点和整数配合使用,能够让你的游戏运行得更顺畅。通常在桌面电脑上,你可以随意的使用浮点运算。

但是非常遗憾,嵌入式处理器通常没有支持浮点运算的硬件,所有对"float"和"double"的运算都是通过软件实现的。一些基本的浮点运算,甚至需要毫秒级的时间才能完成。

甚至是整数,一些芯片有对乘法的硬件支持而缺少对除法的支持。这种情况下,整数的除法和取模运算也是有软件来完成的。所以当你在使用哈希表或者做大量数学运算时一定要小心谨慎。 ”
分享到:
评论

相关推荐

    半正定优化在桁架结构设计中的应用

    桁架结构优化设计的主要目标是减轻结构整体重量,同时满足特定的振动频率要求,以确保结构的性能和稳定性。在桁架结构优化设计领域,涉及振动频率的优化问题尤其受到关注。 本文的研究聚焦于具有物理对称性的桁架...

    优化设计方法的若干创新内容

    在深入探讨优化设计方法时,首先需要了解优化设计的广泛性和重要性。优化设计是一门具有超过一百年历史的学科,尤其在机械领域内研究十分广泛,已形成了一个具有完整理论体系和在大学课程体系中有重要地位的学科。...

    优化php的若干建议

    - **解释**:重构不仅可以优化代码结构,还可以提高代码的可维护性和性能。 #### 27. 代码的优化 - **描述**:持续优化代码可以不断提高应用的性能。 - **解释**:随着技术的发展和业务需求的变化,不断优化代码以...

    基于 DSP 的视频算法系统优化若干策略

    优化策略包括减少判断跳转的代码,采用查表或Intrinsics指令替换比较操作,以及利用#pragma指令向编译器提供更多信息。在C代码无法满足要求时,可逐步过渡到线性汇编,甚至直接编写汇编代码,但需谨慎,以确保实现高...

    软件体系结构优化研究.pptx

    - **可维护性**:保持良好的代码结构和文档。 - **可扩展性**:支持未来的功能扩展和技术演进。 - **安全性**:确保数据和系统的安全。 #### 三、评估方法与指标 - **性能评估**:包括响应时间、系统吞吐量、...

    DaVinci DSP端代码优化策略

    以上策略需要根据具体应用需求和代码结构灵活运用。在优化过程中,应持续关注代码可读性和维护性,确保优化效果的同时不牺牲代码质量。通过这些方法,可以显著提升DaVinci DSP上的程序运行效率,充分发挥其硬件潜能...

    代码 基于动态规划离散优化问题代码.rar

    4. **代码结构分析**:压缩包中的代码可能包含以下几个部分: - 输入处理:定义问题的输入数据结构,如矩阵、数组等。 - 状态定义:确定问题的状态空间,定义每个状态的含义。 - 状态转移方程:描述从一个状态到...

    MATLAB优化与控制模型代码 多目标快速非支配排序遗传算法优化代码.zip

    通过编写MATLAB代码,用户可以自定义复杂的优化模型,包括线性、非线性、连续和离散优化问题,以及多目标优化问题。 4. NSGA-2的实际应用: 多目标优化在工程设计、经济管理、环境规划等多个领域都有广泛应用。例如...

    数据结构若干例题

    数据结构是计算机科学中的核心课程,它探讨了如何在计算机中高效地组织和管理数据,以便于进行...每一道题目的解答都应包括思路分析、算法描述、代码实现和时间/空间复杂度分析,有助于全面掌握和应用数据结构知识。

    数据结构,森林编程作业代码

    在本主题中,我们聚焦于一种特殊的数据结构——森林,以及与之相关的编程作业代码。森林是由若干棵树构成的数据结构,而每棵树内部则通过节点和边的关系来表达数据间的层次关系。 森林在数据结构中的地位十分重要,...

    数据结构 代码code.zip

    在“数据结构 代码code.zip”这个压缩包中,你可以找到一系列与数据结构相关的实现代码,覆盖了从基础到高级的数据结构类型,以及它们的常见操作。 首先,我们来了解一下线性表。线性表是最基本的数据结构之一,它...

    数据结构(c语言版)书上所有的源代码

    本压缩包包含的是《数据结构(C语言版)》一书中的所有源代码,为学习者提供了宝贵的实践资源。 源代码通常分为若干部分,每部分对应书中的一个章节或案例。例如,"BC"可能表示"Binary Tree"(二叉树)或者"Basic ...

    代码 基于全染色算法的图优化代码.rar

    这个名为"基于全染色算法的图优化代码"的压缩包可能包含若干个源代码文件,比如`.cpp`或`.py`,它们实现了全染色算法的不同版本。开发者可能使用了不同的数据结构(如邻接矩阵或邻接表)来表示图,并通过递归、迭代...

    garbf_RBF_rbfGA_RBF优化_ga-rbf_神经网络_

    总结来说,这个压缩包文件中的内容可能包括了GA优化RBF网络的源代码、实验数据、训练和测试过程的记录,以及可能的性能评估报告。通过对这些资料的学习和研究,我们可以掌握如何利用遗传算法来提升RBF神经网络的性能...

    基于人工蜂群优化算法实现机器人路径规划附Matlab代码.zip

    4. **代码结构**:根据压缩包内的文件名,我们可以推测代码包含了一个主文件和若干辅助函数。主文件可能定义了问题的参数,如机器人的初始和目标位置、环境地图以及ABC算法的参数。辅助函数可能包括了环境模型的构建...

    多目标优化NSGA3代码,NSGAII多目标算法,Python源码.zip

    对于多目标优化问题,Python有若干库可以实现NSGA-II和NSGA-III算法,如DEAP(Distributed Evolutionary Algorithms in Python)和PyGMO(Python Global Optimization Module)。这些库提供了方便的接口,使得用户...

    搜索方法中的剪枝优化

    总的来说,搜索方法中的剪枝优化是一种强大的工具,它利用问题的内在结构和约束来减少搜索空间,提高算法的运行速度。在实际应用中,理解问题特性,设计合适的剪枝策略,以及不断优化估价函数,都是实现有效剪枝的...

    数据结构(严蔚敏)配套C代码

    这本书涵盖了数据结构的基本概念、设计与实现,以及相关的算法分析。本压缩包提供了严蔚敏教授书中数据结构的C语言实现,包括线性表、链表、树和森林等关键数据结构。 线性表是一种最基础的数据结构,它是由n(n&gt;=0...

    matlab编写的LBFGS优化算法

    3. **可扩展性**:代码结构清晰,易于添加自定义的函数评估和终止条件。 4. **适应性**:算法能够适应不同的优化问题,包括约束和无约束问题。 **四、应用场景** 1. **机器学习模型的参数优化**:在训练神经网络、...

Global site tag (gtag.js) - Google Analytics