`

尽可能使用堆栈变量

    博客分类:
  • java
 
阅读更多

如果您频繁存取变量,就需要考虑从何处存取这些变量。变量是

static

 

变量,还是堆栈变量,或者是类的实例变量?变量的存储位置对存取它的代码的性能有明显的影响?例如,请考虑下面这段代码:

class StackVars
{
  private int instVar;
  private static int staticVar;
  
  //存取堆栈变量
  void stackAccess(int val)
  {
    int j=0;
    for (int i=0; i<val; i++)
      j += 1;
  }
  
  //存取类的实例变量
  void instanceAccess(int val)
  {
    for (int i=0; i<val; i++)
      instVar += 1;
  }   
  
  //存取类的 static 变量
  void staticAccess(int val)
  {
    for (int i=0; i<val; i++)
      staticVar += 1;
  }
}     

 

这段代码中的每个方法都执行相同的循环,并反复相同的次数。唯一的不同是每个循环使一个不同类型的变量递增。方法

stackAccess

 

使一个局部堆栈变量递增, instanceAccess 使类的一个实例变量递增,而 staticAccess 使类的一个 static 变量递增。

instanceAccessstaticAccess 的执行时间基本相同。但是, stackAccess 要快两到三倍。存取堆栈变量如此快是因为,JVM 存取堆栈变量比它存取 static 变量或类的实例变量执行的操作少。请看一下为这三个方法生成的字节码:

Method void stackAccess(int)
   0 iconst_0         //将 0 压入堆栈。
   1 istore_2         //弹出 0 并将它存储在局部分变量表中索引为 2 的位置 (j)。
   2 iconst_0         //压入 0。
   3 istore_3         //弹出 0 并将它存储在局部变量表中索引为 3 的位置 (i)。
   4 goto 13          //跳至位置 13。
   7 iinc 2 1         //将存储在索引 2 处的 j 加 1。
  10 iinc 3 1         //将存储在索引 3 处的 i 加 1。
  13 iload_3          //压入索引 3 处的值 (i)。
  14 iload_1          //压入索引 1 处的值 (val)。
  15 if_icmplt 7      //弹出 i 和 val。如果 i 小于 val,则跳至位置 7。
  18 return           //返回调用方法。
  
Method void instanceAccess(int)
   0 iconst_0         //将 0 压入堆栈。
   1 istore_2         //弹出 0 并将它存储在局部变量表中索引为 2 的位置 (i)。
   2 goto 18          //跳至位置 18。
   5 aload_0          //压入索引 0 (this)。
   6 dup              //复制堆栈顶的值并将它压入。
   7 getfield #19 <Field int instVar>
                      //弹出 this 对象引用并压入 instVar 的值。
  10 iconst_1         //压入 1。
  11 iadd             //弹出栈顶的两个值,并压入它们的和。
  12 putfield #19 <Field int instVar>
                      //弹出栈顶的两个值并将和存储在 instVar 中。
  15 iinc 2 1         //将存储在索引 2 处的 i 加 1。
  18 iload_2          //压入索引 2 处的值 (i)。
  19 iload_1          //压入索引 1 处的值 (val)。
  20 if_icmplt 5      //弹出 i 和 val。如果 i 小于 val,则跳至位置 5。
  23 return           //返回调用方法。
  
Method void staticAccess(int)
   0 iconst_0         //将 0 压入堆栈。
   1 istore_2         //弹出 0 并将它存储在局部变量表中索引为 2 的位置 (i)。
   2 goto 16          //跳至位置 16。
   5 getstatic #25 <Field int staticVar>
                      //将常数存储池中 staticVar 的值压入堆栈。
   8 iconst_1         //压入 1。
   9 iadd             //弹出栈顶的两个值,并压入它们的和。
  10 putstatic #25 <Field int staticVar>
                      //弹出和的值并将它存储在 staticVar 中。
  13 iinc 2 1         //将存储在索引 2 处的 i 加 1。
  16 iload_2          //压入索引 2 处的值 (i)。
  17 iload_1          //压入索引 1 处的值 (val)。
  18 if_icmplt 5      //弹出 i 和 val。如果 i 小于 val,则跳至位置 5。
  21 return           //返回调用方法。

 

查看字节码揭示了堆栈变量效率更高的原因。JVM 是一种基于堆栈的虚拟机,因此优化了对堆栈数据的存取和处理。所有局部变量都存储在一个局部变量表中,在 Java 操作数堆栈中进行处理,并可被高效地存取。存取 static 变量和实例变量成本更高,因为 JVM 必须使用代价更高的操作码,并从常数存储池中存取它们。(常数存储池保存一个类型所使用的所有类型、字段和方法的符号引用。)

通常,在第一次从常数存储池中访问 static 变量或实例变量以后,JVM 将动态更改字节码以使用效率更高的操作码。尽管有这种优化,堆栈变量的存取仍然更快。

考虑到这些事实,就可以重新构建前面的代码,以便通过存取堆栈变量而不是实例变量或 static 变量使操作更高效。请考虑修改后的代码:

class StackVars
{
  //与前面相同...
  void instanceAccess(int val)
  {
    int j = instVar;
    for (int i=0; i<val; i++)
      j += 1;
    instVar = j;
  }  
  
  void staticAccess(int val)
  {
    int j = staticVar;
    for (int i=0; i<val; i++)
      j += 1;
    staticVar = j;
  }
}    

 

方法 instanceAccessstaticAccess 被修改为将它们的实例变量或 static 变量复制到局部堆栈变量中。当变量的处理完成以后,其值又被复制回实例变量或 static 变量中。这种简单的更改明显提高了 instanceAccessstaticAccess 的性能。这三个方法的执行时间现在基本相同, instanceAccessstaticAccess 的执行速度只比 stackAccess 的执行速度慢大约 4%。

这并不表示您应该避免使用 static 变量或实例变量。您应该使用对您的设计有意义的存储机制。例如,如果您在一个循环中存取 static 变量或实例变量,则您可以临时将它们存储在一个局部堆栈变量中,这样就可以明显地提高代码的性能。这将提供最高效的字节码指令序列供 JVM 执行。

分享到:
评论

相关推荐

    MCS51单片机程序设计时堆栈的计算方法解析

    此外,程序员还应该合理组织代码结构,尽可能减少不必要的局部变量,避免过深的函数嵌套,并且在可能的情况下,使用寄存器变量来代替堆栈变量,以减少堆栈空间的占用。 综上所述,堆栈在MCS51单片机程序设计中扮演...

    vC 堆栈 异常处理

    这意味着在抛出异常时,程序应尽可能保持数据的一致性和完整性。例如,如果在执行过程中出现异常,资源(如动态分配的内存)应被正确地释放,以防止内存泄漏。 总的来说,"vC 堆栈 异常处理"涉及的是C++编程中如何...

    堆栈溢出之类的问题和答案的脚本功能1.3.zip

    1. **优化递归**:确保所有的递归函数都有正确的退出条件,并尽可能减少递归深度。 2. **减少局部变量**:尽量避免在函数中声明大量或大型的局部变量,可以考虑使用全局变量或类成员代替。 3. **使用堆分配**:对于...

    51单片机堆栈深入剖析

    通过分析函数结构和变量使用,我们可以计算出所需的堆栈空间。 总之,51单片机的堆栈管理是C51程序设计的重要组成部分。理解堆栈的工作原理,准确计算堆栈大小,能够有效地优化内存使用,提高程序的稳定性和效率。...

    行业分类-设备装置-在TCL语言中创建、应用指针变量的方法、装置及系统.zip

    7. **最佳实践**:在编写TCL代码时,应尽可能地使用局部变量以减少副作用。如果确实需要使用`upvar`或`interp alias`,请确保提供清晰的文档,说明这些变量的用途和可能的影响,以便其他开发者理解。 总结来说,TCL...

    基于嵌入式系统中c语言代码运行效率探析.pdf

    由于寄存器的访问速度远快于内存,因此应当控制函数的参数数量在四个以下,以保证参数能尽可能地在寄存器中传递。当参数数量超过四个时,则需要使用堆栈传递,这时性能会有一定下降。 文章还提及了在编程实践中如何...

    FreeRTOS_RAM使用情况及优化方法.pdf

    例如,可以使用 FreeRTOS 提供的方法来获得哪些 RAM 被分配了但是没有被使用,可以在开发的后期对 FreeRTOS 进行尽可能小的配置,或者根据应用的情况,将最大优先级和最小堆栈量设置的尽可能小等。 本文档提供了对 ...

    MSP430的C语言编写的注意事项

    因此,应尽可能地限制这类数据类型的使用,以减少内存消耗和提高处理速度。 3. 注意位操作的使用。由于MSP430的C编译器不支持位寻址,频繁的位操作会降低代码效率,因此应尽量减少位操作的使用,尤其是在关键的性能...

    MSP430 应用笔记

    - 尽可能使用局部变量而非全局变量或静态变量。这样做有助于编译器优化代码,尤其是在局部变量的使用过程中避免使用`&`取地址符,以免导致编译器无法将该变量放入CPU寄存器中。 6. **函数调用的优化** - 如果...

    第六章Python函数习题及答案--中文

    6.18 节变量的范围:尽可能避免使用全局变量,应该尽量使用局部变量。 本章节讲解了 Python 函数的基本概念和应用,包括函数的定义、函数的调用、函数的参数、函数的返回值等,同时也探讨了变量的范围和按值传递...

    8位单片机的程序优化11条

    8051单片机不支持符号运算,因此在程序设计时应尽可能避免使用含带符号变量的外部代码。除非确实需要表示负数,否则推荐将所有变量定义为无符号类型(如`unsigned char`、`unsigned int`)。这种做法不仅简化了运算...

    浅谈Java程序的性能优化

    因此,在不影响程序逻辑的前提下,尽可能使用局部变量。 6. **利用移位操作代替乘法和除法**:移位操作比乘法和除法更快,尤其是在循环中,可以显著提升性能。例如,用左移操作替代乘以2的倍数,右移操作替代除以2...

    Kevin 用于 AVR微控制器 的 RTOS_C语言_代码_相关文件_下载

    这是一个基于任务的抢先式实时操作系统,旨在消耗尽可能少的资源,同时提高使用 AVR 微控制器的系统的有效利用率。 这个项目的动机源于我自己写这样的东西的愿望。还有许多其他可用的选项,它们可能写得更好,更...

    ARM汇编和C语言的优化.pdf

    - 函数返回值和参数尽可能使用`int`类型,以减少数据转换的开销。 3. **循环结构的优化**: - 使用减法循环,避免每次循环都进行减法计算。 - 使用无符号循环计数器,以避免负数比较带来的额外操作。 - 对于...

    程序优化方法

    - 在处理数据时,尽可能使用 32 位数据类型,如 `int` 或 `long`,以利用 ARM 的 32 位运算优势。避免使用 `char` 和 `short` 类型,除非它们的零溢出特性是有意为之的。 2. 局部变量处理: - 避免在循环中使用 `...

    android-miniapp:miniapp Android堆栈溢出

    1. **优化递归**:尽可能避免深度递归,或者使用尾递归优化,使得每次递归不再在栈上分配新空间。 2. **减少局部变量**:尽量避免在函数中声明过多或过大的局部变量,可以考虑使用全局变量或对象实例来存储数据。 3....

    8位单片机的C语言优化技巧.

    尽可能使用局部变量,仅在必要时才使用全局变量。 8. **预编译宏**: - 利用预编译宏进行条件编译,根据不同的硬件配置生成优化过的代码。 9. **编译器特性**: - 不同的8位单片机C编译器可能有其特定的优化选项...

    51单片机C语言编程技巧_陶孝海.pdf

    在C语言中,可以使用`register`关键字声明变量,这样编译器会尽可能地将该变量分配到CPU的寄存器中,而不是将其放在内存中。这可以减少内存访问次数,进而提升程序性能。需要注意的是,并不是所有的变量都适合声明为...

    嵌入式ARM的C和C++代码优化

    - 局部变量应尽可能减少数量,并使用32位数据类型,以减少内存访问和提高计算效率。 - 函数参数应优先使用`int`类型,减少堆栈使用,同时对于频繁调用的函数,考虑使用小数据类型节省空间。 - 避免在循环中使用...

    C#.net编程规范

    - 常量和字段变量使用 PascalCase,但静态常量全部大写,如 `public const int MAX_SIZE`。 - 局部变量和参数使用 camelCase(首字母小写)。 - 命名应清晰且具有描述性,避免使用缩写,除非是公认的缩写,如 `...

Global site tag (gtag.js) - Google Analytics