除数为2的N次方取模可以用与运算替代，效率更高 (HashMap之数组索引) -

xinklabi

浏览: 1610043 次
性别:
来自: 吉林

最近访客更多访客>>

jamsbone

bbls

netbuddy

rx78liuliu

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

除数为2的N次方取模可以用与运算替代，效率更高 (HashMap之数组索引)

博客分类：

Java

取模运算在包括JAVA在内的大多数语言中的效率都十分低下，而当除数为2的N次方时，取模运算将退化为最简单的位运算，其效率明显提升（按照Bruce Eckel给出的数据，大约可以提升5～8倍）。看看JDK中是如何实现的：

Java代码：

static int indexFor(int h, int length) {
return h & (length-1);
}

[java] view plain copy

static int indexFor(int h, int length) {
return h & (length-1);
}

当key空间长度为2的N次方时，计算hashCode为h的元素的索引可以用简单的与操作来代替笨拙的取模操作！假设某个对象的hashCode为 35（二进制为100011），而hashMap采用默认的initialCapacity（16），那么indexFor计算所得结果将会是 100011 & 1111 = 11，即十进制的3，是不是恰好是35 Mod 16。

上面的方法有一个问题，就是它的计算结果仅有对象hashCode的低位决定，而高位被统统屏蔽了；以上面为例，19（10011）、 35（100011）、67（1000011）等就具有相同的结果。针对这个问题， Joshua Bloch采用了“防御性编程”的解决方法，在使用各对象的hashCode之前对其进行二次Hash，参看JDK中的源码：

Java代码：

static int hash(Object x) {
int h = x.hashCode();
h += ~(h << 9);
h ^= (h >>> 14);
h += (h << 4);
h ^= (h >>> 10);
return h;
}

[java] view plain copy

static int hash(Object x) {
int h = x.hashCode();
h += ~(h << 9);
h ^= (h >>> 14);
h += (h << 4);
h ^= (h >>> 10);
return h;
}

采用这种旋转Hash函数的主要目的是让原有hashCode的高位信息也能被充分利用，且兼顾计算效率以及数据统计的特性，其具体的原理已超出了本文的领域。

加快Hash效率的另一个有效途径是编写良好的自定义对象的HashCode，String的实现采用了如下的计算方法：

Java代码：

for (int i = 0; i < len; i++) {
h = 31*h + val[off++];
}
hash = h;

[java] view plain copy

for (int i = 0; i < len; i++) {
h = 31*h + val[off++];
}
hash = h;

这种方法HashCode的计算方法可能最早出现在Brian W. Kernighan和Dennis M. Ritchie的《The C Programming Language》中，被认为是性价比最高的算法（又被称为times33算法，因为C中乘数常量为33，JAVA中改为31），实际上，包括List在内的大多数的对象都是用这种方法计算Hash值。

分享到：

优化技巧分享：把内存消耗降低至原来的1/20 | ArrayList与Vector区别

2013-06-05 00:28
浏览 1541
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

除数为2的N次方取模可以用与运算替代，效率更高 (HashMap之数组索引)

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

除数为2的N次方取模可以用与运算替代，效率更高 (HashMap之数组索引)

评论

发表评论

相关推荐

Java SE7新特性之二进制字面量

浮点数为什么不精确？为什么银行的金额不能用浮点数计算

计算机是如何计算乘法除法的（实际上都是转换为二进制加法计算）

什么是补码、反码、负数在计算中如何表示

Math.abs()绝对值取到的数不一定是正数

用BigInteger实现大素数生成算法

加密（AES）、公私钥（PKI）、摘要（DIGEST）、签名（SIGNATURE）、证书（CERT）的形象解释和组合用法

RSA加密公私钥生成工具（openssl）

RPC原理详解

Java并发之CountDownLatch、CyclicBarrier和Semaphore

线程间协作的两种方式：wait、notify、notifyAll和Condition

The final local variable xxx cannot be assigned, since it is defined in an enclo

一个奇葩的excel中无法trim的“空格”的问题

List深度复制

Eclipse导入 jar 源码乱码问题

Java高并发编程的各种陷阱

ASM介绍（java字节码操作利器）

JDK 7 中的 Fork/Join 模式（并发处理）

Java常见内存溢出异常分析

dom4j解析带有命名空间的xml

最近访客更多访客>>