`
dengminhui
  • 浏览: 167878 次
  • 来自: ...
社区版块
存档分类
最新评论

遍历大容量map的正确方法

阅读更多

首先,遍历map有以下方法:

import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;

public class MapTest {

	public static void main(String[] args) {
		Map<String, String> map = new HashMap<String, String>();
		map.put("1", "1");
		map.put("2", "2");
		map.put("3", "3");


		// 第一种:通过Map.keySet遍历key和value
		System.out.println("通过Map.keySet遍历key和value:");
		for (String key : map.keySet()) {
			System.out.println("key= " + key + "  and  value= " + map.get(key));
		}
		
		// 第二种:通过Map.entrySet使用iterator遍历key和value
		System.out.println("通过Map.entrySet使用iterator遍历key和value:");
		Iterator<Map.Entry<String, String>> it = map.entrySet().iterator();
		while (it.hasNext()) {
			Map.Entry<String, String> entry = it.next();

			System.out.println("key= " + entry.getKey() + "  and  value= "
					+ entry.getValue());
		}

		// 第三种:通过Map.entrySet遍历key和value
		System.out.println("通过Map.entrySet遍历key和value:");
		for (Map.Entry<String, String> entry : map.entrySet()) {
			System.out.println("key= " + entry.getKey() + "  and  value= "
					+ entry.getValue());
		}

		// 第四种:通过Map.values()遍历所有的value,但是不能遍历键key
		System.out.println("通过Map.values()遍历所有的value:");
		for (String v : map.values()) {
			System.out.println("value= " + v);
		}
	}

}
 

结果如下:

通过Map.keySet遍历key和value:
key= 3  and  value= 3
key= 2  and  value= 2
key= 1  and  value= 1
通过Map.entrySet使用iterator遍历key和value:
key= 3  and  value= 3
key= 2  and  value= 2
key= 1  and  value= 1
通过Map.entrySet遍历key和value:
key= 3  and  value= 3
key= 2  and  value= 2
key= 1  and  value= 1
通过Map.values()遍历所有的value:
value= 3
value= 2
value= 1
 

这四种方法都可以遍历map:

第一种是目前许多人最喜欢的一种方式,因为代码最少,看起来最简单,通过遍历keySet,再将key所对应的value查询出来,这里有一个二次取值的过程,所以并不推荐;

第二种和第三种原理是相同的,都是通过遍历Map.Entry的方式,将Entry中的key和value打印出来,第三种是比较推荐写法,因为采用jdk1.5后的遍历形式,代码看起来比较整洁;

第四种比较少用,因为我们大多数时候都是同时需要key和value的

 

综上所述,如果map里面内容比较少,其实采用哪种方式都可以,第一种和第三种相对简洁一些;但是一旦容量非常大时,更推荐采用第三种方式,相比于第一种将极大地节省性能。

 

修改一下代码,对执行时间执行一下测试

 

import java.util.HashMap;
import java.util.Map;

public class MapTest {
	static long MAX_LONG = 1000000L;
	static int TIMES = 10;
	static Map<String, String> map1 = new HashMap<String, String>();
	static Map<String, String> map2 = new HashMap<String, String>();
	static {
		for (long i = 0; i < MAX_LONG; i++) {
			map1.put("1" + i, "abc" + i);
			map2.put("2" + i, "def" + i);
		}
	}

	public static void main(String[] args) {

		String valueStr = ""; 
		String keyStr = "";
		long start, end;
		double totalMs;



		totalMs = 0;
		for (int i = 0; i < TIMES; i++) {

			// 通过Map.keySet遍历key和value
			start = System.currentTimeMillis();
			for (String key : map1.keySet()) {
				keyStr = key;
				valueStr = map1.get(key);
			}
			end = System.currentTimeMillis();
			System.out.println("通过Map.keySet遍历key和value耗时 " + (end - start)
					+ " ms ");
			totalMs += (end - start);
		}
		System.out.println("Times : " + TIMES + ", totalMs : " + totalMs
				+ "ms, average :" + totalMs / TIMES + "ms");
		
		
		totalMs = 0;
		for (int i = 0; i < TIMES; i++) {
			// 通过Map.entrySet遍历key和value
			start = System.currentTimeMillis();
			for (Map.Entry<String, String> entry : map2.entrySet()) {
				keyStr = entry.getKey();
				valueStr = entry.getValue();
			}
			end = System.currentTimeMillis();
			System.out.println("通过Map.entrySet遍历key和value耗时 " + (end - start)
					+ " ms ");
			totalMs += (end - start);
		}
		System.out.println("Times : " + TIMES + ", totalMs : " + totalMs
				+ "ms, average :" + totalMs / TIMES + "ms");

	}

}

 以下是测试结果:

通过Map.keySet遍历key和value耗时 186 ms 
通过Map.keySet遍历key和value耗时 189 ms 
通过Map.keySet遍历key和value耗时 87 ms 
通过Map.keySet遍历key和value耗时 89 ms 
通过Map.keySet遍历key和value耗时 84 ms 
通过Map.keySet遍历key和value耗时 92 ms 
通过Map.keySet遍历key和value耗时 85 ms 
通过Map.keySet遍历key和value耗时 94 ms 
通过Map.keySet遍历key和value耗时 89 ms 
通过Map.keySet遍历key和value耗时 91 ms 
Times : 10, totalMs : 1086.0ms, average :108.6ms
通过Map.entrySet遍历key和value耗时 112 ms 
通过Map.entrySet遍历key和value耗时 98 ms 
通过Map.entrySet遍历key和value耗时 71 ms 
通过Map.entrySet遍历key和value耗时 65 ms 
通过Map.entrySet遍历key和value耗时 65 ms 
通过Map.entrySet遍历key和value耗时 64 ms 
通过Map.entrySet遍历key和value耗时 64 ms 
通过Map.entrySet遍历key和value耗时 65 ms 
通过Map.entrySet遍历key和value耗时 65 ms 
通过Map.entrySet遍历key和value耗时 65 ms 
Times : 10, totalMs : 734.0ms, average :73.4ms

 可以看出,百万级别的量时,使用keySet和entrySet遍历,执行时间大概为1.5:1,这并不是最主要的差异。真正的差异还是必须看代码

map.get(key))

时执行的hash操作

    /**
     * Returns the value to which the specified key is mapped,
     * or {@code null} if this map contains no mapping for the key.
     *
     * <p>More formally, if this map contains a mapping from a key
     * {@code k} to a value {@code v} such that {@code (key==null ? k==null :
     * key.equals(k))}, then this method returns {@code v}; otherwise
     * it returns {@code null}.  (There can be at most one such mapping.)
     *
     * <p>A return value of {@code null} does not <i>necessarily</i>
     * indicate that the map contains no mapping for the key; it's also
     * possible that the map explicitly maps the key to {@code null}.
     * The {@link #containsKey containsKey} operation may be used to
     * distinguish these two cases.
     *
     * @see #put(Object, Object)
     */
    public V get(Object key) {
        if (key == null)
            return getForNullKey();
        int hash = hash(key.hashCode());
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
        }
        return null;
    }

 

计算hashCode是CPU密集运算,非常耗费CPU资源,如果对一个比较大的map进行遍历,会出现CPU迅速飚高的现象,直接影响机器的响应速度,在多线程的情况下,简直就是一场灾难,而采用entrySet来进行遍历,则无此问题,对这个有兴趣的同学,可以使用自己的机器试一试。

 

36
2
分享到:
评论
29 楼 chenhongwei0924 2010-12-20  
不错。。。 值得学习..
28 楼 fm_974 2010-10-26  
有研究精神!赞一个
27 楼 zhang_xzhi_xjtu 2010-10-25  
加上静态代码检查工具 就会发现第一种方法会有warn的。
26 楼 Java_Travler 2010-10-25  
很好,这样的帖子才应该鼓励和支持!这样大家才有讨论的热点和兴趣!才能学到或更好的理解更多的东西!
25 楼 風一樣的男子 2010-10-24  
看过源码的人都知道应该用entrySet遍历
24 楼 ldbjakyo 2010-10-14  
再次回来瞧过 比第一次来看 补充了 好多 
23 楼 lwz777 2010-10-13  
这样的文章才有点味道不是!
22 楼 parabellum_sky 2010-10-13  
parabellum_sky 写道
怎么执行第二段代码出错了呢?
Exception in thread "main"
并且啥信息都没有~~

估计是OOM了,MAX_LONG减少一个数量级以后就可以了~但是看不出来问题~~
21 楼 parabellum_sky 2010-10-13  
怎么执行第二段代码出错了呢?
Exception in thread "main"
并且啥信息都没有~~
20 楼 elan1986 2010-10-12  
总结的不错!
19 楼 ansjsun 2010-10-12  
su1216 写道
实践证明,不一定哪个快。。。
不过第二个基本上每次都要慢一点
测试map

public static Map<String,String> getMap(long k){
Map map=new HashMap();
for (int i = 0; i <k; i++) {
map.put(""+i,""+i);
}
return map;
}

k=10w

ps:jdk1.5

你用的是linux吧....用windows速度应该比较稳定的...其实大容量map不是考虑..速度..而更应该考虑内存的开销..集合啦..处理海量数据最容易导致..内存当掉了...
如果很追求速度..那也不要用map去做..jdk的自动装箱..本来就是很耗费时间的
18 楼 dengminhui 2010-10-11  
呵呵,针对大家的疑问,我写在文章后面了,执行时间只是差异的一方面,最主要的还是CPU。
17 楼 lkj107 2010-10-11  
大家都用的就是好方法

代码的执行只是一小部分功能,最大的是可读性,以及由此延伸的可维护性等
16 楼 newvirus 2010-10-11  
不错的文章 学习了 私下地下尝试一下
15 楼 helloguoxing 2010-10-11  
这样减少了map扩容的次数。不过数据量小了,就不必这样写,直接new HashMap()。
14 楼 helloguoxing 2010-10-11  
map的大容量优化方法:
1、提前要知道容量要放多大,只要确保map集合的size<1024*0.75就可以了。
这个1024是自己设置的。可以在new HashMap(1024,0.75);
1024是偶数,在方法hash()-哈希算法中:h & (length-1);(length-1)要确认得出的值是奇数,这样才能解决循环遍历map产生的冲突。
0.75是3/4,因为数组满了不利于数组扩容。所以设计者建议为3/4.
13 楼 su1216 2010-10-11  
实践证明,不一定哪个快。。。
不过第二个基本上每次都要慢一点
测试map

public static Map<String,String> getMap(long k){
Map map=new HashMap();
for (int i = 0; i <k; i++) {
map.put(""+i,""+i);
}
return map;
}

k=10w

ps:jdk1.5
12 楼 gh_aiyz 2010-10-11  
我打赌第一种和第二三中的性能差别不超过1%,无论你多大容量。
LZ纯粹是臆测罢了,有点想当然了。
11 楼 吃猫的鱼 2010-10-10  
没说服力啊,,要是把测试结果的性能比较贴出来,就很带劲了……
10 楼 yuantong 2010-10-10  
还大容量,最普通不过了

相关推荐

    java遍历大容量map的正确方法.pdf

    在Java编程中,遍历大容量的Map是一个常见的操作,特别是在处理大数据或内存优化的场景下,选择正确的遍历方式至关重要。以下是对标题和描述中提及的四种遍历Map方法的详细说明: 1. **通过Map.keySet遍历key和...

    Map (c++实现的简易map)

    - 迭代器:定义前向迭代器,实现`begin()`和`end()`方法,允许遍历`Map`。 自定义`Map`的一个挑战是实现高效的查找、插入和删除操作,这通常需要熟练掌握二叉搜索树的特性,尤其是红黑树的插入和旋转规则。此外,...

    java中map集合的用法.pdf

    在Java编程语言中,Map接口是集合框架的重要组成部分,它提供了键值对(Key-Value)的数据存储方式。Map不是列表或数组,它允许通过键来查找...选择合适的Map实现,以及正确地遍历和操作Map,都是提高程序性能的关键。

    java中map集合的用法.doc

    Java中的Map集合是一种存储键值对的数据结构,它允许通过键来访问对应的值。Map接口在Java的`java.util`包中定义,...通过选择合适的Map类型,调整大小,以及正确地遍历和操作Map,可以提高程序性能并避免潜在的问题。

    map元素映射,正确使用标准模板库

    本篇文章将深入探讨如何正确地使用`std::map`,以及它提供的各种函数。 一、map的基本结构与类型定义 `std::map`由键值对组成,每个元素都有一个唯一的键和一个相关联的值。它的基本定义如下: ```cpp template, ...

    Map容器的用法(STL).docx

    例如,可以定义一个包含整型和字符串的结构体`StudentInfo`,并重载`运算符,以便`map`可以正确排序这些元素。 8. **迭代器操作**: - `lower_bound(key)`返回第一个大于等于key的元素的迭代器。 - `upper_bound...

    stl_map.rar_V2

    7. **大小和容量**:`map::size()`返回元素数量,`map::empty()`检查Map是否为空,`map::max_size()`返回Map能容纳的最大元素数。 8. **迭代器**:Map提供了双向迭代器,支持前向和后向遍历。`iterator`用于读写,`...

    map效果

    5. **并发与线程安全**:在多线程环境下,不线程安全的Map如HashMap在并发操作下可能导致数据不一致,而线程安全的Map如Java的ConcurrentHashMap则能保证在并发环境下的正确性。 6. **性能优化**:选择合适的Map...

    Java集合Collection、List、Set、Map使用详细讲解.doc

    - **容器分类**:Java集合框架主要分为两大类:集合(Collection)和映射(Map)。集合类用于存储单一类型的元素,而Map则用于存储键值对。 2. **Collection接口** - **常用方法**:Collection接口提供了add、...

    test-map

    在测试过程中,理解如何创建、遍历和修改Map对象是非常重要的,因为这会直接影响到代码的性能和正确性。 当我们谈论“test-map”,我们可能在讨论以下几种情况: 1. 单元测试:这是针对代码中的最小可测试单元进行...

    易语言HashMap类

    初始容量是指哈希表在创建时预分配的空间大小,而负载因子则是衡量哈希表负载程度的一个参数,表示哈希表在达到多大比例的占用率时需要进行扩容。 2. **加入**:HashMap类提供`加入`方法,用于将键值对插入到哈希表...

    Java-HashMap.rar_hashmap_java hashmap

    4. **键值对**:键(Key)必须实现`hashCode()`和`equals()`方法,以确保正确的哈希计算和比较。值(Value)可以是任意对象。 5. **键的唯一性**:在`HashMap`中,键是唯一的,相同的键不能添加多次。如果尝试插入...

    Java集合Map常见问题_动力节点Java学院整理

    如果桶内形成链表,通过遍历链表并使用键对象的equals()方法来找到正确的键值对。 3. **获取值对象**:在获取值时,HashMap首先根据键的hashCode找到bucket,然后通过键的equals()方法与链表中的键进行比较,找到...

    Map_test:让它工作

    在这个项目中,开发者可能在创建或优化一个使用Map的功能,可能是为了提高性能、处理复杂的数据结构或者确保正确性。 描述提到“地图测试”,这可能指的是针对Map对象的单元测试或集成测试,以验证其在实际应用中的...

    5分钟搞定集合

    了解Map时,需理解键的唯一性、键值对的概念以及遍历Map的方法。 4. **容器的体系** 集合框架的设计是基于继承和接口的。例如,List、Set和Map都继承自AbstractCollection,提供了基本的集合操作。List接口继承自...

    C++hashmap的使用实例

    这个数据结构允许我们以接近常数时间的复杂度进行插入、查找和删除操作,极大地提高了程序的执行效率。下面我们将深入探讨`std::unordered_map`的使用、特性以及一些实例。 1. **引入头文件** 在C++中使用`std::...

    Java企业系列面试题(集合篇).docx

    在自定义类中,必须重写这两个方法以确保键的正确索引和查找。 10. **HashMap与Hashtable的区别**:HashMap允许null键和值,而Hashtable不允许。Hashtable是线程安全的,适合多线程环境,而HashMap则不是。HashMap...

    2021最新版数据结构与算法面试题手册 1.pdf

    因此,这两个方法在HashMap中的正确实现对于保证其精确性和正确性至关重要。 6. **使用Object作为HashMap的key**:当Object对象作为HashMap的key时,必须保证Object的hashCode()方法返回的哈希码不会改变,因为如果...

    java面试 集合中知识点 HashMap(JDK1.8)源码+底层数据结构分析 整理.pdf

    拉链法将链表和数组结合,确保了即使有哈希冲突,也能通过遍历链表找到正确的元素。 2. **JDK1.8之后**:在JDK1.8中,当链表长度超过8且数组长度超过64时,HashMap会将链表转换为红黑树。红黑树是一种自平衡二叉...

Global site tag (gtag.js) - Google Analytics