从提高存取效率的角度深入“集合框架” -

贾懂凯

浏览: 121219 次
性别:
来自: 杭州

最近访客更多访客>>

huhuxin10

扛大炮的小鱼

cainiao1923

Gaberil

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

从提高存取效率的角度深入“集合框架”

博客分类：

java collection frame

框架算法数据结构 JDK 生活

在开始之前，我先提出问题引出整片的论述：

问题：1、我们已经知道JDK提供的集合有很多种，我们应该通过哪些标准（比如执行效率等）来选取合适的集合使用？

2、各种集合之间的关系到底是怎样的？

3、各种集合的适用情况如何，即如何选取才能使你的程序的效率最高？

下面，我就来试图解决这些问题！

一、基于图的集合框架整体认知

接口关系图详解：

更加详细的框架图见：http://hi.baidu.com/%C9%AE_%CC%C6/blog/item/9e2a8b0887008a8ad0581b3d.html

二、部分接口或类的分析

1、整个框架主要包括三大接口：

java.util.Set 接口及其子类，set提供的是一个无序的集合。

java.util.List 接口及其子类，List提供的是一个有序的集合

java.util.Map 接口及其子类，Map提供了一个映射（对应）关系的结合数据结构。

另外，在JDK5中新增了Queue（队列）接口及其子类，提供了基于队列的集合框架。并且，我们应该没有忘记自己最初是通过自定义数组和自定义队列来实现对象的集合存储的。

2、遍历问题：

Collection类的遍历使用iterator()方法。所以，所有实现它的类都可以使用这个方法来达到遍历。

List提供了一个listIterator()方法，返回一个ListIterator接口，和标准的Iterator接口相比，ListIterator多了一些add()之类的方法，允许添加、删除、设定元素，还能向前向后遍历。可以说ListIterator是Iterator的升级版。

遍历HashMap：

方法一：用entrySet()

Iterator it=map.entrySet().iterator();

while(it.hasNext()){

Map.Entry entry=(Map.Entry)it.next();

}

方法二：应用for-Each+keySet()循环：

for(Object o:map.keySet){

Value value=map.get(o);

}

方法三：用entrySet()和or-Each循环

for(Map.Entry<> m:map.entrySet()){

//m是映射项

}

本方法同for(Map.Entry<> m:map){}（不过前提是所有的<>中类型都要指定）

方法四：用keySet()

Iterator it=map.keySet().iterator();

while(it.hasNext()){

String key=(keyType)it.next();

Value value=map.get(key);

}

方法一比方法四效率高，因为对keySet其实是遍历了两次，一次是转为iterator，一次就是取出key对应的value，而entrySet只遍历了一次。

3、接口及其实现类（本条相关论述详见JDK文档）：本条的论述主要涉及同步问题，方法的时间开销，容量等问题。

Collection接口：允许参数为Collection的构造器，实际上就是实现用户复制一个Collection。

SortedSet<E>接口：继承自Set接口，使用自然顺序进行排序，或者在创建有序set是提供的Comparator进行排序。该set的迭代器将元素升序遍历set。

HashSet<E>类：应用HashMap的一个集的实现。固然集定义成无序，但必须存在某种方法能相当高效地找到一个对象。应用一个HashMap对象实现集的存储和检索把持是在固定时间内实现的.

LinkedList类：提供了get，remove，insert的额外的方法，实现在LinkedList首部或尾部作用。这些操作时LinkedList可悲用作堆栈(Stack)、队列(queue)、或双向队列(deque)。

注意LinkedList没有同步方法。如果多个线程同时访问一个List，则必须自己实现访问同步。一种解决方法是在创建List时构造一个同步的List：
　　List list = Collections.synchronizedList(new LinkedList(...));

ArrayList类：size，isEmpty，get，set方法运行时间为常数。但是add方法开销为分摊的常数，添加n个元素需要O(n)的时间。其他的方法运行时间为线性。

当需要插入大量元素时，在插入前可以调用ensureCapacity方法来增加ArrayList的容量以提高插入效率。

同样，该类unsynchronized。

Vector类：实现了List接口。synchronized。当一个Interator被创建而且正在被使用，另一个线改变了Vector的状态，这是调用Iterator的方法将抛出ConcurrentModificationException 。

Stack类：继承自Vector，实现一个后进先出的堆栈。

Map接口：Map接口提供3种集合的视图，Map的内容可以被当作一组key集合，一组value集合，或者一组key-value映射。

HashMap类：unsynchronized。允许null，即null vlaue和null key。但是将HashMap视为Collection时（values()方法可返回Collection），其迭代子操作时间开销和HashMap的容量成比例。因此，如果迭代操作的性能相当重要的话，不要将HashMap的初始化容量设得过高，或者load factor过低。

Hashtable类：由于作为key的对象将通过计算其散列函数来确定与之对应的value的位置，因此任何作为key的对象都必须实现hashCode和equals方法。hashCode和equals方法继承自根类Object，如果你用自定义的类当作key的话，要相当小心，按照散列函数的定义，如果两个对象相同，即obj1.equals(obj2)=true，则它们的hashCode必须相同，但如果两个对象不同，则它们的hashCode不一定不同，如果两个不同对象的hashCode相同，这种现象称为冲突，冲突会导致操作哈希表的时间开销增大，所以尽量定义好的hashCode()方法，能加快哈希表的操作。

　　如果相同的对象有不同的hashCode，对哈希表的操作会出现意想不到的结果（期待的get方法返回null），要避免这种问题，只需要牢记一条：要同时复写equals方法和hashCode方法，而不要只写其中一个。

本条小结：HashSet采用散列函数对元素进行排序，这是专门为快速查询而设计的；TreeSet采用红黑树的数据结构进行排序元素；LinkedHashSet内部使用散列以加快查询速度，同时使用链表维护元素的次序，使得看起来元素是以插入的顺序保存的。需要注意的是，生成自己的类时，Set需要维护元素的存储顺序，因此要实现Comparable接口并定义compareTo()方法。如果涉及到堆栈，队列等操作，应该考虑用List，对于需要快速插入，删除元素，应该使用LinkedList，如果需要快速随机访问元素，应该使用ArrayList。

参考：http://dev.firnow.com/course/3_program/java/javajs/2007917/71621.html

三、扩展

1、散列表（也叫哈希表）：从哈希表的优势入手

数据结构中，有个时间算法复杂度O(n)的概念来衡量某种算法在时间效率上的优劣。哈希表的理想算法复杂度为O(1)，也就是说利用哈希表查找某个值，系统所使用的时间在理想情况下为定值，这就是它的优势。那么哈希表是如何做到这一点的呢？
实际生活中有这样一个mapping需要存储：name-value。存储和读取整个流程为：

A、开辟一块空间(HashValues[m])用于存储value;

B、通过哈希函数(ChangeToHashValue (name))计算出name的哈希码hashcode(name)=x.

C、将value存储到hachValues[x]中。到这里存储就完毕了。

D、读取时，给定name，通过哈希函数(ChangeToHashValue (name))计算出哈码hashcode(name)=x

E、读取HashValue [x]

不过，实际上m总是大于实际需要的n的，所以这其实是用空间换时间的数据结构。

不过，哈希表的方法也会遇到问题：

当两个不同的name值经过哈希函数的计算结构得到的哈希值相同，那么就会出现冲突。冲突使得哈希表的存取速度变慢。解决方法有两种：一种就是定义一个好的哈希函数；另一种就是在不改变哈希函数的情况下用后续的手段解决冲突，如出现重复hashcode加1等等。

2、HashSet 而言，它是基于 HashMap 实现的，HashSet 底层采用 HashMap 来保存所有元素

当我们试图把某个类的对象当成 HashMap 的 key，或试图将这个类的对象放入 HashSet 中保存时，重写该类的 equals(Object obj) 方法和 hashCode() 方法很重要，而且这两个方法的返回值必须保持一致：当该类的两个的 hashCode() 返回值相同时，它们通过 equals() 方法比较也应该返回 true。通常来说，所有参与计算 hashCode() 返回值的关键属性，都应该用于作为 equals() 比较的标准。

1 // 根据 first 判断两个 Name 是否相等

2 public boolean equals(Object o)

3 {

4 if (this == o)

5 {

6 return true;

7 }

8 if (o.getClass() == Name.class)

9 {

10 Name n = (Name)o;

11 return n.first.equals(first);

12 }

13 return false;

14 }

16 // 根据 first 计算 Name 对象的 hashCode() 返回值

17 public int hashCode()

18 {

19 return first.hashCode();

20 }

四、最后的总结：

1、集合框架中各个类的使用需要考虑空间占用率（容量，通过loadFactor 属性来设置）、同步问题、是否可以存入null值、各种类的区别与选择、遍历选择等问题。这些问题，在我上面的论述中多多少少有涉及，其中各个类的区别、是否存入null值、同步问题、以及部分类空间占用等问题我只是做了一个引入式的分析，并没有分析到能应用的层面。这点是还可以进一步研究的地方。

查看图片附件

分享到：

让CPU舞动起来 | RDB的规范化理论（函数依赖+范式）

2010-10-19 17:08
浏览 1384
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

构建面向对象的应用软件系统框架: 良好的框架能够提高开发效率，简化代码维护，并有助于团队协作。 - **应用服务层**：是软件架构中的一个重要组成部分，主要负责处理业务逻辑和数据流，提供给前端或上层应用调用的服务接口。 - **数据实体的表示**：...

百度笔试题及答案: 在准备百度笔试的过程中，了解并掌握这些Java编程的基础知识是非常关键的。下面将详细解释题目中的...同时，不断练习和深入学习Java语言的其他高级特性，如多线程、异常处理、集合框架等，将有助于全面提升编程技能。

The science of computing: 通过对以上各个章节内容的详细介绍，我们可以看到，《计算科学》这本书涵盖了计算机科学领域中最核心的知识点，不仅从理论角度深入浅出地解析了逻辑电路、数据表示等基础知识，还通过实际案例展示了计算机架构和操作...

NoteBook:一个简单的笔记本: Litepal是一个轻量级的Android数据库框架，使得开发者可以更方便地进行ORM(Object-Relational Mapping)操作，即对象关系映射，将数据库操作与业务逻辑代码分离，提高了开发效率。首先，让我们深入了解一下Litepal...

DeepSeek与AI幻觉-清华大学团队制作: DeepSeek与AI幻觉-清华大学团队制作一、什么是AI幻觉（定义与基础概念）二、DeepSeek为什么会产生幻觉（聚焦特定AI模型的幻觉成因分析）三、AI幻觉评测（评估AI幻觉的频率、类型与影响的方法）四、如何减缓AI幻觉（解决方案与技术优化方向）五、AI幻觉的创造力价值（探讨幻觉在创新场景中的潜在益处，如艺术生成、灵感激发等）

协同过滤算法商品推荐系统(源码+数据库+论文+ppt)java开发springboot框架javaweb，可做计算机毕业设计或课程设计: 协同过滤算法商品推荐系统(源码+数据库+论文+ppt)java开发springboot框架javaweb，可做计算机毕业设计或课程设计【功能需求】前台用户可以实现注册登录、商品浏览，在线客服，加入购物车，加入收藏，下单购买，个人信息管理，收货信息管理，收藏管理，评论功能。后台管理员可以进行用户管理、商品分类管理、商品信息管理、订单评价管理、系统管理、订单管理。【环境需要】 1.运行环境：最好是java jdk 1.8，我们在这个平台上运行的。其他版本理论上也可以。 2.IDE环境：IDEA，Eclipse,Myeclipse都可以。 3.tomcat环境：Tomcat 7.x,8.x,9.x版本均可 4.数据库：MySql 5.7/8.0等版本均可；【购买须知】本源码项目经过严格的调试，项目已确保无误，可直接用于课程实训或毕业设计提交。里面都有配套的运行环境软件，讲解视频，部署视频教程，一应俱全，可以自己按照教程导入运行。附有论文参考，使学习者能够快速掌握系统设计和实现的核心技术。

MES系统数字化工厂解决方案.pptx: MES系统数字化工厂解决方案.pptx

MUI调用照片以及裁剪和图库照片上传到服务器: MUI调用照片以及裁剪和图库照片上传到服务器

ChatGPT付费创作系统V3.1.3独立版 WEB端+H5端+小程序端（新增DeepSeek高级通道+新的推理输出格式）: GPT付费体验系统最新版系统是一款基于ThinkPHP框架开发的AI问答小程序，是基于国外很火的ChatGPT进行开发的Ai智能问答小程序。这是一种基于人工智能技术的问答系统，可以实现智能回答用户提出的问题。相比传统的问答系统，ChatGPT可以更加准确地理解用户的意图，提供更加精准的答案。同时系统采用了最新的GPT3.5接口与GPT4模型，同时还支持型，文心一言，腾讯混元，讯飞星火，通义千问，DeepSeeK，智普等等国内各种大模型，可以更好地适应不同的应用场景，支持站点无限多开，可以说ChatGPT付费创作系统目前国内相对体验比较好的一款的ChatGPT及多接口软件系统。新增接入DeepSeek-R1、DeepSeek-V3（Ollama自部署和第三方均支持）、高级通道增加DeepSeek、支持AI接口输出的reasoning_content字段（新的推理输出格式）、更新模型库、修复导出Excel的bug等功能，优化了云灵Midjourney接口，出图更快更稳定。小程序端变化不大该系统版本测试下来比较完美，老版本升级时数据库结构同步下，同时把原来

基于java的美食点餐管理平台设计的详细项目实例（含完整的程序，GUI设计和代码详解）: 内容概要：本文档详细介绍了一款基于Java技术的美食点餐管理平台的设计与实现。该平台旨在优化传统餐饮行业的服务流程，通过智能化的点餐系统、高效的订单处理、智能库存管理和数据分析等功能，为用户提供便捷高效的点餐体验，并提升餐厅管理效率和服务质量。系统涵盖了前端设计、后端开发、数据库设计等方面，采用了成熟的Java技术和现代Web开发框架，如Spring Boot、Vue.js或React，确保系统的高效性和稳定性。此外，文档还包括详细的用户界面设计、模块实现以及系统部署指南，帮助开发者理解和搭建该平台。适合人群：具备一定的Java编程基础和技术经验的研发人员、IT从业者以及有意开发类似系统的企业和个人。使用场景及目标：①为餐厅提供一个集点餐、订单处理、库存管理于一体的高效平台；②优化传统餐饮服务流程，提升客户服务体验；③利用大数据分析辅助决策，助力餐饮企业精细化运营；④通过集成多种支付方式和其他外部系统，满足多样化的商业需求。其他说明：本项目不仅提供了完整的技术方案和支持文档，还针对实际应用场景提出了多个扩展方向和技术优化思路，旨在引导用户不断迭代和完善该平台的功能和性能。

相场模拟与激光制造技术：选择性激光烧结、激光融覆中的凝固与枝晶生长研究,相场模拟与激光制造技术：选择性激光烧结、激光融覆及凝固过程中的枝晶生长研究,相场模拟选择性激光烧结激光融覆凝固枝晶生长: 相场模拟与激光制造技术：选择性激光烧结、激光融覆中的凝固与枝晶生长研究,相场模拟与激光制造技术：选择性激光烧结、激光融覆及凝固过程中的枝晶生长研究,相场模拟选择性激光烧结激光融覆凝固枝晶生长 ,相场模拟; 选择性激光烧结; 激光融覆; 凝固; 枝晶生长,相场模拟与激光工艺：枝晶生长的凝固过程研究

基于ssh框架开发的厂区管理系统，集成增删改查功能。.zip: 项目工程资源经过严格测试运行并且功能上ok，可实现复现复刻，拿到资料包后可实现复现出一样的项目，本人系统开发经验充足（全栈全领域），有任何使用问题欢迎随时与我联系，我会抽时间努力为您解惑，提供帮助【资源内容】：包含源码+工程文件+说明等。答辩评审平均分达到96分，放心下载使用！可实现复现；设计报告也可借鉴此项目；该资源内项目代码都经过测试运行；功能ok 【项目价值】：可用在相关项目设计中，皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面，可借鉴此优质项目实现复刻，设计报告也可借鉴此项目，也可基于此项目来扩展开发出更多功能【提供帮助】：有任何使用上的问题欢迎随时与我联系，抽时间努力解答解惑，提供帮助【附带帮助】：若还需要相关开发工具、学习资料等，我会提供帮助，提供资料，鼓励学习进步下载后请首先打开说明文件（如有）;整理时不同项目所包含资源内容不同;项目工程可实现复现复刻，如果基础还行，也可在此程序基础上进行修改，以实现其它功能。供开源学习/技术交流/学习参考，勿用于商业用途。质量优质，放心下载使用

关于加强新能源汽车安全管理涉及的法规标准分析.pptx: 关于加强新能源汽车安全管理涉及的法规标准分析.pptx

基于SSM的校园二手交易平台.zip(毕设&课设&实训&大作业&竞赛&项目): 项目工程资源经过严格测试运行并且功能上ok，可实现复现复刻，拿到资料包后可实现复现出一样的项目，本人系统开发经验充足（全栈全领域），有任何使用问题欢迎随时与我联系，我会抽时间努力为您解惑，提供帮助【资源内容】：包含源码+工程文件+说明等。答辩评审平均分达到96分，放心下载使用！可实现复现；设计报告也可借鉴此项目；该资源内项目代码都经过测试运行，功能ok 【项目价值】：可用在相关项目设计中，皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面，可借鉴此优质项目实现复刻，设计报告也可借鉴此项目，也可基于此项目来扩展开发出更多功能【提供帮助】：有任何使用上的问题欢迎随时与我联系，抽时间努力解答解惑，提供帮助【附带帮助】：若还需要相关开发工具、学习资料等，我会提供帮助，提供资料，鼓励学习进步下载后请首先打开说明文件（如有）;整理时不同项目所包含资源内容不同;项目工程可实现复现复刻，如果基础还行，也可在此程序基础上进行修改，以实现其它功能。供开源学习/技术交流/学习参考，勿用于商业用途。质量优质，放心下载使用

机器学习课程设计——基于AdaBoost的银行用户逾期行为检测.zip: 项目工程资源经过严格测试运行并且功能上ok，可实现复现复刻，拿到资料包后可实现复现出一样的项目，本人系统开发经验充足（全栈全领域），有任何使用问题欢迎随时与我联系，我会抽时间努力为您解惑，提供帮助【资源内容】：包含源码+工程文件+说明等。答辩评审平均分达到96分，放心下载使用！可实现复现；设计报告也可借鉴此项目；该资源内项目代码都经过测试运行；功能ok 【项目价值】：可用在相关项目设计中，皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面，可借鉴此优质项目实现复刻，设计报告也可借鉴此项目，也可基于此项目来扩展开发出更多功能【提供帮助】：有任何使用上的问题欢迎随时与我联系，抽时间努力解答解惑，提供帮助【附带帮助】：若还需要相关开发工具、学习资料等，我会提供帮助，提供资料，鼓励学习进步下载后请首先打开说明文件（如有）;整理时不同项目所包含资源内容不同;项目工程可实现复现复刻，如果基础还行，也可在此程序基础上进行修改，以实现其它功能。供开源学习/技术交流/学习参考，勿用于商业用途。质量优质，放心下载使用

UI+svg+规范设置打包: UI+svg格式

关于乘用车燃料消耗量评价方法及指标强制性国家标准的分析.pptx: 关于乘用车燃料消耗量评价方法及指标强制性国家标准的分析.pptx

openjpeg-1.5.1-18.el7.x64-86.rpm.tar.gz: 1、文件内容：openjpeg-1.5.1-18.el7.rpm以及相关依赖 2、文件形式：tar.gz压缩包 3、安装指令： #Step1、解压 tar -zxvf /mnt/data/output/openjpeg-1.5.1-18.el7.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm 4、更多资源/技术支持：公众号禅静编程坊

FPGA Verilog实现BT656与1120视频协议组帧解帧代码详解：含文档介绍与仿真验证,FPGA Verilog实现BT656与1120视频协议组帧解帧代码详解：含文档介绍与仿真验证,fpga: FPGA Verilog实现BT656与1120视频协议组帧解帧代码详解：含文档介绍与仿真验证,FPGA Verilog实现BT656与1120视频协议组帧解帧代码详解：含文档介绍与仿真验证,fpga verilog实现视频协议bt656和1120组帧解帧代码有文档介绍协议，有mod仿真，matlab代码仿真 ,FPGA; Verilog; BT656协议; 1120组帧解帧代码; 文档介绍; Mod仿真; Matlab代码仿真,FPGA Verilog：实现BT656与1120组帧解帧代码的仿真与文档化研究

基于 RAG 与大模型技术的医疗问答系统(毕设&课设&实训&大作业&竞赛&项目): 基于 RAG 与大模型技术的医疗问答系统，利用 DiseaseKG 数据集与 Neo4j 构建知识图谱，结合 BERT 的命名实体识别和 34b 大模型的意图识别，通过精确的知识检索和问答生成，提升系统在医疗咨询中的性能，解决大模型在医疗领域应用的可靠性问题。.zip项目工程资源经过严格测试运行并且功能上ok，可实现复现复刻，拿到资料包后可实现复现出一样的项目，本人系统开发经验充足（全栈全领域），有任何使用问题欢迎随时与我联系，我会抽时间努力为您解惑，提供帮助【资源内容】：包含源码+工程文件+说明等。答辩评审平均分达到96分，放心下载使用！可实现复现；设计报告也可借鉴此项目；该资源内项目代码都经过测试运行，功能ok 【项目价值】：可用在相关项目设计中，皆可应用在项目、毕业设计、课程设计、期末/期中/大作业、工程实训、大创等学科竞赛比赛、初期项目立项、学习/练手等方面，可借鉴此优质项目实现复刻，设计报告也可借鉴此项目，也可基于此项目来扩展开发出更多功能【提供帮助】：有任何使用上的问题欢迎随时与我联系，抽时间努力解答解惑，提供帮助【附带帮助】：若还需要相关开发工具、学习资料等，我会提供帮助，提供资料，鼓励学习进步下载后请首先打开说明文件（如有）;整理时不同项目所包含资源内容不同;项目工程可实现复现复刻，如果基础还行，也可在此程序基础上进行修改，以实现其它功能。供开源学习/技术交流/学习参考，勿用于商业用途。质量优质，放心下载使用

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

从提高存取效率的角度深入“集合框架”

评论

发表评论

相关推荐

并发容器——BlockingQueue相关类

简单比较HashMap和Hashtable

引用类，WeakHashMap，以及让value自动回收

三顾java.util.HashMap

集合框架（三）-专用set和map机制分析

再探集合框架(二)——深入源码看数据结构

最近访客更多访客>>