- 浏览: 150143 次
- 性别:
- 来自: 上海
文章分类
- 全部博客 (166)
- Spring (7)
- JavaSE (16)
- web (1)
- Struts2 (2)
- Maven (1)
- 面试 (8)
- Hibernate (4)
- mysql (2)
- WebSerice (2)
- 工作心得 (23)
- 北京 (1)
- 上海 (27)
- groovy (1)
- 生活 (9)
- Linux (12)
- junit (1)
- oracle (5)
- h2db嵌入式数据库 (1)
- redis (14)
- 生活感悟 (1)
- cron (1)
- tomcat (4)
- 设计模式 (7)
- 正则表达式 (1)
- html5 (2)
- 网络编程 (3)
- 微信公众号 (1)
- Java nio (5)
- jdbc (1)
- 框架漏洞 (1)
- 安全 (8)
- 分布式 (2)
- 数据结构 (5)
- xml,json (0)
- xml (1)
- json (1)
- netty (0)
- java8 (1)
- javascript (1)
- 2016计划 (1)
- Java集合源码分析 (1)
- 工作心得,jvm性能调优 (3)
- 转载 (14)
- 产品 (1)
- JVM (10)
最新评论
-
oplife:
都不太难
返利网面试 -
飞翔神话:
谢谢 7 楼 cnrainbing
联想中望面试心得体会 -
飞翔神话:
5 楼 home198979,相比您可能还差点,但是我还是有一 ...
联想中望面试心得体会 -
cnrainbing:
支持小伙子
联想中望面试心得体会 -
jahu:
这简单啊,
联想中望面试心得体会
散列表,散列算法
[size=small]一、概念
首先,回顾下散列的概念。散列同顺序、链接和索引一样,是一中数据存储方法。
定义:以数据集合中的每个元素的关键字k为自变量,通过一个函数h(k)计算出函数值,用这个值作为一块连续的存储空间(数组或文件空间)中的元素存储位置,将该元素存放在这块位置上。其中h(k) 成为散列函数或哈希函数,而h(k)的值成为散列地址或者哈希地址。
散列表
根据散列函数计算出的值作为地址存放相关元素值,这样的一组数据存放方式称为散列表。
冲突
多个元素的key值计算出的哈希值为同一个时,就造成了冲突。通常来讲,这种具有不同关键字而具有相同散列地址的元素称为"同义词",由同义词引起的存储冲突称为同义词冲突。
发生冲突的因素:
1、装填因子α,其中α=n/m,其中n为带插入的元素个数,m为散列表长度。一般来讲,α越小,发生冲突的可能性就越小,但是随之而来的问题是,空间利用率越低。
2、散列函数的选择,若散列函数选择得当,就能使散列地址均匀的分布在散列空间上,从而减少冲突的发生。
3、解决冲突的方法。
散列桶
散列表(散列存储)中每个散列地址对应的存储位置被称为一个桶。
二、散列函数
1、直接定址法
h(k) = k + C 其中k为关键字本身,C为常数。
优点:简单,没有冲突发生,如果有冲突,则说明是关键字重复。
缺点:若关键字不连续,空号较多,将造成存储空间的较大浪费。
2、除留取余数法
h(k)=k%m
该方法适用范围广,是目前最常见的方法。
3、其他
数字分析法、平方取中法、折叠法
三、处理冲突的方法
主要包含开放定址法(线性探查法、平方探查法、双散列函数探查法)、链接法(即链地址法)
散列性能分析,从这本书《数据结构使用教程.徐孝凯》上得到的结果是链接地址法的平均查找长度是比较优秀的。
四、散列表的运算
进行散列表的运算,首先定义散列表在Java中的接口类,说明该中存储结构需要有哪些功能,然后给出不同处理冲突方式的实现类。一般常用的有两种方式:一种是采用开放定址法处理;另一种是链接法处理冲突的实现类。
1、根据散列表的存储性质,定义接口类:
2、开放定址法处理冲突的数组存储类
3、采用链接法处理冲突的链接存储类
定义结点类型
定义存储结构:
4、散列表运算的调试程序
运行结果:
输出散列表中的所有元素:
(34:340),(18:180),(54:540),(73:730),(90:900),(58:580),(75:750),(43:430),(60:600),(46:460),(31:310),(15:150),
散列表容量:17
散列表中的元素个数:12
经插入、删除、修改后的散列表为:
(34:340),(54:540),(90:900),(58:580),(75:880),(60:600),(31:310),(15:150),
散列表容量:17
散列表中的元素个数:8
查找元素的结果:
key为 18关键字的元素未找到!
key为 75对应的元素值为:880
key为 60对应的元素值为:600
key为 43关键字的元素未找到!
以上为使用链接法处理冲突的算法调试结果。
将Example10_3.java的18行注释掉,去掉16行的注释,则为测试开放定址法的数组存储类,执行结果为:
输出散列表中的所有元素:
(34 340),(18 180),(54 540),(90 900),(73 730),(75 750),(58 580),(60 600),(43 430),(46 460),(31 310),(15 150),
散列表容量:17
散列表中的元素个数:12
经插入、删除、修改后的散列表为:
(34 340),(54 540),(90 900),(75 880),(58 580),(60 600),(31 310),(15 150),
散列表容量:17
散列表中的元素个数:8
查找元素的结果:
key为 18关键字的元素未找到!
key为 75对应的元素值为:880
key为 60对应的元素值为:600
key为 43关键字的元素未找到!
[/size]
二分查找
定义:二分查找又称为折半查找,是一种能对有序表进行快速查找的方法,时间复杂度为O(log₂N)。
优点:比较次数少,查找速度快。
缺点:查找前需要建立有序表,而频繁的插入和删除平均每次需要移动表中的一半元素,浪费时间。
适用场景:数据稳定,很少进行插入或删除运算的情况。也就是说,二分查找只适用于顺序存储的有序表,不适于连接存储的有序表。
[size=small]一、概念
首先,回顾下散列的概念。散列同顺序、链接和索引一样,是一中数据存储方法。
定义:以数据集合中的每个元素的关键字k为自变量,通过一个函数h(k)计算出函数值,用这个值作为一块连续的存储空间(数组或文件空间)中的元素存储位置,将该元素存放在这块位置上。其中h(k) 成为散列函数或哈希函数,而h(k)的值成为散列地址或者哈希地址。
散列表
根据散列函数计算出的值作为地址存放相关元素值,这样的一组数据存放方式称为散列表。
冲突
多个元素的key值计算出的哈希值为同一个时,就造成了冲突。通常来讲,这种具有不同关键字而具有相同散列地址的元素称为"同义词",由同义词引起的存储冲突称为同义词冲突。
发生冲突的因素:
1、装填因子α,其中α=n/m,其中n为带插入的元素个数,m为散列表长度。一般来讲,α越小,发生冲突的可能性就越小,但是随之而来的问题是,空间利用率越低。
2、散列函数的选择,若散列函数选择得当,就能使散列地址均匀的分布在散列空间上,从而减少冲突的发生。
3、解决冲突的方法。
散列桶
散列表(散列存储)中每个散列地址对应的存储位置被称为一个桶。
二、散列函数
1、直接定址法
h(k) = k + C 其中k为关键字本身,C为常数。
优点:简单,没有冲突发生,如果有冲突,则说明是关键字重复。
缺点:若关键字不连续,空号较多,将造成存储空间的较大浪费。
2、除留取余数法
h(k)=k%m
该方法适用范围广,是目前最常见的方法。
3、其他
数字分析法、平方取中法、折叠法
三、处理冲突的方法
主要包含开放定址法(线性探查法、平方探查法、双散列函数探查法)、链接法(即链地址法)
散列性能分析,从这本书《数据结构使用教程.徐孝凯》上得到的结果是链接地址法的平均查找长度是比较优秀的。
四、散列表的运算
进行散列表的运算,首先定义散列表在Java中的接口类,说明该中存储结构需要有哪些功能,然后给出不同处理冲突方式的实现类。一般常用的有两种方式:一种是采用开放定址法处理;另一种是链接法处理冲突的实现类。
1、根据散列表的存储性质,定义接口类:
package com.algorithm.hash; /** * 散列表的接口类 * Created by xiaoyun on 2016/8/4. */ public interface HashTable { /** * 向散列表中插入一个关键字为theKey的元素obj,若插入成功返回真否则返回假 * @param theKey * @param obj * @return */ boolean insert(Object theKey, Object obj); /** * 从散列表中查找并返回与给定关键字theKey的元素值,若查找失败则返回假 * @param theKey * @return */ Object search(Object theKey); /** * 从散列表中删除关键字为theKey的元素,若查找失败返回空 * @param theKey * @return */ boolean delete(Object theKey); /** * 返回散列表中的元素个数 * @return */ int size(); /** * 返回散列表的容量,即散列表的空间大小m的值 * @return */ int capacity(); /** * 判断该散列表是否为空,如果为空则返回true,否则返回false * @return */ boolean isEmpty(); /** * 清空散列表 */ void clear(); /** * 输出散列表中保存的所有关键字和对应元素 */ void output(); }
2、开放定址法处理冲突的数组存储类
package com.algorithm.hash; /** * 采用开放定址法(这里采用线性探查法)处理冲突的数组存储类 * Created by xiaoyun on 2016/8/4. */ public class SeqHashTable implements HashTable { /** 保存散列表的容量 */ private int m; /** 定义保存元素关键字的数组 */ private Object[] key; /** 定义保存散列桶的数组 */ private Object[] ht; /** 散列表中已有的元素个数 */ private int n; /** 元素内容被删除后的关键字删除标记 */ private Object tag; /** * 私有方法-散列函数,假定采用除留取余数法,如果参数不是整数,应设法转换为整数 * @param theKey * @return */ private int h(Object theKey) { return (Integer)theKey % m; } /** * 构造方法 * @param mm 散列表容量 * @param tag 删除标记 */ public SeqHashTable(int mm, Object tag) { if(mm < 13) { this.m = 13; // 假定散列表的容量至少等于13 }else { this.m = mm; } n = 0; key = new Object[m]; ht = new Object[m]; this.tag = tag; } /** * 向散列表中插入一个关键字为theKey的新元素obj,插入成功返回true,无可用空间直接退出 * @param theKey * @param obj * @return */ public boolean insert(Object theKey, Object obj) { int d = h(theKey); int temp = d; while(key[d] != null && !key[d].equals(this.tag)){ if(key[d].equals(theKey)){ break; } d = (d + 1)%m; // 探查下一个单元 if(d == temp) { System.out.println("散列表无该元素的存储空间,退出运行!"); System.exit(1); } } if(key[d] == null || key[d].equals(this.tag)) { // 找到插入位置,将该元素插入,返回true key[d] = theKey; ht[d] = obj; this.n++; return true; }else { // 用新元素obj替换已存在的元素并返回false ht[d] = obj; return false; } } /** * 从散列表中查找并返回与给定关键字theKey的元素值,若查找失败则返回假 * @param theKey * @return */ public Object search(Object theKey) { int d = h(theKey); // 求theKey的散列地址 int temp = d; // 用temp暂存所求得的散列地址d while(key[d] != null) { // 当散列地址中的关键字不为空时进行循环 if(key[d].equals(theKey)) { return ht[d]; }else { d = (d + 1) % m; } if(d == temp) { // 查找一周后失败返回空值 return null; } } return null; } /** * 从散列表中删除关键字为theKey的元素,若查找失败返回空 * @param theKey * @return */ public boolean delete(Object theKey) { int d = h(theKey); int temp = d; while (key[d] != null) { // 散列地址为空时退出循环 if(key[d].equals(theKey)) { // 找到需要删除的元素 key[d] = this.tag; // 设置删除标记 ht[d] = null; // 元素值变为空 n--; // 散列桶长度减一 return true; } else { d = (d + 1) % m; // 线性探测法 } if(d == temp) { return false; } } return false; } public int size() { return this.n; } public int capacity() { return this.m; } public boolean isEmpty() { return this.n == 0; } public void clear() { for (int i = 0; i < m; i++) { key[i] = null; ht[i] = null; } this.n = 0; } public void output() { for (int i = 0; i < m; i++) { if(key[i] == null || key[i].equals(tag)){ continue; } System.out.print("(" + key[i] + " " + ht[i] + "),"); } System.out.println(); } }
3、采用链接法处理冲突的链接存储类
定义结点类型
package com.algorithm.hash; /** * 链地址法处理冲突的散列表中的结点类型 * Created by xiaoyun on 2016/8/6. */ public class HashNode { Object key; Object element; HashNode next; public HashNode(Object key, Object element) { this.key = key; this.element = element; next = null; } }
定义存储结构:
package com.algorithm.hash; /** * 链接法处理冲突的散列表 * Created by xiaoyun on 2016/8/6. */ public class LinkHashTable implements HashTable { private int m; // 保存散列表的容量 private HashNode[] ht; // 定义保存散列表的数组 private int n; // 散列表中已有元素的个数 /** * 定义散列函数,除留取余数法 * @param key * @return */ private int h(Object key) { return (Integer)key%this.m; } public LinkHashTable(int m) { if(m < 13) { this.m = 13; }else { this.m = m; } n = 0; ht = new HashNode[this.m]; } /** * 向散列表中插入一个关键字为theKey的元素obj,若插入成功返回真否则返回假 * @param theKey * @param obj * @return */ public boolean insert(Object theKey, Object obj) { int d = h(theKey); HashNode p = ht[d]; while (p != null) { if(p.key.equals(theKey)){ break; }else { p = p.next; } } if(p != null) { // 用新值替换旧值,返回false p.element = obj; return false; }else { // 将新结点插入到对应单链表的表头并返回真 p = new HashNode(theKey, obj); p.next = ht[d]; ht[d] = p; n++; return true; } } /** * 从散列表中查找并返回与给定关键字theKey的元素值,若查找失败则返回假 * @param theKey * @return */ public Object search(Object theKey) { int d = h(theKey); HashNode p = ht[d]; while (p != null) { if(p.key.equals(theKey)){ return p.element; } p = p.next; } return null; } public boolean delete(Object theKey) { int d = h(theKey); HashNode p = ht[d]; // p指向表头结点 HashNode q = null; // q指向前驱结点 while (p != null) { // 循环查找被删除的结点 if(p.key.equals(theKey)){ break; }else { q = p; p = p.next; } } if(p == null){ return false; } if(q == null) { ht[d] = p.next; }else { q.next = p.next; } n--; return true; } public int size() { return this.n; } public int capacity() { return this.m; } public boolean isEmpty() { return this.n == 0; } public void clear() { for (int i = 0; i < m; i++) { ht[i] = null; } n = 0; } public void output() { for (int i = 0; i < m; i++) { HashNode p = ht[i]; while(p != null) { System.out.print("(" + p.key +":" + p.element+"),"); p = p.next; } } System.out.println(); } }
4、散列表运算的调试程序
import com.algorithm.hash.HashTable; import com.algorithm.hash.LinkHashTable; import com.algorithm.hash.SeqHashTable; /** * 散列表算法测试类 * Created by admin on 2016/8/6. */ public class Example10_3 { public static void main(String[] args) { // 关键字数组 int[] a = {18,75,60,43,54,90,46,31,58,73,15,34}; // 要存放的元素数组 String[] b = {"180","750","600","430", "540", "900","460","310","580","730","150","340"}; // 初始化开放地址法处理冲突的散列表 //HashTable tb = new SeqHashTable(17, -1); // 链地址法处理冲突的散列表 HashTable tb = new LinkHashTable(17); for (int i = 0; i < a.length; i++) { tb.insert(a[i], b[i]); } System.out.println("输出散列表中的所有元素:"); tb.output(); System.out.println("散列表容量:" + tb.capacity()); System.out.println("散列表中的元素个数:" + tb.size()); // 删除元素 for (int i = 0; i < a.length; i += 3) { tb.delete(a[i]); } // 修改元素 tb.insert(75, "880"); System.out.println("经插入、删除、修改后的散列表为:"); tb.output(); System.out.println("散列表容量:" + tb.capacity()); System.out.println("散列表中的元素个数:" + tb.size()); System.out.println("查找元素的结果:"); for (int i = 0; i < 4; i++) { Object x = tb.search(a[i]); if(x == null) { System.out.println("key为 " + a[i] + "关键字的元素未找到!"); }else { System.out.println("key为 " + a[i] + "对应的元素值为:" + x); } } } }
运行结果:
输出散列表中的所有元素:
(34:340),(18:180),(54:540),(73:730),(90:900),(58:580),(75:750),(43:430),(60:600),(46:460),(31:310),(15:150),
散列表容量:17
散列表中的元素个数:12
经插入、删除、修改后的散列表为:
(34:340),(54:540),(90:900),(58:580),(75:880),(60:600),(31:310),(15:150),
散列表容量:17
散列表中的元素个数:8
查找元素的结果:
key为 18关键字的元素未找到!
key为 75对应的元素值为:880
key为 60对应的元素值为:600
key为 43关键字的元素未找到!
以上为使用链接法处理冲突的算法调试结果。
将Example10_3.java的18行注释掉,去掉16行的注释,则为测试开放定址法的数组存储类,执行结果为:
输出散列表中的所有元素:
(34 340),(18 180),(54 540),(90 900),(73 730),(75 750),(58 580),(60 600),(43 430),(46 460),(31 310),(15 150),
散列表容量:17
散列表中的元素个数:12
经插入、删除、修改后的散列表为:
(34 340),(54 540),(90 900),(75 880),(58 580),(60 600),(31 310),(15 150),
散列表容量:17
散列表中的元素个数:8
查找元素的结果:
key为 18关键字的元素未找到!
key为 75对应的元素值为:880
key为 60对应的元素值为:600
key为 43关键字的元素未找到!
[/size]
二分查找
定义:二分查找又称为折半查找,是一种能对有序表进行快速查找的方法,时间复杂度为O(log₂N)。
package com.data.search.binary; /** * 二分查找算法 * 二分查找定义:二分查找又称为折半查找,首先,二分查找是针对有序表a(这里认为是升序)进行查找,首先取数组中的中间值a[mid],同给定的值x进行比较,如果x小于中间值,那么max=mid-1,min=0,mid=(max-min)/2, * 继续比较a[mid]与x的大小,然后依次递归,直到找到对应的元素或者查找区间为空为止。 * Created by xiaoyun on 2016/8/1. */ public class BinarySearch { /** * 从数组的前n个元素中二分查找值为x的元素 * @param a * @param x * @param n * @return * 时间复杂度:二分查找过程可用一棵二叉树来描述,它的左子树和右子树分别代码对应区间的左子表和右子表,通常把这样的二叉树称为判定树, * 进行二分查找的判定树不仅是一棵二叉搜索树,而且是一颗理想二叉树,因为除了最后一层外,其余所有层的结点数都是满的。 * 所以二分查找的时间复杂度为:O(log₂N),其中N为元素个数。 * 优点:比较次数少,查找速度快。 * 缺点:查找前需要建立有序表,这需要付出一定代价,同时对该有序表进行插入和删除操作都需要平均比较和移动表中的一半元素,是浪费时间的操作。 * 应用场景:适用于顺序存储、并且不经常进行插入和删除的有序表。不适用于链接存储的有序表。 */ public static int binarySearch(Object[] a, Object x, int n) { int low = 0; int high = n - 1; while(low <= high) { int mid = (low + high)/2; // 比较该下标代表的值与目标值 int result = ((Comparable)a[mid]).compareTo(x); if(result == 0) { return mid; }else if(result > 0) { // 查找左区间 high = mid - 1; }else { // 查找右区间 low = mid + 1; } } return -1; // 查找失败返回-1 } public static void main(String[] args) { Object[] a = {1,2,3,4,5,6,7,8,9,10,11}; System.out.println(binarySearch(a, 5, 5)); } }
优点:比较次数少,查找速度快。
缺点:查找前需要建立有序表,而频繁的插入和删除平均每次需要移动表中的一半元素,浪费时间。
适用场景:数据稳定,很少进行插入或删除运算的情况。也就是说,二分查找只适用于顺序存储的有序表,不适于连接存储的有序表。
发表评论
-
快速排序算法
2016-08-18 00:10 619[size=small]排序是数据处理领域一种最常用的运算,排 ... -
二叉搜索树和堆
2016-07-31 12:00 1342[size=x-small]这周学习了 ... -
二叉树基础-定义、创建、遍历、属性计算(深度,结点数)、查找算法
2016-07-23 15:02 4154一、概念和定义 ... -
散列算法,冲突解决方法分析
2016-07-09 12:11 1614哈希法又称散列法、杂凑法以及关键字地址计算法等,相应的表称为哈 ... -
需要学习的东西
2016-01-24 23:56 0spring,ioc,aop,23种设计模式。
相关推荐
通过以上步骤,我们可以设计并实现一个C语言的电话号码查找系统,有效地利用散列表实现快速的查找功能。在实际开发中,还需要编写详细的概要设计和详细设计文档,阐述每一步的设计思路和实现细节,以及可能遇到的...
散列表是一种高效的数据结构,它通过哈希函数将键(key)映射到数组的索引位置,从而实现快速的查找、插入和删除操作。在这个电话号码查找系统中,散列表被用来存储电话号码和用户名作为关键字的记录,每个记录包含...
设计散列表实现电话号码查找系统。 【基本要求】 1) 设每个记录有下列数据项:电话号码、用户名、地址; 2) 从键盘输入各记录,分别以电话号码和用户名为关键字建立散列表; 3) 采用一定的方法解决冲突; 4) 查找并...
在这个场景中,我们关注的是使用散列表(哈希表)来实现一个电话号码查找系统。散列表是一种数据结构,它允许我们在常数时间内进行查找、插入和删除操作,这使得它非常适合用于快速查找通讯录中的联系人。 首先,散...
为小于n个关键字设计一个散列表,使得查找成功时平均查找长度,要求完成相应的散列表建立和查找。假设关键字为整型数据,散列函数用除留余数法,采用开放定址法的线性探测法处理冲突。 1.从键盘输入关键字个数n及...
综合应用所学知识,设计完成一个散列表实现的电话号码查找系统。本系 统拟实现以下功能: 【基本要求】 1) 设每个记录有下列数据项:电话号码、用户名、地址; 2) 从键盘输入各记录,分别以电话号码和用户名为...
二分查找是一种高效的搜索算法,尤其适用于已排序的数组或列表。它通过不断将搜索区间减半来快速定位目标值,大大提高了查找效率。以下是关于二分查找算法的详细解释: 1. **设计内容** - **输入元素**:首先,...
在C++中,我们可以使用`std::unordered_map`容器来实现散列表,它已经内置了高效的哈希函数和冲突解决策略。电话本系统的核心功能包括添加联系人、查找联系人以及可能的删除联系人: 1. **添加联系人**:当添加新...
二分查找(Binary Search)是计算机科学中一种高效的数据检索方法,适用于已排序的数组或列表。它的基本思想是将目标值与数组中间元素进行比较,如果目标值等于中间元素,则查找成功;如果目标值小于中间元素,则在...
在Java中,二分查找法通常用于数组或有序列表中,其核心思想是通过不断缩小搜索范围来快速定位目标元素。以下是关于Java实现二分查找法的详细解释: 1. **算法原理**: 二分查找法首先将数组或列表分为左、中、右...
二分查找算法是计算机科学中的一个基本算法,适用于任何已排序的列表或数组。其优势在于能够快速地定位到目标值所在的范围,从而大幅减少不必要的比较次数。此外,对于大规模数据集而言,二分查找的效率远高于线性...
散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组...
数据结构课程中的散列表的编程实现,c语言
在Java中,我们可以使用`HashMap`类来实现散列表。`HashMap`提供了`put()`方法用于添加键值对,`get()`方法用于查询键对应的值。为了实现电话号码的添加,我们需要创建一个`HashMap`对象,然后将每个姓名或身份证号...
在C++中实现散列表,我们可以充分利用C++的特性来提高效率和代码的可读性。 首先,散列表的基本思想是利用哈希函数(Hash Function)将关键字(Key)转化为数组的下标,这个过程称为哈希化。哈希函数的设计至关重要...
本demo实现了类似qq列表,但能自行扩展的多级列表(demo中实现了4级列表)。满足每次点击cell才发起网络请求获取数据的思路(demo中在每次点击cell的时候创建并加载了更多的model)。满足自定义各级cell。
对于非关键字的词,程序可能会使用二分查找在C语言关键字列表中查找,若查找到则增加对应关键字的计数,否则跳过。考虑到VC++6.0的特性,这个程序可能使用C++标准库中的文件操作和字符串处理函数,如fstream用于文件...