`
128kj
  • 浏览: 600280 次
  • 来自: ...
社区版块
存档分类
最新评论

学习“五大经典查找”(2)

阅读更多
大家可否知道,其实查找中有一种O(1)的查找,即所谓的秒杀。

第三:哈希查找:
     对的,他就是哈希查找,说到哈希,大家肯定要提到哈希函数,呵呵,这东西已经在我们脑子里面形成固有思维了。大家一定要知道“哈希“中的对应关系。

     比如说: ”5“是一个要保存的数,然后我丢给哈希函数,哈希函数给我返回一个”2",那么此时的”5“和“2”就建立一种对应关系,这种关系就是所谓的“哈希关系”,在实际应用中也就形成了”2“是key,”5“是value。

    那么有的朋友就会问如何做哈希,首先做哈希必须要遵守两点原则:
          ①:  key尽可能的分散,也就是我丢一个“6”和“5”给你,你都返回一个“2”,那么这样的哈希函数不尽完美。
          ②: 哈希函数尽可能的简单,也就是说丢一个“6”给你,你哈希函数要搞1小时才能给我,这样也是不好的。

其实常用的做哈希的手法有“五种”:

第一种:”直接定址法“。
很容易理解,key=Value+C; 这个“C"是常量。Value+C其实就是一个简单的哈希函数。

第二种:“除法取余法”。
很容易理解, key=value%C;解释同上。

第三种:“数字分析法”。
  这种蛮有意思,比如有一组value1=112233,value2=112633,value3=119033,
针对这样的数我们分析数中间两个数比较波动,其他数不变。那么我们取key的值就可以是
   key1=22,key2=26,key3=90。

第四种:“平方取中法”。此处忽略,见名识意。

第五种:“折叠法”。
   这种蛮有意思,比如value=135790,要求key是2位数的散列值。那么我们将value变为13+57+90=160,   然后去掉高位“1”,此时key=60,哈哈,这就是他们的哈希关系,这样做的目的就是key与每一位value都相关,来做到“散列地址”尽可能分散的目地。

    正所谓常在河边走,哪有不湿鞋。哈希也一样,你哈希函数设计的再好,搞不好哪一次就撞楼了,那么抛给我们的问题就是如果来解决“散列地址“的冲突。

其实解决冲突常用的手法也就2种:

第一种: “开放地址法“。
所谓”开放地址“,其实就是数组中未使用的地址。也就是说,在发生冲突的地方,后到的那个元素(可采用两种方式
:①线性探测,②函数探测)向数组后寻找"开放地址“然后把自己插进入。

第二种:”链接法“。
  这个大家暂时不懂也没关系,我就先介绍一下原理,就是在每个元素上放一个”指针域“,在发生冲突的地方,后到的那个元素将自己的数据域抛给冲突中的元素,此时冲突的地方就形成了一个链表。

  上面啰嗦了那么多,也就是想让大家在”设计哈希“和”解决冲突“这两个方面提一点参考和手段。

那么下面就上代码了,
     设计函数采用:”除法取余法“。
     冲突方面采用:”开放地址线性探测法"。

import java.util.List;
import java.util.Arrays;
import java.util.Scanner;
public class HashProgram  
     {  
         //“除法取余法”   
         static int hashLength = 13;  
   
         //原数据 
          static Integer a[]={ 13, 29, 27, 28, 26, 30, 38 }; 
          static List<Integer> list=Arrays.asList(a);  
 
         //c#中可以这样啊!jdk1.7也不能啊
        // static List<int> list = new List<int>() { 13, 29, 27, 28, 26, 30, 38 };  
     
         //哈希表长度   
         static int[] hash = new int[hashLength];  
   
       public static void main(String[] args)  
         {  
             Scanner sca=new Scanner(System.in);
             //创建hash   
             for (int i = 0; i < list.size(); i++)  
             {  
                 InsertHash(hash, hashLength, list.get(i));  
             }  
   
             System.out.println("Hash表中的数据:");
             for(int i:hash)
               System.out.print(i+",");  
   
             while (true)  
             {  
                 System.out.printf("\n请输入要查找数字:");  
                 int result = sca.nextInt();  
                 int  index = SearchHash(hash, hashLength, result);  
   
                 if (index != -1)  
                   System.out.println("数字" + result + "在索引的位置是:" + index);  
                 else  
                   System.out.println("呜呜," + result + " 在hash中没有找到!");  
   
             }  
         }  
   
   
 // Hash表检索数据   

     static int SearchHash(int[] hash, int hashLength, int key)  
         {  
             //哈希函数   
             int hashAddress = key % hashLength;  
   
             //指定hashAdrress对应值存在但不是关键值,则用开放寻址法解决   
             while (hash[hashAddress] != 0 && hash[hashAddress] != key)  
             {  
                 hashAddress = (++hashAddress) % hashLength;  
             }  
   
             //查找到了开放单元,表示查找失败   
             if (hash[hashAddress] == 0)  
                 return -1;  
             return hashAddress;  
   
         }  
   
          
 //数据插入Hash表   
 
         static void InsertHash(int[] hash, int hashLength, int data)  
         {  
             //哈希函数   
             int hashAddress = data % 13;  
              //如果key存在,则说明已经被别人占用,此时必须解决冲突   
             while (hash[hashAddress] != 0)  
             {  
                 //用开放寻址法找到   
                 hashAddress = (++hashAddress) % hashLength;  
             }  
   
             //将data存入字典中   
             hash[hashAddress] = data;  
         }  
      
 }  


运行:
D:\java>java   HashProgram
Hash表中的数据:
13,27,28,29,26,30,0,0,0,0,0,0,38
请输入要查找数字:38
数字38在索引的位置是:12

请输入要查找数字:33
呜呜,33 在hash中没有找到!

请输入要查找数字:27
数字27在索引的位置是:1

请输入要查找数字:

第四:索引查找
  简称分级查找.例如汉字查找.对象是计算机为索引查找而建立的主表和各级索引表,主表只有一个,索引表的级数和数量不受限制,根据具体的需要确定.索引存储结构是数据组织的一项很重要的存储技术,在数据库领域中有广泛的应用.

  基本思想:首先把一个集合或线性表(主表)按照一定的函数关系或条件划分成若干个逻辑上的子表,为每个子表分别建立一个索引项,由所有这些索引项构成主表的一个索引表,然后,可采用顺序或是链接的方式来存储索引表和每个子表.

索引表包含三个域:
(1)索引值域,用来存储对应子表的索引值,相当于记录的关键字,在索引表中由此索引值来唯一标识一个索引项.

(2)表的开始位置域,用来存储对应子表的第一个元素的存储位置,从此位置出发可以依次访问到子表中的所有元素.

(3)子表的长度域:用来存储对应子表的元素个数.

  索引查找算法:是在索引表和主表上进行的查找.过程是:首先根据给定的索引值K1,在索引表上查找出索引值等于K1的索引项,以确定对应子表在主表的开始位置和长度.然后再根据给定的关键字K2,在对应的子表中查找出关键字等于K2的元素.对索引表或子表的查找时,若表是顺序存储的有序表,则可进行顺序查找,也可以进行二分查找.否则只能进行顺序查找.

import java.util.Arrays;
public class IndexSearch {  
  
    // 主表  
    static int[] students = { 101, 102, 103, 104, 105, 0, 0, 0, 0, 0, 201, 202,  
            203, 204, 0, 0, 0, 0, 0, 0, 301, 302, 303, 0, 0, 0, 0, 0, 0, 0 };  
    // 索引表  
    static IndexItem[] indexItem = { new IndexItem(1, 0, 5),  
            new IndexItem(2, 10, 4), new IndexItem(3, 20, 3), };  
  
    // 查找数据  
    public static int indexSearch(int key) {  
        IndexItem item = null;  
  
        // 建立索引规则  
        int index = key / 100;  
  
        // 首先去索引找  
        for (int i = 0; i < indexItem.length; i++) {  
            if (indexItem[i].index == index) {  
                item = indexItem[i]; 
                break;  
            }  
        }  
  
        // 如果item为null,则说明在索引中查找失败  
        if (item == null)  
            return -1;  
  
        for (int i = item.start; i < item.start + item.length; i++) {  
            if (students[i] == key) {  
                return i;  
            }  
        }  
        return -1;  
    }  
  
    // / 插入数据  
    public static int insert(int key) {  
        IndexItem item = null;  
        // 建立索引规则  
        int index = key / 100;  
        int i = 0;  
        for (i = 0; i < indexItem.length; i++) {  
            // 获取到了索引  
            if (indexItem[i].index == index) {  
                item = indexItem[i];
                break;  
            }  
        }  
        if (item == null)  
            return -1;  
        // 更新主表  
        students[item.start + item.length] = key;  
        // 更新索引表  
        indexItem[i].length++;  
        return 1;  
    }  
  
    public static void main(String[] args) {  
        int value = 205;  
        // 将205插入集合中,过索引  
        int index = insert(value);  
        insert(308);  
  
        // 如果插入成功,获取205元素所在的位置  
        if (index == 1) {  
            System.out.println("\n插入后数据:" + Arrays.toString(students));  
            System.out.println("\n数据元素:205在数组中的位置为 " + indexSearch(205) + "位");  
        }  
  
    }  
  
}  
  
// 索引项实体  
class IndexItem {  
    // 对应主表的值  
    public int index;  
    // 主表记录区间段的开始位置  
    public int start;  
    // 主表记录区间段的长度  
    public int length;  
  
    public IndexItem() {  
    }  
  
    public IndexItem(int index, int start, int length) {  
        this.index = index;  
        this.start = start;  
        this.length = length;  
    }  
}  


运行:
D:\java>java   IndexSearch

插入后数据:[101, 102, 103, 104, 105, 0, 0, 0, 0, 0, 201, 202, 203, 204, 205, 0, 0, 0, 0, 0, 301, 302, 303, 308, 0, 0, 0, 0, 0, 0]

数据元素:205在数组中的位置为 14位

下载源码:
分享到:
评论

相关推荐

    学习“五大经典查找”(3)

    在本篇博客“学习‘五大经典查找’(3)”中,博主主要探讨了计算机科学中的查找算法,这是数据结构与算法的重要组成部分。查找算法在软件开发中起着至关重要的作用,尤其是在处理大量数据时,高效的查找算法能显著...

    算法系列15天速成 第六天 五大经典查找【下】

    由于它的有序性,可以快速定位数据,使得搜索时间复杂度降低至O(log n),在数据量大时具有明显优势。 ### 总结 掌握二叉排序树的原理及其操作是数据结构与算法学习中的一个重要里程碑。理解其动态平衡的过程和对...

    解析lookup的经典查找方式.docx

    本篇主要解析lookup的经典查找方式,特别是向量形式的应用,以及如何利用lookup函数进行条件查找。 **一、lookup函数基本用法** lookup函数的向量形式语法为:`LOOKUP(lookup_value, lookup_vector, result_vector...

    算法系列15天速成 第四天 五大经典查找【上】

    在本篇中,我们将探讨两种经典的查找算法:顺序查找和折半查找。这两种算法在日常生活中有着广泛的应用,例如寻找班级中最漂亮的女生或猜测年龄等。 首先,我们来看顺序查找(Sequential Search)。顺序查找是最...

    数据结构课程设计-查找

    本课程设计主要关注五种不同的查找算法:顺序查找、折半查找、二叉树查找、二叉排序树查找以及哈希查找。这些方法在不同的场景下各有优势,理解并比较它们的性能对于优化算法和提高程序效率至关重要。 一、实践目的...

    C++数据结构折半查找法(二分查找)

    总的来说,二分查找法是C++数据结构学习中的一个重要部分,对于提高程序的运行效率有着重要作用。理解并能熟练运用二分查找法,将有助于提升作为程序员的数据处理能力。通过不断的实践和练习,初学者可以更好地掌握...

    第五章:查找-2021-11

    《第五章:查找》 本章内容主要涵盖了数据结构与算法中的查找技术,适用于计算机科学与技术学院的学生学习。查找是数据处理中的基础操作,它根据给定的值在数据集合中寻找相应记录或元素的过程。本章将深入探讨多种...

    C++ 二分查找法

    ### C++ 二分查找法详解 在计算机科学领域,数据结构与算法是核心课程之一,其中二分查找法(Binary Search)是一种高效的查找技术...在未来的学习和工作中,合理运用二分查找法将极大地提升数据处理的效率和准确性。

    acm折半查找法参考代码

    在ACM(国际大学生程序设计竞赛)中...总结,折半查找法是编程中的一种高效查找策略,尤其适用于处理大规模有序数据。通过熟练掌握这种算法,可以提升在ACM等编程竞赛中的竞争力,并在实际项目开发中优化数据处理性能。

    算法系列15天速成 第五天 五大经典查找【中】

    2. **除法取余法**:通过关键字除以某个较大的素数后取余数作为地址。例如,`key = value % C`。 3. **数字分析法**:根据关键字的特性选取某些部分作为地址。例如,对于数值“112233”,可以取中间两位数字“22”...

    二分查找算法FLASH演示

    综上所述,二分查找算法是数据结构与算法学习中的重要概念,理解其原理并能熟练运用,对于提升编程能力大有裨益。通过提供的"二分查找.swf"文件,初学者可以通过动画演示更直观地理解和掌握这一算法。

    数据结构实验五查找的实现.doc

    数据结构实验五主要探讨了两种查找方法的实现:线性查找和折半查找。这两种查找方法都是在数组或表中定位特定元素的关键技术,在实际编程和数据处理中有着广泛的应用。 1. 线性查找(Linear Search): 线性查找是...

    数据结构7.3树表查找

    通过这些知识点的学习,可以帮助读者更好地理解如何利用二叉排序树进行高效的查找操作。 #### 二、二叉排序树简介 二叉排序树(Binary Search Tree, BST),又称二叉查找树,是一种特殊的二叉树,具有以下性质: 1....

    数据结构 查找

    #### 五、哈希查找 **5.1 系统简介** 哈希查找是一种高效的数据查找方法,它利用哈希函数将关键字映射到一个特定的索引位置,从而快速定位元素。 **5.2 设计思路** 哈希查找的基本步骤: 1. 选择合适的哈希函数...

    搜索引擎学习 方便查找!

    #### 五、倒排索引技术详解 ##### 5.1 正向索引与倒排索引的区别 - **正向索引**:传统的索引方式,通常是基于记录ID建立索引。当进行基于字段值的搜索时,效率较高;但如果进行模糊匹配或部分词条搜索,则需要...

    深大算法实验五——查找所有的桥

    在深大算法实验五中,主题是“查找所有的桥”,这是一个经典的图论问题,与数据结构和算法密切相关。桥在图论中指的是图中的一种特殊连接结构,如果去掉这个边,会导致原来的连通分量数量增加,即桥是维持图连通性的...

    数据结构查找教学,内含五个视频(前版).zip

    在本教学资料中,主要介绍了五种不同的查找方法,这些方法是数据结构和算法学习的基础,对于理解和优化程序性能至关重要。 首先,我们来看**顺序查找**。顺序查找是最基础的查找方法,它遍历数据序列,逐个比较元素...

    基于二分法的从词库中查找单词源代码

    ### 基于二分法的从词库中查找单词 ...通过对基于二分法的词库查找算法的学习,我们了解到了如何高效地在一个有序数组中查找特定元素。这种算法在实际应用中具有广泛的价值,尤其是在处理大量数据时能够显著提升性能。

    任意文件中查找字符串程序_

    通过对其使用方法及源代码的解析,我们不仅了解了如何在DOS环境下进行字符串查找,还学习了如何利用C语言实现文件操作及字符串处理的基本技巧。这对于深入理解早期操作系统的工作原理以及编程实践具有重要意义。

    C#查找窗口句柄的方法

    - Pinvoke.net: 一个关于P/Invoke签名的在线数据库,可以快速查找和学习API函数的C#实现。 - CodeProject: 包含许多C#与Windows API交互的实例项目和技术文章。 总结,C#查找窗口句柄是通过调用Windows API实现的,...

Global site tag (gtag.js) - Google Analytics