插入排序原理:假设给数组Array排序 ,从第二个元素开始排序,就假定的条件是待排序的数字的前面所有的元素已经有序!如从第二个元素开始,前面的一个元素一定是有序的。如果第一个元素比第二个元素大,将一后移。借用算法导论书上的图
第一次从第二个元素开始,
到给下标是N的元素排序的时候,[0....N-1]的元素已经是有序的,这个时候,是从N-1的下标开始比较,如果N-1大于N,就将N-1后移。然后继续比较
N-2和N元素的大小,如果还是大于N,N-2后移,到一个不大于N的元素的时候,直接将N的数组赋给改元素的后一个元素。
public static void insertSort(int [] arr) { for(int i=2;i<arr.length;i++) { int temp = arr[i]; int k = i-1; while(k>=0 && arr[k]>temp) { arr[k+1]=arr[k]; k--; } arr[k+1]=temp; } }
从上面可以看出改算法的时间复杂度为O(n*n)
问题的提出:假设有A,B两个文件,文件里面都是url地址,各有10亿条,如何找出AB两个文件里面都存在的Url。(内存装不下任何一个文件的十分之一)
解决方法:首先在不考虑内存的情况下,我们最传统的方法就是是遍历AB两个文件一个一个的比较,这个方法是能找出结果,但是时间复杂度是o(n2),对于没一个url都要去遍历一遍另外的一个文件。
而Bloom Filter可以解决该问题,同时在时间和空间的开销上都是很小的。原理如下:
1.建立一个byte数组 ,长度为LEN,数组的长度越长发送错误的概率越低
2.读取A的每一个记录,对每一个记录建立一个hash,假设hash值是D
3可以将数组的(LEN-1) & D 位标识值1
4.对于查询是否包含该记录的请求,可以直接查看数组的(LEN-1) & D 的值是否为1,如果为1表示存在
测试代码如下:
import java.util.ArrayList; import java.util.List; /** * 布尔过滤,bit的越大发生的错误的概率越小,哈希的函数和次数也决定啦错误的概率 * * @author zxc * */ public class BoolFilter { private byte[] bits; private int size; public BoolFilter(int size) { this.size = size; bits = new byte[size]; } public void add(String str) { int hash = str.hashCode(); bits[(size - 1) & hash] = 1; } public boolean contain(String str) { return bits[(size - 1) & str.hashCode()] == 1; } /** * @param args */ public static void main(String[] args) { // TODO Auto-generated method stub BoolFilter filter = new BoolFilter(10000000); List<String> list = new ArrayList<String>(); for (int i = 0; i < 99; i++) { String str = java.util.UUID.randomUUID().toString(); list.add(str); filter.add(str); } for (int i = 0; i < 10; i++) { String str = java.util.UUID.randomUUID().toString(); System.out.println(filter.contain(str)); } System.out .println("----------------------------------------------------------"); for (int i = 0; i < 10; i++) { // String str = java.util.UUID.randomUUID().toString(); System.out.println(filter.contain(list.get(i))); } } }
可能大家会有疑问为什么byte数组搞的那么长10000000,这个该算法的本身有关,如果byte的数组长度为1,那么对于任何的处理都是查询处理存在。
而byte越长,那么出现的hash碰撞的概率就越小,同时hash的次数越多出现的概率也越低,但是都不能保证不发生错误。只是降低了错误的概率。
相关推荐
**插入排序**是一种简单直观的排序算法,它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。这种算法对大数据量的处理效率较低,但对于小规模数据或者部分有序的...
Java排序算法 - 插入排序 插入排序(Insertion Sort)是一种简单的排序算法,它的基本思想是将一个记录插入到已经排好序的有序表中,从而得到一个新的、记录数增 1 的有序表。该算法的实现非常简单,但其时间复杂度...
插入排序是一种基础且直观的排序算法,它的工作原理可以类比于整理扑克牌。在实际应用中,插入排序对于小规模数据或者部分有序的数据表现优秀,但对于大规模无序数据,其效率相对较低。以下是关于插入排序的详细知识...
插入排序算法是一种简单的排序算法,它的工作原理是通过将每个元素插入到已经排序的序列中,以达到排序的目的。插入排序算法的时间复杂度为O(n^2),因此它适合小规模的数据排序。 4.快速排序算法 快速排序算法是一...
理解插入排序算法-讲解
经典排序算法 - 插入排序Insertion sort 经典排序算法 - 基数排序Radix sort 经典排序算法 - 鸽巢排序Pigeonhole sort 经典排序算法 - 归并排序Merge sort 经典排序算法 - 冒泡排序Bubble sort 经典排序算法 - ...
直接插入排序是一种基础且简单的排序算法,它的工作原理可以形象地比喻为扑克牌的洗牌过程。在实际应用中,虽然对于大规模数据的排序效率不如更高级的算法,如快速排序、归并排序等,但它的实现简单,适合小规模或...
在编程领域,排序算法是计算机科学中的核心概念,特别是在Java这样的高级编程语言中。这个名为"java排序算法-大全.rar"的压缩包文件显然包含了多种Java实现的排序算法,这对于我们理解和掌握这些算法至关重要。 ...
**插入排序(Insertion Sort)**是一种简单直观的排序算法,它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,通常采用in-place排序(即只需用到...
插入排序是一种简单直观的排序算法,它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,通常采用in-place排序(即只需用到O(1)的额外空间的排序...
实现以下常用的内部排序算法并进行性能比较:"直接插入排序"," 折半插入排序"," 2—路插入排序"," 表插入排序"," 希尔排序"," 起泡排序"," 快速排序"," 简单选择排序"," 树形选择排序"," 堆排序"," 归并排序"," 链式...
本文将深入探讨标题和描述中提到的一些基本排序算法,包括选择排序、冒泡排序、插入排序、希尔排序、堆排序、快速排序以及归并排序,并结合C++编程语言进行讲解。 1. **选择排序(Selection Sort)** - 选择排序是一...
- 直接插入排序:是一种简单的排序算法,将每个元素插入到已排序的部分,保持有序。时间复杂度为O(N^2),适用于小规模数据和基本有序的数据。 - 希尔排序:是插入排序的一种改进版本,通过设定间隔序列(希尔增量...
直接插入排序是一种基础且常用的排序算法,它的工作原理可以直观地理解为手动整理扑克牌的过程。在本篇文章中,我们将深入探讨直接插入排序的细节,包括它的基本思想、步骤、时间复杂度以及适用场景。 一、基本思想...
在这个例子中,可能会有一个类`SortAlgorithms`包含各种排序算法的成员函数,如冒泡排序、选择排序、插入排序、快速排序等。另一个类`UserInterface`则负责处理用户交互和控制执行哪种排序算法。 3. **排序算法的...
Java代码-排序-直接插入排序、希尔排序、直接选择排序、冒泡排序、堆排序、快速排序、归并排序中部分排序以及算法-贪心法,大家可以将源码下载下来进行学习,附带着注释和解释,有不理解的可以找博主一起探讨,共同...
本篇文章将详细讨论几种常见的排序算法:选择排序、冒泡排序、插入排序、合并排序以及快速排序,分析它们的算法原理、时间效率,并通过经验分析验证理论分析的准确性。 **1. 选择排序(Selection Sort)** 选择排序...
此文件为数据结构中的九种排序算法,包含一些排序方法的过程,其九种排序包括:直接插入排序,折半插入排序,希尔排序,冒泡排序,快速排序,选择排序,堆排序,归并排序,基数排序!
该资源提供了Java中实现插入排序的全面指南。文档中涵盖了插入排序的基本概念,包括如何对数组进行排序以及如何在Java中实现插入排序。此外,文档还包括一个逐步指南,介绍了如何在Java中实现插入排序,包括详细的...