好难,慢慢学.
1,定义:
(1)约定一个字符集Σ和一个字符串 S,设 len(S)=n,且 S[n]='$',也就是说 S 以一个特殊字符'$'结尾,并且'$'小于Σ中的任何一个字符。除了 S[n]之外,S 中的其他字符都属于Σ。对于约定的字符串 S,从位置 i 开头的后缀直接写成 Suffix(i)。
例如:S=mississippi+'$'
(2)后缀数组
后缀数组SA 是一个一维数组,它保存 1..n 的某个排列
SA[1],SA[2],...SA[n],并且保证 Suffix(SA[i])<Suffix(SA[i+1]),1≤i<n。也就是将S 的 n 个后缀从小到大进行排序之后把排好序的后缀的开头位置顺次放入SA中。
例如:
T1 = mississippi$ = txt
T2 = ississippi$
T3 = ssissippi$
T4 = sissippi$
T5 = issippi$
T6 = ssippi$
T7 = sippi$
T8 = ippi$
T9 = ppi$
T10 = pi$
T11 = i$
T12 = $
排序后结果为:
T12 = $
T11 = i
T8 = ippi
T5 = issippi
T2 = ississippi
T1 = mississippi
T10 = pi
T9 = ppi
T7 = sippi
T4 = sissippi
T6 = ssippi
T3 = ssissippi
得到:SA=[12 11 8 5 2 1 10 9 7 4 6 3]
(3)名次数组
名次数组 Rank=SA-1,也就是说若 SA[i]=j,则 Rank[j]=i,不难看出 Rank[i]保存的是 Suffix(i)在所有后缀中从小到大排列的“名次”.
得到:Rank=[6 5 12 10 4 11 9 3 8 7 2 1]
2,如何构造后缀数组?
等价于得到SA和Rank.改进的核心正在于此.
(1)最直接最简单的方法当然是把 S 的后缀都看作一些普通的字符串,按照一般字符串排序的方法对它们从小到大进行排序。
分析:这种做法是很笨拙的,因为它没有利用到各个后缀之间的有机联系,所以它的效率不可能很高。即使采用字符串排序中比较高效的 Multi-keyQuick Sort,最坏情况的时间复杂度仍然是O(n2)的.
(2)倍增算法(Doubling Algorithm)
充分利用了各个后缀之间的联系,将构造后缀数组的最坏时间复杂度成功降至 O(nlogn).
单独讲解倍增算法
1,定义u的k-前缀:
分享到:
相关推荐
后缀数组是字符串处理中的一个重要概念,它在解决与字符串相关的问题时表现出强大的威力。罗穗骞的《后缀数组——处理字符串的有力工具》详细介绍了这一数据结构及其应用,包含算法源码和解题源码,对于学习者来说是...
后缀数组是字符串处理中的一种重要数据结构,它在算法竞赛(如ACM)和实际编程问题中有着广泛的应用。本文将深入探讨后缀数组及其相关知识点,帮助你更好地理解和运用这一工具。 后缀数组(Suffix Array)的概念...
后缀数组是字符串处理中的一个重要数据结构,尤其在算法竞赛(如OI)和文本处理领域广泛应用。罗穗骞,可能是某位知名的OI教练或专家,提供了关于后缀数组的源码和相关题目,帮助学习者深入理解这一概念。 后缀数组...
后缀数组是字符串处理中的一种重要数据结构,它在计算机科学特别是文本算法领域扮演着关键角色。后缀数组能够提供一种高效的方式来存储和查询字符串的后缀,这使得它成为解决许多字符串问题的有效工具,例如查找模式...
### 后缀数组的概念与用法 #### 一、引言 后缀数组作为一种重要的数据结构,在字符串处理领域有着广泛的应用。相比于后缀树,后缀数组不仅在实现上更为简便,而且在空间效率上也表现出明显优势。本文旨在详细介绍...
### 后缀数组的倍增法实现 #### 一、后缀数组简介 后缀数组是一种数据结构,用于存储一个字符串的所有后缀按照字典序排序的结果。它在字符串匹配问题中有广泛的应用,例如查找模式串在文本串中的位置、最长公共...
后缀数组是一种高效处理字符串的数据结构,在信息学竞赛和许多字符串处理的实际应用中占据着重要地位。它不仅与后缀树具有相似的功能,而且在编程实现上更加简洁,占用内存也更少,成为后缀树的一个实用替代品。 一...
后缀数组是一种在计算机科学中用于处理字符串的高效数据结构,尤其在文本处理和字符串搜索领域有着广泛应用。本文将深入探讨后缀数组及其相关概念,包括SA(Suffix Array)、Height、RMQ(Range Minimum Query)以及...
后缀数组是计算机科学中一种重要的数据结构,主要用于处理字符串问题。它在字符串搜索、模式匹配、DNA序列分析等领域有着广泛的应用。后缀数组的概念首次由Manber和Myers在1993年提出,其核心思想是将一个字符串的...
《基于压缩后缀数组的字符串搜索库解析》 在信息技术领域,高效地处理字符串搜索问题至关重要,尤其是在大数据分析和文本挖掘等应用场景中。压缩后缀数组(Compressed Suffix Array, CSA)作为一种节省存储空间的...
后缀数组是一种在字符串处理中极其重要的数据结构,由许智磊在IOI2004国家集训队论文中介绍。它是一个一维数组,包含字符串的所有后缀按照字典顺序排序后的起始索引。后缀数组的构建是通过特定算法实现的,如O(nlogn...
后缀数组是计算机科学中处理字符串的一种重要数据结构,它在文本索引、字符串搜索、生物信息学等领域有着广泛的应用。后缀数组的概念源于1990年代,由Udi Manber首次提出,其核心思想是将一个字符串的所有后缀按照...
本篇文章将探讨四个关键概念:树状数组、后缀数组、字典树以及多串匹配算法,这些都属于字符串处理和高效计算的重要工具,并提供一些实际应用的启示。 1. **树状数组(Counting Array / Fenwick Tree)** 树状数组...
后缀数组的构造和应用基础 后缀数组是一种数据结构,用于处理字符串的搜索和匹配问题。它将字符串的所有后缀排序后的结果储存在一个数组中,每个元素 sa[i] 储存的是排名为 i 的后缀的开始位置。后缀数组的构造可以...
后缀数组的实现和应用 后缀数组是处理字符串的有力工具之一,它可以高效地解决许多字符串问题。下面我们将详细介绍后缀数组的实现和应用。 后缀数组的实现 后缀数组是指一个字符串的所有后缀的排序结果。其中,SA...
后缀数组是一种在字符串处理中非常重要的数据结构,它被广泛应用于信息学竞赛和算法设计中。后缀数组可以看作是一系列字符串后缀的排序,其中每个元素都是原字符串的一个后缀,按字典序排列。相比于后缀树,后缀数组...