`
暴风雪
  • 浏览: 390761 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论

[后缀数组]poj 2774:Long Long Message

阅读更多

大致题意:

    给出两个长度均不大于100000的字符串,求出这两个字符串的最长公共子串。

 

大致思路:
    具体思路请参考罗穗骞论文,大致就是将两个串合并为一个,在中间插入分隔符,再求出合并后字符串的最长重复子串,求重复子串时要注意height[i]和height[i-1]应该本别属于分隔符的两边。


 

 

#include<iostream>
#include<cstdio>
#include<cstring>
using namespace std;
const int Max = 200001;

int n, num[Max];
int sa[Max], rank[Max], height[Max];
int wa[Max], wb[Max], wv[Max], wd[Max];

int cmp(int *r, int a, int b, int l){
    return r[a] == r[b] && r[a+l] == r[b+l];
}

void da(int *r, int n, int m){          //  倍增算法 r为待匹配数组  n为总长度 m为字符范围
    int i, j, p, *x = wa, *y = wb, *t;
    for(i = 0; i < m; i ++) wd[i] = 0;
    for(i = 0; i < n; i ++) wd[x[i]=r[i]] ++;
    for(i = 1; i < m; i ++) wd[i] += wd[i-1];
    for(i = n-1; i >= 0; i --) sa[-- wd[x[i]]] = i;
    for(j = 1, p = 1; p < n; j *= 2, m = p){
        for(p = 0, i = n-j; i < n; i ++) y[p ++] = i;
        for(i = 0; i < n; i ++) if(sa[i] >= j) y[p ++] = sa[i] - j;
        for(i = 0; i < n; i ++) wv[i] = x[y[i]];
        for(i = 0; i < m; i ++) wd[i] = 0;
        for(i = 0; i < n; i ++) wd[wv[i]] ++;
        for(i = 1; i < m; i ++) wd[i] += wd[i-1];
        for(i = n-1; i >= 0; i --) sa[-- wd[wv[i]]] = y[i];
        for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i ++){
            x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p - 1: p ++;
        }
    }
}

void calHeight(int *r, int n){           //  求height数组。
    int i, j, k = 0;
    for(i = 1; i <= n; i ++) rank[sa[i]] = i;
    for(i = 0; i < n; height[rank[i ++]] = k){
        for(k ? k -- : 0, j = sa[rank[i]-1]; r[i+k] == r[j+k]; k ++);
    }
}

int main(){
    char str[Max];
    int i, m=30, ans,len1,len2;
    while(scanf("%s",str)!=EOF){
        ans=0;
        len1=strlen(str);
        for(i=0;i<len1;i++){
            num[i]=str[i]-'a'+2;     //字符的范围在2~~28之间
        }
        num[len1]=1;   //用一个不在字符集中的字符填充
        scanf("%s",str);
        len2=strlen(str);
        for(i=len1+1;i<len2+len1+1;i++){
            num[i]=str[i-(len1+1)]-'a'+2;     //字符的范围在2~~28之间
        }
        n=len1+len2+1;   //待处理数组的长度
        num[n]=0;
        da(num, n + 1, m);
        calHeight(num, n);
        for(i=2;i<=n;i++){
            if((sa[i]<len1&&sa[i-1]>len1)||(sa[i-1]<len1&&sa[i]>len1)){
                ans=max(ans,height[i]);
            }
        }
        printf("%d\n",ans);
    }
    return 0;
}
 
  • 大小: 48.2 KB
0
0
分享到:
评论

相关推荐

    后缀数组相关题解1

    【POJ 2774】要求求出两个字符串的最长公共子串,这可以通过后缀数组和LCP(Longest Common Prefix,最长公共前后缀)数组直接计算得出。 【POJ 3693】的问题更复杂一些,需要找出字符串中重复次数最多的连续重复子...

    经典 的POJ 分类

    - POJ 2031、POJ 1039:后缀数组的构建与应用。 #### 字典树 (Trie) - **题目示例**: - POJ 2513:Trie树的基本构造与查询。 ### 编程技巧 #### C++模板应用 - **题目示例**: - POJ 3096、POJ 3007:模板...

    树状数组练习:POJ 2481(JAVA)

    【标题】"树状数组练习:POJ 2481(JAVA)" 是一篇关于使用树状数组(也称为线段树)解决编程竞赛问题的文章。这篇文章可能详细讲解了如何运用这种数据结构来解决特定的问题POJ 2481。POJ(Programming Online Judge)...

    树状数组练习:POJ 3067

    【标题】"树状数组练习:POJ 3067" 树状数组,也称为线段树(Segment Tree),是一种高效的数据结构,用于处理区间查询和修改问题。在这个问题中,我们通过分析POJ 3067的题目来探讨如何应用树状数组解决实际问题。...

    滚动数组应用:POJ 1159

    标题“滚动数组应用:POJ 1159”指的是一个关于编程竞赛问题的解决方案,该问题在POJ(Programming Online Judge)平台上被提出。滚动数组是一种优化动态规划算法的技术,通过巧妙地重用和更新已经计算过的状态,减少...

    acm新手训练方案新手必备

    - **字符串算法**:包括后缀数组、AC自动机等。 - **组合优化**:涉及组合优化问题的求解方法。 - **数学建模**:学习如何将实际问题转化为数学模型进行求解。 - **数论算法**:包括质因数分解、扩展欧几里得算法等...

    POJ2092:计数排序,求第K大的元素

    【标题】"POJ2092:计数排序,求第K大的元素"是一个编程题目,主要涉及计数排序算法以及如何在数组中找出第K大的元素。计数排序是一种非基于比较的排序算法,它适用于整数排序,尤其在数据范围不大的情况下效率极高。...

    poj3261.zip_POJ 3261

    《POJ 3261:深入理解后缀数组及其应用》 在计算机科学与信息技术领域,算法设计和分析是核心部分,而字符串处理问题是其中不可或缺的议题。POJ 3261是一道经典的在线编程竞赛题目,它涉及到一个重要的数据结构——...

    二维树状数组学习之二:练习POJ 1195

    在本篇中,我们将深入学习二维树状数组的应用,并通过解决POJ 1195问题来实践这一概念。 POJ 1195题目要求我们计算一个二维矩阵中的子矩阵之和。这正是二维树状数组的优势所在,因为我们可以快速地对矩阵的任意矩形...

    poj_2682(3).rar_C++ 数组扩充_poj 26_poj 2682_poj26

    "C++ 数组扩充"提示我们问题可能与如何在C++编程语言中处理数组的增长有关,而"poj 26_poj 2682_poj26"似乎是重复提及问题编号,可能是用户在整理文件时的习惯。 描述中提到的“数链思想”可能是指一种处理数组元素...

    acm训练计划(poj的题)

    5. **后缀数组/后缀自动机**: - (poj1703, 2492):用于文本检索的强大工具。 6. **KMP算法**: - (poj1961, poj2406):高效的字符串匹配算法。 ### 十、进阶状态压缩 1. **状态压缩技巧**: - 如何高效地表示...

    poj2774.rar_poj_木材计算

    http://poj.grids.cn/problem?id=2774 POJ 2774 木棒加工 木材厂有一些原木,现在想把这些木头切割成一些长度相同的小段木头,需要得到的小段的数目是给定了。当然,我们希望得到的小段越长越好,你的任务是计算能够...

    ACM北大训练

    - poj1753: 题目要求找出特定条件下所有可能的解,适合用枚举法解决。 - poj2965: 同样适用于枚举策略。 ##### 2. 贪心 - **定义**: 贪心算法是在每一步选择中都采取在当前状态下最好或最优的选择,从而希望导致...

    二维树状数组练习 POJ 2029

    在POJ 2029这个题目中,`Main.java`文件可能包含了实现二维树状数组的代码。通常,代码会包含以下几个关键步骤: 1. **初始化**:创建一个足够大的一维数组C[],并用初始值填充。 2. **更新**:对于一个元素(x, y)...

    图的深搜+树状数组练习 POJ 3321(JAVA)

    标题中的“图的深搜+树状数组练习 POJ 3321(JAVA)”指的是一个编程题目,其中涉及到图的深度优先搜索(DFS, Depth First Search)算法和树状数组(也称为线段树,Segment Tree)的数据结构。这个题目来源于POJ...

    POJ1-7试题

    这是西北工业大学的POJ试题的答案,欢迎下载!

    POJ入门题库(含解题思路和答案)

    11. POJ——2694 逆波兰表达式:这是一个关于后缀表达式(逆波兰表示法)的题目,需要理解运算符优先级,并能实现表达式求值的算法。 12. POJ——2696 计算表达式的值:可能涉及到表达式解析,可以使用栈数据结构来...

    algorithms-and-data-structures.rar_algorithms

    "algorithms-and-data-structures.rar_algorithms"这个压缩包文件聚焦于几个关键的算法和概念,包括线段树、后缀数组、最大权闭合子图、求逆元、斜率优化以及强连通分量。下面我们将详细探讨这些知识点。 1. **线段...

    字符串进阶前导知识1

    通过了解后缀数组,我们可以解决如poj3261这样的模板题。 对于后缀数组的入门,推荐阅读的两篇文章是: 1. https://www.cnblogs.com/nietzsche-oier/articles/6621881.html 2. ...

    acm新手刷题攻略之poj

    - 后缀数组可以高效地解决字符串相关问题。 4. **区间查询** - 推荐题目:[poj3264](https://vjudge.net/problem/POJ-3264)、[poj3368](https://vjudge.net/problem/POJ-3368) - 区间查询问题通常涉及线段树或...

Global site tag (gtag.js) - Google Analytics