`
蒙面考拉
  • 浏览: 160597 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

字符串的最长连续重复子串

 
阅读更多

两种方法:

循环两次寻找最长的子串:

<方法一>

 

#include <iostream>

#include <stdio.h>

#include<string>

using namespace std;

int main(){

 

 

string str,tep;

cin>>str;

for(int i=str.length()-1;i>1;i--){

for(int j=0;j<str.length();j++){

if(j+i<=str.length()){

size_t t=0;

size_t num=0;

tep=str.substr(j,i);

t=str.find(tep);

num=str.rfind(tep);

if(t!=num){

cout<<tep<<" "<<t+1<<endl;

system("pause");

return 1;

}

}

}

}

 

system("pause");

return 1;

}

 

 

<方法二>

 

首先,如果输入字符串存储在c[0..n-1]中,那么就可以使用类似于下面的代码比较每对子字符串:

    maxlen = -1

    for i = [0, n)

        for j = (i, n)

            if (thislen = comlen(&c[i], &c[j])) > maxlen

                maxlen = thislen

                maxi = i

                maxj = j

 

此处:

 

   int comlen(char *p, char* q)

        i = 0

        while *q && (*p++ = *q++)//strlen(q)<strlen(p)

            i++

        return i

 

后缀数组方法:

 

 

 

#define MAXN 5000000

char c[MAXN], *a[MAXN];

 

首先初始化a,这样,每个元素就都指向输入字符串中的相应字符:

    while (ch = getchar()) != EOF

          a[n] = &c[n];

          c[n++] = ch;

          c[n] = 0 ;//将数组c中的最后一个元素设为空字符,以终止所有字符串。

这样,元素a[0]指向整个字符串,下一个元素指向以第二个字符开始的数组的后缀,等等。

 

第二,对后缀数组进行快速排序,以将后缀相近的(变位词)子串集中在一起

qsort(a, n, sizeof(char*), pstrcmp)

 

 

 

a[0]:banana                                          a[0]:a

 

a[1]:anana                   qsort                 a[1]:ana

a[2]:nana             ============》 a[2]:anana         

a[3]:ana                                               a[3]:banana

a[4]:na                                                 a[4]:na

a[5]:a                                                   a[5]:nana

 

注:qsort的说明:

      qsort():

      原型:
      _CRTIMP void __cdecl qsort (void*, size_t, size_t,int (*)(const void*, const void*));

      解释:    qsort ( 数组名 ,元素个数,元素占用的空间(sizeof),比较函数) 
                  比较函数是一个自己写的函数  遵循 int com(const void *a,const void *b) 的格式。
                  当a b关系为 >  <  = 时,分别返回正值 负值 零 (或者相反)。
                  使用a b 时要强制转换类型,从void * 转换回应有的类型后,进行操作。 
                  数组下标从零开始,个数为N, 下标0-(n-1)。

                  实例:
                         int compare(const void *a,const void *b)
                         {
                                return *(int*)b-*(int*)a;  
                          }

                         int main()
                         {
                                int a[20]={2,4,1,23,5,76,0,43,24,65},i;
                                for(i=0;i<20;i++)
                                    cout<<a[i]<<endl;
                               qsort((void *)a,20,sizeof(int),compare);
                               for(i=0;i<20;i++)
                                     cout<<a[i]<<endl;
                                return 0;
                         }

      相关:

            1)why你必须给予元素个数?

               因为阵列不知道它自己有多少个元素

            2)why你必须给予大小?

               因为 qsort 不知道它要排序的单位.

            3)why你必须写那个丑陋的、用来比较俩数值的函式?

               因为 qsort 需要一个指标指向某个函式,因为它不知道它所要排序的元素型别.

            4)why qsort 所使用的比较函式接受的是 const void* 引数而不是 char* 引数?

               因为 qsort 可以对非字串的数值排序.

 

第三,使用以下comlen函数对数组进行扫描比较邻接元素,以找出最长重复的字符串:

for i = [0, n)

     if comlen(a[i], a[i+1]) > maxlen

         maxlen = comlen(a[i], a[i+1])

         maxi = i

printf("%.*s\n", maxlen, a[maxi])

由于少了内层循环,只是多了一次排序,因此该算法的运行时间为O(n logn). 

代码:

1 #include <stdio.h>
 2 #include <stdlib.h>
 3 #include <string.h>
 4 
 5 #define MAXCHAR 5000 //最长处理5000个字符
 6 
 7 char c[MAXCHAR], *a[MAXCHAR];
 8 
 9 int comlen( char *p, char *q ){
10     int i = 0;
11     while*&& (*p++ == *q++) )
12         ++i;
13     return i;
14 }
15 
16 int pstrcmp( const void *p1, const void *p2 ){
17     return strcmp( *(char* const *)p1, *(char* const*)p2 );
18 }
19 
20 int main(  ){
21     char ch;
22     int  n=0;
23     int  i, temp;
24     int  maxlen=0, maxi=0;
25     printf("Please input your string:\n");
26     while( (ch=getchar())!='\n' ){
27         a[n]=&c[n];
28         c[n++]=ch;
29     }
30     c[n]='\0';
31     qsort( a, n, sizeof(char*), pstrcmp );
32     for(i=0; i<n-1++i ){
33         temp=comlen( a[i], a[i+1] );
34         if( temp>maxlen ){
35             maxlen=temp;
36             maxi=i;
37         }
38     }
39     printf("%.*s\n",maxlen, a[maxi]);
40     system("PAUSE");
41     return 0;
42 }

 

 

疑难解释:

1、a是指针数组,数组的元素全是char* 类型的指针。所以对应pstrcmp里面的void类型就是char*

2、const void*p,将char*代替void后,也就是进行强制类型转换时应该写成(char* const*)p 而不是

      (const char **)p,两者之间的区别见前面博文。强调一点:char* const* p里面的const是修饰char*的

      也就是说,p里面的内容是一个char* const q类型的指针。故(*p)++是不允许的。

 

补充:sort()

 

 

要使用此函数只需用#include <algorithm> sort即可使用,语法描述为:

sort(begin,end),表示一个范围,例如:

int _tmain(int argc, _TCHAR* argv[])
{
 int a[20]={2,4,1,23,5,76,0,43,24,65},i;
 for(i=0;i<20;i++)
  cout<<a[i]<<endl;
 sort(a,a+20);
 for(i=0;i<20;i++)
 cout<<a[i]<<endl;
 return 0;
}

输出结果将是把数组a按升序排序,说到这里可能就有人会问怎么样用它降序排列呢?这就是下一个讨论的内容.

 

一种是自己编写一个比较函数来实现,接着调用三个参数的sort:sort(begin,end,compare)就成了。对于list容器,这个方法也适用,把compare作为sort的参数就可以了,即:sort(compare).

1)自己编写compare函数:

bool compare(int a,int b)
{
      return a<b;   //升序排列,如果改为return a>b,则为降序

}

int _tmain(int argc, _TCHAR* argv[])
{
     int a[20]={2,4,1,23,5,76,0,43,24,65},i;
     for(i=0;i<20;i++)
       cout<<a[i]<<endl;
     sort(a,a+20,compare);
     for(i=0;i<20;i++)
       cout<<a[i]<<endl;
     return 0;
}

2)更进一步,让这种操作更加能适应变化。也就是说,能给比较函数一个参数,用来指示是按升序还是按降序排,这回轮到函数对象出场了。

为了描述方便,我先定义一个枚举类型EnumComp用来表示升序和降序。很简单:

enum Enumcomp{ASC,DESC};

然后开始用一个类来描述这个函数对象。它会根据它的参数来决定是采用“<”还是“>”。

class compare
{
      private:
            Enumcomp comp;
      public:
            compare(Enumcomp c):comp(c) {};
      bool operator () (int num1,int num2)
         {
            switch(comp)
              {
                 case ASC:
                        return num1<num2;
                 case DESC:
                        return num1>num2;
              }
          }
};

接下来使用 sort(begin,end,compare(ASC)实现升序,sort(begin,end,compare(DESC)实现降序。

主函数为:

int main()
{
     int a[20]={2,4,1,23,5,76,0,43,24,65},i;
     for(i=0;i<20;i++)
         cout<<a[i]<<endl;
     sort(a,a+20,compare(DESC));
     for(i=0;i<20;i++)
         cout<<a[i]<<endl;
     return 0;
}

3)其实对于这么简单的任务(类型支持“<”、“>”等比较运算符),完全没必要自己写一个类出来。标准库里已经有现成的了,就在functional里,include进来就行了。functional提供了一堆基于模板的比较函数对象。它们是(看名字就知道意思了):equal_to<Type>、not_equal_to<Type>、greater<Type>、greater_equal<Type>、less<Type>、less_equal<Type>。对于这个问题来说,greater和less就足够了,直接拿过来用:

  • 升序:sort(begin,end,less<data-type>());
  • 降序:sort(begin,end,greater<data-type>()).

int _tmain(int argc, _TCHAR* argv[])
{
      int a[20]={2,4,1,23,5,76,0,43,24,65},i;
      for(i=0;i<20;i++)
          cout<<a[i]<<endl;
      sort(a,a+20,greater<int>());
      for(i=0;i<20;i++)
          cout<<a[i]<<endl;
      return 0;
}

4)既然有迭代器,如果是string 就可以使用反向迭代器来完成逆序排列,程序如下:

int main()
{
     string str("cvicses");
     string s(str.rbegin(),str.rend());
     cout << s <<endl;
     return 0;
}

 

 

 

分享到:
评论

相关推荐

    字符串中的最长重复串

    本问题聚焦于找出字符串中的最长重复子串及其出现位置,这是一个典型的字符串处理任务,具有较高的实用价值。 最长重复子串是指在一个字符串中,连续重复出现次数最多的子串。解决这个问题通常需要使用滑动窗口、...

    查询出字符串中重复出现且最长的子字符串

    为找到最长的重复子字符串,我们需要在统计频率的同时,记录下当前找到的最长重复子串及其长度。每次更新最长子串时,不仅要考虑长度,还需要确保其在字符串中出现了至少两次。 这里可以采用两种方法实现: 1. **...

    求串中最长重复子串。

    假设有一个字符串S,我们的任务是找出其中最长的重复子串,即在S中至少出现两次的最长连续子序列。这个问题不仅涉及到字符串匹配的基本概念,还可能涉及到数据结构和算法的高级应用。 ### 二、数据结构设计 为了...

    求字符串的最长公共子序列

    它的目标是找到两个给定序列(通常为字符串)的最长子序列,该子序列在原序列中不需连续,但必须保持原顺序。这个问题在文本编辑、生物信息学和软件工程等领域有着广泛的应用。 在解决LCS问题时,最常用的方法是...

    php-leetcode题解之最长不含重复字符的子字符串.zip

    标题中的“php-leetcode题解之最长不含重复字符的子字符串”表明这是一个关于使用PHP解决LeetCode算法问题的资源包,具体问题是寻找一个字符串中最长的不包含重复字符的子字符串。这个问题在计算机科学和编程领域是...

    C语言求解最长公共子字符串问题及相关的算法分析

    最长公共子字符串问题是一个经典计算机科学问题,主要目标是找到两个字符串中连续出现的最长相同字符序列。在C语言中,这个问题通常通过动态规划方法来解决。动态规划是一种解决复杂问题的有效策略,它通过将问题...

    Python求两个字符串最长公共子序列代码实例

    【Python求两个字符串最长公共子序列】 在编程领域,字符串操作是常见任务之一,而寻找两个字符串的最长公共子序列(LCS)是其中的一个经典问题。LCS是指两个字符串中都出现过的最长的连续子序列,但不考虑字符在...

    找查最长的重复子串

    这个问题的核心在于从给定的字符串中找到最长的连续重复出现的子串及其首次出现的位置。下面将深入探讨这个问题的解决思路、实现方法以及示例解析。 ### 解决思路 查找最长重复子串的问题可以通过多种算法来解决,...

    字符串相似性算法【最长公共字符串算法】 【LCS】

    数组的元素`L[i][j]`表示字符串1的前`i`个字符和字符串2的前`j`个字符的最长公共子序列的长度。 2. 遍历两个字符串,对于每个位置`i`和`j`: - 如果当前字符相同,`L[i][j] = L[i-1][j-1] + 1`,因为我们在当前...

    js代码-最长重复子串

    在JavaScript编程中,"最长重复子串"是一个常见的字符串处理问题。它要求找出一个字符串中最长的连续子序列,这个子序列在原字符串中至少出现两次。这个问题在文本处理、数据压缩、生物信息学等领域都有广泛应用。...

    使用Java实现的计算两字符串相似度+最长公共子序列.zip

    在这个项目中,我们关注的是基于LCS的相似度计算,因为LCS可以直观地反映出两个字符串共享的最长连续子串长度,从而反映它们的相似性。 最长公共子序列问题定义如下:给定两个字符串S1和S2,找到一个非空字符串Z,...

    Python实现针对给定字符串寻找最长非重复子串的方法

    在示例中,分别对字符串"abcabcd","abcabcabd"和"bbbbbbb"进行了处理,结果分别是"abc","ab"和"b",这些都是各自字符串中最长的非重复子串。 这个解决方案的关键在于巧妙地结合了滑窗切片和计数器来快速有效地...

    后缀数组——处理字符串的有力工具.pdf

    通过后缀数组,我们可以快速找到字符串中最长的重复子串、计算出不相同子串的个数,甚至检测字符串中的最长回文子串。 2.3 两个字符串的相关问题 在比较两个字符串时,后缀数组可以帮助我们快速找到它们之间的最长...

    charnums.rar_字符串 c语言

    要找到一个字符串中连续重复次数最多的子串,我们需要遍历字符串并比较相邻的子串。算法大致可以分为以下几个步骤: 1. 初始化:设置两个变量,一个用于保存当前子串,另一个用于记录最大重复次数。此外,还需要一...

    基于C++实现的通过动态规划查找最长公共子序列计算字符串之间相似度.zip

    最长公共子序列(Longest Common Subsequence,LCS)是计算机科学中一个经典的字符串处理问题,主要用于计算两个或多个字符串之间的相似度。在本项目中,我们关注的是使用C++编程语言来实现这一算法,通过动态规划的...

    字符串算法

    7. **Suffix Array(后缀数组)**:后缀数组是所有字符串后缀排序后的数组,可以用来高效地执行许多字符串操作,如最长重复子串、LCP(最长公共前后缀)数组的构建等。 8. **suffix tree(后缀树)**:后缀树是后缀...

    后缀数组——处理字符串的有力工具1

    5. **连续重复子串**:寻找连续重复的子串及其出现次数,后缀数组同样适用。 6. **两个或多个字符串的相关问题**:如最长公共子串、长度不小于k的公共子串的个数等,后缀数组可以处理多字符串之间的关系。 后缀数组...

    ACM字符串题目及源代码[参照].pdf

    - PKU3693和SPOJ687题目都是关于找出重复次数最多的连续重复子串,这可能需要遍历整个字符串,维护当前子串及其出现次数的状态。 7. **长度不小于k的公共子串的个数**: - PKU3415要求计算所有长度不小于k的公共...

Global site tag (gtag.js) - Google Analytics