两种方法:
循环两次寻找最长的子串:
<方法一>
#include <iostream>
#include <stdio.h>
#include<string>
using namespace std;
int main(){
string str,tep;
cin>>str;
for(int i=str.length()-1;i>1;i--){
for(int j=0;j<str.length();j++){
if(j+i<=str.length()){
size_t t=0;
size_t num=0;
tep=str.substr(j,i);
t=str.find(tep);
num=str.rfind(tep);
if(t!=num){
cout<<tep<<" "<<t+1<<endl;
system("pause");
return 1;
}
}
}
}
system("pause");
return 1;
}
<方法二>
首先,如果输入字符串存储在c[0..n-1]中,那么就可以使用类似于下面的代码比较每对子字符串:
maxlen = -1
for i = [0, n)
for j = (i, n)
if (thislen = comlen(&c[i], &c[j])) > maxlen
maxlen = thislen
maxi = i
maxj = j
此处:
int comlen(char *p, char* q)
i = 0
while *q && (*p++ = *q++)//strlen(q)<strlen(p)
i++
return i
后缀数组方法:
#define MAXN 5000000
char c[MAXN], *a[MAXN];
首先初始化a,这样,每个元素就都指向输入字符串中的相应字符:
while (ch = getchar()) != EOF
a[n] = &c[n];
c[n++] = ch;
c[n] = 0 ;//将数组c中的最后一个元素设为空字符,以终止所有字符串。
这样,元素a[0]指向整个字符串,下一个元素指向以第二个字符开始的数组的后缀,等等。
第二,对后缀数组进行快速排序,以将后缀相近的(变位词)子串集中在一起
qsort(a, n, sizeof(char*), pstrcmp)后
a[0]:banana a[0]:a
a[1]:anana qsort a[1]:ana
a[2]:nana ============》 a[2]:anana
a[3]:ana a[3]:banana
a[4]:na a[4]:na
a[5]:a a[5]:nana
注:qsort的说明:
qsort():
原型:
_CRTIMP void __cdecl qsort (void*, size_t, size_t,int (*)(const void*, const void*));
解释: qsort ( 数组名 ,元素个数,元素占用的空间(sizeof),比较函数)
比较函数是一个自己写的函数 遵循 int com(const void *a,const void *b) 的格式。
当a b关系为 > < = 时,分别返回正值 负值 零 (或者相反)。
使用a b 时要强制转换类型,从void * 转换回应有的类型后,进行操作。
数组下标从零开始,个数为N, 下标0-(n-1)。
实例:
int compare(const void *a,const void *b)
{
return *(int*)b-*(int*)a;
}
int main()
{
int a[20]={2,4,1,23,5,76,0,43,24,65},i;
for(i=0;i<20;i++)
cout<<a[i]<<endl;
qsort((void *)a,20,sizeof(int),compare);
for(i=0;i<20;i++)
cout<<a[i]<<endl;
return 0;
}
相关:
1)why你必须给予元素个数?
因为阵列不知道它自己有多少个元素
2)why你必须给予大小?
因为 qsort 不知道它要排序的单位.
3)why你必须写那个丑陋的、用来比较俩数值的函式?
因为 qsort 需要一个指标指向某个函式,因为它不知道它所要排序的元素型别.
4)why qsort 所使用的比较函式接受的是 const void* 引数而不是 char* 引数?
因为 qsort 可以对非字串的数值排序.
第三,使用以下comlen函数对数组进行扫描比较邻接元素,以找出最长重复的字符串:
for i = [0, n)
if comlen(a[i], a[i+1]) > maxlen
maxlen = comlen(a[i], a[i+1])
maxi = i
printf("%.*s\n", maxlen, a[maxi])
由于少了内层循环,只是多了一次排序,因此该算法的运行时间为O(n logn).
代码:
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <string.h>
4
5 #define MAXCHAR 5000 //最长处理5000个字符
6
7 char c[MAXCHAR], *a[MAXCHAR];
8
9 int comlen( char *p, char *q ){
10 int i = 0;
11 while( *p && (*p++ == *q++) )
12 ++i;
13 return i;
14 }
15
16 int pstrcmp( const void *p1, const void *p2 ){
17 return strcmp( *(char* const *)p1, *(char* const*)p2 );
18 }
19
20 int main( ){
21 char ch;
22 int n=0;
23 int i, temp;
24 int maxlen=0, maxi=0;
25 printf("Please input your string:\n");
26 while( (ch=getchar())!='\n' ){
27 a[n]=&c[n];
28 c[n++]=ch;
29 }
30 c[n]='\0';
31 qsort( a, n, sizeof(char*), pstrcmp );
32 for(i=0; i<n-1; ++i ){
33 temp=comlen( a[i], a[i+1] );
34 if( temp>maxlen ){
35 maxlen=temp;
36 maxi=i;
37 }
38 }
39 printf("%.*s\n",maxlen, a[maxi]);
40 system("PAUSE");
41 return 0;
42 }
疑难解释:
1、a是指针数组,数组的元素全是char* 类型的指针。所以对应pstrcmp里面的void类型就是char*
2、const void*p,将char*代替void后,也就是进行强制类型转换时应该写成(char* const*)p 而不是
(const char **)p,两者之间的区别见前面博文。强调一点:char* const* p里面的const是修饰char*的
也就是说,p里面的内容是一个char* const q类型的指针。故(*p)++是不允许的。
补充:sort()
要使用此函数只需用#include <algorithm> sort即可使用,语法描述为:
sort(begin,end),表示一个范围,例如:
int _tmain(int argc, _TCHAR* argv[])
{
int a[20]={2,4,1,23,5,76,0,43,24,65},i;
for(i=0;i<20;i++)
cout<<a[i]<<endl;
sort(a,a+20);
for(i=0;i<20;i++)
cout<<a[i]<<endl;
return 0;
}
输出结果将是把数组a按升序排序,说到这里可能就有人会问怎么样用它降序排列呢?这就是下一个讨论的内容.
一种是自己编写一个比较函数来实现,接着调用三个参数的sort:sort(begin,end,compare)就成了。对于list容器,这个方法也适用,把compare作为sort的参数就可以了,即:sort(compare).
1)自己编写compare函数:
bool compare(int a,int b)
{
return a<b; //升序排列,如果改为return a>b,则为降序
}
int _tmain(int argc, _TCHAR* argv[])
{
int a[20]={2,4,1,23,5,76,0,43,24,65},i;
for(i=0;i<20;i++)
cout<<a[i]<<endl;
sort(a,a+20,compare);
for(i=0;i<20;i++)
cout<<a[i]<<endl;
return 0;
}
2)更进一步,让这种操作更加能适应变化。也就是说,能给比较函数一个参数,用来指示是按升序还是按降序排,这回轮到函数对象出场了。
为了描述方便,我先定义一个枚举类型EnumComp用来表示升序和降序。很简单:
enum Enumcomp{ASC,DESC};
然后开始用一个类来描述这个函数对象。它会根据它的参数来决定是采用“<”还是“>”。
class compare
{
private:
Enumcomp comp;
public:
compare(Enumcomp c):comp(c) {};
bool operator () (int num1,int num2)
{
switch(comp)
{
case ASC:
return num1<num2;
case DESC:
return num1>num2;
}
}
};
接下来使用 sort(begin,end,compare(ASC)实现升序,sort(begin,end,compare(DESC)实现降序。
主函数为:
int main()
{
int a[20]={2,4,1,23,5,76,0,43,24,65},i;
for(i=0;i<20;i++)
cout<<a[i]<<endl;
sort(a,a+20,compare(DESC));
for(i=0;i<20;i++)
cout<<a[i]<<endl;
return 0;
}
3)其实对于这么简单的任务(类型支持“<”、“>”等比较运算符),完全没必要自己写一个类出来。标准库里已经有现成的了,就在functional里,include进来就行了。functional提供了一堆基于模板的比较函数对象。它们是(看名字就知道意思了):equal_to<Type>、not_equal_to<Type>、greater<Type>、greater_equal<Type>、less<Type>、less_equal<Type>。对于这个问题来说,greater和less就足够了,直接拿过来用:
- 升序:sort(begin,end,less<data-type>());
- 降序:sort(begin,end,greater<data-type>()).
int _tmain(int argc, _TCHAR* argv[])
{
int a[20]={2,4,1,23,5,76,0,43,24,65},i;
for(i=0;i<20;i++)
cout<<a[i]<<endl;
sort(a,a+20,greater<int>());
for(i=0;i<20;i++)
cout<<a[i]<<endl;
return 0;
}
4)既然有迭代器,如果是string 就可以使用反向迭代器来完成逆序排列,程序如下:
int main()
{
string str("cvicses");
string s(str.rbegin(),str.rend());
cout << s <<endl;
return 0;
}
发表评论
-
析构函数为虚函数的原因
2012-09-09 11:42 840我们知道,用C++开发的时候,用来做基类的类的析构函数 ... -
hash的应用
2012-08-31 23:02 966第一部分为一道百度面试题Top K算法的详解;第二部分为关 ... -
微软智力题
2012-08-29 19:59 573第一组1.烧一根不均匀的绳,从头烧到尾总共需要1个小时。现在有 ... -
C++不能被继承的类
2012-08-27 20:16 1064一个类不能被继承, ... -
括号对齐问题
2012-08-27 10:47 1416解法一:左右括号成一对则抵消 可以 ... -
树的遍历
2012-08-19 10:43 722/****************************** ... -
堆排序
2012-08-16 14:24 886堆:(二叉)堆数据结构是一种数组对象。它可以被视为一棵完全 ... -
多态赋值
2012-08-14 16:16 836#include <iostream> usi ... -
static变量与static函数(转)
2012-08-13 10:15 750一、 static 变量 static变量大致分为三种用法 ... -
不用sizeof判断16位32位
2012-08-10 15:21 1708用C++写个程序,如何判断一个操作系统是16位还是3 ... -
找出连续最长的数字串(百度面试)
2012-08-09 15:15 1152int maxContinuNum(const char*in ... -
顺序栈和链栈
2012-08-06 10:01 803顺序栈:话不多说直接上代码 #include ... -
队列的数组实现和链表实现
2012-08-05 16:20 1028话不多少,数组实现上代码: #include<i ... -
KMP算法详解
2012-08-02 21:40 891KMP算法: 是在一个“主文本字符串” ... -
寻找一个字符串连续出现最多的子串的方法(转)
2012-07-31 21:19 1000算法描述首先获得后缀数组,然后1.第一行第一个字符a,与第二行 ... -
字符串的循环移位
2012-07-31 16:52 981假设字符串:abcdefg 左循环两位:cdefgab 右 ... -
一次谷歌面试趣事(转)
2012-07-31 15:26 775很多年前我进入硅谷 ... -
约瑟夫环问题(循环链表)
2012-07-30 21:31 1297题目描述:n只猴子要选大王,选举方法如下:所有猴子按 1, ... -
面试之单链表
2012-07-30 20:18 7311、编程实现一个单链表的建立/测长/打印。 ... -
多重继承内存地址问题
2012-07-30 15:55 731[cpp] view plaincopy ...
相关推荐
本问题聚焦于找出字符串中的最长重复子串及其出现位置,这是一个典型的字符串处理任务,具有较高的实用价值。 最长重复子串是指在一个字符串中,连续重复出现次数最多的子串。解决这个问题通常需要使用滑动窗口、...
为找到最长的重复子字符串,我们需要在统计频率的同时,记录下当前找到的最长重复子串及其长度。每次更新最长子串时,不仅要考虑长度,还需要确保其在字符串中出现了至少两次。 这里可以采用两种方法实现: 1. **...
假设有一个字符串S,我们的任务是找出其中最长的重复子串,即在S中至少出现两次的最长连续子序列。这个问题不仅涉及到字符串匹配的基本概念,还可能涉及到数据结构和算法的高级应用。 ### 二、数据结构设计 为了...
它的目标是找到两个给定序列(通常为字符串)的最长子序列,该子序列在原序列中不需连续,但必须保持原顺序。这个问题在文本编辑、生物信息学和软件工程等领域有着广泛的应用。 在解决LCS问题时,最常用的方法是...
最长公共子串是指在两个字符串中都连续出现且长度最长的子串,与最长公共子序列(Longest Common Subsequence,LCS)不同,它要求子串必须是原始字符串的连续片段。 为了解决最长公共子串问题,可以采用穷举法,这...
标题中的“php-leetcode题解之最长不含重复字符的子字符串”表明这是一个关于使用PHP解决LeetCode算法问题的资源包,具体问题是寻找一个字符串中最长的不包含重复字符的子字符串。这个问题在计算机科学和编程领域是...
最长公共子字符串问题是一个经典计算机科学问题,主要目标是找到两个字符串中连续出现的最长相同字符序列。在C语言中,这个问题通常通过动态规划方法来解决。动态规划是一种解决复杂问题的有效策略,它通过将问题...
【Python求两个字符串最长公共子序列】 在编程领域,字符串操作是常见任务之一,而寻找两个字符串的最长公共子序列(LCS)是其中的一个经典问题。LCS是指两个字符串中都出现过的最长的连续子序列,但不考虑字符在...
这个问题的核心在于从给定的字符串中找到最长的连续重复出现的子串及其首次出现的位置。下面将深入探讨这个问题的解决思路、实现方法以及示例解析。 ### 解决思路 查找最长重复子串的问题可以通过多种算法来解决,...
数组的元素`L[i][j]`表示字符串1的前`i`个字符和字符串2的前`j`个字符的最长公共子序列的长度。 2. 遍历两个字符串,对于每个位置`i`和`j`: - 如果当前字符相同,`L[i][j] = L[i-1][j-1] + 1`,因为我们在当前...
在JavaScript编程中,"最长重复子串"是一个常见的字符串处理问题。它要求找出一个字符串中最长的连续子序列,这个子序列在原字符串中至少出现两次。这个问题在文本处理、数据压缩、生物信息学等领域都有广泛应用。...
在这个项目中,我们关注的是基于LCS的相似度计算,因为LCS可以直观地反映出两个字符串共享的最长连续子串长度,从而反映它们的相似性。 最长公共子序列问题定义如下:给定两个字符串S1和S2,找到一个非空字符串Z,...
在示例中,分别对字符串"abcabcd","abcabcabd"和"bbbbbbb"进行了处理,结果分别是"abc","ab"和"b",这些都是各自字符串中最长的非重复子串。 这个解决方案的关键在于巧妙地结合了滑窗切片和计数器来快速有效地...
通过后缀数组,我们可以快速找到字符串中最长的重复子串、计算出不相同子串的个数,甚至检测字符串中的最长回文子串。 2.3 两个字符串的相关问题 在比较两个字符串时,后缀数组可以帮助我们快速找到它们之间的最长...
要找到一个字符串中连续重复次数最多的子串,我们需要遍历字符串并比较相邻的子串。算法大致可以分为以下几个步骤: 1. 初始化:设置两个变量,一个用于保存当前子串,另一个用于记录最大重复次数。此外,还需要一...
最长公共子序列(Longest Common Subsequence,LCS)是计算机科学中一个经典的字符串处理问题,主要用于计算两个或多个字符串之间的相似度。在本项目中,我们关注的是使用C++编程语言来实现这一算法,通过动态规划的...
7. **Suffix Array(后缀数组)**:后缀数组是所有字符串后缀排序后的数组,可以用来高效地执行许多字符串操作,如最长重复子串、LCP(最长公共前后缀)数组的构建等。 8. **suffix tree(后缀树)**:后缀树是后缀...
5. **连续重复子串**:寻找连续重复的子串及其出现次数,后缀数组同样适用。 6. **两个或多个字符串的相关问题**:如最长公共子串、长度不小于k的公共子串的个数等,后缀数组可以处理多字符串之间的关系。 后缀数组...