`
yzmduncan
  • 浏览: 330344 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
文章分类
社区版块
存档分类
最新评论

KMP算法

阅读更多

    今天在POJ上做水题3981,是读取一行字符串并将其中的you换成we输出。以前用c的时候都是用的gets()和char。现在用C++,就了解了下getline与string。

    getline用来获取一行,语法是getline(cin,str),读到文件末尾就返回EOF。按照题目要求,将输入的数据保存在string str中,在str中寻找字符串you,string的find函数:str.find("you"),如果找到第一个you就返回you的开始位置,找不到就返回string::npos,记录这个位置为start,将start位置起的长度为3的内容换为we,然后从start+2开始继续寻找you,直到找不到you为止。

#include <iostream>
#include <string>
using namespace std;

int main()
{
    string str;
    while(getline(cin, str))
    {
        int start = str.find("you");
        while(start != string::npos)
        {
            str.replace(start, 3, "we");
            start = str.find("you", start+2);
        }
        cout << str << endl;
    }
    return 0;
}

 

   参考boost文档库,其实string的find方法提供的是O(m*n)的效率,不是很高,在这里就引出了KMP算法,它的时间效率是O(n+m)。

 

   模式匹配过程是这样:

       当模式串t中的tj与主串中的si比较不相等时,若模式串中存在真子串"t0t1...tk-1"="tj-ktj-k+1...tj-1",此时可以将模式串t按照k=next[j]的值右移,然后比较si与tk(仔细想想),若仍有si!=tk,则继续按照k=next[k]进行迭代,继续右滑,然后比较si与tk。这样的过程一直进行到k=0,此时,若仍有si!=t0,则比较si+1与t0。

next[j]的值有三种意思:

       当串有真子串,为k(0<k<j);

       当串无真子串,为0;

       当j=0,为-1。

//返回值:模式串在主串中出现的位置。s为主串,t为模式串,start是从主串开始搜索的位置(从0开始)
int KMPIndex(int next[], char s[], char t[], int start)
{
	int slen = strlen(s);
	int tlen = strlen(t);
	int i = start,j = 0, v;
	while(i<slen&&j<tlen)
	{
		if(s[i] == t[j])
		{
			i++;
			j++;
		}
		else if(j == 0) i++;
		else j = next[j];
	}
	if(j == tlen) v = i - tlen;
	else v = -1;
	return v;
}

 

下面,来讨论求next[j]值的算法问题。从next[j]值的三种意思可以看出,next[j]值的计算是一个递推问题。设有next[j]=k,即在模式串t中存在"t0t1...tk-1"="tj-ktj-k+1...tj-1",(0<k<j),其中k为满足等式的最大值,则计算next[j+1]有两种情况:

(1) 若tk=tj,则有next[j+1] = next[j]+1 = k + 1;

(2) 若tk!=tj,则把模式串"t0t1...tk-1"向右移动至k = next[k]。若此时tk=tj,则表明在模式串t中有"t0t1...tk-1tk"="tj-ktj-k+1...tj-1tj",因此有next[j+1] = next[next[j]] +1;若此时tk!=tj,则继续右移,以此类推,直到某此tk=tj,或某此比较有tk!=tj并且k=0,有next[j+1]=0。

 

//求子串T的next[j]的值保存在数组next中
void GetNext(char t[], int next[])
{
	int tlen = strlen(t);
	int j = 1, k = 0;
	next[0] = -1;
	next[1] = 0;
	while(j < tlen)
	{
		if(t[j] == t[k])
		{
			next[j+1] = k + 1;
			j++;
			k++;
		}
		else if(k == 0)
		{
			next[j+1] = 0;
			j++;
		}
		else
			k = next[k];
	}
}

 

   对于poj2406,首先求出串s对应的next数组后(串s的长度为n),构成s的字符串长度为d=n-next[n](如果n%d==0,存在这样的构成),相应的重复次数为n/d。

 

#include <iostream>

const int MAX = 1000001;
char s[MAX];
int next[MAX];

void getNext(int len)
{
	int j = 1, k = 0;
	next[0] = -1;
	next[1] = 0;
	while(j < len)
	{
		if(s[k] == s[j])
		{
			next[j + 1] = k + 1;
			j++;
			k++;
		}
		else if(k == 0)
		{
			next[j + 1] = 0;
			j++;
		}
		else
			k = next[k];
	}
}

int main()
{
	int t;
	int length;
	while(true)
	{
		scanf("%s",s);
		if(s[0] == '.') break;
		length = strlen(s);
		getNext(length);
		t = next[length];
		if(length%(length-t))
			printf("1\n");
		else
			printf("%d\n",length/(length-t));
	}
	return 0;
}

 

 参考poj1961,2406,2752

 

 

分享到:
评论

相关推荐

    KMP算法算法 KMP算法 KMP

    算法 KMP算法 KMP算法 KMP算法 KMP算法 KMP算法 KMP算法 KMP算法 KMP算法 KMP算法 KMP算法 KMP算法 KMP

    KMP算法详解 KMP算法详解

    KMP算法,全称为Knuth-Morris-Pratt算法,是一种高效的字符串匹配算法,由Donald Knuth、Vaughan Morris和Robert Pratt三位学者提出。它的主要目标是在一个长字符串(主串A)中查找是否存在一个指定的短字符串(模式...

    数据结果 kmp算法实验报告

    ### 数据结果 KMP算法实验报告 #### 实验背景与目的 本实验主要针对《数据结构》课程中的字符串处理部分,具体涉及的是模式匹配算法——KMP算法。通过实验加深学生对串类型及其基本操作的理解,并重点掌握两种重要...

    传统KMP算法与改进KMP算法的对比

    KMP算法,全称为Knuth-Morris-Pratt算法,是一种在字符串中寻找子串的高效搜索算法。它由D.E. Knuth、V. Morris和J.H. Pratt三位学者于1970年提出,主要用于解决模式匹配问题。传统的KMP算法避免了不必要的字符比较...

    易语言KMP算法模块

    KMP算法是一种改进的字符串匹配算法,由Donald Knuth、Morris和Frank Pratt共同提出,其主要特点是在匹配过程中能够避免不必要的字符比较,从而提高搜索效率。 KMP算法的核心思想是构建一个部分匹配表(也称为失败...

    数据结构(C语言)--模式匹配--KMP算法

    `KMP算法.cpp`文件应该包含了这些实现逻辑,通过编译生成的`KMP算法.exe`可执行文件可以直接运行并测试。 4. **性能分析** KMP算法的时间复杂度为O(n + m),其中n为主串长度,m为子串长度。这是因为即使最坏情况下...

    KMP算法实现模板(c++版)ACM算法

    **KMP算法实现模板(C++版) ACM算法** KMP(Knuth-Morris-Pratt)算法是一种在文本字符串中查找子串匹配的有效方法,尤其适用于已经预处理了模式串(子串)的匹配信息。它是由D.E. Knuth、V. Morris和J.H. Pratt...

    C++实现的KMP算法

    用C++语言实现的KMP算法。经过调试。供广大算法学习者参考。

    模式匹配的KMP算法

    "模式匹配的KMP算法" 模式匹配的KMP算法是计算机科学领域中的一种经典算法,用于解决串的模式匹配问题。该算法可以高效地查找目标串中是否包含某个模式串,并返回模式串在目标串中的起始位置。 模式匹配的KMP算法...

    《字符串模式匹配KMP算法》教学课例设计[归纳].pdf

    《字符串模式匹配KMP算法》教学课例设计 在这篇教学设计中,我们旨在帮助学生掌握KMP字符串模式匹配算法的基本概念和应用。通过本课例设计,学生将了解KMP算法的应用普遍性、实现机制和时间复杂度,并掌握计算next...

    数据结构KMP算法

    数据结构中的KMP算法是一种高效的字符串匹配算法,由D.E.Knuth、V.J.Morris和J.H.Pratt三位学者提出,因此得名KMP(Knuth-Morris-Pratt)。该算法主要用于在一个文本串中查找一个模式串(即目标字符串)是否存在。...

    kmp算法的代码实现

    数据结构、kmp算法、代码实现、KMP(char *P,char *T,int *N,int start)

    DS串应用--KMP算法

    DS串应用--KMP算法DS串应用--KMP算法DS串应用--KMP算法DS串应用--KMP算法

    BF算法和KMP算法

    BF 算法和 KMP 算法在字符串匹配中的应用 BF 算法和 KMP 算法是两种常用的字符串匹配算法,分别应用于不同的场景中。本文将对这两种算法进行详细的分析和比较,以便更好地理解它们的原理和应用。 BF 算法 BF ...

    模式匹配中的KMP算法的实现

    模式匹配中的KMP算法的实现 模式匹配是计算机科学领域中的一个研究热点,串的模式匹配算法是其中的一个重要分支。在模式匹配中,KMP算法是一个非常重要的算法,它可以高效地实现串的模式匹配。下面我们将详细介绍...

    字符串KMP算法c语言

    ### 字符串KMP算法C语言实现解析 在计算机科学领域,字符串匹配是常见的操作之一,其中KMP算法(Knuth-Morris-Pratt算法)因其高效性而被广泛使用。KMP算法由Donald Knuth、James H.Morris以及Vaughan Pratt共同...

    KMP算法KMP算法KMP算法KMP算法

    KMP算法,全称Knuth-Morris-Pratt算法,是一种高效的字符串匹配算法,由Donald Knuth、James H. Morris和 Vaughan Pratt三位学者在1970年提出。该算法主要用于解决在一个大文本串(A)中查找是否存在一个指定的小...

    KMP算法Flash演示

    数据结构中KMP算法过程的Flash演示

    KMP算法,求子字符串位置

    在数据结构和算法的学习中,理解并掌握KMP算法对于解决字符串匹配问题至关重要。 KMP算法的核心是构建一个“部分匹配表”(也称为“失败指针”或“前缀函数”),它记录了子字符串的每一个前缀和后缀的最大公共长度...

    Python实现字符串匹配的KMP算法

    kmp算法 KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为克努特——莫里斯——普拉特操作(简称KMP算法)。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串...

Global site tag (gtag.js) - Google Analytics