`
betakoli
  • 浏览: 168762 次
社区版块
存档分类
最新评论

最长公共字串

 
阅读更多

动态规划法

经常会遇到复杂问题不能简单地分解成几个子问题,而会分解出一系列的子问题。简单地采用把大问题分解成子问题,并综合子问题的解导出大问题的解的方法,问题求解耗时会按问题规模呈幂级数增加。

为了节约重复求相同子问题的时间,引入一个数组,不管它们是否对最终解有用,把所有子问题的解存于该数组中,这就是动态规划法所采用的基本方法。

 

 

【问题】 求两字符序列的最长公共字符子序列

问题描述:字符序列的子序列是指从给定字符序列中随意地(不一定连续)去掉若干个字符(可能一个也不去掉)后所形成的字符序列。令给定的字符序列X=“x0,x1,…,xm-1”,序列Y=“y0,y1,…,yk-1”是X的子序列,存在X的一个严格递增下标序列<i0,i1,…,ik-1>,使得对所有的j=0,1,…,k-1,有xij=yj。例如,X=“ABCBDAB”,Y=“BCDB”是X的一个子序列。

考虑最长公共子序列问题如何分解成子问题,设A=“a0,a1,…,am-1”,B=“b0,b1,…,bm-1”,并Z=“z0,z1,…,zk-1”为它们的最长公共子序列。不难证明有以下性质:

(1) 如果am-1=bn-1,则zk-1=am-1=bn-1,且“z0,z1,…,zk-2”是“a0,a1,…,am-2”和“b0,b1,…,bn-2”的一个最长公共子序列;

(2) 如果am-1!=bn-1,则若zk-1!=am-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列;

(3) 如果am-1!=bn-1,则若zk-1!=bn-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列。

这样,在找A和B的公共子序列时,如有am-1=bn-1,则进一步解决一个子问题,找“a0,a1,…,am-2”和“b0,b1,…,bm-2”的一个最长公共子序列;如果am-1!=bn-1,则要解决两个子问题,找出“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列和找出“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列,再取两者中较长者作为A和B的最长公共子序列。

求解:

 

引进一个二维数组c[][],用c[i][j]记录X[i]与Y[j] 的LCS 的长度,b[i][j]记录c[i][j]是通过哪一个子问题的值求得的,以决定搜索的方向
我们是自底向上进行递推计算,那么在计算c[i,j]之前,c[i-1][j-1],c[i-1][j]与c[i][j-1]均已计算出来。此时我们根据X[i] = Y[j]还是X[i] != Y[j],就可以计算出c[i][j]。

问题的递归式写成:

 

 

recursive formula

回溯输出最长公共子序列过程:

flow

 

算法分析:
由于每次调用至少向上或向左(或向上向左同时)移动一步,故最多调用(m * n)次就会遇到i = 0或j = 0的情况,此时开始返回。返回时与递归调用时方向相反,步数相同,故算法时间复杂度为Θ(m * n)。

Java代码实现:

public class MaxPipei {
	public void pipei(char arr1[], char arr2[]) {
		int b[][] = new int[arr1.length][arr2.length];
		int c[][] = new int[arr1.length][arr2.length];
		for (int i = 0; i < arr1.length; i++) {
			if (arr1[i] == arr2[0]) {
				while (i < arr1.length) {
					c[i][0] = 1;
					b[i][0] = 1;
					i++;
				}
			} else
				c[i][0] = 0;
		}

		for (int j = 0; j < arr2.length; j++) {
			if (arr2[j] == arr1[0]) {
				while (j < arr2.length) {
					c[0][j] = 1;
					b[0][j] = 1;
					j++;
				}
			} else
				c[0][j] = 0;
		}

		for (int i = 1; i < arr1.length; i++) {
			for (int j = 1; j < arr2.length; j++) {
				if (arr1[i] == arr2[j]) {
					c[i][j] = c[i - 1][j - 1] + 1;
					b[i][j] = 1;
				}
				// System.out.println(i + ":" + j);
				if (arr1[i] != arr2[j]) {
					if (c[i - 1][j] >= c[i][j - 1]) {
						c[i][j] = c[i - 1][j];
						b[i][j] = 0;
					} else if (c[i - 1][j] < c[i][j - 1]) {
						c[i][j] = c[i][j - 1];
						b[i][j] = -1;
					}
				}
			}
		}
		System.out.println(c[arr1.length - 1][arr2.length - 1]);

		Display(b, arr1, arr1.length - 1, arr2.length - 1);
	}

	public static void Display(int[][] b, char[] x, int i, int j) {
		if (i == -1 || j == -1)
			return;

		if (b[i][j] == 1) {
			Display(b, x, i - 1, j - 1);
			System.out.print(x[i] + " ");
		} else if (b[i][j] == 0) {
			Display(b, x, i - 1, j);
		} else if (b[i][j] == -1) {
			Display(b, x, i, j - 1);
		}
	}

	public static void main(String[] args) {
		MaxPipei maxPipei = new MaxPipei();
		maxPipei.pipei("nihaodddiccc".toCharArray(), "hapoii".toCharArray());
	}
}

 子串如果是连续的,算法如下

import java.util.ArrayList;
import java.util.List;

public class MaxPublicSubString {
	List<Integer> maxstr = new ArrayList<Integer>();
	int maxLen = Integer.MIN_VALUE;

	public void pipei(char arr1[], char arr2[]) {
		//同不连续的字符串类似初始化。
		int c[][] = new int[arr1.length][arr2.length];
		for (int i = 0; i < arr1.length; i++) {
			if (arr1[i] == arr2[0]) {
				c[i][0] = 1;
			} else
				c[i][0] = 0;
		}

		for (int j = 0; j < arr2.length; j++) {
			if (arr2[j] == arr1[0]) {
				c[0][j] = 1;
			} else
				c[0][j] = 0;
		}
		StringBuffer sb = new StringBuffer();
		for (int i = 1; i < arr1.length; i++) {
			for (int j = 1; j < arr2.length; j++) {
				//当前字符相等,则用前面动态规划的值加1,否则为0
				c[i][j] = arr1[i] == arr2[j] ? 1 + c[i - 1][j - 1] : 0;
				//如果大于最大长度则改变记录位置。
				if (c[i][j] > maxLen) {
					maxstr.clear();
					maxstr.add(i);
					maxLen = c[i][j];
				} else if (c[i][j] == maxLen) {
					maxstr.add(i);
				}
			}
		}
	}

	public static void main(String[] args) {
		String str1 = new String("binghaven");
		String str2 = new String("jingseven");
		MaxPublicSubString mps = new MaxPublicSubString();
		mps.pipei(str1.toCharArray(), str2.toCharArray());
		System.out.println(mps.maxLen);
		for (Integer i : mps.maxstr) {
			System.out.println(str1.substring(i - mps.maxLen + 1, i + 1));
		}
	}
}

 

分享到:
评论

相关推荐

    用定长顺序存储结构表示串,求两个串的全部最长公共子串

    在本题目中,任务是使用定长顺序存储结构表示串,并找出两个字符串的最长公共子串。这是一个典型的字符串处理问题,通常在计算机科学和编程领域出现。以下是对这个任务的详细解析: 首先,我们需要理解“定长顺序...

    查找最长公共子串

    本话题聚焦于一个经典的算法问题——“查找最长公共子串”。这是一道典型的字符串算法题,主要考察对字符串操作和动态规划的理解。 首先,我们需要明确什么是“公共子串”。如果一个字符串s是另一个字符串t的子串,...

    最长公共子串的快速搜索算法

    最长公共子串的快速搜索算法 最长公共子串的快速搜索算法 最长公共子串的快速搜索算法

    动态规划——最长公共子序列和最长公共子串之Python实现

    用Python实现动态规划中最长公共子序列和最长公共子串问题!

    最长公共子串的求解问题

    最长公共子串求解,有需要的可以下来参考……

    C#最长公共子串(连续)算法(自创)

    在编程领域,最长公共子串(Longest Common Substring,LCS)问题是一个经典的问题,主要涉及字符串处理和算法设计。在这个案例中,我们关注的是一个由C#实现的自创算法来解决这个问题。下面将详细讲解这个算法的...

    新建 WinRAR 压缩文件_最长公共子串_

    在IT领域,尤其是在编程和算法设计中,"最长公共子串"是一个重要的概念。这个知识点主要涉及字符串处理和算法分析,对于计算机科学的学习者和开发者来说具有基础且实用的价值。在给定的压缩包文件中,我们可以看到它...

    最长公共子串MFC实现

    最长公共子串(Longest Common Substring,LCS)是一个在计算机科学中常见的字符串处理问题,它涉及到查找两个或多个字符串中的最长连续子序列,这个子序列同时存在于所有字符串中。MFC,全称为Microsoft Foundation...

    C语言求两个字符串的最长公共子串

    本文实例讲述了C语言求两个字符串的最长公共子串的方法。分享给大家供大家参考。具体实现方法如下: #include "stdio.h" #include "string.h" #include "stdlib.h" void getCommon(char str1[],char str2[],char * ...

    JavaScript自定义函数实现查找两个字符串最长公共子串的方法

    本文实例讲述了JavaScript自定义函数实现查找两个字符串最长公共子串的方法。分享给大家供大家参考,具体如下: //查找两个字符串的最长公共子串 function findSubStr(s1,s2){ var S=sstr= ,L1=s1.length,L2=s2....

    大整数计算器最长公共子串数据结构课设

    大整数计算器最长公共子串数据结构课设,沈阳工程学院

    动态规划:最长公共子串 LCS

    ### 动态规划:最长公共子串 LCS #### 长度与定义 **最长公共子串(Longest Common Substring, LCS)**是两个或多个字符串中的最长字符串,该字符串同时也是这些字符串的子串。这里需要注意区分子串与子序列的概念...

    获取最长公共子串

    在编程领域,"获取最长公共子串"是一个经典的问题,主要涉及到字符串处理和算法设计。这个问题的基本目标是从两个或多个给定的字符串中找到最长的共同连续子序列,即这个子序列是每个字符串的一部分,且在原字符串中...

    求解最大子序列、最长递增子序列、最长公共子串、最长公共子序列

    求解最大子序列、最长递增子序列、最长公共子串、最长公共子序列. http://blog.csdn.net/ssuchange/article/details/17341693

    java实现求两个字符串最长公共子串的方法

    在编程领域,求解两个字符串的最长公共子串是一个经典问题,主要应用于文本处理、比较和搜索算法。这里我们将深入探讨如何使用Java实现这一方法,同时结合华为在线判题平台(OJ)的要求来编写代码。 首先,我们需要...

    最长公共子串(动态规划)1

    最长公共子串问题是一个经典的计算机科学问题,主要目标是找到两个字符串中的最长的共同子序列,这个子序列在原字符串中都是连续的。在给定的代码中,使用了动态规划的方法来解决这个问题。 动态规划是一种解决问题...

    PHP实现求两个字符串最长公共子串的方法示例

    在编程领域,最长公共子串(Longest Common Substring,LCS)问题是一个经典的问题,它寻找两个或多个字符串中的最长连续子序列,这个子序列同时存在于所有字符串中。在这个问题中,我们专注于PHP如何解决两个字符串...

    编辑距离与最长公共子串(字符串的相似度)

    用本程序可得到字符串的相似度和字符串的公共子串以及编辑距离。

    LCS最长公共子串

    c源码编写的求两个字符串的最长公共子串,采用递归算法

Global site tag (gtag.js) - Google Analytics