python实现求两个字符串的最长公共子串方法_python两个字符串的最长公共子串资源-CSDN下载

65 浏览量 2020-09-20 05:56:53 上传评论 1 收藏 36KB PDF 举报

在Python编程语言中，求解两个字符串的最长公共子串是一项常见的字符串处理任务。这个问题的解决方案通常基于动态规划思想，即将问题分解为更小的子问题，并存储子问题的解以便于后续使用，从而避免重复计算。下面我们将深入探讨如何使用Python实现这个算法。我们需要了解什么是字符串的最长公共子串。给定两个字符串`str1`和`str2`，它们的最长公共子串是指在两个字符串中都出现过的最长的、连续的字符序列。例如，如果`str1 = "ABCDEF"`，`str2 = "BDEFAC"`, 那么它们的最长公共子串是`"BDEF"`。以下是一个Python函数`getNumofCommonSubstr`，用于找到两个字符串的最长公共子串及其长度： ```python def getNumofCommonSubstr(str1, str2): lstr1 = len(str1) lstr2 = len(str2) record = [[0 for _ in range(lstr2+1)] for _ in range(lstr1+1)] # 创建二维数组，记录子串状态 maxNum = 0 # 初始化最长匹配长度为0 p = 0 # 初始化匹配起始位置 for i in range(lstr1): for j in range(lstr2): if str1[i] == str2[j]: # 如果当前字符相同，则更新记录数组 record[i+1][j+1] = record[i][j] + 1 if record[i+1][j+1] > maxNum: # 更新最长匹配长度和结束位置 maxNum = record[i+1][j+1] p = i + 1 # 返回最长公共子串和长度 return str1[p-maxNum:p], maxNum ``` 在这个函数中，我们创建了一个二维数组`record`，其大小为`(lstr1+1) * (lstr2+1)`，用来存储字符串`str1`和`str2`中连续字符是否相同的判断结果。数组的每个元素表示`str1`中从`i`位置到`i+1`位置的子串与`str2`中从`j`位置到`j+1`位置的子串是否相同。数组的额外一列和一行是为了方便边界条件的处理。在双重循环中，当`str1`的第`i`个字符和`str2`的第`j`个字符相等时，`record[i+1][j+1]`等于`record[i][j]`加1，表示当前子串长度增加1。同时，如果当前子串长度大于已知的最长公共子串长度`maxNum`，就更新`maxNum`和结束位置`p`。函数返回`str1`中从`p-maxNum`到`p`的子串作为最长公共子串，以及它的长度`maxNum`。这个算法的时间复杂度是O(nm)，其中n和m分别是两个输入字符串的长度。空间复杂度也是O(nm)，因为我们需要存储一个n*m的二维数组。虽然这种方法效率不是最高的，但它直观易懂，适合初学者理解和实现。在实际使用中，如果字符串长度非常大，可以考虑使用其他优化策略，如后缀树或后缀数组来提高效率。但针对大多数情况，上述的动态规划方法已经足够满足需求。

资源推荐

资源评论