数据结构KMP算法及next数组求解过程资源-CSDN下载

共21个文件

tlog：6个

pdb：2个

suo：1个

需积分: 50 176 浏览量 2018-11-04 20:30:58 上传评论 2 收藏 2.59MB ZIP 举报

数据结构中的KMP（Knuth-Morris-Pratt）算法是一种高效的字符串匹配算法，它能够快速地在主串中查找模式串是否存在。该算法的核心在于利用了预处理得到的next数组，这个数组记录了模式串中每个字符后可能跟的最长公共前后缀的长度。下面我们将深入探讨KMP算法及其next数组的求解过程。我们需要理解KMP算法的基本思想。传统的朴素字符串匹配算法在遇到不匹配时会将模式串回溯到第一个字符，但KMP算法通过next数组避免了这种无效的回溯。当主串与模式串中对应位置的字符不匹配时，模式串会根据next数组的值向前移动，这样可以跳过已知的部分，减少不必要的比较次数。接下来，我们详细讲解如何求解next数组。next数组的计算是基于模式串的，对于模式串中的每个字符，我们需要找到其前面的最大公共前后缀。例如，对于模式串"ababc"，next数组应该是[0, 0, 1, 2, 0]，表示在字符'a'和'b'之后没有公共前后缀，而在字符'b'和'a'之后有公共前后缀'a'，在字符'c'和'b'之后有公共前后缀'ab'。计算next数组的步骤如下： 1. 初始化next[0]为0，表示模式串的第一个字符没有前缀。 2. 从第二个字符开始，假设当前字符为'i'，则next[i]等于上一个满足模式串前'i-1'个字符和'i-n'到'i-1'个字符相同的最大值'n'，如果找不到这样的'n'，则next[i]为0。 3. 在这个过程中，我们需要用到已计算好的next[i-1]，并检查模式串的子串'i-n'到'i-1'是否与'i-1-n'到'i-2'相同，若相同则更新next[i]。在实际编程实现中，这个过程可以通过两个指针j和i来完成，j初始为0，i初始为1。当模式串的子串'i-j'到'i-1'与'i-1-j'到'i-2'相同时，将j加1，并将next[i]设置为j。若不相同，将i减1，并将j设置为next[i-1]。重复这个过程直到i等于模式串的长度。有了next数组，我们就可以实现KMP算法了。在匹配过程中，当主串与模式串的某个位置不匹配时，主串指针不动，模式串指针根据next数组移动到适当位置。如果整个模式串都匹配完了，说明模式串在主串中找到了。 KMP算法的时间复杂度是O(m+n)，其中m是模式串的长度，n是主串的长度，因为每次字符比较后，模式串的移动都是基于next数组，而不是简单地回溯。这使得KMP算法在处理大量数据时具有较高的效率。在C++编程中，我们可以定义一个KMP匹配函数，接受主串和模式串作为输入，返回模式串在主串中的起始位置。函数内部实现KMP算法，结合next数组进行字符串匹配。 KMP算法和next数组是数据结构中非常重要的部分，它们提供了高效字符串匹配的方法，对于理解和应用字符串处理有着重要意义。通过深入学习和实践，我们可以更好地掌握这一经典算法，提高程序的运行效率。

资源推荐

资源详情

资源评论

收起资源包目录

KMP算法及next数组.zip （21个子文件）

KMP算法及next数组

ConsoleApplication1

Debug

ConsoleApplication1.ilk 475KB

ConsoleApplication1.exe 66KB

ConsoleApplication1.pdb 851KB

ConsoleApplication1.v12.suo 17KB

ConsoleApplication1

Debug

vc120.pdb 332KB

ConsoleApplication1.log 2KB

ConsoleA.52031550.tlog

cl.command.1.tlog 744B

CL.read.1.tlog 6KB

link.read.1.tlog 2KB

link.write.1.tlog 664B

ConsoleApplication1.lastbuildstate 214B

CL.write.1.tlog 680B

link.command.1.tlog 1KB

vc120.idb 235KB

源.obj 146KB

ConsoleApplication1.vcxproj.filters 944B

ConsoleApplication1.vcxproj 4KB

源.cpp 1KB

ConsoleApplication1.sdf 6.88MB

ConsoleApplication1.sln 1003B

next数组详解.txt 2KB

例1： ? ? ? ? ? 序号 0 1 2 3 4 5 6 7 8 子串 a b c a a b c b a Next值 -1 0 0 0 1 1 2 3 0 1，第一个字符的next值令为-1。令第二个字符b的next值为0，初始k=0，j=1，比较S[k] 和S[j] 2，比较S[0] ！=S[1] ?所以 ?j++ k不变 next[j=2]=0 3，比较S[0] ！=S[2] ?所以 ?j++ k不变 next[3]=0 4，比较S[0] ?==S[3] ? 所以 ?j++，k++， next[4]=k=1 5，k=1了所以比较S[1] ！=S[4]，k返回到next[k]位置，即k=next[1]=0,然后比较S[k=0] == S[4] 所以 j++ ，k++ ，next[5]=k=1 6，比较S[1] ==S[5] ? 所以?j++ ，k++ ，next[6]=k=2 7，比较S[2] ==S[6] ? 所以?j++ ，k++ ，next[7]=k=3 8，比较S[3] ！=S[7] ? ? 所以k返回到next[k=3]位置，即k=next[3]=0,然后比较S[k=0] ！= S[7] 所以 j++ ，不变k=0不变，next[8]=k=0 完毕可以轻松的发现，S[j]的比较，决定了字符 S[j+1 ] 的next函数值例二：在例一中，每次不相等时返回的都是k=next[k]=0，都是返回到了开头，我们看一个不是返回到开头0的情况：序号 0 1 2 3 4 5 6 7 8 9 10 子串 a a b c a a a b a a c Next值 -1 0 1 0 0 1 2 2 3 1 2 从 j=5，k=1的时候开始 5，比较 S[1] == S[5] 所以 j++，k++，next[j+1=6]=k=2 6，比较S[2] != S[6] 所以?k返回到next[k=2]位置，即k=next[2]=1,然后比较S[k=1]==S[6] 所以j++，k=1+1=2，next[7]=k=2 ………… 因此，我们发现K的退回是退回到next[k]的位置即S[j]!=S[k]时，k=next[k] --------------------- 作者：zero9988 来源：CSDN 原文：https://blog.csdn.net/zero9988/article/details/60478388 版权声明：本文为博主原创文章，转载请附上博文链接！

评论收藏

内容反馈