龙空技术网

算法-- KMP

sattention 580

前言:

眼前你们对“串的kmp算法”大概比较看重,各位老铁们都需要学习一些“串的kmp算法”的相关文章。那么小编同时在网上收集了一些对于“串的kmp算法””的相关文章,希望看官们能喜欢,你们一起来了解一下吧!

百度百科定义:KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)。

问题定义

先说说要解决什么问题,就是在一个字符串中查找是否包含另一个字符串,如果包含就返回子字符串开始位置的小标,如果不包含就返回-1

分析问题

假设长的字符串为str1,长度为N,需要在str1里寻找str2是否存在,str2长度为M。

首先想到的最简单的办法,就是从字符串中的0位置开始遍历,是否和字符串中的字符相等,如果不相等,就从下一个字符开始比较,时间复杂度是O(N*M)。

那是否有O(N)的解法了,那就是KMP算法了。

解决问题

KMP的核心是先知道最长前缀和最长后缀的概念了。

最长前缀和最长后缀

先介绍下最长前缀和最长后缀是什么意思,先举例:

字符串"abaabc"中字符c的最长前缀和最长后缀的长度为2, 值为ab,前缀就是从头开始算,后缀是c的前几个字符,前缀和后缀是相等的。

所以说"abaabc"的最长前缀和最长后缀数组为[-1, 0, 0 , 1, 1, 2](第0个位置和第1个位置比较特殊,定为-1和0), 就就是KMP中的next数组,这里我们先把KMP的流程讲明白,再来说这个next数组怎么求解。

KMP流程

这里先要求解出str2的next数组。

第一步,还是要遍历字符串进行对比

第二步,如果有一个字符不相等,按照原始方法是把i1变成1的位置,i2从0位置开始遍历。正是因为我们有next数组,我们可以i1不动,i2移动到该字符的最大前缀处和i1位置进行比较,直到有一个字符串遍历完成。

看下代码

public int indexOf(String str1, String str2) {		char[] str1Char = str1.toCharArray();		char[] str2Char = str2.toCharArray();		int i1 = 0;		int i2 = 0;		int[] next = getNext(str2Char);		while (i1 <= str1Char.length - 1 && i2 <= str2Char.length - 1) {			//如果相等,就比较下一个位置			if (str1Char[i1] == str2Char[i2]) {				++i1;				++i2;			} else if (next[i2] == -1) {				//如果是-1,说明是第0个位置,那么直接从i1的第一个位置开始				++i1;			} else {				//如果不相等又不是第0个位置,则从最长前缀的位置开始				i2 = next[i2];			}		}		 		return i2 == str2Char.length ? i1 - i2 : -1;	}

next数组

next数组第0个位置和第1个位置比较特殊,定为-1和0,从第2个开始算起。假如现在的位置在i,i位置的最大前缀是可以通过i-1算的,这里分两种情况。

第一种情况,第i-1个位置如果等于第i-1个位置的最大前缀的位置,那么第i位置的前缀长度就是第i-1个位置的最大前缀+1

第二种情况,如果不相等,位置就跳到前缀的前缀去比较,直到0

代码

public int[] getNext(char[] str) {		if (str.length == 1) {			return new int[] {-1};		}		int[] next = new int[str.length];		next[0] = -1;		next[1] = 0;		int i = 2;		int pre = 0;		while (i < next.length) {			if (str[i - 1] == str[pre]) {				next[i++] = ++pre;			} else if (pre > 0) {				pre = next[pre];			} else {				next[i++] = 0;			}		}		return next;	}

这些就是KMP算法的全部内容了,就是通过next数组来减少比较的次数。

希望对大家有所帮助,有帮助记得点赞哦!可以关注下,后面持续分享编程类的文章,谢谢!

标签: #串的kmp算法