重复叠加字符串匹配
- 686. 重复叠加字符串匹配
 
686. 重复叠加字符串匹配
题目链接:686. 重复叠加字符串匹配
 题目内容:
 
 理解题意,可以发现题目还是要求我们做字符串匹配。只是查询串不是简单的a,而是a的叠加,并且这个叠加次数是不确定的。
 首先我们要明确方法,字符串匹配,首选KMP算法。a的叠加在匹配中可以用a[i % a.size()]来解决。 如果a的m次叠加后,能够查询到b,之后的m+1,m+2次叠加b也是其子串, 因此m就是最小的叠加次数。并且如果能够找到这样的m使得b成为a的m次叠加后的子串的话,kmp查询就能成功,b会被遍历完。但是如果不能的话,由于a的叠加用a[i % a.size()],a的下标永远不会越界,b也一直不会遍历结束,那么kmp中的循环该如何结束?
 因为查询串s是a重复循环叠加的,假设当前s和b开始匹配的位置是在第一个a之后,说明第一个a是没用的,不管前面的匹配中,第一个a中的字符是否和b匹配,之后都会出现不匹配的使得b下标回退,最终从第一个a之后开始匹配;那么又侧面说明,之后也会出现这样的情况,当前匹配的这个a也会被舍弃,也就是说,s和b开始匹配的地方不是在第一个a中话,可以肯定b不是s的子串,只有b从第一个a中的字符开始匹配才有可能匹配成功。即a中下标i,b中下标 j,如果 **i - j >= a.size()**就说明匹配不上。
 代码如下(C++):
class Solution {
public:
	//KMP算法
    int strStr(string haystack, string needle) {
        int len_h = haystack.size();
        int len_n = needle.size();
		//求模式串的vector数组
        vector<int>  next(len_n, 0);
        //next数组中存的是对应下标处子串【包括下标位置】的最长前后缀的长度
        for(int i = 1; i < len_n; i++){
            int j = next[i-1];
            while(j>0 && needle[j] != needle[i])
                j = next[j-1];
            if(needle[i] == needle[j])
                j++;
            next[i] = j;
        }
		//开始匹配
        int pos = 0, j = 0;
        //结束条件
        while(pos - j < len_h){
            while(j>0 && haystack[pos % len_h] != needle[j])
                j = next[j-1];
            if(haystack[pos % len_h] == needle[j]){
                pos++;
                j++;
            } 
            else
                pos++;
            //因为pos可以无限增加,当遍历完b的时候说明已经找到了    
            if(j == len_n)
                return pos;              
        }
        return -1;
    }
    int repeatedStringMatch(string a, string b) {
        int idx = strStr(a, b);
        if(idx == -1)
            return -1;
        //求m
        return  (idx-1) / a.size() + 1;
    }
};
                

















