【剑指offer-52】正则表达式匹配
- 考点:字符串
- 时间限制:1秒
- 空间限制:32768K
- 请实现一个函数用来匹配包括’.‘和’*‘的正则表达式。模式中的字符’.‘表示任意一个字符,而’*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配
思路:
先看 * 再看 匹配
前提:当pattern遍历完,return取决于str是否遍历完,str恰好遍历完才返回true,再接下来讨论
1.若当前字符存在下一个字符,看下一个字符是否是 ‘*’,如果是,有2种情况
一:当前匹配
1.1match(str,i + 1,pattern,j)//跳过str
1.2match(str,i,pattern,j + 2)//跳过pattern
1.3match(str,i + 1,pattern,j + 2)//这一种可以省略,相当于 1.1 + 1.2
二:当前不匹配
match(str,i,pattern,j + 2)//跳过pattern
2.下一个不是 *
当前匹配 return match(str,i + 1,pattern,j + 1)
当模式中的第二个字符不是“*”时:
1、如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
2、如果 字符串第一个字符和模式中的第一个字符相不匹配,直接返回false。
而当模式中的第二个字符是“*”时:
如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符,继续匹配。如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:
1、模式后移2字符,相当于x*被忽略;
2、字符串后移1字符,模式后移2字符;
3、字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位;
这里需要注意的是:Java里,要时刻检验数组是否越界。
代码:
public class Solution {
public boolean match(char[] str, char[] pattern)
{
if (str == null || pattern == null) {
return false;
}
int strIndex = 0, patternIndex = 0;
return matchCore(str, strIndex, pattern, patternIndex);
}
public boolean matchCore(char[] str, int strIndex, char[] pattern, int patternIndex) {
// 有效性检验:检验同时到达了尾部
if (strIndex == str.length && patternIndex == pattern.length) {
return true;
}
// 如果模式走到尾了,匹配失败
if (patternIndex == pattern.length && strIndex != str.length) {
return false;
}
// 模式的第二个字符是*,并且字符串第一个和模式的第一个匹配。分为三种匹配模式。如果第一个字符和模式的字符不匹配,那么模式后移两位,相当模式这两个字符被胡烈
if (patternIndex + 1 < pattern.length && pattern[patternIndex + 1] == '*') {
// 和字符串的第一个匹配
if ((strIndex != str.length && pattern[patternIndex] == str[strIndex])
|| (strIndex != str.length && pattern[patternIndex] == '.')) {
return matchCore(str, strIndex, pattern, patternIndex + 2) // 模式后移两位,相当于x*被忽略
|| matchCore(str, strIndex + 1, pattern, patternIndex + 2) // 字符串后移一位,模式后移两位,匹配成功
|| matchCore(str, strIndex + 1, pattern, patternIndex); // 字符串后移一位,模式不变,*可以匹配更多的字符串
} else {
// 如果第一个字符和模式的字符不匹配,那么模式后移两位,相当x*被省略
return matchCore(str, strIndex, pattern, patternIndex + 2);
}
}
// 如果模式第二位不是*,且字符串第一位和模式第一位匹配,则同时后移一位,否则直接返回false。
if ((strIndex != str.length && str[strIndex] == pattern[patternIndex]) || (strIndex != str.length && pattern[patternIndex] == '.')) {
return matchCore(str, strIndex + 1, pattern, patternIndex + 1);
}
return false;
}
}
我的问题:
- index要同时走到尾部,才算匹配成功
- 如果模式匹配完了,字符串还没走到尾部,说明匹配失败。
- 这道题考虑的情况比较多,所以一定要细心。在这里在复习一遍。
- 第二位是*:
- 第一个字符没有匹配成功:
- 略过这个x*,也就是模式往后移2位。
- 第一个字符匹配成功了:
- 模式后移两位,x*被省略
- 字符串后移一位,模式后移两位,匹配成功,匹配后面的
- 字符串后移一位,模式不后移,匹配更多的*
- 第一个字符没有匹配成功:
- 第二位不是*
- 匹配成功,同时后移一位
- 匹配失败,返回false
- 第二位是*:
- 在进行匹配的时候,要时刻注意str.length==strIndex这个问题防止越界。为什么不检查patterIndex呢,因为开头检查过了,如果patterIndex走到尾部了的话,就返回false了。
- 匹配不仅仅是当前index下的相等,也有可能是strIndex没有越界的情况下,patterIndex下的字符为’.’。