【剑指offer-52】20190907/01 正则表达式匹配

【剑指offer-52】正则表达式匹配

  • 考点:字符串
  • 时间限制:1秒
  • 空间限制:32768K
  • 请实现一个函数用来匹配包括’.‘和’*‘的正则表达式。模式中的字符’.‘表示任意一个字符,而’*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配

思路:

先看 * 再看 匹配
前提:当pattern遍历完,return取决于str是否遍历完,str恰好遍历完才返回true,再接下来讨论
1.若当前字符存在下一个字符,看下一个字符是否是 ‘*’,如果是,有2种情况
一:当前匹配
1.1match(str,i + 1,pattern,j)//跳过str
1.2match(str,i,pattern,j + 2)//跳过pattern
1.3match(str,i + 1,pattern,j + 2)//这一种可以省略,相当于 1.1 + 1.2
二:当前不匹配
match(str,i,pattern,j + 2)//跳过pattern
2.下一个不是 *
当前匹配 return match(str,i + 1,pattern,j + 1)

当模式中的第二个字符不是“*”时:
1、如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
2、如果 字符串第一个字符和模式中的第一个字符相不匹配,直接返回false。

而当模式中的第二个字符是“*”时:
如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符,继续匹配。如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:
1、模式后移2字符,相当于x*被忽略;
2、字符串后移1字符,模式后移2字符;
3、字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位;

这里需要注意的是:Java里,要时刻检验数组是否越界。

代码:
public class Solution {
    public boolean match(char[] str, char[] pattern)
    {
        if (str == null || pattern == null) {
            return false;
        }
        int strIndex = 0, patternIndex = 0;
        return matchCore(str, strIndex, pattern, patternIndex);
    }
    
    public boolean matchCore(char[] str, int strIndex, char[] pattern, int patternIndex) {
        // 有效性检验:检验同时到达了尾部
        if (strIndex == str.length && patternIndex == pattern.length) {
            return true;
        }
        // 如果模式走到尾了,匹配失败
        if (patternIndex == pattern.length && strIndex != str.length) {
            return false;
        }
        // 模式的第二个字符是*,并且字符串第一个和模式的第一个匹配。分为三种匹配模式。如果第一个字符和模式的字符不匹配,那么模式后移两位,相当模式这两个字符被胡烈
        if (patternIndex + 1 < pattern.length && pattern[patternIndex + 1] == '*') {
            // 和字符串的第一个匹配
            if ((strIndex != str.length && pattern[patternIndex] == str[strIndex]) 
                || (strIndex != str.length && pattern[patternIndex] == '.')) {
                return matchCore(str, strIndex, pattern, patternIndex + 2) // 模式后移两位,相当于x*被忽略
                    || matchCore(str, strIndex + 1, pattern, patternIndex + 2) // 字符串后移一位,模式后移两位,匹配成功
                    || matchCore(str, strIndex + 1, pattern, patternIndex); // 字符串后移一位,模式不变,*可以匹配更多的字符串
            } else {
                // 如果第一个字符和模式的字符不匹配,那么模式后移两位,相当x*被省略
                return matchCore(str, strIndex, pattern, patternIndex + 2);
            }
        }
        
        // 如果模式第二位不是*,且字符串第一位和模式第一位匹配,则同时后移一位,否则直接返回false。
        if ((strIndex != str.length && str[strIndex] == pattern[patternIndex]) || (strIndex != str.length && pattern[patternIndex] == '.')) {
            return matchCore(str, strIndex + 1, pattern, patternIndex + 1);
        } 
        return false;
        
    }
}
我的问题:
  1. index要同时走到尾部,才算匹配成功
  2. 如果模式匹配完了,字符串还没走到尾部,说明匹配失败。
  3. 这道题考虑的情况比较多,所以一定要细心。在这里在复习一遍。
    1. 第二位是*:
      1. 第一个字符没有匹配成功:
        • 略过这个x*,也就是模式往后移2位。
      2. 第一个字符匹配成功了:
        • 模式后移两位,x*被省略
        • 字符串后移一位,模式后移两位,匹配成功,匹配后面的
        • 字符串后移一位,模式不后移,匹配更多的*
    2. 第二位不是*
      1. 匹配成功,同时后移一位
      2. 匹配失败,返回false
  4. 在进行匹配的时候,要时刻注意str.length==strIndex这个问题防止越界。为什么不检查patterIndex呢,因为开头检查过了,如果patterIndex走到尾部了的话,就返回false了。
  5. 匹配不仅仅是当前index下的相等,也有可能是strIndex没有越界的情况下,patterIndex下的字符为’.’。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值