Skip to content

Latest commit

 

History

History
100 lines (89 loc) · 4.3 KB

正则表达式匹配.md

File metadata and controls

100 lines (89 loc) · 4.3 KB

题目描述

请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"abaca"匹配,但是与"aa.a"和"ab*a"均不匹配。

测试用例

  • 功能测试(模式字符串里包含普通字符、‘.’、‘*’;模式字符串和输入字符串匹配/不匹配;“.*”这个组合真的是吃屎)
  • 特殊输入测试(输入字符串和模式字符是null、空字符串)

题目考点

  • 考察应聘者对字符串的编程能力
  • 考察应聘者对正则表达式的理解
  • 考察应聘者思维的全面性。在应聘者写完代码之后,面试官会要求他测试自己的代码,这个时候应聘者要充分考虑普通字符、‘.’、‘*’三者的排列组合,尽量完备地想出所有可能的测试用例。

解题思路

用递归的思想解决,对于一次判断有以下情况:

  • 当模式中的第二个字符不是“*”时:

    • 如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
    • 如果字符串第一个字符和模式中的第一个字符相不匹配,直接返回false。
  • 当模式中的第二个字符是“*”时:

    • 如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符,继续匹配。
    • 如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:
      • 模式后移2字符,相当于x*被忽略;
      • 字符串后移1字符,模式后移2字符;
      • 字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位;

自己解题

自己的测试通过率才3.33%,不拿出来了。

参考解题

/**
 * 正则表达式匹配
 *
 * @Author rex
 * 2018/7/23
 */
public class Solution {
    /**
     * 正则表达式匹配
     * (递归)
     *
     * @param str
     * @param pattern
     * @return
     */
    public boolean match(char[] str, char[] pattern) {
        if (str == null || pattern == null) {
            return false;
        }
        return matchCore(str, pattern, 0, 0);

    }

    /**
     * 正则表达式匹配分步
     *
     * @param str     字符串
     * @param pattern 模式
     * @param i       str的下标
     * @param j       patter的下标
     * @return
     */
    public boolean matchCore(char[] str, char[] pattern, int i, int j) {
        // 终止条件
        if (i == str.length && j == pattern.length) {
            return true;
        }
        // 当模式不足以配置字符串时
        if (i < str.length && j == pattern.length) {
            return false;
        }
        // 当模式中的第二个字符是“*”时:
        if (j + 1 < pattern.length && pattern[j + 1] == '*') {
            // 如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式
            if (i != str.length && pattern[j] == str[i] || (pattern[j] == '.' && i != str.length)) {
                return
                        // 字符串后移1字符,模式后移2字符
                        matchCore(str, pattern, i + 1, j + 2)
                                // 字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位
                                || matchCore(str, pattern, i + 1, j)
                                // 模式后移2字符,相当于x*被忽略
                                || matchCore(str, pattern, i, j + 2);
            } else {
                return matchCore(str, pattern, i, j + 2);
            }

        }
        // 如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的
        if ((i != str.length && str[i] == pattern[j]) || (pattern[j] == '.' && i != str.length)) {
            return matchCore(str, pattern, i + 1, j + 1);
        }
        // 如果字符串第一个字符和模式中的第一个字符相不匹配,直接返回false
        return false;
    }

}

补充

循环想不通,请用递归试试,在用递归的时候,关键是设计好一步的情况。