(C/C++学习)33.编辑距离和正则表达式匹配分析

说明:本文主要分析关于力扣 10 题(正则表达式匹配) 和 力扣 72 题(编辑距离) 的状态方程问题(主要便于自己理解)

 

1.关于编辑距离的状态方程:

a. 首先 DP[i][j] 为字符串 1 的前 i 个字符和字符串 2 的前 j 个字符能匹配的最小步数;

b. 其次根据字符串编辑操作:增添、删除以及替换,列出以下状态方程:

1 DP[i][j] = DP[i-1][j-1]+1          //替换元素
2 DP[i][j] = DP[i][j-1]+1            //从索引为 i 的字符串插入一个元素或从索引为 j 的字符串2中删除一个元素
3 DP[i][j] = DP[i-1][j]+1            //从索引为 i 的字符串删除一个元素或从索引为 j 的字符串2中插入一个元素

注意:其实在编辑距离问题中, 为了达到匹配,一个字符串的元素插入可以用另一个字符串的元素删除来达到同样的目的。

如 ab -> abc, 可以前者插入 c,也可以后者删除 c,这就是为什么代码中2、3行可以有两层含义的原因。另外,理解状态方

程正向较难,可以逆向理解。

 

1.关于正则表达式匹配的状态方程:

a. 首先 DP[i][j] 为字符串 1 的前 i 个字符和字符串 2 的前 j 个字符是否能匹配(true 或 false);

b. 其次根据匹配规则,列出以下状态方程:

若:   s[i-1] = p[j-1] 或 p[j-1] = '.'   那么:DP[i][j] = DP[i-1][j-1]

否则:① 若 P[j-1] = '*'

                       若:    s[i-1] != p[j-2]  并且 p[j-2] != '.'     那么:DP[i][j] = DP[i][j-2]

                       否则:DP[i][j] = DP[i-1][j]              //字符串 2 复制多个元素来匹配   (继续下一次复制,不跳过 “*”)

                                  DP[i][j] = DP[i][j-1]              //字符串 2 复制1个元素来匹配   (跳过 “*”)

                                  DP[i][j] = DP[i][j-2]              //字符串 2 不需要复制来匹配(直接跳过 “.*” 或 “字符*”)   

           ② 空

注意:两个问题的初始化都应该特别小心

原文链接: https://www.cnblogs.com/tuihou/p/12828327.html

欢迎关注

微信关注下方公众号,第一时间获取干货硬货;公众号内回复【pdf】免费获取数百本计算机经典书籍;

也有高质量的技术群,里面有嵌入式、搜广推等BAT大佬

    (C/C++学习)33.编辑距离和正则表达式匹配分析

原创文章受到原创版权保护。转载请注明出处:https://www.ccppcoding.com/archives/346197

非原创文章文中已经注明原地址,如有侵权,联系删除

关注公众号【高性能架构探索】,第一时间获取最新文章

转载文章受原作者版权保护。转载请注明原作者出处!

(0)
上一篇 2023年3月2日 上午3:45
下一篇 2023年3月2日 上午3:46

相关推荐