BM65 最长公共子序列(二)

动态规划

BM65 最长公共子序列(二)

这道题是动态规划的典型例题。

思路

题目要求获取最长公共子序列,我们要先求最长公共子序列的长度,然后根据这个长度倒推从而获取这个子序列。注意:子序列不是子串,子串要求所有字符在原字符串中的位置必须连续,子序列不要求连续,只要求相对位置不变。这一点会影响dp数组的定义。
设存在字符串 s 1 和 s 2 ; 设存在字符串s1和s2; 设存在字符串s1s2

  1. 定义dp数组并初始化。
    d p [ i ] [ j ] 表示在截止到 s 1 [ i − 1 ] 和 s 2 [ j − 1 ] 的字符串中,最长公共子序列的 长度。注 : 在这个定义中 , 此时的最长公共子序列的末尾元素不一定 是 s 1 [ i − 1 ] 或 s 2 [ j − 1 ] dp[i][j]表示在截止到s1[i-1]和s2[j-1]的字符串中,最长公共子序列的\\长度。注:在这个定义中,此时的最长公共子序列的末尾元素不一定\\是s1[i-1]或s2[j-1] dp[i][j]表示在截止到s1[i1]s2[j1]的字符串中,最长公共子序列的长度。注:在这个定义中,此时的最长公共子序列的末尾元素不一定s1[i1]s2[j1]

这里为了省去初始化时的分类讨论,我们可以将dp数组初始化成一个 l e n g t h ( s 1 ) + 1 length(s1)+1 length(s1)+1 l e n g t h ( s 2 ) + 1 length(s2)+1 length(s2)+1列的全0数组。此时有 d p [ 0 ] [ j ] = d p [ i ] [ 0 ] = 0 dp[0][j]=dp[i][0]=0 dp[0][j]=dp[i][0]=0

  1. 从前到后遍历两个字符串,开始状态转移。状态转移方程如下:

{ d p [ i ] [ j ] = d p [ i − 1 ] [ j − 1 ] + 1 s 1 [ i − 1 ] = s 2 [ j − 1 ] d p [ i ] [ j ] = m a x ( d p [ i − 1 ] [ j ] , d p [ i ] [ j − 1 ] ) s 1 [ i − 1 ] ≠ s 2 [ j − 1 ] 1 ≤ i ≤ l e n g t h ( s 1 ) , 1 ≤ j ≤ l e n g t h ( s 2 ) \begin{align} \begin{cases} dp[i][j]=dp[i-1][j-1]+1 &s1[i-1]=s2[j-1]\\ \\ dp[i][j]=max(dp[i-1][j],dp[i][j-1]) &s1[i-1]\neq s2[j-1]\\ \\ 1\leq i\leq length(s1),1\leq j\leq length(s2) \end{cases} \end{align} dp[i][j]=dp[i1][j1]+1dp[i][j]=max(dp[i1][j],dp[i][j1])1ilength(s1),1jlength(s2)s1[i1]=s2[j1]s1[i1]=s2[j1]
解释一下这个状态转移方程。

  • s 1 [ i − 1 ] = s 2 [ j − 1 ] s1[i-1]=s2[j-1] s1[i1]=s2[j1],说明字符s1[i-1]和字符s2[j-1]相同,它们都属于最长公共子序列;在截止到s1[i-1]和s2[j-1]的字符串中最长公共子序列的长度 = 在截止到s1[i-2]和s2[j-2]的字符串中最长公共子序列的长度+1,即 d p [ i ] [ j ] = d p [ i − 1 ] [ j − 1 ] + 1 dp[i][j]=dp[i-1][j-1]+1 dp[i][j]=dp[i1][j1]+1
  • s 1 [ i − 1 ] ≠ s 2 [ j − 1 ] s1[i-1]\neq s2[j-1] s1[i1]=s2[j1],说明s1[i-1]和s2[j-1]不可能同时属于最长公共子序列,但有可能它俩其中之一属于最长公共子序列。因此 d p [ i ] [ j ] = m a x ( d p [ i − 1 ] [ j ] , d p [ i ] [ j − 1 ] ) dp[i][j]=max(dp[i-1][j],dp[i][j-1]) dp[i][j]=max(dp[i1][j],dp[i][j1])
  1. 状态转移完成后, d p [ l e n g t h ( s 1 ) ] [ l e n g t h ( s 2 ) ] dp[length(s1)][length(s2)] dp[length(s1)][length(s2)]一定是最长公共子序列的长度。

  2. d p [ l e n g t h ( s 1 ) ] [ l e n g t h ( s 2 ) ] dp[length(s1)][length(s2)] dp[length(s1)][length(s2)]开始倒推寻找最长公共子序列。根据dp数组转移的方向,不断往前组装字符。

    只有当 d p [ i ] [ j ] dp[i][j] dp[i][j]同时满足如下3个条件,才能说明字符s1[i-1]和s2[j-1]都属于最长公共子序列,将s1[i-1]或s2[j-1]添加进序列。
    { d p [ i ] [ j ] ≠ d p [ i − 1 ] [ j ] d p [ i ] [ j ] ≠ d p [ i ] [ j − 1 ] d p [ i ] [ j ] = d p [ i − 1 ] [ j − 1 ] \begin{align} \begin{cases} dp[i][j]\neq dp[i-1][j]\\ \\ dp[i][j]\neq dp[i][j-1]\\ \\ dp[i][j]=dp[i-1][j-1] \end{cases} \end{align} dp[i][j]=dp[i1][j]dp[i][j]=dp[i][j1]dp[i][j]=dp[i1][j1]

  3. 第4步得到的序列其实是最长公共子序列的逆序,将其逆转就得到了题目所求的最长公共子序列。

在这里插入图片描述

代码
import numpy as np
import  pandas as pd

#
# 代码中的类名、方法名、参数名已经指定,请勿修改,直接返回方法规定的值即可
#
# longest common subsequence
# @param s1 string字符串 the string
# @param s2 string字符串 the string
# @return string字符串
#
class Solution:
    def LCS(self, s1: str, s2: str) -> str:
        """dp[i][j]:截至到s1[i-1]和s2[j-1],搜索到的最长公共子序列长度"""
        if s1 is None or s2 is None:
            return "-1"
        dp = [[0] * (len(s2) + 1) for i in range(len(s1) + 1)]
        for i in range(1, len(s1)+1):
            for j in range(1, len(s2)+1):
                if s1[i-1] == s2[j-1]:
                    dp[i][j] = dp[i-1][j-1] + 1
                else:
                    dp[i][j] = max(dp[i-1][j], dp[i][j-1])
        # print(dp)
        #寻找最长公共子序列
        i = len(s1)
        j = len(s2)
        lcs = []
        while dp[i][j] != 0:
            if dp[i][j] == dp[i-1][j]:#如果从左方向来
                i = i-1
            elif dp[i][j] == dp[i][j-1]:#如果从上方向来
                j = j-1
            elif dp[i][j] > dp[i-1][j-1]:#只有从左上方向来才是字符相等
                i = i-1
                j = j-1
                lcs.append(s1[i])#这样得到的最长公共子序列是逆序的
        res = ''
        while len(lcs) != 0:
            res += lcs[-1] #依次将lcs中末尾元素插入
            lcs.pop() #弹出末尾元素

        #如果两个序列完全不同
        if res == '':
            return "-1"
        else:
            return res

if __name__ == '__main__':
    s1 = input()
    s2 = input()
    a = Solution()
    print(a.LCS(s1,s2))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/136441.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言进阶

数组 在基础篇说过,数组实际上是构造类型之一,是连续存放的。 一维数组 定义 定义格式:[存储类型] 数据类型 数组名标识符[下标]; 下面分模块来介绍一下数组的定义部分的内容。 1、初始化和元素引用: 可以看到数组是连续存储…

第六章 DNS域名解析服务器

1、DNS简介 DNS(Domain Name System)是互联网上的一项服务,它作为将域名和IP地址相互映射的一个分布式数据库,能够使人更方便的访问互联网。 DNS系统使用的是网络的查询,那么自然需要有监听的port。DNS使用的是53端口…

【Python】python读取,显示,保存图像的几种方法

一、PIL:Python Imaging Library(pillow) PIL读取图片不直接返回numpy对象,可以用numpy提供的函数np.array()进行转换,亦可用Image.fromarray()再从numpy对象转换为原来的Image对象,读取,显示&…

【OpenCV实现图像:用OpenCV图像处理技巧之白平衡算法2】

文章目录 概要Gray-world AlgotithmGround Truth Algorithm结论: 概要 随着数字图像处理技术的不断发展,白平衡算法成为了图像处理中一个关键的环节。白平衡的目标是校正图像中的颜色偏差,使得白色在图像中呈现真实的白色,从而提…

transfomer模型——简介,代码实现,重要模块解读,源码,官方

一、什么是transfomer Transformer是一种基于注意力机制(attention mechanism)的神经网络架构,最初由Vaswani等人在论文《Attention Is All You Need》中提出。它在自然语言处理(NLP)领域取得了巨大成功,特…

虚拟机CentOS 8 重启后不能上网

情况说明:原本虚拟机是可以上网的,然后嘚一下,重启后,连接不上网络,完了,上网查找一堆质料,我的连接方式是桥接模式(复制物理网络连接状态)。 好,有人说是vmn…

Git基本概念和使用方式

Git 是一种版本控制系统,用于管理文件版本的变化。以下是其基本概念和使用方式: 仓库(repository):Git 存储代码的地方,可以理解为一个项目的文件夹。提交(commit):Git …

【Go入门】struct类型

【Go入门】struct类型 struct Go语言中,也和C或者其他语言一样,我们可以声明新的类型,作为其它类型的属性或字段的容器。例如,我们可以创建一个自定义类型person代表一个人的实体。这个实体拥有属性:姓名和年龄。这样…

前端开发引入element plus与windi css

背景 前端开发有很多流行框架,像React 、angular、vue等等,本文主要讲vue 给新手用的教程,其实官网已经写的很清楚,这里再啰嗦只是为了给新手提供一个更加简单明了的参考手册。 一、打开element plus官网选则如图所示模块安装命令…

c语言练习第11周(1~5)

数列 1 1 2 3 5 8 13 21 ... 被称为斐波纳数列。 输入若干个正整数N,输出这个序列的前 N 项的和。 题干数列 1 1 2 3 5 8 13 21 ... 被称为斐波纳数列。 输入若干个正整数N,输出这个序列的前 N 项的和。输入样例3 5 4 1输出样例…

【第七章】软件设计师 之 程序设计语言与语言程序处理程序基础

文章底部有个人公众号:热爱技术的小郑。主要分享开发知识、学习资料、毕业设计指导等。有兴趣的可以关注一下。为何分享? 踩过的坑没必要让别人在再踩,自己复盘也能加深记忆。利己利人、所谓双赢。 1、前言 正规式 2、编译过程 编译型&…

【操作系统】4.2 文件系统

📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨ 📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸对你有帮助,可点赞 👍…

如何有效的保护Windows登录 安当加密

为了有效保护Windows安全登录,以下是一些建议: 使用强密码:强密码是保护Windows登录安全的重要措施之一。确保密码包含大写字母、小写字母、数字和特殊字符,长度至少为8位,并且不要使用容易猜到的单词或短语。启用多因…

pointnetgpd复现

参考: Installation Instructions — Dex-Net 0.2.0 documentation Install git clone https://github.com/lianghongzhuo/PointNetGPD.git 添加环境变量 gedit ~/.bashrc #添加下面这一行 export PointNetGPD_FOLDER$HOME/code/PointNetGPD #然后source source…

SLAM从入门到精通(SLAM落地的难点)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 在所有的slam算法中,基于反光柱的激光slam和基于二维码的视觉slam是落地最彻底的两种slam方法。和磁条、色带等传统导航方式相比较&…

U-Mail邮件系统三大安全措施,防止信息泄露!

在当信息化高速发展的今天,国内很多企业业务流程对OA系统、CRM系统、ERP系统、邮件系统等办公应用依赖度越来越高。这些办公应用给企业带来便利的同时也伴随着越来越多的信息安全问题,而在日常的办公场景中,由于内部员工非法泄漏或黑客入侵导…

Flowable 外部表单

内置表单需要在每个节点中去配置,当如果多个节点使用同一套表单属性就要配置多次比较麻烦,修改的时候也要修改多次,外部表单可以定义一次,然后其它节点都去引用同一个表单属性。 外部表单需要定义一个.form后缀的文件。 外部表单…

运行pytest时,给出警告 PytestConfigWarning: Unknown config option: result_log

问题:在ini中配置了一些选项后运行pytest,会出现下面的警告信息 解决:在ini中增加配置:addopts -p no:warnings

【Git】的分支与版本

前言 Git 的分支是指将代码库从某一个特定的提交记录开始的一个独立的开发线,也可以理解为是一种代码开发的并行方式。分支在 Git 中的使用非常广泛,它可以让多人在同一个代码库中并行开发,同时也能够很方便地进行代码版本控制和管理。 Git …

Python 多进程多线程

多任务 并发:在一段时间内交替执行多个任务 并行:在一段时间内同事一起执行多个任务 进程 Process 进程:一个程序运行在系统之上, 便称这个程序喂一个运行进程,并分配进程ID方便系统管理。操作系统进行资源分配和调…