数据结构-算法和算法分析

目录

  • 前言
  • 一、算法
    • 1.1 算法与程序
    • 1.2 算法描述方法
    • 1.3 算法特性
    • 1.4 算法设计的要求
  • 二、算法分析
    • 2.1 算法时间效率的度量
      • 2.1.1 事前分析方法
        • 算法的渐进时间复杂度
        • 算法时间复杂度分析例子
        • 算法最坏时间复杂度
        • 时间复杂度的计算规则
    • 2.2 算法空间效率的度量
  • 总结

前言

程序 = 数据结构+算法
数据结构通过算法实现操作
算法根据数据结构设计程序

一、算法

定义:对特定问题求解方法和步骤的一种描述,它是指令的有限序列。其中,每个指令表示一个或多个操作。
简而言之,算法就是解决问题的方法和步骤

1.1 算法与程序

  • 算法
    算法是解决问题的一种方法或过程,考虑如何将输入转换成输出,一个问题可以有多种算法
  • 程序
    程序是用某种程序设计语言对算法的具体实现

1.2 算法描述方法

  • 自然语言:中文、英语等
  • 流程图:传统流程图、NS流程图(盒图)等
  • 伪代码:类C语言(类语言)等
  • 程序代码:C语言程序、JAVA语言程序等

1.3 算法特性

  • 有穷性
    一个算法必须总是在执行有穷步之后结束,且每一步都在有穷时间内完成
  • 确定性
    在任何条件下,只有唯一的一条执行路径,即对于相同的输入只能得到相同的输出
  • 可行性
    算法是可执行的,算法描述的操作可以通过已经实现的基本操作执行有限次来实现
  • 输入
    一个算法有零个或多个输入
  • 输出
    一个算法有一个或多个输出

1.4 算法设计的要求

  • 正确性(Correctness)
    如果一个算法以一组满足初始条件的输入开始,那么该算法的执行一定会终止,并且在终止时得到满足要求的输出
  • 可读性(Readability)
    一个算法的描述应该是便于人的阅读,以便于人对算法的理解
  • 健壮性(Robustness)
    算法的健壮性也叫鲁棒性,指当输入不合法的数据时,算法恰当地作出反应。
    处理出错的方法,不应是中断程序的执行,而是应该返回一个表示错误或错误性质的值,以便在更高的抽象层次上进行处理。
  • 高效性(Efficiency)
    要求花费尽量少的运行时间和存储空间

二、算法分析

一个好的算法首先要具备正确性,然后是健壮性,可读性,在几个方面都满足的情况下,主要考虑算法的效率,通过算法的效率高低来评判对同一个问题的不同算法的优劣程度
算法效率包含时间效率空间效率
时间效率:指的是算法执行完成后所耗费的时间
空间效率:指的是算法执行过程中所耗费的存储空间

有时候,算法的时间效率和空间效率两者之间会出现矛盾,不能既要时间效率,又要空间效率。所以,有些情况需要用时间效率换空间效率,还有些情况需要用空间效率换时间效率。
下面,分别介绍如何分析一个算法的时间效率和空间效率

2.1 算法时间效率的度量

度量算法的时间效率的方法包含以下两种:

  • 事后统计
    事后统计是指将算法使用程序设计语言实现后运行,统计其时间和空间的开销
  • 事前分析
    事前分析是指对算法所消耗的资源按照某种方法进行估算

由于事后统计这个度量方法需要编写程序实现算法,所得统计结果依赖于计算机的软硬件等环境因素,掩盖算法本身的优劣。所以,采用事前分析这个度量方法进行算法时间效率的分析。

2.1.1 事前分析方法

一个算法的运行时间是指一个算法在计算机上运行所耗费的时间大致可以等于计算机执行一种简单操作所需的时间与算法中进行简单操作次数的乘积
算法运行时间 = ∑每条语句的执行次数×该语句执行一次所需的时间
语句的执行次数又称为语句频度
每条语句执行一次所需时间,一般随机器而异。取决于机器的指令性能、速度以及编译的代码质量。是由机器本身软硬件环境决定的,与算法无关。
所以,假设执行每条语句所需的时间均为单位时间。那么对算法的运行时间的讨论就可以转化为讨论该算法中所有语句的执行次数,即频度之和。通过这样,就可忽略机器的软硬件环境。

根据以上,可得出算法运行时间 = ∑每条语句的频度

例子,两个n×n矩阵相乘的算法可描述为(类C语言描述):

for(i = 1; i <= n; i++)  								//n+1次
	for(j = 1; j <= n; j++){							//n*(n+1)次
		c[i][j] = 0;									//n*n次
		for(k = 0; k < n; k++)							//n*n*(n+1)次
			c[i][j] = c[i][j] + a[i][k] * b[k][i];		//n*n*n次
	}		

算法所耗费的时间定义为该算法每条语句频度之和,则上述算法的时间消耗为:
T ( n ) = n + 1 + n ∗ ( n + 1 ) + n ∗ n + n ∗ n ∗ ( n + 1 ) + n ∗ n ∗ n T(n) = n+1+n * (n+1)+n * n+n * n * (n+1)+n * n * n T(n)=n+1+n(n+1)+nn+nn(n+1)+nnn
整理得 T ( n ) = 2 n 3 + 3 n 2 + 2 n + 1 T(n) = 2n^3 +3n^2+2n+1 T(n)=2n3+3n2+2n+1
为了便于比较不同算法的时间效率,这里仅仅比较不同算法的数量级,即算法的渐进时间复杂度

算法的渐进时间复杂度

若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n)/f(n)的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数,即
T ( n ) = O ( f ( n ) ) T(n)=O(f(n)) T(n)=O(f(n))
O ( f ( n ) ) O(f(n)) O(f(n))为算法的渐进时间复杂度( O O O是数量级的符号),简称时间复杂度

那么,根据算法的渐进时间复杂度的定义,对于求解矩阵相乘问题,算法耗费时间:
T ( n ) = 2 n 3 + 3 n 2 + 2 n + 1 T(n)=2n^3+3n^2+2n+1 T(n)=2n3+3n2+2n+1
n → ∞ {n \to \infty} n时, T ( n ) / n 3 → 2 {T(n)/n^3 \to 2} T(n)/n32,那么, T ( n ) 和 n 3 T(n)和n^3 T(n)n3是同阶或同数量级,引入大 O O O记号,则 T ( n ) T(n) T(n)可记作:
T ( n ) = O ( n 3 ) T(n)=O(n^3) T(n)=O(n3)
O ( n 3 ) O(n^3) O(n3)就是求解矩阵相乘问题的算法的渐进时间复杂度。
一般情况下,不必计算所有操作的执行次数,而只考虑算法中基本操作执行的次数,它是问题规模n的某个函数,用f(n)表示
算法中基本语句重复执行的次数问题规模n的某个函数f(n),算法的时间度量记作: T ( n ) = O ( f ( n ) ) T(n)=O(f(n)) T(n)=O(f(n))
基本语句:执行次数最多
问题规模n在不同的问题中,表示的意义不同
排序问题:问题规模n表示记录数
矩阵问题:问题规模n表示矩阵的阶数
多项式问题:问题规模n表示多项式的项数
集合问题:问题规模n表示元素的个数
树问题:问题规模n表示树的结点个数
图问题:问题规模n表示图的顶点数或边数

算法时间复杂度分析例子

定理1.1
f ( n ) = a m n m + a m − 1 n m − 1 + . . . + a 1 n + a 0 f(n)={a_m}{n^m}+a_{m-1}{n^{m-1}}+...+{a_1}{n}+{a_0} f(n)=amnm+am1nm1+...+a1n+a0是m次多项式, T ( n ) = O ( n m ) T(n)=O(n^m) T(n)=O(nm)
忽略所有低次幂项和最高次幂系数

分析算法时间复杂度的基本步骤
step1:找出语句频度最大的那条语句作为基本语句
step2:计算基本语句的频度得到问题规模n的某个函数 f ( n ) f(n) f(n)
step3:取 f ( n ) f(n) f(n)数量级用符号 O O O表示

例子1

for(i = 1; i <= n; i++)
	for(j = 1; j <= i; j++)
		for(k = 1; k <= j; k++)
			x = x + 1;

x = x + 1 x=x+1 x=x+1作为基本语句,则其 f ( n ) f(n) f(n)
f ( n ) = ∑ i = 1 n ∑ j = 1 i ∑ k = 1 j 1 = ∑ i = 1 n ∑ j = 1 i j = ∑ i = 1 n i ( i + 1 ) 2 = 1 2 ( ∑ i = 1 n i 2 + ∑ i = 1 n i ) = 1 2 ( n ( n + 1 ) ( 2 n + 1 ) 6 + n ( n + 1 ) 2 ) = n ( n + 1 ) ( n + 2 ) 6 \begin{aligned} f(n) ={\overset{n}{\underset{i=1}{\sum}}}{\overset{i}{\underset{j=1}{\sum}}}{\overset{j}{\underset{k=1}{\sum}}}1 ={\overset{n}{\underset{i=1}{\sum}}}{\overset{i}{\underset{j=1}{\sum}}}j &={\overset{n}{\underset{i=1}{\sum}}} \frac{i(i+1)}{2}\\ &=\frac{1}{2} ({\overset{n}{\underset{i=1}{\sum}}}i^2+{\overset{n}{\underset{i=1}{\sum}}}i)\\ &=\frac{1}{2}(\frac{n(n+1)(2n+1)}{6}+\frac{n(n+1)}{2})\\ &=\frac{n(n+1)(n+2)}{6} \end{aligned} f(n)=i=1nj=1ik=1j1=i=1nj=1ij=i=1n2i(i+1)=21(i=1ni2+i=1ni)=21(6n(n+1)(2n+1)+2n(n+1))=6n(n+1)(n+2)
综上, T ( n ) = O ( n 3 ) T(n)=O(n^3) T(n)=O(n3)

例子2

i = 1;
while(i <= n)
	i = i*2;

i = i ∗ 2 i=i*2 i=i2作为基本语句,则 f ( n ) f(n) f(n)
若循环执行1次: i = 1 ∗ 2 = 2 i=1*2=2 i=12=2
若循环执行2次: i = 2 ∗ 2 = 2 2 i=2*2=2^2 i=22=22
若循环执行3次: i = 3 ∗ 2 = 2 3 i=3*2=2^3 i=32=23,…,
若循环执行x次: i = 2 x i=2^x i=2x
设基本语句执行x次,由循环条件 i < = n i<=n i<=n ∴ 2 x < = n ∴ x < = log ⁡ 2 n \therefore2^x<=n \therefore x<=\log_2n 2x<=nx<=log2n
2 f ( n ) < = n , 即 f ( n ) < = log ⁡ 2 n ,取最大值 f ( n ) = log ⁡ 2 n 2^{f(n)}<=n,即f(n)<=\log_2n,取最大值f(n)=\log_2n 2f(n)<=n,f(n)<=log2n,取最大值f(n)=log2n
综上, T ( n ) = O ( log ⁡ 2 n ) T(n)=O(\log_2n) T(n)=O(log2n)

算法最坏时间复杂度

有的情况下,算法中基本操作重复执行的次数还随着输入数据集不同而不同。
例如,在一个数组中顺序查找一个数e,返回其位置

for(i = 0; i < n; i++)
	if(e == a[i])
		return i;
 return -1;		

最好情况:循环遍历1次
最坏情况:循环遍历n次
平均时间复杂度: O ( n ) O(n) O(n)

最好时间复杂度:指在最好情况下,算法的时间复杂度
最坏时间复杂度:指在最坏情况下,算法的时间复杂度
平均时间复杂度:指在所有可能输入实例在等概率出现的情况下,算法的期望运行时间

一般情况下,总是考虑最坏情况下的时间复杂度,以保证算法的运行时间不会比它更长。

时间复杂度的计算规则

对于复杂的算法,可以将它分成几个容易估算的部分,然后利用大 O O O加法规则和乘法规则,计算算法的时间复杂度

  • 加法规则
    T ( n ) = T 1 ( n ) + T 2 ( n ) = O ( f 1 ( n ) ) + O ( f 2 ( n ) ) = O ( m a x ( f 1 ( n ) , f 2 ( n ) ) ) T(n)=T_1(n)+T_2(n)=O(f_1(n))+O(f_2(n))=O(max(f_1(n),f_2(n))) T(n)=T1(n)+T2(n)=O(f1(n))+O(f2(n))=O(max(f1(n),f2(n)))
    这里的 m a x ( f 1 ( n ) , f 2 ( n ) ) 表示当 n → ∞ 时,取函数值较大的那个函数 max(f_1(n),f_2(n))表示当n \to \infty时,取函数值较大的那个函数 max(f1(n),f2(n))表示当n时,取函数值较大的那个函数
    常见的函数大小关系如下:
    O ( 1 ) < O ( l o g 2 n ) < O ( n ) < O ( n l o g 2 n ) < O ( n 2 ) < O ( n 3 ) < O ( 2 n ) O(1)<O(log_2n)<O(n)<O(nlog_2n)<O(n^2)<O(n^3)<O(2^n) O(1)<O(log2n)<O(n)<O(nlog2n)<O(n2)<O(n3)<O(2n)
  • 乘法规则
    T ( n ) = T 1 ( n ) × T 2 ( n ) = O ( f 1 ( n ) ) × O ( f 2 ( n ) ) = O ( f 1 ( n ) × f 2 ( n ) ) T(n)=T_1(n)\times T_2(n)=O(f_1(n))\times O(f_2(n))=O(f_1(n)\times f_2(n)) T(n)=T1(n)×T2(n)=O(f1(n))×O(f2(n))=O(f1(n)×f2(n))

2.2 算法空间效率的度量

算法空间效率的度量使用渐进空间复杂度进行分析
空间复杂度:算法所需存储空间的度量,记作 S ( n ) = O ( f ( n ) ) S(n)=O(f(n)) S(n)=O(f(n))
其中,n为问题规模
算法要占据的空间:

  1. 算法本身要占据的空间,输入/输出,指令,常数,变量等
  2. 算法要使用的辅助空间

例子
将一个一维数组a中的n个数逆序存放到原数组中
算法1

//利用辅助空间变量t
for(i = 0; i < n/2; i++)
{
	t = a[i];
	a[i] = a[n-i-1];
	a[n-i-1] = t
}

空间复杂度 S ( n ) = O ( 1 ) S(n)=O(1) S(n)=O(1)
算法2

//利用辅助空间数组b[]
for(i = 0; i < n; i++)
	b[i] = a[n-i-1];
for(i = 0; i < n; i++)
	a[i] = b[i]	

空间复杂度 S ( n ) = O ( n ) S(n)=O(n) S(n)=O(n)

总结

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/725003.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深度优先遍历解决迷宫问题(顺序栈的应用)

学习贺利坚老师课程 数据结构例程——迷宫问题&#xff08;用栈结构&#xff09;_数据结构迷宫问题-CSDN博客文章浏览阅读3.1w次&#xff0c;点赞25次&#xff0c;收藏118次。本文针对数据结构基础系列网络课程(3)&#xff1a;栈和队列中第6课时栈的应用2-迷宫问题。例&#x…

品牌为什么要做电商控价

消费者购买产品的途径愈发多样&#xff0c;抖音、快手等直播电商的兴起进一步拓宽了品牌的销售渠道。市场形态越是丰富&#xff0c;品牌所要应对的问题自然也就越多。主流电商平台如淘宝、拼多多&#xff0c;依然是消费者主要的选购之处&#xff0c;即便不购物&#xff0c;电商…

使用nvm管理nodejs版本,设置淘宝NPM镜像源

nvm-windows https://github.com/coreybutler/nvm-windows nvm配置文件的路径 C:\Users\用户名\AppData\Roaming\nvm 修改 settings.txt 文件&#xff0c;添加淘宝镜像源地址 node_mirror: https://npmmirror.com/mirrors/node/ npm_mirror: https://npmmirror.com/mirrors…

tauri嵌入外部二进制文件,以及sidecar是什么意思?

sidecar是什么意思 有时&#xff0c;为了使应用程序正常运行或防止用户安装额外的依赖项&#xff08;例如Node.js或Python或者ffmpeg等&#xff09;&#xff0c;你可能需要嵌入依赖的二进制文件&#xff0c;我们将这种二进制文件称为"sidecar"&#xff0c;中文意思就…

Navicat 重装 查找 保存的查询sql文件

背景&#xff1a;Navicat 一个收费的软件&#xff0c;存在的最大缺点就是收费&#xff0c;所以我们为了优化它会遇到卸载重装这些复杂的过程&#xff0c;但是我们保存的查询sql会跟随卸载Navicat而删除&#xff0c;为了节省时间省去不必要的麻烦&#xff0c;我们可以查到我们保…

基于STM32和人工智能的智能楼宇安防系统

目录 引言环境准备智能楼宇安防系统基础代码实现&#xff1a;实现智能楼宇安防系统 4.1 数据采集模块4.2 数据处理与分析4.3 控制系统4.4 用户界面与数据可视化应用场景&#xff1a;智能楼宇安防管理与优化问题解决方案与优化收尾与总结 1. 引言 随着物联网和人工智能技术的…

后端数据null前端统一显示成空

handleNullValues方法在封装请求接口返回数据时统一处理 // null 转 function handleNullValues(data) {// 使用递归处理多层嵌套的对象或数组function processItem(item) {if (Array.isArray(item)) {return item.map(processItem);} else if (typeof item object &&…

开源的语音合成项目-EdgeTTS,无需部署无需Key

前几天和大家分享了&#xff1a;全网爆火的AI语音合成工具-ChatTTS。 有很多小伙伴反应模型下载还有点麻烦~ 今天再给大家带来一款开源的语音合成 TTS 项目-EdgeTTS&#xff0c;相比ChatTTS&#xff0c;操作起来对小白更友好。 因为其底层是使用微软 Edge 的在线语音合成服务…

Java数据结构与算法——稀疏数组和队列

一、稀疏数组sparsearray数组 该二维数组的很多值是默认值0,因此记录了很多没有意义的数据&#xff0c;可以采用稀疏数组进行压缩 1.基本介绍: 当一个数组中大部分元素为0&#xff0c;或者为同一个值的数组时&#xff0c;可以使用稀疏数组来保存该数组。 稀疏数组的处理方法…

c++文件io,字符串io简单介绍

目录 c文件io 介绍 采用文件流对象操作文件的一般步骤 示例 注意点 利用字节流特性 字符串io 介绍 istringstream ostringstream 示例 c文件io 介绍 c根据文件内容的数据格式分为二进制文件和文本文件 基本上和c一样 c 标准库中有许多不同的标志 用于指定流对象的…

Ollama(docker)+ Open Webui(docker)+Comfyui

Windows 系统可以安装docker desktop 相对比较好用一点&#xff0c;其他的应该也可以 比如rancher desktop podman desktop 安装需要windows WSL 安装ollama docker docker run -d --gpusall -v D:\ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama 这里…

CI /CD学习

CI/CD概述 CI/CD 是持续集成和持续交付/部署的缩写&#xff0c;旨在简化并加快软件开发生命周期。 持续集成&#xff08;CI&#xff09;是指自动且频繁地将代码更改集成到共享源代码存储库中的做法。持续交付和/或持续部署&#xff08;CD&#xff09;是一个由两部分组成的过程…

Paper Reading: PAMS:通过参数化最大尺度量化超分辨率

PAMS: Quantized Super-Resolution via Parameterized Max Scale PAMS&#xff1a;通过参数化最大尺度量化超分辨率, ECCV 2020 paper: https://arxiv.org/pdf/2011.04212.pdf GitHub: https://github.com/colorjam/PAMS 摘要 深度卷积神经网络&#xff08;DCNNs&#xff09;…

HumanPlus——斯坦福ALOHA团队开源的人形机器人:融合影子学习技术、RL、模仿学习

前言 今天只是一个平常的日子&#xff0c;不过看到了两篇文章 一篇是《半年冒出近百家新公司&#xff0c;「具身智能」也有春天》 我看完之后转发到朋友圈&#xff0c;并评论道&#xff1a;让机器人翻一万个后空翻&#xff0c;不如让机器人打好一个螺钉&#xff0c;毕竟在目前…

Flutter第十三弹 路由和导航

目标&#xff1a; 1.Flutter怎么创建路由&#xff1f; 2.怎么实现路由跳转&#xff1f;页面返回&#xff1f; 一、路由 1.1 什么是路由&#xff1f; 路由(Route)在移动开发中通常指页面&#xff08;Page&#xff09;&#xff0c;在Android中通常指一个Activity。所谓路由管…

什么是Linux挂载

首先先说一下在Linux中一切皆文件&#xff08;硬件设备也是文件&#xff09;&#xff0c;所有文件都是存放在以根目录为树形目录结构中&#xff1b;下面来说说一下什么是挂载 挂载&#xff1a;指的就是将设备文件中的顶级目录连接到 Linux 根目录下的某一目录&#xff08;最好是…

5.音视频基础 FLV

目录 简说FLV FLV Header FLV Body Tag Header ​编辑Tag Data Audio Data Video Data Script Data 简说FLV FLV格式可以包含音频、视频和文本数据&#xff0c;并且可以在网络上进行流媒体传输。优点是文件大小较小&#xff0c;压缩效率高&#xff0c;并且可以在较低…

深度解析ISO9001质量管理体系认证的核心优势

ISO9001质量管理体系认证是一项全球通用的标准&#xff0c;旨在帮助企业优化质量管理&#xff0c;提升市场竞争力。本文将详细解析ISO9001认证为企业带来的多重核心优势。 首先&#xff0c;ISO9001认证显著提升了企业的产品和服务质量。通过建立和实施系统化的质量管理流程&…

为数据安全护航,袋鼠云在数据分类分级上的探索实践

在大数据时代&#xff0c;数据具有多源异构的特性&#xff0c;且价值各异&#xff0c;企业需依据数据的重要性、价值指数等予以区分&#xff0c;以利采取不同的数据保护举措&#xff0c;避免数据泄露。故而&#xff0c;数据分类分级管理属于数据安全保护中极为重要的环节之一。…

小白速成AI大模型就看这份资源包

前言 在数字化浪潮席卷全球的今天&#xff0c;人工智能&#xff08;AI&#xff09;技术已成为推动社会进步的重要引擎。尤其是AI大模型&#xff0c;以其强大的数据处理能力和广泛的应用前景&#xff0c;吸引了无数人的目光。然而&#xff0c;对于初学者“小白”来说&#xff0…