第一章:数据结构前言(Lesson 1)
1. 什么是数据结构?
2. 什么是算法?
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
第一章:算法的时间复杂度和空间复杂度(Lesson 2)
1. 算法效率
1.1 如何衡量一个算法的好坏
long long Fib(int N)
{
if (N < 3)
return 1;
return Fib(N - 1) + Fib(N - 2);
}
斐波那契数列的递归实现方式非常简洁,但简洁一定好吗?那该如何衡量其好与坏呢?
1.2 算法的复杂度
第二章:时间复杂度
2.1 时间复杂度概念
// 请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
int count = 0;
for (int i = 0; i < N; ++i) {
for (int j = 0; j < N; ++j)
++count;
}
for (int k = 0; k < 2 * N; ++k)
++count;
int M = 10;
while (M--)
++count;
前面两个for循环的时间复杂度是N*N,第三个for循环的时间复杂度是2N,最后一个while循环的时间复杂度是10。最终的时间复杂度函数式:F(N)=N*N + 2*N + 10
实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。
2.2 大O的渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
- 用常数1取代运行时间中的所有加法常数。F(N)=N*N + 2*N + 10
- 在修改后的运行次数函数中,只保留最高阶项。N^2
- 如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。O(N^2)
F(N) = N*N + 2*N + 10 | |
N = 10 | F(N) = 130 |
N = 100 | F(N) = 10210 |
N = 1000 | F(N) = 1002010 |
O(N^2) | |
N = 10 | F(N) = 100 |
N = 100 | F(N) = 10000 |
N = 1000 | F(N) = 1000000 |
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。当N越大,后面项对结果的影响就越小
另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
2.3 常见时间复杂度计算举例
实例1:
// 计算Func2的时间复杂度?
void Func2(int N)
{
int count = 0;
for (int k = 0; k < 2 * N; ++k)
++count;
int M = 10;
while (M--)
++count;
printf("%d\n", count);
}
//时间复杂度函数式:F(N) = 2*N + 10;时间复杂度:O(N)
在分析算法的时间复杂度时,通常关注的是算法的增长趋势,而不是具体的常数因子。因此,当时间复杂度中出现类似2N和10N这样的情况时,它们都会被认为是线性增长的,即O(N)。
在大规模问题上,常数因子不再影响算法的增长趋势。例如,假设一个算法的时间复杂度是2N,而另一个是10N,如果输入规模为100时,第一个算法的执行时间是200个单位时间,而第二个算法的执行时间是1000个单位时间。尽管第二个算法的执行时间更长,但它们的增长率是一样的,都是线性增长。
因此,当我们分析算法的时间复杂度时,会将常数因子视为可以忽略的因素,只关注随着输入规模增长时,算法执行时间的增长趋势,而这种增长趋势决定了算法的时间复杂度。
实例2:
// 计算Func3的时间复杂度?
void Func3(int N, int M)
{
int count = 0;
for (int k = 0; k < M; ++k)
++count;
for (int k = 0; k < N; ++k)
++count;
printf("%d\n", count);
}
//时间复杂度函数式:F(N) = M + N;时间复杂度:O(M+N)
//M和N相互独立,某一项的增加和减少都会导致时间复杂度变化,所以不能省略其中一个
实例3:
// 计算Func4的时间复杂度?
void Func4(int N)
{
int count = 0;
for (int k = 0; k < 100; ++k)
{
++count;
}
printf("%d\n", count);
}
//时间复杂度函数式:F(N) = 100;时间复杂度:O(1) - 代表常数次
//常数时间复杂度表示算法的执行时间与输入规模无关,
//因此不管执行一次还是一亿次,都可以认为是常数次
实例4:
// 计算strchr的时间复杂度?
const char * strchr ( const char * str, int character );
//实现
while (*str)
{
if (*str == character)
return str;
else
++str;
}
//该算法时间复杂度O(N)
在该长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
实例5:
// 计算BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i - 1] > a[i])
{
Swap(&a[i - 1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
//时间复杂度函数式:F(N) = N*(N-1) / 2;时间复杂度:O(N^2)
//第一轮:n - 1次
//第二轮:n - 2次
//第三轮:n - 3次
//......
//倒数第二轮:2次
//倒数第一轮:1次
//总共n-1轮
//全部加起来就是等差数列。首项1,尾项n-1,项数(n-1轮)
实例6:
// 计算BinarySearch的时间复杂度?
int BinarySearch(int* a, int n, int x)
{
assert(a);
int begin = 0;
int end = n - 1;
// [begin, end]:begin和end是左闭右闭区间,因此有=号
while (begin <= end)
{
int mid = begin + ((end - begin) >> 1);
if (a[mid] < x)
begin = mid + 1;
else if (a[mid] > x)
end = mid - 1;
else
return mid;
}
return -1;
}
//时间复杂度函数式:F(N) = log_2 N;时间复杂度:O(logN)
//每查找一次少一半,所以每次除以2。N/2/2/2.../2 = 1
//反过来就是每次*2,(假设查找了x次),2^x = N
//查找次数和输入规模的关系就是log_2 N = 1(2为底)
实例7:
// 计算阶乘递归Fac的时间复杂度?
long long Fac(size_t N)
{
if (0 == N)
return 1;
return Fac(N - 1) * N;
}
//时间复杂度函数式:F(N) = N + 1;时间复杂度:O(N)
//调用如下,每次函数调用内部固定执行if判断和递减操作,可视为O(1)
//Fac(N)
//Fac(N-1)
//Fac(N-2)
//.......
//Fac(2)
//Fac(1)
//Fac(0)
实例8:
// 计算斐波那契递归Fib的时间复杂度?
long long Fib(size_t N)
{
if (N < 3)
return 1;
return Fib(N - 1) + Fib(N - 2);
}
时间复杂度:O(2^N)
//调用如下
//2^0 Fib(N)
//2^1 Fib(N-1) Fib(N-2)
//2^2 Fib(N-2) Fib(N-3) Fib(N-3) Fib(N-4)
//..........
//2^(n-4) Fib(4)
//2^(n-3) Fib(3)
//2^(n-2) Fib(2)
//每一层都是上一层的2倍,就是一个等比为2的等比数列
//通过下方错位相减法可得结果
//FN(n)= 2^0+2^1+2^2+......+2^(n-4)+2^(n-3)+2^(n-2) 1式
//2FN(n)= 2^1+2^2+......+2^(n-4)+2^(n-3)+2^(n-2) +2^(n-1) 2式
//两边乘以公比2,再用2式减1式
//FN(n)= 2^(n-1) - 1
第三章:空间复杂度
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用额外存储空间大小的量度。
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟时间复杂度类似,也使用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
实例1:
// 计算BubbleSort的空间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i - 1] > a[i])
{
Swap(&a[i - 1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
//额外的空间复杂度是常量级别的,不随输入规模 n 的增加而增加
//空间复杂度为 O(1)
实例2:
// 计算Fibonacci的空间复杂度?
// 返回斐波那契数列的前n项
long long* Fibonacci(size_t n)
{
if (n == 0)
return NULL;
long long* fibArray = (long long*)malloc((n + 1) * sizeof(long long));
fibArray[0] = 0;
fibArray[1] = 1;
for (int i = 2; i <= n; ++i)
fibArray[i] = fibArray[i - 1] + fibArray[i - 2];
return fibArray;
}
//额外开辟了1个数组,元素个数为n+1
空间复杂度为 O(N)
实例3:
// 计算阶乘递归Fac的空间复杂度?
long long Fac(size_t N)
{
if (N == 0)
return 1;
return Fac(N - 1) * N;
}
//递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间。
//空间复杂度为O(N)
实例4:
// 计算斐波那契递归Fib的空间复杂度?
long long Fib(size_t N)
{
if (N < 3)
return 1;
return Fib(N - 1) + Fib(N - 2);
}
//空间复杂度为O(N)
调用顺序为红色箭头→蓝色箭头→绿色箭头。总共开辟0~0-2层,即n-1层栈帧。每一层的栈帧是共用的。例如调用Fib(2)创建栈帧,返回后,栈帧销毁;再调用Fib(1),再创建栈帧,返回,销毁。
时间是累积计算的,空间可以重复利用。所以空间复杂度为O(N)。
(下图证明栈帧可以共用)
作业:
作业1
数组nums包含从0到n的所有整数,但其中缺了一个。请编写代码找出那个缺失的整数。你有办法在O(n)时间内完成吗?
示例 1:
输入:[3, 0, 1]
输出:2
示例 2:
输入:[9, 6, 4, 2, 3, 5, 7, 0, 1]
输出:8
//方法一:异或
int missingNumber(int* nums, int numsSize) {
int i = 0;
int ret = 0;//0异或任何数还是任何数
for (i = 0; i < numsSize; i++)//将nums数组所有元素异或
ret ^= nums[i];
for (i = 0; i < numsSize + 1; i++)//因为nums数组少了个1个元素,在异或完整数组
ret ^= i;
//相当于用完整数组和少1个元素的数组(nums数组)所有元素异或,最后相同的为0,
//剩下的就是少了的那个元素
return ret;
}
//方法二:两数组相减
int missingNumber(int* nums, int numsSize) {
// 计算从 0 到 n 的所有整数之和
int total = numsSize * (numsSize + 1) / 2;
// 计算 nums 中所有元素的和
int sum = 0;
for (int i = 0; i < numsSize; i++)
sum += nums[i];
// 返回缺失的整数
return total - sum;
}
//方法三:排序后再比较
//排序,依次查找。如果下一个数不是上一个数+1,那么上一个数+1就是消失的数字
int missingNumber(int* nums, int numsSize) {
// 如果数组只有一个数,返回缺失的整数
if (numsSize == 1)
return (nums[0] == 0) ? 1 : 0;
//当数组只包含一个元素时,我们需要确定缺失的整数是0还是1。
//因为对于一个只包含一个元素的数组而言,如果这个元素是0,则缺失的整数可能是1;
//如果这个元素不是0,则缺失的整数可能是0。
// 如果数组中没有0,则0为缺失的整数
if (nums[0] != 0)
return 0;
// 遍历数组,检查是否存在断号
for (int i = 1; i < numsSize; ++i)
if (nums[i] != nums[i - 1] + 1)
// 如果下一个数不是上一个数+1,那么上一个数+1就是缺失的整数
return nums[i - 1] + 1;
// 如果数组中没有缺失的整数,则返回数组最后一个数加一
return nums[numsSize - 1] + 1;
}
作业2
给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。
示例 1:
输入: nums = [1, 2, 3, 4, 5, 6, 7], k = 3
输出 : [5, 6, 7, 1, 2, 3, 4]
解释 :
向右轮转 1 步 : [7, 1, 2, 3, 4, 5, 6]
向右轮转 2 步 : [6, 7, 1, 2, 3, 4, 5]
向右轮转 3 步 : [5, 6, 7, 1, 2, 3, 4]
示例 2 :
输入:nums = [-1, -100, 3, 99], k = 2
输出:[3, 99, -1, -100]
解释 :
向右轮转 1 步 : [99, -1, -100, 3]
向右轮转 2 步 : [3, 99, -1, -100]
//方法一:3段逆序
void reverse(int* left, int* right) {
while (left < right) {
int tmp = *left;
*left = *right;
*right = tmp;
left++;
right--;
}
}
void rotate(int* nums, int numsSize, int k) {
k %= numsSize;
reverse(nums, nums + numsSize - k - 1); // 逆序前n-k个数字 4 3 2 1 5 6 7
reverse(nums + numsSize - k, nums + numsSize - 1); // 逆序后k个数字 4 3 2 1 7 6 5
reverse(nums, nums + numsSize - 1); // 逆序整个数组 5 6 7 1 2 3 4
}
//与上方逆序顺序不同
void rotate(int* nums, int numsSize, int k) {
k %= numsSize;
reverse(nums, nums + numsSize - 1);//逆序整个数组 7 6 5 4 3 2 1
reverse(nums, nums + k - 1);//逆序前k个元素 5 6 7 4 3 2 1
reverse(nums + k, nums + numsSize - 1);//逆序后n-k个元素 5 6 7 1 2 3 4
}
//时间复杂度:前n-k+后k个是n,逆序整个数组是n,加起来是2n,所以O(n)
//空间复杂度:O(1)
//方法二:拷贝
void rotate(int* nums, int numsSize, int k) {
int* tmp = (int*)malloc(numsSize * sizeof(int));
k %= numsSize;
memcpy(tmp + k, nums, (numsSize - k) * sizeof(int));
memcpy(tmp, nums + (numsSize - k), k * sizeof(int));
memcpy(nums, tmp, numsSize * sizeof(int));
}