欢迎来到我的博客!在今天的文章中,我将采用一种独特且直观的方式来探讨我们的主题:我会使用一幅图像来贯穿整篇文章的讲解。这幅精心设计的图表不仅是我们讨论的核心,也是一个视觉辅助工具,帮助你更深入地理解和掌握本文的内容。
通过这种方式,我们可以一步步深入本文的主题,每个阶段都将图像作为参考。这样不仅可以增加信息的吸收和理解,还能让学习过程更加生动和有趣。无论你是刚入门的新手还是寻求更深层次理解的老手,这幅图都将是你理解本文内容的有力工具。
所以,让我们开始这一独特的旅程,一边阅读文章,一边参考这幅将贯穿全文的图表,深入探索我们今天的话题!
想象一下,你走进了一个充满了成千上万本书的巨大图书馆。这些书籍横七竖八地堆放着,没有任何顺序。你需要找到一本特定的书,但在这混乱中,这看似是一个不可能完成的任务。这时,一位图书管理员出现了。这位管理员不仅知道每本书的具体位置,而且还能以令人难以置信的速度将这些书籍分类和组织起来,让你轻松地找到所需的书籍。这正是快速排序算法在数据世界中的角色:一个高效、精准的“信息管理员”,能迅速将数据整理成有序的结构。
快速排序,这个由英国计算机科学家Tony Hoare在1960年发明的算法,至今仍是计算机科学中最受欢迎和广泛使用的排序算法之一。它之所以名为“快速”,是因为它比其他传统排序算法(如冒泡排序或插入排序)要快得多,尤其是在处理大量数据时。快速排序的基本思想是选择一个元素作为“基准”,然后将数组分为两部分,一边是小于基准的元素,另一边是大于基准的元素,接着递归地在这两部分进行同样的操作。
在现代计算的世界里,快速排序不仅是一个算法的范例,它也是处理大规模数据不可或缺的工具。从数据库的查询优化到大数据分析,再到我们日常使用的搜索引擎,快速排序的影响无处不在。它的效率和优雅使它成为了计算机科学中的一个经典,一个在不断变化和发展的数字时代依然屹立不倒的算法巨人。
快速排序有三种方法。他们分别是“hoare版本” “挖坑法” 和 “前后指针版本”本文只介绍第一种,剩下两种请挪步下一篇文章!
1.hoare版本
一张图片带你秒懂过程!
快速排序的基本原理
快速排序是一种高效的排序算法,使用分而治之的策略来排序数据。以下是它的基本步骤:
-
选择基准值(Pivot):
从数组中选择一个元素作为基准值。这个选择可以是随机的,通常选择第一个或最后一个元素。 -
分区(Partitioning):
重新排列数组,使得所有小于基准值的元素都排在基准之前,而所有大于基准值的元素都排在基准之后。这个步骤结束后,基准元素就处于其最终位置。 -
递归排序子数组:
对基准左侧和右侧的子数组分别递归地执行快速排序。 -
终止条件:
当子数组的大小减至1或0时,递归结束,因为每个元素都已经被排序。
// 假设按照升序对array数组中[left, right)区间中的元素进行排序
void QuickSort(int array[], int left, int right)
{
if(right - left <= 1)
return;
// 按照基准值对array数组的 [left, right)区间中的元素进行划分
int div = partion(array, left, right);
// 划分成功后以div为边界形成了左右两部分 [left, div) 和 [div+1, right)
// 递归排[left, div)
QuickSort(array, left, div);
// 递归排[div+1, right)
QuickSort(array, div+1, right);
}
上述为快速排序递归实现的主框架。
分区(Partitioning)
我们首先选择基准值将其定义为key 一般为最左或最右,此时,对其进行遍历,L向右找比key大的值,R向左找比key小的值,找到了就相互交换, 直到第一次相遇,将key与相遇点进行交换
此时可能会有人疑问,为什么相遇就一定要交换,如果我们相遇后这个值比key大的情况下,是否违背我们要排序的初衷呢? 这里先给出答案:相遇位置一定比key小。
原因:
如果左边先走就无法保证一定比key小
接下来我们实现初步代码,如何让他先进行左右交换并让key挪动到相遇位置
void QuickSort(int* a, int begin, int end)
{
int keyi = begin;
int right = end;
int left = begin ;
while (left < right)
{
//左边找大
while(left < right && a[left] < a[keyi])//加入&&的原因是如果到相遇点时,left还是小于kei,他不会在相遇点停下,并且再次交换就颠倒顺序了
{
++left;
}
//右边找小
while (left < right && a[right] < a[keyi])
{
--right;
}
Swap(&a[left], &a[right]);
}
Swap(&a[left], &a[keyi]);
keyi = left;
}
此时我们已经完成初步交换
那我们是不是可以得出,如果接下来让左边变得有序,右边也有序。整体就有序了
递归排序子数组
接下来我们对左右子数组进行递归处理,就可以得出一个有序数组
接下来我们先对左子树进行递归
进行处理后,3就是key就是相遇处,接着再对左子数组进行处理递归处理直到只剩一个数组时返回
接着再对右子树进行处理,以此类推,这里不多做赘述
终止条件
这里涉及到递归子分治问题,所以我们进行修改代码,将第一步的key也就是图中的6保留,keyi-1就是左边的数组个数,keyi+1就是右边的数组个数,我们进行递归,返回条件就是只有一个节点时返回。
void QuickSort(int* a, int begin, int end)
{
if (begin >= end)
return;
int keyi = begin;
int right = end;
int left = begin+1 ;
while (left < right)
{
//左边找大
while(left < right && a[left] < a[keyi])//加入&&的原因是如果到相遇点时,left还是小于kei,他不会在相遇点停下,并且再次交换就颠倒顺序了
{
++left;
}
//右边找小
while (left < right && a[right] < a[keyi])
{
--right;
}
Swap(&a[left], &a[right]);
}
Swap(&a[left], &a[keyi]);
keyi = left;
//左半 [begin , keyi-1] keyi [keyi+1, end]
QuickSort(a, begin, keyi - 1);
QuickSort(a, keyi + 1, end);
}
快速排序的优化
对以上代码进行测试,我们会发现在处理有序数组时,快速排序反而是最慢的排序
为什么有序的情况下快排会很吃亏呢? 因为我们采取了固定选Key
理想状态下,快排时间复杂度是O(N*logN)
所以我们采取三数取中法 可以避开所有最坏的情况,越接近二分,就越快
三数取中法是快速排序算法中一种改进的基准(pivot)选择方法。它的目的是减少快速排序在最坏情况下的时间复杂度,这通常发生在选择的基准值是最小或最大元素时。通过选择一个更接近中间值的基准,可以提高分区的均匀性,从而使算法更加高效。
在传统的快速排序中,基准通常被选择为数组的第一个元素、最后一个元素或随机一个元素,这样在面对某些特定的数据集时(比如已经排序或接近排序的数组)可能会导致算法效率低下。
三数取中法是通过考虑数组的第一个元素、中间元素和最后一个元素,然后选择这三个元素的中位数作为基准。这种方法在实践中通常能给出一个较好的基准,从而使得分区更加平衡。
void QuickSort(int* a, int begin, int end)
{
if (begin >= end)
return;
int midi = GetMidi(a, begin, end);
Swap(&a[midi], &a[begin]);
int keyi = begin;
int right = end;
int left = begin ;
while (left < right)
{
//右边找小
while (left < right && a[right] >= a[keyi])
{
--right;
}
//左边找大
while(left < right && a[left] <= a[keyi])//加入&&的原因是如果到相遇点时,left还是小于kei,他不会在相遇点停下,并且再次交换就颠倒顺序了
{
++left;
}
Swap(&a[left], &a[right]);
}
Swap(&a[left], &a[keyi]);
keyi = left;
//左半 [begin , keyi-1] keyi [keyi+1, end]
QuickSort(a, begin, keyi - 1);
QuickSort(a, keyi + 1, end);
}
-
begin 和 end: 这两个变量通常表示正在处理的数组或子数组的开始和结束索引。在数组的第一次排序时,
begin
通常是 0(数组的第一个元素的索引),而end
是数组的最后一个元素的索引。 -
计算中点:
(begin + end) / 2
这个表达式的目的是找到begin
和end
之间的中间索引。这是通过将begin
和end
的值相加,然后除以 2 来实现的。由于这里使用的是整数除法,所以即使begin + end
是奇数,结果也会被自动向下取整到最接近的整数。 -
数组索引: 在 C/C++ 中,数组的索引是从 0 开始的。因此,计算出的
midi
一定是一个有效的数组索引,只要begin
和end
是有效的。这意味着a[midi]
是数组中的一个实际元素。
总结来说,int midi = (begin + end) / 2;
确保 midi
是位于 begin
和 end
之间的一个有效索引,而 a[midi]
则是数组在这个索引位置的元素。这是一种常见的找到数组中间元素索引的方法。
结论:Hoare版本快速排序的效率与优势
Hoare版本的快速排序算法是计算机科学中的一个经典例子,它展示了高效算法设计的重要性。通过其独特的分区策略,该算法能够快速、高效地处理各种大小的数据集。Hoare版本的快速排序在最佳情况下的时间复杂度为 O(n log n),并且即使在平均情况下也能维持这一高效表现。虽然它在最坏情况下的时间复杂度为 O(n^2),但通过智能选择枢轴点,如使用三数取中法或随机选取,可以大幅减少这一风险。
此外,Hoare版本相较于其他变体如Lomuto分区方法,通常需要更少的数据交换操作,这使得它在处理大数据集时更为高效。然而,它的实现相比一些其他版本更为复杂,可能需要更细致的理解和调试。
总的来说,Hoare版本的快速排序因其高效性和对大数据集友好的特性,在算法领域和实际应用中仍然占有一席之地。它不仅是排序算法的一个优秀代表,也是计算机算法设计和分析的一个经典案例。