随机算法实战：如何用Python实现快速排序的随机化版本（附性能对比）

原创

于 2026-03-01 05:20:42 发布 · 853 阅读

标签

随机算法实战：如何用Python实现快速排序的随机化版本（附性能对比）

如果你已经对快速排序的经典实现了然于胸，甚至能闭着眼睛写出它的递归结构，那么是时候接触一个更“狡猾”的版本了——随机化快速排序。它听起来像是给算法加了一点“运气”，但这份“运气”背后，是坚实的数学理论和显著的性能保障。对于处理现实世界中那些并非总是“教科书式”有序的数据集，随机化快速排序提供了一种优雅的解决方案，它能将最坏情况的时间复杂度从令人担忧的O(n²)拉回到我们熟悉的O(n log n)期望值。这篇文章，我将带你从零开始，用Python亲手实现这个算法，并通过详尽的性能对比，让你直观感受“随机化”带来的魔力。我们不仅会写代码，还会深入其背后的概率论原理，并探讨它在实际工程中的应用场景。

1. 重温经典：确定性快速排序的核心与痛点

在进入随机化的世界之前，我们必须先清晰地理解传统快速排序的运作机制。它的核心思想是“分而治之”：选择一个基准元素，将数组划分为小于基准和大于基准的两部分，然后递归地对这两部分进行排序。

一个典型的Lomuto分区方案的Python实现如下：

def quicksort_deterministic(arr, low, high):
    if low < high:
        # 分区操作，返回基准元素的最终位置
        pivot_index = partition(arr, low, high)
        # 递归排序左半部分
        quicksort_deterministic(arr, low, pivot_index - 1)
        # 递归排序右半部分
        quicksort_deterministic(arr, pivot_index + 1, high)

def partition(arr, low, high):
    # 选择最后一个元素作为基准 (确定性选择)
    pivot = arr[high]
    i = low - 1  # 指向小于基准区域的最后一个元素
    for j in range(low, high):
        if arr[j] <= pivot:
            i += 1
            arr[i], arr[j] = arr[j], arr[i]
    arr[i + 1], arr[high] = arr[high], arr[i + 1]
    return i + 1

这个算法在平均情况下表现卓越，时间复杂度为O(n log n)。然而，它的致命弱点在于基准元素的选择。上述代码固定选择最后一个元素作为基准。试想一下，如果输入的数组已经是升序或降序排列，例如 [1, 2, 3, 4, 5]，每次分区操作都只能将数组划分为一个大小为 n-1 的子数组和一个空数组。这将导致递归树退化成一条深度为 n 的链，从而使时间复杂度恶化到 O(n²)。