冒泡排序：最“笨“算法背后的最聪明设计

最新推荐文章于 2026-06-13 10:09:19 发布

原创最新推荐文章于 2026-06-13 10:09:19 发布 · 601 阅读

7 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#算法 #数据结构 #排序算法

从一个问题开始

假设你手上有十张扑克牌，点数分别是 8、3、5、1、9、2、7、6、4、10，现在要把它们从小到大排列整齐。你会怎么做？

有人可能会这样做：先找到最小的 1，放在最左边；再找剩下的九张里最小的 2，放在 1 后面；以此类推。这是一种思路，叫做选择排序。

但还有另一种完全不同的思路——不是去"找最值"，而是不断"比较相邻元素"，让最大的元素像气泡一样一步一步"浮"到水面。这就是冒泡排序。

一、为什么叫"冒泡"

想象一个杯子，里面装满了水底往上冒的气泡。气泡越小，上浮的速度越慢；气泡越大，上浮得越快。最终，大气泡全部浮到水面，小气泡沉在水底。冒泡排序的核心思想与此惊人地相似：在一个无序数组中，每一次遍历都让当前最大的元素"冒"到它该待的位置。第一次遍历后，最大的元素就位；第二次遍历后，第二大的元素就位；以此类推。遍历 n-1 次后，整个数组就有序了。但这里有个关键细节——它是怎么让最大元素"冒"出来的？答案是：相邻比较与交换。

// 核心操作：把相邻两个数中较大的那个向右移
if (a[j] < a[j + 1])  // 如果左边比右边小
{
    // 交换它们的位置
    temp = a[j];
    a[j] = a[j + 1];
    a[j + 1] = temp;
}

就这么简单。一轮比较下来，最大的元素一定被交换到最右侧。下图展示了第一轮冒泡的过程：

初始: [8, 3, 5, 1, 9, 2, 7, 6, 4, 10]
第1次: [8, 3, 5, 1, 9, 2, 7, 6, 4, 10] → 8<10? 否
第2次: [8, 3, 5, 1, 9, 2, 7, 6, 10, 4] → 4<10? 是，交换
第3次: [8, 3, 5, 1, 9, 2, 7, 10, 6, 4] → 6<10? 是，交换
第4次: [8, 3, 5, 1, 9, 2, 10, 7, 6, 4] → 7<10? 是，交换
第5次: [8, 3, 5, 1, 9, 10, 2, 7, 6, 4] → 2<10? 是，交换
第6次: [8, 3, 5, 1, 10, 9, 2, 7, 6, 4] → 9<10? 是，交换
第7次: [8, 3, 5, 10, 1, 9, 2, 7, 6, 4] → 1<10? 是，交换
第8次: [8, 3, 10, 5, 1, 9, 2, 7, 6, 4] → 5<10? 是，交换
第9次: [8, 10, 3, 5, 1, 9, 2, 7, 6, 4] → 3<10? 是，交换
       ↓
第一轮后: [10, 8, 3, 5, 1, 9, 2, 7, 6, 4]
          ↑ 最大元素就位

这就是冒泡排序的本质：不是跳跃式地寻找极值，而是通过相邻元素的逐轮比较，把"重的"东西逐步推向边界。 理解这一点，比记住代码模板重要一万倍。

二、从直观到代码：逐层拆解

2.1 最基础的版本

让我们先从最直观的方式写出冒泡排序的代码：

#include <stdio.h>

int main()
{
    int a[10];
    int i, j, temp;

    printf("请输入10个整数：\n");
    for (i = 0; i < 10; i++)
    {
        scanf("%d", &a[i]);
    }

    // 外层循环：控制遍历轮数
    // n个元素只需要 n-1 轮就能排好序
    for (i = 0; i < 9; i++)
    {
        // 内层循环：逐个比较相邻元素
        // 每轮结束后，已排序区域增加一个元素
        // 所以内层循环的范围是 [0, n-1-i)
        for (j = 0; j < 9 - i; j++)
        {
            if (a[j] < a[j + 1])  // 从大到小：左边小就交换
            {
                temp = a[j];
                a[j] = a[j + 1];
                a[j + 1] = temp;
            }
        }
    }

    printf("从大到小排序结果：\n");
    for (i = 0; i < 10; i++)
    {
        printf("%d ", a[i]);
    }
    printf("\n");

    return 0;
}

2.2 逐行理解代码逻辑

为什么外层循环是 i < 9 而不是 i < 10？因为对于 n 个元素，最多只需要 n-1 轮交换。当第 n-1 轮结束后，剩下的最后一个元素必然在它该在的位置——不需要和自己比较。为什么内层循环是 j < 9 - i？每一轮冒泡后，都有一个元素"就位"了。第一轮后，最大的元素在 a[9]；第二轮后，第二大的在 a[8]；以此类推。这些已就位的元素不需要再参与比较，所以内层循环的右边界在收缩。

2.3 第一次优化：提前终止

思考一个问题：如果数组在第3轮时已经有序了，后面的几轮还需要执行吗？答案是不需要。但基础版本的代码会继续执行——它不知道数组已经有序了。怎么判断"已经有序"？

如果在某一轮遍历中，一次交换都没有发生，说明数组已经是有序的了。

这就是第一个优化的核心：

#include <stdio.h>

int main()
{
    int a[10];
    int i, j, temp;
    int swapped;  // 标记本轮是否发生过交换

    printf("请输入10个整数：\n");
    for (i = 0; i < 10; i++)
    {
        scanf("%d", &a[i]);
    }

    for (i = 0; i < 9; i++)
    {
        swapped = 0;  // 每轮开始前重置标志
        
        // 优化点：如果数组已经有序，这一层循环结束后 swapped 仍为0
        // 外层循环检测到这个情况后，可以直接退出
        for (j = 0; j < 9 - i; j++)
        {
            if (a[j] < a[j + 1])
            {
                temp = a[j];
                a[j] = a[j + 1];
                a[j + 1] = temp;
                swapped = 1;  // 发生了交换，标记为1
            }
        }
        
        // 优化点：如果本轮没有发生交换，说明已经有序
        // 此时无需继续执行，直接跳出外层循环
        if (swapped == 0)
        {
            break;
        }
    }

    printf("从大到小排序结果：\n");
    for (i = 0; i < 10; i++)
    {
        printf("%d ", a[i]);
    }
    printf("\n");

    return 0;
}

这个优化在处理部分有序或接近有序的数组时效果显著。极端情况下（如已经排序好的数组），时间复杂度可以从 O(n²) 骤降到 O(n)。

2.4 第二次优化：记录最后交换位置

再深入思考：每一轮冒泡中，交换发生的最后位置意味着什么？意味着：这个位置之后的元素，在本轮冒泡中没有被交换过，因此它们已经就位，不需要再参与后续的比较。我们可以用这个信息来缩小内层循环的右边界：

#include <stdio.h>

int main()
{
    int a[10];
    int i, j, temp;
    int last_swap_index;    // 记录本轮最后一次交换发生的位置
    int right_boundary = 9; // 右边界，初始为最后一个有效下标

    printf("请输入10个整数：\n");
    for (i = 0; i < 10; i++)
    {
        scanf("%d", &a[i]);
    }

    for (i = 0; i < 9; i++)
    {
        last_swap_index = 0;  // 本轮开始前重置
        
        // 优化点：不再固定为 9-i，而是动态使用上一轮记录的右边界
        // 右边界右边的元素已经就位，无需再比较
        for (j = 0; j < right_boundary; j++)
        {
            if (a[j] < a[j + 1])
            {
                temp = a[j];
                a[j] = a[j + 1];
                a[j + 1] = temp;
                last_swap_index = j;  // 记录本次交换的位置
            }
        }
        
        // 优化点：本轮最后一次交换的位置，右边的元素都已就位
        // 下一轮只需要比较到这个位置
        right_boundary = last_swap_index;
        
        // 优化点：如果 last_swap_index 为0，说明本轮没有发生交换
        // 此时数组已经有序，可以提前退出
        if (right_boundary == 0)
        {
            break;
        }
    }

    printf("从大到小排序结果：\n");
    for (i = 0; i < 10; i++)
    {
        printf("%d ", a[i]);
    }
    printf("\n");

    return 0;
}

这个优化在处理尾部无序的数组时特别有效。例如数组前半部分杂乱、后半部分已经有序的情况。

三、冒泡排序的哲学

3.1 为什么 O(n²) 的算法至今还在教？

这是个好问题。冒泡排序的时间复杂度是 O(n²)，在数据量大的时候，远不如快速排序 O(n log n)、堆排序 O(n log n) 高效。既然如此，为什么几乎所有计算机教材都要讲它？

原因有三。

第一，它是最直观的不变量(Invariant)教学工具。

在冒泡排序中，不变量非常好理解：每一轮遍历结束后，最大的未排序元素一定位于正确的位置。 这个不变量是理解排序算法正确性的起点。

第二，它揭示了排序的本质。

排序的本质是什么？是消除逆序对。每一次相邻交换，本质上都是在消除一个逆序对。当逆序对全部消除时，数组就有序了。冒泡排序完美地展示了这一点——它不是"找到最大元素然后放过去"，而是"一步一步把逆序对消灭掉"。

第三，它与生活的道理相通。

冒泡排序告诉我们：有时候，最笨的方法反而是最稳健的方法。 它不依赖任何特殊的数据结构，不假设数据的分布特点，只需要相邻比较和交换，就能保证完成排序。就像人生中，有些问题没有捷径，只能一步一步来。每一个小交换，都是在向最终目标靠近。

四、边界与陷阱

4.1 输入校验

你的代码目前假设用户会老老实实输入10个整数。但用户可能输入9个，可能输入非整数，可能输入超出 int 范围的数。在实际项目中，应该加入输入校验：

int count = 0;
while (count < 10)
{
    printf("请输入第 %d 个整数（共10个）：\n", count + 1);
    if (scanf("%d", &a[count]) == 1)  // scanf 返回成功读取的项数
    {
        count++;
    }
    else
    {
        printf("输入无效，请重新输入整数。\n");
        while (getchar() != '\n');  // 清空输入缓冲区
    }
}

4.2 整数溢出问题

题目要求的是整数排序，但 C 语言的 int 有范围限制（通常是 -2,147,483,648 到 2,147,483,647）。如果用户输入超出这个范围，会发生整数溢出，导致不可预测的排序结果。对于严肃的项目，可以考虑使用 long long 类型，或者在比较前检测溢出。

4.3 稳定性问题

冒泡排序是稳定排序（Stable Sort）。这意味着：当两个元素值相同时，排序后它们的位置不会改变。这在什么情况下重要？考虑一个场景：按姓名和年龄双重排序。第一次按姓名排序后，再按年龄排序时，稳定排序能保证相同年龄的人仍然保持姓名的相对顺序。冒泡排序的稳定性来自于它的交换规则：只有严格的小于才交换，等于时不交换。 这一点在实现时务必注意。

4.4 空数组和单元素数组

如果数组为空或只有一个元素，冒泡排序应该做什么？

答案是：什么都不做，直接返回。 因为空数组和单元素数组本身就是"有序"的。

你的代码没有处理这个边界情况，但一个健壮的实现应该考虑：

// 对于空数组或单元素数组，不需要排序
if (n <= 1)
{
    return;
}

五、从冒泡看排序全貌

5.1 排序算法的分类

冒泡排序属于比较排序（Comparison Sort）——它通过元素之间的两两比较来确定顺序。所有比较排序在理论上都有一个下界：最好情况下时间复杂度是 O(n log n)。但排序世界远不止比较排序。计数排序、基数排序、桶排序等非比较排序，在特定条件下可以达到 O(n) 的时间复杂度。

5.2 排序算法的度量维度

评价一个排序算法，不能只看时间复杂度，还有以下几个维度：

维度	说明
时间复杂度	平均、最坏、最好情况
空间复杂度	是否需要额外内存
稳定性	相等元素的相对顺序是否保持
适应性	对部分有序数组的处理能力

冒泡排序在这些维度上的表现：