归并排序专栏

原创已于 2025-08-14 19:40:12 修改 · 1k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-08-14 16:13:06 首次发布

归并排序（Merge Sort）作为计算机科学领域的经典排序算法，自 1945 年由约翰・冯・诺依曼提出以来，始终在算法领域占据重要地位。它不仅是 "分治法" 思想的完美实践，更以稳定的性能和明确的执行流程，成为理解高级排序算法的绝佳入门案例。本文将从算法原理、实现细节、性能分析到优化策略，全方位剖析归归并排序的精髓。

一、归并排序的核心思想：分而治之

归并排序的核心思想可以用 "分治合" 三个字高度概括：

分（Divide）：将原始数组递归拆分为两个规模大致相等的子数组，直到每个子数组只包含一个元素（此时可视为天然有序）
治（Conquer）：对拆分后的子数组进行递归排序
合（Combine）：将两个已排序的子数组合并为一个更大的有序数组

这种思想的巧妙之处在于：将复杂的排序问题分解为简单的子问题，通过解决子问题并合并结果，最终得到整体解决方案。与其他排序算法相比，归并排序的 "合并" 步骤是其最具特色的部分，也是保证排序稳定性的关键。

二、归并排序的工作流程详解

让我们通过具体示例详细解析归并排序的完整流程。以数组 [38, 27, 43, 3, 9, 82, 10] 为例：

1. 分解阶段（Divide）

分解过程采用递归方式，每次将数组从中间位置一分为二：

初始数组：[38, 27, 43, 3, 9, 82, 10]
第一次分解：[38, 27, 43] 和 [3, 9, 82, 10]
第二次分解：[38]、[27, 43] 和 [3, 9]、[82, 10]
第三次分解：[38]、[27]、[43]、[3]、[9]、[82]、[10]

当子数组长度为 1 时，分解过程终止，因为单个元素的数组本身就是有序的。

2. 合并阶段（Merge）

合并是归并排序的核心操作，将两个有序子数组合并为一个更大的有序数组：

第一次合并：[27, 43]（合并[27]和[43]）、[3, 9]（合并[3]和[9]）、[10, 82]（合并[82]和[10]）
第二次合并：[27, 38, 43]（合并[38]和[27, 43]）、[3, 9, 10, 82]（合并[3, 9]和[10, 82]）
第三次合并：[3, 9, 10, 27, 38, 43, 82]（合并[27, 38, 43]和[3, 9, 10, 82]）

合并操作的关键在于：通过双指针技术，每次从两个子数组中选取较小的元素放入临时数组，确保合并结果始终有序。

归并排序的合并阶段借鉴了 "利用已有序信息构建更大有序序列" 的思想，但通过双指针技术实现了线性时间复杂度，这比插入排序的嵌套循环效率更高。可以说，合并操作是对插入排序思想的优化升级 —— 用空间换时间，将原本需要嵌套循环的操作转化为一次线性遍历。

三、归并排序的 Java 实现与解析

下面是归并排序的完整 Java 实现，包含了核心的分治逻辑和合并操作：

import java.util.Arrays;

public class MergeSort {
    // 比较方法：判断a是否小于b
    private static boolean less(int a, int b) {
        return a < b;
    }

    // 交换数组中i和j位置的元素
    private static void exch(int[] array, int i, int j) {
        int temp = array[i];
        array[i] = array[j];
        array[j] = temp;
    }

    // 主排序方法
    public static void sort(int[] array) {
        if (array == null || array.length <= 1) {
            return;
        }
        mergeSort(array, 0, array.length - 1);
    }

    // 递归分治排序
    private static void mergeSort(int[] array, int left, int right) {
        if (left >= right) {
            return;
        }

        int mid = left + (right - left) / 2;
        mergeSort(array, left, mid);
        mergeSort(array, mid + 1, right);
        merge(array, left, mid, right);
    }

    // 归并操作
    private static void merge(int[] array, int left, int mid, int right) {
        int[] temp = new int[right - left + 1];
        int i = left;
        int j = mid + 1;
        int k = 0;

        // 使用less方法进行比较
        while (i <= mid && j <= right) {
            if (less(array[i], array[j])) {
                temp[k++] = array[i++];
            } else {
                temp[k++] = array[j++];
            }
        }

        while (i <= mid) {
            temp[k++] = array[i++];
        }

        while (j <= right) {
            temp[k++] = array[j++];
        }

        System.arraycopy(temp, 0, array, left, temp.length);
    }

    // 测试方法
    public static void main(String[] args) {
        int[] testArray = {38, 27, 43, 3, 9, 82, 10};
        System.out.println("排序前: " + Arrays.toString(testArray));

        MergeSort.sort(testArray);
        System.out.println("排序后: " + Arrays.toString(testArray));
    }
}

代码核心组件解析

辅助方法
- less(int a, int b)：封装比较逻辑，提高代码可读性，便于未来修改比较规则
- exch(int[] array, int i, int j)：封装元素交换逻辑，虽然在归并排序中不常用，但作为排序算法的标准组件保留
主排序入口
- sort(int[] array)：对外提供的排序接口，包含参数校验，避免空指针和无需排序的情况
递归分治核心
- mergeSort(int[] array, int left, int right)：实现分治逻辑
  - 终止条件：left >= right（子数组长度为 1）
  - 中间位置计算：left + (right - left) / 2（避免(left + right)可能导致的整数溢出）
  - 递归排序左右子数组后执行合并操作
合并操作
- merge(int[] array, int left, int mid, int right)：归并排序的核心
  - 创建临时数组存储合并结果
  - 双指针遍历左右子数组，选取较小元素放入临时数组
  - 处理剩余元素（左右子数组可能有一个先遍历完毕）
  - 使用System.arraycopy高效复制临时数组到原数组

四、归并排序的性能分析

时间复杂度

归并排序的时间复杂度表现非常稳定：

最佳情况：O(n log n)
最坏情况：O(n log n)
平均情况：O(n log n)

这种稳定性源于其分治策略：无论原始数组是否有序，都需要进行相同次数的分解和合并操作。具体来说，分解过程产生的递归树深度为 log₂n，每层的合并操作总耗时为 O (n)，因此整体时间复杂度为 O (n log n)。

空间复杂度

归并排序的空间复杂度为 O (n)，主要源于合并操作中创建的临时数组。这是归并排序相比快速排序的主要劣势，但在许多对稳定性要求高的场景中，这种空间开销是值得的。

稳定性分析

归并排序是稳定的排序算法，即相等元素的相对顺序在排序后保持不变。这是因为在合并操作中，当左右子数组元素相等时，我们总是优先选择左子数组的元素（if (less(array[i], array[j]))中的<=逻辑保证了这一点）。

五、归并排序的优化策略

虽然基础实现已经很高效，但在实际应用中仍可进行多项优化：

1. 小规模子数组使用插入排序

对于长度小于一定阈值（通常 15-20）的子数组，插入排序的性能往往优于归并排序。这是因为插入排序在小规模数据上的常数项开销更小，且避免了递归调用和数组复制的成本。

// 优化后的mergeSort方法
private static void mergeSort(int[] array, int left, int right) {
    // 当子数组长度小于阈值时使用插入排序
    if (right - left + 1 <= 15) {
        insertionSort(array, left, right);
        return;
    }
    
    int mid = left + (right - left) / 2;
    mergeSort(array, left, mid);
    mergeSort(array, mid + 1, right);
    merge(array, left, mid, right);
}

// 插入排序辅助方法
private static void insertionSort(int[] array, int left, int right) {
    for (int i = left + 1; i <= right; i++) {
        for (int j = i; j > left && less(array[j], array[j - 1]); j--) {
            exch(array, j, j - 1);
        }
    }
}

2. 避免不必要的合并操作

当左右子数组已经自然有序时（即左子数组的最后一个元素小于等于右子数组的第一个元素），可以跳过合并操作：

// 优化后的合并判断
private static void mergeSort(int[] array, int left, int right) {
    if (left >= right) return;
    
    int mid = left + (right - left) / 2;
    mergeSort(array, left, mid);
    mergeSort(array, mid + 1, right);
    
    // 当左右子数组已经有序时，跳过合并
    if (!less(array[mid + 1], array[mid])) return;
    
    merge(array, left, mid, right);
}

3. 复用临时数组

基础实现中每次合并都创建新的临时数组，这会带来额外的内存分配开销。可以改为在排序开始时创建一个全局临时数组并复用：

public class OptimizedMergeSort {
    private static int[] temp; // 全局临时数组
    
    public static void sort(int[] array) {
        if (array == null || array.length <= 1) return;
        temp = new int[array.length]; // 仅创建一次
        mergeSort(array, 0, array.length - 1);
    }
    
    // 后续实现中使用全局temp数组...
}

六、归并排序的应用场景

归并排序虽然需要额外空间，但其稳定性和可预测的性能使其在许多场景中成为首选：

外部排序：当数据量超过内存容量时，归并排序是处理外部数据（如磁盘文件）的理想选择，因为它可以分批次加载数据进行处理。
链表排序：归并排序对链表排序非常高效，不需要随机访问特性，且可以将空间复杂度优化至 O (1)（通过调整节点指针实现原地合并）。
需要稳定排序的场景：在电商订单排序（先按价格，再按时间）、数据库查询结果排序等场景中，稳定性至关重要，归并排序是最佳选择之一。
大数据处理：在分布式系统中，归并排序常用于合并多个已排序的数据集，如 MapReduce 框架中的排序阶段。

七、归并排序与其他排序算法的对比

排序算法	平均时间复杂度	空间复杂度	稳定性	特点
归并排序	O(n log n)	O(n)	稳定	性能稳定，适合大数据和外部排序
快速排序	O(n log n)	O(log n)	不稳定	实际应用中通常更快，内存占用少
堆排序	O(n log n)	O(1)	不稳定	原地排序，适合内存受限场景
插入排序	O(n²)	O(1)	稳定	简单，适合小规模或接近有序数据