【数据结构与算法】数据结构与算法介绍-CSDN博客

文章目录

数据结构与算法的详细介绍，涵盖核心概念、实现原理、应用场景及代码示例：

1. 数据结构详解

数据结构：存储和组织数据的方式，决定了数据的逻辑关系及操作效率（如增删查改）。
算法：解决问题的步骤，用于操作数据并得到结果。
关系：数据结构是算法的“工具”，算法通过高效使用数据结构完成任务。例如，图结构上的最短路径算法（如Dijkstra）依赖图的存储方式（邻接矩阵或邻接表）。

1.1 线性结构

数组 (Array)
- 实现：连续内存空间，存储相同类型元素。
- 操作：
  - 随机访问：通过下标直接定位（arr[i]），时间复杂度 O(1)。
  - 插入/删除：需移动后续元素，时间复杂度 O(n)。
- 应用：高频随机访问场景（如缓存、矩阵运算）。
链表 (Linked List)
- 类型：
  - 单链表：节点包含值和指向下一个节点的指针。
  - 双链表：节点包含指向前后节点的指针，支持双向遍历。
- 操作：
  - 插入/删除：修改指针指向即可，时间复杂度 O(1)（但需先遍历到目标位置）。
  - 随机访问：需从头遍历，时间复杂度 O(n)。
- 应用：内存池管理、LRU缓存（结合哈希表）。
栈 (Stack)
- 实现：可通过数组或链表实现（数组更节省内存，链表动态扩容）。
- 核心操作：
  - push()：入栈，时间复杂度 O(1)。
  - pop()：出栈，时间复杂度 O(1)。
- 应用：函数调用栈、表达式求值（中缀转后缀）、撤销操作。
队列 (Queue)
- 类型：
  - 普通队列：FIFO，如任务队列。
  - 循环队列：利用数组首尾相连，避免空间浪费。
  - 优先队列：基于堆实现，按优先级出队（如 Dijkstra 算法）。
- 操作：
  - enqueue() 和 dequeue()，时间复杂度 O(1)。
- 应用：BFS 遍历、消息队列、滑动窗口算法。

1.2 非线性结构

树 (Tree)
- 二叉树 (Binary Tree)
  - 性质：每个节点最多两个子节点。
  - 遍历方式：
    - 前序：根 → 左 → 右（用于复制树结构）。
    - 中序：左 → 根 → 右（二叉搜索树有序输出）。
    - 后序：左 → 右 → 根（计算目录大小）。
  - 二叉搜索树 (BST)：左子树值 < 根 < 右子树值，查找复杂度 O(log n)（退化为链表时 O(n)）。
- 平衡树
  - AVL 树：通过旋转（左旋/右旋）保持平衡，左右子树高度差 ≤ 1。
  - 红黑树：近似平衡，通过颜色标记和旋转保证插入/删除高效（Java TreeMap、C++ map）。
- 堆 (Heap)
  - 实现：完全二叉树，数组存储。
  - 类型：
    - 最大堆：父节点值 ≥ 子节点（用于求 Top K）。
    - 最小堆：父节点值 ≤ 子节点（用于优先队列）。
  - 操作：插入和删除的时间复杂度 O(log n)。
- B树/B+树
  - B树：多路平衡搜索树，每个节点存储多个键和子节点指针（适合磁盘存储，减少IO次数）。
  - B+树：叶子节点通过指针连接形成有序链表（数据库索引如 MySQL）。
图 (Graph)
- 存储方式：
  - 邻接矩阵：二维数组表示边，适合稠密图，空间复杂度 O(V²)。
  - 邻接表：链表数组表示边，适合稀疏图，空间复杂度 O(V + E)。
- 算法：
  - 最短路径：Dijkstra（单源无负权边）、Floyd-Warshall（多源）。
  - 最小生成树：Prim（稠密图）、Kruskal（稀疏图）。
哈希表 (Hash Table)
- 原理：通过哈希函数将键映射到桶地址。
- 冲突解决：
  - 开放寻址法：线性探测、二次探测。
  - 链地址法：每个桶存储链表（Java HashMap）。
- 负载因子：哈希表填充程度，通常扩容阈值为 0.75。

2. 算法详解

2.1 排序算法

快速排序

def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr)//2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)

核心思想：分治，选择一个基准值（pivot），将数组分为三部分。
时间复杂度：平均 O(n log n)，最坏 O(n²)（可通过随机选择pivot优化）。

归并排序
- 核心思想：分治，将数组递归拆分为子数组，合并时按序合并。
- 稳定性：稳定排序，适合对象排序（如按多个字段排序）。
- 时间复杂度：始终 O(n log n)。
堆排序
- 步骤：
  1. 构建最大堆。
  2. 交换堆顶与末尾元素，堆大小减一，调整堆。
- 时间复杂度：O(n log n)，适合大数据量但内存有限的情况。

2.2 搜索算法

二分查找

def binary_search(arr, target):
    left, right = 0, len(arr)-1
    while left <= right:
        mid = (left + right) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return -1

前提：数组有序。
时间复杂度：O(log n)。

广度优先搜索 (BFS)
- 实现：队列辅助，逐层遍历。
- 应用：最短路径（无权图）、社交网络中的好友推荐。
深度优先搜索 (DFS)
- 实现：递归或栈辅助，回溯法常用。
- 应用：迷宫求解、拓扑排序。

2.3 动态规划 (DP)

核心思想：将问题分解为重叠子问题，通过记忆化（Memoization）或递推表格避免重复计算。
典型问题：
- 斐波那契数列：dp[i] = dp[i-1] + dp[i-2]。
- 背包问题：
  - 0-1背包：dp[i][w] = max(dp[i-1][w], dp[i-1][w - wt[i]] + val[i])。
  - 完全背包：允许重复选择物品。
- 最长公共子序列 (LCS)：二维DP表比较字符匹配。