栈溢出、堆溢出与BSS溢出：底层原理与案例分析

原创于 2025-08-05 08:30:00 发布 · 537 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#网络 #web安全 #BSS溢出 #栈溢出 #堆溢出

安全设计同时被 2 个专栏收录

14 篇文章

订阅专栏

底层原理

6 篇文章

订阅专栏

一、栈溢出：函数调用的致命陷阱

底层原理

栈是程序运行时用于存储函数调用信息的内存区域，遵循LIFO（后进先出）原则。每个函数调用都会在栈上创建栈帧，包含：

返回地址（函数结束后跳回的位置）
函数参数
局部变量
栈基指针（EBP）

当向栈上的缓冲区写入超过其分配空间的数据时，就会发生栈溢出，覆盖相邻的栈帧数据，特别是返回地址。

// 典型漏洞代码
void vulnerable() {
    char buffer[4];  // 栈上分配4字节缓冲区
    gets(buffer);    // 无边界检查的输入函数
}

攻击原理

攻击者构造精心设计的输入：

[ 恶意机器码 ][ 填充数据 ][ 覆盖的返回地址 ]

恶意代码（Shellcode）放置在缓冲区起始处
填充数据覆盖缓冲区剩余空间和EBP
返回地址被覆盖为缓冲区的起始地址

当函数返回时，CPU会跳转到被覆盖的地址执行，从而运行攻击者的恶意代码。

真实案例：Morris蠕虫（1988）

漏洞位置：Unix fingerd 服务的gets()调用
攻击载荷：包含Vax汇编的Shellcode
影响：感染了10%的互联网主机（约6000台）

技术细节：

; 经典Shellcode结构
jmp short call_point  ; 2字节跳转
pop_esi:
pop esi              ; 获取字符串地址
mov [esi+0x20], esi  ; 设置参数
mov al, 0x0b         ; execve系统调用号
int 0x80             ; 触发系统调用
call_point:
call pop_esi
db '/bin/sh',0       ; 嵌入命令字符串

防护措施

栈保护金丝雀（Stack Canary）：

; 函数入口
mov eax, gs:0x14      ; 获取随机金丝雀值
mov [ebp-4], eax      ; 放置在栈帧关键位置

; 函数返回前
mov ecx, [ebp-4]
xor ecx, gs:0x14
jne __stack_chk_fail  ; 检测到修改则终止

不可执行栈（NX Bit）：现代CPU支持将栈标记为不可执行
地址随机化（ASLR）：随机化内存地址布局

二、堆溢出：动态内存的黑暗森林

底层原理

堆是程序运行时动态分配的内存区域，通过malloc()/free()管理。堆块结构包含：

+-----------------+
| 前一块大小/状态  | 
| 当前块大小/标志  |  ← chunk头
+-----------------+
| 用户数据区       |  ← 程序实际使用的区域
+-----------------+
| 下一块头信息     |
+-----------------+

当向堆分配的缓冲区写入超过其大小的数据时，会覆盖相邻堆块的元数据，特别是：

大小字段
空闲链表指针（fd/bk）

攻击原理：unlink攻击示例

溢出覆盖下一个堆块的size字段和指针

原始空闲块A: [size][fd][bk][...]
溢出后变为: [size][目标地址-12][攻击值][...]

当该块被释放时，glibc执行unlink操作：

FD = P->fd;  // 被覆盖为 目标地址-12
BK = P->bk;  // 被覆盖为 攻击值
FD->bk = BK; // 写入目标地址: *(目标地址-12+12) = 攻击值
BK->fd = FD; // 写入攻击值+8: *(攻击值+8) = 目标地址-12

实现任意地址写（通常覆盖GOT表）

真实案例：Heartbleed漏洞（2014）

漏洞位置：OpenSSL的TLS心跳扩展
漏洞类型：堆缓冲区过读（反向溢出）
技术细节：
```
// 漏洞代码简化版
memcpy(bp, pl, payload); // 无边界检查的复制
```
攻击者可读取相邻堆内存，泄露敏感信息（私钥、会话cookie）

现代堆防护

Safe Unlinking：

// glibc改进后的unlink
if (__builtin_expect (FD->bk != P || BK->fd != P, 0))
  malloc_printerr ("corrupted double-linked list");

Tcache保护：
- 每个线程独立的缓存桶
- 单链表结构（无bk指针）
- 数量限制和随机化

堆地址随机化：

# Linux查看堆随机化
cat /proc/sys/kernel/randomize_va_space

三、BSS溢出：静态数据的隐秘杀手

底层原理

BSS段（Block Started by Symbol）存储：

未初始化的全局变量
初始化为0的静态变量
程序启动时由内核清零

内存布局：

+------------------+
| .data段          | ← 已初始化全局变量
+------------------+
| .bss段           | ← 未初始化全局变量
|   buffer[64]     | ← 可溢出缓冲区
|   global_ptr     | ← 相邻的关键指针
+------------------+
| 堆区             |
+------------------+

当向BSS段的缓冲区溢出时，会覆盖相邻的全局变量，特别是函数指针。

攻击场景

// 漏洞示例
char global_buf[64]; // BSS段缓冲区
void (*log_func)(char*) = default_log; // BSS段函数指针

void process_input(char* input) {
    strcpy(global_buf, input); // 无边界检查
}

int main() {
    char input[256];
    read_input(input); // 用户可控输入
    process_input(input);
    log_func(global_buf); // 可能执行恶意代码
}

真实案例：wu-ftpd漏洞（2000）

漏洞位置：FTP服务器的全局缓冲区
攻击方式：覆盖全局函数指针glob()
利用步骤：
1. 发送超长MKD命令（创建目录）
2. 覆盖glob()函数的GOT表项
3. 下次调用glob()时执行Shellcode

BSS防护技术

Full RELRO：
```
# 编译时启用
gcc -Wl,-z,relro,-z,now program.c
```
- 重定位表（GOT）标记为只读
- 防止覆盖函数指针

变量重排序：

// 编译器自动重排
__attribute__((section(".data"))) 
void (*critical_func)() = safe_func;

边界检查扩展：

// Clang的SafeStack
void foo() {
  char safe_buf[128]; // 安全栈
  char* unsafe_buf = malloc(128); // 危险堆
}

四、对比分析与防御矩阵

三种溢出对比

特性	栈溢出	堆溢出	BSS溢出
发生区域	运行时栈	动态堆	静态数据段
目标指针	返回地址	堆块指针/GOT表	全局函数指针
利用难度	★★☆	★★

# 综合防护编译选项
gcc -fstack-protector-strong -D_FORTIFY_SOURCE=2 \
    -Wl,-z,now,-z,relro,-z,noexecstack \
    -fPIE -pie -o secure_app app.c

编译时防护：

# 综合防护编译选项
gcc -fstack-protector-strong -D_FORTIFY_SOURCE=2 \
    -Wl,-z,now,-z,relro,-z,noexecstack \
    -fPIE -pie -o secure_app app.c

运行时防护：

技术	防护目标	Linux启用方式
ASLR	所有内存攻击	`echo 2 > /proc/sys/kernel/randomize_va_space`
SELinux/AppArmor	权限限制	系统策略配置
Control Flow Integrity	跳转目标验证	LLVM-CFI编译

开发实践：

// 安全编码示例
void safe_copy(char* dest, const char* src, size_t size) {
  if (strnlen(src, MAX_INPUT) >= size) // 输入检查
      abort();
      
  #ifdef __STDC_LIB_EXT1__
      strcpy_s(dest, size, src); // C11安全函数
  #else
      strncpy(dest, src, size-1); // 传统方案
      dest[size-1] = '\0';
  #endif
}

五、前沿演进：内存安全的未来

硬件辅助防护：
- Intel CET（控制流增强技术）
  - Shadow Stack：返回地址的只读副本
  - Indirect Branch Tracking：间接跳转验证
```
; CET保护下的函数调用
call func
endbr64          ; 合法入口点标记
```

内存安全语言：

// Rust示例（免疫大部分内存漏洞）
fn main() {
    let mut buffer = [0u8; 4];
    let input = b"AAAAAAA"; 
    buffer.copy_from_slice(&input[..4]); // 编译时边界检查
}

静态分析突破：

符号执行：KLEE、Angr
污点分析：TaintScope

# 污点分析伪代码
taint_source = get_user_input()
tainted_vars = propagate_taint(taint_source)
if tainted_vars & sensitive_sinks:
    report_vulnerability()

终极防御法则：

永远不信任任何输入

最小化攻击面原则

纵深防御策略

持续更新防护机制

这三种溢出漏洞揭示了计算机内存管理的深层挑战：安全与效率的永恒博弈。理解其原理不仅是防御需求，更是对计算机系统本质的认知深化。在万物互联的时代，内存安全已成为数字文明的基石之一。