汇编语言原理与操作详解
立即解锁
发布时间: 2025-08-20 02:12:41 订阅数: 4 


计算机架构:软件、编码与硬件的综合探讨
# 汇编语言原理与操作详解
## 1. 段寄存器假设
在汇编语言中,有这样的语句 `assume cs:CSEG, ds:CSEG, ss:CSEG`,这里段寄存器和其基地址之间的冒号意味着两者相等。该语句不可执行,汇编后会消失,它告知汇编器,段名 `CSEG` 是运行时存储在三个段寄存器中的基地址。这种假设能让汇编器根据指定的基地址正确准备代码中内存操作数的偏移量。由于操作系统在程序执行前有自己设置段寄存器的规则,所以用户程序在访问其中的操作数之前,通常需要正确设置数据段寄存器。
## 2. 三种基本寻址模式
在指令执行期间,操作数可能位于内存或 CPU 中。若操作数在内存中,会发出一个内存周期将操作数从内存取到 CPU。若操作数为 16 位,而处理器的内存数据总线为 8 位,则每次只能取回操作数的一部分,需要两个物理内存周期。三种基本的内存寻址模式如下表所示:
| 名称 | 获取操作数所需的内存周期 |
| ---- | ---- |
| 内存直接寻址 | 1 |
| 内存立即寻址 | 0 |
| 内存间接寻址 | 2 |
### 2.1 内存立即寻址
一般来说,内存立即寻址意味着操作数在 CPU 中。实际上,操作数可以编码在指令的地址字段中。执行中的指令位于指令寄存器(IR)中,但从 IR 中获取操作数位仍需一个时钟周期。也就是说,立即操作数意味着无需内存引用。需要注意的是,指令中的立即操作数可以是源操作数,但作为目的操作数则毫无意义。大多数汇编器要求在操作数字段中,在符号地址或数值绝对地址前放置井号(#)来表示内存立即寻址,例如 `#opd1`、`#100` 等。
### 2.2 内存直接寻址
内存直接寻址模式意味着获取操作数需要一个内存周期。从概念上讲,IR 中的低 16 位字段包含操作数存储在内存中的地址。具体而言,指令包含一个直接指向内存中操作数的地址。
硬件寄存器可用于在访问操作数之前修改指令中的内存地址,这称为索引,是计算中第二个主要的编程概念。寄存器直接寻址意味着操作数存储在 CPU 寄存器中,寄存器间接寻址意味着 CPU 寄存器包含一个直接指向内存中操作数的地址。若操作数是寄存器直接寻址,获取操作数无需内存周期,因此可将寄存器直接寻址归类为内存立即寻址的派生形式。同样,寄存器间接寻址是内存直接寻址的派生形式,因为获取操作数只需一个内存周期。下面是一些 MASM 示例:
1. 无索引的绝对符号或数值地址指定内存立即操作数。
```asm
B80064 mov ax, HUNDRED ;ax ~ 0064 {HUNDRED equ 100}
880064 mov ax, 64h ;ax ~ 0064
880064 mov ax, 50*2 ;same as above
880064 mov ax, opd2-opd1 +98 ;same if opd2=opd1 +2
```
该指令有三个字节,操作码 `B8` 指定将 AX 进行内存立即寻址移动,其中 AX 隐含为目的操作数。地址字段包含 `0064`,但实际上,十六进制字节 `64` 存储在 `00` 之前。
2. 前面带有关键字 `offset` 的可重定位符号指定内存立即寻址,如下所示:
```asm
moy ax, offset opd1
moy di, offset opdl+2
```
3. 段名表示立即操作数,例如:
```asm
mov ax, CSEG ;ax.- CSEG
```
段名 `CSEG` 通常大写,被视为绝对符号,因此 16 位基地址(段号)从 IR <15:0> 复制到 AX 中。
4. 前面带有关键字 `ds:` 的数值地址或绝对符号表示内存直接寻址,如:
```asm
mov ax, ds:80h ;ax .- M[ds:80] {memory direct}
```
5. 指令中带有或不带有索引的可重定位符号表示内存直接寻址,如下:
```asm
mov aX,opdl ;ax .- M[ds:opdl]
mov ax, opdl lsi] ;ax .- M[ds:opdl+si]
```
6. 带有索引的绝对符号或数值地址表示内存直接寻址,例如:
```asm
mov ax, lsi] ;ax .- M[ds:si]
mov dx, 100[si] ;dx .- M[ds:64+si]
mov dx, HUNDRED[si] ; same as above
```
### 2.3 内存间接寻址
内存间接寻址模式意味着获取操作数需要两个内存周期。指令包含一个内存字的第一个地址,其中存储着第二个地址。在第一个内存读取周期后,第二个地址被取到 CPU 中,该第二个地址直接指向操作数。由于指针意味着地址,所以指令包含一个指向指针的指针,该指针指向内存中的操作数。在第一个内存读取周期后,立即发出第二个内存读取周期以获取操作数。因此,总共需要两个内存读取周期来获取操作数。由于内存相对 CPU 较慢,大多数大型机不支持内存间接寻址,奔腾处理器也不支持,所以我们将其作为一种编程概念来学习。在支持的机器上,间接地址符号前会放置 `@` 符号来表示内存间接寻址,例如 `@opdPtrl`、`@100` 等。
## 3. 机器操作
每个机器操作(mop)由汇编器转换为一条指令。所有机器操作可分为六类:加载和存储、算术、逻辑和移位、比较和分支、输入/输出以及系统控制。即使操作码助记符相同,在移动、算术、逻辑或移位指令中指定的操作数语法可能会进一步揭示操作数的长度,可能是 8 位、16 位或 32 位。在计算中,四个基本指令是加载、存储、减法和条件分支,任何应用程序都可以用这些指令编写,其他指令只是为了使编程更快、更容易而设计的。
### 3.1 加载和存储
加载指令是将操作数从内存取到 CPU,存储指令则相反,将操作数从 CPU 存储到内存。受 PDP - II 的影响,奔腾处理器可以使用 `mov`(移动)指令来完成加载和存储,因为唯一的区别在于方向。需要注意的是,`mov` 并不意味着物理移动,而是复制,因为源操作数保持不变。该指令需要两个操作数,如果目的操作数是寄存器,源操作数是内存,则为加载;否则为存储。`mov` 助记符可能会根据移动方向和操作数大小转换为不同的操作码。
### 3.2 入栈与出栈
栈是一种可以在内存中模拟的动态数据结构。也就是说,可以发出一个内存读取周期来访问栈中的操作数。段语句是一个伪操作,用于声明栈,如下所示:
```asm
SSEG segment stack
dw 80 dup ('1)
SSEG ends
push cs ;SP ~ SP - 2; M[SS:SP] .- CS
pop ds ;DS .- M[SS:SP]; SP.- SP + 2
push cx ;save ex
pop cx ;restore ex
```
符号 `SSEG`、段伪操作和
0
0
复制全文
相关推荐










