Arachne:系统应用的强大切面语言解析
立即解锁
发布时间: 2025-08-20 00:01:04 阅读量: 1 订阅数: 5 


面向方面软件开发交易I
### Arachne:系统应用的强大切面语言解析
#### 1. 重写策略概述
重写策略负责在编织时将基础程序的二进制代码进行转换,从而有效地将切面与基础程序关联起来。这些策略将Arachne的主要依赖定位到底层硬件架构。一般来说,重写策略需要收集基础程序的相关信息,这些信息通常包括不同影子的地址、大小、它们操作的符号(即函数或全局变量名)、长度等。为了使编译后的切面独立于基础程序,这些信息会在运行时按需收集。基础程序源代码中的符号名与其在内存中的地址之间的映射是从基础程序可执行文件中包含的链接信息推断出来的。由于检索这些信息的成本较高,Arachne会将其收集并存储到元信息动态链接库(DLL)中,这些DLL就像一种缓存,减少了收集基础程序检测所需信息的问题。为了实现切面语言,Arachne提供了一组八个重写策略,这些策略最终可能会相互使用。
#### 2. 部分特定策略介绍
- **call、readGlobal和writeGlobal策略**
- 在Arachne中,call、readGlobal和writeGlobal分别允许在函数调用、全局变量读取或写入时触发通知。readGlobal和writeGlobal在Arachne中的实现与µDyner接近,但Arachne通过重写基础程序中找到的函数调用来实现call策略,而µDyner则重写被调用者的函数体。在英特尔架构上,函数调用得益于与x86调用汇编指令的直接映射,几乎所有编译器都会使用该指令。对全局变量的读写访问在基础程序的二进制代码中被转换为使用立即硬编码地址的指令。通过将这些地址与基础程序可执行文件中包含的链接信息进行比较,Arachne可以确定全局变量的访问位置。因此,这些原始切入点不涉及任何动态测试,仅重写基础程序的二进制代码就足以在所有适当的点触发通知和残余执行。
- x86调用指令和x86跳转(jmp)指令的大小相同。由于访问全局变量的指令涉及硬编码地址,读取或写入全局变量的x86指令至少具有x86 jmp指令的大小。因此,在编织时,Arachne将它们重写为跳转到钩子的jmp指令。钩子是在新分配的内存上动态生成的,包含一些汇编指令,用于在通知(或影子)执行前后保存和恢复适当的寄存器。
- **controlflow和controlflowstar策略**
- 每次调用C函数时,Linux运行时会在调用栈上创建一个激活记录。与µDyner一样,Arachne对controlflow的重写策略实现使用控制流切入点中最深嵌套的函数调用(或全局读写访问)作为影子,该影子触发一个残余。这个残余使用激活记录的链接来检查控制流中剩余的函数调用是否在Linux运行时维护的调用栈上。通过适当使用存储基础程序可执行文件中链接信息的哈希表,可以将确定特定函数是否为另一个函数的调用者的成本降低到指针比较。因此,对于具有n个直接嵌套函数的controlflow,残余需要进行n次指针比较。然而,允许非直接嵌套函数的间接控制流运算符controlflowstar的残余最坏情况下的运行时间与基础程序栈深度成正比。
- **read和write策略**
- read和write是µDyner中未包含的新切入点,已添加到Arachne的最新版本中。它们的实现依赖于Linux操作系统接口(即mprotect)和英特尔处理器规范允许的页面内存保护。读写切入点触发一个残余,将绑定变量重新定位到基础程序不允许访问的内存页面,并添加一个专用信号处理程序。基础程序对已识别的绑定变量的任何访问尝试都将触发之前添加的信号处理程序的执行。该处理程序将检查试图访问受保护页面的二进制指令,以确定是读访问还是写访问,然后最终执行适当的通知。
- **seq策略**
- 与read和write一样,seq是Arachne的一个新语言特性,µDyner没有等效的构造。Arachne对该运算符的重写策略为序列中除最后一个阶段之外的每个阶段关联一个链表。序列中的每个阶段触发一个残余,该残余更新这些链表以反映当前匹配执行流的状态转换。当seq中第一个原始切面的第一个切入点匹配时,会分配一个节点并将其添加到关联的链表中,该节点包含一个保存序列中不同切入点之间共享变量的结构。一旦连接点匹配表示序列中某个阶段的原始切面的切入点,Arachne会查询与前一阶段关联的链表中的每个节点并执行相应的通知。最后,Arachne更新该节点,如果没有使用星号(*),则将其移动到与当前匹配切入点关联的列表中。如果匹配的切入点对应于序列的末尾,则释放结构。我们的切面编译器包含一个优化,即从可调整大小的池中分配结构,并且在序列终止时,结构不会被释放,而是返回到池中。
#### 3. Arachne的局限性
基础程序的激进优化可能会阻止Arachne无缝编织切面,有两种优化Arachne目前还不支持:
- 如果编译器在基础程序的二进制代码中将一个函数内联到另一个函数中,Arachne编织器将无法正确处理引用该函数的切入点。
- 控制流切入点基于激活记录的链接。在x86架构上,优化编译器有时在叶子函数中不维护这种链接,以释放一个寄存器用于其余的计算。不过,在我们使用开源C编译器gcc的实验中,这并没有成为问题。Arachne在编织切面时不需要基础程序的源代码,但它依赖于可执行文件中嵌入的链接信息来确定程序代码必须重写的位置。因此,从可执行文件中剥离符号以及破坏编译器和/或调试器之间互操作性的激进优化与Arachne不兼容。实际上,Arach
0
0
复制全文
相关推荐










