并发系统中的错误处理与进程管理
1. 进程命名与故障恢复
在并发系统中,与进程通信需要其 PID。但在监督进程的场景下,进程可能会重启,重启后的进程 PID 会改变,这使得对原 PID 的引用失效。因此,注册名称变得尤为重要,它提供了一种可靠的方式来查找和与进程通信,无论进程是否重启。
例如,使用新进程的方式和旧进程相同:
iex(6)> bobs_list = Todo.Cache.server_process("Bob's list")
Starting to-do server for Bob's list.
#PID<0.167.0>
这个简单的实验证明了系统具备基本的容错能力,在进程崩溃后,系统能自我修复并恢复服务。
2. 子进程规范
为了管理子进程,监督者需要一些信息,这些信息被统称为子进程规范,主要回答以下问题:
- 子进程应如何启动?
- 子进程终止时应采取什么措施?
- 用什么术语来唯一标识每个子进程?
基本的子进程规范是一个映射,包含配置子进程属性的字段。例如,待办事项缓存的规范可能如下:
%{
id: Todo.Cache,
start: {Todo.Cache, :start_link, [nil]},
}
-
:id