公地困境中进化社交性的影响
立即解锁
发布时间: 2025-08-20 00:31:00 阅读量: 1 订阅数: 2 


自适应与学习代理:ALA 2009精选论文
# 公地困境中进化社交性的影响
## 1. 引言
在群体互动和博弈的研究中,如何促进合作一直是一个重要的课题。传统的群体选择机制存在一定局限性,而本文尝试通过标签介导的交互模型来研究群体动态,探讨在 n 人囚徒困境这类公地困境中,进化社交性对合作的影响。
## 2. 相关概念
### 2.1 n 人囚徒困境
n 人囚徒困境也被称为公地悲剧。在这个博弈中,x 轴代表某一特定游戏中 n 个玩家群体中合作者的比例,y 轴代表参与游戏的个体的收益。合作者比例与参与者获得的效用呈线性关系,但重要的是,背叛的收益总是高于合作的收益,即对于所有的 x 值,都有 Ud(x) > Uc(x),其中 x 表示合作者的比例,Ud 和 Uc 是基于群体中合作者比例的效用函数。
尽管背叛在个体理性上更有利,但在全是合作者的群体中,合作者的收益要远高于全是背叛者群体中背叛者的收益。当所有个体都选择背叛时,他们都只能获得 0.5 的收益,这是一个非帕累托最优、次优且集体非理性的结果。
### 2.2 代理交互模型
已经提出并研究了多种代理交互模型,包括空间约束和标签介导的交互等。群体规模在 NIPD 和使用标签的 PD 中都被证明是重要的,限制群体规模有利于促进合作。社区结构等因素也对合作的进化有积极影响。
标签是一种视觉标记或社交线索,可以帮助偏向社交互动,类似于足球支持者通过穿着喜欢的球队颜色来识别彼此,或者人们通过共同的语言、方言或地域口音在对话中识别彼此。标签介导的交互模型是一种更抽象的交互模型,可用于更抽象地表示代理交互。
Riolo 的研究表明,标签可以在囚徒困境中促进合作的出现,他研究了固定和进化的标签偏差。近年来,标签也成功应用于多智能体问题,但标签在需要互补行动的情况下存在局限性,更适合通过相同行动实现的合作。
## 3. 实验设置
### 3.1 代理基因组
每个代理由一个代理基因组表示,基因组包含以下基因:
- GC 基因:表示代理在特定行动中合作的概率。
- GT 基因:表示代理标签,取值范围为 [0...1],用于确定代理参与的游戏。
- GS 基因:表示每个代理的社交性,取值范围为 [0...1],作为个体代理的社交程度。
在第一代中,这些代理基因使用均匀分布生成,后续代通过遗传算法生成新的代理基因组。这些基因是进化属性,在个体的生命周期内是固定的,群体的变化仅通过具有进化遗传特征的新后代发生。
### 3.2 代理交互
在模拟中,每个代理通过标签介导的交互模型进行交互。代理 A 有机会向所有其他代理发出游戏邀请,其他代理参与游戏的概率由以下公式确定:
- dA,B = 1 - |AGT - CGT|
- Rab = dA,B × AGS
其中,dA,B 基于两个代理 A 和 B 的标签值的绝对值,用于生成两个轮盘赌 Rab 和 Rba,以确定代理 A 对 B 和代理 B 对 A 的态度。只有当两个轮盘赌都表明接受时,代理 B 才会参与游戏。代理的社交性基因会影响轮盘赌的分布。
以下是确定代理游戏交互的伪代码:
```plaintext
WHILE(Agent_A < POPULATION_SIZE)
Game_Participant_Set.Add(Agent_A)
WHILE(Agent_B < POPULATION_SIZE)
Decision_A = Decision_Roulett
```
0
0
复制全文
相关推荐










