神经符号集成与多智能体系统研究
立即解锁
发布时间: 2025-08-21 01:50:57 阅读量: 2 订阅数: 10 


多智能体系统与认知逻辑的融合进展
### 神经符号集成与多智能体系统研究
在人工智能领域,将线性时态逻辑(Linear Temporal Logic,LTL)集成到非符号(视觉)领域以及多智能体系统(Multi - Agent Systems,MAS)的研究具有重要意义。下面我们将详细探讨相关的模型、应用以及面临的问题。
#### 集成线性时态逻辑的神经符号方法
##### 问题提出
在非符号环境中,每次运行会产生一系列图像 \(I = i_0, i_1, \cdots, i_{l - 1}\) 以及关于该序列的高级标签。每个图像是公式字母表 \(P\) 上符号解释的“渲染”,存在一个符号接地函数 \(sg: I \to 2^P\),将每个图像映射到 \(P\) 中符号的真值。我们的目标是在系统中利用深度学习感知和符号推理,以利用子符号数据和符号知识。
##### 模型介绍
- **循环逻辑张量网络(Recurrent Logic Tensor Networks)**
- 逻辑张量网络(Logic Tensor Networks,LTN)是一个神经符号框架,它可以通过利用结构化符号知识和原始数据进行推理和学习。它实现了实逻辑,即一阶逻辑(First Order Logic,FOL)的模糊松弛。由于连续逻辑,神经网络可以在逻辑框架中共存,并实际实现逻辑元素,将每个原子接地到实张量中。
- 在之前的工作中,我们将基于最佳可满足性学习的概念应用于由LTLf公式生成的确定有限自动机(Deterministic Finite Automaton,DFA)。实现自动机的神经计算图具有循环结构,类似于长短期记忆(Long short - term memory,LSTM)神经网络,可以应用于任意长度的序列。
- 我们的框架基于三个模糊谓词:Symbol、State和Output。Symbol(p, t) 表示序列中第 \(t\) 个图像是否属于类 \(p\),通过卷积神经网络进行接地。State(qk, t) 表示在时间 \(t\) 时自动机是否处于状态 \(q_k\)。Output(oi, t) 表示机器在时间 \(t\) 是否给出输出 \(o_i\)。
- 我们使用这些谓词定义了一个由三个公理组成的知识库(Knowledge Base,KB):初始条件、转移规则和输出规则。通过应用KB中的规则,我们可以监控公式 \(\varphi\) 在时间上的满足情况,并根据已知的图像序列标签定义模糊自动机输出的损失。
- **DFA的概率松弛:DeepDFA**
- 在另一项工作中,我们提出了一种基于概率有限自动机(Probabilistic Finite Automata,PFA)的不同神经架构。PFA 更容易与神经网络集成,因为可以通过矩阵乘法计算序列被接受的概率。我们将 PFA 表示为转移矩阵 \(M_t\)、输入向量 \(v_i\) 和输出向量 \(v_o\)。对于字符串 \(x = x[0]x[1]\cdots x[l - 1]\),其被接受的概率计算如下:
\[v_i \times M_t[x[0]] \times M_t[x[1]] \times \cdots \times M_t[x[l - 1]] \times v_o\]
- 我们设计了一个具有转移矩阵和输出向量参数的循环神经网络,类似于 PFA 的工作方式,称为 DeepDFA。该架构可以将 DFA 和 PFA 规范作为背景知识。与循环 LTN 不同,DeepDFA 仅适用于符号相互排斥的任务,并且可以从轨迹中学习 DFA 规范。为了从轨迹中学习 DFA,我们使用了一种特定的激活函数,在训练过程中平滑地近似独热向量,使 PFA 成为 DFA,同时保持模型的可微性。
- **具有概率接地符号的 DeepDFA**
我们提出了一种扩展的 DeepDFA 模型,将其扩展到概率接地符号。该模型在每个时间步使用符号的概率计算下一个 DFA 状态的期望值,是一个更通用的框架,适用于非符号环境,特别是在非马尔可夫强化学习领域。
##### 应用
- **在图像序列分类中利用 LTL 知识**
- 我们使用循环 LTN 架构提高了视觉任务中序列分类器的性能。通过利用公式知识和序列级标签,将图像序列分类为是否符合给定公式。与纯深度学习方法相比,我们的方法即使在减少数据集样本数量的情况下也能达到更高的准确率,表明将逻辑知识嵌入网络的方法非常有效。
- 操作步骤:
1. 准备包含图像序列和序列级标签的数据集。
2. 构建循环 LTN 架构,包括
0
0
复制全文
相关推荐









