自然场景表征的皮质模型:3D视觉计算的前沿探索
立即解锁
发布时间: 2025-08-25 00:18:50 阅读量: 3 订阅数: 17 

### 自然场景表征的皮质模型:3D视觉计算的前沿探索
#### 1. 3D LAMINART模型概述
3D LAMINART模型旨在解释和预测感知与神经生物学数据,聚焦于层状皮质机制如何相互作用以创建3D边界和表面表征。在处理自然场景时,该模型面临着诸多挑战,主要包括:
- 3D边界常常不完整,这可能是由于图像采集过程中的噪声,或者在某些边界位置缺乏相同极性的匹配。
- 杂乱场景中存在大量产生错误双目匹配的可能性。
为应对这些挑战,增强后的模型具有更对称的全局解剖结构,涉及V1中斑点与斑点间的相互作用,V2中细条纹与淡条纹的相互作用,以及V2细条纹和淡条纹中的视差滤波器。视差滤波器的存在是该模型的一个重要预测。同时,V2中存在的长距离双极样相互作用以及短距离循环抑制相互作用,与双极分组和视差滤波器对虚假边界视线抑制的需求相契合。这些相互作用共同揭示了边界和表面皮质流如何相互协作,克服彼此的计算缺陷,从而产生具有互补一致性的有意识视觉感知。
#### 2. 与其他3D视觉生物模型的比较
除了3D LAMINART模型,还有一些其他的3D视觉生物模型被提出。其中,著名的能量模型包含V1中的双目复杂细胞,并能预测猫的复杂细胞双目感受野的形状。尽管能量模型的变体,如结合相位和位置偏移来计算视差的模型,已成功应用于一些立体计算的前端,但它们不足以解释3D边界分组和表面表征如何形成并导致有意识的感知,如随机点立体图、达·芬奇立体视觉、帕努姆极限情况、透明度和双稳态感知等,而3D LAMINART模型能够对这些感知进行解释和模拟。
|模型名称|特点|能否解释特定感知现象|
| ---- | ---- | ---- |
|能量模型|包含V1双目复杂细胞,预测猫复杂细胞双目感受野形状|否|
|3D LAMINART模型|考虑层状皮质机制相互作用,有对称全局解剖结构|能|
#### 3. 模型扩展方向
为了进一步提升模型性能,可从以下几个方面对模型进行扩展:
- **纳入倾斜和倾斜表面计算**:将边界和表面计算扩展到能够表示深度中的倾斜和倾斜表面。例如,双极细胞可以推广为视差梯度细胞和角度细胞。视差梯度细胞能够表示跨越多个深度的边界,角度细胞则对直边之间的特定角度有选择性激活。这些细胞的相互作用可以消除对2D图片和3D场景中模糊倾斜的歧义。
- **引入空间注意和眼动控制机制**:大脑利用空间注意和眼动来固定场景中的感兴趣区域。由于皮质放大因子的存在,中央凹外区域的视觉分辨率较低,而中央凹区域可以提供更高的分辨率。当前模型在处理复杂自然场景时,用于解决局部模糊像素和双目匹配的像素数量有限。通过引入空间注意和眼动控制机制,如ARTSCAN神经模型及其改进版本,利用对数极坐标映射处理图像,结合简化的3D LAMINART前端,可以模拟大脑如何学习不变的对象类别表征,用于对象注意、识别和预测。
mermaid格式流程图如下:
```mermaid
graph LR
A[输入图像] --> B[对数极坐标映射]
B --> C[简化3D LAMINART前端处理]
C --> D[学习不变对象类别表征]
```
0
0
复制全文
相关推荐









