视觉思维算法:从查询到路径规划的深度解析
立即解锁
发布时间: 2025-08-21 00:14:02 阅读量: 1 订阅数: 4 


信息可视化:基于感知的设计原则与应用
# 视觉思维算法:从查询到路径规划的深度解析
## 1. 视觉查询的基础概念
视觉查询是针对认知任务形成的一种假设,可通过发现或未发现视觉模式来解决问题。视觉问题解决中涉及的模式多种多样,包括图中的路径查找、数量估计、大小估计、趋势估计、聚类识别、相关性识别、异常值检测与特征描述、目标检测以及结构模式识别(如网络中的层次结构)等,每种都需要不同类型的模式发现。
为了快速且低错误率地执行视觉查询,查询应包含能存储在视觉工作记忆中的简单模式或对象。研究表明,人的视觉工作记忆可能只能同时处理大约三个基本查询或一个更复杂的查询。当查询超出视觉工作记忆容量时,就需要其他认知策略。
虽然可能的查询模式数量众多,但了解快速视觉搜索的要求有助于我们理解哪些视觉查询可以快速处理。随着我们对特定图形约定的熟练掌握,我们能够处理更复杂的查询模式。例如,象棋大师能够进行新手无法完成的视觉查询,但即使是专家,基本模式感知的规律也会使某些模式比其他模式更容易被识别。
## 2. 计算数据映射
计算机算法可以将数据转换为计算机屏幕上的像素,其多样性和复杂性是无限的。这些算法是整体视觉思维过程的一部分,这里主要关注能以相对直接和快速的方式改变数据到显示映射的简单算法,例如在充满数据的平面上放大,会使一些数据被放大,而一些数据则会从视野中排除。
在探索复杂或大容量数据集的界面中,数据与其视觉表示之间的映射应具有流畅性和动态性,同时操作控件所需的认知努力不应过大,以免影响分析。某些交互技术可以让用户感觉直接与数据接触,Rutkowski 将其称为透明度原则。当达到透明度时,“用户能够直接将智力应用于任务,工具本身似乎消失了”。丰富的经验是实现透明度的一种方式,但良好的用户界面设计也能让新手轻松实现这一目标。
数据通常在显示之前会进行转换,交互式数据映射就是调整将数据变量映射到显示变量的函数的过程。数据与其视觉表示之间的非线性映射可以使数据处于最容易显示模式的范围内。常见的操作包括对数据施加对数、平方根等变换函数。当显示变量为颜色时,可以选择直方图均衡化和交互式颜色映射等技术。对于大型复杂数据集,有时可以使用滑块限制可见数据值的范围。
## 3. 视觉思维算法概述
视觉思维算法将感知和认知行动与数据可视化相结合,以解决问题。这里介绍的算法使用伪代码描述,伪代码是为人类阅读设计的,用于描述计算算法,这些算法只是对视觉思维过程的概述,旨在明确其适用场景并提供优化思路。
在这些算法中,需要注意不同类型信息和操作之间的相互作用,主要包括以下几种:
- **感知和认知操作**:包括将问题的一部分转化为视觉查询、在脑海中添加图像、为感知到的符号或其他特征添加属性等,还包括在找到项目时终止视觉搜索等决策。
- **显示信息**:指屏幕或纸张上可视化表示的信息。
- **认知行动**:旨在以某种方式获取信息的行动,如眼睛移动以聚焦显示的不同部分,鼠标移动以选择数据对象或在数据空间中导航。
- **外部化**:将获得的知识保存到外部世界的行为,例如在纸上做标记或输入到计算机中。
- **计算**:视觉思维算法中在计算机中执行的部分。
## 4. 算法 1:视觉查询
视觉查询是所有视觉思维算法的组成部分,可以看作是计算机科学中的子例程。以下是视觉查询算法的伪代码:
```plaintext
[A1] Visual queries
Display environment: A graphic display containing potentially meaningful visual patterns.
1. Problem components are identified that have solutions based on visual pattern discov-
ery. These are formulated into visual query patterns sufficient to discriminate between
anticipated patterns.
2. The low-level visual system is tuned to be sensitive to the query pattern. Visual
information from the display is processed into a set of feature space maps weighted
according to the search pattern. A visual scanning strategy is activated based on prior
knowledge, display gist, and the task.
3. An eye movement is made to the next best target location based on the feature space map,
scene gist, and prior knowledge
```
0
0
复制全文
相关推荐










