数据可视化中的模式感知与图形表达
立即解锁
发布时间: 2025-08-21 00:13:59 阅读量: 1 订阅数: 4 


信息可视化:基于感知的设计原则与应用
# 数据可视化中的模式感知与图形表达
## 1. 纹理与数据可视化的对比度
在数据可视化里,纹理元素通常较小,为了使其与背景区分开来,亮度对比度十分关键。当纹理透明地叠加在其他颜色编码的数据上时,与背景编码之间存在亮度对比度尤为重要,否则纹理元素将难以被看见。这对构建纹理元素的颜色以及背景颜色都形成了限制。最简单的解决办法是把纹理元素设为黑色或白色,并限制背景颜色的范围,使其不处于低亮度或高亮度的两端。
### 相关准则
[G6.18] 当将蕾丝纹理与颜色结合用于重叠区域时,要确保前景中的纹理元素与背景中颜色编码的数据之间存在亮度对比度。
## 2. 多维离散数据中的模式感知
数据可视化面临的一个有趣且具挑战性的任务,是支持对离散多维数据进行探索性分析。可视化在数据挖掘中是强大的工具,其目标常是探寻数据间的关系和趋势。
### 2.1 数据可视化的重要性
例如,营销专家会收集大量潜在目标人群的数据,像年龄、收入、教育水平、职业类别、购买巧克力的倾向等。每个测量变量都可视为一个数据维度。若营销人员能在这个多维数据集中找出与购买不同产品可能性相关的值簇,就能实现更精准有效的广告投放。
### 2.2 散点图的应用
绘制技术一直是数据探索者的重要工具。其过程本质上是绘制数据、寻找模式并解释结果,所以发现过程的关键步骤在于感知。图 6.44 中的四个散点图展示了不同的数据关系:
- 第一个有两个明显的簇,可能暗示生物有机体的不同亚群。
- 第二个两个测量变量间存在明显的负线性关系。
- 第三个是曲线的倒 U 形关系。
- 第四个有突然的不连续性。
这些模式会引导出关于变量间潜在因果关系的不同假设。若这些关系此前未知,研究者将有新发现。通过查看数字表格很难看出这些模式,可视化方法的强大之处在于能让人在嘈杂数据中看到模式,即从噪声中看到有意义的信号。
### 2.3 常见模式与数据维度处理
数据中可能存在无限多种有意义的模式,信号和噪声在不同情境下会相互转换。不过,有两种模式最为常见:簇和相关性。当每个数据点有两个属性时,传统散点图是较好的解决方案。但当涉及两个以上数值属性时,问题就变得复杂了。对于四个属性,通常会增加符号大小和颜色来展示。
处理三维以上数据的方法有:
- **广义绘图员图**:利用所有变量对创建一组二维散点图。但它难以展示只有同时考虑三个或更多数据维度才能理解的高维数据模式。
- **平行坐标图**:每个属性维度用一条垂直线表示,数据点成为连接各个属性值的线。不过,看到的模式依赖于轴的排列顺序,相邻轴的变量关系更容易被发现。研究表明,带有嵌入式散点图的平行坐标图在识别簇方面表现更佳。
### 2.4 颜色映射的应用
颜色映射可将单个散点图中可显示的数据维度扩展到五个。Ware 和 Beatty(1988)提出的方法是创建一个散点图,每个点是一个彩色斑块,而非白色背景上的黑点。具体映射方式如下:
| 变量 | 映射方式 |
| ---- | ---- |
| 变量 1 | x 轴位置 |
| 变量 2 | y 轴位置 |
| 变量 3 | 红色量 |
| 变量 4 | 绿色量 |
| 变量 5 | 蓝色量 |
这种方法在感知簇方面,颜色显示维度与空间维度效果相当,但解释这些模式可能有困难。
### 2.5 相关准则
[G6.19] 要显示四维以上的离散数据,可考虑使用颜色增强的广义绘图员图并结合刷选操作。
### 2.6 模式感知流程
```mermaid
graph LR
A[收集多维离散数据] --> B[选择可视化方法]
B --> C{数据维度}
C -- 二维 --> D[传统散点图]
C -- 三维或四维 --> E[增加符号大小和颜色的散点图]
C -- 四维以上 --> F[广义绘图员图或平行坐标图]
D --> G[寻找模式]
E --> G
F --> G
G --> H[解释模式]
```
## 3. 模式学习
若模式感知对从可视化中提取意义至关重要,那么一个问题随之而来:我们能否更好地学习看到模式?相关研究结果
0
0
复制全文
相关推荐










