可视化实证研究中的变量调查
立即解锁
发布时间: 2025-09-03 00:26:41 阅读量: 15 订阅数: 20 AIGC 


数据可视化的理论与实践
# 可视化实证研究中的变量调查
## 1. 可视化实证研究概述
实证研究是可视化研究活动中不可或缺的一部分。在可视化领域,众多实证研究为评估不同的视觉设计和可视化技术提供了可验证的方法,还有许多研究专注于通过控制实验来理解或测量可视化中的特定现象,如颜色感知、情感影响或知识运用等。
在实证研究中,所有的控制和半控制实验都明确定义了自变量、因变量、无关变量和操作变量。控制实验旨在研究多个条件变化的影响,其中实验中被改变的条件的各个方面定义为自变量,而要测量的效果则定义为因变量。由于一个效果的变化可能由多个变量引起,每个实验通常需要尽量减少一些潜在变量的影响,以确保所研究的条件数量在可充分采样的范围内。控制变量的方法通常包括将其设置为常量(如使用同一房间)和使其实例随机化(如随机排列不同条件)。在一些实证研究中,如基于网络的众包研究,虽然有明确的自变量和因变量,但某些潜在变量的影响无法完全控制,这类研究通常被称为半控制研究。
也有许多实证研究形式不预先定义自变量和因变量,如自由文本问卷、观察日记、焦点小组讨论、出声思考环节、访谈等。这类研究的目标之一是以开放的方式识别可能对可视化中的因果关系提供最有意义解释的自变量和因变量。
## 2. 自变量、因变量和其他变量
### 2.1 变量的定义
在实证研究中,变量是一个概念实体,在实验过程中可能会发生变化。它可以是刺激信息、特征属性、实验条件、测量值或其他可能变化的实体。例如,在一个基本的视觉搜索实验中,参与者可能会看到类似图 7.1 所示的刺激物,实验中可能变化的变量有很多,如下表所示:
|变量类型|具体变量|
| ---- | ---- |
|刺激物中对象的属性|颜色、形状、大小、位置、数量|
|显示区域属性|显示区域的纵横比|
|与刺激物相关的问题|问题内容、回答方式、选项数量、选项顺序|
|实验环境|计算设备类型、实验地点、实验时间|
|参与者属性|性别、年龄、视觉能力、教育背景、完成实验所需知识|
|实验结果|参与者完成一次试验的时间、参与者对刺激物反应的正确性、一组参与者完成相同类型试验的平均时间、一组参与者对相同类型刺激物反应的平均准确性|
### 2.2 变量的控制与分类
#### 2.2.1 自变量
在设计实证研究时,“控制”起着至关重要的作用。首先,需要选择少量变量作为自变量,通常自变量的数量 m 相对较小(一般 m < 5)。那些可能影响参与者表现但未包含在自变量集合中的变量被称为无关变量、干扰变量或潜在混淆变量。当一个无关变量已知对参与者的表现有混淆影响但未得到充分控制时,它就成为了实际的混淆变量。
其次,要控制每个自变量的变化或可选值的数量。例如,在设计图 7.1 中的刺激物时,虽然有许多不同的颜色和形状可供选择,但需要限制颜色和形状的数量。可以将自变量 X 看作信息论中的字母表,其有限的变化数量就是对应字母表中的字母数量。
最后,要控制无关变量的影响,通常将其设置为常量。但并非所有变量都能固定为常量,在许多实证研究中,一些变量可能会被随机采样或伪随机采样。还有许多变量既不能固定为常量,也不能随机或伪随机采样,如参与者的年龄和教育背景。在这种情况下,通常会记录这些变量的变化,并在实验报告中讨论其潜在影响。
#### 2.2.2 因变量
在一般的零假设中,变量 Y1, Y2, …, Yn 被称为因变量。因变量主要分为两类:
- **测量因变量**:在单个试验中要测量的变量。最基本的测量因变量是二元变量,许多研究刚刚可察觉差异(JND)的实验和测试快速反应或决策能力的实验都会使用二元变量。稍微复杂一些的测量因变量是一组多项选择,通常通过多个命令按钮、单选按钮或刺激物中的可选视觉对象来实现。有些实证研究的测量因变量的字母表更为复杂,如从 n 个可选位置中选择地图上的一个位置或输入高精度的实数。
- **衍生因变量**:从一个或多个测量变量中定义的因变量。例如,可以根据图 7.1 中定义的真实信息,将每次试验的正确性定义为衍生因变量。通过汇总一组试验的正确性值,可以将准确率(百分比)定义为该组的衍生因变量。同样,参与者在每个单独试验中的响应时间是测量因变量,而一组试验的平均响应时间则是衍生因变量。试验的分组方式取决于所关注的假设、自变量的定义和无关变量的控制。
0
0
复制全文
相关推荐










