重新利用数据质量评估中元数据使用的行为分析
立即解锁
发布时间: 2025-08-20 02:17:39 阅读量: 1 订阅数: 5 


概念建模与本体驱动模型目录
### 重新利用数据质量评估中元数据使用的行为分析
在当今数字化时代,数据已成为政府和组织的宝贵资产。然而,数据质量问题却对业务和决策产生了不利影响。因此,数据质量评估成为了一个重要的研究领域。本文旨在探讨在数据重新利用任务中,用户如何与元数据进行交互,以及元数据在评估重新利用数据质量方面的作用。
#### 1. 引言
数据质量评估通常采用自上而下的方法,包括确定用户需求、数据质量测量、数据清理和持续质量监控。然而,随着数据可访问性和共享的增加,这些传统方法面临着挑战,尤其是在数据重新利用的情况下。新用户往往对数据及其质量特征了解甚少,而现有的评估方法通常依赖于元数据,如概念模型、数据目录或数据库模式,这些元数据在重新利用的数据集中往往不可用或不完整。
为了解决这一问题,一些研究提出了“自下而上”的方法和机器学习技术,但由于数据质量评估的高度情境性和需要人类判断,目前无法完全自动化。元数据作为支持人类判断的基本工具,在数据质量评估中发挥着重要作用。然而,对于用户在评估重新利用的数据集时如何与元数据进行交互,目前仍缺乏深入的理解。
#### 2. 相关工作
数据质量研究已经进行了四十多年,不同的研究社区对数据质量维度进行了分类,以支持数据质量评估和问题发现。常见的评估方法包括全面数据质量管理方法(TDQM)和数据质量评估框架(DQAF)。数据剖析是一种常用的实践方法,它可以生成各种数据质量维度的元数据,帮助用户评估数据质量和适用性。
元数据通常分为描述性、结构性和管理性三类。在传统信息系统中,高质量的元数据有助于用户评估数据,但在数据重新利用的情况下,元数据往往缺乏。目前的数据质量评估实践主要是手动和临时的,效率低下且容易导致基于有缺陷数据的分析和决策。
#### 3. 研究设计
本研究采用实验室实验的方法,通过专门设计的平台来了解元数据对参与者在评估重新利用数据集质量时的表现和行为的影响。实验过程中,收集了行为日志数据、眼动数据和定性口头数据。
- **参与者**:来自两所澳大利亚大学的学生,无需特定的数据分析经验。共有20名学生参与实验,其中19份响应可用。
- **实验方法**:
- **眼动追踪**:使用Tobii Pro TX300眼动仪直接收集眼动数据,测量注视持续时间等客观指标,以确定吸引参与者注意力的具体区域。
- **提示性回顾性出声思考法**:参与者在解决问题过程中记录眼动,随后根据回放报告思考过程,克服了并发出声思考法在高需求情况下的局限性。
#### 4. 实验流程
```mermaid
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A([开始]):::startend -->
```
0
0
复制全文
相关推荐









