数据是当今我们随处可见的一个词。一般来说,数据是事实、信息和统计数据的集合,可以采用多种形式,例如数字、文本、声音、图像或任何其他格式。
在本文中,我们将了解 什么是数据、 数据的类型、 数据的重要性以及 数据的特征。
一、什么是数据
根据牛津大学的说法,“数据是不同的信息,通常以特殊的方式格式化”。数据可以被测量、收集、报告和分析,因此通常使用图表、图像或其他分析工具将其可视化。原始数据(“未处理的数据”)可能是在研究人员“清理”和纠正之前的数字或字符的集合。必须对其进行纠正,以便我们可以消除异常值、仪器或数据输入错误。数据处理通常分阶段进行,因此一个阶段的“处理后的数据”也可以被视为后续阶段的“原始数据”。现场数据是在不受控制的“现场”环境中收集的数据。实验数据是在科学研究观察中产生的数据。数据可以通过以下方式生成:
- 人类
- 机器
- 人机结合
它通常可以在任何以结构化或非结构化格式生成和存储信息的地方生成。
二、什么是信息
信息是经过处理、组织或结构化的数据,使其有意义、有价值和有用。它是被赋予背景、相关性和目的的数据。它提供可用于决策、解决问题、沟通和各种其他目的的知识、理解和见解。
三、为什么数据很重要
- 有助于做出更好的决策
- 通过查找表现不佳的原因来帮助解决问题
- 有助于评估绩效
- 有助于改进流程
- 有助于了解消费者和市场
四、数据类别
数据可以分为两个主要部分:
4.1 结构化数据
这类数据将数据组织成特定的格式,便于搜索、分析和处理。结构化数据存在于关系数据库中,其中包括数字、数据和类别等信息。
4.2 非结构化数据
非结构化数据不符合特定的结构或格式。包括一些文本文档、图像、视频和其他未经额外处理就不易组织或分析的数据。
五、数据类型
一般来说,数据可以分为两部分。
5.1 类别数据
在分类数据中,我们看到具有已定义类别的数据,例如:
- 婚姻状况
- 政治党派
- 眼睛的颜色