机器学习方法论软件工具的需求分析与探讨
立即解锁
发布时间: 2025-08-23 01:05:18 阅读量: 1 订阅数: 3 

### 机器学习方法论软件工具的需求分析与探讨
#### 1. 从需求到面向对象类/实体关系实体
基于相关需求,可识别出以下一组类(或关系实体):
- **项目(Projects)**:系统需维护一个持久的项目列表,其中部分项目正在进行,部分已完成,部分处于搁置状态。
- **团队成员(Team Members)**:团队成员有直属经理、一系列技能及相关可用性信息,以及在项目中的一组角色。
- **任务(Tasks)**:任务是项目计划中工作包的最终组成元素。
- **角色(Roles)**:角色是团队成员在特定项目中扮演的职能(或一组职能),例如“技术主管”“项目经理”“数据科学家”“软件工程师”或“数据质量专家”。
- **技能和技能水平(Skills and Skill Levels)**:团队成员可拥有特定的技能组合(每个技能处于特定水平),项目也可关联一组所需的技能和水平。
- **利益相关者(Stakeholders)**:项目经理可创建和维护利益相关者列表(通常是项目团队外部人员),他们可能是外部或内部人员,对项目感兴趣。项目的执行赞助商(支付项目费用的人)就是一个典型例子。系统应维护RACI信息(一种与利益相关者沟通的分类方式)。利益相关者可向项目经理提问,也可查看多个进度仪表盘之一。
- **模型(Models)**:项目依赖一个或多个机器学习组件或模型,每个模型有不同的迭代版本。模型有技术简称和描述,以及指向代码和用于推导它的训练数据的链接。模型可在数据集上运行(实验),产生实验结果。模型性能可在时间轴上绘制,记录质量方面的进展(时间 𝑡 显示当时可用的所有模型,并挑出最佳模型)。
- **实验(Experiments)**:一个项目通常每个机器学习组件包含多个实验。一旦针对一个或多个数据集的一个或多个折叠运行模型类型的代码,实验就开始了。当分配的实验时间用完、达到足够的质量,或者(最常见的)投入的努力回报递减时,实验可以结束。
- **数据集(Datasets)**:项目使用一个或多个数据集。数据集可以是人工标注的,也可以是“原始”的。数据集可以作为输入或黄金数据的来源,用于训练或评估。
- **方法论(Methodologies)**:方法论以有向图的形式定义一组阶段以及它们之间可能的转换。每个阶段可能包含活动信息和其他元素,如问卷。
- **文本工件(Textual Artifacts)**:文本工件是一个文本文档(无论文件格式如何),主要自动上传,用作整个项目的文档,或作为方法论某个阶段的结果(可交付成果)。可以将其视为文件附件。
- **阶段(Phases)**:阶段是方法论中的一个状态(与一组活动和项目子目标相关的时间点),它可以递归地包含其他阶段。
- **活动(Activities)**:活动是在项目处于方法论的某个特定阶段时,团队成员预期要执行的操作。
- **问卷(Questionnaires)**:问卷是与某些方法论相关的一组预定义问题,以及与项目相关的特定答案。它们有助于使项目中的假设和决策明确、透明且可共享。
- **代码(Code)**:模型实现的程序代码不包含在系统中,而是作为指向源代码变更集的链接(例如,在Git或类似的版本控制系统中)被引用。
以下是这些类的简单关系表格:
| 类 | 相关描述 | 关联对象 |
| --- | --- | --- |
| 项目 | 有不同状态的项目列表 | 团队成员、任务、模型等 |
| 团队成员 | 有经理、技能、角色 | 项目、任务、角色 |
| 任务 | 项目计划的组成元素 | 项目、团队成员 |
| 角色 | 团队成员在项目中的职能 | 团队成员、项目 |
| 技能和技能水平 | 团队成员和项目的技能相关 | 团队成员、项目 |
| 利益相关者 | 对项目感兴趣的人员 | 项目、项目经理 |
| 模型 | 项目依赖的机器学习组件 | 项目、数据集、实验 |
| 实验 | 基于模型和数据集的操作 | 模型、数据集、项目 |
| 数据集 | 项目使用的数据集合 | 项目、模型、实验 |
| 方法论 | 定义项目阶段和转换 | 项目、阶段、活动 |
| 文本工件 | 项目文档或阶段成果 | 项目、阶段 |
| 阶段 | 方法论中的状态 | 项目、方法论、活动 |
| 活动 | 团队成员执行的操作 | 团队成员、阶段、项目 |
| 问卷 | 辅助项目决策的问题集 | 项目、方法论 |
| 代码 | 模型实现代码的链接 | 模型 |
#### 2.
0
0
复制全文
相关推荐










