2.1 时间序列预测模版
模版包含不同的步骤:
1).业务理解和性能度量
2).数据摄取
3).数据探索和理解
4).数据预处理和特征工程缩进
5).模型构建和选择
6).模型部署
7).预测解决方案的接受程度
2.1.1 业务理解和性能度量
2.1.2 数据摄取
数据摄取有三种不同的方法:批处理、实时处理和流处理。
2.1.3 数据探索与理解
关于原始数据质量的几个考虑因素:
缺失值
测量准确率
测量时间
同步
延迟
2.1.4 数据预处理和特征工程
特征可以是基于数据集的两种主要类型:
1).固有的原始特征
2).衍生特征
a. 时间驱动特征:一天中的时间、星期、日期、月份、周末、假日、傅里叶项
b.独立的测量特征:滞后特征,长期趋势,
c.依赖特征
2.1.5 模型构建和选择
数据集分割:训练集、验证集和测试集
2.2 需求预测建模技术概述
a.移动平均(MA)
b.指数平滑
c.差分自回归移动平均(ARIMA)模型
d.一般多元回归
深度学习神经网络有三个主要的内在能力
1.可以从输入到输出的任意映射中学习
2.支持多种输入和输出
3.可以自动提取跨长序列的输出数据中的模式
2.2.1模型评估
平均绝对偏差(MAD)
平均绝对偏差(MAD)/平均比
几何平均相对绝对误差(GMRAE)
对称平均绝对百分比误差(SMAPE)
2.2.2 模型部署
2.2.3 预测解决方案的接受程度
客户验收阶段的任务
系统验证:确认部署的模型和管道是否满足客户的要求。
项目移交:将项目移交给将在生产中运行系统的实体。