【R语言数据科学】
文章目录
- 【R语言数据科学】
- 统计学习导论(ISLR) 第六章变量选择课后习题
-
- 8.我们需要生成一个虚拟数据,然后利用这个数据来衡量变量选择
- 9.
-
- (a) 将数据集分为训练集和测试集。
- (b) 在训练集上用最小二乘法拟合一个线性模型,并报告得到的测试误差。
- (c) 在训练集上拟合一个岭回归模型,通过交叉验证选择λ。通过交叉验证。报告获得的测试误差。
- (d) 在训练集上拟合一个Lasso模型,通过交叉验证选择λ。报告获得的测试误差,以及非零系数估计的数量。
- (e) 在训练集上拟合一个PCr模型,通过交叉验证选择M。报告获得的测试误差,以及通过交叉验证选择的M值
- (f) 在训练集上拟合PLS模型,通过交叉验证选择M。报告获得的测试误差,以及通过交叉验证选择的M值。的测试误差以及通过交叉验证选择的M值。
- (g) 对获得的结果进行评论。我们能多准确地预测收到的大学申请的数量?这五种方法产生的测试误差是否有很大的区别
- 10.
- 1