线性回归分析——高尔顿数据集更正版
一、“父亲—儿子”身高数据回归分析
1、做数据处理,将数据重复项删除;完成‘儿子’分类
2、做回归处理
做好回归处理后我们可以看到,父亲与儿子的身高是成正比的(即父亲越高儿子越高)
同时我们所做的回归的方程R^2=0.9495是一个非常好的模型,P值也很小,因此数据模型符合了归回。
二、“母亲—儿子”身高数据回归分析
1、做数据处理,删除重复项;分类儿子身高
2、做归回分析
从图中可以看出,母亲身高与儿子的身高成正相关,但是相关性R^2并没有父亲的大,也符合了我们日常生活的认知,父亲对儿子的身高影响较大。同时P值也在一个合理的范围内,因此模型可以成立
如果不知道如何做回归分析,可以参考以下博客