excel数据 散点图 直接求得最佳拟合线,相关性。
书籍网盘地址:
链接:https://pan.baidu.com/s/1Bm2nohTSXZCTY9WGp9ihlw
提取码:rnif
原理:
1、体现两个变量之间的关系,叫散点图或散布图。
2、散点图显示出数据对之间的相关性。
3、散点图上数据点几乎呈直线分布,则相关性为线性。
4、正相关、负相关、不相关:
5、两个变量之间存在相关关系并不一定意味着一个变量会影响另一个变量,也不意味着二者存在实际关系。
6、相关性度量关系为线性关系,但并不是所有关都是线性的。
7、最佳拟合线预测数值。
8、SSE:误差平方和。
9、SSE为最小的直线式,其中y=a+bx,可得到a、b最优值,可得到最佳拟合公式。
10、斜率计算
11、最佳拟合线最好穿过x、y的均值,故求截距。
12、总结
最小二乘法:
13、最佳拟合线的准确性—回归线的相关性强度—相关系数
相关系数介于-1和1之间,描述了各个数据点与直线的偏离程度,字母r表示。
r为负,两个变量存在负线性相关;
r为0,不相关;
r为正;两个变量存在正线性相关。
向0靠近,线性相关性减弱。