七周成为数据分析师 | 统计学

本文介绍了统计学的基础概念,包括描述统计学中的分类数据描述统计、数值数据描述统计等内容,并探讨了推断统计中的贝叶斯定理。适用于初学者了解统计学的基本原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一.描述统计学

1.分类数据描述统计

频数统计:单纯对各分类计数即可

频数百分比:单纯对各分类计数即可

2.数值数据描述统计

统计度量

平均数:表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数

中位数:是按顺序排列的一组数据中居于中间位置的数

众数:是指在统计分布上具有明显集中趋势点的数值,代表数据的一般水平

分位数:是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(二分位数),四分位数,百分位数等

方差:描述数据的离散程度

标准差:方差开平方

数据标准化:z-score

切比雪夫定理:设X是一个随机变数取取区间(0,)上的值,F(x)是它的分布函数,设Xα(α >0)的数学期望M(Xα )存在,a>0,则不等式成立。

图形

箱线图:是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间

直方图:是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况

 

二.推断统计

贝叶斯定理:在信息和条件有限的情况下,基于过去的数据,通过动态调整的方法,帮助我们一步步预测出事件发生的接近真实的概率。其基本思想是:后验概率 = 先验概率 * 调整因子,其中,先验概率就是在信息不完整情况下做出的主观概率预测,调整因子则是在信息收集不断完善的过程中对先验概率的调整,后验概率则是经过调整后最终作出的概率预测

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值