什么是正态分布? 一、正态分布到底是啥?正态分布(Normal Distribution),又叫高斯分布,是统计界的“顶流”。它的曲线形状像个钟,所以大家又叫它“钟形曲线”。 它的图像是左右对称的; 峰值出现在均值 μ 的位置; 曲线越高越瘦,说明数据越集中; 越胖越扁,说明数据分散得厉害。 上专业定义: 正态分布是一种连续型概率分布,由均值 μ 和标准差 σ 完全决定,其概率密度函数如下: f(x)=1σ2πe−(x−μ)22σ2f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{- \frac{(x - \mu)^2}{2\sigma^2}} 别怕这个公式!一句话翻译就是: 我们通过平均值 μ 决定“山峰”位置,标准差 σ 决定这座“山”是瘦高型还是胖矮型。 二、正态分布的5个关键特征 1.左右对称,峰值居中 正态分布的最典型特征就是对称性。以均值 μ 为中心,左边和右边的分布形状 2. 68-95-99.7法则:σ区间的魔法 标准差 σ 是描述数据分散程度的关键指标。正态分布里,它有个非常“神奇” 68% 的数据在 μ ± 1σ 之间; 95% 的数据在 μ ± 2σ 之间; 99.7% 的数据在 μ ± 3σ 之间。 也就是说,如果你搞清了 μ 和 σ,几乎就掌握了整个数据集的“命运”。 3. 越集中,标准差越小 标准差小,说明数据集中,“峰”更尖——这叫“精度高”;反之,σ大说明数据分散,控制起来就麻烦多了。 质量人最怕的,就是σ过大导致产品超出规格上下限。 4. 面积恒等于1,代表总概率 在正态分布的图像下,整条曲线包围的“面积”就是1,代表“所有可能的概率”。 这也是为什么我们可以用这个模型去推算某个范围内出现某个结果的概率(比如合格率)。 5. 均值=中位数=众数 正态分布的另一个“独门绝技”:三值重合。 这意味着:数据分布最密集的点(众数)、中间值(中位数)和平均数(均值)是同一个数字。你在哪看到这仨不一样,那就不是正态分布! 三、标准正态分布 当 μ = 0,σ = 1 时,就成了标准正态分布,记作 N(0,1)。 这个“标准款”有什么好处呢? 所有正态分布都可以换算成 N(0,1) 来处理; 使用 Z 分数(z = (x - μ)/σ)统一各类分布; 各种统计工具都内置标准正态分布表,查起来贼方便。 四、为什么正态
00:00 / 05:01
连播
清屏
智能
倍速
点赞40
00:00 / 22:37
连播
清屏
智能
倍速
点赞1247
00:00 / 13:45
连播
清屏
智能
倍速
点赞542
00:00 / 08:01
连播
清屏
智能
倍速
点赞2103
00:00 / 03:03
连播
清屏
智能
倍速
点赞1151
00:00 / 12:18
连播
清屏
智能
倍速
点赞1422
00:00 / 04:54
连播
清屏
智能
倍速
点赞734
00:00 / 02:08
连播
清屏
智能
倍速
点赞40
00:00 / 23:26
连播
清屏
智能
倍速
点赞19