粉丝1.6万获赞3.7万

大家好,这节课我们来看一下正态分布的方差、标准差和六八九五九九法则。本节课用到的数学知识不会超过初中水平,请大家放心观看。 我们先来看一下方差,方差是用来衡量总体中所有的数偏离平均数的程度。假设一个总体有 n 个数,平均数为六,大家都会算,就是加起来除以 n, 每个数和六的差值有正有负,直接加在一起就抵消了。所以我们取差值的平方,然后再相加,最后除以 n, 就可以看出总体偏离平均值六的程度了。 总体的方差,英语叫做 vrrys, 记住小写希腊字母西哥们的平方方差在开方就是总体的标准差。 我们在之前课程中通过加热顿板演示了正态分布的形成。今天我们再用加热顿板来演示一下如何计算方差和标准差,并引入正态分布的六八九五九九法则。 我们用加热盾板做一次十行钉子,一千零四颗豆子左右,概率随机的实验结果如图所示,呈现正态分布。柱状图的高度数值代表掉入这个槽子中的豆子。那么如何根据柱状图来计算方差呢? 首先我们要对落入不同槽子中的豆子进行复制,例如选择最高的一个注状图,把落入这个槽子中的每一个豆子复制为 a, 这个槽子左边第一个槽子中的豆子复制为 a 减一, 左边第二个槽子中的豆子复制为 a 减二,以此类推。然后落入 a 槽子,右边第一个槽子的豆子 复制为 a 加一,右边第二个槽子里的豆子复制为 a 加二,以此类推。这样落入每个槽子里的豆子都有了一个数值,我们就可以计算方差了。下面我们用 excel 表来展示这个计算过程。 这一列我们填入每个槽子落入的豆子数量,这和我们的实验结果排列是一致的。这一列我们给每一个豆子复制豆子数量最多的一个槽子复制 a, 然后向上和向下复制,分别减一递减和加一递增。 我们先计算总体一千零四个豆子的平均值六,这需要把所有一千零四个豆子的负值全部相加。例如,这一个草字里有九个豆子,每个豆子复制为 a 减三,那么这个草字里所有的豆子复制相加为九乘以 a 减三等于九乘以 a 减去二十七。 再例如,这个槽子里有六十三个豆子,每个豆子复制为 a 加二,那么这个槽子里所有豆子复制相加为六十三,乘以 a 加二等于六十三,乘以 a 加一百二十六。 我们把每一个槽子的所有豆子的负值相加计算出来,然后再把所有槽子的负值相加,得到一千零四, a 减去一百七十七, 除以一千零四,得到平均值六等于 a 减去零点一七六。这个六就是这次实验正态分布的对称轴的位置,可以看出对称轴比最高柱子三百三十六稍微偏移左边一点点,这个偏移量就是负的零点一七六。 下面我们再计算方差和标准差,这一列是每个豆子与没有的差值,可以看出我们给最高柱子负的值 a 在这里全部消除了。所以说我们给 给豆子复制的具体数值都是无所谓的,有所谓的是设定槽子间隔的数值。本例中设定槽子间隔的数值为一, 这一列我们计算每个豆子与六的差值的平方,这一列我们计算每个槽子中所有豆子差值的平方的和。这里把所有槽子相加,再除以 n 得到方差,这个的平方等于一点三五零四开平方得到标准差,这个码等于一点一六二一。 请注意,本例中我们把柱子间隔设为一才得到这个标准差。假如我们把柱子间隔设为更大或更小, 图出的方差会相应的更大和更小,但是并不影响我们马上要得出的一个结论及六八九五九九法则。下面我们在正在分布图上画几个区间。第一个区间是对 分轴两侧各一个四个码的区间及从六减四个码到六加四个码,数值上为,从 a 减一点三四到 a 加零点九九。 我们想看一下总共一千零四个豆子会有多少个豆子落入这个区间,因为区间端点不是整数,我们在计算落入区间的豆子的数量时做了一个进次及计算图中阴影部分的面积。 柱状图的宽度都是一高度及豆子个数,我们根据区间端点的数值很容易计算出这个阴影面积,如图所示, 那么三部分加起来约等于六百七十个豆子,占总体的百分之六十七左右。下面我们看第二个区间对正轴两侧各两个四个码的区间及从六减二四个码到六加二四个码,数值上为,从 a 减二点五零到 a 加二 点异物。这里面除最右边注册的几部分需要进一次计算,其他注册都是完整的。 我们算出阴影部分的面积为九百五十七颗豆子,占总体的百分之九十五点七左右。最后我们看对称轴往两边三个四个码的区间及从六减三四个码到六加三四个码, 数值上为从 a 减三点六六到 a 加三点三一,我们扔。通过进四计算得出,这个区间总共有九百九十九颗豆子,占总体的百分之九十九点九左右,也就是几乎包括了全部豆子。 我们通过比较得出,在对称轴六左右各一个标准差的范围内,包含了总体大概百分之六十七的豆子。在没有左右各两个标准差的区间内,包含了总体大概百分之九十五点七的豆子。 假如我们扩大到六左右三个标准差的区间内,就包含了百分之九十九几乎全部的豆子。 到现在为止,我们只进行了一次加热盾版实验,上面的结果并不能说明什么,下下面我们再多进行几次实验,看是否能找到规律。 我们再进行一次试行钉子一千颗豆子的实验,结果如图所示,平均值 m 等于 a 加零点五七方差四个马,平方等于一点七零九二,标准差四个马等于一点三零七四。 对阵轴谬左右一个西个门区间内有六百六十六颗豆子,占总体的百分之六十六点六左右两个西个门区间内有九百四十二颗豆子,占总体的百分之九十四点二左右三个西个门区间内有九百九十七颗豆子,占总体的百分之九十九 点七。我们把这两次实验进行对比,发现豆子在三种区间分布比例十分相似。 上面两次实验都是十行钉子一千颗豆子,下面我们再来做两次二十行钉子的实验,如图,这次实验是二十行钉子、一千颗豆子。方差、标准差和三个区间的端点 和落入三个区间的豆子数量都通过 excel 计算出来。我们发现三个区间对应的总体百分比分别是百分之六十六点八、百分之九十五点一和百分之九十九点九。 最后我们再做一次二十行钉子、一千颗豆子的实验,三个区间对应的总体百分比分别是百分之六十七点一、百分之九十五点三和百分之九十九点六。我们把这四个图放在一起比较,这个规律就非常明显了。虽然 是四个不同的正态分布,但只要按照对称轴左右一个标准差、两个标准差、三个标准差的方法去划分区间的话,总体落入各个区间的比例是一致的。下面我们给出数学上的精确描述, 若一个总体服从正态分布,不论其标准差是多少,以对称轴谬为中心。向两边各一个标准差的区间范围内,将会包括整个总体百分之六十八的数据。 向两边各两个标准差的区间范围内,将会包括整个总体百分之九十五的数据。向两边各三个标准差的区间范围内,将会包括整个总体百分之九十九点七的数据。通俗的说,这叫做正态分布的六八九五九九点七法则。 那么这个法则有什么用呢?这个简直不要太有用了,比方说你开了个服装厂,你是厂长,你们服装要出口到美国, 那大码和小码的服装肯定不能生产同样的数量。作为厂长,你学过我前面的几节课。你知道不管哪国人,只要人足够多,身高尺寸肯定都是服从正在分布的。但美国人平均身高没有和别的国家的没有肯定不一样。 你就在美国做了很多次随机抽样,当然男的女的你得分开统计,然后你通过抽样样本估计出了美国人身高的总体均值,没有和标准差四个码有了没有和四个码,就等于说你就可以把身高尺寸的正态缺陷完美的画出来了。 画出来后,你就大胆的按照每个尺寸的数量去生产衣服就行了,不用担心最后哪个尺寸造多了,哪个尺寸造少了。 好,这节课就讲到这里,希望大家通过对正在分布方差、标准差和六八九五九九法则的学习,都可以去创业,开工厂,科学组织生产,然后卖大单,赚大钱。不谢,下节课再见!

大家好,上节课我们讲解了 t 临界值表,这节课我们来学习一下 p 值。 p 值或者 p w 是每个统计学初学者都绕不开的一道坎。 p 值到底是什么?其实上节课中我们已经提到了, 例如在这个自由度等于十九单边右尾的体检验中,我们已经人为规定了右尾是极端的方向。 当然你心中应该知道,单边右尾代表的是 h 零为六小于六零。我们抽样一次获得一个 t 值, t 等于一点七二九,在 t 分布区线上, t 等于一点 七二九的地方画一条线,这条线朝更极端的方向 t 分布区线下所包含的硬部分的面积就是皮质 本立中,屁直等于零点零五,所以一言以必之,屁直就是抽样一次算出屁直画一条线,这条线到极端方向应部分的面积。 如果 p 小于显著水平二十,法则拒绝 h 零。如果 p 大于二十,法则接受 h 零。好,这节课讲完了, 当然跟大家开玩笑的,不过 p 值也真没什么可讲的了,我们从第一堂课的加尔顿板正态分布,到后来的均值抽样分布,都一直在给大家灌输极 和尾巴尖的概念。直到现在,我们终于对这个极端到底有多极端,尾巴到底有多尖给出了一个亮化的数字,那就是屁直。相信大家应当不难接受。 显著水平阿尔法只不过也是一个特殊的屁纸。屁和阿尔法的关系相当于考试名次和排名录取线的关系。 例如一次考试一千人参加,每个人都会有个成绩名次,这个名次就相当于壁纸。 而考试只选拔录取前五十名,那么这个前五十名就是排名录取线相当于阿尔法。假如你的排名比录取 比排名还要高的话,就说明你的成绩越优异越显著。所以考试排名和排名录取线都是名字, p 和阿尔法都是概率。 大家在网络上搜索可以看到 p 值的这样的定义, p 值就是当原假设为真实,比所得到的样本观察结果更极端的结果出现的概率。 英语的说法是, p values and the assumption that now hypothesis is true the probability of obtaining test results at least as extreme as the results actually observed。 当然,你可能 会搜到其他的定义,但这种说法是我最认同的。乍一看这个定义还是很唬人的。假如我在第一节课就搬出屁直的这个定义,相信绝大多数同学都看不懂。 这里面涉及了原甲设样本极端的概念。我个人很讨厌在给一个术语下定义时,引入其他更陌生的术语来解释这个术语, 所以在之前的课程中,我们把原甲设样本极端这几个概念都讲了。特别是极端这个词, 我在加尔顿板实验室就开始不断引入了,为的就是大家到今天这个关键时刻,你不会对他感到陌生,并且对极端有了非常感性的理解。下面我 我们来咬文嚼字一下,把这个较为学术的屁直的定义和我们之前课程中学过的内容来对应一下。我们回到之前关于大一和大二高考英语成绩平均分的例子, 在这个例子中,我们假设已经知道了大二的成绩总体 excel 表,并可以计算得到大二的平均分。没有大二,我们的原甲设 h 零为没有大一等于没有大二。 冤。假设为真的话,我们粗略的认为大一和大二是同一个总体,所以大一和大二的均值抽象分布是完全一样的分布。为什么说粗略认为,因为为了简化讲解,实际上有 同学已经在留言中问过我了,大一和大二的均值相等,但大一和大二总体的方差不一定相等,所以均值抽象分布不一定完全一样。 这位同学说的很对,事实上,在真正的体检验中,我们还需要进行方差其性检验, 但本课程是通俗入门课,我们故意简化,如果有可能的话,我会在入门课讲完后继续开设进阶课程。当然这是后话。 如果原甲设为真,那么大一和大二的均值抽样分布完全一样,这时需要特别注意,原甲设是双边结验,此时我们抽样一次算出均分为一百四十一分,这个 抽样只对应了双边中右边的一条线,还应当找出左边的那条线。根据对称轴是一百三十七分,抽样所得的一百四十一分是从对称轴往右边尾巴尖 第四个柱状图的位置,那么左边这条线也应当是从对肾轴往左数第四个柱状图的位置是一百三十三分。 所以,虽然抽样得到的样本是一百四十一分,因为是双边,姐姐你心中还要有个对称轴,另一边的假想样本一百三十三分, 所以比样本含更极端的结果包括两个部分,右边是一百四十一分,一百四十二分、一百四十三 分等等,但到一百四十三分,抽样次数就为零了,所以比一百四十三分再高的均分的概率都是零。 那么右边的累积概率是百分之一点一,零加百分之零点一,零加零等于百分之一点二。 同样的,左边的累计概率是百分之零点二,零加零等于百分之零点二。那么本次抽样一次得均分一百四十一分的双边 p 之为两边加起来百分之一点二加百分之零点二, p 等于零点零一四,得出了抽样疑似的 p 值。下一步就是和显著水平阿尔法比较一下, 如果一开始设置的阿尔法等于零点零五,则 p 小于二法拒绝 h 零。若一开始设置的阿尔法等于零点零一,则 p 大于二法接受 h 零。 这里可以看出,用屁直来进行假设检验的好处就是,不用再去比较什么临界之,也不用再画出什么拒绝句了。拿屁和埃尔法进行比较,两个纯小数,谁大谁小一目了然。 当然,上面需要说明两点,第一,这是一个粗略的抽样一千次形成的均值分布。理论上,一百四十一分和一百三十三分是以一百三十七分为对称轴的,两端的累计频次应该 是相同的。但本例中,右边是百分之一点二,左边是百分之零点二,两边不相等。第二,抽样均分本身的频次被累计包含到屁纸里面去了。 这是因为柱状图是一个柱子,不是一条线,一条线的面积为零,可以忽略,但一根柱子的面积是很多的,不能忽略。 在中文定义中,没有突出包含抽样结果的意思,但在英文定义中, at least as extreme as 是包含了抽样样本的, 执意过来是至少和抽样结果一样极端,就很显然的包括了抽样样本了。下面我们再把屁直的概念放到 真实的体检验中来对应一下。例如这是之前我们讲过的比较稻田 a 和稻田 b 亩产量的单边体检验。原甲设 h 零为谬 b, 小于谬 a, 则拒绝与应该在单边右尾,也就是说右尾是极端方向。 假设根据样本算出来的 t 值是一点六,那么在这个粗略的气值分布表中,在 t 等于一点六这里画一条线, 从一点六到更极端方向的累计概率是,零点零二加零点零零九加零点零零四加零点零零二加零等于零点零三五。于是此次单边右尾检验的 p 值为零 零点零三五。那么假如事先规定的阿尔法等于零点零五,则 p 小于二法,于是拒绝 h 零。假如阿尔法等于零点零一,则 p 大于二法,于是接受 h 零。 当然,我们这个演示用的气质表实在不够精确,可能会导致错误的结论。 我们用上节课告诉大家的这个网站来算一下精确的配置。首先由原甲设 h 零中的小于号确定是单边右边检验,于是这里选 red tail 自由度,这里输入十九,然后 ty 六,这里输入一点六。这时程序算出了 p 等于零点零六三,并在 t 分部曲线中做出了硬部分的面积。 现在我们知道了 t 等于一点六对应的精确的 p 值为零点零六三。无论二法等于零点零五,还是二法等于零点零一, p 都大于二法,于是我们接受 h 零, 这说明我们从那个粗略的细支表画出来的 p 等于零点零三五,还真是不靠谱。 这里也需要说明两点,第一,气质画出的硬部分的分界线是一条线,这条线本身是没有面积的,直线的面积为零, 所以可以说这个硬面积是包含了 t 等于一点六的。第二,可能有同学会问,因为 t 值公式比较简单,我们用高级点的计算器就可以把 t 值算出来,那么 p 值 可以直接算出来吗?答案是可以,但不建议用手动计算,这个是 p 值的计算公式,手动算应该是不大容易算出来吧。 这也就是为什么在计算机没有普及前, t 临界值表存在的意义。有了临界值表,我们就可以通过较为简单的公式来计算 t 值,通过比较 t 值和临界值来决定是否拒绝 h 零。 但现在计算机普及发达了,可以直接帮我们用这个复杂公式算出壁纸, 那么便可以直接拿 p 值和显著水平阿尔法进行比较,从而更简单的决定是否拒绝 h 零。最后,请大家继续注意,同样的 t 等于一点六, 但假如尾巴方向不一致的话,算出来的 p 值是不一样的。如图所示,单边右尾 t 等于一点六的 p 值为零点零六三,但是单边左尾 t 等于一点六的 p 值为零点九三七。 细心的同学会发现,两个 p 值加起来正好等于一,这在图中也是很方便直观理解的。 单边右尾时,极端方向为右边,那么按照 p 值的定义,至少比一点六还极端的硬面积,应该是从 t 等于一点六到右边的尾巴尖 算出来是 p 等于零点零六三。那么单边左尾时,极端方向为左边, 还是在替等一点六这一条线,但比一点六还极端的硬面积就变成了左边的硬面积。 根据 t 分布区线下整体印部分面积等于一,也可以得知,此时的 p 等于一,减去零点零六三等于零点九三七。 所以在使用统计软件计算 p 之时,都要明确设定你的假设检验到底是双尾还是单尾。单尾的话,具体是左尾还是右尾, 不同的尾巴方向代表着你的原甲射中的大于号,小于号还是等于号,这关乎 p 值的计算结果和结论的正确与否。例如,这是微软 excel 自带的计算体检 检验 p 值的函数 t 点 test, 在使用时必须指明是单位还是双位,至于是左位还是右位,则需要通过这两个数列的先后顺序来决定。 因为这个函数要求二一减去二二必须是正数。这其实就是规定了此函数只能检验右尾,但假如你非要检验左尾的话,把二一和二的顺序倒过来就行了。 再例如,这是一款免费开元的统计软件二,其中 t 检验函数中有个参数叫 alternative, 直译是备用的意思,也就是对立假设 h e 的意思。这个参数有 greater less 或 tool sided 三个选项,分别对应着右尾、左尾和双尾检验。本课程后续的立题计算中就选用啊这个软件进行操作,到时会详细讲解。 所以说,通过软件计算配置时也一定要把原甲设 h 零写正确。 h 零中的大于号,小于号还是等号,一定要认真仔细的考虑,否则你可能算出一个零点九级的很大的屁质,令自己哭笑不得。 最后我们再来复习一下 p 值的含义和使用。通俗的讲,在 t 分布区线下,从抽样得到的 t 值画一条线,当然双边检验是两条线,这条线 到极端方向的应面积就是 p 制。如果 p 大于二法则接受 h 零。如果 p 小于二法则拒绝 h 零。 我们之前讲过的假设检验的基本套路是,若想得到一个结论 h 一,首先要写出这个结论的对立结论,并将其作为原假设 h 零,然后通过抽样数据来拒绝 h 零,从而正得 h 一。 如此看来, p 值越小越容易拒绝 h 零。所以一般来说, p 值越小越好,最好是越接近于零才更好。所以大家多文献的时候经常会看到根本没有提到显著水平阿尔法,而是直接展示 p 值 有多接近于零。大家注意,因为屁直作为一个概率永远是小于一的,所以屁直是纯小数,因此小数点后的零越多,屁直就越接近于零。文献中经常会用星号来表示屁直有多接近于零, 例如这是一些常见的用星号表示屁直的方式。星号越多,屁直小数点后的零一般也越多,屁就越小,就越有底气拒绝 h 零。 以上就是屁直的讲解,当然大家在网上搜索的话,还会看到屁直和两个术语, 第一类错误,第二类错误的关系。有的说法还会把屁直的定义和第一类错误联系起来。下节课我们简短的来聊一下第一类错误和第二类错误,我们下节课见。

要统计学入门,就必须先了解正态分布。正态分布是最重要的一个分布,也是统计学的基础。正态分布曲线是自然规律的一种呈现, 在对大量的随机事件进行统计后,发现正态分布曲线往往是必然的一种结果。正态分布曲线呈现一种铃铛形状,英语里叫 bell shipped curve。 这个公式是正态分布曲线的概率密度函数。大家不用害怕,本节课不要求大家掌握这个公式,本课程系列只对公式中几个参数的含义进行感性理解。 我们看到公式里有一个派,圆周率。你也许感到奇怪,正太曲线里没有圆弧或圆形啊,怎么会出来个派呢?这个问题我也回答不了,我只能说这就是数学的神秘之处, 也是发现这些公式的数学家的伟大之处。我们向那些骨灰级的数学家们致敬。 发现正泰分布公式的数学家是德国的高斯,所以正泰分布也叫高斯分布。高斯对正泰分布的应用与发现做出了人类发展史上最伟大的贡献。 这张图片是德国某个版本的史马克纸币中的高斯化背景,里面还有正太分布曲线和概率密度公式。 我们讲统计,也就肯定讲到概率。提到概率,大家肯定想到抛硬币。大家写英语作文时肯定都背过 every coin has two sides 这么一个陈词滥调。 抛一枚均匀的硬币,得到正反面的概率都是百分之五十。那么抛硬币与正态分布有什么关系呢?假设我们抛 同一枚均匀硬币,得到正面,我们用空心圆圈表示。得到反面,用实心圆圈表示。我们可能得到这么一个结果,共有六次正面,四次反面。我们把这抛十次硬币这样一件事,即为第一组实验。 我们再抛十次同一枚硬币,即为第二组实验,得到七次正面,三次反面。 假如我们进行了一百组这样的实验,得到一百个结果,我们把一百个结果中得到的正面数量都记下来,分别为七、九、四、七等等,共一百个数据。这一百个数据的取值范围是零到十的整数。 现在我们把这一百个整松的零到十出现了次数,用坐标轴上的柱状图来表示,正面次数零出现了零次, 所以什么都不画正面。次数一出现了一次,于是在坐标轴一这个位置画一个高度为一的柱状图,次数二出现了六次,就在坐标轴二这个位置画一个高度为六的柱状图,依次类推。 柱状图画完后,只出现一次正面的概率是百分之一,出现两次正面的概率是百分之六,三次正面的概率是百分之十二,四次正面的概率是百分之二十三,以此类推。然后我们发现这个柱状图的轮廓正是一个正态分布曲线。 实际上,在概率统计学中,抛十次同一枚硬币的实验,叫做十重伯努力实验。我们进行了一百组这样的实验,可以称为一百次十重伯努力实验。数学定理表明,大量的恩重伯努力实验的 结果就能够产生正态曲线。恩宠不努力实验这个概念不要求大家掌握,因为读起来和理解起来都比较拗口。但大家既然学了这门课,知道这个概念还是有好处。 以后有人跟你聊抛硬币时,你可以说,嗯,同级学上这个叫恩宠不努力实验,这样显得比较专业。 事实上,可以用更简易的一种方式来进行恩宠不努力抛硬币实验。假设有一颗均匀光滑的圆形豆子和一只均匀光滑的圆形钉子,豆子落在钉子中间后,会向左或向右落下左右概率都是百分之五十。 那么一个豆子落下,就可以看做抛了一次硬币,豆子向左或向右,就可以看做硬币的正面或反面朝上。假设我们有食行钉子,然后放落一颗豆子,豆子下落碰到 每一个钉子向左向右的概率都是零点五。十行钉子下面有十一个槽子,我们可以根据豆子落入哪个槽子来推断豆子经过十行钉子时几次向左,几次向右。例如, 假如一颗豆子落入中间槽子,那么这颗豆子肯定是五次向左,五次向右。假设向左代表抛硬币得到正面,向右代表抛硬币得到反面。如果一颗豆子经过适行钉子落入最左边第一个槽子, 我们可以看做抛了十次硬币,共出现了十次正面。假如落入第二个槽子,则共出现九次正面,一次反面,一次。类推,假如落入最右边的槽子,则出现了十次反面。下面我们用虚拟仿真程序来做这个实验,我们设定十行钉子落下一百颗豆子, 随着越来越多的豆子落下,槽子中的豆子逐渐呈现一个轮廓,这相当于做了一百次十重不努力抛硬币实验。槽子中的豆子轮廓正是一条正态分布曲线,和我们抛硬币得到的结果是一样的。这种豆子和钉子的实验叫做加尔顿板实验。 加尔顿板可以演示在看似混乱的随机现象中存在的规律,这个规律就是正态分布。顾名思义,加尔顿板是加尔顿发明的。 嘉尔顿是英国维多利亚时代的统计学家、博学家、社会学家、心理学家、人类学家、热带探险家、地理学家、发明家、七项学家、遗传学家和心理测量学家。他是最早提出通过指纹来鉴定个人身份的研究人员之一。报个料,他还是英国生物学家查尔斯达尔 轮的表哥。现在我们反过来看,这个轮廓虽然大致为正太曲线,但曲线的光滑度不高。这是因为我们只放了一百个豆子,规律表现的还不够明显。下面我们放一千颗豆子重新做一下这个实验,可以看到,从一百颗豆子到一千颗豆子, 正态曲线的光滑度提高了。这说明重复实验次数越多,我们观察到的规律性就越明显。 下面我们改变一下实验参数,我们把钉子行数记做 n。 刚才的实验是 n 等于十,十行钉子,现在改成 n 等于二十行钉子,再放一千个豆子落下来观察结果, 结果显示仍然是一条光滑的正台分布曲线。我们比较 n 等于十和 n 等于二十的曲线,发现 n 等于二十的曲线比 n 等于十 曲线要扁一点。这个结果也是可以直观理解的,钉子越多,豆子可以落下的岔路就越多,底下的槽子也越多,豆子必然更分散。 事实上,丁字行数 n 越大,正态分布的曲线就越扁,正态分布的方叉就越大。 n 越小,豆子越集中,正态分布的曲线就越窄,正态分布的方叉就越小, 方叉就是概率密度函数中 c 哥们的平方。关于方叉的概念,本课只做题集,后续课程会详细展开。 例如这个图中有四条正态分布曲线,蓝色曲线的方叉为零点二,方叉最小,所以蓝色曲线最尖。黄色曲线的方叉为五点零,方叉最大,所以黄色曲线最扁。到目前为止,大家可能觉得 杰克的内容没有什么意思,因为所有结果现象都是很直观的。再例如,豆子落下形成的正太分布曲线是对称的,对称轴就是最中间的那个槽子,这也是直观的,因为豆子向左向右落下的概率都是一半一半,肯定是对称的嘛。 下面我们再改变一下实验参数,来做一次加尔顿板试验,看是否会让你觉得神奇。我们仍然放二十行钉子,一千颗豆子,只不过我们把每行钉子向左向右的概率改成随机。 例如这一行钉子向左的概率是零点九四,向右的概率是零点零六,这一行向左的概率是零点五八,向右的概率是零点四二。每一行钉子向左向右的概率都是随机生成的。那么豆子下落后形成的轮廓是什么样的呢?在我上学期 板上,有的同学猜可能是一条比较平坦的一字型轮廓,有的同学猜可能是一条像股市大盘一样的参差不齐的曲线。 下面我们开始实验看一下结果可以看出,除了对称轴不在中间,草字豆子轮廓仍然是一条光滑的正态分布曲线。大家有没有感到有点神奇呢? 我们重复四次上述实验,每一次都是二十行钉子,一千个豆子,每一次每行钉子向左向右的概率都是重新随机设定的。 四次实验结果显示,斗字的轮廓都是光滑的正太分布曲线,只是曲线对称轴的位置有所不同。事实上,每次重新设定每行钉子的随机概率并且确定不变后,对称轴的位置是可以根据各行钉子的概率计算出来的。这个对称轴的值 就是概率密度函数中的 miu。 这个图中有四条正态分布曲线,有三条曲线的 miu 相同,所以对称轴也相同。只有一条绿色的 miu 不同,所以对称轴也不同。在本节课我们也不对缪做详细展开, 下面我们给出中心极限定理,非严格数学意义上的一个版本,方便大家感性理解。其数学表数为所研究的随机变量,如果是由大量独立的随机变量相加而成,那么他的分布将近似于正态分布。 其通俗表述为,如果一个结果是有大量的不相干的因素累加导致的,那么这个结果一定表现为正态分布。例如,某个省某年的高考,全部考生的英语成绩卷面原始分必定服从正态分布。下面我们来分 学习一下英语高考的成绩分布。一个考生的高考英语成绩其实受到了无数因素的影响,每一个因素都可能使最终英语分数更高一点或者更低一点。例如,性别、 出生地、教育水平是否上过幼儿英语,小学英语老师水平、中学老师水平、英语老师性格是否喜欢英语电影、接触外国人频率、 饮食营养、高考当天天气、高考当天健康水平、高考当天心情等等等等。有无数的表面上相关的或者不相关的因素, 我们无法证明每个因素对英语成绩的影响到底有多大。但遗憾的是,我们也无法证明每个因素与英语成绩无关,这也就是一些社会培训机构向家长贩卖焦虑的原因。每个因素对成绩所产生的影响, 就好比一颗豆子经过一颗钉子时,向左向右的概率说不清楚,但这个概率一般不会是左右各零点五。这个因素总能使分数更高一点或更低一点。我们把豆子向左表示为分数更高一点,向右表示分数更低一点。 一名考生从小到大的生活历程,包含了无数因素的影响,最终得到了一个高考英语成绩相当于一颗豆子经历了无数行钉子的下落,最终尘埃落定,落到槽子里。 某省某年,数十万计考生最后的成绩分布相当于数十万个豆子经过了无数行钉子落到槽子里。根据中心极限定理,其分布必然是正态分布。 现于程序页面的篇幅,我们只进行了三千颗豆子,一百行丁字的实验,结果可以看出,豆子轮廓是正态分布曲线。 上述的高考成绩的例子只是现实世界中无数例子中的一个。只要参加高考的人足够多,所有人的原始分数必然是正态分布,考最高分的人和考最低分的人必然都只占少数, 都分布在曲线两边的尾巴上,而大多数人必然都是在中间位置考一个不高不低的分数。 所谓中庸者,不偏不倚,无过不敌,而平常治理乃天命所当然。这里我们提一下相关的历史时期和人物, 我们的历史和文化都必须由我们炎黄子孙来背负,传承、发展与弘扬,此处不做展开讨论,但每个同学都应当认真死。最后,我们来说一下,一个人的分数若落在双边的尾巴上,那必然是一个小概率事件,因为一颗豆子 要想从一开始一路向左或一路向右落到草字里太难了,所以最两边的草字里几乎没有豆子落进去的。一个人的分数 若能够落在正太分布曲线双边的尾巴上,无论是考的太好或是考的太差,都是具有极端显著性的情形,必然引起人们的关注与研究。 你看,每年的高考状元都要上头条新闻,人们会研究他们的学习方法,每年落榜的都会经历无数次的来自内心和来自别人的心灵考,但这其实都是注定的,有人就有竞争,有竞争就有江湖,有江湖就有正态分布。 现在所谓的内卷不就是人为的来画一条正态分布曲线吗?抱歉,话又讲多了,下一节课我们将从中心极限定理的另外一个 通俗版本均值抽样,来研究正态分布和双边尾巴的极端情形。我们将这样一步一步的带大家走到体检验的面前,后续课程敬请期待,谢谢大家!

大家好,在之前的课程中,我们学习了均值车辆分布,并通过车辆分布学习了假设检验的概念。 例如一个学生总体 a 的英语平均分是六零,等于一百三十七分。对这个总体进行均值抽样的话,均值抽样分布的对称轴必然为一百三十七分,分布的双边尾巴上的 是比一百三十七分低很多分或者高很多分的极端情况。我们可以人为的把双边尾巴尖上共百分之五的区域画出来, 也就是每个单边尾巴百分之二点五,并人为定义其为极端情况,用术语来说就是双 显著水平阿尔法等于零点零五。我们讲比较另外一个总体 b 和此总体 a 的均值有无显著差别的时候,可以先假设这两个总体没有显著差别及 h 零,没有 b 等于没有 a。 在这个假设下,两个总体的均值车辆分布也应当是相同的。那么我们从总体币中车辆一次, 则样本均值也应该以百分之九十五的大概率落入对称轴两边的中间区域,而只有可能百分之五的极小概率落入双边尾巴的拒绝欲。 现在在总体 b 中抽样一次得样本均值为一百四十二分,落入了总体 a 抽样分不 的拒绝欲。仅抽样一次,极端事件便发生,我们便有理由去怀疑一开始的这个原甲设 h 零有问题,我们便拒绝 h 零,从而接受对立。假设 h 一 总体 b 和总体 a 的均值有显著差别,一百四十二分落入了右边拒绝句,因此我们拒绝了 h 零。假如样本均值是一百二十九分,落入了左边的拒绝句,我们也会去拒绝 h 零。 不管落入左边还是右边的拒绝欲,我们都拒绝 h 零,得到结论是 h 一、总体 b 和总体 a 的均值有显著性差别。热爱思考的同学可能早就想过这么一个问题,那总体 b 和总体 a 到底 谁的君子大,谁的君子小呢?答案是,我们不知道。上面的假设检验叫做双边检验,也叫双维检验,英语叫 totaled test。 因为我们开始的假设是谬 b 等于谬 a, 所以总体 b 的抽氧均值比 mia 大也好,比 mia 小也好,只要不和 mia 相等,就足够检验了我们这个假设了。 所以基于这个谬 b 等于 ma 的 h 零假设,我们只能得出到底有没有显著差别的结论,得不出谁大谁小的结论。 但现实统计中,很多时候我们想得出到底谁大谁小的结论怎么办呢?那就要用到单边检验了。 下面我杜壮了一个听起来比较荒唐,但比较有趣的例子,来帮大家理解双边检验和单边检验的区别。 假如你从大学毕业了,创业,开了个工厂,自己当老板,现在需要招聘员工, 现在各个招聘单位都会对员工的英语水平有一定要求,但是你的要求比较特殊,你既不要英语太差的,也不要英语太好的。你觉得英语太差的不够用,看个英语说明书也看不懂, 但你同时也觉得英语太好的也没用,你工厂也不需要直接和国外打交道,英语太好的你还要多给工资,不划算。你现在到了一个高校去招聘,弄到了所有一千名应届生的英语四级成绩表, 根据我们学过的加尔顿满实验和正态分布的性质,可以知道,这么多学生的英语四级成绩必然呈现正态分布。注意,这个图不是抽样分布,而是成绩的总体分布。 例如,考四百二十分的有五人,考四百三十分的有十三人,考五百分的有一百人,考五百七十分的有十三人,考五百八十分的有五人。 正太分布的对称轴必然是总体的真实均值。妙龄,我们可以看出,这个总体的英语四季军分为妙龄等于五百分。 你的要求是英语水平不要太差,也不要太好,要中不溜的。那么现在让你在这个正太分布里画出分界线,把英语太差和太好的总共百分之五 的人都画出去,你会在哪里画线呢?很简单,因为我们学过双边检验了,只要画出双边的拒绝欲就行了。 例如,我们分别在四百三十五分和五百六十五分之里画出零戒指,双边一共百分之五,那么每一边百分之二点五。 假如这时有一位成绩五百八十分的来应聘,显然是落入了右边的拒绝欲,因为他英语成绩太好了,所以被你拒绝了。同理,假如一位四百二十分的来应聘,落入左边拒绝欲也被你拒绝, 这就是对应了你的需求,英语不要太好,也不要太差,只要平均分左右的中不溜的。换句话说就是 h 零 应聘者成绩等于五百分的,只有靠近对称轴中间部分的才足以代表等于五百分。两边尾巴尖上的,要么成绩太差,要么成绩太已经不那么能代表平均分等于五百分了。 上面讲的就是阿尔法等于零点零五的双边检验,下面接着编故事。你工厂开了几年,直接国际化了,你非常需要英语非常好的员工, 这一年你又来这个高校里招聘,你说英语四级成绩太差的,我一律不招,我要英语四级成绩好一点的。那么还是这个成绩总体的正态分布。你需要画一条线,画出成绩 最差的百分之五,作为你的拒绝欲。你该怎么画线呢?显然,你会在左边尾巴间从左往右数出百分之五的总体面积,画上一条线。 例如,你把四百四十五分作为临界制,凡是英语四级成绩比四百四十五分少的应聘人员,都被你拒绝了,而剩下的百分之九十五就是你的接受,与 你接受的条件是英语成绩要好一点的。那具体比多少分好一点呢?当然是比平均分好一点了。 所以实际表现出来,也就是这百分之九十五的面积,代表着 h 零应聘者成绩大于五百分。假如此时来了一个应聘人员,说自己的 成绩是四百二十分,你按照心中的这个 h 零检验了一下四百二十分,落入了拒绝育,所以不予以聘用。这个就是单边假设检验,更具体的说是拒绝育在左边或左尾的单边假设检验。 这个概念比较难绕弯,我们把单边和双边比较一下,帮助大家进一步理解。 第一次是你想招聘成绩既不太好也不太坏的,即最能代表成绩等于五百分的。 因此你用的是双边检验,要拒绝双边尾端各百分之二点五的。成绩太差和成绩太好的,你在双边尾巴画了两条临界值的线,四百三十 五分和五百六十五分,比四百三十五分还低的有百分之二点五,比五百六十五分还高的也有百分之二点五。 第二次是你想招聘成绩不太差,或者说成绩好一点的,即最能代表成绩大于五百分的。因此你用单边检验要拒绝左边单边尾巴的百分之五, 你在左边单边尾巴上画了一条临界直线,四百四十五分,比四百四十五分还低的有百分之五。 我们把单边和双边检验的临界值放在一起比较,发现单边检验时左边的临界值四百四十五分,比双边检验时左边的临界值四百三十五分要 高。为什么呢?因为把双边拒绝玉石右边的这百分之二点五的面积加到单边拒绝玉的左边来了。 我们仍然看那位成绩为五百八十分的应聘者,在招聘双边不要太差也不要太好的时候,是落入了双边的右边的拒绝欲,因为他英语成绩太好了,所以被你拒绝了。 但这次招聘单边英语成绩要好一点的时候,虽然还是在右边的尾巴尖上,但这次就没有落在拒绝句, 因为在这次单边检验中,右边的尾巴尖属于接受欲。你要招聘英语成绩好一点的这个人,成绩五百八十分 简直不要太好了,太符合你的要求了,太符合你的 h 零了,你怎么能拒绝呢?大家明白了没有?还是更把你给绕进去了,没关系,我们再接着绕一下, 又过了几年,你工厂人员流失严重,你第三次又来招聘人员了,但这次你对应聘者的英语水平又有新要求了。 你第二次招聘的英语水平好的员工,比你的英语都要好不知多少倍,词汇量比你多,发音比你准,背后里嘲笑你的土鳖英语,这令你非常不爽。 加上近些年外国人若不会说上些流利的汉语,都不好意思来中国做生意。综上,你在 再也不想要英语好的应聘者了。所以这次你专门要招英语成绩差一点的。 假如还是这个同样的成绩,总体你需要画出一条线,把总体里英语成绩最好的那百分之五给画出去。 于是你就在最右边的分数高的尾巴尖上画了一条线,这个线代表的临界值是五百六十分,比五百六十分还高的人占了总体的百分之五。这就是你这一次的拒绝欲。 而剩下的这些百分之九十五,就是你的接受欲。你接受的条件是 h 零英语成绩差一点的。这接受欲的百分之九十五,在这个均分为五百的 总体中,最能代表 h 零成绩小于五百分的。而这拒绝率的百分之五是最不能代表 h 零成绩小于五百分的。 假如这时来了一个应聘者,成绩五百八十分,分数太高了,按你的 h 零标准来检验一把,显然落入拒绝。拒了。被你拒绝了, 我又来了一个应聘者,成绩二百三十分,这个分数在最左边的尾巴上都属于比极端还极端的低分,你心想,自己闭着眼也考不了二百三十分这么低啊。 但你不能拒绝他,因为这个分数按照你的检验标准是在接受欲的,而且太符合你的成绩小于五百分,这个 是零了,所以你得欣喜若狂的接受这个二百三十分,这个就是拒绝于在右边或者右尾的单边。假设检验 上面就是我编的一个荒唐,但你仔细想又好像不那么荒唐的一个例子。 我们简单归纳一下,双边检验就是等于号 h 零为成绩等于五百分。拒绝预赛最不能代表等于的双边尾巴。单边呢,要么是大于号,要么是小于号, 大于号就是 h 零为成绩大于五百分。拒绝预在最不能代表大于号的左边,小于号就是 h 零为成绩小于 六百分。拒绝雨雨在最不能代表小于号的右边。这个英语成绩招聘的例子是通过一个总体的正态分布来讲解,单双边检验 每次只检验一个个体的成绩在正态分布中的位置是否符合 h 零。 下面我们把单双边的概念带入均值抽样分布中。我们回到高考英语成绩的例子,这是一个成绩总体 a 的均值抽样,均分式对称轴没有零等于一百三十七分。 现在请问这一千次抽样中,最不能代表 h 零没有等于没有零一百三十七分的抽样是哪些呢?很简单,在双边尾巴上各画出百分之二点五的抽样, 也就是拒绝欲,也就是拒绝这个区域的样本代表 h 零没有等于没有零一百三十七分。 假如有一个样本的均值为一百三十二分,则落入左边拒绝欲,于是我们拒绝认为这个样本来自 h 零六等于六零一百三十七分的总体 a。 假如又有一个样本的均值为一百四十三分,则落入右边拒绝欲,于是我们也拒绝认为这个样本来自 h 零六等于六零一百三十七分的总体 a。 那么再请问,在这一千次均值抽样中,最不能代表 h 零没有大于没有零一百三十七分的百分之五的抽样是哪些呢?那就要从左 左边的尾巴尖朝右数出百分之五的抽样,然后画出一条线,这条线代表的临界值为一百三十五分, 这条线左边的比一百三十五分还少的抽氧均分,便最不能代表 h 零没有大于没有零一百三十七分。 假如车上一次得样本均值一百三十二分,则落入单边左边的拒绝欲。 于是我们拒绝这个样本来自 h 零没有大于没有零一百三十七分的总体,并认为这个样本来自 h 一没有小于没有零一百三十七分的总体。 假如抽样一次得样本均值一百四十三分,则落入百分之九十五的 接受欲。于是我们不拒绝 h 零,仍然认为这个样本确实来自 h 零没有大于没有零一百三十七分的总体。上面是拒绝欲在左尾的,我们再来看拒绝欲在右尾的。 那么在这一千次均值抽样中,最不能代表 h 零谬小于谬零一百三十七分的百分之五的抽样是哪些呢? 那就要从右边的尾巴尖朝左数出百分之五的抽样,然后画一条线,这条线代表的临界值为一百四十分, 这条线右边的比一百四十分还多的抽样均分便最不能代表 h 零没有 小于没有零一百三十七分。假如抽样一次得样本均值一百四十三分,则落入单边右边的拒绝率。 于是我们拒绝这个样本来自 h 零没有小于没有零一百三十七分的总体,并认为这个样本来自 h 一,没有大于没有零一百三十七分的总体。 假如出样一次得样本均值一百三十二分,则落入百分之九十五的接受率。于是我们不拒绝 h 零,认为这个样本确实来自 h 零没有小于没有零的总体。 听到这里,不知道你是更明白了还是更绕晕了,但没办法,还得继续绕,还差最后一步。 最后,我们把单双边检验的概念带入替分部。之所以一开始不直接用替分部来讲,是因为替分部是把具体案例中的单位均值等信息都抽象出去了的,很难进行直观理解的。 我们仍然用上节课稻田亩产量的例子有稻田 a 和稻田 b, 以至稻田 a 的亩产量为六 a 等于一千三百三十斤。现在对稻田 b 进行一次样本容量为二十的收养计算,样本均值 x 八等于一千三百六十四斤。 请问稻田 b 的亩产量比稻田 a 大还是小呢?显然,肉眼可见,一千三百六十四大于一千三百三十。但是,怎么通过单边体检验来得出 没有 b 大于没有 a 一千三百三十斤的结论呢?假设检验有个常见套路,就是虽然你想得到的结论是 h 一,但你得先假设 h 零成立,然后通过检验拒绝 h 零,再正式 h 一。 例如,稻田币的抽氧均值为一千三百六十四斤,我们想得到的结论是, h 一 没有 b 大于没有 a 一千三百三十斤。但我们要先做原甲,设 h 零 缪 b 小于 ma 一千三百三十斤,然后尝试拒绝这个 h 零来证实 h 一。这是上节课得出的万能的替分部和体制表。在单边 划线之前,我们先回忆一下 t 值的公式,这是一个分式,分母肯定是个正数,因为标准差和 n 都是正数, 分子是正是负就不一定了。这是因为样本均值 x 八与总体均值谬相减,若 x 八大于谬,则体值就是个正数。若 x 八小于谬,则体值就是个负数。 在本例中, t 等于零,这一点代表六, b 等于六 a 一千三百三十斤。 那么现在请你画出最不能代表 h 零缪 b 小于 ma 一千三百三十斤的百分之五的 t 值区域。怎么画呢? mob 要是小于 ma 的话,根据 t 值, 同时 t 应该是个负数,所以 t 值越小于零,越往左边尾巴间就越能代表 h 零,谬 b 小于没有 a。 反之,气质越大于零,越往右边尾巴尖,就越不能代表 h 零缪 b 小于 moa。 所以我们从右边尾巴尖这里往左数出百分之五的体脂。作为 h 零的拒绝欲, 我们开始数二点二,这里概率百分之零点二,累计百分之零点二二,这里概率是百分之零点四,累计百分之零点六。一点八,这里是百分之零点九,累计百分之一点五。一点 六,这里是百分之二点零,累计百分之三点五一点四,这里是百分之四点八,累计百分之八点三。超过百分之五了,所以单边右边的阿尔法等于零点零五的临界之为一点六, 超过一点六,再往对称轴方向数一点点,就超过百分之五了。所以单边右边阿尔法等于零点零五的拒绝欲就是包括 t 等于一点六在内的再往右的所有区域。 那么我们稻田 b 的样本计算出来的 t 值是多少呢? t 值还是原来的 t 值一点六六?不管是双边还是单边的,只要样本一样, t 值都是一样的, t 值等于一点六六落入了 拒绝玉。所以我们在单边阿尔法等于零点零五的显著水平下拒绝此样本可以代表 h 零,谬 b 小于谬 a。 接受此样本可以代表 h 一,谬 b 大于谬 a, 即稻田 b 的亩产量显著大于稻田 a。 热爱思考的同学又要问了,为什么是同样的样本和同样的体质?在上节课双边检验中得出稻田 b 和稻田 a 的亩产量没有显著差别。在本节课中又得出了稻田 b 的亩产量显著大与稻田 a 的结论。这显然不是矛盾的吗? 原因是我们的原甲设变了,所以拒绝句也变了,双边 变成了单边显著水平还是零点零五。拒绝玉从两边尾巴尖的面积挪到了一边的尾巴尖的面积,这单边的尾巴肯定比原来双边的尾巴要粗,也就是说,单边的拒绝玉更大的,更容易拒绝 h 零。 这也就是为什么在实际统计工作中,很多人都不用零点零五这个显著水平,而使用零点零一或者零点零零一等更小的显著水平。 本节课我们先后从正态分布、均值抽奖分布和气分布逐步的带入并讲解了单边假设检验的概念。需要说明的是,我举的这些例子都不是严格数学意义上的,例如我只用了大于号和小于号,而 没有用大于等于号或者小于等于号。我举的例子呢,也是瞎编乱造的,演示的气质和实际的气质也有较大出入,为的是简化讲解,帮大家感性理解。 国内外的网站上关于单双边检验的说法花样繁多,有的还互相矛盾。我分享给大家的是自己多年总结,觉得能说服自己的一个版本, 欢迎大家讨论。以上内容大家慢慢消化,可以多看几遍,我们下节课见。

好,各位同学,大家好,欢迎来到统计学原理的课程内容,我是凯丽老师,那么接下来呢,就由凯丽老师带领着大家一起来学习统计学原理这门课程。 首先我们先来一起了解一下考勤分析,那么统计学原理啊,那么这门课程的话,其实和其他的课程都是一样的呃,我们在考试当中的考试时间呢,是一百五十分钟,也就是两个半小时的时间, 那么总分呢是一百分啊,六十分作为一个几个线。好,那么紧接着呢,我们再来看到关于考试提醒啊,因为我们统计学原理呢这本书啊,他的这个,呃改编啊,次数比较少,所以的话,我们启用的教材比较旧啊, 但是呢,对于考试题型,可能啊,每年的这个考试题型呢,哎,过差不多五年就会会有一次改革,所以呢,这些题型是固定的,但是在题型上面的这个分值占比有的时候可能会有改动啊,那 所以我们可以简单的去看一下题型的分布,题型的分布呢,有单项选择题啊,多项选择题啊,那所以这个题型的一个占比可能会有啊一定的变动啊,那总的来讲,单选 选题和多选题加起来差不多能够占到百分之三十左右的一个占比啊,但是在啊,具体的这个题目的提量啊,还有这个占比的分值可能会有一定的调整。好,那么再来看到后面啊,判断改错题,填空题,简答题和计算题啊, 那么,呃,对于这些固定的一些题型呢,是教材上面对于我们考试价高的一些要求啊,对于我们考试的具体要求啊,那么我们这边呢来看一下啊,嗯,关于这个计算题啊,那 在所有的题型当中呢,其实啊,我们来讲到单选题和嗯,多选题,其实是分为什么客观题,对吧?那么啊,除了由我们讲到的主观题,其实还有自选题啊, 那么我们来看一下这个计算题啊,呃,计算题一般性在我们整个考试当中的占领呢,会有三十分左右啊,三十分左右 也是非常高的一个占比了,那剩下的部分的话,就是从判断改错题啊,填空题,还有简答题啊,就是那种我们要需要书写的,对吧,我们称之为叫做主观题。 那为什么判断改错题,我们也把它归纳为主观题呢?是因为这边呢,我们再讲到啊,判断加上改错,它是分为两个部分,第一, 判断是要去根据啊这个题目,我们去阅读题目材料,然后首先呢先做判断啊,判断他到底是对还是错,这是第一步, 第二步呢,我们要去进行改错啊,当然是改错,如果当我们去判断啊,这道题目是错误的表述方式,那么我们要去旁边啊,写好,写上正确的表述方式啊,那么所以这就是改错。 好,那么我们的这样的这个呃,题目的这个分数是这样的,如果这道题是错误的啊,那么这道题的这个分值啊,就占 一半,对吧?改对改错啊,那么我们讲改错,他是占到分数的一半,那么以及你改对 的这个内容啊,也作为啊,我们整道题目的另外一半的分数。那有同学说,如果这道题是对的呢,如果对的,你只要打勾就可以了,并不用去改正他啊,如果他是对的啊,如果你啊写了这个打勾,对吧,判断是正确的, 你所有的分数都可以拿到啊,所以是这样子的。嗯,那很多同学会犯的这个错误呢,就是在做判断改错题的时候呢,我们啊把它辨析认为是错误的之后呢,就没 没有去纠缠他了啊,这是咱们可能会碰到的一个问题啊。好啊,那么这个其他的这个骑行呢,相对而言都比较常规,所以呢,我们要去注重这个骑行的一个比例啊, 因为在我们这一门课程当中可能会有这个计算题啊,计算题啊,他的这个比重相对而言占的还是比较高的,所以啊,我们计算题一定要认真的去听课,然后跟着老师讲 讲到的这个知识点内容啊,去做了解,然后呢对于这个公式做一个牢牢的掌握,然后根据公式呢啊,然后去分析题目,将题目当中的数据带入啊,这样的话,我们这个计算题就万无一失了啊啊,但是 有些同学说,老师,那我们的一些计算题的内容是不是比较难啊,那这个不用担心,我们考试的时候是可以去带科学型计算器的啊, 科学型啊,那什么是科学型计算器呢?就是不带有存储功能的。呃,那么考试能不能带手机呢啊,是不可以的, 所以呢,我们考试只能去啊携带这个科学型的计算器啊,是不能够去带有存储功能,是可以带入考场的。好,那么这就是我们在讲到啊,考试当中应该去注意的问题啊,特别是我们在啊学习的过程当中呢,要对这个计算题计算的内容去做一个重点的学习。 好,接下来来看的啊,我们再讲到啊,同期学啊,我们这门课的这样的一个课程性质和目标, 统计学呢,是认识事物数量特征和数量规律的通用方法体系,那么我们学习本课程呢,就是为了能 去系统掌握统计学的主要概念,基本思想,基本方法。好,那么这个的话,其实主要是以理论为主,对吧,还有呢,以 事物的数量特征啊,为对象,建立从整体观察事物的思维方法啊,以及逻辑啊,那么除了我们要知道统计学的基础的一些理论之外,我们还要掌握什么一些统计方法 好?由于统计方法是属于归纳方法,技术性较强,学习时我们要充分调动已有的经验,并认真完成练习题。好, 所以我们在啊,呃,理解到一些知识点,要点内容之后呢,要去对于我们的啊,呃,课后的练一练,或者说是我们上课讲到的这个例题啊,要去认真的完成练习题啊, 去进行计算,那么以验证和巩固所写内容,提高分析问题,解决问题的能力。好,那么这就是我们统计学这门课程对于大家的要求, 接下来呢,我们来对啊本书的这个章节做一个详细的讲解啊,那么我们这一本书啊,因为啊,这个版本可能比较早啊,那统计学啊,统计学原理呢啊,他的这样的一些啊,基础的一些理论和原理啊, 其实呢,比较固定啊,其实一共也就七张,所以呢,对于同学们的学习的啊,这个任务不是很艰巨,对吧?啊,因为他的整体的这个量不是很大,不像有一些其他的超过十张的。这个呃,理论的部分,嗯,比较多, 所以我们啊,一方面来讲啊,量不是很大,学习起来应该相对比较轻松,对吧,也给同学们减负。但是啊,但是我们在学习呃,这些章节的时候一定要什么 啊,我们一定要去关注到啊,里面的里面的理论或者说是公式,因为我们在后期啊,呃,从第三章开始, 第二章啊,后面的一一部分可能就会慢慢涉及到一些啊,关于这个计算啊,像一些组织啊等这样的一些啊,这个为我们计算做准备的啊,一些理论的知识了。那所以呢,从第三章开始 到后面第七章其实都会有一些计算的部分啊,当然每个章节的分布的难度是不一样的啊,好, 我们先来看一下啊,嗯,每一章集啊,第一章呢,是总论部分,总论部分的话,我们哎学习到的这个内容啊,主要是呃,同级学的一些基础的一些理论啊, 包括统计学的产生由来发展,对吧?好,那么第二呢,第二章我们要哎来学习到统计资料啊,统计资料方面的一个搜集与整理,第三章统计数据 描述与显示啊,所以从第三章开始呢,就讲到了统计数据,从第三章开始我们就就要涉及到一些计算的一些问题了。 第四招,车辆调查第五招,相关分析与回归分析。第六招,数列啊,时间数列分析。 第七章,统计指数法。所以我们后面学到的一些啊,数字啊,方法啊,计算会比较多,那么考试当中的计算题部分呢啊,主要重点内容是出在第三章当中, 当然还有我们讲的第四章啊,来看到第三、第四、第五和第六出的比较多, 那么第七章也有可能会出到啊,但是相对而言体重比较小啊,那么第三章仍然是我们计算题的一个重点的内容,所以第三章当中的这个啊,课程的内容,我们是一定要去好好学习的啊,包括像第四章的抽央调查里面的部分内容,还有呢,哎, 回归分析当中的一元线性回归,一元线性回归方程,这是我们要知道的, 还包括第六章的时间数列分析。好,那么这就是我们在讲到的统计学当中啊,这 七章的一个分布,以及我们考试当中的一个重点部分啊,那所以啊,总的来讲啊,第三章是我们考试当中啊,根据历年的这个考题分布啊,第三章考察的是最多的啊,以及 第四章还有第五章啊,我们都是要去重点去看到的,所以呢,第三章是我们学习的一个重点啊。好,那么我们接下来的就从第一章总论部分开始。第一章总论, 首先我们先来看一下总论的啊,这样的一个学习目标,对吧?学习前沿。好,我们讲统计方法,起源于人类久远的接触活动,后来逐渐发展为应用广泛的统计学, 所以总论部分呢,就是去研究啊,我们在讲的早期的这种技术技术活动,他是怎么样去发展成为一名一门学问的,对吧,他是怎么样去发展成为统计学的, 这就是我们在第一章所要学习到的内容就是统计的产生啊,统计的产生以及,哎,讲到统计的基本方法有哪些?哎,简单了解一下。二、 并且讲到统计是什么?统计的概念是什么?统计是对生物数量特征去进行分析的方法体系,它是一种体系啊,那么需要对不同的特征采用不同的计量尺度,在统计理论中还需要归纳一些基本的 常用的概念。好有一位啊,德国有一位哲人斯乐兹曾经说过, 统计是动态的历史,历史是静态的统计。那这句话的话以我们课件上为主啊,以我们课件上为主,因为和书本上有写啊,有些出入我们的这个书本上这句话是有问题的, 那么书本上的描述是统计是静态的历史啊,那我们这边去做一个更改啊,统计是动态的历史, 历史是近看的统计。这句话什么意思?我们在我们在讲,呃,根据古代的这个记录,对吧?哎,那古代的这样的一些啊,历史的一些事件啊,比如说人口啊,军事啊,领土的,呃,这些记载啊,我们可以从统计啊这些数据 当中作为一个参考和分析啊,可以把他们什么啊,连成一幅动态的画面一样,对不对?那么历史是静态的统计,那在某一个历史节点,那这些数据他是什么呈现静态的这个方式的啊?所以我们要将什么啊, 通过统计所得出的这些统计资料,把它串联起来,就可能啊,就可以去考察到啊,原来的这个历史,对吧?人类的这个历史发展啊, 那么这说明我们的统计学,其实他的产生和发展也是要和人类的文明,人类的这个社会的变迁,社会的进步去进行紧密联系的啊,换句话说,统计是哎,我们在马克思主义基本原理当中 讲过的,统计是适应社会生产力发展啊,这是第一个第二个国家管理的客观要求产生和发展起来的啊,这样的一门学科。 好,所以呢,在第一章啊当中啊,一共有五节的这个分布,我们简单先来看一下啊, 那么在第一节讲的是啊,技术活动,这是第一部分,第二部分是统计学的产生, 那技术部分啊,技术活动,他其实是人类最古老的这种技术的方式啊,技术的活动对不对?他还没有成为什么统计学啊,所以呢,他从最早的技术活动先讲起,统计学是怎么样 产生,包括啊,到后期统计学的产生啊,那么所以第一节就介绍了啊,统计学的什么真正的由来和产生啊,那么第二节呢,讲的是统计的含义和应用啊,也就是,哎,统 记什么是统计,以及统计在生活当中的应用。第三部分呢,讲的是统计的什么基本方法啊?好,那么第四集 讲的是量度层次和计量尺度,那么这一节呢,我们在考试当中也是一个哎,重点会考到的内容。好,那么我们要学习呃,这个量度层次和计量尺度啊,包括第五节讲的是统。

大家好,我们到目前为止已经讲解了以下概念,假设检验单边 t, 检验双边 t, 检验显著水平阿尔法自由度。本节课我们来介绍另一个重要的概念, t 临界值表、 t 分布。临界值表,简称 t 临界值表或 t 值表,英语叫 t table, 也叫 t distribution critical values table。 临界值的概念其实我们之前的课程中已经接触过了,例如,这是一个样本容量 n 等于二十,自由度等于十九,单样本抽样一千次形成的一个 t 值分布图。假如我们人为划定单边,右边百分之五为 端情况,也就是说我们的原甲设 h 零为 miu 小于 m 零,显著水平为单边,右边阿尔法等于零点零五。我们要把这一千次抽样中最右边的五十次抽样,也就是这百分之五的阴影面积作为极端情形, 这部分的阴影面积就叫做拒绝玉。拒绝玉的这里有一条边界线,这条边界线所代表的气质就是零戒指。 在本例中,粗略的临界值是 t 等于一点六。我们拿一次抽药所算出来的 t 值和临界值去比较,假如算出来的 t 值是一点九, 一点九大于一点六,则样本肯定落入拒绝于,于是拒绝 h 零。 假如抽样算出的气值是一点三,一点三小于一点六,则样本肯定落入接受欲,于是接受 h 零。所以说,临界值就是拿来比较的一个标准。 要想确定临界值这条线,我们需要从右边尾巴尖朝左数出,累计百分之五的面积。例如,在这个演示用的精度非常低的 t 值分布表格中,从左往右数到 t 等于一点六,这一点 比一点六含还大的 t 值的频次累计是百分之三点五。再往左边数一个 t 等于一点四十,比一点四含还大的累计频次就是百分之四点八加百分之三点五等于百 分之八点三,超过百分之五了。所以在本例中, t 等于一点六是单边,右边阿尔法等于零点零五的粗略的临界值。那么精确的临界值是多少呢? 我们现在引入系临界值表的概念,这个表就是别人已经算好了的精确的,方便我们查询比较的一张表。 这个表虽然密密麻麻的一整页数字,但其实并不复杂,他主要包含三个查询信息,分别是一、单边 one tail 还是双边 two tail。 二、自由度是多少?三、显著水平是多少。只要有了这三个信息,就可以查出 不对应的 t 零戒指。例如在刚才这个例子中,首先他是单边检验,于是我们先找到单边这一行, 然后自由度为十九,再找到 df 等于十九这一行,最后显著水平是零点零五,再找到单边这一行中的零点零五这一列,这时就框出一个直来一点七二九, 这个一点七二九就是自由度为十九的积分部中单边右边阿尔法等于零点零五的精确的零件值。 假如抽样一次,由样本计算出来的气质比一点七二九还大,那么肯定落入拒绝欲,便拒绝 h 零。假如算出来的气质 比一点七二九要小,那么就落入接受率就接受一次零。下面我们来验证一下。在自由度为十九的气氛部中,从七等于一点七二九这里画一条线,这条线到右边尾巴尖的面积是不是零点零五? 这里向大家介绍一个网站,这个网站可以演示气氛部的曲线、自由度、临界值和拒绝于的面积等等。 网址写在这里,供大家自己实验。大家可以在课后尝试把 t 临界值表中的任何一个值输入到这个网站程序中,以获取临界值的直观感受。 在本力中自由度是十九,于是 df 这里填十九,本力是 单边右边检验,于是这里选择 ride tell, 然后临界值是一点七二九,在 t 值这里填入一点七二九。这时可以看到程序在这个自由度等于十九的气氛部中,在 t 等于一点七二九这里画了一条线, 这条线到右边尾巴尖或者叫正无穷的阴影部分的面积正好是零点零五,所以这就验证了单边右边阿尔法等于零点零五的临界值为一点七二九。 下面我们通过在程序中依次做出不同临界值的拒绝欲来动态的演示临界值的变化,方便大家把临界值表和气氛部曲线在心中做一个对应。 例如选取自由度为十五的这一行,来看一下单边右边的变化过程。 可以看到,由于 t 分部是正负对称的,所以假如显著水平是零点五的话,临界值正好是对称轴。 t 等于零,曲线下方的整体面积是一则拒绝于的阴影面积正好是一半,也就是零点五。 随着显著水平越来越小,或者说拒绝玉的面积越来越小,临界值的数值变得越来越大。 刚才是单边右边零戒指的例子,下面我们再举一个双边零戒指的例子。双边零戒指我们在之前的课程中也接触过,例如,这是一个样 本,容量 n 等于二十,自由度等于十九。单样本抽样一千次形成的 t 值分布注重图,假如划定双边百分之五为极端情况,也就是两边的每一边是百分之二点五,此时对应的原甲设为 h 零 六等于六零,显著水平为双边阿尔法等于零点零五。在这一千次抽样中,从两边的尾巴尖各数出二十五次抽样作为极端情形。 因此双边假设检验的拒绝欲有两个部分组成,于是有两个临界值。我们之前讲过,由于替分部是正负对称的,所以这两个临界值肯定是绝对值相等,正负号相反的。在这个粗略的气值分布表格 中,左临界值是负的一点八,右临界值是正的一点八。那么精确的临界值是多少呢?我们再来查一下这个临界值表。首先找到双边这一行,再找到显著水平零点零五这一列, 再找到自由度为十九的这一行,框出一个临界值为二点零九三。我们直接把这个临界值输入到程序中来印证, 在 tw 输入二点零九三,自由度输入十九。单双边选 two tails 结果选式双边检验的拒绝句分两块,左右尾巴尖各一块,双边尾巴尖总共应面积为零点零五。 两边是对称的,每一边的阴影面积为零点零二五,右边尾巴的临界值是二点零九三。从 t 等于二点零九三画一条线到正无穷的阴影面积为零点零二五, 左边的连接值为 t 等于负的二点零九三。从负的二点零九三画一条线到负,无穷的硬面积为零点零二五,两边硬部分面积加起来等于显著水平,阿尔法等于零点零五, 这就验证了双边阿尔法等于零点零五的临界值为正负二点零九三。这里需要说明的是,因为气氛部是正负对称的,正负临界值的绝对值相同, 只是正负号不同。所以在 t 临界值表中,双边的临界值只给出正的临界值就可以了,或者说只给出双边临界值的绝对值就可以了。 假如抽样一次,由样本计算得到 t 等于二点三,或者 t 等于负的二点三, t 的绝对值都大于临界值二点零九三,于是 t 比左右正负两边的临界值都还极端,于是拒绝 h 零。 假如 t 等于一点六,或者 t 等于负的一点六, t 的绝对值都小于二点零九三,于是 t 不比正负任何一个临界值极端,于是接受 h 零。 所以双边检验的时候,不管抽样计算出的气质是正还是负,都取其绝对值再和临界值进行比较。若比临界值大,则极端,则拒绝 h 零。若比临界值小,则不极端,则接受 h 零。 同样的,我们在程序中动态演示一下双边临界值的拒绝欲,例如,选取自由度为十九双边的临界值,当临界值为零时,双边的拒绝欲就充满了整个曲线下方拒绝欲的面积为一。 随着显著水平越来越小,或者说拒绝玉的面积越来越小,正负临界值的绝对值变得越来越大。最后,我们再举一个单边左 边临界值的例子,例如自由度仍然是十九,显著水平为单边左边阿尔法等于零点零五。但是在 t 临界值表中,好像并不区分单边左边或单边右边,只能区分单边或双边。 原因我们刚才讲过了,因为气氛部反正是左右正负对称的,只看绝对值就可以了。 不过我们心中要时刻记着,此时对应的元甲设为 h 零,谬大于缪零,拒绝于在左尾,左尾的气质都是负数, 表中查到的临界值都要在心中加上一个负号,于是查表时,表面上和刚才单边 右尾查表是一样的,找到单边这一行,找到零点零五这一列,再找到自由度持久这一行,所以查出来的同样是个一点七二九。 不过往程序里面输入 t 之时,一定要记得把负号给加上。所以在 tf 六这里输入负的一点七二九, 可以看到从负的一点七二九画一条线,从这条线到负无穷的阴影部分面积正好是零点零五,于是就验证了 t 等于负的一点七二九是单边左边阿尔法等于零点零五的零介质。 假如抽样一次计算出的 t 值小于负的一点七二九,例如 t 等于负的一点九,则落入拒绝 绝育,拒绝 h 零。假如 t 值大于负的一点七二九,例如 t 等于负的一点四,则落入接受欲接受 h 零。 或者我们也可以只看绝对值。首先必须记住的是拒绝欲在单边左边的话,抽样得到的气质必须是个负数,才有可能被拒绝。 因为如果抽样 t 值算出来是个正数,肯定在对称轴的右边,必然是处于接受欲的。 所以假如抽样一次计算出气值是个负数,若气的绝对值大于临界值一点七二九,则拒绝 h 零。若绝对值小于一点七二九,则接受。 同样的,我们也来动态演示一下单边左尾临界值的拒绝欲,要记住,一定要给临界值加上负号。 当临界值为零时,拒绝誉为左尾的一半面积,也就是左边的零点五。 随着显著水平阿尔法的减小,或者说左尾的拒绝于面积的减小,负数的临界值也越来越小,或者说负数的临界值的绝对值越来越大。 最后我们来看一下系临界值表的几个性质。第一,单边阿尔法和双边二阿尔法的临界值是相同的。例如,单边零点零五和双边零点一的临界值是同一, 单边零点零一和双边零点零二的临界值也是同一列。这就是因为 t 分布式正负对称的,我们在 t 分布图中看一下就很直观了。 例如单边阿尔法等于零点零二五和双边阿尔法等于零点零五是同一列。自由度为十五时,替临界值都是二点一三一。我们输入到程序中,画出替分布的拒绝欲。 可以看到,单边右边的拒绝玉是从正的二点一三一到正无穷,硬部分面积是零点零二五。双边拒绝玉包括两块,首先也是从正的二点一三一到正无穷,左边是从富的二点一三 到负无穷。两边每一边的阴影面积都是零点零二五,两边加起来就变成了零点零五。所以单边零点零二五和双边零点零五的临界值是同一个值。 第二,同意显著水平下,自由度越大,临界值就越小。例如我们选取单边零点零五这一列,可以看出,从上至下,随着自由度的增加,替临界值也在逐步减小。 我们挑出其中自由度等于二五十二十的提分布,并做出其单边右边零点零五的拒绝欲,然后把图片重叠在一起进行比较。可以看到,自由度越大,曲线中间就越尖。曲线中 中间越尖的话,曲线下的面积就越朝中间集中,但曲线下方的面积永远等于一,中间面积多了,两边的尾巴面积就变少了,尾巴更细了。 现在把重叠的图片翻开,可以把尾巴尖看的更清楚一点,自由度从二增加到二十,尾巴越来越细。 因此,想要从尾巴尖上画出面积为零点零五的拒绝欲的话,分界线必然朝对称轴移动,也就是临界值变小了。所以说,同一显著水平下,自由度越大,临界值就越小。 第三,随着自由度的增加,相邻自由度的气氛部越来越相似,并最终趋近于标准正态分布。 表现在数值上,就是当自由度很大时,自由度等于 n 和自由度等于 n 加一的临界值很接近。例如单边阿尔法等于零点零五时,自由度四和自由度五的临界值相差还比较大,有零点一之多。 但自由度为二十九和自由度为三十的临界值就只差零点零零二了。 这是因为我们之前课程中也讲过,随着自由度的增加,替分布越来越尖。 但存在一个极限天花板,就是自由度趋近于无穷大时,替分布就趋近于标准正态分布。其实自由度为三,实时替分布和标准正态分布的差别 也就不大了。那么自由度等于六十和自由度等于八十的替分部就和标准正态分部更相似了。 df 等于六十和 df 等于八十的自由度相差二十,单边 f 等于零点零五的临界值仅仅相差零点零零七。 所以替临界值表的最后没有把不同的自由度以加一递增的方式都列出来,因为自由度加一的替分部实在是差别不大,没必要都列出来, 而只是列出了六十、八十、一百、一千这几个自由度,最后列出了一个 z, z 分布,就是标准正态分布。现在我们稍微总结一下,首先圆角 设要写正确,圆假设要是写错了,单双边尾巴的位置就搞错了,尾巴的位置搞错了,拒绝预约就搞错了,临界值的正负号就会搞错,最后结论也就错了。所以圆假设中的大于号、小于号还是等于号,一定要写对, 然后确定显著水平阿尔法是零点零五还是零点零一还是零点零零一或者更小,然后再根据样本容量算出自由度,单双边确定了,阿尔法确定了,自由度也确定了,则临界值也就可以查表确定了。 注意,这是强烈建议大家按照单双边自己画出一个替分部,给临界值标上正负号,然后按照临界 直画出拒绝玉。最后根据样本和公式算出气质,看气质是否落入拒绝玉,进而判断是否拒绝 h 零。 以上就是替临界指表的讲解,不过貌似遗憾的告诉大家,其实现在很少直接用到临界指表了,因为临界指表算是一个历史产物,在计算机还没有普及的时候,替临界指表可以方便的帮助大家进行比较和判断。 但是现在计算机普及发达了,只要我们把原甲设和各个参数写对,计算机就可以计算出一个 p 值,通过这个 p 值就可以直接判断是否拒绝 h 零。其实这节课已经看到了 p 值,只不过怕 引起概念混淆,故意没有展开讲解。虽然现在很少用到替临界指表,但不理解临界指表就很难理解 p 指。下一节课我们就来讲解 p 指,我们下节课见。


大家好,上一节课中我们学习了双样本体检验和独立样本体检验是一回事,独立 independent 不是单独 single, 所以独立样本体检验是两个样本之间的体检验,不能多也不能少,就是两个。这节课我们来通俗讲解一下样本之间相互独立的含义。 我们仍然回到上节课的故事中。一个县城有两个中学,一中和二中,每个中学都有一千个学生。县教育局想比较一下两个中学的总体英语水平,于是组织了一次统考,一中和二中考同一份试卷。 考完之后,由于时间仓促,两个学校各自的总体均分没有一和没有二,还没有统计出来。 但教育局局长非常急切,说六点下班前必须要知道两个学校的总体水平谁高谁低。我们一看表,这不都五点六十了吗?那怎么办呢?只能抽样。 于是我们赶紧跑到一中和二中的学校门口去抽样。学生们正好放学,我们在一中和二中门口分别随机抽样二十个学生,问他们英语考了多少分,于是获得了两个样本, x 一和 x 二。注意,随机抽样是个大学问,别看我们每次随机说的这么轻松,但真正做起来 可是需要非常严谨的方法的。本节课只讲独立性,暂时不对随机出样进行展开讲解。 我们获得了两个样本,一中样本 x 一样本均分 x 一磅等于七十分,二中样本 x 二样本均分 x 二磅等于六十八分。 样本均分存在差别。但是 miu 一和 miu 二是否存在显著差别呢?我们先写出原假设, h 零认为 miu 一和 miu 二没有差别, 然后通过双样本的替值公式算出一个 p 值 p 大于二方,于是接受 h 零,所以缪一和缪二没有显著差别。现在我们盯着这两个样本来看一下样本之间相互独立到底是什么意思。 但首先我们先了解两个术语,兽士 subjects 和观测值 observations。 在本例中,我们抽样抽到的提供英语成绩的同学就是兽士,是人 同学提供的成绩分数就是观测值,是数据。有了这两个概念,我们就可以比较容易的理解相互独立的样本了。 independent samples 各种教材中存在多种说法,有简单的,有复杂的,我挑了一个相对好理解的供大家参考。 independent samples 是指, there is no relationship between the subjects in each sample。 翻译一下,两 两个样本各自的授室之间没有任何关系,听起来似乎很笼统,具体是指什么呢?具体有三个方面,第一, subjects in the first sample cannot also be in the second sample。 两个样本中第一个样本中的首饰不能同时出现在第二个样本中。第二, no subjects in either sample can influence subjects in the other sample。 两个样本中任何一个样本中的首饰不能影响另外一个样本中的首饰。 第三, no sample can influence the other sample。 两个样本中一个样本不能影响另一个样本。这三个具体的方面仍然比较 图像,我们放到一中和二中的故事中来举例说明。首先看第一个方面,第一个样品中的首饰不能出现在第二个样子中。 假如我们先在一中门口抽样完毕后,再去二中门口抽样,在二中抽样时,怎么发现一个同学感觉有点面熟呢?好像刚才在一中抽过了啊, 因为他脸上有两颗麻子,不容易记错。我们一问,果不其然,这个同学就是一中的名字叫钱二麻,刚才在一中门口已经被抽到过了, 现在人家来二中找他女朋友一起去吃饭,结果就又被抽到了。这就叫第一个样本中的兽式出现在了第二个样本中。这时 x 一和 x 二这两个样本就存在关系了, x 一和 x 二就不是互相独立的样本了。实际上,这就是犯了低级的抽样错误。 我们并不是总能碰到钱二麻同学这样不凡的容貌,好让我们及时发现手势重叠了 overlapping subject。 所以抽样的时候,我们不能只把成绩记下来就拉倒了,还得把姓名、学号或者其他能区分兽式个体的信息给记下来,免得两个样本里出现重叠的兽式,导致样本之间互不独立。 你可能会说,这个例子太扯了吧,怎么会这么巧呢?事情就是这么巧,概率不就是个巧字吗?在本例中, 样本容量本来就很小, n 等于二十,只要碰上一个巧的重叠了,那可就是二十分之一,也就是百分之五的观测值就无效了。百分之五的观测值都无效了,你还能相信算出来的 t 值和 p 值吗? 你可能还会说,那被抽到两次的同学自己就不会吱一声吗?那你就想多了,作为研究者,我们自己不把抽奖方法弄严谨,还指望兽士们自觉吗? 这就是为什么考试监考的时候要查一下考生的证件,把证件照片和考生人脸比对一下,以免出现替考。替考就是其他考场中的受试出现在你的考场中。 假如你的考场和其他考场存在竞争关系的话,那么这两个考场就不是相互独立的样本,也就根本没有可比性了。 下面再看第二个方面,任何一个样本中的首饰不能影响另外一个样本中的首饰。 不知道大家有没有看过一部电影天才枪手,讲的是一个天才考生去国外考试,考完之后提前交卷,答案记下来传回国内。 国内和国外考的是同一套试卷,但国内和国外存在时差,所以国内还没开考的同学就可以提前知道答案了。那么在一中和二中的故事中,假如一中也有个天才同学,半小时就做完了试卷, 并且通过某种方式把答案传给了二中的不止一个好朋友。而我们在一中和二中抽样式,恰巧把天才同学和他的好友都抽到了我们的样本中。 那么虽然两个样本中的兽式没有重叠,但 x 二中多个兽式的观测值受到了 x 一中这个天才兽式的影响,那么 x 一和 x 二就也不是相互独立的样本。 下面看第三个方面,一个样本不能影响另一个样本。注意,这里说的是样本作为整体,而不是样本中的数式个体。例如有一位王老师,由于某些原因,同时在一中和二中担任英语老师, 王老师在两个中学上课时用的是同一套教材,放的是同一套 ppt, 布置的是同样的课堂练习和课后作业讲的是同样的笑话等等等等,全都是一样的。 然后,假如在一中抽到的二十个同学和在二中抽到的二十个同学正正好好就都是王老师教的, 那么这两个样本中虽然没有重叠的兽式,也没有作弊的雷同卷,但是这两个样本显然都受同一个王老师的影响,当然是互相脱不了干系的。 并且我们抽样的目的是调查两个学校的总体均分缪一和缪二有无显著差别,结果弄来俩样本竟然出自同一个老师, 这在常识上和感情上都是不能接受的。所以,这样明显关联的两个样本绝对不是相互独立的。 以上,我们通过一中和二中的故事,讲解了两个样本互不独立的三种情形。当然,这三种情形肯定不是包罗万象的,大千世界中两个样本存在联系的情形是无法穷尽的。 所以,大家一定要把抽样的详细过程描述清楚,因为别人并不只是看你进行了多么高超的数据计算, 而更关心你的抽样方法是否科学。否则第一步抽样就有问题的话,无论你计算出多么震撼的结论,都是毫无意义的。例如,你星期一 上午跑到一个高级商场里对消费者做幸福指数的抽样调查,结论是大家都很幸福,那我自然就要质疑你这个抽样不科学,没有代表性。 星期一上午能去消费的,我觉得肯定比我要幸福,你咋不抽让一下我呢?我星期天夜里还在做 ppt 呢,我当然这是玩笑,大家不要对号入座。 接下来再举一个常见的,故意让两个样本相互不独立的例子,这就是大名鼎鼎的 paired tea test。 例如,一个班级有二十名同学,在学期开始时进行了一次英语目的考试,然后学期结束时又进行了一次考试,试卷和 之前摸底考试是同一套试卷,目的就是为了看一看这二十名同学在经历了一个学期的英语学习后,英语水平有没有显著提高。学期开始时的考试叫做前侧 pre test, 学期结束时的考试叫做后侧 post test。 一般来说,在 paired t tests 中,每个数是前后两次的成绩和前后两次成绩的差值都写在同一列。 所以看到这样的数据格式你就知道了,这是 paired tea test。 而 paired tea test 的目的就是比较所有受试的前侧和后侧的成绩有没有显著差别。 paired tea test 常见的翻译叫 做配对体检验或成对体检验。关键词是 pair, 就是一对的意思。每个受试的前测成绩和后测成绩来自同一个受试,所以是一对,是一个 pair。 因此,我更愿意把佩尔的 t test 叫做成对体检液,而不是配对体检液。人家本来就是一对,就跟一双鞋一双袜子一样,是成对的,不是人为强行给配对的。 前侧与后侧的差值只能成对的才能做减法,不成对的当然不能相减。 paired t test 中的这两行数据,或者说这两个样本就不是相互独立的,因为这两个样本太有联系了,他们来自 完全相同的二十个手势。 paired tea test 这种实验设计本身就是故意从相同的手势中产生完全关联的、成对的、可以相减的数据,用于检验前侧和后侧有无显著差别。 所以 paired t test 中的这两个样本就不是 independent samples, 而是 dependent samples, 翻译过来叫做相互依赖的样本或简称相依样本。 paired tea test 我们会用一节课来专门讲解,本节课提到它只是为了说明什么样的样本不是相互独立的。当然,我们剧透一下 paired tea test 和 two sample tea test 的最大区别是自由度不一样。 例如在一中和二中的 two sample tea test 中,假如每个样本的样本容量都是二十的话,两个样本便一共有四十个成绩来自四十个手势,那么这个 two sample tea test 的自由度是二十减一加二十减一等于三十八。 但是在 paired tea test 中,每个样本也是二十个成绩,一共四十个成绩,但只来自二十个手势,所以这个 paired tea test 的自由度是二十减一等于十九。 以上就是在独立样本体检验中关于两个样本相互独立含义的讲解。再次强调,样本之间的独立与否是很难界定的,你不可能 能通过一种公式去计算两个样本是否相互独立,而只能通过科学的抽样方法和实验设计来最大限度的保证样本之间的独立性。所以请把你的瘦式群体抽样方法都描述清楚, 人家才好判断你的样本是不是独立的,才好去决定要不要相信你的结论。最后,我们通过一个思考题来说明为什么不能通过计算来判断两个样本是否相互独立? 在刚才钱二麻同学的故事中,他考了六十六分,被抽样抽到了两次,因此钱二麻的六十六分同时出现在 x 一和 x 二两个样本中,因此这两个样本不是相互独立的。这时,假如我们进行 抽样补救,把 x 二中钱二麻的六十六分拿掉,然后再在二中门口重新抽取另外一个同学的成绩来替换钱二麻的六十六分。然后好巧不巧,新抽到的这个同学英语成绩正好也是六十六分。 这就很尴尬了。替换前和替换后这两个样本在数值上没有发生任何变化,输入到统计软件中算出来的批值和批值也完全没有差别。 但是替换前两个样本就不是相互独立的,替换后两个样本就是相互独立的了。所以说,样本是否相互独立不能靠计算得出。但这时你肯定会问,既然 结果都一样,那样本独不独立有区别吗?重新抽样补救有意义吗?这是一个很玄乎的问题。 个人认为这既是一个哲学问题,也是一个信仰问题。说是哲学问题,是因为数学科学本来就是从哲学中分化出来的, 数值上没差别,但抽样方法不同,说明认识论不同,是哲学本质上的不同。说是信仰问题,是因为在科研工作中,无论结果如何,难道都该遵守科学的方法吗? 这是最起码,最起码的科研良知,而良知就是天理,良知就该是信仰。好,又扯远了,最后的最后 肯定会有同学问,独立性是可以检验的啊,咖坊检验就是检验独立性的啊,大家不要着急,到咖坊检验的时候,我肯定会给大家讲不一样的故事。为了不过早的把太多的术语搅混在一起,这里我就不多讲了。 这节课的参考文献列在此处,供大家课下自学,或者做英语阅读练习,我们下节课见。

大家好,本节课我们来通俗讲解一下统计学中最基本的两个概念,正态分布和中心极限定理。 谈到统计学,大家必然会想到抛硬币,所谓抛一个均匀的硬币,得到正面和反面的概率都是二分之一, 我们就从抛硬币开始,给大家抛出一个正态分布来。我们先抛十次硬币,并把它记做第一组实验,其中白色空心代表抛硬币得到正面,黑色实心代表得到反面。那么第一组实验的结果是六次正面,四次反面。 我们重复进行一百组实验,每次只记录正面出现的次数。得到这样的结果,第一组是七个正面,第二组是九个正面,以此类推,我们都 得到一百个数字。现在我们把这一百个数字在坐标轴上画成直方图。例如,七出现了九次,便在坐标轴上七这里画一个高度为九的柱状图。 四出现了二十三次,便在坐标轴四这里画一个高度为二十三的柱状图。以此类推,就得到一个正面次数的频次分布图, 而这个分布图的轮廓像一个铃铛形状的对称曲线,这就是正态分布曲线。于是我们通过抛硬币抛出了一个正态分布曲线。 不仅如此,假如把这一百个数字加起来除以一百,也就是总体平均值等于五左右,而正太分布的对称轴正好也是五左右。正太分布最早是由法国数学家提莫 服务提出的,然后由德国数学家高斯完善的,所以正在分布也叫高斯分布。下面我们引入一种更简易的抛硬币的实验装置,假如有一个光滑的圆钉子和光滑的圆豆子,豆子落在钉子上,向左向右滑落的概率都是零点五。 我们把向左当做抛硬币,抛出了正面,把向右当做抛出了反面,这种装置叫做加尔顿板。假设他有十行钉子,那么一颗豆子落下要经过十行钉子,向左或向右相当于抛了十次硬币。 假如豆子落到了左边第二个槽子,说明其中只有一行钉子是向右的,九次都是向左的,也就相当于抛了十次硬币,只有一次反面,九次都是正面。我们把 把加尔顿板变成了虚拟仿真程序,假设有一百颗豆子,十行钉子,每行钉子向左向右概率都是零点五,我们来演示一下,可以看到程序结果和抛硬币的结果是一样的,也是一个正台分布轮廓。 下面我们改变实验参数,刚才是十行钉子一千颗豆子,现在是二十行钉子一千颗豆子,结果仍然是正态分布。讲到这里大家可能觉得没啥意思,这是因为豆子和钉子都是圆的,光滑的, 左右的概率都是零点五,豆子落下中间多两边少,符合你的直观预测。下面我们把每一行丁字的左右概率都设定为随机的,再放一千个豆子。请大家猜一下落下的豆子是什么轮廓呢?有的同学猜可能跟噪声一样,是一个一字, 有的同学猜可能跟股票大盘一样参差不齐。下面我们揭晓结果。可以看到,在左右概率随机的情况下,仍然是一个光滑的正态分布,有没有感觉有点神奇呢? 这时我们引入通俗版本的中心极限定理,供大家感兴理解。若一个结果是由大量的不相干的 随机因素叠加导致的,那么这个结果一定表现为正态分布,而正态分布的中心,也就是其对称轴必然等于总体均值。 例如,某一省份几十万考生的英语原始成绩必然呈现正态分布,而对称轴的位置必然是所有考生总体的平均分。这是因为每个考生相当于一颗豆子。 考生一生中会遇到无数因素,每个因素都会使其高考英语成绩要么更高,要么更低。每一个因素看成每一行钉子,成绩更高看作豆子向左,成绩更低看作豆子向右,每行钉子向左向右的概率都是随机的。 那么一个省份几十万考生的英语原始成绩就相当于几十万颗豆子,经过无数行钉子落入最下面的槽子里,必然是一个正态分布。 而这个高考成绩的正态分布中,极端的高分和极端的低分必然占少数,都在尾巴上,而大多数考生的分数必然在中间,不太高也不太低。 这就是孔子所说的中庸者,不偏不倚,无过不及。而平常之理乃天命 所当然,京微之极致也。虽然正在分布是由外国人提出和完善的,但我们的祖先早在公元前其实就已经思考出了中心极限定理的哲学启示。 个人认为,孔子说的和中心极限定理是完全一致的,中便是中心,庸便是长,正常平常长就是永远不变的东西。 极限便是极致,而不是极端。追求极端的高分不如手中,不如追求极致的中心,而中心就是本心、初心。 假如一个豆子代表一个人,一行钉子代表一件事情,无数个人做无数件事情,相当于无数个豆子经过了无数行钉子后落到 槽子里,事情做的有好有坏,斗字向左向右。只有极少数的人才能把所有事情做的都很优秀,也只有极少数的人才能把所有事情都办糟糕。但大多数人办好办坏的事情都有,大多数人就是平常之人, 这就是我们对社会的支持。假如所有这些钉子代表一个人的内心, 每行钉子代表这个人的一种思绪或影响因素。假如一颗豆子代表这个人所做的一件事情,那么一个人一生中做无数件事情, 每个事情都要经过内心的层层考虑,最后这个人回首一生所做的事情,只有极少数做的很完美,也只有极少数做的极其糟糕, 大多数事情都做的不好,不差,有一个忠心,这就是这个人的本心或初心。人只有通过实际践行无数事情,才能找到自己的初心。 当我们把这两个正态分布摆在一起时,发现社会的中心和个人的中心竟然是一致的。 但一个人仅仅知道社会的知识是不够的,一个人需要去践行,去亲身做,才能实践出自己的本心,才能真正的印证个人的初心和社会的初心原本是一个心,我们把这个中心或初心就叫做良知。 我把社会知识和个人践行的一致,叫做知行合一。无数人的初心叠加起来,就构成了社会的重 中心,这就是社会规律,或者叫道理。所以王一鸣说,心急理,并且要治良知治就是极致的意思,人不能只口头上说懂得了,人需要像豆子一样脚踏实地的落下去, 反复的坚持实践,才能达到自己的极致,印证自己的初心。本节课就到这里,希望大家课下可以思考一些现实生活中符合正在分布的例子,也希望大家思索一下自己成长过程中的实践和感悟,不忘初心,坚持实践。


大家好,我们已经学过了单双边体检验的基本概念和原理。这节课我将尝试通俗讲解一下体检验里的一个重要概念,自由。 do degrees of freedom, 简写为 df。 我仍然先杜传一个故事。小时候,我家门前有个小饭馆,里面只有几种简单的炒菜 菜单贴在墙上,价格从高到低排列下来是,红烧肉七块钱,宫保鸡丁六块钱,油焖茄子五块钱,鱼香肉丝四块钱,西红柿炒蛋三块钱, 青椒土豆丝两块钱,炒大白菜一块钱。有一年过年,爷爷给我二十块钱压岁钱,我准备带爷爷去小饭馆 搓一顿。我有两个目标,第一要点四个菜,第二,四个菜的价钱加起来正好是二十元。我要把压岁钱全部花光,一分钱都不剩。 我开始点菜,宫保鸡丁六块钱,鱼香肉丝四块钱和西红柿炒蛋三块钱。这三个菜可以说是我自由选择的,但第四个菜我就没得选了,因为前三个菜加起来是十三块钱, 要想凑齐二十块钱,第四个菜只能选七块钱的红烧肉。所以说, 虽然表面上是点四个菜,但为了满足总价等于二十块钱这个限制条件,我其实只能自由的选择三个菜,而第四个菜的价钱是被前三个菜决定了的, 第四个菜不能自由选择。换句话说,我点四个菜的自由度其实为,四减一,等于三。 假如我们把点菜看成抽样,那么这个样本就可以记做 x 一、 x 二、 x n x 四样本容量 n 等于四。限制条件是总价必须等于二十块钱,可以记做 x, 一加 x, 二加 x, 三加 x 等于二十。 变换一下形式就可以写成样本均值 x 八,二等于 x 一,加 x 二,加 x 三,加 x 除以四等于五。 样本中 x 一 x 二 x x 这四个变量能自由变动的只有三个,一旦其中三个变量确定了,第四个变量便也就确定了。所以说,第四个变量是不可 可以自由变动的。于是,在样本容量 n 等于四、样本均值 x 八等于五的条件限制下,这个样本的自由度 df 为 n, 减一等于三。 回到我们之前讲过稻田亩产量的丑样,其样本容量为 n 等于二十,样本均值为 x 八等于一千三百六十四。这个样本由二十个变量组成,这一组二十个变量中,能自由变动的变量只有十九个。 一旦其中十九个变量确定了,为了满足 x 八等于一千三百六十四这个限制条件,第二十个变量就只能计算出来了,是确定了的,是不能自由变动的。 所以,在样本容量 n 等于二十、样本均值 x 八等于一千三百六十四的条件限制下, 这个样本的自由度 dfvn 减一等于十九。这个就是自由度的通俗讲解,当然也是非严格数学意义上的,为的是方便大家感性理解。 那自由度有什么用呢?不同的自由度提分布的形状是不一样的,如图所示,这是一个通过理论计算获得的不同自由度的提分布曲线。 蓝色的曲线代表自由度, df 等于一的提分布。绿色的代表自由度,等于三的提分布,橙色的代表自由度,等于十的提分布,红色的代表自由度,等于二十的提分布。 我们可以发现,自由度越大,提分布的曲线就越尖,但是曲线不会随着自由度的增加而无线变得更尖。 存在一个天花板,这个天花板就是这条黑色虚线,这个黑色虚线代表的就是标准正在分布, 标准正态分布就是均值六等于零、标准差 c 个码等于一的正态分布。所以说自由度趋近于无穷大的时候, t 分布趋近于标准正态分布。其实在自由度等于三十的时候, 替分部与标准正态分布之间的区别已经不怎么能用肉眼分别了。聪明的同学又会问,为什么不直接用样本容量 n 来区分这些不同的替分部呢? 而非要再减去一个一变成自由度来区分替分部呢?这是因为我们目前讲到的 t 检验还是比较简单的单样本 t 检验, 例如上面这个稻田亩产量的体检验,就是单样本体检验及拿单个样本的均值和一个总体的均值去比较。单样本体检验中自由度等于样本容量减一。 但后面我们马上会讲到双样本体检验、配对体检验、卡方检验等,在这些检验中,样本容量和自由度的关系就不是减去一这么简单了,所以不能简单的用样本容量 n 来区分不同的替分部。 下面我们通过气氛部的虚拟仿真实验来验证一下不同自由度的气氛部曲线形状。 例如我们分别取样本容量 n 等于六和 n 等于三十一来进行单样本替分部抽样实验,获得的便是 自由度等于五和自由度等于三十的替分部。我们看到自由度等于五的替分部很扁,自由度等于三十的替分部很尖,这和我们刚才看到的理论计算出来的曲线是一致的。 这就是本节课关于自由度的通俗讲解,希望大家记住点菜的这个故事,总价一定点 n 个菜的话,自由度其实只有 n 减一。这节课就到这里,我们下节课见。


主管身边的辨析数,他是比较相对离散程度用的,那么这个百分等级啊,他是来比较,哎,两个数或几个数大小用的,说白了他的作用叫做比较大小。比较什么大小呢?比较两个数的大小,哎,如果是多个数呢?我们可以量量的比较,比较两个数,或者说多个数的大小。 哎,这个跟咱家的辨析数有什么区别啊?辨析数呢,它不是比较两个数,它是比较呢。哎,两列数,它是比较两列数,所以它的区别是不一样的, 他的对象是不一样的,他是比较两列数,哎,两列数据的什么呢?相对离散程度,他是两列 二,我们这个呢,是比什么呢?两个啊,那叫两个谁大谁小啊?是两个数,直接比不就行了吗? no, no, no, 比不了。为什么呢?我给大家举一个例子啊,咱们看看他的背景,例如我们说,嗯,小张,他的语文成绩, 哎,叫 x 语文考了多少分呢?哎,考了九十分,哎,小李,他的 x 数学考了多少分呢?考了这个二十九分。那么你说谁的成绩好呢?想象是不能比较的。为什么不能比较?你这个东西是语文成绩,我这个东西数学成绩我们不能比啊。对,同学们, 我们往往的一些数据呢,是比不了的,我们这种情况就要比,怎么办呢?还好吧,我把他们画成相对位置, 在这种情况下就产生了百分等级,所以同学们,他用于比较两个不通知的原始分数,到底谁大谁小, 我们把它画成相对位置。你这个语文在你们班的成绩是排多少名?我这个数学成绩在我们班排多少名,咱比较名次,这个思想又产生了百分等级,那我们来看一看两个基本概念,一个叫百分等级,一个叫百分位数。哎,这两个公式啊,这两个定义,他到底是什么意思?提到百分等级, 百分位数呢,不得不提及一个叫做累加曲线的概念,咱们大家看看,这个曲线叫累加曲线,横轴上放着呢,叫做原始分数,这个原始分数呢,我们称之为百分位数 啊,这是个百分位数,众筹哎,叫做百分等级。这里同学们,咱们这里给他做一个备注啊,百分位数呢,他呢,其实就是原始分数, 百分位数呢,他叫相对当今相对位置,这个相对位置呢,同学们啊,实际上是零,零是最小的,一百呢,是最大,零是最小的,一百是最大。 那我们看一看他这个代表什么含义?同学们,例如我们达到五十这个点,像这个曲线呢,有垂线相交于横轴,还是啊,咱们就相交于八十这个点,那么这里呢,我们可以这样认为,叫做 p 五零等于 八十一,其中 p 五零这个东西,我们叫做,哎,我们把它叫什么呢?我们把它叫做百分位数, 八十一就是这个百分位数,百分之十多少呢?是八十一,那这里的五十是什么意思啊?同学们,这里的五十呢,就是八十一对应的等级排名,人说低于八十一分的占了总体的百分之五十啊,小于等于八十一分的分数占了百分之五十,那么就说呢,八十一这个分在这个班里面啊,在这个团体里面是中有水平, 同理,我们还可以得到这样的量,如果是,这是一百,哎,啊,小事啊,得到了九九分意味着什么事呢?呦, 一小于等于九十九分的,占了总体的百分之一百,那意味着什么呢?九十九分是这个班里的第一名最高分小于等于他的占了百分之一百,对不对?哎,这他是最高成绩。这位同学们啊,咱们要搞清楚啊,动轴是百分等级, 杭州是百分倍数,百分倍数是一个原始分数,百分等级啊,是一个相对位置,那百分等级我们通常用这个字母来表示,大家看一下, 百分等级通常用 p 啊表示,而且我们说 rank 顺序的意思。百分等级呢,我们常常用 pp 来表示啊,通常用 pp 来表示,注意啊, 这是两个字母啊,啊,同学们,我们知道了,那么如果说语文和数学来比较非常简单,我在这里面呢,我就求他的语文成绩的百分等级,我这里面就是他的数学成绩的百分等级。然后呢,哎,我比较他们的百分等级,谁的百分等级大,谁成绩就好,谁的百分等级小,谁的成绩就差。这同学们,咱们呢,就借助百分等级这种相对位置哎, 来比较两个数的大小啊,这也没什么,这很简单,确实很简单。那么同学们,百分之几这里,我们家里考试的时候,我们考哪一个公式呢?哎,同学们,这公式大家记住啊,这公式叫排名百分等级公式,这个公式将来大家复习英考的时候呢,是必考的。那我们看一下, 这里的 pr 就是百分等级,这里的 r, 大家记一下, r 呢叫做排名,嗯, r 叫排名,对吧?这里的 n 是什么呢? n 是总的数据个数,嗯,懂的,数据个数, 这个故事到底怎么考呢?我现在给大家举一个例子,例如我们现在举一个这样的例子啊,同学们,来来来,我们说啊,现在呢,呃,总共有五十个人,一个班有五十个人,其中呢,小明呢,他考了第三名,我问他的百分等级 pr 是多少,你看, 那我们现在求这个 pr, 这里面 n 是多少呢? n 就是五十,这里的排名是多少呢?排名二二九三。那咱们这种情况下呢,要计算百分之几就用到了这个公式,那我们来算一算吧, 有小明的是不是啊?啊,就等于一百减去一百呢,乘以三啊,一百乘以三,你看,一百乘以 减去呢,五十总共有多少人?总共有五十个人,那么说,三百减去五十等于二百五,二百五除以五十呢等于五,一百减五呢等于九十五,也就说我们按这种哎,公式呢,算出来,他的百分之等级是九十五,也就说,哎,比小明低的哎, 小于等于小明这个分数啊,占了总体的百分之九十五。同学们,这个公式大家会用哦,嗯,这个公式会用,这叫做排名百分等级公式。那同学们,这公式有没有适用范围呢?老师来告诉你,他有受范围。这个 n 呢,我们有一个条件限制,那一般是大,相反,大于等于三十人,三十以上 人说,如果你这个 n 呢,太小了,你十个八个,那么这个公式啊,他就失效了,因为这个 n 呢,越大越好,越大呢,算出来的数据呢,就越准确。对,这个公式呢,也是一个近似的同事,而不是在 n 为任意值的时候可以使用 n 呢,是大数据,大要买吃好。同学们,这是咱们讲的百分等级的 排名,百分等级计算公式,哎,这个呢,需要你们掌握哦,这些都比较简单,想必大家都很清楚了,那我们来看一下读过二十的标准分数,嗯,那我说有了百分等级,为什么还有追分数呢?因为我们现在发现了一个百分等级的致命缺点。什么缺点呢?大家跟我看一下。百分等级的缺点, 说百分等级这么好,有两个数,我通过计算他的百分等级就能比较大小一个,我排名我也能算百分等级。通过百分等级,我知道你们俩谁好谁坏。那现在咱们要问大家,这个百分这么好,为什么还有发明这一分数呢?我们说百分等级虽好,但是他有一个缺陷,他的缺点是什么呢?大家给我看一下。来来来,咱们在这里呢,做一个唇线, 你看动轴差十个单位,我看一下横轴,呦,你看动轴差十个单位,这个从一百到九十,哎,这十个百分等级跨越的分数有这么宽,如果我们在中间这一块去做中间这一块也是跨越十个单位, 但是他跨越的分数怎么样?非常的窄,那如果底端也跨越十个单位,哎,你看他的跨越单位就宽一些,这意味着,哎,意味着一个事实。什么事实呢?就是我们说的两端, 两端单位大,中间单位小,也就说百分等级啊,他是无相等单位的, 嗯,没有相的单位,哎,老师,你说说他有相的单位的是什么情况?如果有相的单位啊,那这条线应该一条直线啊,他,他的这个斜率啊,处处相等,现在你看既然两端这一块呢,变化慢啊,就这画做切线,这个是和 x 平行的,厉害,中间这块呢比较陡峭,哎,无相,那无相的单位呢?在咱们哎统计里呢,被我们称之为顺序数据, 说这类数据呢,他有个特点,他只能排序,排序呢就是用于大小比较,但是呢,他不能进行加减,更不能进行长出,而这两个用这两种代数运算, 他是通通不能做的,哎,对同学们百分等节随好,他不能够进一步代数运算,这就限定了他的使用范围。 那么我们要发明一个能进行带数晕扇的一个相对位置量数,因此在这种背景下,标准分数就诞生了。