哈喽,大家好,那我们今天继续往下去讲我们统计学的小知识啊,我们前几次讲的这些知识, 包括均分呀、标准差呀、方差呀,这些其实都是对我们的原始数据原始分数去做的一些统计和处理,你可以把它都归为原始数据原始分数的这个大的类别下。那我们今天要分享的其实是统计中的一个更高级的概念啊,我们称之为标准分数, 这个东西为什么他说更高级,而且其实是更实用的?你举个例子,如果你现在走在校园里边遇到了你的一个同学啊,你问他说,哎,你的期末考试数学考了多少分呀?他说我考了七十分, 那这个七十分你可能接着会问满分是多少?他如果说满分是一百分的话,你大概心里有一个数,七十是一个相对中 等偏上一点点的分数,我们可以简单称之为良好。但是这个七十分的含金量有多少?在他们班里边七十分是属于高的分数还是属于低的分数呢?这些你都是没有概念的, 所以七十分是一个原始分数,我们要把所有的原始分数放到一个可以共同 参考和去度量的一个标准体系下,让我们更好的知道他代表的位置和他的含金量和他的这个价值性的话,我们可能就需要另外一个概念和体系了,这个概念和体系我们就称之为标准分数。 我们继续来详细的去看一下我刚刚说的这个七十分的含义啊,我画的这个图画画水平实在是有限,大家包容一下,我们可以发现,假设这个是 a 班,然后这边是 b 班,那我们可以发现啊,两个班的平均 分数可以都是六十分。在这样子的情况下,如果你的同学在 a 班得的是七十分,你能够很明显发现,他的七十分在 a 班里边是属于少部分偏高的分数,也就是说在 a 班七十分是一个高分的分数了。 但是我们同样发现,在 b 班,他的七十分可能只是一个中等偏上的分数,远远可能有比七十分更高的八十甚至九十的分数。那么在 b 班,你同学的七十分可能就是一个中等的成绩了。 那有同学可能就想到了,我们要去对比两个数据分布的差异性,可能会用到我们上次讲到的标准差。 所以说大家这么来想啊,我们在 a 班和 b 班七十分同样都是高于均分十分的一个分数。但是假如说在 a 班标准差是五分,在 b 班的标准差是二十分的话,那我们就可以去推测,在 a 班七十分也就是相当于高 高于了平均分两个标准差,对吧?他的标准差是五分,那么在 b 班七十分的分数相当于只高于了平均分零点五个标准差, 那我们大概心里就会有一个这个差异性的概念啊,也就是说,这个七十分在 a 班和 b 班的位置是完全不同的,一个只是高于了零点五个标准差,而另一个是高于了两个标准差的分数。所以说,当我们知道 军分以及知道这个人的分数高于或低于军分多少个标准差的时候,我们对他的分数会有一个更清晰的概念和认识, 而这个就是我们在统计中一个很重要的概念,叫做 z 分数。所以啊,在任何一个已知平均数 和标准差的数据样本和数据的这个统计中啊,只要我们知道了平均数,知道了标准差,我们都可以求出你的 z 分数。 那我们现在又知道了一个了不得的重要的东西啊,叫做 z 分数。那我们现在来算一下,刚刚我们说,假设我们已知 a 班的均分是六十,他的标准差是五分, 那我们说一个考七十分的同学啊,他的 z 分数是多少呢?其实就是我们说 z 分数等于他的分数高于均分多少个标准差,那么这样算出来其实是等于二,你就说他的 z 分数啊,就等于二, 那我们再来看,如果是在 b 班,同样均分是六十,他的标准差是我们说二十分,那七十分是什么呢?我们知道七十减去六十,再除以一个二十,其实他等于零点五,所以他的这分数是等于零点五的。所以你会发现啊,如果你的朋友他考了七十分,然后他的这分数是二,那你就会知道这是一个相当不错 错的成绩,相当不错的分数,因为他高于了标均分,两个标准差啊。但是如果你的朋友他考了七十分,但是他的标准分,也就是我们都说 z 分数啊,只有零点五,那你大概知道这可能只能算是一个一般的成绩了。我们说这个二和零点五,他都是正, 这个证号是有很重要的含义的,他说明你是高于军分等,也就是说你比大堆的人要成绩好。那我们再来算一下,假如你的朋友在毕班,在这个比较难,成绩比较好,比较难一点的班啊,他考了四十五分, 我们来算一下他的这分数是多少,也就是说四十五分,然后减去六十分的平均分,再除以二十的这个标准差,那么算出来是多少呢?上面是负十五除以二十,也就是说他的 内分数是负的零点七五,也就是说他要比平均分再少零点七五个标准差,那也就是说你看到这个分数,他的这分数,你大概就知道你的这位朋友在班级里边是比中不溜的,这些人要再少一点点的 不太好的成绩啊。那么我们说,因为这一分数啊,他是没有任何的测量单位的,所以我们要把它称之为标准分,英文名叫做 standardize the score。 为什么我们称之为标准分,或者说他没有任何测量单位呢?大家可以去想一下, 我们在计算方差的时候,上面的分子部分啊,他的单位可能是分数,比如说七十分或者是七十厘米,减去均分六十厘米,就是这个距离, 然后除以的是个数,你可能是用的分数分值,或者是米,或者是平方,或者什么什么之类的,这些除以了个数,他的单位是不一样的。但是我们在计算自己分数的时候啊,他的分子是可能是分数,比如说我们的均,你的得分和你们班级的均 分,那他的分母这个标准差,他还是分数上下两个的单位是一致的,所以这样子一除之后,他就等于没有单位了,所以我们把它称之为标准分。 那么这份书有一个非常大的优势是他为所有不同单位之间或是不同体系下的这些东西去提供了一个对比的可能性。举个例子, 呃,如果你的朋友他的数学是在班高于班里均分一个标准差,但是他的物理高于了班里均分的两个标准差,你不需要知道他到底考了多少分,你就大概知道他的物理成绩是要比数学成绩好的。 哪怕他的物理成绩考了六十,但是数学成绩考了八十,那也意味着他的物理成绩会更好。所以说,大家能够理解为什 这分数变得这么重要了吧?是因为有了这分数,我们就可以忽略原始分数的所有这些可能会带来干扰的一些 局限性,而去更好的知道他在群体中的价值,他的含金量和他所代表的含义。这是为什么标准分数对于我们来讲其实比原来是分数高价值的原因。