粉丝4.8万获赞12.9万

如何理解致信度百分之九十五?致信度什么意思?致信度也可称为致信水平,是指总体参数值落在样本统计值某一区内的概率。致信区间,是指在某一致信水平下,样本统计值与总体参数值间误差范围。致信区间越大,致信水平越高。 比如说某人有百分之九十五的把握,高考分数是五百五十到六百五十,那么致信区间就是五百五十到六百五十,致信度就是百分之九十五。是不是很好理解?

事情我已经帮你调查的清清楚楚。嗯,那,辛苦了儿子啊,应该的,哈哈哈。据我调查,妹妹最近成绩出现问题,和他交了一个新朋友有很大关系。 这段时间每次回家之后,他那个朋友都要给他发信息,打电话,就连妹妹写作业的时候都要一边回信息一边写作业,所以这段时间他写作业都是率耳操孤,阅读也是敷衍了事啊。他们一天到晚聊什么 我都看过呀。你偷看你妹妹聊天记录啊。不,你让我秘密调查,我不去偷看我怎么提供情报给你啊。行行行,你聊什么?他们就是聊一些女孩子可爱的东西,还有一些游戏角色,他那个朋友还经常叫妹妹上线打游戏呢。 嗯,那通过这个聊天记录应该可以得出一个结论呢。没错,他这个朋友学习不太好, 哈哈哈,不,你一天到晚盯着男女干嘛。哎,不用管了,反正这个事情啊,我跟你妹妹好好聊一聊,哈哈哈。爸爸,嗯,我交的这个朋友他人很好的。是吧,上次别人嘲笑我,他还帮我说话。 那你的朋友确实很好啊。嗯,我也觉得你这个朋友很好,一个好的朋友就犹如这瓶鸡鸭尿啊, 但朋友虽好,也不能贪杯呀。哈哈哈,什么意思啊?你哥的意思就是说呢,虽然是朋友,但也没必要把所有时间全部用来维护友谊上面的。你看你这段时间聊天聊的啊,作业,作业质量差啊,阅读也不好好读。你那朋友是不是学习习惯不太好啊? 他学习是不好,但是我觉得这个朋友应该交。确实应该交,但问题是不好,但是我觉得这个朋友应该交。确实应该交,但问题是不好,但是我觉得这个朋友应该就比较丰富了,知道吗? 啊哈哈哈,先做事,儿子,我也有学习不好的朋友,但是我们有共同的爱好啊,拼模型呢。还有他虽然学习不好, 但是他那一身游戏的装备是真好,跟他在一起做游戏杂志还可以蹭他的装备。少提了呀。一开始的时候,他也会每天给我发信息,打电话,叫我上线玩游戏, 但是我毕竟有自己的事情要做,所以我就跟他讲,我没有时间,我要干嘛干嘛干嘛,时间长了之后,他也就大概知道我在什么时间要做什么事情。嗯,最后我们就把玩游戏的时间定在了周末。 但是现在我们的关系还是很好啊。你看妹妹,哥哥虽然也交朋友,但是他没有因为朋友圈坏习惯而影响自己的生活。所以呢,你又这么啰嗦,择其善者而从之的下一句是什么 棋?不善者而改之。没错,所以你可以欣赏和学习你朋友的优点,但不能因为他的缺点而影响你本来的生活习惯和节奏,明白了吗?嗯,你看问题已经解决了,我现在可以去泡面了吗?哈哈哈哈。


我一般面实习生或者校招生的时候问统计学知识呢,其实都不会刻意去刁难大家,一个基本的底线就是问到常见概念,得要能清楚的说出来,但就是这么简单的一个要求,平常都能够卡掉百分之八十的人,经常会碰到那种好像懂一点,但说又说不明白的候选人, 而这里面最容易胜任的概念就是知性度和知性区间。但凡是面试的时候说我有百分之九十五确定这个结果正确的,或者我有百分之九十五的把握确定结果落在一个区间内的,都是在捣浆糊的。 你要想讲清楚知性度和知性区间,首先得要搞明白点和区间的概念。我们还是结合业务里的例子来看,假设你负责一个页面的转化效果,最近做了个调整,想看看有没有提升转化率。你拿到数据之后一算,转化率是百分之五点二,那这个百分之五点二就是一个点,它是你根据当时观测到的用户情况算出来的一个数, 明天用户一变,这个数可能又变了,并不能代表那个真正的转化率。所以呢,你就很难确定这个具体的点准不准,靠不靠谱。那业务方不知道这个结果背后到底有多大偏差,决策就会有风险,这个时候就可以引入区间的概念, 区间呢就是一个范围,他可以告诉你算出的这个点到底确定性如何,所以给区间会让你给的点更有安全感。那知道了点和区间的概念之后,我们就好来说知行度和执行区间了。那为什么刚才说如果一个投资者把百分之九十五的执行度解释成我算出的区间有百分之九十五的概率包含真实值是错的呢? 是因为区间一旦算出来,要么包含真实值,要么不包含,没有什么概率以说。所以算区间它是一种方法。 用上面提到的例子来说,我们希望通过这种方法能算出一个范围,然后让真正的转化率能够在这个范围里面。那制定区间就是这样一个用我们观测到的样本数据算出的可能包含真实转化率的区间范围。但是这种方法你不能只算一次啊,算一次未必准啊,你得多算几次这个结果才严谨, 在你跟老板和业务方汇报的时候,你才有信心。那知性度指的就是,如果你重复算了一百次,其中九十五次算出来的区间都包含了真正的转化率,那知性度就是百分之九十五。所以知性度不是对某一个结果的信心,而是对你这套推断方法的信心。 最终你还是想致信你这个方法,以及你所观测的样本背后代表的总体同居。里面有些概念呢,确实还挺绕的。我是学生的时候,我也犯过这些错误, 但等我自己成了面试官才发现,这些绕的点刚好成了我们验证一个求职者基本功到底扎不扎实的试金石。如果你不想面试的时候,业务技术好不容易都过了,结果最后因为统计概念解释的不严谨不准确而栽跟头,那就赶紧扣统计学。


大家好,在之前的课程中我们学习了气质和显著水平 hurf 的概念。本节课我们来学一下自信区间的概念。 致信区间英语叫做 confidence interval, 请大家把汉语和英语都好好记一下, 因为统计学中还有其他区点,大家不要搞混。刚才认识这个词,大家在英语四级里应该学过了, 字面是自信或信心的含义, intro 可能在六级词汇里是区间的意思。区间这个概念大家在初等数学中也都学过了,例如零到一,这个区间表示从零到一的所有 指范围。致信区间的这个示意图是一个概率分布图,左右两边尾巴尖上是拒绝于双边,每一边的面积是显著水平阿尔法的一半,中间剩下的用红色阴影标出来的面积是一减二法。 中间的面积我们之前也学过,叫做接受欲,接受欲所代表的这个区间就是致信区间。 假如阿尔法等于零点零五,那么中间的面积就是零点九五,则这个区间就叫做百分之九十五的知性区间。百分之九十五叫做知性水平,英语叫做康费等死 level。 本节课我们主要解释三个问题,致信区间是什么?怎么构造致信区间?为什么 要用执勤取点?我们仍然回到之前的高考英语成绩的例子,这个 excel 表里存储着五千名学生的英语成绩,但现在我们没有权限打开这个表。 access restricted, 所以无法直接计算出五千个成绩的真实君子。但我们有权限从表中进行抽样。 假如现在你从表中随机抽出了二十个学生的成绩,这二十个成绩的平均分算出来是 x 八,等于一百三十七点六分,这能说明什么呢? 我们想要知道的是,这五千名学生总体的真实军分没有,但限于条件,我们只能抽样一次得到样本军分为一百 百三十七点六五分,这个样本均分就叫做对总体均分六的一次估计。 sgmh, 因为单次抽样均分在做标轴上表现为一个点,因此这个样本均值也叫做对总体均分 mill 的点估计。 point estimate。 既然是估计,那么我们一般都会这么表述,总体的真实均值六在一百三十七点六分左右,而这个左右实际上就是引入了一个区间的概念, 区间就表示谬在一百三十七点六五分上下浮动。那么上下浮动的范围是多少分呢?一分?三分?还是十分呢? 这个浮动范围我们总不能瞎蒙的,那怎么办呢?这时我们回到均值抽样分布的实验中,假设我们现在有权限打开 excel 表了,并且算出总体的真实均值六等于一百三十七点四一分, 然后对这个 excel 表进行一千次样本容量 n 等于二十的抽样,获得如图所示的均值抽样分布。我们发现均值抽样分布的对称轴正是总体的真实均值。谬, 在一千次抽象中,除了能抽到样本均值正好等于总体均值没有以外,还可能抽到从一百三十三分到一百四十一分等等偏离没有的样本均值。换句话说,明明知道 到了真实的 miu, 也不是每一次抽样均值都是 miu, 所有的抽样均值其实是分布在 miu 左右的一个区间里, 那么这个区间在没有左右浮动的范围是多少呢?这是我们要再用到拒绝欲和显著水平了。 例如我们把左右两边尾巴共阿尔法等于零点零五的抽样画出去作为玉绝玉, 那么中间剩下的一减二法等于百分之九十五,就是我们的接受欲,这个接受欲实际上就是一个区间, 在我们这个演示用的不精确的表格中,这个区间的粗略范围是一百三十五分到一百四十分。对称轴代表的总体均值六等于一百三 十七点四一分,我们粗略的把这个区间看作在一百三十七点四一分上下浮动了二点五分,于是这个接受欲的区间可以表达为从六减二点五到六加二点五分。 注意,下面我说的这句话又比较拗口了,在明明知道总体均值六的情况下,对总体进行一千次抽样,并不是每次抽样均值都等于六的, 而是有百分之九十五的抽样落在了从六减二点五到六加二点五分这么一个区间内,这个区间的浮动范围是在六左右二点五分。那么在不知道 总体均值谬,而且只能抽样一次的情况下,得到一个样本均值一百三十七点六五分。我们假如想估计一个区间说真实总体均值谬,可能在这个样本均值左右浮动的话,那么 浮动的范围是多少分呢?就干脆也用刚才这个二点五分吧,作为这个区间的浮动范围。 于是抽样一次构造出来的这个对总体没有进行估计的区间,就叫做本次抽样的百分之九十五的执行区间。 致信区间由一个点估计 x 八和一个上下浮动的范围构成。上下浮动范围就是从这里到推出来 一个粗略的二点五分。说到这里,基本概念都抛出来了,大家可能还是有点糊涂,我们再从头捋一遍。 有个总体,我们想知道他的均值没有,但限于人力、财力等各方面原因,我们无法获得总体中每个数据来计算。没有,我们只能抽样, 所以我们只出了一次样,算出一个样本军职,我们用这次样本军职来代替或估计总体军职命,但你总不能说命就等于这次样本军职。 按常识你得说没有可能在本次样本君之左右浮动,但浮动多少呢?这时,假如我们突然有人力有财力了, 便对总体进行了一千次抽样,发现百分之九十五的抽样均值分布在谬左右大概二点五分的区间内。 然后我们又回到了只能抽样一次的进行中来,那就正好用这个二点五分吧,来作为这一次抽样均值上下浮动的范围。这就是通过一次抽样所构造的总体 miu 的百分之九十五执行区间。 由此看来,构造知性区间的关键不是抽样均值,因为抽样均值一算就算出来了,没啥不好懂的,关键是这个左右浮动的范围。 大家到这里肯定有疑问,这个二点五是怎么来的呢?在这个例子中,我们是从抽样分布中数出来的二点五分, 之所以能数出来,是因为这个总体其实就是我们自己事先造出来的,我们有权限看到所有数据,也能通过程序模拟一千次抽样。 但真实世界中,我们不可能为每一个统计案例进行一千次的均值抽样啊。 认真听课的同学肯定觉得这句话似曾相识。对,这就是第六节从均值抽样分布到替分布时我们讲过的。所以我们不可能也不用对每一个案例都抽样一千次, 因为我们有替分布。替分布不就是为了让你不用为每个案例抽样一千次而生的吗?可以说替分布预测了,或者说 总结了一切均值抽样分布,我们可以通过任何单个样本和对应的替分布反推出一个均值抽样分布。反推出均值抽样分布后,我们就可以得到百分之九十五的接受,欲去进 也就知道了致信区间上下浮动的范围。所以现在请记住,我们的任务是通过单次抽样反推均值抽样分布的百分之九十五接受与区间。但是请注意,反推出来的这个抽样分布不是来自我们所研究的这个东西, 我们所研究的总体就是这个打不开的一个笑表,它的总体谬是未知的。我们反推出来的抽象分布来自一个假想总体, 这个假想总体的均值就是从所研究的未知总体中抽样一次所获得的样本均值一百三十七点六五分。 为了避免混淆,我们把这个假想总体的均值记做没有假想总体等于一百三十七点六分。下面这句话也比较拗口,大家注意听, 我们通过单次抽样和替分布反推出来的这个均值抽样分布,就是从这个均值为一百三十七点六五分的假想总体中抽样一千次形成的抽样分布。 那么这个假想抽样分布的百分之九十五的接受欲在哪里呢?均值抽样分布中百分之九十五接受欲 的边界线和双边阿尔法等于零点零五,拒绝句的边界线是同样的边界线,或者叫做临界值。这里请大家注意,均值抽样分布中的每一条竖线都代表一个抽样均值 x 八, 所以这个零戒指是 x 八的零戒指。抽样分布中 x 八的零戒指对应着 t 分不中 t 零戒指,这个对应关系是通过 t 值公式来实现的。注意,这里的 x 八是甲想总体中的抽样均值, 这时我们通过小学数学知识把 t 值的公式变换一下,便得到 x 八零借值的基层公式。其中 t 零借值可以通过查表得到,样本标准差 s 可以通过样本算出来。我们先来查表,在 t 零戒指表中找到自由度 df 等于十九,双尾 rf 等于零点零五,也就是中间百分之九十五的 t 零戒指为二点零九三。 注意,双边剃纸零戒指表中只给出正等剃零戒指,我们心中要知道其实有正负二点零九三两个剃零戒指, 然后样本标准差 s 通过公式选注得 s 等于五点五四七,于是我们把 t 等于正负二点零九三, s 等于五点五四七, n 等于二十。待到公式中得到 x 八二零借值等于一百三十七点六五,加减二点五九 九六分。这个二点五九六就是点估计上下浮动的精确范围,这就回答了之前的问题,总体没有的致信区间中上下浮动范围到底是怎么来的? 就是用 t 零减值乘以样本标准差再出以样本容量的平方根算出来的。 之前我们讲气质公式的时候,这个样本标准差除以样本容量的平方根,当时没有详细展开, 现在大家能坚持听到这节课的话,说明大家已经比较专业了。今天我们给出这个 s 除以根号 n 的术语,这个东西叫做样本均值的标准误差,简称标准物,英语叫做 standard error of mean, 简称 standard never, 缩写为 s e, 汉语和英语的缩写都有一定的问题,把均值这个关键词给省略了。所以大家一定要明白,标准物不是所研究总体的标准差,而是所有抽样均值的标准差。 例如这是一千个样本均值的抽象分布,这一千个 x 八作为一个总体的话,这个总体的标准差就是标准物。所以体质其实可以解释为 一个抽样的均值偏离了抽样分布的对称轴多少个标准物。 现在我们回到任务目标,我们已经完全反推出了这个假想的抽象分布。 假想抽样分布的对称轴就是从所研究总体中抽样一次得到的样本均值一百三十七点六五分。 假想抽象分布的百分之九十五的接受与区间,由一百三十七点六五分加减二点五九六分算出来,也就是从一百三十五点零五分到一百四十点二五分, 这个区间就是用来估计所研究总体均值六的百分之九十五的致信区间。 这就回到了本节课封面的这张致信区间的示意图,大家现在应该都清楚了,这个分布是一个假想总体的均值抽样分布,这个假想总体的均值就是从所研究总体中抽样一次的 样本均值。现在我们来总结一下本节课开始提出的三个问题。第一个问题,致信区间是什么?致信区间是对一个未知总体的均值谬的区间估计。区间估计由两部分组成,一个是点估计, 也就是从未知总体中抽样一次所得的样本均值。另一个是上下浮动的范围。 第二个问题,如何构造出执行曲径点估计 x 八很简单,样本加起来除以 n 就算出来了, 浮动范围稍微复杂一点,要用 t 零戒值乘以均值抽样的标准物算出来。第三个问题,为什么用执行取减?有三个理由,第一,由于各种 限制,很多时候我们只能对一个未知总体抽样一次,我们总不能说总体均值六就直接等于样本均值 x 八,我们要加上一个上下浮动的范围,形成一个区间估计。 第二,在总体未知的情况下,这个样本就是我们获得的关于总体的唯一数据,要好好利用, 不要只算出个样本君之来就扔一边了。我们还可以算出样本标准叉 s, 并且进一步来估算出标准物质性区间的宽度,其实就是二 t 格标准物。 第三,其实也是很直观的一个理由,气质是从所有案例中抽象出来的,对称轴等于零,因为减 去了六零,没有单位,因为做了除法,没有任何实际意义的一个值。你不知道 t 等于二点零九代表着几只包子,也不知道 t 等于二点八六代表着多少分。 不仅如此,要算出一个气质的话,你还得有个圆甲色才能有个妙龄。但很多情况下,我们就是想抽一次药, 并没有想去做什么假设检验,也并没有想和哪个假想的妙龄去比较。我们只是想利用这个抽样做出一个区间估计。 例如在一次全校考试后,我们通过二十个同学的抽样军分算出一个致信曲径,我们就有百分之九十五的信心。康飞等词说全校军 分六应该在一百三十八分上下二点五分左右,这里又有实际的数值一百三十八,又有浮动范围上下二点五,而且还带有单位分。所以说 在这种情况下,自信区间比一个光秃秃的气质更能表达实际意义。好,这节课就讲到这里,下节课我们再来详细讲解一下这个自信水平百分之九十五到底该怎么理解,我们下节课见。

哈喽大家,今天是七条不同裤型的好穿裤子合集,显高显瘦的和慵懒有型的都会有,现在这一条它搭配起来很有存在感但是又很百搭的格子裤,是这种慵懒的阔腿裤型,黑白格的你就怎么搭都不会出错,你搭配什么颜色的上衣都给你稳稳拿捏。前面是这种纽扣的形 式,就增强了整体的设计感,型也是会比较硬挺有型的面料,穿起来就是有型又很舒服。 然后这一条不管你想穿的精致或是舒服的时候都可以选择的灰色卫裤,这条在冬天的上腿率绝对是排前三名,感觉单人的话一条可以直接过冬了。里面是这种厚厚的很舒服的牛奶绒,它还有这种香蕉裤型的剪裁会有点微微的弧度,上身都是很清爽利落,不是属于很宽大的版型, 就年龄跨度比较大,时髦和舒适两不误。然后这一条可以算是我今年穿过的微喇裤里 top 级的上身,这个版型我就是很很爱上,而且它这个水洗可以看到这个纹理感做的就很好,后兜有两个这种翻盖的设计就更有那种美式的感觉。微喇的裤型就真的可以爱一辈子, 直接跟我们穿出三七比裤型好不好,就是一看就知道你搭配一个简单款它都能够很好看。又是一条北方也可以稳稳过冬的懒人格子裤, 这一条它就是轻松可以穿出慵懒感的绒裤性棕蓝配色,这个大格子也是一眼出挑的,本身就是这种自带绒感的毛呢料子,然后里面还有加了一层厚绒,整条就超级厚实,套完这条就感觉整个人都可以暖和起来,松紧腰加上宽松的版型,整个舒适感就浪漫了。 这一条闪闪的帅帅的柳丁牛仔裤,柳丁的设计让整条更加出彩,就很吸睛,这个裤型也是巨显瘦,腿围把控的很好的一条直筒裤,稍微有一丢丢的感觉就很包容,上身就是修长的筷子腿,黑灰色系的做旧水洗也是很好搭的一个颜色,简单搭配一下就很有那种美式甜酷感。 一条很有腔调的卡其色西裤,这条它剪裁做的很好,上身是自带造型感的,就属于是你穿上身就看得出的质感。前面和两侧它是有做这种立体的横线,包括它的下摆还做了一个这种立体的捏住,让整条的版型就很好穿。虽然它是一个宽松的西裤, 但是完全不会脱穿出来就是这样一个很有型的廓形。做一条可能是本期最花哨的一条,这个它就适合搭配上半身比较素一点的衣服,就能让整体 看起来不会很挑,但是又很亮眼,风格就会比较偏甜酷。韩女裤长它会有些拖地,但是我觉得这条它不拖地的话就会差这么点意思,松紧腰加卫裤的毛圈料也是很舒服的一条。