好,接下来看一下第三小节是估计量和样本量,在这里呢,我们有三个考点,第一个是估计量的性质,第二个是抽样啊,抽样误差的估计,最后呢是样本量的计算。这三个考点啊 啊,估计量性质,车辆误差估计以及样本量的计算。好,来看一下第一个估计量的性质呢,我们把它叫做一无所有,一无所有三件事啊。估计量性质呢?什么叫做好的估计量? 衡量好的估计量的标准。第一个是估计量的无偏性、有效性和抑制性。所以我知道一无所有吗?一无所有啊,一无有,一无所有。记住三个无偏性,抑制性和有效性好。那么首先什么叫做估计量的无偏性呢?无偏 性呢?他并不是要求估计量和总体参数不得有偏差啊,不是说要求不得有偏差啊,既然是抽样,那肯定存在偏差 啊,不可能完全相同是不是?所以无偏性也不是说完全无偏差啊,他指的是呢,如果对这同一总体反复多次抽样啊,则要求各个样本所得出的估计量的平均值要等于总体均值 啊。经过多次抽奖之后,他要求各样本的估计量的均值等以总体均值好,均值等于均值,样本均值等于总体均值。无偏性的关键词是等于,看明白 无偏性的关键词是等于关键词就可以了。好,再看有效性。有效性呢,既然是抽样啊,那估计量和总数 之间,参数之间一定存在着误差啊。衡量这个误差大小的指标就是方差,方差来体现差异。体现误差啊,好,方差越小,也就误差越小呗,先用方差来体现误差特差异好,那意味着方差越小,这个估计量的代表性就越好。是不是 方差越小,误差越小,那不就越准确吗?所以大家记一句口诀啊,什么体现了估计量的有效性呢?方差越小越有效,方差越大越无效。方差越小,代表性越好,越有效。明白了吗?把这句话记下来就可以。 最后来看一下一致性。估计量的一致性呢,它是随着样本量的增大,样本量的值呢?如果稳定于总体参数的真值。注意啊,这个一致性,它的关键词是稳定于样本量 量的值,稳定于总体参数的真值。那这个估计量就由一致性可以称为是一至估计量,掌握了吗?所以啊,这儿要和无偏性相区别。无偏性呢,是样本的均值等易总体的均值,它的关键词是等于无偏。 而一致性是稳定于总体的参数,稳定于总体参数,所以当看到等于,那是五偏性。当看到稳定于或者叫收敛于总体的参数的值。好,那这个就叫做一致性。 稳定稳定一致性啊,一定一定。相对应无偏无偏是相等有效性,是方差越小越有效。把这个一无所有三件估计量的性质标准对号入座,他的概念好。这道题在抽样,在抽样估计当中,随着样本量 增大,如果估计量的值稳定于总体参数的真值,看到稳定于选择谁看到稳定于选择的是意志性,一定一定。相对应稳定性是稳定于,就是意志性的代名词。 无偏是平均样本均值等,以总体均值叫无偏。有效性是方差越小越有效啊,没有确定性。所以这道题我们选择 a 考察概念题 总体参数的无篇估计量的方差小与其他无篇估计量的是什么?好,你看无篇估计量的方差,方差越小越有效呗,这体现的是有效性啊,选择 a 才是我们要的正确的答案。 好,接下来我们再来看一下抽样误差他的估计。抽样误差的估计呢?首先,抽样误差没有办法避免, 但是他是可以进行计算的来看啊,抽样误差的影响因素在这啊。第一个,抽样误差与总体的分布是有关系的 啊,如果呢,这个总体的单位指之间这个差异越大,也就是方差越大,差异越大,那肯定出样误差就越大啊。方差代表误差,方差越大,差异越大误差越大,这个很好理解。 好。第二个,抽样物差于样本量 n 也有关系,其他条件相同的情况下,样本量越大,抽样物差越小 啊。你说我要调查,那现在你说我抽我总共一百个人是吧?你说我抽九十个人,和你抽九个样本和你抽九十个人作为样本,那代表性能一样吗?哎,你抽的样本越大,你对总体越接近,那你肯定对总体 代表性就越好了是不是?那你说我抽九十九个人,那你就差一个就总体了,那你跟总体也差不了多少,对不对?所以啊,样本量越大,误差越小,很简单,容易理解啊。好,抽样误差与抽样方法和估计量选择也有关系。分层抽样,他的误差就会小与简单随意抽样。我们前面举个例子 对吧?我分开层,这样样本更加均匀,对总体代表性更好,如果抽的正好,简单随意抽呀,抽的正好是几个女生好,那对咱们总体的代表性可能就不太好,抽的正好都是几个男生,那对咱们咱们身高就总体代表性不好。 那如果采用分层抽样,把这个男的里面抽两个,女的里面抽两个,这样才能更好反映总体身高是不是好,所以这就是这个具体的啊,抽样方法的选择也会影响这个代表性 啊,也会影响误差好,利用有效的辅助信息量也可以啊,有效的减少车辆误差。哎,那我这个分层车辆是不是有有效的利用了一些抽样框的信息啊,根据这些车样框的信息分成不同的类别,不同的层,然后再独立的抽,这样是不是减减低了这个误差。 总而言之呀,你就记住啊,跟出样方法有关,跟是否利用足够的辅助信息有关啊,跟这个方差有关系,方差越小越有效啊,方差越大,误差越大,然后跟样本量有关系,样本量越大,那我的代表性就越好,误差就越小。好,这里呢,大家再去体会一下就可以了。 好,最后呢是抽样误差,他的估计啊,抽样误差估计呢,在这有一个简单的计算公式,大家有一个了解吧,实践当中呢,总体方差 是未知的,可以利用样本方差来估计啊,样本方差来估计我们的总体。那这样一个公式啊,一个公式好 啊,我们用一减去大 n 分之小 n 啊,扩起来的 n 分之 s 平方。好,这个大家去了解一下就行了啊,不做特别重要的考勤啊,不做特别重要的考勤。 好,接下来来看一下这道题。下列关于抽样误差的表述错误的,由 a。 利用有效的辅助信息的估计量呢,也可以有效的减小抽样误差 啊,利用有效的信息更多啊,我充分利用上,把它分开类,分开层我再去抽,这样是不是有效减少误差?好,这个说法对的啊,抽样误差与总体分布有关。方差,总体方差越大,车样误差就越大 啊。方差越大,误差越大没有问题。在其他条件相同,样本量越大,出样物差越大吗?样本量越大,我都接近于总体了。好,那我的误差就越小。 好,抽样误差与抽样方式的估计量选择有关系,分层抽样就比简单抽样误差小一些 好,分层抽样的估计量方差一般大于简单随意抽样吗?方差一般是小于简单随意抽样的,因为分层抽样他的误差更小,对总体的代表性更好,也就是说他的方差也是小于简单随意抽样。 所以这道题呢,我们应当选择的是 c 选项和 e 选项,表述错误的是剩下都是表述正确的选项。
粉丝3558获赞1.3万

前面讲的抽样方法适合于个体差不多的情况,但当个体差别比较大时,为了更好的反映出总体的情况,得用分层抽样。比如某单位共四百人,其中老年五十人,中年一百五十人,青年两百人,被调查他们的身体状况,打算抽取一个四十人的样本。 老中青差别很大,得用分层收养,那就分成老中青三层共四百人,要抽四十人, 四百除以四十得十。也就是说,平均十个人里抽一个,先看老年人五十除以十得五,所以应该抽五人。再看中年人,一百五十除以十得十五,所以应该抽十五人。 最后看青年人二百除以十得二十,所以应该抽二十人。至于每一层里你咋抽,用前面学过的抽样方法就行。这里最关键的 是按照人的总数比例,确定在每层抽多少人。刚才每层要抽的人数都刚好是整数,如果算出来的不是整数,你还得四舍五入。比如把老中青的人数变成五十二、一百四十六、二百零二。用同样的方法计算后三层需要抽取的人数,分别是五点二十、四点六、二十点二。 那你还按五十五、二十抽就行。了解了如何分层抽样,来看道题,练练手。某年级有男生五百六十人,女生四百四十人。想用分层抽样的方法,从该年级全体学生中抽取一个五十人的样本,那这个样本中男生应该有多少人呢? 男生五百六,女生四百四,加起来一共是一千人,要抽五十人,一千除以五十得二十。也就是说,平均二十人里抽一个,那男生就应该抽五百六十除以二十,得二十八人高 定好。总结一下,这个视频我给你讲了分层抽样,当个体差别较大时,你就得分层来抽样,其中最关键的一点就是利用比例算清楚每层要抽的人数。怎么样,都听明白了吗?明白了就速速刷题去吧。

本视频讲解抽样检验一、确定检验水平。检验水平对应着检验量表一中给出了三个一般检验水平应使用水平二,除非另有规定。二、确定要检查产品的数量,如两千个产品。 三、确定样本量字码,根据要检查产品的数量两千和检验水平二,即行和列的交汇处的字母 k 为样本量字码。四、确定 a、 q、 l 值,如主要不良取零点六五, 次要不良取一点五五,使用 a、 q、 l 值和样本量字码。从抽样方案表中解锁抽检方案,在抽样方案表中,由字码 k 所在行向右在样本量栏内读出样本量一百二十五, 再以让本量字马所在行和指定的接收质量线所在列相交处读出接收数 a、 c 和拒收数二。 一、检查一百二十五个样本,并对不良品分类,其中主要不良两个小于拒收数。三、判定合格,次要不良五个小于拒收数。六、判定合格。主要和次要不良数都小于拒收数,此批判定合格。六、若在相交处是箭头, 如上例,主要不良 a、 q、 l 取零点一五,则沿着箭头方向读出箭头所指的第一个接收数和拒收数,然后由此接收数和拒收数所在航向左在样本量栏内读出相应的样本量八十,原来样本量一百二十五作废。根据转移规则和程序, 当正在采用正常检验时,连续五批或少于五批中有两批不接收,则转移到加烟检验。使用加烟检验一次抽样方案主表。当正在采用正常检验时,当前的转移得分至少是三十分,则转移到放宽检验。使用放宽检验一次抽样方案主表。

在确定抽样方法和样本量的时候,既要考虑调查的目的、调查性质和精度要求等,又要考虑实际操作的可实施性、非抽样误差的控制、经费预算等。要估算样本含量,首先要弄明白两类错误,第一类错误,原假设是正确的, 却拒绝了原假设,也就是契真错误。第二类错误,原假设是错误的,却没有拒绝原假设,也就是区委错误。举个例子,把假设检验比作法庭判案,我们想知道被告是好人还是坏人?原假设是被告是好人 被责。假设是被告是坏人,法庭判案会犯两种错误,如果被告真是好人,而你判他有罪,这是第一类错误,错杀好 好人。如果被告真是坏人,而你判他无罪,这是第二类错误,放走坏人在其他条件不变的情况下,如果要求犯第一类错误概率越小,那么犯第二类错误的概率就会越大。 这个结论比较容易理解,当我们要求错杀好人的概率降低时,那么往往就会放走坏人。 同样的,在其他条件不变的情况下,如果要求犯第二类错误概率越小,那么犯第一类错误的概率就会越大。当我们要求放走坏人的概率降低时,那么往往就会错杀好人。影响假设检验时样本含量估计的因素有四个, 一、第一类错误概率的大小。 alpha 也称检验水准, alpha 越小,所需样本含量越多。对于相同 alpha, 双侧检验比单侧检验所需要的样本含量更多。二、检验功效,一、检 beat 或第二类错误概率的大小 beat 检验功效越大,第二类错误的概率越小, 所需要样本含量越多。三、容许误差 delta 容许误差 delta 越大,所需的样本含量越小。四、总体标准差 sigma 或总体概率 sigma 越大,所需样本含量自然越多,总体概率越接近零点五, 则所需样本含量越多。下面讲怎样使用软件估算样本含量。首先打开医学统计助手,点击样本量估算,总共有四个功能,咱们分别介绍一下。第一个功能是单样本均数,选择好第一类错误和第二类错, 以及双侧还是单侧。如果已知的是均数,则默认已知均数,输入总体均数量本均数和总体标准差点期计算。如果已知的是均数误差,则选择已知均数误差,输入误差值和总体标准差点期计算,量本量会显示出来, 同时右侧显示不同错误概率组合的样本量。第二个功能是单样本率,选择好第一类错误和第二类错误,以及双侧还是单侧,输入总体率和样本率,点击计算样本率,计算出来,同时右侧显示不同错误概率组合的样本量。 第三个功能是两样本均数,选择好第一类错误和第二类错误,以及双侧还是单侧,输入两个样本均数或两个样本均数的 差值。两个样本量的比率。总体标准差,点击计算两个样本的样本量就计算出来了,同时右侧显示不同错误概率组合的两个样本量。 第四个功能是两样本率,选择好第一类错误和第二类错误以及双侧还是单侧,分别输入样本一和样本二的率。两样本比率,点击计算两个样本量就计算出来了,同时右侧显示不同错误概率组合的两个样本量。 好了,医学统计助手的样本量估算功能就介绍到这里吧,谢谢观看。

大家好,在之前的课程中,我们学习了均值车辆分布,并通过车辆分布学习了假设检验的概念。 例如一个学生总体 a 的英语平均分是六零,等于一百三十七分。对这个总体进行均值抽样的话,均值抽样分布的对称轴必然为一百三十七分,分布的双边尾巴上的 是比一百三十七分低很多分或者高很多分的极端情况。我们可以人为的把双边尾巴尖上共百分之五的区域画出来, 也就是每个单边尾巴百分之二点五,并人为定义其为极端情况,用术语来说就是双 显著水平阿尔法等于零点零五。我们讲比较另外一个总体 b 和此总体 a 的均值有无显著差别的时候,可以先假设这两个总体没有显著差别及 h 零,没有 b 等于没有 a。 在这个假设下,两个总体的均值车辆分布也应当是相同的。那么我们从总体币中车辆一次, 则样本均值也应该以百分之九十五的大概率落入对称轴两边的中间区域,而只有可能百分之五的极小概率落入双边尾巴的拒绝欲。 现在在总体 b 中抽样一次得样本均值为一百四十二分,落入了总体 a 抽样分不 的拒绝欲。仅抽样一次,极端事件便发生,我们便有理由去怀疑一开始的这个原甲设 h 零有问题,我们便拒绝 h 零,从而接受对立。假设 h 一 总体 b 和总体 a 的均值有显著差别,一百四十二分落入了右边拒绝句,因此我们拒绝了 h 零。假如样本均值是一百二十九分,落入了左边的拒绝句,我们也会去拒绝 h 零。 不管落入左边还是右边的拒绝欲,我们都拒绝 h 零,得到结论是 h 一、总体 b 和总体 a 的均值有显著性差别。热爱思考的同学可能早就想过这么一个问题,那总体 b 和总体 a 到底 谁的君子大,谁的君子小呢?答案是,我们不知道。上面的假设检验叫做双边检验,也叫双维检验,英语叫 totaled test。 因为我们开始的假设是谬 b 等于谬 a, 所以总体 b 的抽氧均值比 mia 大也好,比 mia 小也好,只要不和 mia 相等,就足够检验了我们这个假设了。 所以基于这个谬 b 等于 ma 的 h 零假设,我们只能得出到底有没有显著差别的结论,得不出谁大谁小的结论。 但现实统计中,很多时候我们想得出到底谁大谁小的结论怎么办呢?那就要用到单边检验了。 下面我杜壮了一个听起来比较荒唐,但比较有趣的例子,来帮大家理解双边检验和单边检验的区别。 假如你从大学毕业了,创业,开了个工厂,自己当老板,现在需要招聘员工, 现在各个招聘单位都会对员工的英语水平有一定要求,但是你的要求比较特殊,你既不要英语太差的,也不要英语太好的。你觉得英语太差的不够用,看个英语说明书也看不懂, 但你同时也觉得英语太好的也没用,你工厂也不需要直接和国外打交道,英语太好的你还要多给工资,不划算。你现在到了一个高校去招聘,弄到了所有一千名应届生的英语四级成绩表, 根据我们学过的加尔顿满实验和正态分布的性质,可以知道,这么多学生的英语四级成绩必然呈现正态分布。注意,这个图不是抽样分布,而是成绩的总体分布。 例如,考四百二十分的有五人,考四百三十分的有十三人,考五百分的有一百人,考五百七十分的有十三人,考五百八十分的有五人。 正太分布的对称轴必然是总体的真实均值。妙龄,我们可以看出,这个总体的英语四季军分为妙龄等于五百分。 你的要求是英语水平不要太差,也不要太好,要中不溜的。那么现在让你在这个正太分布里画出分界线,把英语太差和太好的总共百分之五 的人都画出去,你会在哪里画线呢?很简单,因为我们学过双边检验了,只要画出双边的拒绝欲就行了。 例如,我们分别在四百三十五分和五百六十五分之里画出零戒指,双边一共百分之五,那么每一边百分之二点五。 假如这时有一位成绩五百八十分的来应聘,显然是落入了右边的拒绝欲,因为他英语成绩太好了,所以被你拒绝了。同理,假如一位四百二十分的来应聘,落入左边拒绝欲也被你拒绝, 这就是对应了你的需求,英语不要太好,也不要太差,只要平均分左右的中不溜的。换句话说就是 h 零 应聘者成绩等于五百分的,只有靠近对称轴中间部分的才足以代表等于五百分。两边尾巴尖上的,要么成绩太差,要么成绩太已经不那么能代表平均分等于五百分了。 上面讲的就是阿尔法等于零点零五的双边检验,下面接着编故事。你工厂开了几年,直接国际化了,你非常需要英语非常好的员工, 这一年你又来这个高校里招聘,你说英语四级成绩太差的,我一律不招,我要英语四级成绩好一点的。那么还是这个成绩总体的正态分布。你需要画一条线,画出成绩 最差的百分之五,作为你的拒绝欲。你该怎么画线呢?显然,你会在左边尾巴间从左往右数出百分之五的总体面积,画上一条线。 例如,你把四百四十五分作为临界制,凡是英语四级成绩比四百四十五分少的应聘人员,都被你拒绝了,而剩下的百分之九十五就是你的接受,与 你接受的条件是英语成绩要好一点的。那具体比多少分好一点呢?当然是比平均分好一点了。 所以实际表现出来,也就是这百分之九十五的面积,代表着 h 零应聘者成绩大于五百分。假如此时来了一个应聘人员,说自己的 成绩是四百二十分,你按照心中的这个 h 零检验了一下四百二十分,落入了拒绝育,所以不予以聘用。这个就是单边假设检验,更具体的说是拒绝育在左边或左尾的单边假设检验。 这个概念比较难绕弯,我们把单边和双边比较一下,帮助大家进一步理解。 第一次是你想招聘成绩既不太好也不太坏的,即最能代表成绩等于五百分的。 因此你用的是双边检验,要拒绝双边尾端各百分之二点五的。成绩太差和成绩太好的,你在双边尾巴画了两条临界值的线,四百三十 五分和五百六十五分,比四百三十五分还低的有百分之二点五,比五百六十五分还高的也有百分之二点五。 第二次是你想招聘成绩不太差,或者说成绩好一点的,即最能代表成绩大于五百分的。因此你用单边检验要拒绝左边单边尾巴的百分之五, 你在左边单边尾巴上画了一条临界直线,四百四十五分,比四百四十五分还低的有百分之五。 我们把单边和双边检验的临界值放在一起比较,发现单边检验时左边的临界值四百四十五分,比双边检验时左边的临界值四百三十五分要 高。为什么呢?因为把双边拒绝玉石右边的这百分之二点五的面积加到单边拒绝玉的左边来了。 我们仍然看那位成绩为五百八十分的应聘者,在招聘双边不要太差也不要太好的时候,是落入了双边的右边的拒绝欲,因为他英语成绩太好了,所以被你拒绝了。 但这次招聘单边英语成绩要好一点的时候,虽然还是在右边的尾巴尖上,但这次就没有落在拒绝句, 因为在这次单边检验中,右边的尾巴尖属于接受欲。你要招聘英语成绩好一点的这个人,成绩五百八十分 简直不要太好了,太符合你的要求了,太符合你的 h 零了,你怎么能拒绝呢?大家明白了没有?还是更把你给绕进去了,没关系,我们再接着绕一下, 又过了几年,你工厂人员流失严重,你第三次又来招聘人员了,但这次你对应聘者的英语水平又有新要求了。 你第二次招聘的英语水平好的员工,比你的英语都要好不知多少倍,词汇量比你多,发音比你准,背后里嘲笑你的土鳖英语,这令你非常不爽。 加上近些年外国人若不会说上些流利的汉语,都不好意思来中国做生意。综上,你在 再也不想要英语好的应聘者了。所以这次你专门要招英语成绩差一点的。 假如还是这个同样的成绩,总体你需要画出一条线,把总体里英语成绩最好的那百分之五给画出去。 于是你就在最右边的分数高的尾巴尖上画了一条线,这个线代表的临界值是五百六十分,比五百六十分还高的人占了总体的百分之五。这就是你这一次的拒绝欲。 而剩下的这些百分之九十五,就是你的接受欲。你接受的条件是 h 零英语成绩差一点的。这接受欲的百分之九十五,在这个均分为五百的 总体中,最能代表 h 零成绩小于五百分的。而这拒绝率的百分之五是最不能代表 h 零成绩小于五百分的。 假如这时来了一个应聘者,成绩五百八十分,分数太高了,按你的 h 零标准来检验一把,显然落入拒绝。拒了。被你拒绝了, 我又来了一个应聘者,成绩二百三十分,这个分数在最左边的尾巴上都属于比极端还极端的低分,你心想,自己闭着眼也考不了二百三十分这么低啊。 但你不能拒绝他,因为这个分数按照你的检验标准是在接受欲的,而且太符合你的成绩小于五百分,这个 是零了,所以你得欣喜若狂的接受这个二百三十分,这个就是拒绝于在右边或者右尾的单边。假设检验 上面就是我编的一个荒唐,但你仔细想又好像不那么荒唐的一个例子。 我们简单归纳一下,双边检验就是等于号 h 零为成绩等于五百分。拒绝预赛最不能代表等于的双边尾巴。单边呢,要么是大于号,要么是小于号, 大于号就是 h 零为成绩大于五百分。拒绝预在最不能代表大于号的左边,小于号就是 h 零为成绩小于 六百分。拒绝雨雨在最不能代表小于号的右边。这个英语成绩招聘的例子是通过一个总体的正态分布来讲解,单双边检验 每次只检验一个个体的成绩在正态分布中的位置是否符合 h 零。 下面我们把单双边的概念带入均值抽样分布中。我们回到高考英语成绩的例子,这是一个成绩总体 a 的均值抽样,均分式对称轴没有零等于一百三十七分。 现在请问这一千次抽样中,最不能代表 h 零没有等于没有零一百三十七分的抽样是哪些呢?很简单,在双边尾巴上各画出百分之二点五的抽样, 也就是拒绝欲,也就是拒绝这个区域的样本代表 h 零没有等于没有零一百三十七分。 假如有一个样本的均值为一百三十二分,则落入左边拒绝欲,于是我们拒绝认为这个样本来自 h 零六等于六零一百三十七分的总体 a。 假如又有一个样本的均值为一百四十三分,则落入右边拒绝欲,于是我们也拒绝认为这个样本来自 h 零六等于六零一百三十七分的总体 a。 那么再请问,在这一千次均值抽样中,最不能代表 h 零没有大于没有零一百三十七分的百分之五的抽样是哪些呢?那就要从左 左边的尾巴尖朝右数出百分之五的抽样,然后画出一条线,这条线代表的临界值为一百三十五分, 这条线左边的比一百三十五分还少的抽氧均分,便最不能代表 h 零没有大于没有零一百三十七分。 假如车上一次得样本均值一百三十二分,则落入单边左边的拒绝欲。 于是我们拒绝这个样本来自 h 零没有大于没有零一百三十七分的总体,并认为这个样本来自 h 一没有小于没有零一百三十七分的总体。 假如抽样一次得样本均值一百四十三分,则落入百分之九十五的 接受欲。于是我们不拒绝 h 零,仍然认为这个样本确实来自 h 零没有大于没有零一百三十七分的总体。上面是拒绝欲在左尾的,我们再来看拒绝欲在右尾的。 那么在这一千次均值抽样中,最不能代表 h 零谬小于谬零一百三十七分的百分之五的抽样是哪些呢? 那就要从右边的尾巴尖朝左数出百分之五的抽样,然后画一条线,这条线代表的临界值为一百四十分, 这条线右边的比一百四十分还多的抽样均分便最不能代表 h 零没有 小于没有零一百三十七分。假如抽样一次得样本均值一百四十三分,则落入单边右边的拒绝率。 于是我们拒绝这个样本来自 h 零没有小于没有零一百三十七分的总体,并认为这个样本来自 h 一,没有大于没有零一百三十七分的总体。 假如出样一次得样本均值一百三十二分,则落入百分之九十五的接受率。于是我们不拒绝 h 零,认为这个样本确实来自 h 零没有小于没有零的总体。 听到这里,不知道你是更明白了还是更绕晕了,但没办法,还得继续绕,还差最后一步。 最后,我们把单双边检验的概念带入替分部。之所以一开始不直接用替分部来讲,是因为替分部是把具体案例中的单位均值等信息都抽象出去了的,很难进行直观理解的。 我们仍然用上节课稻田亩产量的例子有稻田 a 和稻田 b, 以至稻田 a 的亩产量为六 a 等于一千三百三十斤。现在对稻田 b 进行一次样本容量为二十的收养计算,样本均值 x 八等于一千三百六十四斤。 请问稻田 b 的亩产量比稻田 a 大还是小呢?显然,肉眼可见,一千三百六十四大于一千三百三十。但是,怎么通过单边体检验来得出 没有 b 大于没有 a 一千三百三十斤的结论呢?假设检验有个常见套路,就是虽然你想得到的结论是 h 一,但你得先假设 h 零成立,然后通过检验拒绝 h 零,再正式 h 一。 例如,稻田币的抽氧均值为一千三百六十四斤,我们想得到的结论是, h 一 没有 b 大于没有 a 一千三百三十斤。但我们要先做原甲,设 h 零 缪 b 小于 ma 一千三百三十斤,然后尝试拒绝这个 h 零来证实 h 一。这是上节课得出的万能的替分部和体制表。在单边 划线之前,我们先回忆一下 t 值的公式,这是一个分式,分母肯定是个正数,因为标准差和 n 都是正数, 分子是正是负就不一定了。这是因为样本均值 x 八与总体均值谬相减,若 x 八大于谬,则体值就是个正数。若 x 八小于谬,则体值就是个负数。 在本例中, t 等于零,这一点代表六, b 等于六 a 一千三百三十斤。 那么现在请你画出最不能代表 h 零缪 b 小于 ma 一千三百三十斤的百分之五的 t 值区域。怎么画呢? mob 要是小于 ma 的话,根据 t 值, 同时 t 应该是个负数,所以 t 值越小于零,越往左边尾巴间就越能代表 h 零,谬 b 小于没有 a。 反之,气质越大于零,越往右边尾巴尖,就越不能代表 h 零缪 b 小于 moa。 所以我们从右边尾巴尖这里往左数出百分之五的体脂。作为 h 零的拒绝欲, 我们开始数二点二,这里概率百分之零点二,累计百分之零点二二,这里概率是百分之零点四,累计百分之零点六。一点八,这里是百分之零点九,累计百分之一点五。一点 六,这里是百分之二点零,累计百分之三点五一点四,这里是百分之四点八,累计百分之八点三。超过百分之五了,所以单边右边的阿尔法等于零点零五的临界之为一点六, 超过一点六,再往对称轴方向数一点点,就超过百分之五了。所以单边右边阿尔法等于零点零五的拒绝欲就是包括 t 等于一点六在内的再往右的所有区域。 那么我们稻田 b 的样本计算出来的 t 值是多少呢? t 值还是原来的 t 值一点六六?不管是双边还是单边的,只要样本一样, t 值都是一样的, t 值等于一点六六落入了 拒绝玉。所以我们在单边阿尔法等于零点零五的显著水平下拒绝此样本可以代表 h 零,谬 b 小于谬 a。 接受此样本可以代表 h 一,谬 b 大于谬 a, 即稻田 b 的亩产量显著大于稻田 a。 热爱思考的同学又要问了,为什么是同样的样本和同样的体质?在上节课双边检验中得出稻田 b 和稻田 a 的亩产量没有显著差别。在本节课中又得出了稻田 b 的亩产量显著大与稻田 a 的结论。这显然不是矛盾的吗? 原因是我们的原甲设变了,所以拒绝句也变了,双边 变成了单边显著水平还是零点零五。拒绝玉从两边尾巴尖的面积挪到了一边的尾巴尖的面积,这单边的尾巴肯定比原来双边的尾巴要粗,也就是说,单边的拒绝玉更大的,更容易拒绝 h 零。 这也就是为什么在实际统计工作中,很多人都不用零点零五这个显著水平,而使用零点零一或者零点零零一等更小的显著水平。 本节课我们先后从正态分布、均值抽奖分布和气分布逐步的带入并讲解了单边假设检验的概念。需要说明的是,我举的这些例子都不是严格数学意义上的,例如我只用了大于号和小于号,而 没有用大于等于号或者小于等于号。我举的例子呢,也是瞎编乱造的,演示的气质和实际的气质也有较大出入,为的是简化讲解,帮大家感性理解。 国内外的网站上关于单双边检验的说法花样繁多,有的还互相矛盾。我分享给大家的是自己多年总结,觉得能说服自己的一个版本, 欢迎大家讨论。以上内容大家慢慢消化,可以多看几遍,我们下节课见。

咱们分享一下初一的统计调查的问题啊,首先要明白三个公式,就是总量怎么去计算啊?用对应的数量除以对应的百分比,那么圆心角就是扇形圆心角度数怎么去计算啊?用三百六十度乘以对应的百分比, 那么第三个呢,就是样本和总体,那么他们对应的百分比呢,是相同的,那么如果说还是没有听懂的话呢,咱们通过题型呢去历练一下啊。 首先某校从群体师生中呢,随机抽取了部分学生,调查他们平均每周劳动时间,那么分成了四个组,那么 a 组呢是小于五小时, b 组呢是大于等于五小时,小于七小时。 ca 组呢是大约等于七小时,小于九小时,而 一组呢是大约等于九小时。那么他给你绘制成了一个条形统计图,那么右边呢,又给你画了一个扇形统计图。首先第一问问你调查样本容量是多少,那么 他问你这次调查的人数是多少?首先我们通过图可以看到,哎,这个统计图上行统计图当中,第一组他的百分比是百分之十,而第一组对应的人数是十人,所以呢,你就可以用公式 对应的数量十除以对应的百分比百分之十,那么十除百分之十就能算出所谓的样本容量是多少呀?哎,是一百,哎,切记不要再单位啊,样本容量是没有单位的。然后呢,再看第二位 c 组的圆心角大小 是多少,那么你可以看一下, c 组对应的人数呢是三十,也就是说一百个人当中呢,有三十人,他的劳动时间呢是在大约等于七小时,小于九小时,所以说他的百分比怎么去计算啊?用三十除以一百乘以百分之百, 那么 c 组的百分比是不是就是百分之三十?然后问你 c 组的圆心角大小,那么就是算他的圆心角大小,你要知道一周是三百六十度,所以呢,你就用三百六乘以百分之三十算出圆心角的大小呢,是一百 零八度,哎,三百六乘以百分之三十。再来第三问,该校一千五百名学生,每周不少于七小时的学生人数,那么这个题怎么去做呢?首先你先计算一下在样本周不 少于七小时的人数有多少呢?来不少于七小时呢,肯定就是 c 组和 d 组总共有四十人,然后呢,样本容量总体呢是一百人,所以呢,在样本中,如果说不少于七小时的人数呢,他占到了百分之 四十,你要知道在样本中的这个百分比和总体的百分比相同,那什么意思呢?就是在总体中,就在一千五百余学生当中,那么每周不少于就是劳动时间不少于七小时的人数,他的百分比呢也是百分之四十, 所以呢,对应的人数怎么去计算?我们就可以拿总体一千五百乘以百分之四十 算出,对应的人数呢,就是六百人,那么统计调查的问题呢,就这么去做啊,还有呢,就是一定要把这三个公式弄清楚,同时呢要明白怎么去分析题, 而且像这三种的这种问题的形式啊,在期末考试当中呢,基本上考的会特别勤啊,所以说每个同学必须要会啊,那么如果说哪里有不会的地方呢?可以在评论区呢进行留言。

学校想检查小卖部某种小袋饼干的卫生质量,可是每一袋都检查太麻烦了,这时候就可以采取抽样的方法,为了保证每一袋饼干被抽到的可能性都是一样的,得采用随机抽样。 随机抽奖的方法有很多,这个视频我先来给你介绍。其中最简单的一类叫简单随机抽奖。比如想从五十袋饼干里抽出三袋来检查,就可以抽一袋,摇一摇,再抽一袋,再摇一摇,再抽一袋,这样每次抽时,每袋饼干被抽到的可能性就都是一样的。 像这样从 n 个东西里抽 m 个出来,每次抽时,每个东西被抽到的可能性都一样,这种抽样的方法就叫做简单随机抽样,其中这个 n 就叫做总体容量,这个 m 就叫做样本容量。生活中大家都见过简单随机抽样, 比方说抽签就是最典型的简单随机抽奖。比如某健身房想从刚买的十台跑步机中抽出五台来检查质量,就可以用抽签法先给他们都编上号,把这些号都写到纸上,扔到一个容器里,摇一摇,抽一个,再摇一摇,再抽一个, 照这样下去,一直到抽出五个,这五个号对应的机器就是咱抽出来的样本。这样的方法就是抽签法。 抽签法很简单,不过如果总体很大,比如一千个,那你光写号码就都累死了,更别提抽签了。而且如果纸片不小心黏在了一起,那抽签结果就肯定不公平。于是人们发明了另一种简单随机抽样的方法,随机竖边反, 这就是一张随机数表,里面的数都是随机出现的。比如学校要从五百名同学中抽出三十名进行身体素质检测,就可以用随机数表法, 先给这五百个人编账号,就编为零零一到五百吧,然后从随便一个地方开始,按照同一个规则抽取即可。 比如你就从这个地方开始,你可以从左向右抽,也可以从右向左抽,可以从上向下抽,也可以从下向上抽。我说过了,怎么抽都行,只要按同一个规则就行, 那咱就从左向右抽三位,三位的读三八六,就是第一个号一九六,第二个号四五二,第三个六二九,哎,超过五百了,那就跳过去三八六,哎,重了也跳过去, 然后第二行开始,接着从左往右读,如此下去,直到得出在零零一到五百之间的三十个三位数,这就完成了抽取。 好了,又到了总结时间,这个视频我就给你讲了,简单随机抽样。常用的简单随机抽样的方法就两种,抽签法和随机数表反。至于随机数表反,你想怎么抽就怎么抽,顺着抽就行。怎么样,听明白了吗?明白了就速速刷题去吧!

本节课为大家讲解抽样,我们都知道啊,如果说需要知道总体的 一些参数,比如说我们需要总体的均值、标准差、方差等数据是非常困难的,因为数据量比较大, 而我们往往采用的是抽样的方式,也就是从总体里面抽取一定量的样本来进行分析样本的均值标准差, 进一步通过统计推断来推断出总体的均值和标准差。换一句话说,我们抽奖的最终目的是 为了使用样本来反馈总体,或者是来反映总体的参数,这整个过程呢叫做统计推断。 抽样的主要好处是他能够节约费用和时间,因为对总体进行全部检测或者是检验的费用和时间都是非常高的。 那么我们接下来看一下如何才能进行科学的抽样。我们制定一个抽样计划呢,主要包含三大块, 第一,抽烟的类型。第二,样本的数量。第三,频率。 接下来我们先来看一下用抽样的方法有哪几种。首先我们来看一下简单随机抽样。 简单随机抽样呢,最常见的比如说我们的抓究以及抽签计算机模拟,包括我们的随机数表法, 都是简单随机抽象。简单随机抽象呢,他要要符合两个基本条件,第一个等可能性,也就是说每一个个体都有被抽到的可能性,并且这个可能性是相等的。 比如说我要在十个小球里面去抽出两个来,那么这十个小球每个小球被抽 都出来的可能性一定要是相等的。第二,独立性。独立性指的是 a 发生,对 b 发生的概率没有影响。 第二,分层抽样。分层抽样呢,因为总体被分成了户部交叉的层,比如说一号机或者是二号机, 或者是说第一季度或第三季度等,通过层别法进行了分层。我们需要按照一定的比例,从个层中独立抽出一定数量的个体, 将各层的个体结合在一起作为样本。这个要求 都是各样本之间的差异很大,但层与层之间的一个个体差异比较小。 比如说我们要研究各个年龄段的收入情况,那么我们不可能将每个人的收入情况都调查清楚,所以我们对各个年龄进行抽样。 比如说按照我们全国人口普查的比例,七十五岁以上的人口有多占多少比例,六十到七十五的断多少比例,五十到六十的占多少比例, 四十到五十的占多少比例,四十岁以下的占多少比例?按照这个比例进行抽样,抽取来之后合成一个样本进行分析,来求出人均的一个 收入。最后是一个系统抽样。系统抽样也是需要将总体进行分成,但是和分成抽样的区别是系统抽样是平均均衡的,将总体分成几个部分,按照一定的 预先的规则去抽取个体。比如说我们机台每四个小时抽取五片,那这个就是按照时间将总体分成了几个均衡的部分,按一定的规则去抽,这个就是典型的系统抽样。

t b g 两千八百二十八点一是有统计学依据的。 a q a 要控制百分之一,最小样本量是十三零收一退。 a q a 要控制百分之一点五,最小样本量十八零收一退。 a q a 要控制百分之二点五,最小样本量是五零收一退。 抽样方案不能单纯的按等比例抽样,特别是高端产品批量小于一百台时,等比抽样样本量就会很小。建议有个最小样本量,如不少于五台或吧台,否则使用方风险会非常大,漏减风险会很大。

大家好,就是昨天晚上有人私信问我说关于这个 gmp 里边的啊实实际抽烟量和最小最小抽烟量应该如何舔?呃, 现在我在这一块给大家说一下,我们在做任何资料的时候,你一定一定要查规范,不要在那去想当然,然后或者就是因为大家都能知道洁颜皮里边有一个自动生成的,然后你不管不管就是填一个洁颜皮容量,只要我们把容量以前他 底下会自动生成最小抽烟量和实际抽啊,那么这个最小和实际是如何来的呢?如,如果你仔细去看过那个填表说明的话,那么这个很简单,我们现在来看一下这个的话,我室内填了四十五件,那么他最小和实际出样量 啊自动生成,那么这个到底是如何生成的?他的取样标准是什么?咱们旁表上面都有一个填表说明,大家要看一下,我们现在以这个四点四点四为例,来看一下四点四 威力是什么?各项各项检查与抹灰间之间应该牢固,无抹灰层,无脱层、空鼓和裂缝,那么这个里边他这个底下也没有,那么是按照什么来的?咱们现在来看一下,上面有一个 检查数量应符合下列标准,室内每个检验批应抽查百分之十,并不得少于三件,不足三件应全数抽查。那么我们现在是我室内填了一个四十五,四十五,最小百分之十四是四点五, 咱们首先在容量抽取上不可能出个几点几,必须就是,嗯,把它换成整数,那么四点五就是五,就是五,对不对?所以这一块填的五,那么最小抽奖量是五,这个实际实际抽奖量呢? 我们实际出样量就是最低,最低不能超过最小。那么你这块你我给写个八也可以, 最小出阳量是五,但是你实际出阳量我们是八八吗?所以这一块这个是允许的,但是你这一块最小出阳量是五,实际出阳量是三,这样就是不符合规范的。 所以咱们在这一块一定要注意,再加上主控项目必须全部合格,然后一般项目符合设计要求,一般项目要达到百分之多少,最少要达到百分之八十, 所以你这块实际抽羊啊,抽了五,呃,抽查五处,合格四处,我们现在看百分之八十,在这个时候包括你假如你要填三的话,你要看他的这个 是不是这样就不合格了。所以我们在这一块一定要注意,包括最小抽样和实际抽样如何得来的,咱们一定要常看填表说明。

哈喽,大家好,我是小何,今天呢我们来学习一下第四章的内容,叫做描述性统计。那么在正式讲解描述性统计之前呢,我们首先要对于统计学啊一个基本的了解, 对于统计学的定义的话呢,不同的老师,不同的教材,可能有不同的这个概念的说法,在这里呢,我们可以把统计称之为收集数据,整理数据,提取有价值信息的这一过程,我们称之为统计, 我们手机要收集数据,那么怎么进行收集呢?这种我们可能是通过一些随机取取样的方法,或者是呢我们事先有一个设计好的出现方案,然后呢得到一组样本, 那么有了样本以后呢,我们就可以计算出来样本的各种参数信息,而你比如说样本的均值,样本的标准差等等。那么 有了这些计算出来的这些样本参数以后呢,我们就可以把统计学啊分为两大类,一类这是我们在第四章会讲到的描述性的统计,另外一类呢我们称之为推断性统计,推断性统计,那么什么叫做描述,什么叫做推断呢? 这里呢我们通过下面这张图来给大家讲解一下,我们刚说过统计啊,他是收集数据,整体数据,提取有价值信息的过程,那么第一步呢,我们是收集数据,为什么要收集数据呢? 哎,你比如说我想研究一下我这个这个车间里面上个月生产的所有螺钉的重量,那平均值是多少? 那如果我去整体称重所有的这个螺钉的话呢,我可能啊时间 会花的很多,成本也会很大,那么这个怎么办呢?这时候呢,我们只需要在这个总体当中,这所有的螺钉当中呢抽取适量的螺钉,而你不得说我只抽取两百颗螺钉,然后呢计算螺钉的均值啊,他的标准差呀, 这样的话呢,我们就可以从总体当中按照随机取样的方法得到一个样本,然后呢计算这个样本的各种各样的参数信息,他的均值,他的标准差在信息。那么有了这样样本 样本的参数信息以后呢,我们就可以对样本进行相应描述。哎,你比如说我现在有两个样本,样本 a 它的均值为二十,样本 b 它的均值为三十,那么很明显样本 a 的均值呢,比样本 b 的均值比较小,是吧?由样本的参数直接对 样本进行比较,这种分析方法呢,我们称之为描述性统计,他的真的,他的分析对象呢,是真正的是样本。但是我们刚也说过,我们之所以进行抽样,其实呢并不是想知道样本的信息,我并不是想知道这两百颗螺钉的重量 啊,并不是想知道样本信息,而且我们抽烟以后呢,我们样本信息我也可以计算出来, 对不对?那么我今之所以进行抽象的话呢,我的根本的目的呢,是想通过样本的参数信息对总体的对所有螺钉的重量的均值进行推断, 这种分析思路的话呢,我们称之为黑段性土地,由降本的参数直接对总体的某个特征参数进行推断, 我们称之为推断性统计,推断性统计,如果我们细分的话呢,又可以分为参数估计和假设检验这两种方法来参数估计的话呢,我们就可以分为点估计和区间估计, 什么意思呢?哎,你比如说我们后面在进行过程的内分析的时候,我们经常会对于总体的标准差距估计,那么这时候估计的方法呢,我们可可能会用到阿坝比上。第二说阿坝的话呢,它是一个样本的参数,看样本的信息,然后呢我们去一个修边系数 出一个。第二啊,这种分析速度呢,就是称之为点估计了,后面呢我们也会计算过几分呢进行区间这种估计呢,我们称之为区间估计,这是推单系统计量,我们可以分为这个参数估计,参数估计呢也可以分为 点固定和权限固定。另外一类呢就是甲车体验方法了,在六十四个码的工具运用当中呢, 假设简易的方法占到了将近百分之八十,占到了将近百分之八十。我们后面呢也会通过大量的案例来给大家讲解推断性统计当中的点估计、区间估计以及假设警应当中各种各样应用好。那么这几个呢,我们首先来跟大家了解了关于 统计学当中有两大类统计,一个是描述性统计和贴电性统计,另外的话呢,我们可以打开软件来看一下。 另外在尼太美系当中,他的这个界面的结构啊,其实从某种程度上来说呢,也是这两种分类的一个结合。怎么说呢,你比如说我们在之前的课程当中讲到的各种观点图形对不对? 像这些图形下拉菜单当做这些图形的话呢,有很大的一部分他的飞机对象就是样本,来说这种图形的话呢,有很多称之为描述性的图形,对吧?你看三点图, 他针对的是样本,时光图真的是样本,相信图呢,他也是真的样本。比如说这里面的图形的话呢,有很大一部分他针对的都是样本,而在统计菜单里面呢, 统计菜单里面呢,像说假设检验期检验这个单页门 z, 单页门 t, 双页门 t 配对 t 干比例,双比例,单方差,双方差这些他真正对象呢,都是总体,都是总体。其实呢,样本和描述统计和推量性统计,他的分析思路也体现在 迷他脑筋当中。那么具体的应用的话呢,我们在后面的课程当中再给大家进行详细的介绍。好,那么本节课程呢,就讲到这里,谢谢大家观看。我是小何。

本次学习数据分析中抽样工具的使用,打开 excel 数据表, 假如我们要在当前的三个变量中其中的某个变量进行随机抽样,如何操作呢? 点击工具菜单下数据分析选项,找到数据分析对话框中的抽样分析工具, 点击确定。这时我们可以在输入区域中选择将要抽样的原始数据的所在区域。比如我们 要对体重找二十个数值进行抽氧,我们鼠标拖转选择 b 二到 b 二十一单元格。由于我们没有选中 b 一格中的体重这个变量名称, 所以我们将标志前面的对号去掉,也就是告诉计算机抽样时直接从 b 二到 b 二十一单元格中进行抽样。 抽样的方法有两种,一种是周期性抽样,一种是随机抽样。我们先进行随机抽样, 在样本数里面我们可以填写将要抽样的个数,比如我们写六输出区域,我们选择 f 一点击确定, 这时可以看到在 f 列下出现了六个样本数,这六个样本数就是从体重这一变量下面的数据中所抽出来的,这一种叫做随机抽样。 下面我们再看一下如何进行周期性抽样。打开抽样窗口,输入区域仍然为 b 二到 b 二十一单元格。抽样方法,选择周期间格,我们选择每五个抽一个,填入输入区域,选择记一单元格。我们知道 二十个数据中每五个抽一个应该能抽到四个数据,我们看一下结果是不是这样的。点击确定好,大家可以看到第一个抽到七十八, 第二个从七十八,第五个数再隔五个第十个数六十五,六十五,也就是第十个数,再隔五个七十四,最后 第二十个数七十一,我们就得到了按周期性抽样方法所得到的四个样本。同样我们再来演示一下,如果我们把周期改成三, 输出区域,选择 h 一单元格,点击确定 二十个数据,每三个抽一个,应该能抽六到七个,严格的说是六个数据, 那么我们看一下,每三个抽一个一二三, 第三个数据六十三,六十三,再往后查四五六,又一个数据 五十九,这种就是周期性抽样,实际工作中我们可能用的更多的是随机抽样。再来演示一下, 这次以身高的数值进行抽样,我们在输入区域中选择系列下的 c 一到 c 二十一单元格,可以看到在输入区域中我们把身高这个变量 也选择了进来,这时我们要在标志前面空格中打成对号, 也就是告诉计算机 c 单元格中为这批资料的电量 名称,不参与抽样。同样我们抽样方法选择随机 抽样,样本技术选择八输出区域,我们选择 按一点击确定,可以看到在这里抽出了八个数值,分别是一七三,一七一,一七二等等。我们再看一下, 如果我们的输入区域包括了 c 一单元格,但是我们没有选择标志, 看一下结果会是怎么样的。输出区域我们选择 f 一点击确定, 这时计算机就会提醒抽样,输入区域中包含了非数值型的数据, 所以我们需要把标志前面打上对号,这样呢就把身高这个变量明排除在抽样之外,我们再次进行抽样, 这次就能顺利的得到朝阳,结果本次到此结束,谢谢大家。

前面的视频我讲了三种车样方法,那这个视频我来给你讲讲这三种车样方法该如何运用。选什么方法,主要取决于他们具有的特点,咱先从他们的相同点和不同点入手分析一下。 先说相同点,因为都是随机抽样,所以无论哪种抽样方法,在抽样的过程中,每个个体被抽到的可能性都是一样的,别觉得哪种抽到的可能性大,哪种可能性小,作弊可不行。 相同点看完了,再说说不同点。简单随机抽样是一个一个抽的,所以他适合总体个数较少的情况,总体太多,抽着就太累。 而系统收养也就是等距收养,是先把总体均分成几份后再抽的,所以它适合总体个数较多的情况。而分层收养是先把总体根据差别分成几层, 然后再从每层里按照比例来抽的,所以他适合总体差别较大的情况。你看每种抽样方法都有不同的适用范围,所以咱得根据情况选择不同的抽样方法。比如这个五百个家庭里,既有高收入的,又有中等收入的,还有低收入的,显然分成了三类。 如果要抽样,肯定要用分层抽样。还有这个要从十二个人里抽三个,总人数很少,显然用简单随机抽样就行了。最后来看,这个要从一千两百人里抽三十人,总人数很多,而且没什么差别,所以用系统抽样。 好了,总结一下,这个视频我就给你讲了三种抽样方法如何运用。在选择合适的抽样方法时,主要是看总体的特点,总体个数少时,你就用简单随机抽养,总体个数多时,你就用系统抽养, 而总体差别较大时,你就用分层抽氧。怎么样?听明白了吗?明白了就速速刷题去吧!

如果你选择了定量研究,那么一定要重视样本选择这一环节,只有具有代表性的样本才能保障研究结果的可靠。如何科学合理的抽取样本?使用这些方法。一、 随机抽样最基本的抽样方法,每个个体都有相等的机会被选中,可以使用随机数生成器来随机的选择样本。二、分层抽样,样本总体根据某种特征分成若干个层次,然后从每个层次中随机抽取样本,这样可以确保不同子群在样本中都有代表性。 三、整群抽样,总体分成若干个群体,然后随机的选择一些群体作为样本,在选中的群体中抽取个体作为样本。四、系统抽样从总体中随机选择一个起始点,然后按照一定的间隔,例如,每隔五个个体选择样本,适用于大样本时,提高抽样效率。

哈喽,大家好,今天我们学习总体个体样本和样本容量。总体是要考察的全体对象,个体是组成总体的每一个对象样本,在总体中抽取调查的部分对象样本容量是样本中包含个体的数目。 好,我们看下列立体学校为了了解五百名初三学生的体重情况,从中抽取一百名学生进行测量,下列说法正确的是。 a 选项总体是五百,我们研究的是学生的体重情况,所以总体是五百名初三学生的体重情况。 a 选项错误。 b 选项样本容量是一百,那么出去一百名学生,所以样本容量是一百。 b 选项正确。 c 选项样本是一百名学生,我们研究的是体重情况,所以样本是 从中抽取的一百名学生的体重情况。 c 选项错误。 d 选项个体是每个学生,个体是每个初三学生的体重情况,所以 d 选项错误。那么最终正确的只有 b 选项。

那么在样本来计算的过程中呢,往往会有这样的一个情况,是吧?接下来计算的是一个特别呃需要小心的过程。那当然呢,呃,这样讲样本来计算的,只跟大家说一下 rct 研究的这个样本来计算的一个基础,取了两个例子是吧?一个是均数的,一个是绿的啊,后面还会详细的去讲啊,因为样本量计算的时候啊,他会影响到你整个研究的布局,是吧?你是一百个人还是五百个人,那你研究这个开展起来是不一样的,所以说影响样本量大小会有哪些因素呢?是吧?嗯,会有一类错误,阿法二类错误,悲疼, 我们的允许有差这个,嗯,第二趟我们的总体的表演差是这个,嗯,还有我们是单车还是双车节,还有我们的研究设计类型和抽氧方法,这个呢,我在都会简单的讲一下,那要么咱接下来的话呢,还会去重点的去讲一下他们的差别,嗯, 那么其实我们也会遇到一些例子,是吧?有一些,嗯,这个这个生产企业啊,在做一些评估的时候呢,他会去找一些 cro 公司来算什么量,是吧?这样计算的时候呢,比如说前段时间遇到一个费力小钱, 如果说一旦把某一个参数填错了,是吧?如果正号和副号你没填对,那样板量就是一百多和六百多的产品,是吧?那这对于研究者来说这就会很大,是吧?如果说每组需要六百粒的,你给人家每组算一百粒。研究开展了两年,研究结束的时候才发现这个问题,那怎么办啊? 就是说在弥毒那肯定 cfda 也也也也不允许啊,是吧啊或者说你肯定觉得你这个有问题啊,是吧,所以要么来计算呢,就是说参数要填对了,当然餐饮减都比较好填。在等校又像合肥类校的一块呢,会有一些正符号的问题,一定要填对了,把正符号别写,写反方向了就行。方向别写反, 因为从阿尔法我们说阿尔法呢一般就是我们的检验水准零点零五一般是不调整的啊,除非呢你是一些这个这个基因的研究啊,就是你的要塞的这个内点实在是太多了,你要塞两千个三千个,那这时候呢我们一定会说那你不能再压发这个来算是吧,你应该把它折损折损到很小是吧,乘以十的负几次方啊啊 一般的人群的研究或者说我研究的都是一些测量的参数啊什么之类的,这不是经历的这类的一般我们就是零点零这个不动。嗯第二个呢是阿来处背他背他呢就是我的把握度说我有百分之多少的把握 重复这个研究的时候还能获得同样的结果是吧这时候呢一般呢我们去百分之八十或者百分之九十啊,说我有呃百分之八十的把握,但我觉得还可以是吧,说我有百分之九十的把握,我觉得很好啊,那么当然你把握性越大你所需要的样本量就越大。说我有百分之九十的把握,那你肯定比百分之八十的把握所需要的样本量要大啊。那么有时候呢我们为了 这个节约经费节约成本,是吧我们就会把百分之九十的把握呢退到百分之八十的把握说我不要那么高的把握度,我只要百分之八十的把握,这样我要不然会小我好做,是吧?要不然太多了我做不了啊,我研究没法做,没法开展了,是不是 跟了把握度呢?你也别退的太低,是吧?比如说你退到百分之五十后面觉得把握度有点低,那百分之四十那就更低了,是吧?你有百分之六十的获得反方向的结果是吧?啊,所以说 你也别退太低,一般就是百分之八十或者百分之九十,能容忍的说你低到百分之七十,那有时候我也觉得还行吧啊,这个将就将就是吧,也就只能这么说了啊,允许不差啊,容许不差这个单他这个单他呢?是指两组之间的差别。我们在想,如果说 a 要和 b 要 差别比较大,是吧?天差地别,一个改善的是百分百,一个改善的是百分之十,这么大的差别啊,大家就是 就是这个,这个运球差是均数一类的,是吧?比如说一个改善的是十,一个改善的是零点一,这么大的差别的情况下,其实需要很少的样本料就可以获得差优同决议。换句话说,你们咱们做临床研究的是吧?各个临床专家肯定会说, 设计什么临床实验啊,是不是我看都看出差别来了啊?你看不见吗?那种那样那种那样,我差那么大个啊,你还设计?当然你检验的更好,你不检验我也能看出差别是不是?所以说允许我差越大,也就是两组均数差越大,变不了越小, 两组越接近量量越大,所以有时候两组能够接近到说一个是十,一个是十一,嗯,我还非要检验他的差别,然后呢,这样差又特别大,这时候呢,你可能就会需要很大的 病人啊,没什么可能成千上万的人你才能够发现差异,有统计原因,你需要很多人,这时候我们就会反过头来问你,据说十和十一真的有必要去研究吗?是不是你有统计学差异, 你有临床的意义吗?折腾了半天多降一毫米,工作啊,还存在是基础差,是不是?恨不得就多降都不到一毫米,多降零点五毫米,是不是还有意义吗?嗯? 这是什么?允许我插,哎,当然我这样说的,是允许我插越大,让我俩越小把。允许我插你。这两组越接近,需要量不了越大,两组离得越远就需要量不了越小。那么这样插,这样插呢,就是反应的是每一组之间的变异,是不是这样插越大说明这一组变化的越大,这样插越小呢,说明这一组研究对象呢,一致性比较强,对吧?那肯定是如果两组都离这么远,是吧,这样插大的时候这两组的人就容易什么呀重 也首先这样就大,那如果两组还是这么远,均数还是这么远,刚插小的时候我就可以极限情况我就可以试成这组换的就是这个,这组换的也就是这个,他们的杆插很小很小,那时候我就很容易发现两个之间的差别了,是不是?嗯,所以杆插 越大要么量越大,这个东西呢,你都可以试出来是吧?你怎么试呢?我就在怕是软件里面,他这个是软件吗?是吧?我害怕把它折腾坏了,我就点呗,一开始零点一我试一下,比如说多少个零点二,我再试一下,点三点四点五,一点一点一点三,是吧?你不停的试就可以看出来,要不然大的小是不是 还有单侧和双侧检验,对吧?单侧检验呢,所需要的样本量呢?要小一些,双侧呢要大一些,因为双侧都是可大可小的,这个会有一个不确定性,可能在这边,可能在这边,所以他就会大一些。 研究设计类型啊,研究设计类型呢?大家在第一个里面呢,我们就说的是餐饮节一个小等项和非列小,是吧?这个呢?啊,这个是在我们的这样的一个手机的这样的一个平台上面呢,你都可以找他相相应的中文的帮助文档。那当然了,下次我们两个来计算那个课程里面我会详细的去说这方面的这个内容。