粉丝1.1万获赞3.8万

哈喽,大家好,我是在日本就读护理学博士的小鹏同学,由于最近收到了很多的私信,就是关于咨询呢,就是论文中样本量的计算的问题啊,然后因为我跟大家口述或者打字的话也是表达不是很清楚,然后呢,今天就想着给大家录个视频,就是简单的教一下大家,嗯,如何计算样本量,像我们一般, 嗯,中华医学会底下的一些杂志,其他就会要求我们的投稿文章中要写到你的样本量,嗯,怎么来的?要写出你的具体的计算公式啊啊等等。所以的话呢,掌握样本量的计算的话啊,也是我们一段写论文的必要的一个技能啊。 然后呢,我们先从很多面研究开始吧,这也是一个常用的一个研究类型啊,我举的一个例子啊,就比如说我们这个很多面研究,大部分鉴于都是一些调查性研究,我们在调查性研究中肯定会使用到量表或者是问卷。我这个研究中,如果我这个研究中有三个量表,它分别是一般资料,还有就是自我管理量表以及生活质量量表。这三个量表的话,我们在知道它有哪些条目 是维度的情况下,是怎么计算他的样本量呢?就比如如果我在这个研究中,一般资料中设计的有包括性别,年龄,婚姻状况,这里是三个问题,我们就把它看做成三个质量量,然后自我管理量表中他肯定接受,量表中他肯定会介绍他有多少个维度,有多少个条目,对不对? 然后呢,他这个量表有三个维度和二十个条目,这里面我们取的是维度的个数作为资本量,生活质量表也是一样的,他有四个维度和三十个条目,我们也是取他四个维度的四作为他的资本量,所以这个研究整个研究中有三个量表,三个量表中的所有的资本量相加就是三加,三加四 等于十,所以说这个研究中他的自备量就是有十个。然后再根据我们多元线性回归,样本中他的样本量至少为自备量个数的五到十倍。然后再考虑你的研究的一个 现实情况的话,我们可以选从五到十倍中,你选择一个,嗯,最接近于你理想的这个调查的那个样本量的大小。比如说我考虑了五倍,然后再考虑百分之十二十的无效益达,有些可能会写百分之十,嗯,这都是可以的。 嗯,考虑这个无效益达之后,我们的自变量是十个,所以我们又选取了五倍的话,就是十乘五,再考虑百分之二十的无效益达,再乘以的,呃,百分之一百二十,对不对?然后所以我们假设得出的样本量是一百粒, 然后我们这个研究中最终纳入的就是,嗯,只要大于他这个最小的能量一百粒都是可以允许的。不管你是大于他一一百粒啊,还是两百粒啊,只要是大于他最小的能量的话,都是可以取的。所以这就是一个很多面调查的研究,可能有些东西会混淆了,就是调木数和维度数的区分,然后去计算这个样本量的时候,不知道该选哪一个作为他的质量量,有些量表他可能是单维度的,所以他对应的质量量呢,就是一个, 那这些呢,就是很多没调查研究的他一个量本量的计算方法,还有呢,就是这个干预性研究。干预性研究呢,在我们统计学书上他有一个计划公式,叫做两样本均数比较的样本含量计算公式估计法,他这个 n 一等于 n 二,这个 n 一和 n 二呢,就是指的是,嗯,两组患者的人数。因为我们干预性研究一般情况下都是把患者随机分为两组,对吧?有干预组和 对照组,所以呢,这个 n 一 n 啊啊,一般情况下也是相等的,两组的人数一般情况是是相等的啊,然后这后面有计算公式,嗯,就是这个计算公式吧,我就不会念了哈。然后呢,这个研究呢,一般情况下,我们来看一下这几个位置的啊,位置的总共有四个,四个是位置的,一个是 tf 除以二,再加上一个 t 被的和 s 和那个。那啥我也不懂,不知道咋念。 然后呢,我们整个研究呢,一般情况下都是把这研究设计为双侧实验,然后所以呢, r 呢,就取的是零点零五,然后我们去查表,这个查表的话是同居学书上以后,一般都是最后面的几页,他会有一个表格是不需要我们计算的,你只要给他按法取值到零点零五,他能对应到 tr 是 tf 除以二,然后他就能对应到一点九六,然后被单呢取值是零点一零,然后查表呢,也可以得到他一个,这一个取值情况,所以呢,这两个,这两个数值的话是不需要我们去计算的啊,这就是统计学书上,你去查一查,都是可以得到的数值,而且大部分研究都是这两个数值,然后接下来呢,就是剩一个这个 s 和这一个 这个叫啥?符号圈圈,对吧?这个 s 为两总体标准差的工具值和这个圈圈为两均数的差值,这两个数字怎么算呢?我们两种方法。第一种方法呢,如果你就研究做了一实验的话, 我们可以用玉石宴的结果来算。还有一种方法是我这个研究,比如说我的研究还是处于开启报告,或者说是没有做玉石宴,那我就怎么计算呢?我们就去参考已经发表了的文献的啊,他这个得出来的结果啊, 怎么去选哪一种文,去选哪一篇文献呢?就是去选和你这个和你自己的研究的目的最相似的啊,就比如说你运用了嗯, a 方案对 糖尿病患者的生活质量干预,然后如果已经有 a 方案对这个糖尿病患者生活质量的干预的话,你就直接选把他的结果拿出来用。如果说没有的话,比如说他是 b 方案对糖尿病患者生活质量的呃影响的话,你也可以拿过来用啊。这句话就是优先选择跟你研究目的最相似的参考文献。然后呢,在这片文献中或者我们预实验中,我们肯定会得到一个干预前和干预后的分数, 对不对?我们一般情况下,嗯,这种计量资料都是用嗯均数加减标准叉的形式来展现的,就比如说我的这个 ppt 中,也就是在这干预前的分数,嗯, 假设成是五加五,五加减一分,然后干预后得到的是六加减二分,然后我们来算一算 s, s 是两种底标准差的估计值,标准差也就是后面那个数,对不对?就是干预前中的是一,然后干预后的是二。 两总体标准差的空气值就是用一加二除以二,这就得到了 s 的值,然后这个圈圈值呢,是两均数的差值,两均数的差值,均数就是前面那个数,干预前的前面那个数是吗?五分,干预后的前面那个数是六分, 再加起来呢?两不是加起来,所以两个差值呢,就等于多少?六减五等于一分,然后再把这两个数值带入到我们的这个样本量计算公式里头去,然后就可以得出他这个按一横按啊的啊数来了,然后再考虑一下释放率啊,百分之十或者百分之二十都可以呢,计算出你大概的一个嗯,样本量。他可能会有一些同学说啊, 如果学姐我就是把这个预实验结果或者是参考文献的那个结果带进去,就是和我预想到的,呃,要么这样的人数,嗯,偏差很大的话,这应该怎么办? 这应该怎么办怎么办呢?当然是换一个参考文件接接着参考了。一般一般情况下,咱们干预型研究人数就得最起码两组人数加起来都得六十,是不是六十到一百二比较常见的,所以说你要把你的干预组的人数控制在这个范围内呢, 是比较正常的一个范围,如果太大,比如你可能超过两百组或者太少在十来组的话,那你想想是不是你去实验哪里不过完善或是哪有计算错误,或者是你参考文献的质量是不是不太高?等等等考虑。嗯,多一点因素,然后尽量去排除其他一些误差,然后算出我们最准确的这个样本量的一个。嗯,数值。 好,今天就是和大家分享到这了,就是因为啊,也不是特别专业,希望大家。嗯,有问题提出来大家一起交流一下,然后如果以后大家还有问题也可以给我留言。嗯,我会尽力的帮助大家。好,拜拜。

大家一般会问那个我们研究里面样本量到底要多少?那我这边是根据嘿儿的一个研究,他指出我们的研究样本量只需要我们提最大构面题目数量的五到二十倍就可以了。比方说在你的那个问卷里面, 嗯,你的一个测量孤独感的一个变量包含了八道题目,这是你所有的变量里面题目最多的一个变量了。那只要八乘以二十,就是一百六十个样本就足够做完这个研究了。

大家好,欢迎来到 spas 课堂,接下来我跟大家分享的呢是 摘要独立样本体检验,他呢主要是针对我们在数据分析过程中,原始数据未知,我们已知两组样板量均值标准差已知的情况下进行的两组的独立样本体检验。 呃,这个摘要独立样板体检验呢,在一些 s p s s 某些版本里面呢,可能会安装上这个插件,但是呢,经过我在 多个版本上测试之后呢,就是说安装这个摘药独立样本体检线这个插件呢非常困难,所以呢, 我就是根据他的一个原理制作了这么一个 aser 程序,然后呢我们就可以根据我们已知的样本量均值 还有标准差的情况来计算他的。呃,独立样本体检验的一个批值和批值,他是怎么做的呢?首先我们来了解一下。呃,这独立样本体检验呢,他主要还是 检验来自两个总体的样板这一段两个总体均值是否存在差异,他的前提呢跟我们前面介绍的是一样的, 还是这三个前提独立就是两组数据呢相互独立,这个呢是基本都满足的正态呢,就是因为我们这里呢是没有原始数据, 我们就是没有原始数据的情况下,怎么来判断他是否满足正带径呢? 这里呢就是有一个不成文的规定呢,他呢就是说基本上呢就是标准差小于 他的样本均值的三分之一,我们基本上就认为他是满足正态分布的,如果呢就是标准差大于均值的三分之一,或者接近呃 呃,均值的一半啊之上,这样呢,我们一般就认为他是不满足正态颁布的,我们就需要用原始数据去核核对他的数据正态性。第三个呢,就是方差其性,方差其性呢,我们就是没有原始数据的情况下,怎么样来判 判断他两组数据是否满足方扎奇性?好,接下来呢,我们主要是针对方扎奇性这一块做一个说明。首先方扎奇性呢,他是没有原始数据的情况下呢,我们是用的他,这里还不简念 他呢,主要是统计量呢,这 f 呢是呃最大对应的样本,最大的样本方差比上了最小的一个样本方差,这自由度呢,就是样本量不等的时候呢,就是对应 最大组的值样板减一。这样呢,我们就通过这个 a heartly f 检验呢,判断两组样板方叉是否相等。判断完方叉相等之后呢,我们就可以 进行选择相应的统计量了。若方差相等呢,我们是选择 t, 检验呢,是服从 n 一加 n 二减二左右度的液体分布, 这样呢,我们就通过可以通过这一系列公式呢,首先呢,就算 s c 方,然后呃 s 呢是 呃样板一的均值减样板二的均值的一个标准差,然后带入这个梯值里面来,就是说呢,他呢梯值呢,我们就可以计算出来了,然后对应 p 值表呢,查找 n 一加 n 二减二的自由度的液体分布,这样呢,我们就可以得到一个概率 p 值。 好,如果,如果方叉不讲等的时候呢,我们对它的一个自由度 做了一个纠正,这是他的自由度的一个修正公式。然后同样呢,这个期值呢,是根据这个公式来得到。呃,这样就通过纠正 和自由度呢,我们可以计算出他方差不等的时候对应的梯值,这样呢,我们两种情况下对应的梯值和梯值就都有了,这样呢,我们就是可以进行一个概要的一个独立样板体检验了。 好,我们针对这个呃摘药独立样本体检验呢,写了一个 aj 二程序,它呢主要是特点呢,主要有这三个方面。一个呢就是我们不再需要每个样本的数据,就是 可以进行两组样本的独立样本体检验。第二个呢,在写的程序文件里面呢,我们可以进行方叉轻音检验,输出结果呢,不再是对他的方叉轻音检验结果进行展示,直 只输出的是对应判断好的批值和批值。第三个呢就是我们在眼线里面操作,就是呃,非常简便操作,呃,而且方便我们进行复制啊,以及呃一些表格的编辑处理工作。 好,我们分别来看一下。呃,这两个例子。第一个例子呢是我们是用一个他的一个原始数据来检验这两组样本是否具有差异, 就是用到的是独立样板气垫。好,我们先来看这 s a v 软件, 这呢就是我们用到的一个 suv, 就是文件判断呢,不同境别下乘机是否有差异。我们呢来做一下独立样板体检验正态性呢,我们这里先不管,先看一下结果, 性别呢,一格二乘机选进来。 好,这是我们的一个独立样本纪念片,你的结果我们可以看到呢,你看,这就是刚才我们输出的一个结果,特均值标准叉两组的样板量 n t 和 p 值,这里呢是满足方杀器性,所以 t 值呢对应负的一点五二 g, p 值呢是零点一四一, 就是我们这个表格里面截图部分了。然后呢,我们这里的摘药样本体检验呢, 主要是针对我们没有原始数据的情况下,只有这个样板量均值标准差,我们来做这个批值和批值。好,我们再通过这个摘药独立样本检验。这个程序文件呢,我们来做一下。 呃,这是我做的一个 a l 程序文件,因为里面有很多程序呢都保护起来了,所以呢,这里面我们做的时候呢,只需要把这个 a 组 b 组要买辆均值标准渣,这里我们对应复制过来就行了。呃,这里呢我已经录入好了,直接复制过来。 好,复制过来,你看我们这里 p 值和 p 值呢都对应改,改好了,我们可以看到了, 这个 t 值呢是负的一点五二九,然后 p 呢是对应零点一四一, p 值呢是完全相等, t 值呢是我们这里呢是稍有误差的,因为这里呢 我们小数点后的数值是没有他这个精确的,所以说呢,这期值呢,呃和批值呢在一些计算情况下呢会稍有差异,但是呢对他的结果是没有影响的。这这个 有效程序文件呢,你看我们在做的时候呢,就是很方便的输入样板量均值标准差两组的分别输入,然后这个 t 值和 p 值呢,我们是不需要动的,这里呢我保护起来了也动不了, 因为这是保护后的一个程序,所以说呢,我们在做的时候呢,只需要输入这一部分的内容就可以了。 好,我们回到。呃再进行第二个详情,就是说我们在有些分期的时候, 呃需要对长模进行比较,长模就是文献里面一些做量表的时候呢做的一些数值的结果,这里呢我们是肯定没有男士数据的,然后我们有的呢只是我们通过调查之后得到的一些数据,这里面呢就是 在一篇论文里面故事情节卷在长摩与准的标准研究,这一篇论文里面呢就是研究数据呢跟长摩数据做一做了一个比较, 做了一个比较呢,我们就看他是怎么得出来的。呃,这里呢还是我们已知的这个样板量均值标准差, 以这情绪衰竭为例呢,你看这,恩呢两组的样板量都知道了,均值标准差都有了,我们呢就可以通过我们这个这个小程序文件呢来计算他的一个期值和批值。好,我们再来看一下, 这里呢你看这情绪分解呃衰竭的样本量呢是一三二零,然后 呃对应均均值呢是二十三点零二,标准差呢十点二九,就这一组这一组速度过来, 你看我们这里呢 p 值和 p 值呢又自动更新了,所以呢对应的是二点零五九,就会对应他的二点零六,然后 p 值呢就是小于零点零,这样呢我们就可以通过 两组的样板量均值的标准差来计算他的一个 t 值和 p 值了。 好,关于大家如果需要这 a c r 独立样本旗舰店程序文件呢,可以联联系我们,这是我们的联系方式,就是说这个程序文件呢是经过 呃我们呃反复验证之后的呢,大家如果需要呢联系我们,但是呢这个是有偿的,需要。呃,付费。好,关于这个摘药独立样本几点呢?就介绍到这里。好,谢谢。


各位朋友大家好,今天我们开始学习 spas 统计分析实战终极篇,本次我们讲解的内容是 cox 比例风险模型回归, 我们来看一下具体的案例,研究某种新药的抗肿瘤效果。 将肺癌患者随机的分为两组,分别采用新药和常规药物进行治疗,同时要考虑年龄和性别的影响,也就是这里面我把年龄和性别当做邪变量。 在 spa 的数据文件里面呢,总共有五个变量,第一个变量也就是 group, 它表示新药和常规药。第二个变量呢是性变,分别是男女。第三个变量呢是年龄,这里面年龄呢也将它处理成了分类变量。 第四个变量是生存时间,最后的变量呢就是生存结局,那生存结局这里面呢,我们是用一表示死亡,零表示山势。 我们看一下在 spot 的界面里面如何进行分析。首先呢,在 spot 界面里面找到分析,然后再找到生存分析,那这里面呢,有个 cos 回归,我们点击 cos 回归,那这时候呢,就会弹出来 cos 回归的分析界面, 将生存时间拖入到时间,再严格将结 据拖入到状态的严格。然后呢,再将三个变量,性别,年龄,药物风阻拖入到鞋变量里, 那这里面的方法我们就直接使用强制进入法,不考虑逐步回归。 然后点击定义事件,出现新的对话框,在这里面呢,我们输入一,也就是表示结局,这个变量如果取值等于一,他就表示事件已发生,然后点击继续。 之后呢,我们再点击分类,因为我们的三个斜变量他都是分类变量,所以这时候呢,我们要把三个变量拖入到分类斜变量 单元格,那这时候呢,我们要来指定他的参照水平,就以性别为例,性别呢,他是两个水平,男性和女性,你究竟是以男性为参照,女性和他比,还是女性为参照,男性和他比? 你假设男性他的死亡风险是女性的一点五倍,那这时候反过来,女性的死亡风险是不是男性的一除以一点五倍啊?所以呢,你的参照水平不同,他的结果就会有所差异。 这里面通常而言,我们是以他取值最小的这个水平为参照,所以呢,我们就点击第一个,然后点击变化量,让每一个分类型变量后面都出现 force 的,那这时候呢,他们就以他取值最小的那个值 作为参照,然后我们点击继续,然后呢点击选项,在选项这里面呢,我们要勾上 e x p, 只有勾上 e x p, 它才会返回来 h r 的百分之九十五可行区间。 之后呢就是自主抽样,这个呢使用的比较少,我们就不过多讲解, 我们来看一下结果。首先呢,我们的样码量是七十, 发生结局事件的有三十三个,未发生结局事件的有三十七个,然后不存在趋势值, 然后是分类变量编码,比如这里面药物分组零是常规药。 一是星耀,我们当时在设置的时候呢,是以参照水平最小的为参照,所以这里面呢,我们是星耀和常规要进行比较。性别呢,我们是男性和女性进行比较,年龄呢是大于六十岁的与小于等于六十岁的进行比较。 之后呢就是模型的结果。在这个 ppt 里面呢,我们看的是方程中的变量这个表格,在这个表格里面呢,第一列是回归系数, 第二列是回归系数标准物,第三列是对回归系数进行假设检验所得到的瓦尔德卡方值。那第五列呢,就是它的 p 值,最后三列就是 hr 值以及 hr 值的百分之九十 区间。那这里面呢,我们先看一下 p 值,药物风阻,它的 p 值是小于零点零五,也就是说药物风阻是存在统计学意义,它的 o r 值呢,是零点三九零 over 的百分之九十,肯定区间呢是零点一七四到零点八七六。第二个变量性变,第三个变量年龄,它的 p 值呢,都是大于零点零五的,也就是说不存在统计和意义。 这里面药物分组,它是新药和常规药比,也就是说新药 他发生死亡的风险是常规药的零点三九零倍,或者我们可以描述成新药他的死亡风险 比常规药降低了百分之六十一,这个百分之六十一呢,就是一减去零点三九得来的。 感谢大家的观看,我是大鹏统计工作室的大鹏。

大家好,我是 super 们,刚才有个小伙伴问我,如果自己的样本量特别大,如何在格外拍的里面输入数据,像这种问题啊,我一般都会立刻回应,因为我一直就是这样一个默默风险,不求回报, 我从未见过有如此厚颜无耻之人。哈,开个玩笑,其实是主要是因为这种问题啊,就是做视频比较简单,很快就能做出来回应,大家不会耽搁太长时间,并且,呃,可能还有很多人能用上 啊。另外一方面是这个周我已经开通创作基地了啊,大家看一下,我已经赚很多钱了,那你发家致富,走上人生巅峰就差一步了。所以大家啊,有赞有币不要存着,留给我就好 啊。下面我开始演示一下啊,比如说这里面我有三种数据啊,比如说有一百两百的样本量很大,我们先 可以在一个赛奥里面算出他的均速标准长或标准物,我这里面就像一个十六个样板娘,只是给大家做一下演示。呃,我给大家具体操作一下吧,免得大家不知道在一个赛奥里面怎么做。 我现在算均速点公式插入函数,那这个是均速 标准叉, 这个腰 标准部我在那个视频里面说过,就是用标准查出一样的容量, 要么容量十六 啊,这样我们就把三个组里面的均速标准查标准部都算出来了,然后现在我们就可以在格瑞派里面输入, 大家看主要是在这里,比如说唯一注重土匪地,大家看一下,大家选中这里面 均速标准差样本容量或者是均速标准物样本容量,就这点差别,其他的 都和我原来我个人拍的 pose 做视频的所有都是一模一样,只是输入数据人选中这里就可以。哦,我把三个数据做回来吧, 这样梳就已经梳好了,大家看图就已经出来轮廓了, 这里面可以调标准长会变成末,但是在正面的时候末日是标准差距,标准长不用调,后面在所有的作图方式和各位派对面一起一样。嗯,好,今天展示就到这里。

大家好,今天讲的是非理想数据化的另一个检验方式,叫做由程检验。首先还是讲下由程检验的概念, 什么是流程检验呢?就是在变量序列中连续出现取值相同的数据,他就叫做流程,什么意思?就比如说这一个数据, 一一一二二二三四四四四四五三个一,三个二,一个三,五个四,一个五。那么它的流程是什么呢?就是把它分隔开,连续取值相同的数据,这个是取值相同三个一,对吧?连续的三个二,一个三, 五个四,一个五,那他总共有几个游程?一二三四五,总共有五个游程, 对吧?但是他有多少数据呢?这里有三个,这里有三个,这一个,这里有五个,这里一个一,一五三三六十一,十二十三。一共有十三个数据,五个油成,对吧? 十三个数据,五个流程。那么我们是怎么去验证他的一个分布的随机性呢?就是怎么样利用这个流程呢?大家可以想一下, 如果油成这个油成的个数和这个数据的个数相等的情况会是什么样的情况?比如我给他举个例子,一二三四五,就用这个哦,前面再加个几个吧。 三二二。大家可以看到假设这一串数据他一共有多少个流程? 两个二算一个流程,对吧?然后一个三算一个,一个一算一个二三四五都算一个,那么他总共有几个流程?一二三四五六七,总共有七个流程,对不对?那他总共有多少个数据呢?一二三四五六七八,总共有八个数据, 也就说它的油成数量和它的数据个数是非常相似的,而这里它的油成数量和它的数据个数相差是很大的, 你看他数据相似的时候,他这个数据的分布是不是就比较随机?你看他每个油程上每一个油 流程,他总共有七个流程,然后他的分布二啊、三啊、一啊,他每个数字的分布是比较随机的,大家可以看一下这个他这个分布是不是就比较连续,比较集中在一起。也就是说如果你的流程个数和你的 你的流程个数和你的数据个数非常接近的话,就可以验证你这个分布是满足随机的。如果你这个流程和这个 你这个油成个数和你这个数据的个数分布差异比较大,比如这个五,这个十三,那么就是可以说明他是不满足随机性的。那么怎样去验证他这个一个随机性的? 嗯,等下会用 spas 来进行验证。在这还是讲一下前提,就说你 做流程检验你得有几个前提。第一个你就是基于某一变量的有序序列,就是假设你有两个变量,比如说第一个是性别,然后另外一个是成绩, 基于某一变量的有序序列,然后在其他变量上的分布是否随机?我现在基于成绩这个变量的有序序列,有序序列是什么意思?比如说申序和降序对吧? 身序一二三四对吧?然后在其他变量上,在性别这个变量上,男和女 他的分布是不是随机的?那么就是我这个成绩的成绩在这个男女上的做一个流程检验,来检验他的分布是 是否是随机的。这里有几个田地被检验变量是什么?是性别,男女必须是整数型。什么意思?就说你这个不能是男女这种字符串,你得把它换成数值型的,比如一二这种数值型的才可以。 然后他通常是定类或者定序,更多的是二分变量。二分变量就是性别,他有男女一二这两个变,两个,这个变量有两个,对吧?但是如果你像什么爱好呀?民族啊,他们就有很多个, 比如汉族、壮族、满族,对吧?有两个以上的这种,呃,变量,他,那他就不是二分变量。二分变量的意思就是他只有两个男女这两个背景音变量通常是 定类或者定序的,这是他的一个,比如说男女性别这个性别,他就是定类变量,对吧?或者一些定序变量。但是你 你不能是这种连续的定居型变量。因为如果你想一下,如果你检验成绩在一个定居变量,假设在另一个成绩上,你两个都是连续型的变量,那么你这个分布会非常的复杂。 如果,但是,但是实际上确实很多时候都是要用定句型变量来检验的,这时候没办法,你就只能用割点的方式。什么意思呢?就比如我要检验成绩,我要检验成绩,这个 被检测变量,假设他是成绩,他是一个定计性变量,我怎么割点呢?比如说我把六十分, 六十分以上把它设为一,然后六十分以下把它设为二,那这就是一种割点的方式,就是把它设为两种分,然后去检验它的一个分布是否满足随机。 嗯,那现在就,嗯,这还有个检验结果,等下会用的。到现在就开始设吧。现在假设我现在有个性别啊,而且我都把它编好了一个码, 当然这个码是错的,这个码应该是有一些错误的码,调一下吧。 啊,这里应该升二来着,因为之前我 我只把他的男生是一,女生是二,我只改了他的这个性别的编号,但是我没有改, 没有改这个性别编码的一个,当然这个大家可以在这个转换,然后重新编码,会不同变量里重新转换一下。我在这改一下吧,直接在这上面改也可以的。好了, 男生是一,女生是二,那么我现在刚刚说了,他要一个被谴责变量和在某一个变量上的分布,对吧?假设我现在要检验 语文成语啊,语文成绩二在性别上的一个分布状况, 他的前提是什么?这前面说了一个前提就是说你是要一个呃,有序的序列, 基于某一变量的有序序列什么意思?就是说你这个,你这个语文成绩,你分布你得是符合一定顺序的,所以我先把它做一个深序排列, 大家可以看到他现在是一个身序六十八,六十九。然后我再检验这个语文成绩二在性别上的分布是否满足随机性 分析,非参数检验,旧对话框,在这个邮程检验。这里我检验的是什么?是语文成绩二,对吧?啊?不对,哈哈,是性别,是性别啊,不是语文成绩啊,只是检验语文成绩二在那上 分布而已,然后用中位数就行了。这里因为你性别只有男女吗?你用他的中位数就行了,其他的不用了,确定。 然后这里就是一个最后涂出来的结果检验值二就是只有男女两个性别的意思,个案数小于检验时就小于中位数的吗?五十九个,大于中位数的八十个, 这是邮程数,这是个案数,对吧?这里的邮程数是小于个案数的。那么我们最重要的看什么?还看什么?还是看这个渐进显著性双位。把这个表复制过来, 我们大家可以看到这个表啊,前面刚刚已经解读了,现在主要是看这个渐渐显著性就是他的一个屁值,怎么读呢?如果他大于零点零五,就说明他满足随机分布,如果他小于零点零五,也就说明他不满足随机分布。 我们可以看到的是他的显著性是零点零二四,也就是说他是小于零点零五的,就是不满足原甲设,就是不满足随机分布。那么他最后解的结果就是不同的语文成绩在性别上是不满足随机分布的, 所以说在这里就可以看出,呃,你这个语文成绩很有可能和你这个性别是有一定的关联的,因为他不满足随机分布吗?这个语文成绩二, 那么这也是这次的所有内容。

哈喽,大家好,我是 yooki, 今天我们来讲一下如何在 spss 中进行数据分析,求克朗巴哈系数字。首先我们还是打开 fire open detect, 然后呢,我们打开我们想要分析的数据,我之前已经把数据进行编辑好啊,在 spss 文档中了,所以我直接选择这个 open 就可以了。 有时候 spss 读取数据中会比较慢,会出现卡顿的情况,像这样子的话,数据就已经读取出来了。上期我们讲到如何进行数据的编辑 啊,打,点击 wifi, 我有自己的号,我这里已经是进行数据编辑好的了, 像每一项数据都给他进行了命名,然后每一项 y 的数值也给每一项数值进行了命名定义,然后 s p s s 就知道我们每一项数值的意思。我们直接点击安乐来这里,然后 scab reliability analysis, 然后我们这里可以看到我这一份数据是有很多像 items 的, 我这份数据大概有五六十个 very boss, 那么每个 very boss 都有好几个艾特 啊。我第一个 atten 是 efficiency, 那我就把啊 efficency 以下所有的 itants 的项目全部都拉到 itan 四个框框里面啊。 是要注意的是,不管你有多少个项目艾特和多少个变量,都不要全部一次性把所有的变量中的艾特都放入啊 框这个框框里面进行分析。嗯,最好是一个个变量的一次次的拉进去 啊分析,这样的话呢,才会减少误差。我们今天是求阿尔法,所以这里摸抖,这就不用改了。嗯,在 gt 室里我们点击一下,然后我一般都会选择 item has go items go to live。 但是如果,呃,你有其他的, 有一些数据会所选择是建议 可以参考的话呢,你可以参考,然后应该应该艾特这里,因为我们今天只是要选哦克朗巴哈系数,所以就暂时不选了。沙漠瑞斯这里的话 看,如果你想要求看他的名字或者是 very, 你可以点击,那今天我就随便点击一个名字就好了。嗯,然后继续的话,我们点击 ct, 点击 ok 啊,还有这个 sky ladies 的话呢,我们也可以给他命名一下一方待会数据分析出来之后啊,会 很多,像数据传话可能会混乱,那么我这一项的话,我这个变量的话是一非神奇,那我就给他命名的编号,然后待会数据分析出来的话,我就容易啊,看知道是哪个变量的 啊。竖直 ok, 点击, ok。 好的,那现在我就可以看到 scale, 这个 scale 的话就是啊,我呀,我的这个 efficiency 的这个 scale。 然后呢,首先看一下这里这个 number, 这次就是看你有收集了多少份数据,我甚至是收集两百份,所以我没有任何的微信 data, 却是值,这里是显示百分百,然后拉往下看 vi relaxed statistics, 这里就可以看到克朗巴哈系数值了。克朗巴拉法, 嗯,我的阿法是零点九幺四,还是蛮高的,那么参考标准值就是零点七,如果你大于零点七的话,就代表你这份数据是可信度还可靠的,是蛮高的。 接下来下面的话有很多,呃,刚刚我点的那个命啊,还有球命是 cmdv 选啊这种啊,他队友显示出来供你参考。嗯,主要的是今天我们还是看那个克朗巴哈系数词啊,就是这一块, ok, 那么今天的球克朗巴技术只讲解就到这里了,下期再分享更多视频,谢谢!