粉丝472获赞2002

一、检验是什么?怎么做?首先我们说一下独立样本题检验,什么叫独立样本题检验,它比较的是两个不同群体 或叫不同总体吧,不同总体的均值之间有没有差异?有没有差异,但是因为总体的数据我们不可能获得,我们一般都是通过抽 样,所以事实上我们比较的是两个样本均值之间的差异。但是我们知道,从统计学上来讲,我们想要看的是总体之间有没有差异啊。这个区别一下就可以了,他需要满足以下条件,第一个 自变量,它是个二分类变量,比如性别音变量,它一定要是一个连续变量。比如说我们要检验不同性别的学生他在语文成绩上有没有显著差异,这个时候就用独立样本 t 检验, 嗯,好。然后呢?他需要满足什?还需要满足什么呢?两个样本之间啊,相互独立,互不影响啊。比如女生他的语文成绩和男生的语文成绩,他俩之间肯定不能是相互关联的,如果相互关联就不是独立样本了。 第三个条件是最为严苛的,两个两组样本当中,他必须要正态,并且方差有同志性,或者我们叫方差其性,我们叫方差其性 啊,正态和方差其性在你做独立样本 t 检验之前,都是需要去进行一个检验的啊,如果他不满足,这个时候你就不能用独立样本 t 检验,你可能就需要涉及到一个非餐检验的问题 啊,在非餐检验当中,我们在后面的课会讲,非餐检验不需要有正态啊,这样的一个强假设啊, 如果他呃既满足正态,又是方差其性,那这个时候独立样本题检验没问题啊,没问题。呃,他他他满足这几个条件之后, 独立样本梯检验就可以进行了啊。所以我们说在进行独立样本梯检验的时候呢,先做一下方叉其性检验啊。呃,这个方叉其性检验在我们的 spa 当中呢, 它会自动进行啊,当它在做独立样本梯检验的时候,它的结果会自动输出方叉其性的时候的结果,以及方叉不及性时候的结果。 那至于是不是正态呢?这个我们就需要去单独的提前去检验一下了,所以接下来我们就看一下怎么去检验。哎,是不是正态,是不是方差其性? 在这里我们有两种方法。首先,如果我们想要去检验它服不服从正态,我们可以用 k s 检验 sw 检检验并呃,或者是看这个 qq 图哈,正态的 qq 图 待会我们都会一一演示。如果想要看它是不是方差其性,我们基本上就看它 levin 检验法,它服从的呢,是一个 f 分 布,所以我们只需要去看它这个 f 值是否达到显著性水平。显著达到显著性水平说明它 p 值小于零点零五,你记这个结论就可以了 啊。如果达到显著性水平,说明它 p 值小于零点零五。小于零点零五的情况下, 那这个结果是我们不想要的。注意,这个结果是我们不想要的,因为它表明两组样本它的方差是不同质的,所以理想状况是 p 值大于零点零五,这个一定记住啊,因为一般来说我们说 某某某显著,哎,好像两个样本均值之间就有差异了,这个好像是我们想要的结果,但是在其性检验当中,我们希望它大于零点零五,也就是不显著,这个是比较理想的。 好,接下来我们就演示一下啊,做独立样本 t 检验之前,我们需要做一下正态性检验,我们先打开一个数据库啊, 我们找到, 找到这个原始数据,我们打开一下。好,现在这是我的一个原始数据啊。 好,现在呢,我们先给他做一下正态性检验,比如说我想要检验一下这个语文成绩,它在性别上有没有显著差异,哎,我想检验一下这个东西。好,那,但是呢,我并不知道这个语文成绩在这两组当中, 它的分布情况是怎么样的,服不服从正态,它方差齐不齐性,所以我要去检验一下。好,怎么做正态检验?点击分析描述统计,在这里探索。 好,在这个弹窗当中呢,我们需要去选择语文成绩,选到音变量列表, 在这里因子列表,也就是我们的二分类变量性别选进来,然后呢,在统计这里点,呃,点一下,这里选一下描述啊,然后在图这里点一下,选一下这个 含检验的正态图,我们点击继续确定。好,现在啊,这个个案处理摘要不用看啊,不用看描述统计,可看可不看,我们主要看的是这个表,我们回到 ppt 这里, 我们主要看的是这个表。呃,我们刚刚说正态性检验主要有两种方式,一种是我们既可以看 k s 检验的结果,也可以看 sw 检验的结果,或者我们直接看 qq 图嘛。 好,所以,呃,一般来说,如果你的样本量小于两千的情况下,我们通常看它,也就是这个夏皮洛威尔克,我们简称 sw, 这个科尔斯米诺夫,我们简称 k s。 检验,我们一般看它,我们常常看它。好,如果这个值啊,如果这个值它是大于零点零五,说明什么?说明它 也就是我们要我们不能拒绝原假设,对吧?原假设是什么?是无差的假设啊,无差的假设,那这个时候这是我们希望的结果,因为这代表 他服从正态了,他服从正态了,两个分布他是一样的,都是正态啊,那我们就看呀,对于男生组来说啊,这个成绩 啊,这个表格当中,我这里做的是数学成绩哈,做的是数学成绩,那我们将就看一下啊。对于男生来说, 这个数学成绩在男生组里面,它的这个显著性零点三三六大于零点零五,对于女生来说,它的这个 sw 的 结果显著性大于,呃,大于零点零五, 所以这是我们想要的结果,说明在这两组当中,它的分布是服从正态。哎,这样子的话呢,我们的正态性检验就过了呀。 啊,这就可以进行下下一步的操作了。下一步是什么呢?我们还得看一下他方差齐不齐性。怎么做啊?怎么做?我们刚刚做的是啊,语文的成绩,对吧?语文成绩这里看一下,他这个显著性一样的大于零点零五,说明他是服从这个正态的啊。 呃,我们还可以看一下这个 qq 图啊,你看语文成绩,对于男生这组来说,他的 qq 图,你发现没有,他所有的数据的这个点呢, 基本上是围绕着这个四十五度的这个礼盒的直线,是啊,附近是上下波动的,基本上是比较贴这个直线的,说明他是服从正态的。 对于女生这组来说,他的 qq 图也也是一样,甚至比男生还要服帖,你看到没有,甚至比男生还要服帖,那基本上他就是正态的,哪一种不是正态呢?就这就是他的点,离这一条礼盒的直线呢, 非常的远,而且很分散,没有什么规律,基本上他不大可能是正态了 啊。好,然后接下来呢,我们去做一下这个独立样本的 t 检验,我们刚刚说,呃,独立样本 t 大 师呢,在做独立样本 t 检验的时候,它会自己生成那个方差是否其性的结果, 所以我们就可以直接点分析,在比较平均值这里,我们选择独立样本 t 检验点它,然后这个时候呢,我们要把这个呃语文成绩选进来, 原成绩选进来,因为性别它是一个分组变量,我们要把它选到分组变量这里,然后我们发现性别后面是两个问号,是因为我们还没有去给他们定义那个值,所以这里我点击定义组, 定义组之后使用指定的值,组一组二,组一呢,我们就把它界定成一一代表什么呢?二二代表女生。点击继续 啊,我们看看选项里面啊,选项里面这个致性区间,我们百分之九十五致性区间就可以,它对应的是零点零五的致性水平啊,显著性水平,好,点击点击确定。 现在出现了两个表格,我们还是一样啊,我们回到这里来看哈,我们看一下总统计这个表格当中呢,它显示的是,呃,就数学成绩这个变量, 男生和女生啊,它俩分别的第一个个按数有十八个男生,二十二个女生 啊,平均值,男生的数学成绩的均分是八十二点五,女生数学成绩均分是八十四,说明女生的数学成绩均分还要高于男生高一点啊,而且女生的这个离散程度还要小一点,发现没有,哎,所以整体来说,好像这样看起来,女生是 数学成绩啊,是优于男生的。然后接下来我们就看这个独立样本体检验这个表格,我们首先看看方差是否奇性,这个来文,方差等同性检验,其实就是我们刚刚说的那个 lavin 的 方差奇性检验的结果,它是服从 f 分 布的,我们先看 f 值, f 值是零点六,然后再看显著性,零点四四三大于零点零五,说明什么?它是 等方差,也就是方差其性,所以这个时候我们看的应该是上面的第一排的数据。注意哦,我们看的是第一排的数据,第二排你看他写的是不假定等方差,这个时候如果他 f 的 显著性是小于零点零五的情况,我们就应该看下面第二排的这个数据啊,这个应该能理解。好,那接下来呢,我们就看一下在这个数据当中, 它的 t 值,我们先看一下 t 值是负的,零点六一五,限注性零点五四二。好,我们发现它大于零点零五, 一直大于零点零五,这可能就不一定是我们想要的结果了,说明男生和女生,他俩在数学成绩上,他俩均值是 相等的,相等的,不存在显著差异,因为这个显著性大于零点零五啊,如果你想要他的这个致性区间,可以看到他的下线是负的六点四四,上线是三点四四。但一般情况下,我们只需要报告他的这个 t 值, 他的 t 值,他的显著性,他两组的均值标准差,各按数等等这些变量即可。那接下来呢,我们再看一下相关样本的 t 检验。那相关样本呢,他是对同一批被式在不同时间点 重复测量,或者我们也可以叫重复测量。当然啊,呃, 重复测量的话,它可以测量两次,它也可以测量多次啊,多次。在相关样本体检当中,它限定为两次,两次 啊,所得的这两次测量分数的均值之间,我们要看一下有没有显著差异呢?所以相关样本 t 检验它的适用条件,第一,你的观察值一定是一个连续变量分类,不可以。 第二,你至少有两组观察值。第三,两组观察值的差值就是 x 一 减 x 二,没有明显的异常值,并且这个差值服从正态,或者叫近似正态。怎么做?我们以一个案例来呃入手, 现在啊,我们有一个是新的专注力训练的程序,我们呢去训练了一批小学生。那我们想要看一下这个专注力训练啊,对他们的阅读理解成绩有没有显著的影响。 那很明显,他是一个配对样本 t 检验的一个问题。我们的研究对象呢,是三十名小学四年级学生,九到十岁之间。那我们在给他们进行这个专注力训练之前做了一个前测,这是第一波数据 啊,做了一次标准化的阅读理解,然后我们就开始给他做这个为期四周的专注力训练,那接下来呢?我们做完这个四周的训练之后,再给他们测一次这个阅读理解,也就是我们的后侧,这是 第二波数据,这是第二波数据。现在我们对于同一匹配式 是不是有了两波数据?因为是同一批背式啊,前后测成绩看看他们有没有差异,所以他肯定是相关样本呢。相关样本, 而且他只有两组数据的情况下,我们用 t 检验啊,就是这么去判断的。好,那怎么做?我们一起来演示一下。用这个 好,现在啊,因为我们刚刚说你要做配对样本 t 检验之前,你就需要去看一下它的差值, 首先有没有特别异常的值,或者是,呃,根据我们前面所讲的异常值的筛查的那个板块,我们去看一看有没有异常的值啊,还要去看一下它是否这个差值是否满足这个正态或者是近似正态的分布。那怎么做? 先把前测和后测这个差值先给他算出来,生成一列新的变量。这个差值是怎么生成的?我给大家看一下啊。呃,我们之前也呃,也讲过,在转换这个时候我们要用到的是计算变量这个功能,我们已经讲过了,计算变量 好,比如我就把它命名成叉值啊,叉值应该是干预前,我把它选进去减去干预后啊,你前侧减后侧,后侧减前侧,呃,都可以,都可以,只不过呃 就就看它是正是负而已嘛,但,但它绝对值肯定是一样的。好,所以这个时候我这个数学表达式就是前减后或者后减前都可以好确定跟改性有变量吗?确定 好,我们看一下这个结果啊,你看这个结果当中它全部是负,说明我前减后啊,前测它的成绩是低于后测成绩的,因为我们现在讨论这个问题是这个专注力训练到底能不能提升它的阅读理解, 呃,阅读理解的成绩对吧?好,从这个差值来看,貌似是有效果的,但是实际上有没有效果,我们不能仅根据这个差值来判断哦。 啊,因为从统计学上来讲,他差异是否显著是需要通过假设检验来判断的啊。但是呢,我们初步断定,哎,从差值来看,好像还可以啊,如果你不喜欢负数,你直接就后减前嘛, 你直接就,我们还是把它换成后减前好了。后 减前 好,现在它差值变正了,后减前嘛。然后接下来我们来看一下, 看一下这个叉值是是否满足正态。点击分析,这个我们也讲过,描述统计探索,把叉值选进来。图这里我们选含检验的正态图。继续。 好,这里我们直接搂一眼这个正太的 qq 图,我们就发现,哎,基本上是复合的,因为所有的这些数据点呢,在我们这条礼盒的直线的附近,上下轻微幅度的波动,基本上是贴合的,基本上是贴合的啊, 或者我们看这里大于零点零五,这是我们想要的结果。好,这回我们就可以进行下一步的操作,点击分析比较平均值,因为我们现在做的是相关样本,所以我们要选择成对样本题,检验点它。 然后呢,我们发现在配对变量下面呢,有一个配对一,然后分别选进去, 先把前侧选进去,再把点击后侧选进去。所以现在变量一呢,代表前侧,变量二代表后侧啊,代表后侧 向量大小不需要,我们看一下选项里面有什么啊?选项里面一样的执行区间百分比我们设成百分之九十五,这是它的默认值啊,默认值好,现在我们点击确定, 点击确定好,我们回到 ppt, 我 们看一下,用 ppt 来看一下啊, 好,现在在我的这个配对样本 t 检验当中呢,我们发现有三个表格。首先第一个配对样本的统计量,这是它的描述统计量,我们先看这个干预前是 前侧,干预后后侧,我们先看前侧,前侧的均值是六十五点九分,后侧的均值是七十七点六七分 啊,然后个案数是三十嘛?个案数是三十,是同一批被试,从这个均值来看,呃,后侧的成绩是要高于这个, 是要高于这个前侧的成绩的好,但是他有没有在统计学上的差异呢?我们还要进一步的去看这个配对样本的相关性啊, 我们可以看一下,因为如果啊,如果你的前侧和后侧的成绩他的相关是不显著的,那你的数据就有问题了,因为按道理来讲,他是同一匹配式的 两波数据,按道理来讲,他的相关性应该是绝对需要显著的,因为他是同一批被试,如果他相关性不显著,那就没有关联,那 你的数据一定有问题啊,所以可以浅浅的看一下这个相关性,那主要看的是这个配对样本 t 检验,我们看啊,前测减后测,它的这个差值是负的 啊,负的十一点七七,我们保留到两位数,然后我们再看这个 t 值 啊,我们发现是负的十五点五三,然后我们再看这个显著性,我们发现哎呦,显著的小于零点零五呢?它显著小于零点零五说明什么?说明前侧减后侧这个平均值之差, 它是显著的啊,它是显著的呀,所以这个时候就说明 啊,这个后侧是显著要高于前侧的,他就说明了这个事。为什么我说后侧显著高于前侧,因为从 这个统描述统计量来看,他是后侧的成绩均分是七十七,前侧成绩的均分是六十五。 所以然后这里的结果又显示了这个 t 检验结果又显示了它,是啊,小于零点零五的,这就说明 ok, 那 就是后侧的成绩显著高于前侧的成绩, 这个应该能理解,这是配对样本 t 检验的一个结果的解读。接下来我们看一下单因素方差分析。

我们学习第五章频率分析,频率分析实际上是统计分析或者是数据分析里面一个最基本的一种的操作, 那所谓的频率分析,我们也把它叫做频数分析,那实际上频率我们应该是有百分比,那么频数它只是我们计数出现的一个个数, 当然有的时候我们会把它混为一谈,它也是一种常用的描述性的统计分析的方法,用于确定数据集中各个数据 数值或者是类别出现的频率,主要是帮助我们了解数据的分布情况,还有分布的模式。在 s p s s 软件当中,频率分析主要包括以下一些内容,第一个我们就评述,评述就是一个数值或者某一个类别,比如说难 生女生出现的这个频数也就出现了次数。第二个百分比就是每一个数值或者类别在整个数据集中所占的百分比。第三个就是累计评数, 就是每个数值或类别累计出来的这种的分布的情况。第四,累计百分比它只是平数转化为百分比。第五,我们可以画直方图,展示数值的情况和形状。条形图它主要是会这分类变量的 频率分布,那直方图主要是绘制什么数字型变量的,还有可以绘制丙图,丙图它也是分类变量的这个分布图。最后还可以我们获得这种概括性的统计量,比如说均值、标准差、最小值、最大值等等。 在我们实践中,频率分析是经常会用到的一种方法, 我们来看一下。先来看一下类别变量,也就是分类变量怎么进行频率分析, 那么分类变量包括像性别啊,职称啊,教育程度等等,我们的频率分析是计算他每一种类别,比如说男生、女生或者教授、副教授、讲师等等,在整个这种的数据,数值数据里面出现的这个频率,那我们可以了解他, 他们比如说男生的这个相对的频度占比,还有分布的情况,我们经常用的就是频率表,饼图,条形图等等。 我们先来看一下这个案例,客户购物数据,它是一个线下购物的一个数据库,包括个人的信息等等。那么我们来完成以下两个简单的操作,一个是对变量 是否已婚,还有教育程度,直接生成频率表,然后进行频率分析。那么这个频率分析在这个案例里面 是否已婚,还有教育程度,他这两个都是类别变量,也就是分类型的变量,所以我们可以直接给他生成一个频率表,这是频率表。另外一个就是我们生成频率表之后,再对这个表格进行分析,进行频率分析, 看一下已婚和未婚客户的人数和比例,还有不同时历的人数和各自所占的比例,这让我们很直观的对于这两个变量的数据的这种分布和形态有一个了解。 我们现在打开这个客户购物数据这个数据集,我们来看一下这变量式图,那我们要分析的这是一个是婚姻状况,婚姻状况大家看他这里是零,是未婚,一是代表已婚,这是分类变量。 第二个我们要看一下教育程度,这是异地,就是 education, 那 同样的它也是个分类型的变量,分为五类,高中以下,高中完成部分本科之后,我们可以把它看成是大专、本科学历,还有本科以上就是研究生。那 对这个数据集的这两个变量进行频率分析,我们可以从这个分析这里进入,大家看这里有个描述统计这些这个菜单里面我们都属于描述统计的内容。第一个命令我们就是频率分析,我们打开了这个频率分析这个 对话窗口,大家看这个变量就是我们要分析的这个数值的变量。 首先我们把是否已婚可以选择过来,第二个我们把教育程度也可以拖过来啊,这样这样的话我们就对这两个变量进行频率分析,大家看左下角这边有个显示频率表,他是默认的已经选, 选择了打勾就是他会自动生成一个频率表。那统计这里大家看一下统计这里的话就是我们一些 统计量的深层的基本的选择,这里是百分位置,你可以去选,也可以不选。那集中的趋势,我们讲数据的集中的趋势,我们可以选个均 总和,那么理想的程度你可以选个标准差,可以啊,最大值最小值也行,那分布这个是偏度和风度,这是我们数据分布的形态,实际上对于分类型变量的频率分析这个表格我们实际上是不需要去选择的。 继续那图表的话,我们这里可以选择一个条形图或者饼图都行, 底下的图标的值可以用频率,也就是平竖来画这个图,也可以用百分比来画这个图都可以,我们点继续,那是其他的几个选项,我们就用它默认的不去管它,这个时候我们点确定, 我们就生成了我们的这个频率分析的结果。首先第一个表,我们可以不去看它,因为我们是分类变量,我们直接看这个频率表,大家看这里是频率表,频率表 是否已婚就是婚姻状况,这里面我们很清晰,未婚是三二二四人,已婚是三幺七六人,或者样本总共是六四零零个样本,这里是占的百分比,接下去是有效百分比,还有累积百分比,在这里因为没有缺失值,所以有效百分比,也就是我们的总的这个样本,它是一样的, 同样的这个教育程度也是一样。我们把它分为五个类型,高中以下、高中毕业完成部分,本科大就是大专本科学历本科以上。然后这里面一共占了多少的比例? 比如高中以下学历有幺三九零个样本,那么占了百分之二十一点七, 那本科以上学历就有三百五十九个样本,占了多少?占了百分之五点六,那相对他是比较少的。但是总的来看,他的这个样本 的客户的这个教育程度分布他是比较均匀的,包括性别分布也是比较均匀的,因为也本科以上学历的人数少,本身就是说这些客户数量他在总体里面占的也是就是比较少的。接下来我们来看一下条形图, 这个是是否已婚的条形图啊,这个是未婚,这个是已婚啊,差不多再往底下教育程度也是一样的, 五类教育程度,我们可以很清晰看到高中毕业这个是人数是最多的,那应该这个地方他是已经普及了高中教育,然后完成本科就大专和本科也差不多,高中以下也差不多,就总的是分布比较均匀的。 那这个就是对一分类型的变量进行频率分析的一个案例,我们就学习到这里。

接着我们来学习数据转制,所谓的数据转制它就是改变数据表的结构,把行和列进行对调, 原来行的这个变量就变成列,那么列的这个个案变成行的变量。那我们需要注意的就是原始数据中的变量必须是数字型的数据才可以进行有效的转制。对于制服型还有文本型等等 非数字型的变量转制可能不能够达到我们预期的效果。我们来看一下这个案例数据集, 统计学成绩重修,包含的四位同学的统计学课程的重修的成绩变量,班级的数据用九十九代表重修,要求对该数据集进行数据转制。我们现在打开这个数据集,我们从数据这里进入转制。 首先名称变量,我们是学号,因为学号它是唯一的重修和统计学的成绩,我们放到变量这里直接点确定,这样就我们就得到了这个结果,这个结果我们可以看到 四位同学的学号它就变成了变量,而班级和统计学的成绩就变成了 个案。有的时候在我们进行一些计算的时候,我们需要用到这种数据的转制,行和列的这个转制,当然你在 excel 这些软件里面,它也很容易实现这种的功能,那这一小节我们就学习到这里。

好,各位同学,大家好,欢迎大家来到我们的 spss 基础语实战的第五讲,那今天呢,我们要讲的内容呢,是关于参数的假设检验如何去做?呃,今天这节课当中,我们主要会涉及到的内容呢是关于假设检验的统计学原理, t 检验的方法以及单因素方差分析的方法。在我们本节课当中,我们主要呢需要去理解参数检验,他的统计学原理是什么?当然这个统计学原理因为我们不可能讲成 就是那种很传统的统计学的课程啊,毕竟呢,我们这门课是一个比较呃实操导向的一个课程, 所以其实如果在讲解的过程当中,在统计学这块你不是很理解的话,你记住结论就可以啊,你记住结论就可以,你也不用太过于去纠结其中的一些 啊,推导的一个,或者说呃统计学方面的一个东西啊。呃,如果说你能理解,那更好,那更好,但是便于你,你的这个科研之路可能会更顺畅一些 啊。第二个呢,我们会讲一下,呃,我们需要去理解什么是 t 检验,什么是方差分析,并且我们需要掌握在 spots 当中怎么去做 t 检验和单因素方差分析 啊,他的方法是什么?今天我们所要讲的 t 检验呢,主要是分成两类,一类是独立样本 t 检验,一类是相关样本的 t 检验,或者我们也可以叫配对样本的 t 检验。好,我们一起来看一下。首先假设检验他的统计学原理是什么? 什么叫假设假设检验在统计学中呢,它是推断统计的重要部分,我们一般呢是涉及到两种假设,一种 啊,叫做元假设,一种叫做被则假设,我们待会一个一个去解释,我们通过拒绝或者是接受元假设,我们就可以去检验样本均值与某个特定值,或者是两个不同样本均值之间是否存在显著差异。 如果两个样本均值之间存在显著差异,我们可以由此推断两个总体它是不一样的。我们会提前假设这两个样本均值,它来自两个不同的总体 啊,所以我们虽然检验的是样本的均值,但是我们推断的是总体的均值, 那其中呢,检验样本均值与总体均值之间差异的检验呢?我们叫做单样本检验啊,它是某一个特定的值,比如说就是 miu, 那 两个样本均值之间的差异呢?它就包括了独立样本的 t 检验和配对样本的, 我们这里要用 t 检验,那常见的参数的假设检验的类型有哪些呢?有 z 检验,它呢,是要求我的样本分布要服从正态分布,有 t 检验,它是其实它是一个学生分布来的 学生分布,但是他其实长得很像,他长得很像正态分布 f 检验啊,他用的就是这个 f 分 布。 在实际的研究当中呢,虽然不同的检验对数据分布的要求不同,那我们在 spss 中呢,主要会涉及到的就是我们的 t 检验和 f 检验,因为一般来说啊, z 检验 他是要你完全是要满足正态分布的啊,那那一般来说 z 检验我们用到的这个可能性也比较小,我们一般比较符合实际的话就是 t 检验和 f 检验,接下来我们就一起来认识一下,在参数的假设检验当中,他有几个比较核心的一个概念。 首先我们要认识一组假设,分别是原假设和被则假设。原假设呢,我们用 h 零来表示。被则假设呢,我们用 h 一 来表示。什么叫原假设,它呢,是一种无差假设。在这里 我们发现这里,呃,在双尾检验当中呢,它把原假设写成了 theta, 等于 theta 零, 这就代表他认为这两个均值呃,所来自的总体啊,这俩总体之间是没有显著的差异的,所以叫无差的假设啊,两个均值之间 没有显著的差异,那原假设呢?也可以叫零假设,零假设,因为没有嘛, 在英文当中它写成 no, 所以 是零假设,就是没有的意思。那被则假设呢?它与原假设的表达是相反的,它假设两个均值存在显著差异,因此它是一种有差的假设。在这里, 双维检验当中,他就要写成 c 塔,不等于 c 塔零。好,我们看一下下面这个表格,其实假设检验呢,根据检验的这个呃,这个假设的不同,他可以分成三种不同的类型。第一种 双尾检验,它的假设应该这么写,原假设 h 零, c 等于 c 零, b, 则假设 h 一 c 不 等于 c 零。如果是一个单尾检验,注意这两个都是单尾。什么叫做单尾?我给你画一下就知道了。 假设我们这有个样本的分布,那我所画的这两条线,它对应着我这个横轴上面的这两个值,我们叫做 临界值。临界值呢,它是可以算出来的啊,它算出来怎怎么算,我们不需要知道怎么算,不需要知道这不是统计学啊。好,那这个时候呢, 我们发现临界值的左边这条线,它的左边部分有一个区域,右边这条线它右边的部分也有一个区域,这两个区域 你看是像不像这个分布的两条尾巴啊?所以这个时候我们就要去看一下,到底我们算出来的这个值是在哎,临界值的右边右边就应该是在这个区域,还是临界值的左边左边就应该是这个区域 啊?这个这种情况下呢,它就是一个双尾的检验。再来,如果它是一个单尾的检验, 假设这是它的一个分布,这是它的邻界值啊,这里是它的邻界值。 那这个时候,比如说我们先看右单尾吧,右单尾,那它的假设怎么写呢? h 零呢?就要写成 theta 小 于或者是等于 theta 零, 那他的被则假设就要写成 c 塔大于 c 塔零,因为原假设被则假设他们的写他们的那个假设一定是相反的啊,正好是互补的,相反的啊,比如原假设是等于,那他肯定就是不等于嘛。 好,在这个单位检验当中,我就要去看我计算出的这个值到底有没有落在我临界值的右边就大于吗?有没有大于 我的这个临界值啊?如果落在了右边,比如落在这个区域,那这个时候我们就可以怎么样拒绝原假设?我们就说, 哦,这个应该是拒绝欲,什么叫拒绝欲?什么叫接受欲?待会我们在下页 ppt 我 们再去做解释哈。先有一个大概的了解,如果它落在这里,这是拒绝欲,说明我们要拒绝我们的 元假设,这个时候拒绝了元假设,那我们就选择背则假设呗。啊,因为它落在这个区域,这个时候它是一个 右单尾的检验,因为它的尾巴在右边,在这个分布的右边,那左单尾就好理解了,左单尾它就一定它尾巴是在左边的,就看它有没有落在这个区域 啊。左单尾有没有落在这个区域,我们要验证的就是它有没有小于我们的零界值啊,就这个意思,就这个意思。好,接下来我们需要了解一个概念,什么叫做显著性水平。 显著性水平呢?我们用阿尔法来表示,它指的是当我们的原假设是真的时候 啊,就是这个原假设,它本来就是一个事实,但这个时候我们因为某些原因,我们 拒绝了原假设,这个时候我们是不是就犯了一种错误?那这个犯错误的概率,它是一个小概率事件曲值,一般零点零五, 当然也可以取成零点零一或者零点零零一,一般零点零五就可以,这是最低的一个限度啊,所以显著性水平,它是 alpha。 如果我们看下面这幅图,那 alpha 到底在哪里呢?我们现在 看这个 h 零的分布啊,注意左边这条分布。是啊, h 零的分布,这是 第一个分布。右边这条曲线,它是 h 一 的分布,这是第二个分布,因为我们现在要检验的就是,哎,这个均值,它来自的这个总体呀,是否与另外一个总体是有差异的,还是没有差异的呢? 那 alpha 在 哪里呢?在这里,在这里,这里是 alpha。 我 们说 alpha, 它 叫做显著性水平,它描述的是当元假设是真的时候,我们却拒绝了元假设,这个时候我们犯的错误是阿尔法。 好,接下来我们就看这里捉盗犯错误,我们错误呢,有两类, 一个是一类错误,一类错误,它也叫契真错误, 也就是我们刚刚说的元假设,它本来是真的,但这个时候我们拒绝了它,我们拒绝了它,这个时候我们是不是犯了一个小概率的错误,那这个概率是多少呢?这个概率就是 alpha, 也就是 我在这幅图里面画出来的这个黄色的区域,它是 r 法啊,本来呀,我们如果原假设它是真,本来我们应该落在 接受欲,比如我落在这里,本来应该落在接受,但是现在我拒绝了他,也就是我认为他落在黄色的这个区域,因此这个时候我就犯了一类错误,也就叫做弃真。因为我放弃了 这个元假设的那个真的选择,所以这个时候我犯了一类错误,这是阿尔法。这个概率好,什么叫二类错误?也叫做取伪错误,取伪取伪,顾名思义,元假设 他是假,也就是他本身是不成立的,但是这个时候我们接受了我们错误的概率,他就是二类错误,背他。 所以为什么叫取尾错误,它本来是假,但是我却接受了它,所以就是取尾啊。那在这个图当中,其实就是这个部分,就是我所画的这个蓝色的区域 啊,就是贝塔,阿尔法和贝塔都是两个小概率的事件。注意哦,一定是小概率啊,小概率。 想想看,在二类错误当中,元假设为假,我们本来应该拒绝它,也就是本来我应该落在 拒绝域当中,对吗?可是现在怎么样?我接受了它,也就是它落在了我的, 比如说落在了这里,落在了这里,落在了我的接受欲当中了,因此这个时候我就犯错误了,我这个犯错误的概率就是我的 贝塔二类错误。好,呃,如果你能理解,你就尽可能去理解,如果你理解不了,你就只需要知道阿尔法代表显著性水平,这个取值我们一般取零点零五即可。好,你先记住这个, 然后接下来我们看一下什么叫知性度。知性度呢?它是一减阿尔法,在我这幅图当中呢,也就是我中间的这一大块区域。 大家有没有发现阿尔法是我们刚刚讲的显著性水平,而知性度是一减阿尔法,所以知性度和显著性水平很明显它是一个 呃,这个互补的关系,对吧?所以当阿尔法等于零点零五,也就是百分之五的时候呢,这个致性度就应该等于百分之九十五, 那也就是说如果我的值落在这儿,我就落在了百分之九十五的这个致性度这个区间当中。那注意呦,致性度和致性区间 他是两个概念,那致信度他是一减阿尔法,他是一个概率啊,他是这个,他是百分之九十五啊。我假设当我阿尔法是百分之五的时候,那致信度就应该是百分之九十五,那致信区间呢?致信区间指的就是 这个和这个这两个值之间的一个啊,差距一个距离,这个叫区间啊,叫致信区间。 志性区间也不需要我们自己去算, fast 会给你算出来,它一定会给你提供志性区间。志性区间怎么表达的?括号,这是它的 下限值,这是这是他的上限值。二、一般是这么表示的,比如说我有一,我有一个数据,我现在的执行区间是,比如说是,呃,零点零一到零点零九 啊,他就是一个致性区间,所以说在这里大家可以看到致性度越大,致性区间就越宽,也就是中间这个区域,这个面积他就越大, 这个时候怎么样呢?你就很有可能你就有更大的概率落在中间这个区域,也就是我要接受原假设, 拒绝欲就是我要拒绝原假设,就这个意思。那么如果致性度一减,阿尔法越小,那你的致性区间就越窄,你致性区间越窄了,中间这个这一块它的面积就越小,那这个时候你就越容易落在我们的 两个尾巴这两块区域上,拒绝欲也就越容易拒绝我们的原假设 啊。所以他是这么样的一个关系,这么样的一个关系。好,那双尾检验。单尾检验,我刚刚已经跟大家也解释过了,左边这幅图他是一个双尾,因为他有两个尾巴,他一般检 验的就是缪等不等于缪零呢?啊,那右边这个他展示的是一个右侧的 一个单位检验,他要检验的就是,哎,到底这个缪大不大于缪零呢?这是他需要去检验的。如果他落在了这个区域,这个时候就怎么样?说明他落在了拒绝欲吗?说明我们要拒绝 拒绝元假设,拒绝元假设就说明缪它是大于缪零的,它是大于缪零的啊。好, 接下来我们就总结一下到底假设检验它的步骤是什么?第一步,我们要建立元假设和贝则假设,元假设 如果是双尾,就这么写, h 零 x 一 等于 x 二。呃,很明显,这里它检验的是两个样本均值之间有没有差异。原假设我们说是无差的假设,所以是等于那贝则假设, 那跟它相反吗?不等。第二步,我们要选择检验的方法,然后去计算一个统计量,这个统计量如果是 z 检验,你计算出来的就是 z 值。如果是 t 检验计算出来的就是 t 值。如果是 f 检验计算出来的就是 f 值。一般来说,我们 不看他,我们只看他和他好。第三步,我们要去确定一个显著性水平阿尔法。为什么要确定阿尔法?因为不同的阿尔法,你查表查出来之后计算的零界值它是不同的,所以 要确定显著性水平。阿尔法,一般我们定为零点零五。第四步,计算出一个 z 值、 t 值或者是 f 值,然后和这个零界值 去进行比较。 z 值、 t 值、 f 值怎么计算?不需要知道,有公式,有公式,但我们不需要计算 space 给你计算出来了啊。 事实上,我们在看 space 的 结果的时候啊,看它的结果的时候,我们看的并不是这个 t 值和零界值的比较,我们看的是 b 值、 p 值, p 值,它是一个概率值,它是一个概率值啊, 他和谁比较呢?和阿尔法。阿尔法我们刚刚已经说过了,他是一个显著性水平,一般他的值就定在零点零五。因此你就记结论,如果 p 小 于零点零五啊,或者 严格一点啊,严格一点,小于零点零一啊,那么只要他小于这几个值,那么就可以拒绝 拒绝人,假设我们就认为两个样本之间啊,他是存在显著。注意, 其实严格来说哈,不是样本之间存在显著差异,因为我们是通过样本去推断一个总体,所以严格来说应该说的是两个总体之间是有显著差异的 啊。如果你前面都不懂,无所谓,你去记结论哈。记结论?好,接下来我们就看一下。

我们接着来学习 span 中的汇总汇总这个功能,它主要是将数据按照一个或者多个分类变量来进行分组,然后对组类再进行一个汇总的运算,比如说计算平均值、求和计数等等。那么这个汇总功能 他的操作主要是用于将数据按照分类变量来进行分组统计。那么我们后面要学的像描述性统计分析,这个主要是对单个或者多个变量进行描述性统计分析,和这个是不一样的,因为他不涉及到这个分组和汇总这么一个功能。 我们来看一下这个数据及员工信息,这个案例的员工信息还是我们前面的那个案例,包含了所有员工的基本信息, 请按照员工的雇佣类别计算各个类别员工当前的平均薪金、最高薪金和最低薪金。 现在我们打开了数据集,我们来进行汇总,我们从数据这里进入,这里有个汇总的菜单。首先我们讲看一下这个分界变量,就说你是按照什么来分类的呢?我们按照雇佣的类别来分类,因为雇佣类别分为三类。 然后我们再来计算他的这个汇总,我们要汇总刚刚讲过的,我们要汇总的是他当前的心经,那么当前的心经首先我们看我们是要捉他一个平均心经,那我们点这个平均,这已经是平均值了,命就是平均值,我们只要把名称给他改一下 平均心经,那么用这个标签,我们一样的也是用这个,实际上是同一个标签,就是名称和一样的。 那接下来我们还是要计算这个当前心经里面的最大值就是最高的心经,那还是这个,但是我们函数要给它改变一下,这函数大家看这里面有很多的函数,那我们用一个最大值, 最大值的话我们把名称给它改一下,这里就是最高心经,最高心经 max 就是 最大的意思。 那接下来我们还是来寻找对这个变量。当前心经里面我们找到它最小的一个值,我们函数这里面我我们选择最小值的这个函数,然后把这给它名称和标签给它改一下,这是最低 最低心经 minimum 就是 最小的意思啊,我们放到这个标签这里面,然后我们点继续,那这里的话,你可以把汇总的变量 加到我们就是现在活动的数据机,就是我们打开的这数据机里面,你也可以创建一个新的这么一个数据机,把我们的输出的结果放在里面,比如我们这个新的数据机就叫 a a a, 我 们点确定, 确定之后我们生成那个新的数据级的名称就叫做 a a a。 你 看我们经过汇总,我们把雇佣类别职员、保管员、经理他的平均薪金,职员平均薪金是二点七八万,保管员是 三万,经理是六点三九七七万,那最高薪金在这里经理最高的是十三点五万,那么这是最低的薪金,最低的职员里面只有一点五七五万 啊,那我们也可以点一下这个,可以这个类别就是一二三,在我们数据集里面已经把它分类了,这个汇总的功能也很有用,当然我们后后续的学习还有其他方法来进行一些汇总的计算,那么这个汇总的功能我们就学习到这里。

同学们,收完问卷,打开 spss, 是 不是卡在信效度分析了?别急,百分之九十的人第一关都困在这里。今天用三分钟手把手带你用 spss 跨过这一步。信效度分析 第一步,信度分析,你的数据稳吗?点哪里分析?刻度可信分析,点击右侧统计勾选,如果像已删除,则进行标注。怎么做?把同一个维度下的所有题目拉进右侧框里, 注意不要把整张问卷所有题一次性拉进去,要分维度做,看什么克隆巴赫系数及格线大于零点七, 如果低于零点七,说明这组题测的不准,可能需要剔除个别拖油平题目。第二步,急救修正结果不好看怎么办?看向总统计在输出的表格最后一列, spss 会告诉你,如果你把这道题删了,你的信度系数会升到多少,哪里分高删哪里,直到系数达标为止。 第三步,效度分析,你的题目对吗?点哪里分析?降维 因子分析怎么做?将相关题目选入,点击描述,勾选底部的 kmo 和 bartlett 球形度检验, 点击提取方法选主成分,提取,选基于特征值大于一,点击旋转方法选最大方叉法,勾选旋转解,看什么 kmo 值大于零点六算过关,越接近一越好, bartlett 显著性必须小于零点零五。如果这两个指标达标,恭喜你,你的问卷结构设计是合理的。 接着看旋转后的成分矩阵,找找看, q 一、 q 二, q 三、 q 四,是不是都在一个成分下面?有高数字? q 五、 q 六、 q 七、 q 八,是不是都在另一个成分下面?这就验证了你涉及的问卷维度是否正确?每个题目的最高数字应该大于零点四, 且最好只在一个成分上高。为什么强调正版?正版 s p s s 提供的不仅是稳定的分析环境和完整的功能,更是计算结果的准确性和学术诚信的保障。好了,三步急救法完毕,我们下期再见。

今天给大家讲一下这个信度分析和效度分析是什么意思,然后怎么样做成这种标准的论文三线表,再加上文字分析报告后面的这个文字分析报告。首先我们的信度分析和效度分析是只能对两表题做 什么是量表题,给大家看一下,一般我们的量表就是这种标准的五级的理科特量表,就是比如说像这个自变量维度,然后你认为抖音的界面是否 吸引您的购物,吸引您进行购物,然后一二三四五依旧代表完全不吸引,五就代表完全吸引,就是 这种就是属于两表题,然后对应的数据这里就他就会用一二三四五来表示我们的信效度是不对这些分类题目做的这个要记住。 然后我们打开这个 chat, s p s s, 就是 这里直接点击输入就可以,在网页端随便一个浏览器打开就可以,然后这里点击上传数据,数据上传后,我们只需要一句话就可以让他看一下我的问卷数据,帮我做一下信效度因子分析, 然后他就自己看了我的数据结构,他先说,呃,两表的结构有三个维度是这样的,然后分析的目的,数据的特征,然后包括后面的他要做分析的一个计划,都给我们列出来了,他问我们是否要这样做, 我说你直接做,我看不懂,然后他就自己就根据我的数据结构,他说先做一个信度分析,再做一个探索性因子分析, 然后就帮我做了,就做了信度分析,一共是九个量表题,他就做了个整体的量表,然后样本量是多少?克隆包括系数是多少?帮我整理出来了,我直接复制这个表格,然后粘贴到这个 word, 就是 这个表, 然后这这个我们看这个克隆包括系数就可以,一般是大于零点七就可以,这个数据结果都零点八的结果还可以。然后效率分析的 在后面,它也给我们整理出来了,效度的效度分析,然后 kmo 金斯卡方,然后球形渡劫验,然后 p 值这些关键的指标都给我们整理出来了,我们也是只需要复制表格,然后粘贴到 word, 就是 标准的三线表。 然后面是方差解释率,然后因子分析,这个是探索性因子分析,就一一共是三个因子,然后第一个因子是这三个题,第二个因子是这三个题,然后第三个因子是这三个题,那因子的结果也非常好,他也帮我们整理出来了, 表格都是他直接帮我们整理出来的,我们都直接复制这个表格的一个因子,两个因子,三个因子,这结果都挺好的。那后面就是他的文字分析报告,文字的解释他也给我们整理出来,我们只需要复制粘贴这个文字,然后到我们的 word 就 可以, 就这个这这段文字,这个非常方便,直接就是一句话,他就怕我们把这个信效度分析整理出来,然后针对分析结果的三线表文字分析报告都给我们整理好了,然后右边还有些其他分析方法想要做,也是可以点击或者是打字告诉他都是可以的,这个非常的方便。

对数据进行集中趋势和离散程度分析,反映数据整体特征。将原始数据转化为一组互不相关的新变量。降低数据维度,同时保留最重要信息。 用于衡量两个或多个变量之间关系的密切程度。用于研究一个或多个分类自变量。对于一个连续因变量的影响。比较多组均值差异。 探索观测变量间的潜在结构。提取公共因子,解释变量间的相关与变异。将数据对象分组,使组内对象尽可能相似,组间差异尽可能大。 研究自变量与音变量之间的数量关系。可用于解释和预测音变量变化。用于比较两组数据的均值是否存在显著差异。分析分类变量之间的关联性、频数分布差异。验证变量间复杂的路径与假设关系。可同时分析潜在变量与显变量。 根据已知分类和预测变量,建立辨别函数。对新样本进行分类,分析随时间变化的数据规律。用于趋势预测。用于评估测量工具的一致性和稳定性。评估测量工具是否准确有效。测度目标概念。

大家好,欢迎大家来到我们今天的 s p s s 基础与实战的第四讲,那今天呢,我们主要涉及到的内容是关于数据的基础分析,那数据的基础分析主要会包括哪些内容呢? 第一,首先我们会讲到量表的性度分析的问题,其次呢我们也会给大家讲一下如何去处理多选择题以及进行交叉表的分析。那最后呢,我们还会再讲一下频率和描述统计量的一个报告方法, 事实上在频率和描述统计这一块呢,其实我们在之前的啊,这个 第一讲当中呢,我们也有涉及到啊,在筛选异常值的那个板块呢,我们也有给大家讲到如何去做一个简单的频率分析。那在今天这呃这一讲当中的第三个板块呢?那呃我会 额外的再给大家说一下,我们把这个结果做出来之后,我们应该如何按照这个三线表的标准的范式去把这个数据的结果给呈现出来。 好,那首先呢我们看一下今天这节课当中,我们主要呢是需要理解量表的性度,它的内涵是什么,并且要掌握 spa 当中性度的分析方法如何去操作, 以及我们需要掌握一些数据的基础分析方法和它的结果的报告方法。 好,接下来呢我们先看一下量表的性度分析,首先我们要知道什么是性度, 那性度呢,它是指经过多次测量所得结果的稳定性,或者我们也可以叫一致性的程度。举一个例子啊,举一个例子,比如说现在呢,我有一个量表工具, 现在我有一个量表工具,它测量的呢是父母教育焦虑。现在我选择了某一所小学一年级的学生, 我想去测量一下这一批一年级学生,他的家长,他们的教育焦虑大概的状况是如何?因此呢,我就先做第一次的测量,测量时间点呢?是在他们,呃,开学第一周, 我去测量了一次。好,那等他们到了二年级的时候,我在他们二年级的啊,这个第二学期尾, 二年级第二学期末,我又测量了第二次,测量的还是同一批背时的家长啊,同一批背时的家长。现在我是不是就一共得到了两波数据, 就有两波数据了?那这个时候我把这两波数据的值,我可以算一个均值出来,去进行一个比较。如果这两波数据它的关联程度 比较小,这就说明我这个工具测出来的结果他可能就不太一致,他不太可靠。如果这两波数据的结果他关联程度是比较大的,这就说明我用父母教育焦虑这个工具测量出来的 这个结果,它是比较一致的。那我们就说它性度高啊,就这么简单。好,所以说在这里量表的性度越高,说明结果越稳定,这就说明 啊,我们这个量表工具的结果就更加可信,更加可靠。那在测量学上,性度 它是怎么去衡量的?其实它指标非常多,但是呢,注意,我们在 s p s 当中,我们主要看的是什么呢?叫做克隆巴赫阿尔法系数, 我们直接用阿尔法来表示。那这个克隆巴赫阿尔法系数呢?它测量的我们叫做内部一致性性度,也就是说在一个完整的量表当中,我要去看一下 题目和题目之间的关联程度如何,如果它的关联程度高,那么这个阿尔法值就越高,阿尔法值越高,表明内部一致性性度越好,那这个量表的结果我们就说它是比较可信的。 好,所以在这里我们就了解到,我们在 space 当中,我们主要看的是阿尔法系数,那接下来我们看一下,到底这个阿尔法值 它有没有一个一般的界定标准呢?是有的,通常情况下来说呢,我们希望阿尔法值它至少要大于或等于零点七, 如果他处于零点七以下的这个范围,我们说这个量表啊,所得出来的结果他的信度是比较低的。那这个时候要么你就换一个测量工具,要么你就去修正你的测量工具, 或者你直接换变量了,这个结果你就算把它做出来了,也不太可靠。所以我们说零点七是我们的底线,在这种情况下,量表所测得的结果是可以接受,但是不代表它好。 什么叫好?零点九以上非常理想,但基本上呢,你只要在零点八以上, 我们说其实已经比较不错了啊,已经比较好了,这个这个量表的性度好,所以这个呢,就是阿尔法它的一个取值范围有一个界定标准。 好,那接下来呢,我们就来演示一下,到底在 spa 当中,我们如何去对一个这个量表的性度进行一个分析。好,现在大家所看到的这个界面,我已经提前把这个数据库给打开了,那现在呢? 嗯,我们看一下这里 a e 这个变量,它代表的是学业自我效能感 le 这个变量它代表的是学习环境好,现在呢?呃,它们分别都有十道题啊,这是 a e 杠一到 a e 杠十,那这个是 le 杠一到 le 杠十,现在我想测量一下 a e, 也就是学业自我效能感这个量表的十道题,它的这个信度究竟如何呢?那首先 我们选择分析,然后在分析这里呢,有一个选项叫做刻度,在刻度的下面,我们选择第一个选项叫做可能性分析,点击它。 好,现在呢,在新的弹窗当中,我们可以看到左边这个框里是我们所有的变量,那这个时候我们就需要把我们要去进行信度分析的这一些题项 给选到右边这个叫项的这个方框里面好,比如说这个例子当中,我们需要去分析一下 a e, 我 们的学做相当感这十道题, 我就把它选过来啊,因为现在我要分析的是这十道题之间的一个关联程度。好,那这里有一个模型,模型这里他有个下拉菜单,其实他有很多方法,但是我们选择阿尔法啊,因为我们看的是克隆巴赫阿尔法系数,我们选择阿尔法即可。 那在统计这里呢,可选可不选啊?如果你想要看一下,比如说,呃,象之间的一个相关系数,那你可以勾选相关性啊。当然如果我们只是看阿尔法系数的话,我们直接点击确定好。 呃,我们回到 ppt 这个结果,我们直接到这里来看。好,现在呢,我们可以看到,在这个个案处理摘要这个表格当中呢,它呈现的就是在 你的这个数据当中一共有多少个有效个案。呃,如果有缺失值的情况下,它这个表格里面会呈现缺失值有多少?现在呢,在我们这个例当中呢,是没有缺失值,因此有效个案四十。 好,那在我们主要看的还是这个可信统计,在可信统计这个表格当中呢,可以看一下他的项数代表的就是他有多少道题,十道题,那克隆巴赫阿尔法系数这里零点九九, 零点九九,如果按照我们前面表格的界定标准来说,他是一个相当理想的一个性度值啊,相当理想的一个性度值,我们说零点七以上我们就可以接受,当然零点八以上相对就是比较好的一个 状态了啊。当然这个例子当中零点九九一般情况下这个呃 比较不容易达到啊,因为我这个数据呢,我是用 ai 直接生成的啊,生成的一个虚拟的数据。所以说呢,我们这里零点九九我们只需要知道它代表什么含义即可 啊,每一个研究具体做出来的值,它肯定是不一样的,一般来说,我们说零点八以上已经很不错了。

哈喽,大家好,我是小王,今天教大家如何一分钟学会 spa 数据分析,只要四步就可以学会 spa 数据分析。第一步,打开你的文件,新建一个语法。第二步, 打开你的变量式图,复制你的变量名称。第三步,打开任意一个 ai 工具,我这里用的 jimmy, 但是你们用其他的都可以粘贴你的表头,跟他说跟 jimmy 说你要做哪些数据分析,那么是学修打法, 我现在就跟他说这是我 spa 里面的表头。现在给我生成 spa 可以 用的语法代码,我要做信效度相关中介和回顾分析,然后发送给 ai。 ok, 代码已经出来了。第四步,复制 ai 生成的语法代码, 粘贴到 spa 的 语法里面,然后点击运行,运行全部好处理完成。现在你学会 spa 数据分析啦。好了,这期就到这里的,拜拜。

长值的筛查,所谓异常值的筛查呢?它主要指的是我们在进行啊,项目分析,统计分析啊,这个项目分析一般是我们在编制量表的过程当中,我们会涉及到的叫做项目分析,所谓项目就是,呃,题目 啊,一道题,一道题题目啊,这个不用纠结啊,就是我们在统计分析之前,我们为了避免异常值的存在而影响最终数据结果的精度, 从而夺得出错误的结论。那我们在进行统计分析之前,我们首先要进行异常值的筛查和处理。那异常值的筛查和处理呢?有两种方式,一种叫做频率分析,频率分析呢,我们主要去看什么?看的是每一道题 啊,他的数值有没有异常值?我,你比如说啊,比如说我这个量表是五点积分,如果说我经过频率分析之后,发现其中有一道题,它里面有一个值是六, 那是不是就说明他是异常值啊?因为我是五点积分,我最小是一,最大是五,如果他是六 就异常值吗?这是其中一种方式。另外一种方式呢是描述统计,那看一下它的描述统计量,它的最小值和最大值,主要是看最小值、最大值有没有异常值, 有没有缺失的啊,有没有缺失的。如果缺失值的话是这样的,是我们一开始在录入数据的过程中,我们就需要去界定的,这个叫缺失值。比如说我在录数据的时候,我发现,哎,这个背式,他在这个题当中他是没有回答的,所以我就把它记为缺失值。 一般我们记缺失值的话,你可以把它记成九九啊,负的九九啊,九百九十九啊,啊?负的九百九十九啊,这是比较通常的一个做法啊,如果也就是说我如果给他负成九十九,那我在变量试图当中我给他界定一下,我界定一下这个离散缺失值是九九 啊,那这就代表我告诉 boss, ok, 只要是九九的,你就给它界定成啊缺失值。那不要把它纳入分析,那在我们的描述统计当中我们也是可以看出来的,包括频率分析当中也是可以看出来的。具体怎么操作我们一起来看一下。打开它。 呃,现在我们这个数据机是三十个个案,我们搂一眼的话,呃,其实也能,如果他数据量很少的情况下,你搂一眼其实也能看出来他哪些地方是,呃,比较不合理的 啊。但是如果说你的变量有一百多个变量,然后你现在有两千多个个案, 请问你怎么去搂一眼?你搂不出来,对吧?好,所以这个时候我们的异常值的筛查就很重要了,就很重要了啊。怎么做?首先我们做频率分析,在这里点击分析 描述统计,选择第一个频率。好啊,比如说我现在去看一下数学成绩吧, 我点击数学成绩,把它选到变量下面啊,选到变量下面,我们看看有没有需要选择的。在统计这里第一个统计这里,我们可以看一下它的,呃,最小值,最大值吧。 嗯,看一下啊,点击继续。好确定。好,在这里呢,我们发现 他有一个统计,这个统计是什么?就是我这三十个个案当中 他会显示啊,一共是这里有效,是三十个个案,有没有缺失呢?没有缺失,是零个好,最小值,他这里给你,给你显示了啊,最小值是负一,最大值是一千,有没有发现他这就是异常值啊? 因为按理来说我们数学成绩他如果百分制的话,那最低就是零分吗?没有答卷吗?最高也就是一百分吗?不可能有一千分吧,也不可能有负分吧,所以我们这个时候就发现好有异常值,那这个时候我需要回去找啊,到底哪一个背式 他是异常值呢?我可以从这里看这里,因为现在我的这个,呃,背式数量比较少啊,只有三十个,所以我可以从这里数学成绩啊,这下面这个表格去看,你看他这里 发现没有,这里有一个负一,频率是一,代表只有一个背式,他在数学成绩这栏呢,他是 啊负一,所以是异常值啊,还有没有这里一千,发现频率是一啊?还有一个背式,他的这个数学成绩这一栏呢,他填的值是一千,说明现在呢,我的数学成绩这一栏啊, 所有背式里面有两个异常值。好,现在我想要回去找,是谁呢?我想回去找,我就 啊,我就看到数学成绩这一栏,我发现,哎,个案三这里,他这数学成绩怎么是一千?好,我就找到他了,我再看,哎,这里是个负 一,个案十三,我发现啊,个案三和个案十三他俩的数学成绩 它是异常值啊,所以这个时候我怎么办?我再回溯一下我的原始问卷,我再看一下,哎,到底是我录错了还是它本来就填错了啊?不管是我录错了还是它本来就填错了,如果是我录错了,我就去看一下那个原始 问卷当中人家背式本来填的是多少,比如说这里填的可能是一个九十,我把它改了呀,我改正确呀,啊,我改正确, 我先把它改回来啊,好啊,这个负一一样的啊,啊,这是其中一种方法,还有一种方法,还有一种方法,因为现在呢,我的数据量特别少,我可以一个一个的去查,一个一个的去看, 如果我有两千,我甚至四千、五千、六千甚至上万的数据量的时候,我不可能一个一个去,对的,这个时候怎么办啊?我发现了哎有异常值,并且我在我的这个结果当中, 我发现哎,有一个异常值是负一,有一个异常值是一千,因为在在统计这个表格里,你已经可以看到了,已经可以看到了最小值负一,最大值一千,然后在这里也是可以看到的,所以这个时候我就去找啊,哪些是负一呢?哪些是一千呢啊?哪些是九九缺失值呢? 我首先我知道是数学成绩有缺有异常,所以选中它,然后呢我点击 编辑啊,编辑这个功能当中呢,有一个叫做查找的功能,点击它好在这个界面当中,我在这里啊查找,查找当中我输入数字,比如说啊 负一,然后点击查找下一个,好,看到了吗?它直接就跳到了各案十三这里,并且数学成绩负一这个单元格当中,它就已经是灰色了,已经是暗色了,它就是 直接就特别明显,你一眼就能看出来哦,这里有一个异常值,如果说还有其他的是负一的异常值,你再点击查找下一个 啊,再点击查找下一个。好,现在我这个数据里面只有一个是负一,所以你查找不了了啊。如果你还有其他的负一的话,你再点击查找下一个,它还会再跳到第二个负一上面,也就是第二个异常值,非常简单,一千操作方法也是一样的。 好,在这里我们就不再演示了啊,这是第一种方法啊,就是通过频率分析第二种方法啊,分析这里描述统计选择第二个描述 选择。哎,比如说数学成绩在这里,然后呢,我们在选项这里点一下他,呃,我们可以平均值标准差,其实可以不用看,当然你看一下也无所谓了, 然后主要是看一下最小值,最大值,然后继续点击确定。好,在这里描述统计呢,他就只有一个表格,在这里,你可以直接就看到。哎, 我的 n 就是 有效的个案是三十个,没有缺失值,所以这里没有显示。然后呢,我的最小值我发现是负一, 这不就异常了吗?我的最大值我发现是一千,这不也是异常了吗?啊,好,这个时候我发现好有异常值了,那接下来操作方法就跟刚才是一样的了,我就一个一个,要么我一个一个去找,要么我直接使用编辑里面的这个查找的功能,我去看一下。哎, 哪个个案,哪些个案他是这个妇女,哪些个案他是一千,然后我找到之后,我给我给他改过来,或者我直接给他设成。啊,这个缺失值九九就可以了 啊,这就是如何去筛查一下啊,这是很简单的提前,我们提前就做好筛查的这个工作,这是频率分析的结果,频率分析他是有两个表格,然后主要就是看一下,哎,有没有缺失了 啊?这里边有没有这个呃,不正确的数字啊?比如说啊,这个是我之前粘贴那个表格,比如说这个数学成绩里面,我去搂一眼,哎,我一个一个去看,我发现,哎,好像都是挺正常的啊,没有没有异常值啊?我刚刚给大家演示的那个案例当中是有这个异常值的啊, 好,那或者说我们去看一下这个描述统计,一样的啊,一样的描述统计,主要看一下最小值是一,最大值五,哎,正常的平均值三点六三 啊,正常的,有效的成对个案是四十个啊,正常的啊,在这里一样的,呃,数学成绩、语文成绩,最小值、最大值、最小值、最大值, 然后平均值看一下有没有,如果有异常值的话,他最小值、最大值肯定是不正常的啊,或者说他的,他的这个啊,平均值和有效个案也是不正常的,这个是完全可以一眼就看出来的,就。

同学们大家好,欢迎大家来到我们的 spss 基础语实战的第三讲。呃,那今天呢,我们第三讲涉及到的内容啊,主要是关于变量,我们如何去转换它? 那变量的转换呢?我们主要涉及到以下的内容,主要包括变量的计数与计算,变量的重新编码以及雅变量的处理。呃,这里我说一下雅变量处理这个呃知识点哈。 呃,如果说你觉得必要的话,你可以实实在在的去掌握它一下,但是一般情况下你的研究当中没有涉及到说我非得要呃用那个多分类的变量去呃进行相关呢,或者是回归分析的话。 呃,其实你就不太涉及的到哑变量的处理这个问题。比如说我所有的变量都是连续的变量,你根本就没有这种 呃,多分类的,这种变量可能就不会涉及到,但是哑变量的处理是你一定需要了解的。那今天我们这节课呢,我们主要就是需要去理解到底变量转换他的应用场景有哪些?其次呢,我们就是要 具体地去掌握在 spss 当中变量的几种转换的方法,怎么样实际地去操作它,怎么样实际地去应用它。首先我们看一下变量的计数与计算,什么叫做变量的计数,它用在什么样的场景当中呢? 啊?我们看一下计数呢,它的功能是在于统计单个变量在某一个值,某一个值上面的一个次数,我们叫 评述,也可以啊,我们叫评述次数或者评述。比如说啊,这里举两个例子,怎么去用它?比如说初中生呢?现在有语文成绩,有数学成绩,我们现在想要知道哪位同学他在语文 和数学这两个科目中有几个科目不及格?或者我就只是想知道,哎,我在语文这个科目当中,他小于六十啊,不及格吗?小于六十,或者我想知道,哎,有多少个语文成绩他是大于九十分的呀? 这个时候我就需要用到计数这个功能,九十分吗?高分了。好,第二个例子我们再来看一下,因为我们平常在科研当中,我们可能是到比较多的是量表的问题啊,尤其是 我们,呃,有些时候在教育学类的一些啊文章当中,我们会会发现他们喜欢统计一些百分比啊,啊,评述啊,比例呀,这样的一些数据啊。比如说现在我有一个量表叫父母教育焦虑,它是一个五点记分,一 代表非常焦虑,二代表比较焦虑,三代表一般焦虑,四代表比较不焦虑,五,非常不焦虑。五点积分,我们可以近似把它看成是一个啊,连续的数据啊,连续,但是其实我们在赋值的时候是给他赋的五点值 啊,这个,这个量表,假设,假设他现在有二十道题,那如果我们想知道每一个背式,他在二十道题上有多少个题选的是非常焦虑,非常焦虑对应谁呢?对应一,也就是有多少个一呢? 啊?有多少个题选的是一般焦虑,一般焦虑对应这里三,所以三有多少个三呢?这个时候我们也可以用计数的功能。好,具体怎么去操作呢?我们直接回到 space 的 界面当中,我们再去具体的看,我们先打开一下啊,我们的 s p s s。 好, 我先打开一个我们会用到的,我们会用到的数据集。 好,现在在我的这个数据集当中可以看到。嗯,我们先切换到变量式图啊,给大家解释一下。 呃,前面这几个变量啊,跟我们之前的两节课讲的是一样的,现在我新增了两个变量,一个是学业自我效能感,一个是学习环境。然后呢?这个学自我效能感啊,呃,我们用 这个 a e 来表示,我们用 a e 来表示,一共有 十道题, a e 杠一到 a e 杠十。十道题,这里学习环境我们用 l e 来表示,一共有十道题, l e 杠一到 l e 杠十。呃,它们都是五点积分啊,五点积分,我们看一下这个负值啊。 嗯,这个学自我效能感,他是五点记分,一代表非常不同意,五代表非常同意,那这个学业环境他的也是五点记分,一代表环境极差,五代表环境优秀。 好,现在呢,我就是想看一下,比如说啊,我的学业自我效能感这十道题当中我的每一个背式 啊,他在这十道题上面到底有哪几道题或者哪些题,他选的是这个一 啊?一代表的,我们刚刚说一代表的是完全不同意啊,在学业自我效能感这个这个量表当中啊,所以这个时候我们用计数,我们看一下啊,怎么去计数,点击转换, 选择第三个,对个案中的值进行计数,点击它。好,现在我们可以看到弹出了一个新的界面, 叫做计算个案中值的出现次数。这里在目标变量下面的框当中呢,我们把它做一个命名,因为它在计数之后会生成一列新的变量进行命名,比如说,呃,我把它命名成效能感 啊,每个背式,好,现在我从这里啊 把这个,因为 a e, 它代表是学左向能杆,我把这几道题我把它选进去啊,选到数字变量这个框当中, 目标标签呢?呃,可写可不写吧,标签就是我们前面讲过的那个值,标签备注而已,可以不备注。好,接下来在定义值这个地方点击它, 我们发现这,呃,出现了一个新的弹窗,叫做要计数的值,你需要告诉 spss, 你 现在要计数的,因为他是五点几分,一二三四五吗?你要告诉 spss, 你 现在想要我计算哪一个值?你想要让我计算一,就代表你想让我告诉你,哎,选择一的人,呃,一的这个有多少道题 啊?如果我写五,那也就是说你想让 spass 告诉你,哎,我每个背式在这十道题当中选择五的有多少个题?比如说,我现在就是一,这里渐入一,点击,添加好,点击,继续点击。确定 好了,现在我们拉到这边看,我们发现这里生成了一列新的变量,这个新的变量我们发现,哎,有些是零,有些是一,有些是五,有些是七,好, 我们对应着来看啊,对应着来看,我们先看,各按一,这里是零,我们刚刚介入的值是一,对吧。所以呢,这个时候我们发现 boss 告诉我们,这里的值是零,就代表在 学业作效能感,也就是 a 一 杠一到 a 一 杠十,这十道题上面各按一,他在这十道题当中 没有一道题选的是一,这个选项我们可以一一看一下, 第一题他选的是四,第二题他选的是三,第三题他选的是五,第四题是四,第五题是四,第七七题是五,第八题是四,第九题是四,第十题是三。发现了吗?没有一道题是选的是零。 我再看这里,各按十一。好,我发现各按十一,他那个值,呃,值,呃,显示的是五,对吧?所以我再看一下,哎,这里第一道题是一,第二道题是二,第二道题是二啊,有几个一呢? 第一题是一啊,第四题是一,第五题是一,第八题是一,第十题是一。好,有五个一啊,这里就显示的是五 啊。七,道理就是一样的啊。如果说啊,在这里,我们在此基础之上啊,我们在此基础之上。我想要看一下,哎,我不想要看全部的个案,怎么办? 我们先回到这里计数,这里我不想要看全部的个案。下面有个选项叫做如果点击它, 如果现在我们发现在这个 if 个案这个界面当中,他选择的是包括所有个案,我不选择他,我点第二个。 在个案满足条件时,包括,意思是只有在满足我定义的这个条件的时候,你才给我去进行计数,比如说我只想要看一下, 哎,男生性别等于一,也就是等于男生的时候啊,他选择的一个情况,那我在这里就要选择, 我重新来性别,点它,点击箭头选择,下面是一个计算器,一样的,我选,呃,点击等于一,点击继续。好,现在这里就出现了,如果旁边这个框里出现了性别等于,这就是告诉 spos, 你只给我计算男生这组,他在这十道题当中有多少道题选择的是第一个选项呢?点击确定是否更改现有变量选择。是 现在效能感应变了啊,变了。好,刚才啊,可以看到这个,比如说各按三,我们发现这里是一,也就是说,呃,这个十道题里面它只有一道题是选的,一看一下它是不是男生呢? 我们拉到这里看一下。个案三,在性别这里,在性别这里。哎,这里是二。是女生吗?看一下啊,个案三,这里效能感这里是一, 性别这里是二。看下效能感有没有问题啊? 啊?这里有一个一四二,哎,这个统计是,这个统计的频次是对的, 是界定的问题吗?一是男生,二是女生,没问题啊,再来一次啊,再来一次,如果你发现不对,哎,再来一次啊。定值,如果性别等于一,满足条件时,包括继续 性别等于一,或者 我们输二,试试看吧。我们输二,试试看女生是否更改性有变量,是我们输二,试试看看还是不是错的。 效能感应好,这里啊,这个是个案三,个案三,这里显示的是一啊,这里性别是二,然后这里从 a 一 到 a 十, a 一 到 a 十,第七题是一,只有一个一,这个是对的,那我们再验证一道,再验证一道,比如这个个案七,个案七,哎,这是对的,性别是二,女生啊,那 a 一 到 a 十, 个案七, a 一 到 a 十,有一个一吗?有,第九题是一,这个频次统计是正确的啊,是正确的。 那为什么刚才男生不行呢?我们再来试一下,我们再试一下,再试一下别的变量,我们不要性别,我们再试一下,比如说,呃,比如说,我想看一下 数学成绩,我选过来,我选过,比如说数学成绩小于吧,小于一个七十, 点击继续啊,数学成绩小于七十的啊,这十道题里面看一下能不能行,确定更改现有变量吗? 是啊,再看一下效能感一这类变量,看现在是正确否?呃,这个时候我们就要去对数学变量了啊, 看这个吧,这个是个案十一啊,看个案十一,好,数学成绩小于七十否?六十九小于。好,再看一下它, a 一 a 一 杠一到 a 一 杠十有几个一呢?第一题二三四五,哎,好正确啊,正确,刚刚是出现 bug 了吗?正确,我们再看一下这个七 啊,这是第二十七号个案啊,他的数学成绩是,哎,小于七十六十八啊,六十八, 然后呢?他 a 一 杠一有几个一呢?一二三四五 六七,好,正好七个。哎,这就是对的了。好,这就是如何,哎,我们去通过筛选条件去达到我们的目的,我们可以通过筛选条件啊。八,你不筛选的话,点击这里,如果选择第一个,包括所有个,按继续 确定更改一下。哎,更改一下就好了,就好了啊,就好了, 好,我现在先把这个清除掉。 好,这是关于个案的那个值的技术啊,关于值的技术。嗯,如果说刚才是关于这个量表的题目的问题,我们再举一个例子,如果说我现在想要看的是,比如说, 嗯,这个语文不及格啊,语文不及格,看看有没有语文不及格的啊。那我们再来一次转换啊,计数这里新命名一个变量吧。语文,哦, 语文怎么样呢?不及格还是一样的。我们这次呢要选,我先把这个选出来啊,然后我们要选的是语文成绩,然后定义值,这里不及格。呃, 这里哈,因为他有一个一的情况下啊,有一个一的情况下,你点一下这个一,然后点出去,出去啊,就把前面的记录就消掉了,现在我们要给他界定一个范围,对吧?选这里, 呃,选这里,范围从最低到直指的就是,呃,指的就是 s s p s s, 你 要从这个语文成绩的最低的那个分数一直记到 我给你界定的这个临界值这么一个段啊,这就叫范围从最低到值,如果是范围从直到最高就是,呃,要从我给你界定的这个值开始记,一直到这个语文成绩的最高的那个分数就这么一段啊,这个应该很容易理解。 好,我们这里呢,我们想要看的是有多少个不及格呢?呃,及格分数六十嘛,我们就写个五十九啊,五十九,从最低到五十九,看看有没有点击添加啊,这里呢,要计数的值这里就出现了,呃,这个最低到五十九,继续。 好,继续,然后点击确定。好,现在我们看一下。 哎,这里有一个新的变量了,叫做语文不及格,你会发现,哎,全部都是零呢,全部都是零呢,说明没有啊,说明语文成绩这一列变量呢?所有这三十,呃,这四十个个案,这四十个个案全部都是在 六十分以上吧,至少,呃,如果啊少的情况下,你可以一个一个去对,你要是不相信的话可以一个一个去对,看看有没有在五十九及五十九以下的。没有啊,楼易言也知道没有了,没有。好,所以这就是如何去筛选啊?如何去筛选? 我们清除一下,清除一下它, 好回到这里啊。好,刚才呢,我们是计数,这是计数的一个功能,现在我们看一下什么叫计算,那变量的计算呢?它是进行数据分析之前 注意哦,你必须要做。为什么啊?因为呢,它的实质是对数据进行四则预算,最终我要生成的是一个新的变量啊, 通常呢,它用于将一个量表中怎么算啊?注意所有题目加,呃,加和。然后呢,再去求它的一个事实上求的是一个平均分啊,它事实上求的是一个平均分, 它既可以求一个变量的平均分,它也可以求这个变量当中的维度啊, 分为度的那个均分也是可以的。比如说下面啊,我们还是以父母教育焦虑举个例子啊。父母教育焦虑呢,它指的是,呃,父母在子女教育过程中表现出来的对子女多个方面的焦虑。这个时候啊, 我们发现,哎,他可能是子女的这个啊,学习方面的焦虑啦,可能是就业竞争方面的焦虑啊等等。 比如说我这个量表,我就用五个维度来测,这五个维度就是我父母教育的五个分维度,这就叫,呃,这个量表呢,也是一样的,有二十道题, 这个时候我统计的时候,我不可能对每一道题去单独的进行统计,意义不大呀。我想要知道的是它的平均值,呃,因为我们在后面进行差异检验的时候,也是用这个变量的均值来进行的差异检验,我不可能用一道题的这个 分数去进行这个统计检验,不可能,所以这个时候计算变量就很有必要了,我们将会合成一个新的变量,比如说我就可以把它命名成父母教育焦虑,或者说我把它命名成其中一个维度,叫做,比如说学习焦虑、健康焦虑、竞争焦虑等等, 我们一起来看一下啊,怎么做?怎么去计算变量。我还是以我现在的这个数据集 呃,来举一个来进行操作啊。现在我们发现这个数据集当中呢,这个 a e 代表学业自我效能感,这个 l e 代表这个呃,学习环境好,现在呢,我就是想要去统计一下这十道题 它的均分是多少,也就是我将会合成一个新的变量,叫做学业自我效能感。那我还想统计一下这十道题 啊,这学习环境,这十道题它的均分是多少?也就是学习环境这个新的变量,它的每个背式在这个变量上的一个均分 啊,我就不是拿第一题我去做统计,第二题我再去分析,第二第三题我再去单独分析,就不是这样的。这个时候我们就需要计算变量,在这里转换第一个选项,计算变量。好,我们先去算一下 a e, 也就是学自我消能感, 呃,有十道题,对吧?我们先在目标变量下面呢建入我们的新的变量名称,比如说向能感吧,向能感我们简称啊,简称向能感 a e, 从这里开始点击它, 注意哦,我们要求的是均分,对吧?所以这个数学表达是应该怎么去计算呢?就应该是他这十道题加总之后再除以十。所以呢,这里需要有个括号,先点击这个括号啊,把这十道题呢一一的选入这个括号当中, 点一下 a 一 杠一啊,点击箭头,然后呢点击加选中 a 一 杠二箭头加 a 一 杠三箭头加以此类推啊, 好,一个一个的选进去,可能有同学会觉得麻烦啊,但有些时候呢 啊,确实挺麻烦的,待会我跟大家说另外一个方法,我们先把它选进去,这传统的操作好,现在呢,我把这十道题都选到这个括号里面了,我们现在要算平均时的话,我们还需要再除以十, 鼠标这里点一下,点到括号外面,这里除号,点它选择十。或者你也可以不用这个小键盘计算器,直接用你自己的电脑键盘, 电脑键盘进入它也是可以的,也是可以的。好,然后这个时候点击确定。 好,我们看一下有没有啦,这里生成一列新的变量,效能感保留到小数点后面两位数的。好,如果你怕它算错,你想看一下有没有异常值,你可以对效能感做一个描述,统计 拉下来,效能感选进去选项平均值标准差,最小最大值看一下, 看一下啊,看一下,有没有呢?最小值你翻,唉,一点三,最大值五,反正没有超过一到五的范围啊。正常的效能感平均值三点七四这里就有了啊,三点七四,在这个例子当中, 中等吧,效能感中等偏上,对吧?中上水平好,这是效能感,然后我们再算一下, 然后我们再算一下这个学习环境吧,我们简称它叫环境环境,然后呢,应该是 l e, 对 吧?先选,记得先选括号,括号啊,不要忘了 l e 选进去, 选进去啊,一道题一道题的选进去,虽然看起来挺麻烦的,但是在这个例子当中呢,还好,它的题目是比较少,比较少哈,点一下除号 一样的十道题,确定看一下环境出来了 啊,如果你不放心,你做一下描述统计,看看他的均值如何,看看他的均值如何啊?注意哦,这个算出来是什么?你会发现这个算出来的平均值是每一个倍,是在 这十道题上的一个均值,而不是这个变量的一个总体均值。哦,如果你要算总体均值,你需要去做那个描述统计啊,描述统计在这里,刚刚我们示范过了,描述统计描述 啊,把这个环境选进去,确定好,在这里的三点七一,呃,三点七二吧,保留到两位数才是他的这个 环境的一个总体均值啊,我们报告的时候不是报告的这个啊,每一个个案后面的这个均值,我们报告的是这个维度的一个总体的均值。 嗯,好。呃,还有一种方法,我们我们用函数来计算,还是一样的,点击这里转换计算变量, 我先把这个删掉,环境还是面临环境好,这个时候你会发现这里有一个函数组,函数组下拉有很多,然后呢,你可以点击全部,全部,这里 点击全部了之后,这里出现了函数和特殊变量,你去选一下啊。那这个时候呢,你就需要知道啊,它算平均数的那个英文的表达是什么? m e, a, n 吗?命好看一下啊,在哪里?我们找一找,找一找。嗯, 这里啊,双击它,我们这里平均值,双击它,双击它之后,数字表达式就出现到这个框里了,我们发现它这个函数的表达为, m、 e、 a n, 括号, 问号,逗号,问号,然后后括号这里我们只需要填入两个值,前面这个括号问号,我们只需要把 l e 杠一选入好,然后我们再 指到第二个问号,把 l e 杠十选进去好了。确定更改现有变量吗?确定 这里环境就算出来了,环境就算出来了,是不是很简单?校准感一样的啊?校准感一样 好,这个就是关于计数和计算变量。我们回来第二个,我们再来讲一讲变量的重新编码。变量的重新编码主要是用在哪里呢? 首先他是为了将原始变量的水平数值重新加以人为的设定啊,通常呢在什么情况下呢?有些题目啊,他要反向记分 啊,有些题目啊,他是需要把连续变量变成几个不同的, 叫做足年龄呢。我这一批背时里面的年龄大概是在二十到七十岁之间,哎,我发现这个跨度实在是太大了吧,我统因为其实年龄本身它是一个连连续数据嘛, 那我发现这个二十到七十这个跨度也太大了,所以我想要把它分成几个不同的年龄段,那我就可以分成二十到三十,三十到四十,哎,四十到五十,五十到六十,六十到七十啊,这么几个段, 那这个时候我们就需要用到重新编码这个功能啊。那重新编码呢,他有两种选择,一种是相同变量,一种是不同变量,那他们两者的区别 其实他们输出的结果是一样的,唯一的区别就是编码为相同变量,指的是在你的这个原始变量的基础之上去编码,编码之后输出的那个变量就会直接把原始变量给改变。那不同变量指的是,呃, 在编码的基础之上,它重新生成一个新的变量,会有一个新的变量的一列,这是它维的区别,但其实它的结果,它的本质都是一样的啊。我们来演示一下, 看看有没有转换啊?转换这个是好,我们就用这个数据吧。现在假如我们先说一下如何反向计分啊? 假如说啊,假如说现在这个 a 一 杠一到 a 一 杠十这十道题呢?其中有四道题是反向记分的题目。本来啊,比如说我们这个,本来我们这个五点记分呢,它是, 呃,分值越高就代表他的这个分,呃,他最后算出来的那个平均分肯定就越高,对吧?他的态度倾向就越正向,分值越低,态度倾向就越消极。好,现在 比如说第一题、第四题、第九题和第十题,他都是反向积分题,那这个时候他代表的就是 我给你赋予的这个值啊。分值越高,他的态度与前面这些题就是相反的,分值越高,他反到态度越消极。分值越低,他反到态度越积极,他就是反的。 如果你不去反向积分,你进行一个统计分析,你的结果就是错的,就完全是错的。一定一定记得有反向积分题,一定一定要反向积分,没有反向积分,你这样的话, 你一定是错的。好,如何反向积分?我们就要用到编码,现在在转换, 这里有两个选择哦,重新编码为相同变量和不同变量。一般情况下呢,我个人是比较喜欢重新编码为相同变量,这样我下次再打开我这个数据集的时候,我就不用再重复编码了,我也不用再呃, 就是再再去,再去各种找,因为我的变量通常会比较多,我就不用再去找我重新编码的那个变量。呃,但是因为这里我们是为了方便演示,我们为了方便展示,我们选择重新编码为不同变量,点击它。 好,在这个弹窗当中呢,我现在想要编码的是 a 一 杠一 选进去, a 一 杠四选进去, a 一 杠九和十选进去。现在这四道题呢,它分别就是反向记分题,五点记分,记住啊,五点记分 啊,在这里发现这后面啊有一个问号,这四道题后面都是问号,是因为现在我们在输出变量下面,这里还没有给他界定新的名称,因为它是要 呃,在输出的时候它是要生成,呃,四列,相当于生成四列,有四个题嘛,四列新的变量,我们一个一个去命名,我们先选中 a 一 杠一, 这里名称我们渐入,比如说 a、 e、 e, 注意名称不能重复啊,不能跟这个重复啊,新的名称,比如说 a、 e、 e, 点击变化量,一定要点击它,这里才可以出现 a、 e、 e, 我 们新的名称。 好,再次点击 a 一 杠四,命名为 a 一 四变化量,点击 a 一 杠九,命名为 a e 九,点击变化量, 点击 a e 杠十,命名为 a e 十,再点变化量。好,现在我这四个变量全部命名完成,接下来一步很重要,点击这里的旧值和新值, 在新的弹窗当中,我们发现其实和刚才啊,我们那个值的计数那个界面其实挺像的啊,在这里我们怎么编码?现在啊,我想要反向记分,怎么反向一个一个的去记 本来呢?我是一二三四五,现在我要把它变成五四三二一,这个叫做反向积分,在值这里先输入一,这里注意哦,代表的是旧值,也就是你现在 这个界面当中,本来你录入的这个值叫做旧值,或者叫原始的值,现在我想要编码为新的值,点一下这里,我把它编成五,好,添加, 然后来继续二,我把它编成四,添加三,那就还是三吗? 四,我把它编成二,添加五,我把它编成一,添加。好,这里就可以看到。在旧星,这个啊,从旧到新, 这一列是旧,这一列的值是星,原来是一二三四五,现在是五四三二一,这就是啊,反向积分,点击继续好,然后点击确定,点击确定, ok 了,事实上我们看有没有啦啊,事实上有啦, a 一 一 a 一 四, a 一 九和 a 一 十。现在我们就是把这四道需要反向积分的题给它重新编码了。那么我们在下一步进行统计分析的时候呢,我们直接 啊直接用这四道题去代替前面原始的那 四个题。其他题还是用原始的其他题啊?因为其他题不用反向记分啊,这个应该是很容易理解的。 好,然后接下来我再演示一下如何把一个连续的变量去进行一个分段啊?分段,比如说我现在啊,我在这里加一个新的变量,我这个新的变量呢?是,呃, 我想想要不要加一个新的变量?也可以也可以,或者也不用这样吧,我们用这个收入我们看一下啊,这个收入的话呢,它本来是有 五个类别哦,本来有五个类别,现在我只想把它归类为三个类别,比如说我只想归类为一万元以下的,一万到两万的,以及两万以上的。好,这个时候怎么办?这个时候怎么办?我就以这个为例。 好,一万元以下的,我们发现原本呢,一代表三千以下,二代表三千到一万,现在我想把它编码成一万以下,那意思就是我想要把原本的一和二合并成新的一,对吗? 啊?合并成新的一,注意哦,这里,哎。啊,这个是不能写啊,这里不能写。 好,我先这样讲。啊,我先这样讲,如果,呃,如果说,如果说不太理解的话,这样吧,我在这写先在这写,本来是一二三四五,本来我这个收入水平它是 一二三四五,这是原始的,现在我要重新编码新的 新的,那我想要的编码方式是我想要把一跟二 变成新的一,我想要把三跟四变成新的二,我想要把五变成新的三,我现在是不是就把它变成了三组呢?这就是我重新编码之后的结果啊,所以怎么操作?怎么操作? 我们看一下啊。好,一跟二我变成新的一,三跟四我变成新的二五我就变成新的三,本来有五组,现在我变成三组,那么新的一呢?就代表一万元以下,新的二呢?呃,一万到三万,那新的三就代表三万以上,对吧? 好,确定,我这里来编码一下,转换重新编码,以为不同变量,我们还是选择。嗯,我先把这个 清楚一下,选过去,我选过去先。呃,好,我们把这个收入选进去。一样的,这里要命名, 我就写中文吧,收入记得点击变化量,这里旧值和新值。 好,因为呢,等一下啊,我先把这个移除,这是刚才的记录,我先把这个移一下,好,因为呢,我现在需要把一和二合并成新的一,所以这里要点击 范围,这里是范围,从一到二,新值赋的是一,点击添加好,一到二,一。好,然后呢,从三到四三组四组合语为新的第二组, 那么五只有一个值,所以这里点击值,然后五赋予成新的第三组添加好,这里就可以看到你编码的结果。第一组是谁呢?一二合并成新的一三四合并成新的二五变为新的三,点击继续 确定,这里收入就来了,你可以看到就没有五组了哟,就只有一二三的编码了,只有一二三的编码了。好,这就是如何 啊?将一个,这是,其实就是如何将多分类的做一个编码啊。当然如果你是一个连续变量啊,比如说年龄吧,比如说年龄, 说年龄它就是个连续数据了,那年龄这一块的话,比如说我们, 比如说这是二十二十四,三,三十三十五啊,这个四十五,五十 六十五,七十七十五,八十八十五啊,先输这几个吧。好,这个时候呢,我们一样的转换它一下 年龄,选进来,我们用英文来表示吧,点击变化量赋值, 一样的把前面的记录先移除好,它是个连续数据,所以我要选择的是范围,范围指的是啊,我先选这个,从最低到哪个值呢?比如啊,比如到 三十,我把它赋成组一添加,然后呢我再从, 我再点一个这个范围啊,从三十一到,比如四十, 我把它赋成组二,点击添加,然后呢我再从这个,比如我只只设三组啊,比如我只设三组的情况下 点击范围,然后从四十一到最高。四十一到最高。啊,我把它赋成组三添加,继续确定。 好,可以看到这里出现了一个 h 新的变量,只有一二三的编码。 一就代表他三十岁以下吗?啊?这里本来是二十,对吧?对,一,这里是二十四。一三十。好,二代表三十到。呃,三十一到四十,对吧?这里是三十五,三代表四十一到最高值,这是四十五,这是五十六十五都是三了。 好,就这么简单啊,就这么简单清楚一下。好,这是如何重新编码反向积分连续变量分组。我们都讲到。

今天花两分钟讲一下这个描述分析和评述分析是什么意思,如何整理成这种标准的论文沙县表,再加上后面的文字分析报告,然后两分钟之后 保证每个人都是可以学会的。首先我们知道描述分析,他是对定量数据做的,就可以统计这些数据的最小值、最大值、均值、标准差。像我们的这个问卷对应的就是这份问卷。定量数据就是我们的分维度的这个量表 他有,比如这个是五级的尼克特量表,比如说一代表完全不吸引,五代表完全吸引,就是一、二、三、四、五,这种就是属于定量数据。然后在数据里面呈现就是这样的 一二、三、四、五,这种就可以做描述统计分析,然后做出来就是这种最小值、最大值、均值和标准差。 然后面这个是频数分析,频数分析主要是对对分类数据做的,就像我们的这个性别, 我们的性别,男生和女生年龄段和使用抖音的频率。然后在数据里面就是这样的,它的性别、年龄段和使用频率,这个是属于分类数据,它的分类数据数字就只代表类别,不具备不具备大小的区别。 什么意思呢?就比如说一代表男生,二代表女生,他的一和二没有大小的对比,但是这个定量数据的话,他的五就会比四的程度更深。就 我们看这个问卷,比如说我填五的话说明,然后是完全吸引,填四就是比较吸引,填一就是完全不吸引,就在这个题的得分,它是不一样的,有程度的区分,这个就叫量表题 好了。然后我们先打开这个 chat s p s s, 我 们在 chat s p s s 里面新建一个对话,就是我们新建聊天,然后在这边上传数据,数据就是上传我刚才这份数据,数据上传成功后给他一句话说针对我的问卷数据帮我做一个描述和评述分析, 然后他会自己去读取我的数据,识别我的数据变量,他这里就识别出来了,看左边分类数据和数字型的数据,他就清楚的给我识别出来。然后先帮我把这个量表,就是 定量数据,数字型的数据先做了一个描述性统计分析,就刚才我这个表格,我把这个表格直接复制,然后粘贴过来,就是标准的这个论文的三线表,这个都不需要我们去整理表格,这个非常的方便。 然后后面呃,这个是频速分析的,就是针对我们的基本信息,性别、年龄段还有使用频率,它的个选项, 还有频率占比百分比,累计百分比,这些都是帮我们整理好的。而且这个表格也是三线表,我直接复制粘贴到 word 就 可以。然后就是粘贴过来,就是后面这个表格,这种形式标准的论文三线表,这个非常的方便。 然后后面针对分析的结果,他帮我们把这个文字分析报告给写出来了,本研究有一百名涉访者,其中女性占比多少,男性占比多少,就是针对这个数据的文字分析报告,然后后面的文字解释也都是有的,我们直接复制粘贴这个文字就可以,这个非常的方便。如果说我们有我们的 整个问卷的题目,我们可以把我们的问卷发给他,把我们的研究目的、研究方向、研究这些都发给他,他会再结合我们的研究帮我们写文字分析报告,都是 ok 的, 这个非常的方便,基本上就是两三分钟就能做好一个分析。

数据分析其实一点都不难, s p s s a i。 助你快速搞定数据分析,顺利通关毕业!不用安装复杂软件,不用啃绘色教程,三步轻松出结果!数据上传自动整理, ai 智能推荐分析方法,一键导出标准论文格式, 覆盖所有常用统计功能,信效度中介调节、结构方程方差回归全覆盖,满足各类论文需求。 结果专业规范,解读清晰,表格图表直接可用,省去大量排版和写作时间,还可以导出分析内容的各个样式,满足所有提交需求,使用简单高效。点击评论区置顶链接不到一杯奶茶钱,搞定论文实证!