大家好,我们是 data six 啊,这个网站是我们分享那个,主要是用来分享统计的相关的一些知识啊,今天我们就来这个视频呢,我们就来讨论一个统计的知识,就是 kmo, 我们在这个我们这个频道啊,以前就是在这个频道里边,我们以前分享过 kmo 啊,怎么样理解 kmo 啊,感兴趣的同学可以去看这个视频啊,我们今天呢啊,不再急,仔细的去解释这个 kmo, 我们要解释的一个问题就是 kmo 与样本量有什么关系, 那有什么关系呢?我们啊,不妨先来问一个人物智能啊,我问他这个, 呃, k m o 跟样本量有没有关系啊?问他,然后他说这个 k m o does not depend on sampsa, 就是 k m o 不如来 样本量,但是呢,他依赖于偏相关,对吧?所以说他的意思就是说 k m o 与样本量没有关系,但是事实真的是这样的,这是我个人的,这个从我个人做统计的经验里边,我我认为不是这样, 我们来不妨来做一个实验啊,我们那个先来看一下 kmo 的计算公式,然后我们解释一下,我们写了一堆代码来做了一个实验,来证明这个 kmo 与样板量的关系。 这 kmo 的计算公式呢,我们再复习一遍,因为我们在之前的视频里已经讲过很多遍这个 kmo 的计算公式了, 其实很简单啊,就是变量之间的相关系数平方之后求和,这是分子,然后变量之间的这个啊,这是还是分子的一部分啊,他加上了变量之间的偏相关平方, 那什么是偏向管,其实就是排除了其他变量影响的情况,我们就是为了这个证明呢,我们先来,我们我们就用一个简单的数据啊, 有一个简单的数据,我们来计算一下相关和骗钱款在 sps 是怎么做的?相关方面量很小,然后把我们想要做相关的这些变量放到这个框里面,然后点确定就可以,点确定你就可以在这个输出界面看到我们的这个 相关矩阵啊,你可以看到任意两个变量之间的相关,比如说第一个题,第一个变量和第二个变量之间的相关是负零点零九九减住,对吧?这是他的一个 相关的算法。那 kmo 的公式里面相关的平方之和是怎么算的?我们只看这个下三角啊,就是这个对角线 下边这部分,把所有的这个相关系数平方以后再加合,就是我们的这个 tmo 里边的分子那分布,这部分除了加上分子之外,我们还加上了一个偏相关,那偏相关在 spss 里面算的,我可以给大家分析 相关下面就有一个平行管啊,但是这个不不能一下子算所有的平行管,比如我们想算第一个题,第一个变量和第二个变量之间的平行管,同时控制其他变量,控制了其他变量,然后你点距离,你就可以得到这个 两个题目呢,它之间呢?平行过来是零点零九,对吧? 这是偏相关,然后你你想要得到和这个相关矩阵一样这样的一个偏相关矩阵,你需要预算很多遍,你呃,就是把这个所有的 两两之间的偏相关全部计算出来,那什么叫偏相关呢?我可以举一个简单的例子啊,说你用那个,因为我们在这个偏相里边,偏相关里边,我们控制了后面的六个题,六个边上, 那我们就是用这六个变量,后边这六个变量去做自变量,然后用第一个变量去做音变量,做一个回归,回归里边总会有残差, 你得到一个残差,残差也是一个变量啊,你得到一个残差,然后你再用第二个题目,第二个题目他作为一变量,四变量没有变啊,还是这六个题目, 然后再做一个回归,又得到一个残差,残差又是一个变量,对吗?第一个残差和第二个残差他们之间的相关就是偏相关,他的什么意思呢?既然是残差,就是其实就是排除了其他六个变量的影响,剩下的那一部分影响残差,所以我们的偏相关就是残 他之间的想法,这就是参差。那为了这我们大概先看一下结论啊,先看一下结论,这就是我们算的这个数据的样本量与我们的 k m o, 我们这个送走标是 k m o, 行走标是样本量,我们看这个样本量,随着样本量增加, 那个所有所有的线,他的 km 所得到的 km 都是一个上升的关系,但是基本上能达到,可能要么要到三十或者四十之间呢,再往后他的 km 就比较平,就平滑,就基基本上不会发生大的变化。 这说明呢,我们啊统计学家把样本量三十定为一个,是否是大于一个判断依据还是有一定道理的,因为达到可能达到三十个样本以后,你的这个 km, 你的这个数据就是比较稳定了,那不同的线代表什么意义?不同的线 实际上就是我们的总体相关系数,就说我们的那个,我们在做这个实验的思路是什么呢?我们是先那个生成了一批数据,生成了一批数据,但这批数据有一个规律,就说我们生成了有三个变量的数据啊,有三个变量,三个变量的数据,他们之间是有相关的,那这个相关定多少啊? 我们定 r 相关,这个 r 呢?我们不能只求一个 r, 对吧?所以我们定了十条 r, 这个 r 从零就是没有相关,变了之间没有相关,到零点九就变了之间就有很高程度的相关,就是 这个总体的情况,这个总体的样,然后从那个总体里边抽样本量,在这个而固定的情况下我们抽,比如说我们抽样本量,我们样本量从多少开始?我们样本量从三开始三五,然后七, 这样逐渐的变化,对吧?样板量逐渐增加,一直增加到一百,这是我们啊,从那个总体中,你要你要知道,我们是先预先生成的数据,就是固定了 r 以后,这 r 就决定了我们的总体从 r 里边,从那个总体里边去抽样本 抽,抽到了样本以后,只不过抽的量不一样,我们再去计算 k、 l, 我们会发现我们的所抽的样本量越高,不管你的儿总体的儿是多少, 不管你的儿子总体多少,我们看这十条线啊,他们的趋势都是一样的,就是随着样板量的增加,我们的 kmo 值会升高,所以很多时候当你的 kmo 不够的时候,当你的样板量低于三十的时候, 你需要去增加你的样板量来提高你的品,那么也就是说你的在你的 k m o 底照底,呃, k m o 这个值比较低,然后你的 样板量又低于三十多少,你往往需要通过增加样板量提高一个片。但是问题来了,为什么我们的 这个天猫会随着样板量的增加而增加?其实啊,我们又看了他的相关系数啊,虽然我们的总体,对吧相关系数固定的,比如说零点一,零点二,但是我们去抽样的话,我们发现啊,这个样板量 也是达到,当达到这个要么能达到二十或者三十的时候,这个相关系数才比较稳定, 但他的变化趋势啊,不是很明显,变化趋势不是很明显,在在样板量较小的时候,有可能很高,有可能很低,对吧?但是有一个趋势明显的就是我们的偏向观,你发现没有?偏向观,在这个样板量零到二十的时候,偏偏向观,随着样板量的变化,随着样板样板量的增加 急剧的降低,也就是说你的偏向观降低,我们可以看一下这公式啊,随着样本量呢,随着样本量增加,你的偏向观急剧降低,也就是说在这个公式里边,我们的分母, 分母在急剧的降低,分相对于这个 kmo 就会变大,对吧?所以样本量对 kmo 的影响很明确,就是因为你的样本量影响到了你的偏向观偏相关急剧变小,所以导致你的 kmo 急剧变大,这就是我们的 kmo 于 kmo 与这个样板量的关系。那为什么很多地方很多人都会说 kmo 跟样板量没有关系呢,是因为就是我们往往样板量是可能会超过三十或者达到四十,对吧?甚至我们一般做问卷的话,可能都是一二百份的数据量,这个时候我们 我们的这个往往这个 pm 是不受样本的影响。但是,但是如果你的变量非常多,我们在这个实验里边,我们只使用了这个三个变量,三个变,那当你的变量增加的时候,你需要的样本量,就 所以我们通常说你的这个做一字喷漆的时候,最好是这个样板量的,样板量呢,他是所用的变量个数的十倍,就是说在我们的例子,当例子当中啊,我们有三个变量,我们的样板量最好要达到三十以上,我们计算的结果才比较稳定, 比如说你有十个题目,对吧?十个,十个变量,那你做这个 pmo 的时候,你的样板量最好要达到一百,这是最低啊,当然样板量是越高越好,你看那个从那个曲线上你就可以看出它的 样板上越大啊,它这个 k m o 的波度就比较小,这时候我们计算得到的这个 k m o 呢也是最越准确的。 好,我们这个视频就到这,我希望大家能够明白,然后如果有什么问题啊,直接在下面留言, 然后这个代码呢,这个代码我们会放到我们的网站上啊,大家有兴趣的话可以去看。
粉丝253获赞1333

km 值过低原因及解决办法?如果是两个分析项, km 值一定是零点五,因而建议删除掉共同度值较低项,这样可以提升 km 值。不输出 km 值意味着数据质量过差,建议先移除相关系数值 低项后再次分析。样本量过少容易导致相关系数过高,一般希望分析样本量大于五倍分析项个数。

大家好,我是君磊,这期视频呢,咱们来讲一下这个因子分析的优化方案啊,那本期视频的一些资料呢?可以在公众号上回复因子分析优化来获得啊, 那因此分析的这个结果不好,通常呢有两种情况啊,第一种就是这个 kmo 值太低啊。啊,这个呢是一般是与那个相关性有关啊。那第二呢,就是那个维度数与自己预期的不相符合啊, 一种情况是与自己预期的那个数目低啊,另外一个是与这个预期数目高。那下面呢,我们来讲讲这个两种情况啊。 好,那第一种情况呢,就是这个 kmo 值,泰迪亚,那这个情况呢,一般呢就是与我们的这个数据的相关度有关啊。那 什么是数据相关注呢?我们举个例子啊,呃,就比如这样一份数据,这个数据是一个比较良好的一个数据,我们可以先测一下这个相关性啊, 看一下。那这个相关性呢,是一个呃比较理想的一种相关性呢,就是相关性程度在零点三零点四左右,就是说我这个自身这个题目跟其他题目有一定的关联,但是关联性又不是 那么大,如果都是零点七零点八的那种,或者零点九以上这个相关性就是就是他自己可能本身就已经没有什么自己独特性了啊, 像这样一个题目,他与其他题目有一定的相关性,他又又有自己的个性,那这样的一些一个数据呢,是一个比较良好的数据,所以一般这样的数据去做这个因子分析啊,他是 kmo 值啊,一般他都是都是不低的啊,我们可以看 给点拇指把它里,哎,我们来做一下这个行为,这款橘子。 好,我们可以做一下啊,哎,这个值呢?你看他那个 kmo 值呢?是在零点八啊,这个已经是非常不错的了啊,提取了两个因子啊,提取两个因子,嗯,那这个数据呢,我们再去操作一下啊, 如果呢,我们把他的这个,嗯,我在事先呢给他排下序啊,把那些都是选五的,这样的给他排在前面,如果我们降低他的相关性,就比如我们把这都选五的给他删除啊, 或者前面这一堆,这前面这一堆都是比较相关的啊,我们来删除一些,删除个一些样本,我们破坏一下他这个相关系啊,然后我们再做一下啊,再做一下。 好,你看这时候的这个 km 就是从零点零点八,对吧?零点八下降到了零点七八,对吧?零点七九九下降到了零点七八,这就说明我是把原始数据那个相关性给他打破了啊,给他破坏了一些,然后呢他的数据他 km 就降低了啊,那我们再看看例子啊, 我们新建个数据,然后这个呢,这时候是我事先准备的一个, 呃,前有 random, 就是那个,呃,那个那个 excel 的一个函数啊, random 比拖延一和到五就是生成了一个随机的数数字,对吧?也是 也是这么一些数据,我们用这个随机申请的数据去测一下这个 k m 值,对吧?然后我们做一个分析,那这数据是完全都是随机的啊,完全都是随机的, 那随机的数据他们之间是相关度是比较低的,那么这时候啊, km 这零点零点四,其实这还是算比较高的了,这说明这随机的数据里面他也有一定的一个相关度,我们测一下。 呃,你看零点一几还是有一定的啊?有一定的,只是说啊,不显著吧?不显著,但是也是有一定的一个相关度,零点二几年的啊? 嗯,我的想表达什么意思呢?就是说 km 值是与相关性密切相关的,那 如果我们想提升我们的这个 km 值啊,一个是要把我们的核载比较低的那些题目给他删除,因为核载比较低的题目,他的含义就是说跟自己维度的那些那些题目相关性 比较差,所以优先可以剔除相关啊,和在比较低的题目。那第二呢,就是在样本入手,从样本入手就是说你可以增加一些样本啊,再去调验一些样本,他说不定就提升了 啊。所以啊,这个 kmo 值的这个优化基本呢就是从样本和题目这两个角度去入手啊,题目的话就是那个删除和再低的样本的话,你要知道什么是好样本,什么是差样本啊。那么对于这个 kmo 值来说啊,这个这样的样本随机的这样样本是不是差样本? 那这样的样本呢,就是都是选五的那种样本啊。啊,这种对刚才我身上那些样本,这样样本反而是一种好样本。 好,我们再来讲第二个问题啊,唯独数不符,那这个问题可能是我们做问卷分析遇到的最头疼啊,最难解决的问题 之一了啊。那这个问题呢,就是我给大家提供一个思路作为参考啊。嗯,首先我们把握一个原则, 第一个就是原则,就是啊,我们这个维度命名啊,以那个核载较高的占多数题目为准啊, 就是我们不要上来就期望他提出来那个因子刚好跟我维度设置的啊,一样啊,那个太理想了啊,我们是以那个维度内的占多数的那个题目啊,核载较高的占多数题目为准啊, 那么允许少数题目跑到,跑到其他维度下,就是说如果有一两个题目创造了其他题目下,你是可以保留的啊,可以保留,但是你如果觉得实在不想保留,你就把它删除啊。好,那我们有这两个原则之后,再去看对应的这个情况,我们 进行处理哈。好,那我们接着这个数据来看一下这两种情况啊。第一个就是这个大于预期啊,也就是我们抽取出来那个数量是大于我们实际想要那个数量的啊, 我们看一下这个数据啊,我们做下这个因子分析,那这个因子分析呢?我实际上是想抽取两个因子,也是 f r 也是 pi, 那我们可以做一下这设置,我都设置好了哈。好,那实际上出来之后这个结果我们可以看到啊,特效只能大于一的有三个,也就是说它实际上是 踢出来三个啊,踢出来三个意思。我们看一下这个因子和仔的一个相声比赛啊,我们看一下他这个四五六 p i 的四五六在一起了,对吧?然后呢?一二三在一起了,然后又把 fi 的另外一个因子给拖过来了,对吧?有人说 pi 一二三加上 fi 四形成了一个因子,然后 fr 一二三形成一个因子,那这个地方呢?我们就可以进行删减了哈, 那我们再来分一下这个结果啊,那 fr 一二三他们是没有问题的,那么我们可以用这个三个题目,也就是维度三来作为 fr, 对吧? 然后问题就出在前面这两个因子,我们保留。保留谁?我们可以将这个一二三四、 fi 四和 pi 的一二三都删除啊,只保留 pi 的四五六。将 pi 四五六来代表这个 pi 是第一种做法,第二种做法是我们把 pi 的四五六删除啊,然后用这四个题目来代表 pi 啊。我们可以先做一下啊,我们将这个,呃 pi 一二三和这个都删掉啊。 pi 一二三 这个删掉,我们来再做一下,我们看一下这个都符合两个音字,然后出来这个结果,那我们可以用这个结果作为我们的这个实际的啊,那个唯独设置, 大家有同学说我删这么多题目合适吗?还是一个乘除量表没问题啊?我们用因子分析去做的时候,我们可以将这个步骤作为我们呃,对量表进行优化,或者说我们对我们的维度进行优化,这样一个过程啊,删是没问题的啊,删没没问题你就勇敢的删啊。 然后我们再来试一下第二种做法,我们可以保留这个,保留一二三,我们把这个四五六给删除啊, 看一下这个还是啊?就是,呃,你看刚才我说到这个,允许有一个题目串到这个位置吧,对吧?我们可以将 fs 同这啊 pi 一二三一起作为这个 pi 啊,当然你就说一下,行了,我们以主要题目作为命名,将其命名为 pi, 对吧? 好,那么这是第一种啊,就是这个维度数啊,啊,那个大于这个逾期数啊。 好,咱来看第二种情况,这个小玉系数啊,那这种做法怎么做呢?呃,比如说我想提取四个因子,结果他就给我出来三个啊,那么我们怎么做呢?我们这时候就要强制提取,我们回到我们的因子分析, 然后在提取设置里面,我们把这个也搞进来啊,我们把那个提取设置里面在这里也设置,我他他出来三个,但是我实际想要四个,我们这里显示四,然后我们再做一下看一下,那这时候呢,他就有墙 制提取了四个啊,四个因子,那这时候要注意啊,如果你的数据本身质量不 不足以支撑四个维度,或者不足以支撑我的预期啊,你的预期那个维度设置,呃,他这里就是第四个特征值,就非常小,非常小,比如像这个零点七就不足以支撑啊,如果你这时候这个特征值在零点九以上,或者是 零点八九啊,是也接近零点九,那还可以勉强说他能够提取出来啊,四个维度啊,那首先你要看这里他是不是一个比较高的一个特征值啊?零点九是一个,呃,能够接受的一个一个标准啊。 好,那这个零点九的之后呢,我们再看下面这个旋转成分矩阵,如果他多出来那个维度啊,比如这里啊,他多出来一个 f f i 二,对吧?如果多出来这个呢?他刚好是 在两个或者是两个以上,对吧?呃,就是新做出来那个维度呢,在两个两个以上,那,那他构成了一个新的维度 啊,那这时候你就可以以新出来那个维度作为你的那个啊,少那个维度的命名了,对吧? 嗯,当然了,这个这完全是碰运气的样,有一可能是啊,有一可能是你前置踢了之后,他出来这个全都乱掉了啊,那这个呢?呃,实在不行你就把某个维度全部都踢出啊,全部踢出只保留那个啊,他踢出来那个样子啊。 嗯,那基本呢就是,呃,这几种做法,其实我们看到这个也没有什么特别好的办法,因为因此分析啊,因此分析呢,就是这样啊,他提出来什么样,我们就基本上以他什么样的那个为准了啊,只能通过这样的方法去 平合理的优化啊。当然我们还是建议啊,能用成熟量表就用成熟量表,毕竟成熟量表这个胎草性因子分析是可以跳过的哈。 嗯,那我们今天视频到这里了,我们下期再见,谢谢大家。

来了来了,大家好,我是大师姐,接下来我们来讲笑度 km 怎么操作,那我们为什么要做笑度分析呢?就是为了证明我们在四季问卷的时候是前后一致性很高的,不会出现前后不搭的情况。 那接下来我们先看一下重要的操作步骤哦,然后我们再开始详细的讲解喽。 操作一,点击分析,然后点降为最后点,因子分析。接下来把描述框中的初始解跟 kmo 给他选上,简单吧, kmo 出来了, kmo 只要大于零点六就可以, 大家看一下 pmo 的取值范围,如果是大于零点八零点九,那么证明你的一次性就很好。用动画讲 spac 有数据分析问题记得找大师姐,记得点赞收藏加关注哦!

嗯,大家好,我是君磊,上一个视频呢,我们呃简单介绍了一下关于信度分析如何去操作,以及啊我们通过一些方法来改善这个信度值。 从这几个开始呢,我们就连续做几个视频来去介绍这个笑度检验如何操作。嗯,笑度检验呢,可能是在我们做假设检验之前啊啊做的最大的一个检验了, 当然有的同学可能是用的非常成熟的量表啊,这一步呢,有可能会跳过啊,但是啊,我们发现啊,就是即有的同学即使是用了非常成熟的啊量表啊,导师依然会建议你去把这个笑度再做一遍啊,这也是有可能。 所以说,嗯,这一步呢,你需要跟自己导师啊去沟通,如果是你是用了成熟的链板,你需要去沟通确认一下你是不是要做这一步啊。如果是你是自己设计的文件,那么一定是要去做这一步检验的 啊。我们可以先看一下他的,看一下他的定义啊,这个定义是我自己写的啊,跟一些概念啊,可能啊,不太一样,但是表达大家都是一样的。嗯, 效度检验其实它代表一是数据的有效性啊,也就是说啊,通俗一点讲,就是你心中所想的,跟你实际所测量出来他是有一致性的,嗯, 如果一致性比较高,就说明你数据的有效性较高啊。放在我们的这个问卷的分析当中呢,就是说你的量表的这个设计啊, 跟你的实际测量出来这个维度啊啊和音子他是一致的,或者是基本是一致的。比如说你有二十个题目,你设计的六个因子, 那么我们用探索性因子分析呢去把它给呃探索出来哎呃,刚好你这个探索出来因子跟你实际所设计的是一致的。 ok, 那么你就说明这个消毒是通过的, 那我们应该用呃什么样的呃呃特征来去表征这个效应呢?或者说用什么样的指标来去探来去验证这个效应呢? 那我们我一般是会把这个度减压区分三个难度啊。第一个难度呢就是用 k m 和巴特利求生减压来去操作啊。其实是,其实说呢这个这两个指标呢,他并不是来去减 的这个笑度,他是来去啊来去呃看一下这个数据是不是适合做这个因子分析。嗯,但是呢就是,呃 嗯,原则上讲这不是消毒检验,但是我发现很多的文献当中都是把这个当成一个消毒检验,这个很有意思啊。所以说呃当你的当你的这个笑度实在吞不过的时候,你可以哎浑水摸鱼一把,然后只用这个。呃 啊,只用这两个指标就去表扬这个笑度啊,当然可能会不会通过啊,也可能也有可能会被通过。嗯,好,那么一般呢,我们是用探索性因子分析啊去做这个笑度的言,这是啊用的最多的,最多的一个。 嗯,他其实是在我们积极学习当中他是一种降为的一种方法啊,我们叫 啊因子分析,降为嘛啊?在这里叫他投降因子分析,他本身上是啊有 n 个题目,有二十个题目你给他降为降成了四为或者五为,然后呢我们能通过因子和载去呃找到这个因子下他跟哪些题目是 啊比较亲密的,因为他哪些题目是归属到哪个因子的,那么这种呢就跟可以跟我们的设计呢所哎呃有一个匹配关系,如果匹配比较高就说明你的效度比较高,我们叫 efa 探索性因子分析,那么嗯, 另外一个比较高难度的这个消毒检验呢,我们叫探索性因子分析加验证性因子分析。嗯,简单来讲就是我们探索出来这个因子之后啊, 再用啊结构方程或者是啊验证性因子分析啊,去跑一下,看一下你这个啊,你探索出来这个是不是一个良好的一种啊?结构啊,这两个用探索性因子分析加验证性因子分析呢, 这种方法呢,他是呃最能够让人幸福的,当然他的一些指标想达标的话也是最难的,所以说啊, 一般本科是很难很少去做这个这两个呃分析来做泄露检验的,一般是研究生阶段呢会用这个分析, 本科生我建议就是用探索性因子分析就够了。好,我们今天呢就先讲这个探索性因子分析。 好,我们还是先看一下这 这个呃表格的样式。呃,因此分析呢,他有很多种表格样式。嗯,但是这种呢是我觉得呃是最方便的。因为什么呢?因为他是直接可以从 spss 中呃 去输出的,也是直接可以用的啊,我觉得不需要再大改了。嗯,当然也有其他一些比较啊,综合的形式啊,那种也是可以的啊。嗯, 好,我们先先介绍一下这些表格。第一个表格呢,他是啊刚才我说的 km 和巴特利群体验这个指标呢怎么看呢啊?首先要看 kmo 值啊,这个值呢?呃,也是要看他是不是大于零点六, 嗯,也有的时候要看大本,嗯,是不是大于零点七,这个不是很严格,一般大于零点六我觉得就可以了。呃,当然你要看你导师是不是, 呃,要求你大于零点七啊,或者零点八,呃,然后通过这个,这个通过之后呢要看他这个屁,再看那个他的群里面的配置啊,这个配置如果是小学零点,呃, 小于零点零五,那一般他都是小于零点零一的啊,他,呃,这很容易通过的。这个如果这两个都通过呢,就说明这个数据啊,他可以进行因子分析。好啊, 嗯,可以做印子分析。之后呢,下面我就就开始看那个音。嗯,主持分的 t 恤以及宣传成本矩阵。好,我们下个这个表怎么看呢?嗯,这个表出来之后呢?嗯,首先要看这一列我们叫什么叫啊?特征值。 这节车上知道要看他是不是大于一,或者说要看一下他大于一的有几个,能够大于一的有吗?有四个, 有这四个,也就是说我们,嗯有十三个题目,十三个题目呢,他提取出来四个音字,而这四个音字呢?呃,我们再往后看后看,这里有一个累计 多少多少,我们叫什么叫累计的方差解释度啊,这个呢是百分之七十六点几 啊,这个是比较好的啊,这个累计发达。呃,几十度呢?这个呢也没有一个非常严格的标准,有的地方呢说达到百分之六十,有的地方达到百分之七十啊,这个确实是没有谁严格的标准,反正是越高越好。嗯, 你大家记住,主要是看这个 t 恤度,还有就是这个,呃大于一的个数。好,然后呢,看完这一个之后 啊,我们会看一个碎石图,嗯,这个碎石图呢,我们要看一个拐点,比如说这个地方大概是在这个地方出现拐点, 这地方出现拐点之后呢,我们就会说他,呃,提取二到五个啊,之间就可以了,而不是说他拐点出现在哪里,你就说提取几个适合,这个是没那种绝对的啊,比如说他拐点出现在这,你就说他 说是三到六啊,这样来表达就可以了啊,你看这里,嗯,在这前五数出现平缓之前继续下降,所以提取四个比较合适啊,其实他就是在五出现之后呢,然后说四到六个就比较合适,然后就说啊,提取四个合适,这样好,下面就是我们重头戏 叫悬崖成分矩阵,嗯,这个悬崖成分矩阵呢,他是这样的,就是每个题目呢,在 每个因子下面都有一个值,但是他最大的那个值呢,是他的那个因子的归属, 这里是都有直的,只不过我们把它给省略掉了啊,给他删掉了,因为我们只保留他最大的那一个,所以说我们取最大的这四个呢,那么这啊, t 第一就要提第三、第二、第四这四个题目就属于英子一,那么这三个题目就属于英子二 啊,这三这几个题目都数银子三啊,这都排序好的。好,然后下面你就解释一下啊, 根据学院成分得学院学院成分基本得知。然后啊,哪个题目是属于啊?哪个因子,然后他因子喝了有多少,这里的他解释就比较啊,就比较简洁,如果你想凑字数的话,你就可以啊啊,这个题 他的因子喝的是多少啊啊?写一下,然后他都是打游戏的,然后都可以问他命名为什么好,那下面呢,我们就接着一个数据来操作一下,给大家看一下啊,操作呢也比较简单, 但是有些细节需要好好的注意啊,我来操作大家一定要看清楚。首先我们点击这个分析,分析里面有一个降维降位,里面有因子分析,然后呢我们就把你的量本的题目给它塞进来, 比如说我们把这里的这这个这几个题目给他塞进来啊,加上这个吧。 好,然后呢我们一个一个点这里呢,先点这个描述,描述里面我们需要点什么?点这个 km 和巴特利,这个是一定要点的, 继续,然后抽取,这里呢我们是要点啊,这里我们就不动,一个是觊觎特征值的一个抽取啊,这里是我们不动的啊,有时候我们的抽取效果不是很好,比如说啊,我们 本来想是呃抽取四个,结果他就出来三个,那么这里呢,你就点他强制抽取四个,这里输入一个四,然后你看他出来是什么样子,你就可以去简单的看一下,但是呢我们还是要去看刚才说的特征值的。 好,我们先点他,然后四十图啊,就在这里点个四十图。好,然后我们点这里就旋转,旋转什么?就是旋转成分矩阵嘛,对吧?然后我们这里用最大方叉法好,其他方法就不需要了解,你就记得记得一个最大方叉法就可以了啊,这个是我们嗯 最常用的一个方法。好,我们今天继续,然后得分,这个保存为变量呢,一般是在,嗯, 在哪里会用到呢?就是在那个,呃呃,财务类的这个,因此分析里面,主持人的分析里面会用到这里呢,因为我们主要讲一部件分析吗?这里暂时先不讲了啊。嗯,我们这个也可以点上。好,我们再点这个选项,这里注意啊,我们 有这么一个注意的事项,一个是使用均值去替换这个确实值,然后呢按大小排序,这个是一定要点的,然后取消系数,这里我们点到零点三, 取消系数就是我们呃把那些呃因子核载低于零,低于零点三的我们都给他不敢试,然后我们就确定 好,那么这个就出来了。好,我们可以看一下,其实这个表格呢, 就是我们那刚才我展示的那几个表哥的样子,只不过我们稍微稍加去修饰了一下。好啊,这个就是 kmo 值和巴特利啊,他,他是零点八七七,还是比较高的,然后配置也是良好的。 好,这里呢就是刚才我说的那个啊,特征值,我们看他是不是大于一啊?大于一的有六个,也就是说这六个呢,也就是说这二十一个题目提取了六个因子, 然后累计解释百分之七十二点四的一个方差,这个是比较理想的。然后这个就是,那你就啊,这个地方其实没那么严格,你就大概说一下啊,他是在七这地方出现了 一个拐点,所以呢啊,从五到八提取五到五到八个因子是可以的,所以说我们提取六个因子是合适的,这是六吧,这六个因子是合适的。 好,然后这是成分矩阵,这个成分矩阵跟后面那个矩阵他是不一样的,这是还没旋转之前的,我们不管这个直接看这个。好,这个就是旋转成分矩阵。 那么这个举证呢?你们看他就是啊,这一堆是在一起的,然后呢?我们,呃,这零点,你看这是零点四吧,这零点四我们要看他大的,所以我们要从这开始看,从零点八这地方开始看,然后这停止,然后在这里看, 他给你排泄好了啊,这个地方就是一个宣传成本举证。嗯,那么关于制表呢,我在这里就不多讲了,大家只需要把啊这个宣传成本举证跟这个解释, 磨砂还有开摩托力啊,给他复制一下。这天他到表哥里面已经稍加休啊,稍加那个加工就可以啊,直接 coffee 到味道里面去了。嗯 嗯,燕子飞行到这里就并没有结束,因为我们还要解决一些问题啊,一些我们很常见的一些问题 啊,比如说我们的因子因子分析的效果,比如这指标不达标,我们怎么办?还有就是啊,我们出来结果啊,学院成分举证并不是我们想要的结果,我们怎么办 好这些这些问题呢?我们放到下一节课来处理啊,今天我们就不不多讲了,好啊,我就啊先到这里这个视频,谢谢大家。

主成分分析只要解读 k m 值和 bartel 检验测中值和分叉解释率, kmoji 如果高于零点八非常适合进行分析。介于零点七到零点八之间说明比较适合分析。介于零点六到零点七之间,说明可以进行分析。 kmoetz 小于零点六则不适合进行分析。如果 bartel x 检验对应批值小于零点零五,也说明适合进行主成分分析, 会根据特征根大于一的标准自动确认主成分的个数。从上表可以看出,主成分分析将构建出三个主成分方差解释率代表因子提取的信息量累计方差解释率一般在百分之八十以上较好,你学会了吗?

大家好,欢迎来到 spas 课堂,我是李博士。呃,接下来我跟大家分享的是 spas 校度检验。 好,首先我们了来了解一下他的一些基本概念。校度呢,就是有校警 是衡量综合评价体系是否能够转确反应评价目的和要求的,而是测量工具能够测出其左右测量特征的正确程度。效度越高呢,就是表示测量结果越能显示 呃索要测量的特征,反之呢,就是效度越低。通常呃,我们调查问卷呢。呃,效度分析的方法主要就是结构效度的分析。结构效度呢,就是指测量结果 体现出来的某种结构与测量值之间的对应程度。呃,在结构角度分析呢,一般采用的方法呢是因子分析。 好,我们呃用这 kmo 和巴特莱的精心检验呢,主要就是用它来判断是否适合做因子分析的,然后如果他满足这些条件呢,我们就可以进进一步做 因子分析,也就是我们通常所说的探索性因子分析。这 k m o 检验呢,它呢主要是用于检查变量之间的相关性。数值呢,是在零到一之间, 他的数值呢,越接近于一,就说明变量之间的偏相关性越强。因子分期效果呢, 就约好。呃,这个数值呢,一般是大于零点七我们要求的。然后呢,如果小于零点五呢,就不适合做因子分机了。呃,关于这个巴特莱的球形检验呢,它主要是用于判断相关局证是否是单位证, 就就是各变量之间呢,是否具有较强的相关性的。然后他的要求呢,是 呃求人检验的显著性批值小于零点零五就说明呢变量之间具有较强的相关性, 如果它们之间的显著性 p 大于零点零五呢就说明,呃各变量之间是相互独立的,就不能做因子分析了。好,我们通过来看一下 s p s s 因子分期的相关模块,呃,他这个效度检验呢,主要是通过因子分析这个模块呢来输出他的相关结果的,他是在哪分析降为因子下面呢? 呃,展开这个主主对话框之后呢,我们可以看到是这样的一个形式,左侧呢帮助我们变亮,右侧呢 就是放置我们进行因子分期或者消毒分期的变量的,然后在这最右侧呢就是有些我们需要输出的一些内容,我们接下来再看 啊描述对话框呢,我们是通常选择这 kmo 和巴特利的球形度检验,这呢就是输出了我们需要的角度检验的结果,他 如果满足刚才我们所说的条件呢,就说明他适合做因子分析。接下来呢我们就可以做因子分析了,然后旋转对话框呢,我们通常选择这个最大方插法, 然后选项对话框呢,我们一般选择的是按大小白序,或者呢有些时候呢我们需要把呃小技术像呢就是不展示,这样呢可以把这个选项禁止减去小区数小技术,同时呢我们可以设定他的一个数值绝对值, 呃小云某一个绝对值呢,他就不展示了,在输出的表格里面。好,我们通过一个案例呢来分析一下他的效度啊,还是限度分析,用限度分析时候的用到 的数据,就是说呢这是呃九个量表题目,然后呢我们来做一下它的一个效度检验,也就是 kmo 和八之类的检验,我们打开这个数据 分析,降为因子,把这九个题目呢选进来, 然后描述呢, k, m, o 和巴特利的球星度假面继续提取呢,我们这里可以不用管继续旋转最大方插法 得分呢,这里不用管取消选项呢,按大小排去继续确定。好。这里呢我们 可以看到巴特利的球星 kmo 和巴特利的球硬度检验呢,是点八五零大于零点七,这巴特利的球经检验呢,是显著性呢是零点零零零,他呢是小于零点零五,就说明呢,呃,这个量表数据呢 满足效度检验的一个条件,说明呢他适合做因子分析。我们接下来呢就可以呃做因子分析了。然后因子分析呢是我们下节课介绍的内容,这节课呢就不做过多讲解。 好,我们再来看一下他的一些相关乱文里面消毒分期的展示结果。首先呢,他是展示了一个 km 五和巴扎利的检验的一个输出结果,就说呢,还是展示他这样一个结果,满足条件呢,就是展示了一下他的一个因子分析的一个结果,他呢就是对这些 输出结果呢,就是对这些条目呢进行合并。这些地以地开通的呢,是工作投入成就动机呢,是转化也开通的这几个题目组织支持呢,是 i 的这几个题目。呃,这呢就是在一篇学问论文里面的一个校度分期的一个展示结果,大家如果有兴趣呢,可以看一下这篇论文。好,关于校度检验呢,就介绍到这里, 大家如果有疑问或者数据分析相关的合作市民呢,可以联系我们,这是我们的联系方式。好,关于本次内容呢,就分享到这里,谢谢!


因此,分析面貌、职位那儿或者不存在怎么办?一、先检查相关关系情况,并且移除掉相关系数过高上。二、再次分析, 如果分析上之间相关系数值过高,比如大于零点八,说明贡献性太强,无法有相同所信息,这种情况可能导致黑幕值无法输出。二、加大样本量,样本量过手,容易导致相关系数过高。建议分析样本量大于五倍,分析上个数,你学会了吗?

一秒搞懂因子分析结果做因子分析需要重点关注这三个指标, k 某值用于检验是否适合因子分析的指标,一般大于零点六即可。 birtwitch 球型度检验对应的屁值小于零点零五则说明适合进行因子分析。分叉解释率是因子 取的信息量累计方差解释率是所有因子提取出的信息量,该指标值一般大于百分之五十即可。用 so 做因子分析不仅可以得到多样化图表,还有智能分析分析建议帮助你理解表格指标,你学会了吗?如有其他疑问,请在评论区告诉我。

哈喽,大家好,我是 yuki, 今天我们来讲一下如何用 spss 做音质分析,求 kmo 和巴特力求检验。 嗯,首先呢,我们还是一样要打开 fire 导入我们想要分析的数据,那我已经导入好了,之前的视频也说过了,就这里就不再讲了。然后在分析数据之前呢,我们要做着数据编辑呢 啊,之前的视频也已经给大家说明过啊,我们这期呢就直接进入分析,还是一样点击分析,点击这个点名胜利大神这一块,然后选择音质分析法特。呃,我们需要把所有, 呃,因为我是用李李克特量表去啊,做我的温泉调查,所以我要把所有的 比克特量表的这个项目数据放入这个歪瑞宝这框框里面进行分析啊,我之前因为是有做过的,所以全部都放进去了啊,那么视频中我也操作一次,给大家看一下如何把这个全部放进去。 嗯,首先我先把之前放进去的数据全部都弄出来。 对,弄到。然后呢, 选中啊,想要你想要分析的数据,把所有,因为我的是要分析离客特量表中 的的数据,所以我选了所有这个问题中所有尼克亮尼克特量表中的数据全部拉到外表这个框框中,然后 descripting 描述分析这里的话会我选择这个。嗯,扣一费神, 他的那个系数还有显著性,还有最重要是选这个 kmo 和巴特莉。 呃,检验,然后点 continue, 继续点。 ok, 现在数据就分析出来了啊,这个双关 矩阵表的话呢?呃,这里就先不仔细说明了,如果你之后要做区别笑度的话,这个相关矩阵表是非常有用的。 嗯,怎么样看这个相关矩阵表的话呢?呃,下一期再做一个视频啊,跟大家详细说一下。 往下拉呢,就可以看到这个 kno 和巴特力检验球的这个数据,然后我的 kno 是零点八七六还是蛮高的了啊。有些学者呢,会说只要大于零点五就可以, 参考时是零点五,但是一般的话,嗯,是学者会推荐是大于零点七,大于零点七的话就代表啊你这个可信度是比较高的。那 这个是零点八七六是蛮高的了。然后下面就看这个显著性,我是小于零点零一,也是非常的显著了啊,一般参考值就是小于零点零五的话呢,就是显著了, 然后你越小,数字越越小的话,就会越显著性就是越高啊。那么今天这一期啊,讲 km 和巴特力球检验呢,就到这里了,下期我们再分享其他相关的视频。好,谢谢。

那么刚才其实我们的假设是说社会支持对于情感的孤独是不是有显著的影响,这是一种假设类型。哦,那有时候我们假设可能会是说男性跟女性,呃, 会不会在某个变料上存在一种影响?比方说我们假设是说男生跟女生,他们在社会知识改善存在了显著差异, 怎么去做呢?那我们一样的在分析这边,我们使用我们的比较均值这一块,然后呢我们要做的是独立样本体检验,因为男性跟女性他们是两个独立的样本。然后我们看一下 点击进去后呢,我们首先手确定的分组变量,那我们是用卷短的性别作为我们的分组变量,用板梁分两组吗?然后我们的简言变料呢是我们的社会支持感,然后把它放进去,那这边是需要对我们 我们的男生跟女生作为一个编码的,在电影组这边的主一呢是零 十二呢,十一我们点击继续,然后点击确定,看一下我们的结果, 结果就是说我们发现,呃,这位告诉我们,比如说男生跟女生的个案数均匀指数。然后呢我最关键是看这儿的,就是说, 呃,他的一个显著性到底显不显著?那么我会发现一个事情,就是从显著性来说呢,他的显著性是点六幺四,那他已经远远大于点零五这个显著性值了,所以说他是不显著的。那么我们就可以在我们的结果部分报告,什么呢? 说男性跟女性呢,这两组群体在社会支持这个变量上呢?结果为结果差异是不显著的。

我们在做数据分析处理时,往往涉及多个测量指标,多个变量之间常常会存在一定的相关性,其中就会有信息重叠的部分。主成分分析可用少量的因子取代原本的变量,通过 spsfu 三步即可操作完成。 登录 spssvu。 第一步,选择进阶方法煮成分。第二步,将十个电量选中,拖拽到右侧分析框。第三步,点击开始分析, 得到分析结果,可按照分析建议及智能分析对结果进行解读。主成分分析一般作为中间环节,后续可保存主成分得分,进行主成分回归或结合商执法计算权重。