粉丝1178获赞4238

大家好,我是陈老师,欢迎大家收看杏花开医学统计课程, 我们将每周在微信公众号中更新最实用的医学统计文章及视频案例教程,帮助大家轻松掌握医学统计学方法和统计软件的操作。我们的微信公众号是 xhk 三四五,欢迎大家关注。 今天我们要讲到的是卡方检验在医学病例对照试验中的应用。今天我们要讲到的案例背景是某机构为了研究,为了研究新药 a 的疗效情况,将一百八十七名肺部感染程度相同的病人 随机分成两组,其中一组为对照组,另一组为观察组。对照组有八十三人,观察组有一百零四人。对照组和观察组的人数轻微不一样也是可以的。 对照组给予的是常规的药物治疗,而观察组给予的则是新的药物,就是我们今天要研究的药物 a, 经过一个疗程的治疗后,啊,对照组和试验组的,啊,人数的这个啊,感染肺部,呃,仍然有肺部感染的人人数和恢复正常的人数的情况。就如这个屏幕上的这个表, 显示的是观察组,呃,经过一个一个疗程的治疗之后,仍然有六名肺部感染者,但是呢,有 有九十八名恢复了正常。而对照组呢,呃,仍然有十名肺部感染者,而七十三名恢复了正常。好,这个呢,就是我们展示在屏幕上的这个四格表。 好,嗯,注意,陈老师,还有一个要强调的就是,呃,对照组和观察组一共有一百八十七名,也就是本次研究一共选择了一百八十七名肺部感染的这样一批患者。 注意,我们一定要保证对照组和观察组的呃,在治疗之前肺部感染程度必须是一致的, 也就是说我们在做病例对照事业的时候,一定要保证呃,一定要排除所有的混杂因素,也就是说我们在治疗前必须两组患者的肺部感染程度一致, 这样的话,我们一个疗程之后的运算结果才能够有效的说明呃药物 a 是否比常规药物的疗效更好 好呃,控制观察组和对照组在治疗前或者是干预前或者是试验前的状态一定要一致,这个呢也是病例医学研究中病例对照试验的一个前提条件。 好,关于这个,嗯,各种各样的试验的方法的介绍呢,我们在长期的工作中整理了一套详细的教程,这套教程包含了大量的医学统计学方法,医学试验方法以及运算结果的详细的模板说明, 同时还有配套的数据,并且持续更新,有需要的朋友可以联系我们的客服进行领取,客服 qq 是 三三零幺八八八二零零。好,现在我们再来看看啊,我们这个屏幕上的这个肺部感染的数据很明显,这个呢是一个四格表数据, 对于四格表很明显,我们实际上就是要比较观察组,也就是使用药物 a 的这么一组患者,他们的这个药物有效率与对照组药物有效率是否存在显著差异, 如果存在显著差异,那么就可以证明呃这个药物 a 呃他与常规药物的疗效是存在显著差异的。然后我们可以再进一步的判断到底是哪一种药物的疗效好? 所以呢,基于这样一个研究的案例背景很明显,我们选择的统计学方法就是四格表卡房检验,也就是卡房检验 好,卡方检验的零假设呢,就是药物 a 的疗效,也就是药物 a 的有效率与常规药物的有效率是一致的,一样的,这个是零假设。 备选假设是药物 a 的疗效,呃,也就是药物 a 的有效率与常规药物的疗效,也就是常规药物的疗呃,这个有效率是显著不一致的。 好,如果我们算出来显著性水平批值小于零点零五,我们就拒绝零假设,接受备选假设。而当我们预算出批大于等于零点零五的时候呢,我们就是接受零假设,也就是认为药物 a 和常规药物的疗效是一致的。 好。嗯,除此之外,这个陈老师还跟还还要跟大家说一下,就是呃卡方 检验他还是有一定的样本量的要求的,就是卡房检验必须要求总体的样本量大于四十,并且 这个呃理论评数小于五的单元格的个数,呃,必须他的这个占比 理论评数小于五的单元格的个数的占比必须小于百分之二十。好,关于这个呃卡方检验的前提条件呢,陈老师在等会的运算结果中给大家详细的讲解。 好,现在呢,我们要把我们刚才看到的那一套四个表的数据录入到 spss 软件中。录入数据的方式首先是录入变量名,录入变量名呢,我们是我们是要撤回到变量师图里面来录入的。好, 我们第一个要录入的名字是组别,组别,我们一般的副职,我们组别的副职,一是代表观察组,二是代表试验组。呃,对照组, 一是观察组,二是对照对照组。然后呢?这个,嗯,第二个我们就是要录入这个治疗,治疗情况就是有效,有效状况。 呃,其实也可以换一个名字叫做治疗结果。治疗结果,治疗结果呢?我们的复制是零,一般都是表示无效的,零表示无效,我们这的无效是仍然有肺部改 开始 一呢,一般在临床医学研究里面, 对于分类变量的复制,我们一般都是用一来代表阳性的,有效的。这个,呃,出现了某某某事件的,而零呢,就是代表无效的,没出现某某某事件的。一就是有效,应该叫做恢复正常。 好,确定。然后第三个呢,就是平数,也就是人数。好, 这个,这个我们录制好了之后呢,我们接下来就可以回到数据师图里面录入数据了。 好,这个组别和治疗结果可以设置成名义的啊。陈老师,这没有设置,因为这里是否设置的话,不影响我们分析。好,我们看看这个,我们刚才的这个观察组,他的编码是一 观察组,这个没有恢复正常的有六个人。好,这个观察组恢复了正常的有九十八个人。对照组没有恢复正常的十个人, 对照组恢复了正常的是七十三个人。好,注意这个下面的这些点,这些点可能是软件 或者是陈老师刚才不小心点错了,自动跳出来的。注意,一定要把那个点删了之后,我们才能够开始做数据分析,不然的话软件会把那样那样一些点默认为缺失值的。 好,我们把这个数据,这个数据就录入好了啊,因为 spss 软件呢?呃,他是呃,卡方检验是横着看的, 我们这样可以切换一下,观察组仍然有肺部感染的是六名,观察组恢复正常的是九十八,对照组仍然有肺部感染的十,对照组恢复正常的七十三。注意,卡房检验的这个数据我们都是横着看的。 好,对于这样一个数据呢,我们第一件事是要加权,因为软件他只知道观察组,呃,我们要做的卡方,卡方 检验室组别和疗效这样一个,呃,两个这个变量之间的一个交叉,我的目的就是为了研究不同的组别在治疗结果上有没有差异, 但是呢,软件并不知道观察组仍然呃,有肺部感染的有多少人,软件是不知道的,所以怎么样让软件知道呢?这个时候我们就要对数据进行一个加权处理。 个案加权,对,注意这个加权的话是人数进行加权,就是告诉软件每一个组别在每一个状态分别是多少人, 直接点确定好,这就是 witby 人数提示,我们这个人数已经被加权了。好,加权了之后呢,我们就可以开始 进行数据分析了,这个时候我们就可以开始进行卡方检验了。点分析描述交叉表就是卡方检验 好,我们检验的就是啊,两个组别在治疗结果上有没有显出差异,所以呢,组别选进行,治疗结果选进列 统计量呢,我们勾选卡方就可以了。然后呢,这个统计量在这个卡方检验的这个这个交叉表的右边,这个统计量啊,勾选卡方继续就可以了,然后我们点确定这个呢,就是运算结果,好 好这一张个案处理的这个摘药表的话呢,也就是说,嗯,参与本次研究啊,试验组 和对照组一共有一百八十七个人啊,这一共是一百八十七个人,并且没有缺失,这一张表不是很重要,我们的重点呢是要看呃,这个交叉表和卡方检验的结果。 好,我们来看看。嗯,这个 spss 软件给出来的这个交叉表实际上就是刚才陈老师屏幕里面嗯,打出来的那一个交叉表,嗯, 实际上呢,我们就是把这个交叉表呢翻译成 spss 软件认识的格式。在进行卡方检验之后呢,啊, spss 软件又把它整理成了我们这种常见的表格的格式, 就是展示一下每一个组别,展示一下这个观察组的这个结果分别是六和九十八,对照组的结果分别是十和七十三。好,至于这个结果 的差异具不具有统计学意义呢,我们可以看一下。首先这个,嗯,总量本量一百八十七大于呃四十。第二呢,就是我们这的这个 没有任何一个单元格的理论评数小于五,那么这个时候呢,满足卡房检验的两个前提条件,一个是一百八十七,一个是理论评数小于五的单元格的个数占比小于百分之二十,这个也满足。所以呢,我们最终确定我们的检验结果就应该是 皮尔逊卡方检验的结果,卡方值是两点三二六,批值是零点一二七大于零点零五。这个时候呢,就说明啊,观察组的恢复正常的率,也就是有效率与对照组的恢复正常率,也是 是这个有效率之间不存在显出差异好,呃,其实,呃,这个不存在显出差异的话呢,我们就没有必要更进一步的去比较呃哪一个组别的有效率高,哪一个组别的有效率低, 没有必要批大于零点零五,就没有必要继续考察谁高谁低,只有批小于零点零五存在显著差异的时候,我们才有必要继续考察哪一组的有效率高,哪一组的有效率低。 当然这个有效率要算的话呢,就是根据这个交叉表里面算,也很简单,比如说观察组的有效率就是恢复正常的人处于观察组的总人数,这个是九十八,除以一百零四等于百 分之九十四点二三。对照组的有效率呢,就是恢复正常的这个人除以总人数就是七十三,除以八十三, 有效率是百分之八十七点九五。好,虽然说这个嗯观察组的有效率百分之九十四点二三,他是高于对照组的百分之八十七点九五,但是呢,他高的这个程度不具有统计学意义, 也就是说观察族比对照族可能略微的好一点,但是好的程度不足以让我们呃认为观察族,呃,这也就是说这个药物 a 的呃治疗结果明显的好于常规药物 好,这个呢就是卡方检验,嗯,如果,呃关于这个方法呢?如果大家有疑问 可以在新花开医学统计微信公众号里面留言给我,我会将大家提的问题集中进行解答,我们的微信公众号是 xhk 三四五。好,然后呢,我们运算的这个使用 最新的,呃,使用的软件是最新的 spss 软件。今后呢,我们会在微信公众公众号里面更新更多有关萨斯、迈塔等统计软件的操作视频。 好,今天我们的课程就讲到这里,我们将持续更新更多更实用的医学统计教程。欢迎大家关注我们的微信公众号, xhk 三四五,品质源于专业,服务源于真心。感谢大家的收看,下期再见!

在平时我们进行一些数据的调整时,可能会遇到这样的情况,我们的列表啊,也就是内容和我们的行啊,也就是变量需要调个位置, 这该怎么办呢?比如说像球员有一二三四五六七七个球员,然后接下来呢是球员评委,一二三四五, 每个球员都对应一个评委,但咱们不想这么技术了,咱们想怎么技术呢?想要是每个评委对应一堆球员会, 这是一个球员对应一堆评委,或几个球员对应一个评委,这样子来进行计数。 可是如果要把他们修改的话,需要发生什么事情呢?那就是从头到尾全部删了,然后重新创建一遍变量,然后再重新写一遍内容,岂不是太麻烦了?该怎么快速的解决这个问题呢? spss 当中就有这样一个用法,我们点击这个数据,然后这里有一个转至, 接着就跳出了这个转制的对话窗口,先把电量放进来,电量是什么呢?就是我们这三个想要被变成列表的内容,选一个,点一个,再选一个,再 点一个,然后一直点,直到把这些评委全部都移过去。最后一个是球员,这个球员是什么呢?就是名称变量,注意了,这个名称变量是我们的列,是我们列的第一列内容,所以把它放到这来 告诉 spss 的意思就是把这个变量里面的这堆东西啊放到名称那里去,然后把名称的这堆东西啊放到变量这里来,好了,点击确定。 接着会有一个日志一闪而过,这个日志是这样子说的,首先呢把这个评委一二三四五和我们的新名称球员进行置换, 置换了以后,他正在完成,就是把这个七个盒子就是七个匣子的内容和六个变 量进行五次的旋转,然后还有八个空位符,然后呢开始进行转换,这是一个循环过程,循环完成了以后呢,球员这个变量啊,他就变成了 变量整形,而至于其他的原变量呢,则是变成了旧的名字,下面是已经更改好的内容,变量是球员一二三四五六七,然后数据即是一二三四五平尾。好,我们看一下结果 是不是和理想的很一样啊,平稳移到这边来了球员移到这边来了,那你可能会说,咦,那原来那个球员呢? 在原来那个球员变成了 case l b l 了, case l b l 是用来存储评委的,一般在进行了位置置换之后,由于原来这球 球员这个变量啊,他已经不能够再放原来的球员了,放的是评委,所以呢就新建了一个名称,称之为 case。 与其说是新建,倒不如说是程序自己把原来的给删了,然后把原名字复制了一份移了过来。 以上就是关于置换的全部内容,要是咱们对于置换的内容很不满意的话,可以点击一下这个按键,这个按键是撤回按键,哎,等一下, 这样可以对于用户的操作进行撤回,快捷键是 ctrl 加 z。 置换完成之后,你仔细观察一下,会看见文件名变成了无标题三,他这里面有一个星号,表示是未保存的,为什么是无标题 题呢?还记得刚才我们打开的时候应该是零三零二吧,对,没错,因为他在进行置换之后,创建了一个新的文件,毕竟置换和创建一个新文件没什么两样,自然程序在替你做这一部分的时候就把文件给创新了。 至于原文件呢,他肯定还开着,我们只需要在菜单栏当中把前面一个零三零二给打开就是了,这就是还没有更改置换之前的样子,然后你可以从这里重新操作,至于那个置换失败的,把他删了就行,或者说不保存, 单步的单步的调整。例如我们删除了一个评委,或者是删除一个数字,这个我们给搞错了,按下回车键即可。如果想要倒回到原来的样 样子,就按 ctrl 加 z。 可是我们不想要倒回到原来样子,而是要还原之前的操作呢,就是 ctrl 加 y, 记住 y 和 z, 这样可以帮你减少不少的时间精力呢。好了,今天的课程就讲到这里, 下节课预告,我们将学习第六课数据文件的合并,领取软件数据。欢迎关注小金微课堂公众号, 咱们下节课再见! see you next time。

欢迎来到小金威课堂 ibm s p s s 软件数据管理与编辑系列课程第一章第一节课定义变量 现在我们看到的是软件的整体界面,点击左下角的并量,试图进入并量编辑页面。 变量编辑是接下来进行数据管理分析和编辑的最基础的步骤,因为我们必须得要把变量进行合理的规划,才可以更好的制作数据表格 和数据结果。首先是名称分类,名称分类可以定义我们自己的名称,由于 i b m s p s s。 软件已经内置了台湾的繁体文字,因此它是支持中文输入的。 比如我们创建类别,名称为姓名, 这时候他会自动生成右侧的这一堆数据。 第一个就是类型,类型是什么呢?是数字,这也是软件默认的,我们可以点击右边三个点开始更改变量类型。 数字逗号点科学技术法,日期美元定制货币字幅串或者是受限的数字。数字呢就是普通的编码,他并没有太多的意义,也 不可以进行计算,只是用来识别当前的这个名称呢。接下来是逗号,逗号这一个其实是点计法,这里我们不做过多的坠数点呢,也是点计法,通常指的是小数点和小数。 科学技术法是那种带意义结尾的日期,日期,这里是各国的各种不同的日期编码形式,还有美元以及定制的货币。 货币的话呢,就是各种通用的货币规则,还有字符串,一般我们会选择字符串,像姓名就是一种,毕竟我们录入的肯定会有中文,还有其他的数字,字符数设定为八,这也是默认的,我们可以更改为十, 也就意味着一个变量当中最多可以输入十个字符。受限的数字是带有前导铃的整数, 说明他有部分的数字是不被识别的数字只能够支持 utf 八,并且宽度只有八个,也就是只能够输入八位数字。这里我们选择字符串,点击确定 宽度呢?十,这是刚才我们设定的小数位数,由于咱们这里不会用到小数,所以不用设定他。接着是标签,标签吗?我们是可以进设定的,在设定好标签之后,进入数据视图就可以获取到当前姓名的附属标签。 值值的分类,我们点击右边的三个点,开始进行附属设置值标签可以给他设定一些分类,比如说像姓名当中可以设定各种不同的姓氏,比如姓氏为王的标签,把它设定为一顶级添加得到的结 结果就是王等于一,之后在列表当中显示,只要是关于王这个数字的,那么他就会显示我一,还可以再放更多,比如礼。 设置标签为二,点击添加里就出来了。在添加好类别之后,可以点击我们当前选中的,然后选择去除, 现在当前变量就已经被删除了。至于为什么要使用值标签呢?因为在这个 spss 的软件当中,数据量庞大时,他不可能把每一个值全部都直接用汉字,或者是直接用长单词来表达出来,一般会使用数字进行缩减。我们重新把网给添加回去, 好了,点击确定。接下来我们讲缺失数值, 点击,点击三个点,无缺失数值,这也是程序最开始的默认值,接着下一个是离散缺失值,最多可以设定三个, 比如十二、十、三十,就说明在十二、十三十这三个节点上就会随机缺失一些值。 这里的范围上加和下选,由于目前我们只有一个变量,并且是字符串,所以无法选择好,点击确定 列列是八列,这也是默认的,我们最好不要改对齐方式,对齐方式可以选择左中右,默认为靠左显示,其他的变量可以根据我们的需求选择靠右或居中,便于我们进行查询和查看。 至于测量,本来是有一个标度,就是一个尺子的形状,但由于我们选择的是字符串,所以只能有有序和名义,名义呢就表示他等于当前他的这个名字,他只能根据名字来进行调用,也可以被输入,但是呢不可以被测量。 有序呢就说明他是有高中低等的,比如说姓名就是一个一等,然后接下来姓名的附属变量就是二等,三等等,都是属于有序类型。我们为了接下来更好的进行调用,所以点击名义。 最后一个角色末日是输入,也就说明我们可以往里面输入一些东西,可以输字符串、数字、标点符号等,目标呢就是可以进行传入,两者就是既可以输入也可以传入。 还有一个是无无就是什么也不能干,但是前面的名称、类型、宽度一直到测量都是生效的,只是他是个摆设,然后呢只能被调用,但是不能被使用。接着就是分区和拆分,这两个功能是什么意思?我们之后的课程在二街在家 选回输入,便于我们接下来的创建。好了第一个变量我们就创建完成了,除了可以使用中文来创建名称,还可以用英文来创建名称,比如我们输入 age 年龄 默认式选择数字模式,宽度为八位,小数位数是两位,点击确定宽度八位,我们可以输入八个数字,小数位数呢?可以,有两个是小数点以后的。 别忘了结尾的这个测量啊,得点击为标度,标度就说明他只能是数字,并且可以像用尺子一样测量他是多是少和其他的标度变量进行测量,哪个多哪个少,然后分类。 在 i, b, m, s, p, s, s 当中,变量的设定有一些特殊的地方,例如它可以使用特殊的符号, at 也可以,括号也可以, 但是不可以以数字开头。当我们点击数字开头的时候,就会说变两名当中的第一个字符是不合法的。 还有在众多的字符当中,下划线是不允许被创建字符的变量名的,除此之外其他都可以。 数字可不可以创建边聊名呢?可以,但是前提是得有个字母,然后再添加下数字,比如 dr。 因为数字和下划线在 sbss 的扩展类型当中 执行扩展操作时里面的编码,也就是之后我们实操时会看到的原代码运行窗口当中会把它和变量名弄混淆,然后就没有办法进行正常的测量了。所以下滑线不允许创建变量名,而数字需要在前面加上字母作为分隔后才可以使用。 四个变量创建完成。点击数据试图。 现在咱们能看到的就是四个不同的变量,姓名、年龄,还有两个设定 的测试变量。在我们的变量没有设定他的类型时,那么他就默认为测量,但是测量模式是未知的。也就是说,在没有创建测量模式之前,他仅仅可以作为对比,但无法进行查找。 回到姓名类别,比如输入 wive, 而 h 这里呢,也可以进行输入。 测量类的都可以直接输数字,并且他会把它后面加上点零零,便于之后计算时可以出现小数。 小数不允许超过三位数字,即使是科学技术法也不可以出现超过三位小数的数字。 本课的内容就讲到这里,下节课预告,我们将学习第二课数据的导入和查 看领取软件和数据。欢迎关注小金威课堂公众号,咱们下节课再见! see you next time。

大家好,我是陈老师,欢迎大家收看杏花开医学统计课程,我们将每周在微信公众号中更新最实用的医学统计文章及视频案例教程, 帮助大家轻松掌握医学统计学方法和统计软件的操作。我们的微信公众号是 xhk 三四五,欢迎大家关注。今天我们要讲到的是皮尔逊相关性分析,一般来讲最常用的相关性分析呢,有这么三种, 主要是皮尔逊相关性分析,肯德尔相关性分析以及斯皮尔曼相关性分析,这么三种是最常见的相关性分析的方法。呃,除了这么三种之外呢,可能还有一些偏相关分析,或者是距离分析,或者是典型相关分析,这么几种呢,可能是 不太常用的,如果,如果有朋友需要了解更多的 spss 里面有关相关性分析的方法,可以联系我们的客服进行领取。我我们的文字教程,我们在长期的工作中整理了一套详细的教程,这一套教程包含了大量的医学统计学方法分析结果的说明, 以及详细的这个配套的数据。而且我们的这个教程呢,也是持续更新的,有需要的朋友可以联系我们的客服进行领取。我们的客服 qq 是三三零幺八八八二零零。好,关于相关性分析,我们今天着重要讲到的是皮尔逊相关性分析。 首先陈老师会介绍一下皮尔逊相关性分析的前提条件,其实呀,任何一种统计学方法我们都不是盲目的使用的,每一种统计学方法都有 自己的特性以及自己适应的这个数据。我们拿到一个统计学方法,我们第一最要了解的就是这个统计学方法能够实现哪样一种统计目的。比如说像这个我们今天要讲到的皮尔逊相关性分析,顾名思义,我们必然研究的是变量之间的关联或者是联系。 比如说我们在医学研究中,为了探究某些疾病的发生与哪些因素有关,或者是这个生化指标与哪样一些因素有关等等。这样一些相关性分析, 我们的目的是研究相关性的,那么我们其实可以很本能的就想到这个皮尔逊相关性分析,但是呢,不一定是所有的数据都能够选择皮尔逊皮尔逊相关性分析的,皮尔逊相关性分析对数据有一定的要求, 皮尔逊相关分析仅仅只能针对这个连续数值型的且正态分布的变量。也就是说,呃, 这辆车老师刚才讲到的,我想研究呃这个疾病的发生与哪样一些因素有关,那么第一反应我就是要做相关性分析,但是呢,我能不能选择皮尔逊相关分析,这个还未知, 因为我要看看我的研究基于我的研究目的,我搜集到的数据是否是正态的,如果服从正态分布的数据,我想研究他们之间的关联性,我才可以选择皮尔逊相关性分析。 好,这个同学一定要记住啊,皮尔逊相关性分析他要求是连续数值型且服从正态分布的数据我们才能够使用。 或者是现在陈老师可以给大家一句汇总的话,就是当我们要研究两列正态分布的变量之间有没有关联性,我们才可以选择皮尔逊相关性分析。 比如说我刚才举的例子,我要探讨某种疾病的发生与其余的因素有没有关系。首先这个疾病是否发生,它是一个二分类变量, 再进一步,呃与哪样一些因素有关?这样一些因素我们不确定这个因素它是分类的变量,或者是连续的呃,或者是呃连续但是非正态的变量,或者是等级变量。像这样一些东西我都没有确定的时候, 我单单的只知道我想探讨疾病的发生和哪些因素有关,我们一定不能盲目的选择皮尔逊相关性分析。好,其实同学可以看一下啊,告 同学一个小窍门,就是每一个统计学方法,每一个变量,他对原始数据的要求,我们怎么查呢?其实可以进入这个,比如说我要查找相关性分析的这个对原始数据的要求的话,我们可以点分析进入相关性双变量这么一个界面里面, 然后打开这个界面之后,我们点右下角的帮助 好,点了帮助之后呢,自动的他就会弹出一个这个呃, spssibm 的一个说明书啊,我们来看看, 你看像这假定,假定写的很清楚,皮尔逊相关性的这个呃相关性的系数是假定每对变量是二元正态分布的。好,呃,就是关于这个说明 书呢,也是这个 spss 软件的一个说明书啊,同学可以这个,今天陈老师就要演示一下这种说明书的用法,帮助同学以后选择统计学方法的时候,如果不太清楚原始数据,不太清楚每一种 每一种统计学方法对原始数据有哪样一些要求的话,可以直接点击这个方法的界面右下角的一个帮助,来看看这个 sbss 软件的说明书里面给出来的一种标准说法。 好,说了这么多,陈老师只是想告诉大家我们的研究目的定了,数据类型定了,我们才能够根据啊目的和数据类型选择合适的同学方法。好, 刚才呢,陈老师是从非常严谨的理论的角度来考虑,皮尔逊相关性分析必须要求数据是服从正态分布的,但 是一般在实际情况中,其实啊,只要是这种像这种什么年龄体重只 bmi 还有这个血压的数据的话呢,他其实如果是轻微的偏态,或者是不是那种,呃,不是那种很明显的这种, 不是那种很明显的分类,也就是说像这种一看就是这种连续数值性的变量,其实我们都是可以选择皮尔逊相关性分析的。

欢迎同学们来到小金威课堂 ibm s p s s 软件数据管理与编辑系列课程。在上一节课,我们学习了如何选择个案,也就是挑选出一些特殊个案, 那这一节课咱们就要针对每个个案进行加权了,欢迎来到第十一课,个案加权 首先得打开本课的使用数据三杠八,这个数据啊,是在统计喜欢的和不喜欢跳舞唱歌的人数, 大概是这个样子,喜欢跳舞不喜欢唱歌的啊,喜欢跳舞喜欢唱歌的有一百三十三,然后喜欢跳舞不喜欢唱歌的有六十九,不喜欢跳舞喜欢唱歌的有一百五十九,两个都不喜欢的有三十七人。 然后呢,我们点击数据,选择最后一个个按加全,现在个按加全出来了,这个页面相当的简单,我们选中人数。哎,为什么只有人数啊?不是有三个变量吗? 其实个案加权他只能够针对这一种带尺子的,也就是只针对这一种计量类的变量进行加权。而至于前面两个呀,他们都是名称类的,跟他们没什么关系。因此,为什么老师是 制定一个这样的表格,就是为了更便于我们了解个案加权的使用方法。选择人数,然后他默认是不对个案进行加权, 下面点击个按加群依据,把这个扔进来,他就变成了频率变量的人数。 当前的状态一定要注意,看好了是不对个案加权还是个案加权依据,如果已经是个案加权依据,这里又有东西,这还要等待的话,那就说明咱们的这一个频率变量可能弄错了, 要是现在显示的是不对个案加权,需要个案加权的时候就紧给他加上,点击确定好,这个运行窗口已经完成了,个案已经加权 全完毕,那这儿来了,这儿有个权重开启,注意看,在你每次完成了数据的调整之后,都要查看一下权重开启,或者是这个地方有没有一些新的消息出现。 好人数出来了,好像貌似没有什么变化,我们进到变量仕途里面去看一看, 来点击分析,在分析当中我们可以看到他真正的变化区域在哪里。 在描述统计当中,选择交叉表, 然后把我们的跳舞和唱 唱歌一到行和列当中,其他的咱们就站起先不动,之后再讲讲他到底有哪些不同的功能。点击确定好了,交叉表出来了, 这是我们修改后的文件,个人处理粘药这里的唱歌和跳舞有效的有三百九十六,个案缺失呢,谋的也没有,其他的一些部分需要再进行被统计了,因此得到的结果是三百九十六, 然后在真正的交叉表里面呢,他就显示了真正的代理数字, 不喜欢唱歌也不喜欢跳舞的,那有一百九十六,然后呢,喜欢唱歌喜欢跳舞的两百, 而不喜欢唱歌喜欢跳舞的是三百九十六个。最后呢,得到的结果都很正确,这是为什么呢?这就是因为我们把整体的数值进行了权重开启,要是没有权重啊,我们来尝试一下, 把数据这里的个人加权改成不对个人加权。点击确定好了, wet off 了,我们点击分析,点击描述统计,然后呢,选择交叉表,再来进行一次统计, 看他居然变成了一一二一二二二四,这是咋回事呢?因为啊,他把每一个个案都算成了一, 因此他所得到的结果就无法进行拆分,也无法进行数据表格的统计。这就是为什么咱们要学习把个案权重加, 把个案加权开启的原因。除了在统计一些数值的时候,包括在计算比率的时候,还有对于各种各样的字符列表,还有数字表格当中都需要使用到个案加权实现最终的统计效果。 时间也是可以实现同样的效果哦,同学们可以自己尝试一下。好了,今天的课程就讲到这里, 下节课预告,我们将学习第十二课计算新变量, 欢迎关注小金微课堂公众号领取软件数据哦,咱们下节课再见! see you next time。

欢迎同学们来到小金威课堂 ipm s p s s 软件数据管理与编辑列课程。在上一节课,咱们已经学习了如何将个案进行加权,使得最终的计算结果可以是真实的数字计算,而不仅仅只是通过我们的个案位置和个案的个数来进行计算。 今天第十二节课,咱们教学习如何计算新的变量了。首先打开,打开这节课要用到的三杠九文件,接着我们看这里面包含了三个变量, 编号测定人和毕业率。编号测定人都是名义,而毕业率则是标度, 这就意味着只有毕业率是表数字的。接下来要学习的计算新变量也要通过毕业率好点击分析,点击转换,点击计算变量,就打开了这个像计算器一样的窗口。 接着先把目标变量写上去,目标变量只就是后来进行了新计算的变量,名称就叫做新并页率。 然后一类型与标签,标签用中文表示就行, 咱们讲的咱也 下面有一个将表达式作用标签,这个咱们就不用了,因为表达式用做标签的话,点燃有点太简单,一般来说不容易马上知道他是在干什么, 因此啊,可以通过标签来表示。当然,如果为了避免某些不错,咱们也可以选择当表达是用做标签。 等一下需要计算的类型属于数字而不是字符串,因此默认为数字就选它。点击继续 下一步,将毕业率这个变量点击箭头转过来,然后在计算机上面 打上加五,挺简单的,是不是运算的过程有了?那,那总得有个条件吧,咱们总不能是对于所有的变量全都这么干吧?点击如果 在如果这里他默认是包括所有个案,也就是不经过任何的调整时,所有的个案全部都会被进行加五的操作,咱们不希望是这样的,所以点击在个案满足的时候, 在各岸满足某条件是满足什么样的条件呢?咱们把毕业率移过来, 在毕业率这一列的数字当中,满足他小于等于四的情况, 就可以进行这个数字加五的运算。那么我们就设定 f 文具条件吧。 点继续看,左下角已经出现了并列率小于等于四的情况, 然后嘞,我们点击确定,等待日制进行一点简单的计算后, 回来看一下。耶,有一个新毕业率出来了,新毕业率他在第四个变量,这 并且帮我们附上了一个标签,叫做毕业率转新,毕业率加五,看是不是和我们所预定的一样呢?接着我们看下毕业率,这里 小于四的部分加了五,比如三点七五,小于四加五后变成了八点七五,二点零八,小于四加五后变成七点零八。至于其他那一些大于四的部分,就会用一个杠杠来代替,占个位置, 下面的也是依次类推,显然这个效果非常成功。点击转换,点击计算变量,让我们再试一遍其他的。 不过当前呐,已经有了这个新毕业率加五的这个名头在了,也就意味着我们已经有一个新的变量,用于制作当前的表达式 樱桃。想要创建一个新的,咱们就可以把目标变量改一改,改成什么呢?比如改成一二三, 哎,一二三,做一个简单的测试,然后呢,把毕业率再次扔进来,把前面的删了。这次我们希望毕业率怎么样呢?当毕业率大于十的时候, 我们就需要把它剪,这次用剪剪五, 点击如果将如果的条件判断变成应验率大于等于十,点击继续。 然后将类型标签换一个名字,这次我们改成音乐率转新的音乐率减五,点击继续,然后点击确。 经过一些简单计算后得出的结果是这样子的,只要毕业率他大于了十,那么就会在 a 一二三这里输出他们赠结果,比如十六点六七加五,十六点六七减五就是十一点六。 好了,以上就是关于如何计算新电量的全部内容,其实计算机还有很多的功能,怎么没有讲完呢?然后会逐步讲解的,再遇到这种有某一些概率上的东西需要集体增加时,就能用上这个功能了。 下节预告,咱们将学习第三方第十三课频数分析,欢迎关注小工微课堂公众号领取软件数据哦, 咱们下期再见, see you next time。

在上节课,我们学习了如何编辑和输出数据,那么现在该学习应该如何更改变量和变量的排序了。 变量排序的方法你可能会说,不是已经学过了吗?在变量试图当中,按下左边的这个 box, 然后长按就可以移动了, 说的也确实是这个道理,但是当我们的变量变多的时候,这可就不适用了,需要把它们按照某个规律进行排序, 点击数据,点击变量排序,现在出现了变量排序的对话窗口。 关于病量的仕途列表,他已经给出了很多种不同类型的排序方式,比如根据名称排序,所谓名称排序就是他的名字首字母为 a 至 z 的顺序排序。 第二种是类型,看到我们这里有名字类型还有度量类型了吗?还有一个就是分级类型,根据不同的类型进行分类。 宽度就是指他的长度从长到短或者从短到长。分类小数位数是否包含小数呢?或者是这个小数少,那个小数多。 标签,至于这标签是个啥,在我们创建变量的时候就已经设定好了,根据标签名称或者是标签的数字进行分类,直缺失、列对齐、侧重也都是同样的道理。 当我们任意选择一个,比如根据名称,然后调整他的是升序还是降序,升序就是从小到大,而降序呢,就是从大到小,我们就选择降序吧。 最后一个判断就是在新属性中保存当预先排序的变量顺序。 有时候啊,咱们啰里八嗦的打了一堆乱七八糟的数据,需要进行整理的时候啊,可能要整理的不仅仅是一次,因为这工 数量啊,不能都扔在一个文件里面呀,要分成好几个文件呢,要是每次在进行变量排序的时候都要调整一次,那就太累了。 所以呢,我们可以选择在新属性中保存当前预先排斥的排序的一个变量顺序,然后把属性的名称弄出来,比如属性名称是一二三, 目前咱们不勾选这个,然后点击确定,等待它制作完日制了以后,你会看到日制有新东西了, 新东西的排序是这个样子的,在桌面上他保存了一个 data, 三杠一的文件,是一个新的文件,在新的文件里面把现在的数据通 通进行了整理,根据每一个不同数据的名称创建了数据级二,然后把我们的窗口前置, 接着呢,再把这个数据集二进行一个互动,最后关闭数据集一,接着他就已经完成了列表当中所有变量的名字和名字的排列了。 好了,日志已经生成完毕了,我们去桌面找找看那个迪塔零三一零吧, 你看他已经进行排序了,支下膏树种树高和冠符, 他是把我们的变量名进行了排列,按照了 a 至 z 的这个顺序。 现在我们回到数据,点击变量排序,换另外一种排序方式,比如按照 就按照宽度来排序吧,点击确定,现在他已经按照宽度来排序了, 前面是只有两个字的,后面是有三个字的,因为量太少,所以我们看不出来太明显的效果,总之他会根据我们的字幅串来进行排列。 顺便老师提醒一下大家哦,我们中文呐,对应英文的字符串站位的字符量是不一样的。 回到并量试图,你看,我们有讲类型的宽度,这个宽度他指的是数字, 而不是我们的名称。名称所指定的宽度是有限定的,一个汉字相当于是四个字符, 也就是说一个汉字等于四个字母。因此,当你的类型选择为自负串的时候,一定要记得,如果自负数是八,那就只能打两个字了,你想要打更多的字,就得把自负数放大一些。 好了,今天的课程就讲到这里,下节课预告,我们将学习第五课,数据转制 领取软件数据。欢迎关注小金微课堂公众号,我们下节课再见! see you next time。

欢迎来到小金微课堂 i b m s p s s 软件数据管理与编辑系列课程第一章第三课, 数据的编辑和收出在上节课内容当中,我们已经学会了如何把现有的文件进行保存,以及如何打开一个新的文件, 那么数据里面的编辑和输出方式有该咋办呢?首先打开一个视力文件,点击这个文件夹按钮, 在数据文件当中选择第二张, 然后选择这一个零三零一,打开 好了,得出来的是这个样子,树种,树高,枝下高灌浮 这个呀,很显然是关于各棵树他们的一些个体参数,一个是树种,就是什么类型的树,然后这树有多高,这树的树干是多高,这树的树脑的也就是冠福有多宽, 做的一个数据统计,但这咱们不是做这一个,咱们点击并量试图看出来了吗?并量试图有这么几个,对应一下 第一节课所学习的内容,你是否能够看懂他到底写的是啥呢?首先树种啊,这里有植肯定有植,像毛白羊、白蜡和刺槐,就是三种类型不同的树。 接着他没有缺失值,列是八列靠右对齐测量为名义,因为他是一种名字类型,只需要让他进行和名字对应就行了,不需要计算是输入的角色。 至于树高之下,高和冠幅通通也都是数字,不过他们的测量单位是标度, 因为后期需要进行计算和进行对比。角色模式还是输入,咱们已经有变量了,对不对?那该怎么删除变量呢? 比如我们不想要灌浮这个边量,觉得他有点多余,那么我们不能够像我们 excel 当中这样子选中,你会发现压根就选不中, 在 spss 当中选中,在变量式图当中只能数列选中,横列是不能选中的。那该怎么删呢?很简单,点击左边这个方格,然后按下键盘上的 delete 键, 好了,删除成功。如果咱们把刚才那个给删错了, 哎,不想删那个,那该怎么办呢?点击一下返回键,或者是按一下键盘上的 ctrl 加 z 即可。这是一个最简单的删除 变量模式。当我们删除了一个变量以后,回到数据,试图看有东西不见了,啥呀?就是我们刚刚删除的那一个支下膏,它从原本的位置消失了。 第二部分,我们能不能更改变量的位置呢?比如现在啊,第一个是树种,第二个树高,第三个官服。 如果想要把树种给移到下面去,该咋办呢?简单,先点击下这个一,因为这个一代表的就是第一个变量, 接着长按移动放到这来,那树种变第三了,树高和冠幅变成了一和二。回到数据师图, 树种在第三列,而前两列是树高和冠符,简单吧, 该如何插入我们的变量呢?插入变量这个呀,也好吧,首先我们想在灌浮和树种之间插入变量, 那么就把冠符和树种一起选中,按下 shift 键多选,接着长按,把它往下移, 然后我们在四这里新建一个变量,就把它命名为 周期, 然后呢,他类型是数字小数位数,两位 直谋的,然后呢,缺失,哎,我们这里就把它命名为是刻度吧,标度,这样比较好做一个计量 周期。这个咱们不希望把它排在最后一位,咋办呢?长按移上去,移到树高的下面,于是周期变成了第二,冠幅第三,最后一个是树种,回到这里来 排序,正如我们所想要显示的一模一样,这就是电量的插入。 完成了以上布局之后,我们点击文件,选择另存为,因为老师不希望把原文件给覆盖了, 接着调整一个保存位置,再接下来选择保存模式为 z s z a v, 也就是 zf 格式,不需要用密码对文件进行加密。 然后这我们得要学习一个新的按钮啊,就是变量,我们点击它,看到了没有,将数据另存为变量,只有选中的变量才会被保存到指定的数据文件当中, 即使是把它保存为原文件的 cf 格式,不需要转码就可以直接打开的那一种,我们一样也可以设定到底是否把我们这个变量给放进去呢?比如现在编辑有四个变量,那保存的时候,我可不希望把这一个冠符给放进去,就可以把它的勾取消。 接下来呀,他只会保存树高周期和树种,这有什么好处呀?因为我们在编辑这些数据的时候 难免呐,总有些东西前面弄得后面不想要了,或者是你要保存多个版本,第一个版本是用来干嘛干嘛的,不能有什么,然后另外一个版本是用来干嘛干嘛的,得有什么什么之类的,但你总不能够把东西复制来复制去的吧,如果数据有几千个呢? 所以呀,这一种把数据另存为变量选择模式就很好用了, 要是便利很多,可以直接选择全部保留,然后点击继续即可。要是这四个你全都不要,那可以选择全部丢弃, 然后再选择一个你想要的,如果变量太多,可以用这个方法保证我们的课程作业能够被正常保存。我们点击全部保留,然后点击继续, 下面就可以点保存了,等待一会。现在这个 spss 正在生成日制, 日制已经生成完成了,来在这呢,这是一个完整的日制内容。首先呢,他是读取了一个什么,读取了我们打开的那个文件,叫做迪塔零三零一。 接着呢就是保存文件,是保存到了桌面上的低塔零三零一点 cia, 并且保存完成。 compressed it 本节课的内容就讲到这里,下节预告,我们将学习第二章第四课数据排序 领取软件数据。欢迎关注小金微课堂公众号,咱们下节课再见! see you next time。

欢迎来到小金微课堂 ibmspss 软件数据管理与编辑系列课程。接下来啊,我们要打开的是第五章的五杠一,因为已经开始第五章的知识啦。 至于应该如何实现我们的点立表分析已经在上节课完成,包括探索性分析也都已经知道怎么才可以把数据列表当中的多项维度通通进行生成。现在我们需要在分析列表当中比较一下平均值。 之所以要比较平均值,因为我们可以通过避难试图看得出来。此次的列表有性别、年龄、年龄段、受教育年限和储蓄金额。其中性别里面包含男女,一是男,二是女。 然后呢,年龄没有,但是年龄段有设置,小于三十五岁的、三十五至四十四岁的、四十五至六十四岁的和六十五以上的。这些呀,也都分别对应着受教育年限和储蓄金额。 我们需要对比的是不同的男女性,他们对应不同的年龄段储蓄金额分别是多少比例?如何点击分析?点击比较平均值,点击平均值 根据储蓄金额判定性别,这就是音列表和那个自变量列表。 接着点击选项。在选项当中有很多种统计方式,可以是中位数、分组中位数,还有最小值、最大值等等。单元格统计形式可以选择按照平均局来统计,可以直接按照个案数统计,也可以按照所有个案数之间的标准差进行统计。 这里的统计分析已经全部被 spss 进行内置过了。右边是选项,咱们这三个不选,按照左边这些就行。 接着是第一层的统计,统计形式就按照默认的 annova at 的统计算法以及线性相关的 调查和检验,这样他就可以在我们输出的日制表当中显示最终的生成图了。点击继续,最后点击确定,看看我们的日制是如何显示的。第一部分当然是平均值,个案整理摘要已经全部都录入进去了, 接着是平均值和个案数和平均分叉,由于偏差的这个值为什么会这么大呢? 那是因为他按照我们的总额值从最小至最大进行一个整体平均分类。 在 no 法表当中出现了一个很奇怪的现象,我们为什么会计算平方核?因为 no 法的计算方法就是通过平方核来计算他的平均值的。平方核和平均值会有一个更大的比例类, 然后通过处于某个数字再变成科学技术法,接着就可以得出他的平均值了。 相关性测量可以通过 at 算法计算出性别的比例是零点零二九,平方根则是零点零零一。 这里咱们不看,主要看一下他最后会得出什么样的结果呢?貌似这里并没有什么变化,为什么?因为我们没有对变量进行一个新建或者是重组,仅仅只是把得出来的结果通过个按表的方式进行整理罢了。 可是这整理出来也看不懂啊。至于我们应该怎么样子才可以进行重新内划生成,可以通过把它分成为 excel 格式,这样呢,外表和 相关性测量以及原来的表格当中的所有内容,就通通照搬到 excel 进去了。而且在 excel 当中还会把部分的科学技术法,比如一家等这样极贵的数字转化为原本的数值 平均值对比都是按照整体对比的,那能不能根据某个个案进行对比呢?那么这是我们下节课的讲, 下节课预告,我们将学习单样本的 t 检验, 欢迎关注小金微课堂公众号获取课件和数据,咱们下节课再见! see you next time。

欢迎来到小金微课堂 i b m s p s s 软件数据管理系列课程 今天我们要学习的是第十四课变量的重新编码。上节课我们已经学习了如何对于个案内执进行一个新的技术,然后以一个格子一个格子为单位的技术。那如何重新编码呢? 首先打开本节课所需要用到的文件,十一号文件, 接着在转换里面有三个关于重新编码的方法,一个是重新编码为相同编量,一个是重新编码为不同编量,还有一个是自动重新编码。 今天魏耀老师就要带着大家一起来实操这三种不同的方法应该如何使用。第一种,修改为相同边量,顾名思义嘛,肯定是要从一大堆的个案当中挑出合适的那些,改成同样的数字。 这次要挑选的不是我们的记录值,而是处理这个变量, 点击旧值和新值。在旧值和新值对话窗口当中,左半部分是对于旧值的筛选, 右半部分是对于新值的更改。你会很容易的发现,其实旧值的修改方式和个案的内值技术是一模一样的,只是多了一个所有其他值,指的是将全部值都改成新值。 如果仅仅只是做个案的一个技术的话,那是没有办法对于所有的职都进行概括的,因为都是挑选了,肯定得要从里面有的部分挑出一部分出来嘛。 首先选择值,接着把值设置为一,设置新值也为一,点击添加,他就出现在了这个地方。当我们的值是二 的时候,心值还是一。当我们的值是三的时候,心值是二。 当我们的值是四的时候,心值还是二?咱们之所以要这么制作,因为在处理系列当中有一二三四这四种数字, 咱们要尝试一下,如果用了旧值改新值的方法,是不是可以把里面变成只有一二两种数字呢? 点击继续在旧值和新值的按钮下面有一个如果按钮, 这是第五次看到这个画面了,他是 f 个案的判断页面,可以给我们的处理条件放一些新的条件类型,也就是通过其他更多的方式来判断 是不是要对他进行修改。点击取消点击。确定 好了,咱们已经日制完成了,查看一下处理部分, 没错,所有的歌案都变成只有一和二两种数字了, 点击转换,现在来测试第二种不同方案,重新编码为不同变量。 本次需要测试的是苗膏,把它扔进来,需要对应它的得有一个输出变量, 输出变量一定是现场制作的,咱们就把苗膏设置为一个新的输出变量,叫做苗膏。 至于这个苗高段是什么意思呢?在标签里面打上吧,虽说标签是可有可无的,但是他能够帮助我们更好的判断到底这个名称所想表达的是什么意思。 比如苗高段子就是每二十厘米就是一段 点击变化量,他就已经设定了一个虚拟变量,并且指定为秒高。 咱们已经经过之前的分析,知道旧值和新值才是需要进修改的了,如果完全不用点 本次的旧值和新值,得有点动脑筋哦。为啥呢?想看二十厘米就我一个部分,那二十厘米二十厘米的不就好多了吗?如果都凑在一起的话,肯定不好算, 既然有范围,那么重点就在于一二三这三个选项当中, 先选择范围,从最低到值,最低当然是一啦,值是二十,指的是一段之间的内容。 spss 所有的数值都是小于等于和大于等于,因此这点不需要记入他的范,他的算法类型。 将范围设置为二十,将值设定为一,点击添加。 第二个则是在已知范围内,如果二十至四十,他没有出破下一个部分,但又已经属于了新的一段范围之内的时候呢,就将值设定为二。 最后一个就是超过两段,超过四十值的,就会将值设定为三,点击添加, 点击继续 好了,数字变量转换成输出变量,就是如此, 点击确定,等待我们的日志设置完成。你会发现在苗沟的右侧 多了一个苗膏段,这个苗膏段就可以对应苗膏有多少个断截,比如三十四块八,那么它就有两个断截,一个是二十,一个是十四块八。依次类推, 点击冰凉试图。 咱们刚刚新建的苗高段是属于名义类的测量,而不是标度类的,因为他指定相为标度类,为了能够证明标度类的苗高是什么样的比例才会设定的苗高段。 同时要告诉大家的是,重新编码为各种不同变量的时候,他只会设定为名义,不会设置为标度,咱们可以后期修改。 还剩下 最后一种方式,咱们需要打开一个新的文件了,打开十二号文件, 在十二号文件当中有四个变量,分别是两串数字,一串是字母,还有一串是中文的名字, 点击转换,点击自动重新编码,这里相当于是傻瓜操作,只需要把所有的变量都扔进来,并且都给他们一个新的变量名就行。 接着啊,就设定,第一个是心变量一,这个是心变量二,这个是心变量三, 这个是新量四。 我们唯一可以手动设置的就是重新设置他的骑马点,可以是由小到大,也可以由大到小,默认为由小到大。 把将空字符串值设置为用户缺失值给打上,那是因为呀,有的时候可能会因为编辑的原因,导致部分的字符串是空的,那这个时候如果把它变成了用户缺失值,就可以减少很多的意外发生, 比如说计算错误呀,或者是把那些不该弄进去的给他同时计算进去了等等。如果是用户缺失值,就会直接属于不符合条件。 最后一个板块就是模块了,这个模板呢,可以选择两种,一个是从我们之前已经保存过的模板当中选,另外一个则是把当前模板另存为, 这都已经自动重新生成编码了,咋还有模板呢?当然是需要的,尤其是将变量变成新名称的时候,以及咱们选择的是什么变量,怎么样子进行重新重组的,都可以用模板保存。 点击确定。现在出来了,出来了四个新的边量,分别代表前面的四个边量, 前面一二,他们都是从小到大境地近排列的,这没啥好说。而变量三呢, 冰凉三年会发现他的顺序是从 a 之 z 数字逐渐增大的,不过呢,他根据当前的数字进行排列,而不是总共有二十四个,或者说有二十六个,整个数字列表当中进行随机挑选, 比如大写 a 就是二,大写 b 就是四等等。咦,怎么大写 a 就是二了呢? 别忘了,在 spsss 当中,他虽然对于毕亮明是不区分大小写的,然而他对于每一个个案都会准确的, 都会非常准确的去区分大小写,自然小写的 a 就是一,大写的 a 就是二。下面的每一个数字和每一个字 字母都分别对应着小写和大写的内容,最后一个变量就是变量四。这有好多人名啊,到底是怎样子进行规律性排列的呢? 众所周知,这些人民都有其背后的拼音,拼音都有他的字母,字母都有每个人的手机,那么这个时候啊,我们就可以逐渐的进行判断了。 打个比方说,哪一个字母越靠后,他的数字就越大,哪一个字母越靠前,数字就越小, a 就是一。那艾涛呢?艾涛他也是 a 开 开头的,自然他对应的数值是一。白城和白银他们俩呀,也都是 b 开头的, b 开头意味着啥呢?意味着他们应该排在第二位才对, 于是就有了这样的显示方式,白晨和白银他们一个是二,一个是三, 当第一个条件都相同的时候,系统会自动分析第二个条件, 臣是 c 开头,而赢是 y 开头,自然会以 c 开头二位的白臣设置为二,接着则是白银为三。好了,以上就是关于如何将变量重新编码 的全部内容,三种方法同学们都学会了吗?下节课预告,我们将学习第十五课,按等级排序 领取软件数据,欢迎关注小金威课堂公众号,咱们下节课再见! see you next time。

欢迎来到小精微课堂 ipm spss 软件数据管理与编辑系列课程。 在第三章的内容里面,我们已经学习了很多各种各样的功能了,也懂得了如何把一些东西进行整合调整,还有很多很多数据采集编辑的功能, 但是还没有实质性的进行分析呢。那么从第四章的第一节课开始,我们就要学习怎样的成 是将每个数据进行分析啦。 数据分析一般有四点,一、评测分析,二、描述性统计分析。三、参数性分析。四点列表分析 咱们会分多个不同阶段来讲,首先点击打开退回,这会要开 thapter, 四,打开四杠一的文件。 很显然,这是一个对于每个学生的性别以及语数化的各种不同成绩的统计。可是直接这么看呐,我们没有办法把它进行一个 走,点击分析,点击描述统计,接着点击频率,这会我们得把这些变量进行一个统计, 然后接下来我们可以选择一个编号,或者是选择一个数学放进来。在频率统计表当中,他是不分标度还有名义的,无论是我们的标度还是名义,都可以分别他的频率。 右侧总共有五个按钮,可以设计统计图表格式、样式和自主抽样。 首先连接统计,在统计当中他会按照百分位值和离散进行统计,百分位值可以使用四分数以及分割点,相等组和百 分位数。至于集中趋势是什么呢?因为整个列表当中不可能全部都给他弄完了,肯定有一些分散的地方,那分散的地方是平均分散,放中间分散, 整体分散还是总和分散呢? 值为祖宗的终点,这个意思就是取一个平均值,整体的值不可以超过一个中间值, 表示后沿分布,可以选择偏度或者是风度,也就是从小到大排序和从大到小排序。 离散同样也是排序的一种方式,它使用的算法不同,总共有六种标准 方差范围最小、最大以及标准误差并均值。这里我们暂时不进行深入了解。 点击图表可以看见,他默认的是没有任何图表的,也就是我们的表格,表格里面他只有数字还有行行列列。当然能够选择条形图,丙图或者是直方图, 这三种类型的图片同样也可以显示他的频率。一般呐,能够选择三种类型的也就只有频率了, 其余的不是只有条状就是只有饼状或者只有直方,因为他们的类型决定了他们使用的图表类型。另外再讲一下,选择直方图的时候, 我们是可以选择在直方图当中显示正态曲线的,正态曲线是他的整体曲线比例,一般会比直方图显示的更加准确, 我们选择无点击继续。第三格式,格式可以按照升序,也可以按照降序。可以将技术按照升序或者是技术按照降序,一个是原本的值,一个是另外技术的值。 如果有多个变量的话,我们可以选择比较每个变量之间的值,从而去确定他的排序方式。 也可以通过按照并量组织输出来确定他的拍摄方式。这个按钮禁止显示具有多个类别的表,那是在 咋回事呢?大类别的也就说明他所包含的变量很多,不过他是一个类别,而不是单个的个案。 恢复点击继续第四个按钮,样式,样式可就有意思了,他可以给我们看一下他的样例表,也就是最终输出的结果。 第一个是所有设的表,指一个完整的变量,接着是直,然后是堆,接着再是条件,最后是格式。 这种调节模式呢,是具备在所有的变量上都可以使用的表值就是基础变量,后面的值为条件格式可 绝对不是其他的变量哦,而是当前变量的所有内容,可以选择添加,可以再选添加或者是上移,在这个过程当中选择频率统计或修改其他的对比方式, 如果这个不想要了,那么就先把它删了吧。 接着在我们的自助抽样当中,可以选择直行自助抽样,然后开始激活下面所有的一些设定,比如样板书啊,算法的种子呀,还有 级别以及百分位数,车辆方式等等,这儿我们暂时不讲 好了。以上就是关于频率里面的所有设置方式了, 这里我们把语文放过来点击确定最终输出的结果,就是根据语文的比例进行输出的。 这就是关于分析描述统计里面频率的所有内容啦。除了频率之外,还有其他的很多种,比如说像可以选择描述 描述呢,也会有选项样式和自助抽样这种类型啊,他们会形成什么样的效果? 就是能帮助我们在选取并生成一个表格之前的时候,只经过我们的筛选,然后变成一个新的表格,接着你可以通过这个新的表格创建一个新的数据集, 这样的方法就会比起我们之前呐仅仅只是通过数据里面,然后进行各种各样的采集啊,转制啊,再生成一个新的文件要更好,因为他同时也有个列表出来啦,更好的能帮助我们对应, 等需要进行扩展时之后再讲。可以通过分析里面的另外一个功能,将表格和报告扩展成原本的数据集。 好了,今天的课程就 就讲到这里,下节课预告,我们将学习第十七课,描述性统计分析, 领取软件数据。欢迎关注小金微课堂公众号,咱们下节课再见! see you next time。

欢迎来到小金微课堂 ibmspss 软件数据管理编辑系列课程这节课啊,我们依旧得使用五杠一号素材, 然后开始我们的单样本的 t 检验,点击分析,点击比较平均值里面第二项,单样本 t 检验。 在单样本体检验当中检验的避量形式,我们只按照储蓄金额进行检验,但是在上一次 课程当中,我们执行的储蓄金额是使用了普通的比较平均值,他的做法是能够把我们的储蓄金额和年龄及性别的对应表通过两种算法表现出来。这次我们尝试使用年龄, 由于年龄段是一个判断值,年龄是标准数值,所以我们直接使用年龄即可 判断当前年龄的值是否是五十。接着点击选项,可以设置区间百分比,也就是按照单个的个案来进判断的话, 整体的区间是在百分之九十五符合就可以保释呢?还是在百分百才可以完全进行记录呢?或者是只有百分之二十就可以进行记录呢?这是一个执行区间,表示 他距离五十的距离,如果是完全五十的话,那可能样例就会比较少一些,接近五十一般是正负五十加五 缺失值,可以选择按照具体分析排出个案,也可以成列排出个案,一般是选择具体分析排出个案,否则就把一整列都给删除完了,点击继续。然后接下来我们的单样本已经完成,点击确定, 看看他得出来的结果有哪些。进行 t 检验的时候先进行了统计,单样本统计值完全正确, 接下来则是检验值,按照经验,五十 t 值是负点三点三六九,自由度是三百九十九,双尾是零点零零一,平均差。 他值是负二点六七八,上线是负四点二四,上线呢是负一点一一,这是百分之九十五的致信区间,所得出来的比例 会得出这样的比例,因为我们的年龄段呢,整体年龄段一般是从二十几到六十岁以上,所以他在进行分析的时候也会按照这个表格来进行分析,没有更多的对比值时,只能通过单样本分析, 最后根据他们的符合情况得出三百九十九的自由度,以及根据不符合情况得出百分之负二点六七八的值。 今天这节课就讲到这里,下节课预告,我们将学习五点三 量独立样本的 t 检验,领取软件数据。欢迎关注小金微课堂公众号,咱们下节课再见! see you next time。

欢迎来到小金微课堂 ibmspss 软件数据管理编辑系列课程这节课啊,我们依旧得使用五杠一号素材, 然后开始我们的单样本的 t 检验,点击分析,点击比较平均值里面第二项,单样本 t 检验。 在单样本体检验当中检验的避量形式,我们只按照储蓄金额进行检验,但是在上一次 课程当中,我们执行的储蓄金额是使用了普通的比较平均值,他的做法是能够把我们的储蓄金额和年龄及性别的对应表通过两种算法表现出来。这次我们尝试使用年龄, 由于年龄段是一个判断值,年龄是标准数值,所以我们直接使用年龄即可 判断当前年龄的值是否是五十。接着点击选项,可以设置区间百分比,也就是按照单个的个案来进判断的话, 整体的区间是在百分之九十五符合就可以保释呢?还是在百分百才可以完全进行记录呢?或者是只有百分之二十就可以进行记录呢?这是一个执行区间,表示 他距离五十的距离,如果是完全五十的话,那可能样例就会比较少一些,接近五十一般是正负五十加五 缺失值,可以选择按照具体分析排出个案,也可以成列排出个案,一般是选择具体分析排出个案,否则就把一整列都给删除完了,点击继续。然后接下来我们的单样本已经完成,点击确定, 看看他得出来的结果有哪些。进行 t 检验的时候先进行了统计,单样本统计值完全正确, 接下来则是检验值,按照经验,五十 t 值是负点三点三六九,自由度是三百九十九,双尾是零点零零一,平均差。 他值是负二点六七八,上线是负四点二四,上线呢是负一点一一,这是百分之九十五的致信区间,所得出来的比例 会得出这样的比例,因为我们的年龄段呢,整体年龄段一般是从二十几到六十岁以上,所以他在进行分析的时候也会按照这个表格来进行分析,没有更多的对比值时,只能通过单样本分析, 最后根据他们的符合情况得出三百九十九的自由度,以及根据不符合情况得出百分之负二点六七八的值。 今天这节课就讲到这里,下节课预告,我们将学习五点三 量独立样本的 t 检验,领取软件数据。欢迎关注小金微课堂公众号,咱们下节课再见! see you next time。

欢迎来到小金微课堂 ibm s p s s 软件数据管理与编辑系列课程。在上一节课,我们已经知道如何把文件进行拆分了,在拆分的时候会提取出我们所需要的文件内容,这一次则需要选择个案。 个案在我们的列表当中有很多,往往会因为数据过于庞大,需要挑选出特定的选择项的时候,不能仅仅用搜索,你看这有个搜索功能,当我们把个案输入进去之后,可以通过这种方式 搜索单个的个案。当然呢,我们要有一个更好的功能,把分类内容进行提取。首先打开咱们今天要用的文件, 这是一个关于慢性咽炎病患者的相关数据,有年龄、性别、身高、体重、抽烟和,可以帮助我们分类呢。点击数据这有个选择个案,打开它 在选择个呢窗口里面有很多东西,这次呢我们就不需要进行选择了,直接用它标准的编号就行,通过编号进行筛选, 选项有很多,首先第一是所有个案也是默认的,因为咱们不需要进行筛选吗?所有个案都统计就行了。 第二个是如果调节满足,什么是如果调节满足呢?点击这个如果按钮, 这看起来像个计算器,其实鄙视他只是一个函数组, 当我们输入一个内容了以后,点击这个按钮,他就转移了过去,下面咱们可以开始判断他到底是大鱼还是小鱼还是大鱼等于小鱼等于 或者是少于,或者是成语什么不等于什么一样,什么语什么等等。然后再关联一个数字,或者是关联另外一个, 看看是不是很像罗纪夜飞呀? 这就是如果条件满足,在满足某条件的时候,他就会在我们 列表当中显示出来,其他的会有一个画叉叉的效果。第二种方式,随机选择个按样本,这个随机呀,当然是计算机计算出来的随机, 随机有两种类型,一种是大约,一种是正好为,大约是可以设置百分比的。比如一千个个案当中,我们可以设定百分之二十就是两百个个案,然而他有可能是一百八至两百二之间。 如果我们选择正好围的话,就是设定一个区间范围,第几个个案和第几个个案之间。 例如我们可以设定为第十个个案至第二十个个案之间,这部分个案呢,就是被保留的,其他的就删掉。 第三,基于时间或个案范围,点击范围,他会根据某一个部分进行观测, 判断依旧是有,但是他只针对一部分观测,例如总共有两百个兵量,但是我们不要指两百个个啊,我们是要从第一至一百个,其他的删了。 以上就是关于我们如何选择个案的条件, 这一次我们用来测试,如果条件满足,点击如果,然后把年龄扔进去,如果年龄 小于四十的,还有一个呢?我们应该用到其他的语句了。这儿顺便科普一下 下,这个是货,这个是河,那咱们这里需要用的是河,所以先把这给删了, 选择两个 at。 接下来还有一个就是性别,把性别放进来,性别等于等于要使用双等号, 等于什么呢?男性,所以是零。好啦,我们设定的规则为年龄小于四十,并且是男性,那么就筛选出来,其余的呢?暂时删除,点击继续。 比如我们先把年龄放进来,判断年龄是否小于四十岁,如果小于四十岁的就 保留,大于四十岁的或者是等于四十岁的会被暂时删除。如果我们希望导入其他的条件也可以,比如可以导入性别或者是身高,然后再进行二次判断男或女,如果是男就是零,如果是女就是一, 接着点击继续。咱们已经创建好样本了,假如选择随机各样样本, 则可以设置大约为百分之五十,也就是所有个案当中的一半。 如果是选择基于时间范围,则可以设定为第一个变量是一,最后一个变量是十,咱们只在一至十个变量当中进行观测。 如果是使用过滤变量呢?现在点击一个导入,这个导入有编号,年龄、性别、厘米、公斤,抽烟和慢性咽炎,可以选择任意一个给他导入进去。比如咱们就不进行身高 的那个计算和识别,只进行其他部分的除身高之外的识别 限定测试的,只选择如果条件满足,下面是输出方式。第一种,过滤掉未选定的个案 过滤,刚才老师开始是讲了,就是用个叉叉划掉,但是他依旧保留在上面,如果想取消时,点击所有个案即可。第二个,就是选定个案复制到新数据, 这个选项我们已经是第二次见他了,因为新的数据集就是把采集出来的这些不被过滤的部分放到新的文件当中,以便于进行新的采集或者是二次过滤。 文件的数据及名称可以提前设定,后期直接保存即可。第三个就是删除未选定的个案, 这个需要谨慎处理,如果咱们确定确定无疑在进行了整体的筛选之后,那些不被选中的部分真的不需要了,这辈子都不需要了,那么我们就可以直接删除 之后他就不会存在这个文档当中。之所以这么跟大家讲,那是因为他是无法撤回的,要是你保存了,就真的撤回不了了。现在我们选择过滤掉未选定的个案, 点击确定好了,现在已经完成了筛选。 完成筛选之后,看到这有一个斜线了吧,斜线那就意味着他是不被选中的,为啥呢?你看年龄,他是四十四岁,大于四十了,这个呢,四十七岁也大于四十了,所以这两个就被划掉了。下面的只要是符合 大于四十的这个条件,就都会被划掉,你看这里有好多。 点击数据回到选择个案,我们尝试第二种方式,也就是随机个案样本, 这时他会从现有当中随机抽取百分之五十的个案,你不用担心前面的这些,因为这些被删除的地方 在我们重新选择之后不会被二次计算。点击确定, 这里是日志啊,日志已经选择了大约五十个个案,来看看效果, 这么抽起来好像好像我们选的是超过五十个了,但实际上差不多,因为你看啊,这是七十,总共有七十。然后呢,在七十个个案当中,大约有三十至四十个个案是会被删除的,毕竟它是一个浮动比率。 再次点击数据,选择选择个案,然后基于时间或一个个案范围内,我们尝试一下这个方式, 他会从一至十当中挑选,点击确定,你看除了一至十之外,其他的 所有全部都被划掉了,只保留了一之十。 这次我们再测试下一个部分,使用过滤电量,点击确定, 现在已经干挑选完成了。在挑选的过程当中,我们基本上没有办法太多变化,但是之后在调用时,你会发现身高不能被调用了。为啥?因为他已经被删除掉了,不可被调用。 接着我们再回到选择更案,看看删除未选定的更案,然后重新回到。如果条件满足,年龄小于四十,看看是不是那一些大于四十岁的全部都被删掉了呢? 好了哇,少了很多,只剩下三十八个了,那也就意味着其中一共有三十二个部分都被删了。这些个案都是大于四十岁的年龄 闲置成功的。当我们按下返回按键的时候,他没法操作,因为删除后是无法撤回的。 如果我们不希望刚才的删除被保存的话,可以直接取消关闭我们当前的文件,然后选择不保存即可。 好了,以上今天的内容就讲到这里,下节课预告第十一课,个案加全领取软件,欢迎关注小金微课堂公众号,咱们下节课再见!

欢迎来到小金威课堂 ibm s p s s 软件数据管理与编辑系列课程在上节课我们已经学习了如何将数据进行分类和汇总, 包括怎么把它进行提取。那现在就要讲讲怎么把文件进行拆分。汇总的时候是需要把他们分级分成几个部分,然后重新进行排列, 而拆分呢,则是完全提取。首先打开我们本节课需要用到的文件,依然是三杠六, 打开文件, 点击数据, 点击拆分文件, 现在就是拆分文件的页面了, 默认的时候为分析所有个案,但是不创建组,为啥呀?因为我们在没拆分时,所有的东西都是按部就班的放在他原有的位置上,他也不会有什么新的组合。 但如果我们希望得出一个新的文件类型的时候,就可以点击比较组,他可以把当前的文件分成几个部分进行比较 来,现在就把性别学生类型给扔进来。 下面有一个按照组来组织输出,这是啥意思呢?按组来组织输出,那就是根据当前的一个组合重新编之后输出。 我们先使用比较组,剩余的由按照分组变量进行文件排序是建立在当前的排序基础上,重新分组后,分两个元模块进排序。 而文件已排序呢,就是指当前的文件已经完全排序好了,剩余输出的就是按照顺序排在下边,而不是并排放。 咱们选择默认的按照分组变量进行文件排序,点击确定 好,现在已经输出出来了,发有这个三杠六的,创建了两个部分, 一个是性别的学生类型,一个是性别学生类型的耶,好了, case a split 完成了,我们看一下结果。 当前分析好了性别和学生类型, 我们看一下他是怎么排列的, 变整齐了,一二都是组合起来的,而不是参差的。可是现在分好类了,咱们要是不想继续分类了怎么办呢? 那么先看看右下角,右下角有一个拆分依据,为性别和学生类型,也就是说,现在文件是拆分状态的。点击数据,回到拆分文件, 点击分析所有个案,不创建组。那现在啊,接下来无论我们做什么操作,他都不会再按照组进行分类了。点击确定, 你看拆分组关闭右下角已经没有这个提示了。然而我们的性别和学生类型却还是拆分之后的亚子, 这就说明什么呢?说明在我们的类型被拆分之后没法复原,只可以说停止当前状态,包括按下 ctrl 加 z 或者是按下回车键也都是不可以的。 只有把当前的这个文件关了,并不保存,重新开启,才可以恢复原来的样子。 好了,以上就是本节 课如何将文件进行拆分的所有方法,下节课预告,我们将学习第十课,选择个案 领取软件数据。欢迎关注小金微课堂公众号,咱们下节课再见! see you next time。