粉丝3.9万获赞9.3万


下面呢,我们来讲解第三章比较平均值分析,这一章的内容呢,总共分为五节, 分别是呢,平均值分析,单样本体检验、独立样本体检验、成对样本体检验以及单因素和诺检验。 其中呢,这个第五节的内容呢,在很多的教材当中呢,把它放入到了这个方差分析那一章,但是我们啊,呃,不难发现,有一个特点,就是其实在 spss 当中啊,大家看一下, 它是放在这里边来的,对吧?所以说呢,从 sps 的这个框架来说啊,它应该是放到了比较平均值这么一个分析当中啊,在这个框架当中来进行讲解啊,所以说呢,呃,这一块呢,我是需要给大家提醒一下 啊,大家这个要知道啊,这一块的内容呢,我们放在这来讲,相应的在房产分析部分呢,我们就不讲了啊,因为呢,我们要跟我们这本书呢,是讲解 spss 的是吧,不是讲解统计分析的,当然呢, 这个肯定会兼顾统计分析嘛,因为前面我也讲过 spss, 它本质上就是统计分析方法在系统中的实现,是吧,通过软件的一种集成,便利了大家的操作啊。所以这一块呢,跟大家需要说明一下, 如果样本数据只有一组,那么通常会遇到均值比较过程和单样本体检验均值比较过程呢,其实就是这个平均值分析啊,这是一个事啊,如果说是样本数据有两组,而且 两组样本是相互独立的,那么呢会通常会用到独立样本体检验,如果样本数据有两组,而且两本两组的样本啊,不是随机独立的,那这个时候应该怎么着啊 啊?应该是可能就用到成对样本的体检验,如果样本数据是两组以上,比如三组、四组,是吧?这时候就最好是用到这个 adobe 检验。 我们的这一章的教学重点呢,首先我们一定要知道这五种分析方法,他自己的特色是什么,能解决哪些问题,更重要的是要知道他的使用条件是什么,他,对啊,对这一个相应的这种数据有没有一个要求对不对? 再一个呢,我们要掌握他的一个窗口的功能,特别是呢,要知道呃,怎么去根据我们的研究目标来在 菜单当中进行相应的设置,是吧?去勾选哪些框啊?然后呢,再一个就是说一定要会对这个比较平均值分析的结果进行一个解读啊,这个在结果输出界面,大家都知道这每一个结果到底是什么样一个含义 啊?到底这个显著还是不显著啊?不显著是拒绝人假设还是接受人假设啊?等啊,这些东西呢,都是很重要的啊,只有把这个结果会解读,并且解读准确,而且表述清楚了,这样的话写出来的研究结论才是高质量的。 首先呢,我们来介绍第一节平均值分析,平均值分析的特色啊,他在于将因变量、按因子变量分组输出均值以及其他统计量,还可以呢,或者单因素防查分析和相关性测量 啊,我们看一下数据三点一 平移值啊,然后呢,我们的这个 我们是要要进行哪一块呢?是今针对这一个工资这一块,是不是啊?我们的这个数据啊,是中国二零一九年部分行业城镇私营单位就业单位平均工资数据呢,来自于我们的国家的统计年件啊, 然后呢有三个变量,包括省市行业以及平均工资,这个地方我们把这个平均工资来来 可以看一下,然后呢看一下行业作为资源量, 这其实就研究一下这个不同行业的这个平均工资是不是存在着显著的不同,是吧?呃,选项里边啊,我们把这几个作为单元格统计的这个指标,第一层的统计量,这些可以都选上, 其他的呢,我们采用系统帮你设置。这儿我再给大家说一遍,就是说 啊,我们的选项其实里边你看内容很多,还有就是我们的央视里边这个,呃,叫什么呢?叫叫这这这几个选项啊,具体什么样的含义,我这不再追述了,教材上都有, 但是大家一定要掌握住,而不是说仅仅是跟着我学会的操作,哐哐一点,一看结果完事啊,就我为什么这么点,为什么要要要要选这个东西,这是更重要的啊,这也是很多新手容易犯的错误,也是很多教材上他没有没有考虑的读的这一个需求啊。我这边呢都想到了, 就是说这个把把的,这这个相关的选项的具体的含义啊,都给大家剖析的很很到位,很全面。单击确定这个参与分析的样本数是九十个,没有确实值 啊,这个描述性统计分析报告包括平均值个按数和标准差分行业的,这个是最重要的,这是这个核心的一个结论, 这说明什么呢?看看哪个地方呢?这个大家有没有会不会看看这个地方啊?主要是看组建, 组建呢,就是不同行不同分组啊,我们这叫分组,相当于把行业分了这几个组,是不是 啊?这个组间呢,就是不同的组之间,也就不同的行业分立之间,他的这个显著性水平不显著,因为他大于零点零五,他越大越不显著, 所以说呢,就是说是他没有什么显著的差,没有什么差别,也就说不同行业他的平均工资水平啊,都差不多,呃,或虽然小有差异,但是没有那么大,所以说呢,或者说这个大的这个差异也不构成统计学上的显著性,是吧? 啊,就是说这个行业的工资啊,不同行业间啊,没有那么大的差异。这是我们的研究结, 下面的是我们的相关性测量结果,它里边的包括这叫负相关系数,而这个呢是叫科学系数,表示的是他的这个解释能力。关于这个公式啊,这个相关的公式啊,我的教材都列了, 这个呢,是依他系数,依他系数呢,是衡量分类变量与连续变量的相关性程度啊,还有依他系数的平方啊 这一块呢,这都是说明我们行业分类啊,与平均工资之间的相关性比较弱啊,也体现在这些数都不高,都不大,也就说不同行业的平均工资差别不够显著。 好了,以上呢,就是我们三点一节的这个全部的一个讲解,我就讲解了这个地方,谢谢大家。

我们这节课正式进入到资料分析的学习啊,在上节课当中呢,我们给大家讲过了,说资料分析啊,就是在考察报考者对于数据的综合理解与分析加工能力。 既然我们资料分析是围绕数据展开的,那我们就要理了解一些基础的统计概念啊。那我们先来看第一个概念啊,叫量与率。什么叫量呢?我们看他的解释啊,说指有一定计量单位的绝对数 啊,及有单位的数据啊,那人家告诉咱了,其实就告诉我们,有单位的数据我们就管他叫量啊,有单位的我们就管他叫量。什么叫率呢?指两个相关的数啊,这两个相关的数实际上也就是我们刚刚说的那个 量呗。啊,两个量在一定条件下的比值。好,那既然是比值,就说明他是没有单位的了,对吧?然后在资料分析当中,一般以百分数的形式存在。 我把这两句话给大家去总结一下,其实说白了就是有单位的数据管它叫亮,没有单位的数据我们管它叫绿啊。那我们来看一下, 如据国家统计局数据显示,二零二一年,我国研究与实验发展经费支出二七八六四亿元,同比增长百分之十四点二。 在这句话当中呢,出现了两个数据,对吧?一个是二七八六四一元,一个是百分之十四点二。那很明显,前面这个数据他是带单位的,是一元,所以说他应该是一个量。 量啊,有单位的数据他叫量。百分之十四点二呢,他应该是一个率,没有单位吗?没有单位他应该是一个率,在国内生产总值之比,然后两个数之比,那他应该是一个率,对吧?没有单位,然后研究经费 幺六九六一元啊。带段位他应该是一个量啊,这就是量和率, 有单位的数据叫亮,没有单位的数据叫绿。好,那我们看第二组啊,是限期与机期啊。什么叫做限期呢? 值与机器相比较的时期啊?那通过这句话我们其实就能够得到啊,说限期和机器他俩应该是成对出现的,你与机器相比的那个时期才能 能称作限期,那没有机期的话,你也就没有限期了,对不好?那什么叫机期呢?指比较时作为参考标准的时期 啊,那还是两个东西去相比,对吧?其中一个叫限期,一个叫机期。好,那假设我直接给你个二零二三年。好,那我问你,他是限期还是机期呢? 有同学就说了啊,那今年是二零二三年的,二零二三年应该是限期,对吗?不对, 因为我刚刚给大家说了,说限期和机器他俩应该是成对出现的,而且机器也告诉你了,说在比较时作为参考标准的时期,那就说明限期和机器他俩是一个比较关系。单独给你一个时间的时候,我那他是没 没有所谓的限期和机期的,因为他只有一个时间啊,是不存在比较关系的呀,对吧?所以说我们是他就不是限期,也不是机期。好,那如果我说二零二三年比二零二二年 多多少少多少,那是不是就出现两个时间去比较了呀?好,那这时候我们判判断一下,谁是限期谁是机器呢?人家说了,机器叫做什么比较时作为参考标准的时期。好,那二零二三年和二零二二年谁是参考标准啊? 二零二三年比二零二二年,我们是拿二零二三年去和二零二二年去比较,那应该是他是参考标准,对不对?他是一个标准,所以说我们拿二零二三年去和他比,是这样吗?啊,所以说二零二 二年他叫机期。好,那么二零二三年他就是限期了。好,那我们刚刚啊,给大家说了,为什么?不,不,为什么不是说今年是二零二三年,今年就是限期呢?啊?那如果人家考试这样出题呢?二零二二年 比二零二三年多了,少了多少?那你就会发现,哎,这回参考标准是谁了?二零二三年所以说他叫机期,二零二二年他应该叫限期,所以说并不是哪年离现在近,哪年就是限期 啊,应该看他们的位置关系,看他们谁拿谁去比。我们可以简单的总结一下,你会发现比字前边的叫限期,比字后边的叫及期,是限 期。比机期怎么样了?所以说比前叫限期,比后叫机期,我们这样记就可以了。然后人家又说了,说描述限,那个限期的数值叫做限期值,描述机期的数值叫做机期值。好,那我们来看一下, 二零二一年某省粮食播种面积是六四二点九万公顷,还是我们只看前一句话的话,你是不知道他是限期还是机器的,或者是说他压根不存在限期和机器。 好,那接着比二零二零年的六三八点九万公顷增加了四万公顷。好,那这回就出现比较关系了,是二零二一年比二零二二年,我们刚刚说了,比前边叫 限期,比后边叫机期,所以说二零二一年应该叫限期,二零二二年 应该叫机器。好,那么二零二一年的播种面积是六四二点九万公顷,他就是限期值呗。啊?六三八点九,他啊万公顷,他就应该是机器值了,对吧?啊?所以说你要这块你要记住的就是比前边的叫限期,比后边的叫机期 啊,没有比较关系,是不存在限期值和机,不存在限期和机器的好,那同样也不存在限期值和机器值了,对吧? 好,我们看下一组概念啊,叫增长量和增长率,看到这我们就能够知道,哎,增长量他应该是带单位的,增长率应该是不带单位的。为什么呢?我们在第一组概念的时候学了量和率,我们说有单位的数据叫量, 没有单位的数据叫率啊,那么增长量,那肯定是有单位的,增长率,那是没有单位的啊。那 什么叫增长量和增长率呢?我们具体来看一下增长量,限期值相对机器值增长的量,那其实说白了就是限期值比机器值增长了多少啊?限期值比机器值多多少? 那我有十个苹果,你有五个苹果,我比你多多少啊?十减五就出来了。好,那同样道理,人家问说限期值比机器值增长了多少啊?那就是限期值减机器值就完事了 啊,那么相减的话,他一定是有单位存在的,对吧?所以说增长量就等于限期值减机器值啊,他是有单位的啊,那什么叫增长率呢?限期值相对机器值增长的百分比, 翻过来就是限期值比机器值增长的那部分,占机器值的百分之几。 限期值比机器值增长的那个部分呢?是不是就叫增长量?就是限期值减机器值啊, 占机器值的百分之几,我们要比上机器值乘上百分之百,因为我们要求一个率吗?对吧?你要乘上百分之百, 那因为百分之百就得一了。所以说我们计算的时候就不用管他了,学那个真正考试都是选择题,他又没不不用写计算步骤啊,我们这个就不用管了。所以说你要记住了,增长率就是什么限期值、减期期值除以期期值 啊,限期值减机器值,他是增长率啊,我用向上的箭头表示,增长啊,那增长啊,增长增啊,限期值减机器值,他就是增长量啊,说错了,增长量比上机器值啊,他就是增长率啊,那增长率我们要知道他是没有单位的,没有单位 我们也管它叫做增速啊,增速,增长率也叫增速,然后呢,如果说增长率为正数的时候,那增长率为正数,我们知道它肯定是增长了,对吧?那增长的话,我们管它叫增幅 啊,我们也管它叫增幅。好,那如果增长率为负的的话,那肯定是下降了,我们管它叫降幅 啊。所以说大家一定要知道,人家说增速,人家就说增幅,人家说降幅,然后呢?都是在说增长率啊。 好,那我们来看一下,二零二一年某省粮食播种面积是六四二点九万公顷,比二零二零年的六三八点九万公顷增加了四万公顷。那我们刚刚已经知道了啊,说二零二一年他应该是几限期?二零二二,二零二零,他应该是 集齐六四二点九,是限期所对应的值,他叫限期值。六三八点九,他应该是集齐值。增加了,那肯定是增长啊,增长量还是增长率呢?一看带单位,那应该叫增长量啊, 增长了,那肯定是增长量或增长率。一看后边不带单位的百分数,那应该叫增长 率啊,这就出来了,对吧?啊?这就叫增长量和增长率。你要知道的就是增长量有单位增长率,没单位增长量,他等于限期值减机器值。增长率他等于限期值减机器值除以机器值。 然后你还要知道,增长率又叫增速,又叫增幅,又叫降幅啊,又那个 可以用啊?可以用征服和降服来表示啊。下一组同比和环比啊。什么叫同比和环比呢?我们先来看这个例子啊,说,据国家统计局表示,二零二一年我国研究与实验发展经费支出二七八六四亿元,同比增长百分之十四点二。 好,同比增长百分之十四点二,咱得知道同比,你是跟谁去比啊?是二零二一年跟谁去比增长了百分之十四点二呢?我们看一下这个概念,他说呀,以最大的时间概念为标准,向过去循环一个周期进行比较, 以最大的时间概念,那我们看这里出现的时间是谁?二零二一年,对吧?啊?那最大的时间概念,那只有年了呀,对吧?人家只给出年来了啊。 好,那我们就要把这个最大的时间概念往过去循环一个周期,那你这个年的话是不是就要往过去循,往过去循环一年啊?好,那二零二一年往前一年就是多少就是二零二零年啊, 所以说你要知道同比增长百分之十四点二,啥意思呢?就是二零二一年比二零二零年增长了百分之十四点二啊,为什么比二零二零年呢?是最大的时间概念往前一个周期进行比较 啊。可能这道题只给出了一个时间概念,你不太好理解啊,如果这道题我这么出,二零二一年七月同比啊,这是七月同比争 涨百分之十四点二。好,那同比增长百分之十四点二的话呢?我们看一下,这里给出的时间是二零二一年七月,时间概念有一个年,有一个月,那最大的肯定就是年了呗。好,最大的往前一个周期,那就应该是二零二零年 七月,所以说二零二一年七月同比增长百分之十四点二,翻译过来就是二零二一年七月比二零二零年七月增长百分之十四点二。 好,那我要把它改成环比。什么叫环比呢?是以最小的时间概念向过去循环一个周期进行比较。好,那二零二一年七月这里最小的时间概念就应该是月了,对吧?好,那往前一个周期,那也就 是往前一个月,二零二一年七月,往前一个月,那是二零二一年六月, 对吧?所以说二零二一年七月环比增长百分之十四点二,你翻译过来就是二零二一年七月比二零二一年六月增长百分之十四点二 啊。所以说同比和环比,你去看题的题干当中给出的时间概念是是什么啊?同比就是把大的那个概念往前循环,一循环一个周期,环比就是小的那个时间概念往前循环一个周期。我们来练习一下, 说二零二三年七月同比,是跟谁比较呢?我们就要看一下,给出最大的时间概念,应该是年啊,同比要把最大的时间概念往前一个周期, 那就是往前一年,二零二二年七月。环比呢,就把最小的时间概念往前一个周期,就把七月往前一个月,二零二三年六月 啊,那接着看二零二三年第二季度同比,那这里也给出了两个时间概念,对吧?一个是年,一个是季度啊,那么同比的话,应该是最大的时间概念,往前一个周期呢,就是二零二二年第二季度。 环比呢,你要把最小的时间概念往前一个周期,那就是第一季度了呗。二零二三年第一季度啊,这就是环比。好,那么第第三个啊,二零二三年同比呢,只给出一个时间概念, 最大最小都是他呀,那是不就是比二零二二年啊?一般情况下只给出年的话,他也不考环比,那考环比的话,出现环比了,那他就是二零二二年呗。那这块你要注意一下,题干当中有没有给出月份的信息,如果给出月份的信息的话,我们就要往前一个月了。你看题干当中给出的信息是啥 啊?这个是同比跟环比哈,我们继续再看下一个概念,百分数和百分点啊。什么叫百分数呢?表示一个数是另一个数的百分之几,它本身是一个相对数,表示为百分之 x。 那我们前面学的那个什么增长率啊, 占比呀,他是不是都是一个百分数啊,对吧?啊?那百分数和百分点其实我们现实生活中也都接触过,对吧?例如说百分之十和十个百 分点啊,大家其实都知道十个百分点和百分之十,它俩数值上是相等的,对吧?但意义是完全不同的。百分数我们刚刚说了,它表示的是一个相对数啊,表示的是百分之几啊,百分之几,那我们前面 通过我们前面来看啊,他应该是在我们统计数据当中,他应该是一个以一个率出现的,对吧?我们前面的增长率前面的占比啊,他都是一个率出现的啊,那什么叫百分点啊?说指不同时期以百分数形式存在的相对指标,如增长率比重的变动幅度, 是用于表达不同百分数之间算数差距及差的正确单位。我把它翻过来,其实就是两个百分数做差之后的单 位。百分点他是一个。什么是一个单位啊?十个百分点,你这十个百分点啊,他这后边这个,我们说的百分点是后边这个单位是一个数加上一个单位,那他应该是一个什么?他应该是一个量啊, 对吧?我们刚刚说百分之十占我们这个前面数据,他说表示都是什么都是一个率啊,是这样吧。 啊?那然后人家也告诉你了,百分点是什么?百分点是两个百分数做差之后的单位, 所以说你这十个百分点咋来的?他应该是这么来的,应该是百分之二十啊,这个百分数比百分之十这个百分数多了多少?十个百分点,他是两个百分数做差之后的单位啊, 而你这个百分数它是一个率啊,那这个越说越糊涂,我们来看一下这个练习啊, 说二零一九年一到八月 l 省社会消费品零售总额九八四六点六亿元,同比增长百分之 六。啊,那我们看一下啊,二零一九年一到八月同比增长百分之六。 no, 问你谁是限期,谁是机器啊?他肯定是存在比较关系的,对吧?啊?那我们看一下,这里给出二零一九年同比,那么二零一九年一到八月,他是不是就应该是限期啊?那同比是跟谁比? 应该是二零一八年一到八月,应该是最大的时间概念往前一个周期嘛。啊,所以说机器应该是二零一八年一到八月,对吧?给出限期值 是九八四六点六,给出同比增长百分之六,这叫什么?这叫增长率啊。好,那然后人就问,若增速比上年同期加快两个百分点,上年同期是多少?上年同期是不是就是二零一八年一到八月 啊?若增速,增速是不是就是增长率?说若增长率比上年同期加快两个百分点。好多同学没有学过百分数和百分点的时候,大家就会把这块理解,为什么呢?二零一八年一到八月的增长率就是百分之二,对吗? 对,两个百分点和百分之二,他俩的意义完全不同,对吧?百分点是什么?是两个绿作差之后的单位。那这句话说增速比上年同期加快两个百分点,那是不是说今年的增数是多少?一九年一到八月的增 是百分之六,说今年的这个增长率啊,比上年多了两个百分点,那是不是就是说今年的增长率减去去年的这个增长率,他应该等于两个百分点啊,是这样吗?所以说去年应该是多少?去年就应该是百分之四啊, 对吧?大家更大家一定要知道他,他不能直接表示增长率的,好多同学都会看到他直接把他认为是去年的增长率了。不是的, 他是指今年的增长率比去年多了两个百分点,所以说去年应该是百分之四。好,那同样道理,看这说若增速,那也就是说若增长率比上年放缓,是不是就是少了呀?就慢了,慢了是不是就小了?也就是说若增速比去年小两个外文百分点,那去年是多少啊?那就是百分之 八呗。今年是百分之六吗?比去年小了两个百分点呢?去年的增长率就应该是百分之八,对吧?啊?这个是啊,两道例题,我们再练习一下。 若征服啊,征服是什么?我们刚刚给大家讲了,说如果增长率为正值的时候,那就说明它上涨了,对吧?上涨的幅度,我们管它叫征服,也就是增长率 啊,那征服比上年同期提高了两个百分点,那也就是说我现在征服是多少?征服是百分之六啊,比上年提高了百分点,比去年多了两个百分点,那去年是不是就百分之四啊?也就是一八年是百分之四 啊?说若征服比上年下降了两个百分点,今年是百分之六,比去年少了两个百分点,那去年就是百分之八呗。啊,这块哈,大家可能都没有太大的疑问啊,关键啊,我们往 往后看了哈,这回啊,变了啊,变了,题干就变了,说二零一八年社会消费品零售总额是九八四六点六一元,同比下降百分之六。好,那我问你,下降百分之六,你告诉我它的增长率是多少?你先告诉我它的增长率是多少? 增长率是负百分之六,因为他下降了吗?所以说增长率得为负数啊。增长率为负百分之六 好说。若增数比上年回升,回升是不就是说比上年上一年多了啊?那也就是说负六比去年多了两个百分点,那去年是多少是负百分之八呀? 对八,负六是不是比负百分之八多了两个百分点?好,若增数比上年同期回落,回落是不是下降了? 比上年下降两个百分点,负六比上年少了两个百分点的。上一年负四呗,对吧?上一年是负四,所以说比他再少两个负四,再减二,那就是负六了啊。这个是,呃,增长率下降的啊。那我们继续再往下看 啊,还是这个下降百分之六,增长率是负百分之六,然后人家说降幅比上年扩大两个百分点。首先你要知道什么叫降幅是下降的幅度啊?那我问你下降百分之几啊,你告诉我下降了百分之六啊。所以说你要知道降幅是多少, 降幅是正百分之六还是负百分之六呢?降幅应该是正百分之六,降幅应该 是正百分之六。为什么?我因为降幅刚刚说了降幅是下降的幅度,我问你下降了多少,你得告诉我下降百分之六,对吧?你得说下降百分之六,这叫降幅啊,下降了百分之六, 是这样吧。好,那我问你下降了多少?你不能告诉我下降了负百分之六,那下降他本身就已经表示负号了,你用负百分之六,他不就得正了吗?对吧?所以说大家你一定要知道啊,你这个下降已经就表示负号了,所以说人家问降符,降符他就是百分之六 啊。由此也可以看出,那个征服和降服他俩一定是正数啊,一定是正数,他应该是增长率的绝对值,因为征服征就表示正号了,对吧?降服降 他就表示负号了啊。增长率为正数的时候,他就是增幅啊,他就是上升增长率为下降为负数的时候,那就是下降,那他就应该用降幅来表示,所以说降幅是百分之六啊。 说了这么多,想告诉大家的就是降幅他是百分之六。好,降幅比上年扩大了两个百分点,比上年扩大了两个百分点,那也就是说百分之六,比去年多了两个百分点,那去年的降幅是多少?百分之四呗。 好,降幅是百分之四,那增长率是多少?负百分之四呗。是这样吗?人家问的是什么?是同比增长百分之几,人家问的是增长率,人家问的可不是降幅。如果人家问你降幅,那应该是多少?百分之四,人家问你增长率是多少?负百分之 四,因为是下降了。好,若降幅比上年同期收窄,收窄收窄是不是就是减小?好,那我刚刚说了,降幅是百分之六,百分之六比上年减少了两个外文点,那上一年是不是百分之八? 上一年的降幅是百分之八,降幅那就是下降了,所以说增长率为负的是负百分之八啊,这就出来了 啊,说了这么多啊,这个大家需要注意的就是第一个,你要知道百分数和百分率,不是说啥呢,百分数和百分点啊,他俩数值数值相等意义完全不同 啊,百分数是个绿,而百分点是两个绿作差之后的单位。然后你要知道的第二个事就是啊,我们这个 增速他等于增长率啊,但是呢,这个增幅和降幅啊,他表示的是增速的绝对值,表示的是增长率的绝对值。 好,当增长率大于零的时候啊,我们用增数增幅来表示,如果增长率小于零的时候,那他就下降了,我们用降幅来表示啊,他们两个都等于增长率的绝对值 啊,这个是我们学习这个资料分析你需要先掌握的一些基础统计概念啊,我们在下一课啊当中啊,在下一节,下一节课会正式给大家讲到资料分析的概念和公式啊。

这个视频我们来讲一下变量的相关关系,那么什么是变量的相关关系呢?啊?他的概念,第一个他的概念。什么是 相关关系啊?他的概念,那概念呢?就是,呃,两个变量如果有关系,但是 有没有确切到可有其中的一个去精确的决定另一个的程度,那么这样的我们就是相关关系,他相对应的我们是函数关系,那么函数关系,那么一个自变量 x, 呃,那 函数值呢?外呢?就唯一的外与值对应啊,唯一的外与值对应,这这个是很确定的,能够精确的决定另外一个,那这是函数关系而相关关系, 这说两个变量有关系啊?有关系,但是还是,呃,还没有确切到可有其中的一个去精确的决定另一个的程度,那么我们把它称为相关关系啊,相关关系,这是他的概念, 那比如说我们这个这个图,那么这个是横坐标呢?是年龄,这个随机变量啊,那么 上面呢?是,呃重坐标呢?是个脂肪含量,他的变量,那他的变量,那么他这个图呢?我们采集的数据呢?这个图呢?我们叫散点图啊,散点图把数据以点的形式标出来 啊,我们采集的数据,采集的数据也就是当二十多的时候啊,这个年龄是二十二十三的时候,那么他大概就接近一 十,脂肪含量百分之十啊,我们采取,我们经过抽样啊,我们做了这个这样的数据,把这个数呢标在图上面,那么就是三点图,而这个从这个三点图里面我们可以看到,这假如说我这个年龄我瘦成 x, 那么这个脂肪含量是万, 那么这个就是 x 随着 x 的增加,那么根据这个数据呢,它是 脂肪含量外呢也是增加的,那么我们把这个就说这两个 xy 呢,是正相关啊,我们叫正相关, 正向观,那如果要是弱,这是正向观啊,若,如果 x 随着 x 增加,那么 y 呢?有明显的趋势是降低的,那我们叫 父相关啊,我们叫父相关。那那么什么是?还有概念就是线性相关。线性相关是什么是线性相关呢?那么就是 两个变量的曲值呢?成正相关或者负相关啊?两个变量取值成正相关或者负相关,则这个散点 啊,这三点落在一条直线的附近,那我们就叫做线形相关。比如说这个, 这个我们他是很明显的啊,他是在一条直线,这些散点,这些点呢,是在一条直线的附近,我可以画一条直线啊,他是在在一条直线的附近。那我们就说像这个年龄和这个脂肪含量,那么就是 正向啊,正相关,并且是线性线性相关啊,线性相关还有一个概念呢,我们叫非线性相关,非线性 相关,那么飞向性相关或者叫曲线相关 啊,曲线相关。那什么那,那这个的概念是啥呢?就是两个变量具有相关性,但是不是相线性相关啊,不是线性相关呢?那我们就说非线性相关呗。啊,比如说我们画一个图啊,比如说这样的一个图, 那你他的散点图了,大概是这样的,哎,往下走了啊,那不是他,他这个 这边是个直,可以可以看成一个直线,这边可以看一个直线,但是折折过来的啊,折过来了,那整体不是一条直线,那我们就不能说是线性相关的,甚至这叫非线性相关啊,或者是,或者是这个这个图呢?那么先是这样的 啊,散点图是这样的,哎,然后就变成这样的了啊,变成这样的了,那显然他不能,你不,他不是在一条直线的附近啊,那么这个我们都叫做 啊,叫做非线性相关,或者是叫曲线相关啊。曲线相关,这是我们的概念啊,我们看后面的这节课呢,我们主要是概念的问题啊,我们要看后面的练习题。第一个举例说明什么是相信相相关 关系?相关关系和函数关系有什么区别?那我们举个例子啊,那么比如说,例如,那么人的年龄和血压啊,人的年龄 与血压啊,那刚才是年龄和脂肪含量啊,他是正正相关的哦,人的年龄和血压也是啊,随着年龄的增大,那血压可能会增增加啊,随着年龄的增长,血压会有所增高的啊,增高的 啊,但这个我们就说他们是相关关系啊,相关关系,呃,那但是年龄不是影响血压的唯一因素,他还会跟 跟我们平时的饮食啊,啊,运动啊,还有呃,等等其他的生活习惯有关, 那也就是说其中一个变量的取值不是随另一个变量取值是唯一确定的,那么这个就我们就叫做相关关系啊,像这样的是相关关系,那么他与函数关系是什么区别呢? 那函数关系区别函数关系呢?这两个量呢?是非有明确的关系的。那一个自变量 x, 那么有唯一的函数之外与之对应啊,是非常明确的关系,那相关关系就不是很明确啊,不是确切的啊,有唯一确确定的啊,那么这个就是我们相关关系和函数关系的区别啊,我们就不再 写了啊,这是文字的说明。那那像相关的啊,这个我人的年龄和血压,那么他是相关关系,你不能说他是确,他是函数关系,他是确定的关系。不是啊,他有血压,还有其他因素, 其他因素来决定的啊,像我们的饮食习惯呢?还是运动啊什么的啊?有关系, 这第一题,我们看第二题,我们看第二题,根据下面的散点图,推断图中两个变量是否存在相关系,那我们看这个散点图,这散点图显然的啊,它是在这条直线 啊,我们在这条直线附近,所有的散点都在这条直线附近的,并且它的直线呢,是随着 x 的增加, y 是下降的。那我们说第一个, 这个就是副相关啊,副相关。那第二个呢?第二个他有相关关系,但是他他是 第二个,他不是线性相关啊,他虽然有有有相关关系啊,有相相关关系,但是他不是线性相关啊,不是线性相关叫非线性 相关啊,他不能画出一条直线来啊,在这把三点图在一条直线附近啊,那第三个一看啊,这就没有任何规律,那么我们就说他是,他叫不相关啊,他是不相关的。 我们第四个呢啊,这个可以把它认为是这条直线的附近啊,那我们把它叫正向关啊,正向关, 正向观。那么这是第二题,我们来看第三题。那么第三题下表给出了一些地区的鸟的种类与该地区海拔高度的数量,鸟的种类 与种树呢?与海拔高度呢?是否存在相关关系?如果是,那么这种相关关系的特点是什么?那有什么特点? 哎,那么第一步我们先把它的散点图。第一步我们先画散点图啊,画散点图啊,可以自己根据这个数据,我们把散点图画出来,哎,这个我们把这个散点图 图,哎,就这个图已经画出来了啊,是他,那这个是 x 呢?是海拔高度,那么 y 呢?是 这个鸟的种类啊,鸟的种类。那么从整体来说啊,从整体来说呢,它是正相关的啊,那么随着海拔的高度越高呢,它是那 鸟的种类是越来越多的啊,整体是正相关的啊,正相关,也就是说是否存在?那么存在啊,是正相关啊。 但是我们从局部来看,那么一千海拔一千米以下啊,和海拔一千米以上,那么这个在一千米以下,你看他的局部来说,这个他是没 没有相关,这个正相关是不明显的啊,这个相关关系是不明显的。还有我们一一千米以上的啊,这个他的相关关系也是不明显的啊,这正相关都不明显啊,他具有这样的一个特点啊,完毕。

大家好,我是这本书的作者啊,首先呢非常感谢大家呢,选择了这样一本书,感谢大家对我的一种认可,无论是新读者还是朗读者。 呃,关于我本人呢,在市场上呢,其实是出版了很多本与 spss 相关的一些图书,还有就 state 相关的一些图书 啊,包括之前备受大家欢迎的这个,呃, spss 商用建模, spss 数据挖掘啊,大家呢,在各种图书网站上搜索我的名字呢,应该也就能看见啊。然后呢,这为什么要创作这本书呢?我简要的先给大家做一个汇报 啊,之前呢,我写的所有的图书呢,呃,很多时候是侧重于对相应的知识,相应的应用的一个基础的一个讲解。 那么针对这本书呢,其实是前面几本书的一种极大成者,就这里边,首先呢有这么几个特点,第一呢,他的这一个每个案例都非常实用, 再一个呢就是每一个每一句话,每一个点都介绍的很全面,很准确啊,就大家呢就是完全可以把它当成一本宝典性质的一种工具,当然更好的就是把它作为一种教材,如果想这种系统的, 全面的,实用的来学习 spss 的话呢,我推荐大家就用这一本,这一本呢,它是总体上呢,也是按照这一个 spss 的各个功能模块来进行的一个划分啊,类似于市场上就是 呃普遍出版的这种从入门到精通的一个系列啊,这个呢叫从入门到精简,比精通呢还要深一个层次啊,针对 体现哪一方面呢?体现在第一呢,就是说我们的这个案例更为实用。第二呢,我们针对于不论是窗口还是对结果的解读上都更加的全面和准确啊。有有有很多这个读者跟我反映,就是说呃,他们呃在这个进行对比较的一些书的进行操作的时候 发现呢,我们的在结果输出窗口输出了很多的结果,但是在最后的这个教材上却没有体现 啊,我们这个这本书呢,就彻底改变了这样的一种情况,就是我们只要是呃,大家按照这个 教材上的讲解,自己一步步进行操作的时候,最后出现的是结果输出窗口系统的结果,输出窗口出现了什么界面,我们都会在教材上告诉大家,这是什么东西,什么样的一种结果,这个结果代表什么含义?他 背后的实际含义又是什么啊?通过这样的一种解结,对结果的准确解读呢?教会这个读者不仅仅知其然,知道怎么操作,更重要的是知道其所以然,知道对结果怎么进行解读 啊,这会我觉得我认为是非常重要的,不然的时候大家可能仅仅是为了满足呃考试啊,或者说是呃写论文的一种需要,对吧?但是在这个基础上呢,就是这个数据分析, 你分析出来的结果到底有什么样的含义,能够为你的实际的问题的解决,不论是学术问题还是实际问题,他的解决提供什么样的决策的参考啊?或者说我们量化分析的价值体现在什么地方,我想这是非常重要的。 好的,下面呢,我们开始正式的一个讲解。呃,这一章呢分为十二节内容啊,它主要的就是包括呃 spss 的这个基础操 操作啊,其实大家呢对 spss 有一个基本的认识,熟悉 sss 的操作界面啊,基础操作以及选项设置,能够熟练的使用 sss 来创建编辑数据啊,数据分两个维度,大家稍后可以看到 这我给大家先展示一下数据呢,他是分两个维度的啊,一个呢是这个每一行叫一个样本观测值啊,就是我们针对某一个每一个样本观测到他在每一个维度上的值,是吧? 然后呢这个每一列呢是一个变量变量呢,就是我刚才说的维度啊,我们呢在 spss 当中啊,统一的把它叫做这个呃变量变量,让每一行呢要叫做样本观测值,或者 叫样本观测,或者叫观测值等等都可以就说的是每一行啊。当然呢 spss 当中啊也有一个变量识图啊,这里边呢可以直接创建变量,大家可以看到这是变量识图,这是数据识图啊, 我们通过这一章的学习呢,要求大家能够熟练地使用 s p s s 创建这样的文件,并且呢能够编辑这样的这个数据。 然后呢学会 spss 当中三种典型的图形绘制方法啊啊包括这个图标构建器啊,图形画板模板选择器以及旧对话框里边的这一个相关的一个操作啊, 从而呢为后面综合使用一些更深层次的 spss 的各种统计分析功能开展研究做好一个必要的准备 啊,主要是体现在这里边,这个分析里边大家可以看到有好多好多的这种呃可以用来进行分析的操作,比如说回归分析里边就有这么多种回归分析方法是吧,大家可以根据自己的这一个实际的需要进行一个选取 本章的学习重点呢,我这就不再追述了,大家可以参与教材上的内容啊,呃,也就是说,我希望大家期待大家真的是通过学习本章能够掌握到的赤点, 其实就这些,那么通过本章的学习呢,大家呃也就对 spss 呃有了一个基本的一个操作,或者说呢,就是说是在一定程度上已经有所入门了啊,为后面更加精深的学习那种比较呃高级的统计分析方法奠定一个良好的基础。 这一章呢,从内容上看不难啊,大家可以呃一边看着教材,一边打开我们提供的数据原文件,一边操作,这样的话学习起来事半功倍 啊,最好就是说拿着书对着电脑这样一步自己一步步的做,这样的话可能就很快就能掌握起这个知识点来啊,我建议大家这么采取这样的一种学习方式啊,当然呢,只是一种建议啊,大家根据自己的实际情况啊选取啊。 第一节呢,很简单,它就是 spss 启动与关闭常用窗户,它的启动呢,其实我们正常的时候只要双击相应的数据文件,它就能够启动啊,关闭的时候呢,点关闭就可以。比如说我给大家举个例子,我们要打开 一 a 文件,我双击一下就出来了,很简单很简单啊,然后从这个文件打开,数据也可以也可以找出来打开,是吧 啊,然后呢,我们的这一个关闭呢,直接点这个右上角的关闭按钮就可以。其实呢,我们教材上虽然列了那么多的这种 呃方法啊,说是 ltf 四啊,还有这个点关闭按钮啊,其实这些呢,都是大家的这个操作习惯,有的呢是学习习惯,还有的是职业习惯,就按照自己的这个习惯做就是了。 从这个维度上来讲呢,其实哈,我个人认为,呃,我们的这个 spss 和我们的嗯,这种就是 excel 啊, word, 它的一些常用的 office 办公软件,又在很多方面都是相通的,比如说关闭的话, 就是关闭就可以,就严格的按照这样的操作来就行。 呃,关于教材上呢,我们还有好多的呃,就是在大家第一次第一次安装的时候,因为我这个电脑啊,已经肯定不是第一次安装了,呃,所所以说第一次安装的时候呢,他会启动一些对话框 啊,大家如果说是呃 spss 的新手的话,哈,完全可以就是按照我教材上写的这一个呃进行一个熟悉和掌握。 我这呢,因为我们不是,我不是第一次装 spss, 所以说呢,就没法不太好演示演示第一节的这个最为基础的一个操作啊,总之呢,就是大家如果说有相应的 spss 文件, 直接呃打开就可以。这儿呢,我给大家再介绍一下它的一个窗口, 刚才呢,其实也已经有所介绍,像这个窗口叫做数据编辑器窗口,数据编辑器窗口呢,它是包括这一个呃呃,数据识图和变量识图是吧? 这是数据编辑器,还有呢,这个语法编辑器,语法编辑器啊,还有一个结果输出,其实最平时我们用的最多的呢,就是这几个窗口啊,关于结果输出呢,我给大家看一下 啊,这就是一个结果输出的窗口啊,这是结果输出的窗口。 呃,关于语法变异器呢,它是可以从这 这个地方文件新建语法啊,这就是在大家在这里边可以写程序,写程序, 我在教材上展示了一段呢,这个联合分析的一个程序,大家呢可以就是,呃,简要看一下啊,简要看一下,到后续的时候讲这个联合分析的时候哈。呃,可以大家再再进行一个一个掌握。 关于第一节我就不再多说了,这里边啊,因为这个第一节的内容很基础啊。然后呢,我们在讲述后边的每一节,每一个章节的时候,其实都会会用到,呃,他的启动啊,关闭啊,还有他的这个窗口啊,这都会在用到啊, 我这呢我就不再过多的追述了。

大家好,欢迎来到 spas 课堂,我是李博士,接下来我跟大家分享的是 spas 多重响应变量交叉表分析。 好,首先我们来了解一下多种响应交叉表分析,他呢是了解不同变量对该变量的多种响应变量的影响,这时呢我们就可以使用 交叉表分析。在分析里面,我们通常见到呢就是单选题跟多选题之间的交叉表分析, 比如说呢,不同性别对大学生旅游花费种类的影响,性别呢就是我们通常作为一个单选题,然后大学生旅游花费种类呢?呃,这里呢有多种选择可以作为一个多选题,这样呢就构成呢是 单选跟多选题的一个交叉表分析,这时候呢我们就需要用到多种讲究的交叉表分析了。 好,关于多种响应的交叉表分析呢,我们主要来分为这几个步骤。第一个步骤呢,我们仍然是需要建立一个多种响应题,这里呢就是针对呃多选题呢建立一个 呃多种奖励集,建立完多种奖励集之后呢,我们就可以对他这样一个 呃数据呢进行交叉表分期。这里呢我们可以通过呃选择他们的行变量,裂变量以及展示的一些百分比等呢,输出我们需要需要的结果, 这是主要的两个步骤。好,我们通过一个具体数据呢来分析一下不同性别大学生旅游花费来源的一个差异,这里呢我们就需要呃建立 单选题跟多选题的交叉表进行分析。首先呢,我们还需要录对数据呢进行录入他的数据录入形式呢,单选题呢,我们就是普通的录入形式了,就是 呃一列变量呢,一呢就是男,二呢是女,然后呢多选题呢,就是跟呃多种奖励的 频率分析里面的路数据形式是一样的,就是每个选项呢是作为一个变量,然后呢通过 多重奖金级呢,就是把这五个选项呢就给组合成一个多重奖金级,然后呢进行交叉分期,就输出呢我们所需要的结果。好,我们通过数据具体数据来看一下, 这是我们的数据,然后呢第一列呢是 id, 然后第二列呢是性别,然后第三列到 呃这个选项五呢是我们的旅游花费来源的五个选项,呃,这是录好的数据。接下来呢我们先定义这多选题的多重选一级分析,多重选一定义变量级, 把这五个旅游花费来源呢抢进来,基数值是一 添加。好,这样呢,我们就把多重奖运集定义好了,关闭。 呃,定义好多种变量级之后呢,我们就可以看到,呃,下面两个窗口呢已经激活了。频率分期呢,我们在上节课呢,已经介绍到这里呃过了,然后接下来呢我们再介绍交叉表分期, 交叉表分期呢,因为这里是五个来源,我们通常是把它作为行,这是多种响应呢,可以作为行,然后性别呢可以作为列, 然后选项呢,我们可以把行和列及总计都选上,这个呢可以根据需要,比如说我们想看一下男性的 呃行占比呢,我们可以看看一下他的行占比或列占比,这个都根据需要选择就可以,这个呢没关系,继续。然后这里经别呢,我们需要定义范围,因为他是 好,我们先来看一下它性别是负值是一和二,所以呢范围呢是一二,继续确定。 好,我们来看一下他的输出结果。呃,旅游花费来源,父母亲有呢性别,男性呢是六十九,女性呢 是五十三,就是总共呢是一百二十二个人。然后呢呃,勤工俭学呢指男性是一百,女性呢是六十四,总重呢是一百六十四。然后呢父母亲友呢,就是占零花费来源的呢, 他两个占比,还有占性别的是两个占比以及总计的占比,这个占比呢可以根据我们的需要 来选择。然后呢我们主要用的还是他的一个这样的一个频数了,就是父母亲有男性多少,女性多少,然后总计是多少是这样一个输出结果。 好,这呢就是单选题跟多选题的一个交叉分析。呃,多选题跟多选题交叉呢,也是可以做的,但是这样呢多选题之间呢, 做结果就比较乱,所以做分期的时候呢,我们尽量就是最多呢基基本上要单选跟多选交叉,能满足要求呢,就不要做多选跟多选之间的交叉,那样会显得结果非常复杂。还有一种情况呢,有时候接的时候呢,我们需要 呃性别,不同性别项呢,对于旅游花费来源呢,这旅游花费来源是否存在差异?这呢我们就需要对统计好的这组数据呢,摘出来再做一个单独做卡房检验,这里呢就不做过多介绍。 关于呃多重小型级的交叉 表分析呢,就介绍到这里,大家如果有意外或者数据方面的合作事宜呢,可以联系我们,这呢是我们的联系方式。好,谢谢。

下面呢,我们再来讲解二点三节探索分析。 当我们需要进行数据筛选,识别极端异常值,分析各组样本之间的变量差异,探索变量变化的分布特征时,都可以用到探索分析。 这呢我强调三点,第一,探索分析既可以为参与分析的所有样本生成摘药、统计量和图形显示,又可以依据分组变量分别为各组样本分别生成摘药、统计量和图形显示。也就是说,既可以针对面相所有样本,也可以啊面向分组样本。 其二,探索分析可以识别极端异常值。极端异常值呢,主要包括错误数据,与绝大多数数值相 比,过大或者过小的数据等等。数据当中如果包含了极端异常值数据,那么必然会影响分析结果,掩盖变量变化的真实规律和特征。 第三点呢,呃,探索数据呢,可以探索变量变化的分布特征,从而帮助用户确定用于数据通析的数据分析的统计方法是否合适。 比如说呢,有的这个分析方法,他假定条件里边要求数据要成正态分布,那我们通过他的分析发现数据他不是正态的,那这个时候呢,可能就不太适合采用这个我们预先想要的那种统计分析方法,想用的那种统计分析方法。 下面呢,我也是结合着案例啊,这个呢,我们用的是数据二点二进行一个分析。 关于这个二点二呢,这个数据啊,它是这个某研究通过调查问件获取的这个 c to c 电子商务顾客信任因素的影响因素的一个数据。 数据文件当中呢,总共是十八个变量啊,十八个变量分别代表什么呢?大家可以看一下相应的值标签啊,这个教材上也都有啊,自己在打开原文件大家也能看到,其中我们针对有一些呢,有一些变量还采用设置了这个值标签操作啊。 好的,下面呢,我们针对这个整体信任度评价变了 进行探索分析,分析描述统计探索,选择这样的一个命令,就会弹出这样的一个对话框。首先呢我们选择进行探索分析的变量,我们选择的是整体信任度评价, 把它选入到音变量列表啊,音变量列表,如果我们需要分析多个变量的话呢,还可以就是把所有的变量都移到里边来,也就是说他不仅仅是支持一个,他是支持多个的,当然一个也可以。 然后呢这个因子呢,我们选择性别,什么叫因变量?什么叫因子呢?因变量,就是说这个被解释变量,被影响的变量啊, 然后呢这个因子呢,就一些影响因素啊,或者叫自变量,或者叫影响因素啊,就是说我们这样的一种设置哈,就表示我们的性别 是不是会对整体信任度评价产生影响,或者再直白的来说呢,就是男的女的啊,男士女士,是否他们对于这个整体信任度的评价存在显著的差异是吧, 这呢还有个按标注依据,个按标注依据呢,这个主要就是说如果系统在数据探索的时候啊 呃,发现了极端异常值,那么就可以使用这个标志标识的这个变量呢加一个标记,从而便于用户迅速的查找到这些极端异常值,如果用户在这不做选择了,那么这个 spss 他默认以第一个变量作为这个标注个案的变量 啊,再就这这个显示显示呢,我们选择要么是选择这个, 呃,表,表的话呢就是统计,图的话呢就是图,两者都呢,就是既输出表也输出图啊,这呢我们选择都选上,然后再就是统计,这里边呢可以选择输出相应的统计量啊,包括描述 m 估计量,离训值和百分之数, 针对每一个选项的具体的含义啊,大家可以参与教材上相关的内容。再就是选项选项里边呢,它主要是用于设置对缺失值的处理的方式啊,这呢我就不再追述了, 教材上都有啊,这个自助出院呢,采取系统默认设置就可以 啊,他这还有个图图这呢,它里边分为大家可以输出这种呃相图,描述图和这个直方图啊,什么什么等等, 我们这都选择去输出,还检验了正态图也选择输出啊,好的,继续点击确定。 这个呢是我们的个案处理摘要啊,列出了参与分析的样本的基本的信息啊,男的有多少,女的有多少,确实只有有多少,总容有多少啊,有效的有多少 啊,这一个呢,下边呢就是一个统计表啊,描述性统计表,因为当时我们选择的是表和图都输出啊,这是一个表, 这个呢是我们的 m 估计量。 m 估计量。 m 估计量呢,它是样本均值和中位数的文件替代值,非常适用于数据当中有较多 接单异常值,需要寻找数据位置时的情形啊。我们这个从这可以看出我们 m 估计量的值啊,与它的平均值是是比较比较接近的啊,平均值 是比较接近的,这说明我们的这个数据当中存在极端异常值的概率比较低。哎,这数据是比较平稳的,这是百分位数表,这是极值的表。 这个呢是正态性检验的一个结果,可以发现呢,两组数据的正态的这个分布特征都非常的 显著,主要的是看这个地方显著性皮值非常小,越小越显著啊。之前我们在第一章的时候讲解了假设检验的基本概念的时候说过这一点啊,越小就越显著啊,都就是说明 他们是浮动正在分布的。这是直方土啊,直方土,这个呢是精液土。 关于静夜图呢,从左到右啊,它主要的是分为频率以及这个静,静就是主干,然后还有一二三部分静呢,就是主干,代表的是这个整数部分。 这书本页呢是小数部分啊,每个页就表示一个样本啊,还有性别为女,性别为女啊,这是性别为女的,是吧?这个镜为九的这个叶片书总共是几个几片叶子?八片,对吧? 表示这个呃职职位九的这个职位九的这个呢是频率是八 啊,这是正态概率图。斜线呢是正态分布的标准线,各个点越接近于直线,则数据的分布啊,越接近于正态分布 啊,这说明我们我们这两组数据的这个值都是比较接近的,说明数据的正态分布特征是比较明显的,这个是去趋势的正态 qq 图,这个呢,主要是看这个数据是不是均匀的分布在这个横线上下, 可以发现的也是比较均匀的,跟前面这个结果是一致的,这个是一个镶线图,镶线图呢是相,是四四分位间距的范围, 中间的这个粗线呢是表示的是这个,呃,平均数上面这个,这这一个呢是表示什么? 这是表示最大值啊,或者这个是最大值,这个是最小值,最大值最小值啊,这个呢是百分之呃,百分之七十,百分之二十五,中间的粗线呢是表示这个均值。 这地方这地方是有一个粗线的,大家在教材上也能看见,自己的电脑上应该也可以看见。这是一个粗线,这是比较黑挡住的啊。粗线的是军指, 这个呢是百分之七十五,这是百分之二十五啊,分位数,这是最小,最大啊,最小百分之二十五,均值百分之七十五最大。 好了,关于这一节呢,我们就讲解了这个地方,谢谢大家。
