粉丝1380获赞4681

图形分析就是简单的一个画图啊,简单的画图,呃,他这里描述的是 xr 和 y 的关系,那我直接按住刚才教大家的就是如何选中两个,那就是 xry, 先点 xr, 再点 y, 有人说可不可以先点 y, 再点 x, 呃,可以,但是这个图形会有一些变化,因为,呃, 因为我们日常习惯之中,我们从初中、高中开始学,我们就习惯的把 x 作为横轴, y 作为竖轴,然后,呃,这个系统默认的是先点谁,谁就是横轴,那我想把 xr 设为横轴,那我就把 xr 先点 y, 后点,然后右击 oppo, 打开一组,打开,然后这里有个 grout 图形,点击 啊,然后这里就图形就出来了,这里就有,底下就有非常多的图形,大家看那个英文单词也能看出来他大概是个什么样的图形,这个他就 是线段类似的,这个就是一个,呃,那个柱状图,巴马棍子,棍子就是柱状图,大家自己每一个去点,大家知都就知道他每一个表示的是 一个什么样的图形,这个就是一个,那个,呃,区域图吗?就类似于丙状图这样的,大家一个一个去试。我们在这里使用的是散点图,这里就一个一个的小点,就叫散点图,就每一个 x y, 比如说我刚才的,呃,把数据打开啊, 第一章的数据,比如说我第一年的 x 等于九点,我该 x 二等于五点零九,然后 y 等于六十点四二,然后第二年的是这么多,我就在, 我找,我同样的,我就在这个坐标轴上, x 等于五十几,然后我就在这里,然后五十几往上找,然后我还等于 y 等于六十, x 等于五百多,然后我就在这里找个六十的,大概就在这里,哎,我就打个点,然后把每一个数字都标一个点标上去,然后这样就形成了一个闪点图,那红线是什么呢?红线就是他礼盒那个回归线这个软件,他就 判断这几个点有没有在一条直线上,然后求出这个这几个点,所有的点到直线的最短距点,然后画出一条线, 这就是他的回归线,然后回到这个软件操作上面来,然后我们选择散点,然后这里可以选择让他礼盒回归线或者不礼盒,这里选,我们选择是礼盒,选择这个回归线,单看单词, 然后这里就输出了这个图形,也就是这也就是 ppt 上的这个图,我们直接看 ppt 大一点啊,然后这里好,这里展示的是 xr 与 y 的散体 点图,以及二者之间的估计趋势,从图中大致的可以看出来, y 是随 x 二的增加, x 二增加, y 也在增加,在一定程度上可以观测两者之间呈现正向的关系,而且他们基本上就是闪点,有很多都 分布在这个回归线上,说明他们两个之间呃存在比较强的一个关系,从这里可以初步的判断出来。然后。

先打开这个软件呃,进行描述性分析之前,给大家先介绍一下这个软件,这就是用来进行纪念经济的一个软件,然后他主要的特点是用来处理具有时间序列特点的一个数据。比如说你要研究零 两千年到二零二零年这样一个时有明显时间趋势端的一个数据的话,用这个软件就非常的合适。但如果你是处理的是温圈类型的数据,那我建议你用 spss 或者 ms 这种软件更合适。呃,每一种软件他都有他的长处或者短处。嗯,这个大家明确他是用来处理时间训练数据会更好的软件就行了。好, 给大家介绍一下这个界面,这就是一个很简单的界面,功能很多,咱们用到的无外乎就那几个,其中这一个他就是打开文件的,你就这么理解就行了。他有很多种打开文件的方式。有这种,如果你直接保存了一个一副右手文档的话,你直接用这个,然后点击,然后选择了一个文件夹打开就行了。然后这个如果你没有之前没有创建过,创建是一个新的,你就点 这个六,然后参加一个新的工作文件。然后这里就有三种模式,一种是非结构化的,一种是呃时间序列的,一种是平衡面板形式的。然后呃非结构化的意思就是 比如说,比如说他只研究某一年的二零一九年,然后证他就不具备有时间信用趋势了,他这样点击的话,他只需要输入多少有多少个观测值。比如说你教学研究 abc, 他们班的人数或者成绩有什么不同啊?因为他们不涉及到那个时间或者是训练时间训练,所以不需要,你只需要填这里有多少个人,比如说两百个人,你就填两百, 这个才是我们常用的,我们常用的就是这里就是时间序列,这里这里就有很多种时间序列的一个类型,这个是多年,比如说你快两年,快三年点选择这个,然后这个是每一年,你选择了这里有个棋子时间,棋子时间就开始的年份和结尾的年份,比如说填入两千就两千年,开始底下就是二零二零年,就是截止到二零二零年吗?这个就是 半年多,就每半年统计一次,这个就是每季都统计一次,这个是每个月统计一次。看单词也能看出来他们的区别。好,大概就是这么多,就是这个软件渐变的介绍,咱们直接来开始录入数据,首先把咱们的数据给打开, 然后这里我们可以看一下,他是一九八八年到二零一九年,每每隔一年统计一次,所以他是一个年度数据,所以我们选到年度数据上面,然后在上面输入一九八八,在下面输入二零一九,然后点击回车,然后这样的话里面就 生成了一个二零啊,一九八八到二零一九的一个样本区间,然后有人说怎么没看到 s e、 s i 三 y 呀?这怎么生成呢?在这个地方,这里要输入一些像一些代码一样的东西,但是代码很简单,大家记住就那么一两个,这里就是 deta, 然后这是数据 x 一,每每个都要打一个空格,然后所有的后面一副右手里面输出的所有的不管是名称呢还是标点呢,还是运算符啊,都应该是英文状态下的,所以这里也全都是英文 状态下的。这里是呆塔 x 一,然后空格 x 二,空格 s 三,然后 y, 这样的话,哎,咱们就参加了一个这样的空的表,咱们把数据填复制进去就完了。 好,复制好了,然后把它关掉就完了。这里就看到了 s e、 s 二、 s 三、 y, 他们就以每一个文件夹一列的形式存在了这个里面。

然后接下来我们再进入更深层次的判断,就是首先我们先把这个数据教大家怎么逃出这个东西来啊。首先我们要选中所有的 y、 x 一、 a 二、 a 三,然后右击用主打开,还是这个用主打开,然后这里有个斜方叉分析,点击这个斜方叉分析, 然后然后把斜方正分析的勾取消,点击这个。第二个才是相关分析,这里有个批纸,就是我们刚才说的零点零五的那个东西,点击一下,把它勾上,点击 ok, 然后就输出了这样一个结果。我们就直接在 ppt 上看 ppt 上的图,大一点好, 呃,他们每一个就是横着竖着,他们代表的就是一个相关关系的值,最大值为一,也就是说我歪和歪我们两个是一样的,那我们两个肯定是相关的吗?百分之百相关吗?所以他的值就为一,然后 x 一与 y 他的关系是零点八六, 也就说他们之间你也可以理解成他们之间的相关度势百分之八十六吧,你要是实在就是理解不了的话, 书面的表达就是他们之间的相关系数为零点八六。然后这里是 s 二和 y 他们的相关程度, s 三和 y 的相关程度,同时这里还描绘了 x 二和 x 一的相关程度, s 三和 x 一的相关程度,还有 s 三和 x 二的相关程度,他以一个 t 字形方式来进行排列, 然后为什么这边没有了?因为这边跟这边应该是一个镜像的关系,是一样的呀,所以他只写了这半边,这半边是不需要写的呀,别说哈,以这个为例啊,我 x 和 y 的关系对吧? 那这里就是 y 和 x 一的关系,那 x y 和 x 一的关系与 x 和 y 的关系,那,那是一样的呀。所以这里的零点八六跟这里的零点八六肯定是一样的,那我只写一个 就行了,那我就写这边了,同样的,这边也是一一对照的关系,所以只写这边就这样的。然后下面的零点零零几,他就是我刚才说的一个概率,屁子零点零零一二,零点零零,零点零零五啊,然后零点零零零,那这个他们这个屁子小于零点零零零,说明他们之间非非常的显著, 有百分之九十九的概率,九十九点九九的概率,他们的相关性是零点八六,你可以这么理解。好吧,因为我用专业的话语,我也实在不知道怎么表述我,我到时候又照着书念,书上肯定比我表示的清楚,然后我念的可能你又觉得太难了,太深奥了,听不懂。 呃,我觉得没必要把一个简单的东西讲的那么书面让人听不懂。如表所示,展示的是变量 y 与 x 一 s 二 s 三的皮尔森相关系数,这个东西就叫皮尔森相关系数,我们简称相关系数。通过表格可以看到, y 与 x 一之间的关系为零点八六 大于零点大于零,可见二者之间的关系呈正相关关系。如果他是一个父子的话,他们两个之间的关系就是父相关的关系, 对吧?然后相应的 p 值为零点零零零,是小一的,可见在百分之一的显著性水平下,两个人之间的相关程度能够很好的反应总体。然后接下来就是关于 xr 的相关系数了,为零点零零九九。 呃,我就不接着练了,哎,练的太累了。然后我再给大家解释一下相关系数。呃,相关系数并不是说越大越好啊,他有一个标准的衡量值,他至少要在 零点四以上,这说明他们之间有一定的相关性的,然后他们是不是越相关越好了?他是这样的,你要求歪,你是通过 x 一、 x 二、 x 三 来证明这个 y, 就他们之间 y 等于 ax, 一加 ax, 二加 ax 三等于 y, 每一个那个变量之间前面都有一个系数吗? 如果 x 二和 x 三特别的相关,他们两个长得一模一样,那你觉得还有必要把 x 三也放上去吗? 他们两个太相关的呀,他们两个就是一模一样的,你没必要再把它放上去了呀,对吧?所以一般来说零点四到零点八这个区间是最好的,你超过零点八,他能就涉及到一个多重贡献性贡献,贡献就是共在一条线上,所以就重叠了吗?这个后面我们也讲,会讲到怎么去消除这个多重贡献性。

今天我们讲一个优质分析的第二节课,就是作图。嗯,我们在做正式的统计分析之前,一般都需要做两个事情,第一个是作图,看一下这个数据的表现,什么样的 更加直观。另一个是做基本的统计描述,比如说均值标准差,正态分布,正态分布情况主要是这些。今天我们讲做图。做图的话就是首先你需要打开这个数据,点开之后会展示这个数据的表, 然后点击这个 vivo, 或者是点击上面溃刻的 gro f 这个选项,我们这里从 vivo 里面进去点击 vivo, 然后就出现这个选项,他们里面会根据你这个数据给你一定的基本的表格。所以基本上我们一般做时间序的话,一般都是用这个蓝牙和申宝, 点击完之后点击确定,这样就把这图做好了。明天我们就讲这个基本的统计描述是怎么做的,我会把上面这些所有的选项给大家讲一遍,点我主页有干货。

好了,我们已经讲完了这个一个大概的一个步骤之后,我们接下来看一下我们的一个 具体的一个操作。比如说这里是我们之前做过的一个东西,比如说他的要求是要求出国留学人数与居民消费水平以及研究生在学人数的一个影响。 那么首先其实我们拿到数据的第一步啊,肯定这个数据处理啊,就是看有没有缺失值,以及以及呃异常值对不对?而对于我们的这样的一个数据,特别是我们看了一下,特别是我们看下这样看这样的一个数据,你看一下出国留学人数,他是其实是一个占比, 而居民消费水平是个员,对不对?单位。而研究百研究生债权人是个外人,其实他们的亮纲不一样。而对于我们这样的问题话,我 我们经常就是对它进行一个取自然对数,明白吗?就是保证他们的亮缸是一样的,这里再取一个自然对数,同样方式我每个都取了之后再拉下来, 然后这里是我们的一个 y, 对不对?然后这里是 x 一,那么这里是 x 二,那么我们再把这个数据放到我们的 ebuse 里面,再进行一个具体的操作。首先我们说打开我们的一个 ebuse, 打开 ebas, 我们看一下它是一个时间训练的一个模型,从一九八八年到二零一八年,对不对?二十一九八八年到二零一八年的一个数据,就在这里 create 一个六的一个 evius, 就在这里啊时间训练,这个是我们的一个时间训练模型, 这个是我们的洁面数据,这个是我们那个面板数据,就是我们关于时间训练,他就分为时间训练、洁面以及面板,面板数据就这三个模型,那么我们现在是时间训练模型,他是 这是频率对不对?一,每一年对不对?他是从一九八八到二零一八年,这里就是我们说所命名这个数据的一个名字啊,你可以写可以不写啊,我经常是没写的 好。这样之后那我们是不是要输入我们的个数据了?输入数据的时候在这里 dat 不区分大小,写这个 dat 我们要输入的数据 y, x 一以及 x 二,它们的中间 用空格来隔开,这样打按 inter 键确定之后,我们再把我们这个数据啊,怎么办呢? copy 一下,就这个复制过来就可以了, 像 ctrl c 加 ctrl v 是不是就可以了?然后这得到了我们这样的一个数据,那么我们的第一步这样可以删掉了,这是个,那么看一下这是不是就在里面了? 那我们看一下,首先第一个我们要做的是什么呢?单位跟检验对不对?我就以一个为例啊,单位跟检验以一个 y 为例,我们说打开右击 open, 他 open 直接打开的是一组数据了,单位一个边一个数,一组数据他打开就是一组数据。 service 就是我们如果知道拍子的是不就是一个 service, 那我们看一下在这里面单位跟检验在哪里啊?在这里有类似 rest 打开,首先我们选的是 adf 检验,对不对?一般来说 adf 检验这个就是我们的 adf 检验。首先我们第一个是要怎么样? 首先第一个是不对原序列进行一个检验,第一个是在这里原序列,我们第一个要选的是带有洁具项以及趋势的点个, ok, 得到一个结果之后你会发现这 p 值是不是 他这里有一个原甲册 y 就是有存在单位根,那么批值大于零点零五,我们就接受这个原甲册,就是不能否认他没有原位单位根就是只能接受他有原根的,对不对? 档位跟对不对?那么先给他设置一下,那么第二步我们在这个技术上重新再进行一下,那么在我们我们第二个要选的就是我们只带有解具项的一个,再进行一个检验, 然后同样想我们再固定一下,冻结一下,那么第三个再选的就是我们那个既无有没有趋势也没有结局项的一个,那么再来看一下,得到了一个三个, 其实这三个是不是都是接受一个元甲的批值都是大于零点零五的,对不对?那么其实都认为他有单位跟,也就是元训练不平稳,那么我们到时候写上去的时候,其实我 你们可以看一下,其实我们就可以用这个批子比较小的这一个当做我们的一个结果来出出进出放到我们的一个论文里面 就可以了,明白吗?那么同样的我们就可以删掉了,是不是第一个,那么接下来是不是他的原序列是不平稳的?那么我的第二个部分是不是要进行一阶三分呢?就在这里进行一阶三分,进行一阶三分的之后选择一阶三分序列之后同样的方式 还是首先第一步进行有洁具有趋势向的一个单位跟检验, ok, 这里是不是直接就平稳了?平稳了之后我们就可以不用往后坐了,明白吗?那我们直接把这个结果放进去,就是我们可以得到结果,他是一阶差分平稳的,明白吗? 所以说我们单位跟着检验他是有步骤的。第一个总结一下,第一个就是我们从原训练一节差分以及二节差分依次来,而当我们原训练的时候,他又分为了三个步骤,第一个是 选择有趋势和拮据,第二个是选择有拮据,第三个无趋势和无拮据的,就这样三个来看,哪个就按照这三个步骤到哪个步骤平稳的就可以不用往后面坐了。如果都没有平稳,你就可以选择 批值最小的,你或者选任意一个也行,但是你选择批值最小的那一个放进去,作为你的不平稳的一个证明,其实也行,明白吗? 这,这是一个结果,那么其他的 x 一和 x 二我们就不用看了啊。那么第二个就是他们都不是平稳的,之后我们说可以用它进行一个斜诊检验,那么斜诊检验什么?呃,这 group, 这,我们在这里,在这里选择这个选择 j, 看到没有?打字 view 里面,在这里一个在选择这个之后结束,对不对?之后结束,我们说之后二结,我们看一下,其实看见没他他的写的结果是什么?当我的 long 什么意思啊?就是当我看我的 p 值,就是说这里当三个变量没有一个 没有变量存在鞋子的时候,他是拒绝原价,是不是对不对?而也是莫斯的一和还是莫斯的至多有一个,至多有两个数,其实这里都是零点零五,大于零点零五,其实我们如果的目的可以选择用零点零,零点一作为标记,如果小于零点一,其实我们都可以当做一个拒绝啊, 所以说这个是可以表示他是存在一个鞋子的,明白吗?鞋子完了之后,然后就干什么呢?建立一个 vr 模型对不对? 那么确定之后结束我们就默认,等你之后结束我们就默认就行了,默认了之后我们这个确定就在这里面, 就是这里,然后再选择这一个,我们就根据他们来,我们总共应该我们最后多选八 g 就可以了,在这里面这里看,那么不行最多选八 g, 不行就表示不行,就是那么我们就往后面调 七看,行不行也不行,那么选六届啊,选六届就可以了,之后我们就看一下,看一下这些值啊,就哪一行带信号比较多的,你看一下, 但信号比较多了,比如这里是六阶,对不对?你看他六阶信号比较多的时候,那我在这里再点一个 st max, 在这里我就改为六,那我们就得到我们一个模型了,之后我们说了,得到我们的模型之后,我们是不是要判断这个模型的稳定性呢?模型的稳定性之后就是我们的一个 a r 根,看见没?这是 a r 根的一个 表,这是一个图,我们经常用图啊看一下,我们发现所有的点是不都在这个圆内,那么说明我们这个模型是稳定的,明白吗?那么这个模型就是可以的,那么就最后六阶 之后,六节之后我们就开始看,进行一个脉冲,就在这里脉冲你可以,这是我们的, 这叫慢松冲击这个变量,这是反应,这个面,我们就以第一个吧,就把这个这个打开,对,就以这个, 这样,就 y 对他 y 本身吧,就这样我们来看一下,你看一下这样的一个结果,其实我们最好的一个结果就是这上面是他的一个误差线,我们最好的结果就是他们收敛,收敛在这一条线上其实是最好的, 他们就得到这样一个结果之后我们看这是 y 对他自身一个冲击的一个,呃,那个脉冲响应,我们来看一下他怎么解释,就是这个解释,是不是在第一期的时候他会 开始下降啊?就等于说第一期的时候自身就给自身一个压力,就比如说出国留学人数,对不对?在第一期的时候可能就可能太疯狂了,对不对?第一期就出了很多的错,所以就开始有时候下降了,结果这这样降到第四,这个不行,降的太多了, 那么资金降的太多了,那是不是又开始升了?升的时候又开始降,对不对?他其实就是成一个来回拨动的一个情况,对 不对?那么我们再换一个,比如说我们换一个 x 一,对他的一个影响看一下,那么 x 一我们这样讲的, x 一是什么? x 一是不是居民消费水平啊?对不对?在第一期的居民消费水平是不是就给他一个正的指南?所以我们 是这项影响使得他开始增加,出国人数比较多,对不对?他可能出国的比较多了,用的钱比较多了,然后消费水平又降低了,没有多少钱了,对不对?他出国人数又开始降低了,降低了之后,哎,又赚钱了, 是不是又出国的人又多了,对不对?其实是不是就这样理解就可以了?那么这样脉冲响应完了之后,我们说了,那我就什么呢?方差分解在哪里? 方叉分解就在这里,方叉分解。我们打开这个就是 deck, 是表示的是个表,就是我们方叉分 表的结构,这个就是所有的图,有几个图我们给大家看一下。先从第一个表,表的结构就是这样的,就表的这么这样的一个结果,你看一下 刚开始的第一期的时候,我是不是 y 出国留学人数百分之九十五都是自身影响的,对不对?有四点几,是不是都是 x 一影响了? r x 二的影响为零,那么随着我们的一个 时间的推移的话,其实看一下自身的影响就慢慢的在降低,对不对?而我们 x 二的影响是不是增长的时候,到这里的时候,到第四期达到最大的时候又开始降低, 降低之后降低对不对?降低到了十八期时候,又开始有缓慢的增长,对不对?而我们的 x 一等于他的影响刚开始就有一点影响,然后他突然间增加到二十一了,然后再又突然间降低啊, 再到十八,然后再慢慢的增长,对不对?他是这么一个趋势啊,就是这个的话,其实还有 图,这是一个图的表示,就这么一个图,就说你看你们自己喜欢哪种形式,你们就用哪种形式,那么我们就帮他分解。之后我们最后就是一个什么预测,预测,这是个动态预测,这是个静态预测,我们来看一下动态预测的,命名一下他们的结果有什么不一样, 这是个动态预测,然后我们再选择一个静态预测,我们就对比一下吧,对比一下我们的, 我们再把这个 vr 模型你可以删掉,也可以不删,我们不删吧,我们就把我们的 y 这三个拿出来 it's group 之后,在这里 b u 给你发个 group, 是个图,对不对?我们来看一下, 看一下其实每一个其实都礼盒的其实挺好的,对不对?你看一下每个是不是?但是你们发现我的 y 是每一个都礼盒的一个挺好的一个东西, 我,哎,有点搞不清楚哪个是 y d, 我们来看一下,有点分不清,刚分不清哪个是哪个线的,是吧?我们来看一下图,对不对?那么第一个是 y d, 其实每个线都礼盒的其实挺好的。按照道理来说的话,你看一下我的那个 绿色的线,其实可能稍微更好一点,看到没?绿色的线就稍微好一点,绿色的线啊,明白吧?绿色的线就稍微 更吻合一点,但是红色的也差不多,这个结果差不多,所以说这个动态的和静态的其实差不多的一个,明白吗?这个就是我们整个的一个 vr 模型的一个步骤。

今天我们继续讲有没有数据分析的第六节,就是对相关和平相关,对相关和平相关涉及到一个非常重要的一个模型,就是阿玛模型,他是做实验序列预测的非常重要的一个模型之一, 他是有两部分都成了,就是用按摩型和按摩型,这就是自相关,这就是一种平均。呃,因为按按摩型他设计到一个非常重要的,就是他的地方,就是他的接触,就是啊,是姐姐,妈是姐姐,这个是怎么确定的?就是有有有,我们这也讲了这个自相关和平相关分析, 分析的时候首先我们现在还是先点开数据,点开数据在微博里面有一个哈瑞果果,我们这个这就是多多的偏向弯和偏向弯的, 这里这里边有一个选一个结束,这个就是讲的我们上一届的,你需要确定你的数据是几届平稳的,如果是莱沃平稳的话,你就选莱沃,然后确定之后,然后这个图就是左边这个图就是字相关,然后右边这个图就是 偏向弯啊,这时候我们需要确定他是结尾还是拖尾,什么叫结尾呢?就是这两个竖线是他的显著性的一个标准,他如果超过这个这个竖线的话。

实证分析啊,他进行一个,呃,描述性分析啊,首先我们点 s, 二选 nsn, ds, 呃, idp, 因为你这个数据啊,呃,你就变量选择了 太多了, interesting, 然后 interesting, let's go, let's go, 完了,我点不了了。 disco will come on, ok, 这是我们的结果,第一个结果 看我这个蛋跟点点怎么做, 看到没这水平,然后这个已经,这个,这个,这个三个是会点这两个,然后这三个下面是 就随便一点就行,两个符合就行即可。然后携程检验,携程检验我们一般是根据这后面做的 vr 模型,因为你这个模型啊,他这个 vr 呃出来的不是太好 啊,所以我只我没有全用所有的边量,因为有些边量他确实是,呃用不上的,好吧。嗯, interest, 然后是 led gdp, 然后 ds 这个余额,然后 fm, 嗯,然后呢? sorry, 然后我们直接 vr, 那我们先做个 vr, 看到没有?然后我们首先我们其实要做的这个信息准则,但是信息,呃,不是,不是信息准则,我们首先要做的是这个平衡性检验, 对,这个平衡线就说明, ok, 我们这个之后一期是同,呃是符合要求的。然后我们再去呃 做歌单结,这个,这个歌单结结果出来了, 对,这就是歌单结结果,这最后一期的结果你可以复制过去。

今天我们讲一个优质分析的第二节课,就是做图,嗯,我们在做正式的统计分析之前,一般都需要做两个事情,第一个是做图,看一下这个数据的表现什么样的同更加直观。另一个是做基本的统计描述,比如说均值标准差、正态分布,正态分布情况 主要是这些。今天我们讲做头,做头的话就是首先你需要打开这个数据,点开之后会展示出这个数据的表,然后点击这个 vo, 或者是点击上面库克的 garf 这个选项,我们这里从微友里面进去点击 vogf, 然后就出现这个选项,他们里面会根据你这个数据给你一定基本的表格。是基本上我们一般做时间序列的话,一般都是用这个拉印和申请宝,点击完之后点击确定,这样就把这图做好了。明天呢我们就讲这个基本的统计描述是怎么做的,我会把上面这些所有的选项给大家讲一遍,点我主页有干货。

关注二幺幺统计课堂公众号,可以加入学术交流群,免费获得各种数据资源。 各位同学大家好,在经过了第一章时政分析前的准备步骤的讲解之后呢,这节课我给大家讲解第二章的内容。经典线性合格分析模型 这一章呢,相信无论是有统计基础还是没有统计基础的同学都听说过,也在许多参考文献中见过他呢,主要是探究一些变量对另外一些变量是否有影响。 那么用专业一点的话来说呢,也就是探究自变量对音变量之间的一个影响,若有影响呢,它的影响程度到底有多大?接下来呢,我就给大家正式讲解这一章的内容。经典线性 qq 分析模型 型呢,主要分为七个小节,其中当大家在写论文确定构建模型时,当确定选用回归分析这个模型来进行实证分析后,也可以按照 ppt 上二点一到二点五的步骤来依次进行实证分析。 其中二点一是描述性分析,二点二是图形分析,二点三是票讯相关分析,二点四是一元或者多元线性回归分析,二点五是对其进行回归分析以后,对其字变量或者残差项进行一些检验及其修正。 主要包括三个方面,第一个方面是多重贡献性的检验及其修正。第二个是一方差的检验及其修正。第三个是序列 相关性的检验继续修正。除此之外呢,在这还给大家举了一些自己遇到在时装分析的时候遇到的一些常见的问题以及解答,还有一些自己感觉比较好的一些书目推荐,以供大家作为参考, 那么接下来呢,给大家讲解二点一的内容。描述性分析大家都知道,在写论文的时候,出来第一步,在选中数据以后,描述性分区便是文章最开头的内容。那么在 evius 中如何实现这一操作呢?首先我们退出 ppt, 打开 evius, 大家可以看到屏幕上就是我们选取的一个变量 y, 变量 x 一和变量 x 二这三个变量的一个 ebox 文件,它们的时间范围呢是从 二零一三年四月到二零一七年十二月份的阅读数据,共五十七个样本。那么它描述性分析在 enuance 中如何操作呢?首先我们选中 y, 然后选中 ctrl, 单击 ctrl, 然后同时选中 x 一和 x 二,右击用足打开,大家便可以看到我们同时打开了变量 y, x 一和 x 二,接下来单击六 描述性统计,然后有不同样本,大家便可以看到我们就做出了变量 y, x 一和 x 二的一个相关的描述性分析。 做出这个结果以后,我们可以就右击复制,单击确定,然后如果大家想要把它粘贴到 excel 里面,可以打开 excel, 然后粘贴就可以了。那么大家再回推到我们的 ppt 中,左侧这个表格呢,就是我从零六四中截取的一个这三个变量的一个同级量的结果, 其中呢,均值中位数,最大值,最小值这四个同期量呢,相信各位同学也都知道他是什么意思,也知道怎么分析,我在这里就不给大家讲了,在这儿呢,主要给大家讲解一下标准差,偏度、风度以及这笔检验到底该如何分析 标准差呢?主要是反应变量的一个离散程度,若求出来标准差越大,表明变量的一个离散程度越大。标准差越小,表明变量的一个离散程度越小。偏度呢,主要是反应变量的一个偏离程度。在 emails 中呢,偏度值大于离 表明的是右偏,而偏度值小于零表明的是左偏。大家可以看下面的图,右偏就表明他的线的一个尾巴是在右边,尾巴在右边是右偏,尾巴在左边是表明左偏。这个样大家要着急了,不要搞混了。 以 y 为例,我们的 y 求出来的偏度是零点三九大于零表明 y 是处于右偏分布的,同样的,点亮 x 一和 x 二也都相应的是处于右偏分度。那么 嗯,风度呢,是反应变量的一个峰值程度。在 evils 中,峰值大于三呢,表明的是高峰,而峰值小于三表明的是低峰分布,相应的,峰值等于三表明的就是平峰分布。在这 话要给大家特别强调的一点是呢,软件和软件的参照值是不一样的, evils 中呢,是以三进行比较,而大家通常用到的 spss 中呢,是与零进行比较, 也就是说,在 spss 软件中为大家做出来的峰值大于零表明的是高峰,小于零表明的是低峰,等于零表明的是平峰。这个大家要特别注意点,以免很多同学觉得两边做出来结果不一样而产生产生混淆。 那么我们以 y 为例,此处 y 的分度求出来是三点三六大于三表明 y 是处于高分分布的,而相应的, x 一的分度是二点二一小于三表明的是积分分图,那接下来呢,给大家讲解这一篇 检验。很多同学不太清楚这笔检验到底是干什么的,在这给大家解释一下这笔检验呢,它主要是来检验电量是否处于正态分布的。一个 若 gb 检验对应的 p 值大于零点零五,表明在百分之五的显著性水平下呢,该序列是服从正态分布的。反之,若 p 值小于零点零五,表明在百分之五的显著性水平下,该序列是不服从正态分布的。 我们仍然以 y 为例,大家可以看到 y 值经过这笔检验,对应的统计量是一点七二,这个统计量对应的 p 值是零点四二,大于零点零五,也就表明在百分之五的显著性水平下,变量 y 是 服从正态分布的。按照同样的分析方式呢,我们可以看到变量 x 一和变量 x 二通过距离检验,对应的 p 值均大于零点零五,也就说这两个变量在百分之五的显著性水平下,也是服从正态分布的。 好,接下来下面呢,就是对于其合计和一些观测值的这两个相应概念都了解,我就不讲了。 那么这就是我们对于描述性分析的一个简单的介绍。那么这一项 ppt 呢,主要就是以外为例,给大家讲解一下我们在论文中到底该如何对其进行分析。 大家在写文章的过程中呢,可以按照右边右右侧的这些文字内容,照猫画虎写一下,对对各个 电量依次进行分析就可以了。在这呢,由于时间限制,我就不给大家讲,就是不给不给大家念了,大家自己看一下就应该就能理解了, 那么在进行描述性分析完呢,我们就开始要探究变量 x 一和 x 二与 y 之间到底存在什么样的关系呢? 大家都知道要探究两个变量之间的关系,我们用图来看是最直观的,那么接下来呢,就给大家讲解第二小节图形分析。 这图形分析大家可以看到左侧我们有两幅图,最上面一幅图展示的是变量 x 一和变量 y 之间的一个图形啊。第二幅图展示的是变量 x 二和变量 y 之间的一个图形,那么这两幅图在一 六次中如何实现呢?首先我们打开一六次,这是我们刚才打开的,然后我们单机关掉,然后我们重新打开这三个变量,用足打开,然后单机六,单机挂,也就是作图。 嗯,这儿呢,我给大家先两个,两个分开吧。首先我们先单击 y, 同时选中,单击 ctrl, 选中 x e, 首先用足打开,用足打开,我们看到同时打开的变量 y 和变量 x e, 然后单击 real, 用 negro off。 大家可以看到我们出现一个作图选项的一个文本框,这个文本框中呢,我们首我们对其变量 x 一和变量 y 进行三点图的分析,我们在这就选择 scan。 然后大家如果想要得到文中就是红线,也就是我们回归的礼盒的结果,我们可以在右侧的这个线性选择回归线,如果大家不想要这个线就可以选择 note 就可以。此处呢,我们选择回归线,然后点击确定, 大家便可以看到我们做出了一个变量 x 一和变量 y 的一个一个图形,在这呢大家要注意一下,就是此处呢,我们把变量 y 放在横轴上,把变量 x 一放在了纵轴上, 为什么这样呢?它是与你刚开始单机变量的一个顺序有关,如果你刚开始在选中边,先单机变量 y, 再单机变量 xe, 那么变量 y 就在此,横轴变量 xe 就来纵轴。如果大家想要颠倒一下,我们便可以先单击 x 一,再单击 y, 同样的我们给大家讲解一下,此时我们先单击 x 一,再同时按住 ctrl 单击 y, 然后右击用足打开,按照同样的方式 作图,选择 scanter, 然后选择回归线单击确定。在这种情况下呢,大家便可以看到我们的横横轴就变成了变量 x e, 纵轴就变成了变量 y 了。这款呢,很多同学不会操作,这儿给大家讲一下好。 嗯,变量 x 二与变量 y 的内变量 y 之间的一个作图分析呢,和这个是一样的,我给大家讲解一个就行,大家就是参照就可以。那么接下来呢,给大家讲解一下这两个图该怎么分析。首先看变量, 第一幅图,变量 x 一与变量二之间的一个关系,大家可以看它们的散点,就整体来看,它们的散点就是当变量 x 一 增大的时候,同样的变量外也会有一个增大的趋势,也就是说他们的趋势是向上的,我们用回归线拟合出来的结果呢,也是一个整体的向上趋势。 同样的看变量 x 二与变量 y 之间的关系,也是一个微弱的向上趋势。从这两幅图呢,我们就能够看到大概的一个变量 x 一和变量 x 二与 y 之间的一个相关程度。