斯达特如何计算墨兰指书?归之墨兰散电图我们先来看下 say 坎上的论文。墨兰指书衡量地理要素的空间急居程度, 也是做空间计量模型的必要步骤。墨兰指数为证,表明要素呈现高值与高值,低值与低值的真空间集居。这里墨兰指数就是显著为证。上面我们看的是全局墨兰,下面再看下局部墨兰 有点累,你们自己看下这段文字,理解一哈。 通过闪电图可以知道每个地区所在乡鲜。下面我们进入实操环节,这是俺之前做的三十省份绿色金融数据数据复制粘贴到 stop, 可以看到数。 数据是类似洁面格式,我们来转换成面板格式。你是不是在 excel 里面一个一个拉成面板,我们用 receive 命令一键转面板,这样我们的数据流成面板格式啦。 当然,我们也可以把面板格式的数据转成类似洁面的。依然是 reshape。 言归正传,我们来计算墨兰之书。我们要准备 story 命令以及相关矩阵,需要的话可以敌敌我。 以荆棘军离巨毡为例,可以看到墨兰指书全部争相现著。接下来我们再看下如何挥之墨兰散电图。邓啊邓啊邓啊邓啊 噔啊噔啊噔啊噔啊噔啊噔终于来了!把三个图合并成一张图, 我们对图稍加修饰,此处省略一万字,如果你不想显示省份,把这部命令后面删除就可以啦。有些论文会展示每个地区所在象限,我们这里阔顿就是啦。 我们还可以用其他巨针进一步验征。建立燕斯以哈领结巨针和范居里巨针 perfect 斗现注,完成任务。
粉丝390获赞1957

大家好,欢迎来到 sita 数据分析入门课程,我是车水老师,本节课我们来进行第一节 sita 的简介, 主要包含三个部分,分别是熟悉随他的界面,熟悉随他的基本设定以及设置我们自己的工作目录。首先我们来进行第一部分,熟悉一下随他的简界面, 所以他的界面呢,包括四组窗口,两个菜单栏以及一个 输出结果窗口。四组窗口呢,分别是历史代码窗口,密令栏窗口,变量栏窗口以及数据性质窗口。在此基础,在此基础上呢,我们要学会如何浏览数据 和使用度文档。我们来打开斜塔,实地操作一下。双击打开, 我们发现,呃,最先映入眼帘的呢是中间这一部分,它是我们的结果输出窗口。呃,四个窗口呢,分别是 历史代码窗口,是最左边的这一列,比如说我在命令窗口进入一行命令之后呢,在左边他就会出现这个历史记录,如果我双击这历史记录的某一行,他就会重新再运行一次。 第二个窗口呢是命令窗口,我们可以把塞塔的指令呢在这里面建入,然后按回车就可以执行。第三个呢是变量窗 窗口,在右上角,我们可以在这里呃看到每一个变量的名称以及他的标签。第四个窗口呢是性质窗口,在右下角我们可以看到这份数据的名称,标签。呃,数据类型以及 嗯,变量的个数和观测值的个数以及这份数据的大小等等。然后两个菜单栏呢,在最左上角呃,用菜单栏我们可以进行一些基本的统计分析,做图,导入,导出数据等等都可以。 然后呢第二行呢是我们平时用的比较多的,比如说打开文件保存,嗯,然后打开读文档,浏览数据等等。嗯,在 基础上呢,我们来学习一下如何浏览数据。我们主要用的是这两个按钮, 这样单击就可以出现我们的数据,然后第二个按钮也是一样的,他们两个的区别呢就在于第一个按钮可以修改数据,比如说我第一个是一,第二个是二,呃,这个技术上 如果我想要修改的话呢,我打开,比如说我想把第一个数据变成零,那我就直接可以是零 就可以了。但如果我用这个第二个浏览数据的窗口呢,我想把它这个数据再变一下,就不可以这样直接改了。 所以在平时的使用过程中呢,我更推荐大家用第二第二个指令,它类似于指读,呃,这样呢,我们可以减少我们嗯,误误操作导致的数据的变化。然后 接下来呢,我们要学会使用杜文档,杜文档呢,就是这个类似于幕布一样的按钮,我们单击可以打开,在这个里面我们可以写入我们的命令,然后呃选中纸, 点击这个三角形就可以运行。克里尔的意思呢是清除数据,那我们就会发现这里面的数据刚刚进入的数据已经没有了。呃,相比于运用这个命令栏呢,相 我更推荐大家用杜文档,因为杜文档呢,我们可以随时的修改保存,以及和合作者同时使用的时候,我们可以把我们的写过的杜文档发给对方,然后在对方呢在你的杜文档基础之上再进行 修改呀,运行之类的都是可以的,这样就更方便更有嗯,修改的余地和更有操作性,也对我们的合作有一些有很大的帮助。嗯,比如说我们 来举个例子,如果我想浏览一下系统的数据呢?我们用 ccuse 这个命令,比如说系统有一份数据叫做 out, 嗯,我们可以 选中,然后点击这个三角形运行一下,就发现我已经把这个,呃一九七八年的机动车的数据 已经掉入进来了。是这个,那我们就可以发现呢,在看右上角可以看到变量的名称和标签,右下角可以看到这一份,嗯,变量的名字, 呃,数据的名字以及数据的标签,然后观测值的个数,嗯,变量的个数都是可以看得到的。好,我们 现在呢来看一下随他的基本设定。呃,因为刚刚开始了解一个软件的话,我们要呃把它设计成我们 喜欢的样子,我们如何设置呢?在 id 的这个里面呢,最下面有一个 praprans, 我们打开这样的 praprans, 我们就可以设置我们这个界面的, 呃显示的属性,比如说这个这个里面有主题,是标准主题,或者是呃什么经典的主题都是可以的,比如说我用标准主题点击 ok 就可以了。呃, 然后呢,第二个我要说的是要学会嗨老婆功能,可以让我们的效率事半功倍。比如说有一个命令叫做三木 s, 是用来做描述性统计的,但是呢,我不知道这个三木 s 是什么意思,那我就要在前面 加一个嗨,然后呢,嗯,直接回车来执行一下这一份,这个代码就可以出来了,他就会跳出来一个嗨,要普文档,告诉你这个三 ms 的命令是用来干什么的,他首先跟你解释这是一个用来做描述性统计的命令, 然后告诉你这个秘密应该怎么用。呃,首先进入三木 s 或者是 su, 就代表了三木 s 这个单词,然后 后面呢加入你的,嗯,变量的名称,后面再加 f 选项,应选项括号呢代表嗯,可加可不加是, 嗯,可以根据自己的需要去加的,然后可以加一些选项,然后有哪些选项呢?后面都会给你列出来,然后呢在后面他会 告诉你用菜单栏呢如何实现这个功能。呃,然后后面呢会给你举一些例子,让你更深刻的来理解这个命令。 所以说如果遇到一些不会使用的命令的时候呢,我们一定要学会使用哈尔普文档,然后也要学会如何阅读哈尔普文档。好,第三 部分呢是设置我们的工作目录,首先我们要来看一下当前的工作目录,用 p wd, 用 p wd 这个命令来实现。 没车,我们就发现当前的工作目录呢是地盘下的四件套。呃,那如果我想改变我的工作目录该怎么办呢?我用下面这一个命令 cd, 然后呢再把我的想要进入的目录在 写进来,比如说我想进入的目录呢是 f 盘。好,那呃,我已经设置到 f 盘,我们来验证一下,用现在的 p wd 发现呢当前的工作目录呢是 f 盘了。呃,还有一个呢是要查看系统的目录,用 casd 啊, diydl 呢,就是 draxdrax, 就发现呢有,所以他呢有六个文件夹,然后分别的系统的路径在哪里?我们如果想改变其中的一个呢?啊?当然是 都是可以改的。我这里演示一个,比如说我想改变这个 plus, 他的路径用 cs 镜。 啊,我想改变 plus, 所以我要把 plus 加进来。然后你想改到哪一个路径?比如说我想改到 fpard, 比如说我想改到地盘的四件套 的 a 度下面的 pass。 那执行一下就可以了。那我验证一下我这个改成功了没有?再用一下 cs, 然后呢就发现我的 plus 已经到了我刚刚设置的这个目录下面了。好,这就是本节课的内容, 我们学习了 cta 的界面、 cta 的基本设定,以及如何设置我们的工作目录。

大家好,欢迎来到水塔数据分析入门课程,我是车水老师,今天我们来进行第二节杜本党的使用, 主要分为两个部分,第一部分是杜文党的简介,第二部分呢是杜文党的写作规范。首先我们 来简单介绍一下杜文档,简单来说杜文档就是塞塔命令的结合,他的优势在于方便我们一次性的执行多条塞塔的命令,相比于代码窗口来说,他就更加的方便 啊,并且呢我们执行的代码具有可重复性,有很多期刊杂志的杜文档和数据都是在网站上可以下载到的,我们下载到他们的杜文档之后呢,也可以进 进行相应的操作,就可以复线文章里面的内容,所以杜文档的使用是非常的方便的。嗯,其次呢,我们要学会如何设置杜文档的属性以及执行杜文档,我们来 打开杜呃,塞塔操作一下。杜文档的打开呢,就是在菜单栏里面这这个类似于白布一样的按钮,点击单击就可以出现杜文档, 如果我们想设置属性呢,在这个艾地特里面下面有一个 pfris, 然后打开,我们可以设置字体,字号啊,颜色高级之类的都可以,我们根据自己的喜好来设置就可以了。然后如何执行 杜文档呢?如,如果说,呃,比如说我先写两行代码,第一种方式呢是我可以选中,然后点击这个三角形运行, 也可以一次性选中多条点三角形运行。还有一个比较快捷的方式呢,就是在啊键盘里面按住 ctrl 加 d 就可以一次性的运行了,在这里写一下 ctrl 加 d 运行,然后呢我们有必要来学习一下杜文档的写作规范,主要学习两个方面,第一个是呢是如何注视语句,第二个是如何段行。首先我们来看 如何注视语句,就像刚刚我演示的这一种,就是第一种的注视方法,先加星号,然后在后面写注视的内容。第二种方式呢是 啊,双双杠,比如说我调用一份数,调用一份系统数据, 我想在这个后面添加注视的话呢,我添两个双斜线,然后在后面写我的注视内容,比如说要用数据 数据,好,这是第二种注视方法,嗯,然后第三种注视方法呢是双斜线,中间再加两个星号, 比如说,嗯,算,那我双斜线,然后呢中间再加两个信号,在两个信号之间写我们的注视内容,比如说这个的注视内容是 描述性统计,这样呢我们就可以啊,很好的写我们的注视内容,然后下一 一个内容呢是学会如何断行,断行也是有两种方法,第一种比较常用的呢,是用三个竖线断行,要 用使用的场景呢,是我们的代码比较呃长的时候需要使用,比如说我先调用这一份数据, 然后呢我想描述 plas, mpg r e p 七八 t, r c, ok, reat。 然后呢我发现比如说我的肚纹档有这么大,然后我再往后写呢,我发现这个我我看不到了,怎么办?当然你不断行也是可以的,但是这样的话呢就 不太好显示,然后最后的结果也不太美观,那我们就那就选择用合适的方法来给他断行。第一种方法呢就是后面添加三个竖线,然后把竖线后面的东西三个斜线,然后把斜线后面 东西回车打到第二行。然后我们要注意的一个点呢是在断行之后,两行的内容要同时选中一起运行, 那如果我不只选中一行的话呢,就是无法达到我这个断行的目的,他就呃 三个斜线之后,所以他会认为你这个密语句还没有写完,所以他不会出现任何的结果,所以我们一定要把呃这一段的代码同时选中一起运行,然后第二第二个段行的方式呢是呃 类似于刚刚加注视的方式,也是两个斜线中间两个信号,但是它的区别在于呢,就是 第一个斜线和信号在第一行,第二个斜线和信号在第二行的开头, 然后这样才可以。如果你第二行不加这个的话,那么谁他会认为你这个后面第二行的东西是注视 就是绿色的,所以只加入这个写信号和斜线,他才会认为这是你断行之后的结果。那我们要运行的时候呢,也是要两行同时选中,然后来运行 这个段行的方法以及注视的方法是非常非常实用的。呃,还有一个杜文档需要注意的点是我们要我们在 在使用的时候要经常的保存度文档,而不是保存数据,就比如说这个代码,那我在写入第一行 k 二的时候,那我就要把这个度文档来保存一下,保存到你想呃保存的位置,比如说我想保存到这个位置,然后我的名字呢是 杜文档的使用,然后我在在在这个基础上再 对杜文档修改的时候呢,这个地方就会出现一个信号,他的意思是你这个杜文档已经啊被修改了,那你要再重新 保存的话呢,要按 ctrl s, 那他这个信号就没有了,我写一下 ctrl s 保存。我们在使用度文档的时候呢,要经常的保存度文档,而不是经常的保存数据,因为, 嗯,只要保存了不文档,那么你在对同一份数据进行相同的操作的时候,那他的结果会和你之前的结果是一样的,所以我们一定要注意这个方面。 好,本节课我们主要讲了杜文党的相关内容啊,包括杜文党的设置,如何执行,如何打开以及如何呃,写注释以及断行等。

哈喽,大家好,那么上期视频给大家分享过中介效应,但是上次的教学数据呢,是很简便数据,然后很多人留言说想看看面板数据的中介效应,其实总体思路和步骤都是一样的,只是具体操作稍微有区别, 那么今天这期视频就一起来学习一下面板数据的中介效应。那么右边依然是我常用的一个呃面板教学示范数据,然后我的个体 id 年份页,然后 y x x r 这样子。 呃,左边的仍然是我这一期会用到的一些呃代码,到时候我也会放在知乎文章里面或者是评论里面。嗯,首先呢,呃,我们第一想介绍面板数据中介效应的第一种方法就是最简单的逐步 回归,那由于面板数据有时间和个体,所以呢,最小二乘法是肯定不行的,所以我一般也不说不行,只是我习惯了使用多维固定效应。那么其实具体使用哪一种? 呃,具体的回归模型我们可以自行安排。呃,简单的就比如说我上期视频分享的几种固定效应模型,呃,我这里呢,以多为固定效应进行示范。 呃,我的数据中,我假设的是我的中介变量是 x 一,自变量是 x r, 然后控制变量是 x 三,这是我,这是我假设的中介变量 m 是 x c, 所以首先我们要呃,首先我们跑的第一个回归应该是自变量 x 对 y 的一个影响,也就是要检验系数 c, 那这里呃 a b c c 撇这个呃,具体的大家可以看我上一期的中介效应的视频,讲的比较详细一些,那这里呢,我就直直接略过,然后我们直接直接跑代码,然后给大家解释结果。 我们先检验系数 c, 然后把这个模型先保存下来。我们跑完一个先别着急,看它的结果,就是一般是要把这三个的跑逐步回归,跑完之后,然后放在一起看这个结果。 我们再来检验一下自变量 x 二对中介变量的一个影响,刚才检验的是自变量 x 二对 y 的影响,接下来检验,接下来是检验 x 二 自变量 x r 对中介变量 x 一的一个影响,然后我们把这个模型的结果保存一下,嗯,接下来呢,最后就是,呃,加入了中介变量之后,那么 x, 也就是说控制中介变量之后,我们自变量 x r 对 y 的一个影响, 那 x 三是因为是控制变量,所以我每步骤都放进去了,然后这样我们的 a、 b、 c、 c 片儿结果基本上都出来了。然后我们把这三个模型的结果导出来,然后放在一起看 s step 命令的话我也讲过好多次了,在我的视频里面也有教学视频,大家可以自行去学习。我们看一下这三个结果,我们可以看到这里,呃,因为我命名的时候,我第一个模型抛的是 s 三,我们不看,因为 s 三是控制变量,所以我们这边容易都忽略掉。然后我们看,呃,第一个模型是 x 二对 y 的一个影响,也就是我们的系数 c, 我们的系数 c 是不显著的。然后接下来我们看第二个模型,第二个模型主要是检验 x 二对 x 一, x 一是什么?是我的中,是我的中介变量,然后 x 二对中介变量的影响,我们是称为系数 a, 大写区分一下,然后是我们的系数 a。 接下来呢,我们在控制了中中介变量中介变量 x 二之后,我们的呃,不是控制了中介变量 x 一之后,我们的自变量 x 二对对 y 的一个音响,那么这里,那么这里就是我的 系数 c 撇儿,这里 x e 对 y 的影响,也就中变量的中介变量对 y 的影响是我的系数 b。 那么至此呢,我的系数 a, b, c, c 撇儿结果都出来了,那么很明显,我这个结果呃, c 撇不显著,我的 a、 b, 我的只有一个 b 是显著的,那么这个明显结果是不存在中介效应的,因为我们可以看到 x 三是中介,是控制变量,我们正确不看,我们把它删除吧。 然后首先看看 x 二,呃, x 二对 y 的印象,不显著,也就是系数 c 不显著。接下来是 x 二对中介变量 x 二对中介变量 x e 也是 不显著,也就是系数 a 也不显著。最后呢,控制了中介变量 x 一之后,那么我的自变量 x 二对 y 也是不显著的, c 撇也是不显著的。但是我的中介变量 x 一对 y 显著, b 显著,但只有一个 b 显著,是也是无法 真实真实中介效应的存在的,所以,呃,结果就是不存在中介效应。 那么这这一种是逐步回归模型,嗯,大家就根据 a、 b、 c、 c 片来看就可以了。嗯,最好的结果就是 最好的中介结果,也就是我的 a、 b 都显著, c 也显著,但是 c 撇不显著。那么这种情况呢,就是一呃 c 撇,嗯, c 撇不显著,那么这就是一个完完全中介。如果 c 撇显著,那 就是部分中介, 那么介绍完了第一种逐步回归模型,那么,呃,接下来重点介绍后面两种回归模型。第二种呢,系是我们的系数乘级法,也叫我们的苏贝尔检验,然后这里,这里是他用的一个代码, 因为在这个,嗯,这里是 y, 然后 m v 里面放的 m 是指中介变量, i v 里面的 x 放的是我的自变量 x, 那么 c v 里面放置的是控制变量,嗯,对于面板数据,我们还可以 控制它的个体和时间虚拟变量,嗯,这里我们要注意的就是因为这个 c v 里面是不能用 i 点 i d, i 点 province 或者是 idea bank, 银行或者是什么来生成虚拟变量,只能手工生成,所以我们只能以这样的方式来生成我们的个体的虚拟变量,大家这里可能要注意一下, 那么对于我的数据,我首先是应该先生成呃,个体的虚拟变量,如果你要控制个体的话,你要先用这种方式来来生成个体的虚拟变量。 我的个体是 id, 所以我直接输入这个代码,如果你的个体,比如说是 province, 你就 id 改成 province 就可以了。 我,因为我是三十一个省份,所以我生成的虚拟变量就是 id 一到 id 三十一,所以我在这里输入我的,嗯,所以我在这里输入我的代码的时候,我, 我这里我的应变量是 y, 然后 mv mv 自变量是 x c, 不好意思, mv 里面放的是中介变量,我是 x c, 然后 iv 是放的自变量,我是 x r c v 控制变量,我放的是 x 三,然后我觉我还要控制 个体,所以我还要放 id 一的 id 三十一,因为我有三十一个 id, 我是三十一个省。然后后面这个 credit 女士表示不显示逐步回归的结果,也就是不显示这个上面的这个 a、 b、 c、 c 片儿这些结果, 因为我们只需要看最终的那个叙述成绩法的那个检验结果书通过就可以了,这个是比逐步回归更加一目了然的。我们直接跑代码, 这里,呃,这里,呃,中间这一部分应该会首先出出现一系列的逐步回归,因为 我加了这个,所以不显示,然后我们直接看这个结果,首先是看这个这个检验结果,这里的皮质是显示我是否存在终结效应,很明显这里不显著是不存在的。然后接下来我们再看一下这个,呃, indirect 就是这里,这代表的是间接效应,然后 direct 是 是直接效应,这边是总效应,那么最主要的是要看这个 propertion, 这里就是中介效应所占的一个比例,有中介效应,我这里占的比例才百分之天呐,才才百分之二,所以特别低,基本上是不存在的。 百分之二点三九,很低很低,所以在我这个呃,在我这个系数成绩法检验中,我的中间效应也是不存在的。 那么这就是第二种方法,也相对来说是比较简单的。需要注意的只是这里加入了控制变量,不能用 idid 生成,要先生成个体的虚拟变量,然后到时候会把代码放在文章里面,大家跟着呃,这个代码一点点的跑打,应该就是会比较简单一些。 接下来呢,我们重点介绍第三种方法,自助法,不 strap, 用这种方法是一种制性区间的方法,是通过 a b 制性区间来判断中介效应 a b a 系系数 a b 就是一种间接效应。 那么知性区间的优势就在于他不仅能够判断中性中介效应的有误,而且我们知性区间的一个宽度嘛,还可以提供中介效应大小变异的信息,那么给出的是一个呃,一个大,一个一系列科 可能的值,而不是一个唯一值。那么这个是前面的检验方法所无法提供的,但是这种检验方法的前提也是正态分布,然后这个检验我们主要看的就是 indirectifact 间接效应和直接效应,当我们所看的就是一个间接效应, 呃,那废话不多说,我们直接就跑代码,然后呃根据结果来给大家进行解释吧。那么这边就是我的代码呃我的应变量 y, 然后 mv 里面的 x 一是我的一个中介变量, xiiv 里面放的是自变量 xcv 里面放的是一个控制变量 x, 嗯,接下来我们直接就哦,我因为我前面跑系数成绩法什么的,我都控制了一个个体的虚拟变量,所以我在这里也应该再加上我的个体。 然后接下来我们直接就泡这个代码, 这个代码好像跑的的确就比较慢,而且它呃容易不稳定,这个 boost trial mini 有时候不稳定可能会出现一定的错误,我们一般用高一点的版本,或者是稍后再重启 slater 再试一下,我有时候也会出现这种情况, 那么这种 bosstrap 呢?与其他的一个中介效应的检验方法来说,呃具有一个更高的一个统计效力,嗯,那么这也是有文献佐证的。大家在写文章的时候,比如说要用这种方法的话,可以找一下相关的文献进行一个 引用。 那么这个方法的结果判断主要就是根据一个间接效应 a、 b、 c 数的一个执行区间是否包含零,来判断中介效应是否成立。 那么如果它包含零,则是中介效应是不显著的,那么 a b 有,可 a、 b 的成绩有可能是为零,所以我们是不能证明存在中介效益的,如果不包括零,则中介效应是显著的。 那么很多人为什么都会问,为什么包括,为什么包括你就不显著,不包括你中学效益就显著呢?嗯,那么这个原理的话,呃,其实网上有很多的文献或者一些文章都有都有说,然后大家可以去学习一下, 我这里就不过多赘述了,然后这里我们可以看到他跑出来了,嗯,然后这里的 b x c indirective back 就是我们要找的一个间接效应。 direct 就是直接效应,那么主要就是看 b、 s、 e 这边的一个直行区间啊,很明显我这里的直行区间怎么样?是包括你的,说明我们的这个中介效应是不显著的。我们或者我们跑一下这个,看一下详细的直行区间, 我们可以看到这里 n 代表的是什么? p b、 c 主要是看这个 p 是一般的直行区间 b、 c 这里是一个偏差矫正的一个偏差,偏差矫正的一个直行区间,我们可以看到这边四个直行区间基本上都是怎么样, 包括你的,说明我们的中介效率是不显著的,那么跟我们前面的两种方法的检验结果是一致的,我们主要就是看这个 bse 这个 性区间是否包括零,然后如果是包括零,说明中介效应是不显著的,我这个结果就是不显著的。如果这边的中介效应呃不包括零,则我们的中介效应是显著的。那这里有很多人还会问一个问题,就是我们可以看到前面这个 b s e 这个 bs, 它提示的是 indirect 间接效应 bx 直接效应,那么我们这边的间接效应是不显著的。嗯,在这个不 strap 这个命令命令的情况下,我们主要就是看它的一个直线区间,呃,一般这里呃就是有一些, 就是有时候我们会出现,比如说我们的呃直接我们的间接效应 bs 一,他这里的屁值是呃是不显著的,但是他这里的置信区间呢?又怎么样?不包括你,那我们的中介效应是 显著还是不显著的呢?呃,大部分,我看到文献大部分都是还是会以执行区间为主,然后只要他不包括你,我们就能证明,呃,终极效应是就是在这种检验的前提下,证明终极效应是显著的,重点还是会看这个执行区间。 当然这也不是说绝对的,我只是嗯有一些疑问,然后也在这里 呃,说一下我,大家如果有不同的看法的话,或者有一些嗯,有一些更多的一些发现,可以在我的评论区留言,大家一起呃学习进步。嗯,那么今天这期视频我就到这里结束了,非常感谢大家的支持。

我们今天主要来说一下,当我们去做时政性论文的时候,导师或者学校要求我们去做 state 面板数据回归的时候,我们要去做的一些板块。那么首先的话就是说我们面板数据的一个适用性,它的话比较适用于我们的金融、经济、会计、统计等等这些啊,偏经济类型的这个专业, 我这些专业的话,可能,呃做这个面板数据回归的话,他的嗯通过率会稍微高一点,那么下面的话就是做这个输了面板回归的这个主要内容。咱们这一次的这个 呃视频的话,主要是针对我们的这个说论写作的啊,主要是针对写作内容去进行的一个说明。那么我们写作内容的话主要分成这以下八个板块, 第一个描述性,第二个多重贡献性,三相关死模型啊。到第八个,那么我们针对每一个板块进行一个简单的说明。首先就是我们的描述性分析这块,我是截了一个已经发表的这个论文,那么这个文章的话,呃,我们看一下描述性分析,一般情况下他的这个模式就 下面这个图表,哎,他第一列就是咱们的变量,第二列是个数啊,就是你收集了多少组数据,然后我们一般情况下去标注的数值就是极大、极小和均值标准差,那么通过极大值、极小值还有我们的均值的话,我们大概就能知道这个变量他目前处在哪一个。呃,分级上, 比如说我们这个 to be q 值,他指的是这个企业绩效,那么我们看最小值零点七,最大值十三,他的均值在百分之,呃在二,那就说明我们所收集的这个研究对象,他整体来讲企业绩效是处在较低水平的,对吧?他二和零点七,呃,零点七和十三,哎,我们去去取他的均值的话,可能在七左右 啊,六左右,那么呃实际上他的均值在二,那他远远小于我们理论上算出来的均值。所以啊,这块的话,我们可以通过这种就是比较简单的方式去描述一下。那么标准差的话,他指代的就是我们说了我的整体他处在一个中等偏下的水平,那么各个企业之间的差异大小情况是怎么样的?我们就从通过标准差去进行一个说明,标准差 他越大,说明各个企业之间的波动程度越大,这是这个描述性分析。那么描述性分析他的目的主要就是去说一下我们整体收集了一份数据,那这个数据假如说我们是对企业去进行描述的,那我们收集了这些企业的分布情况,大致一个怎么样的一个情况?有没有一些极端值? 比如说这个透明 q 值,我们都知道企业绩效,那如果说我有一个极大值,他是几千或者几万,那可能这块就有点问题。我们通过这样子简单的一个排布就能够看出来我数据第一个我数据有没有问题,第二个我数据的这个均值情况,他是否符合现状啊?跟现状去对比一下,如果跟现状严重不符合的话,那也说明我们的数据是有问题的。 所以这块的话就是去简单看一下数据的分布情况,看一下数据是否贴合实际情况,那么我们做描述性分析代码的话,这是一个呃简单的代码,然后第二个的话就是多重贡献性检验,这个的话,嗯,其实有一些争议,就是有些人觉得呃不应该去写这个多重贡献性,就没有必要去写,有些人他又觉得这个多重贡献性 他是呃比较有必要的,那么我们在这块的话就可以根据实际情况啊,就是说如果我们你可以看咱们学校呃历年来的一些文章,他有没有写这个都是关键性,如果没有的话,那咱们也可以不写,如果有的话我们就给他加上,或者后期导师要求加上的话,我们就给他加上。 那么这个多重贡献性的话,他的本意是想去说我所选择的这几个变量,他的多重贡献性就是他的,他们之间没有一个强相关性, 那呃啥意思呢?就是说假如说我选了 x 一到 x 七七的变量,那如果说我 x 一和 x 二它们两个的这个相关性非常强,比如说 x 一和 x 二相关性零点九几, 那那是不是就说明 x 一和 x 二他们所解释的东西啊?有百分之九十的这个信息都解释的是同一个,那我 x 一 x 二保留一个变量就可以了,对吧?那多重贡献性的话,他其实就是去呃降低因为变量和变量之间相关性太高而导致的。对,最后我们的回归结果的一些差异,那么我们通过多重贡献性检验, 我们主要是通过这个 vif 的值,如果 vif 是小于十的话,我们就认为没有严重的都是贡献性,那如果有的话,我们就得把有都是贡献性的那个值给他剃掉,然后他的代码啊,就是这个代码。 然后第三个的话就是咱们的相关性啊,相关性他的表格的话展现就是这样子,一个倒三角的形式,然后里面的这个值的话,就是我们的相关系数啊,一般是负一到一之间,那这个相关系数的话,嗯, 也是有一些问题,就有些人觉得相关系数是不是越大越好,或者啊负向的越大越好,其实这个值的话就是多少就是多少,我们主要看后面的这个显著性。当然如果你的相关性太大了,他并不是一件好事。就我刚才提到的,如果相关系数,就你的所有变量之间的相关系数,他都非常大,比如说都大约的零点八、零点九, 那么我们就可能啊变量之间存在这个严重的贡献性,哎,导致你后面的结论可能有问题。那么我们一般的这个思路就是我先做一个相关,然后我通过相关发现,哎,我的这个系数啊,我的相关系数的话,他都比较正常,就是,哎,零点几啊,零点一, 一级,二级啊,三级啊,这些其实都正常的啊,如果没有那种满天都是零点八、零点九或负的零点八、零点九,那么我们就不用做,都是贡献性。如果你满天都试的话,你就得做一下,看看要不要去提出变量, 这是相关性分析。然后这是他的一个代码啊,这个代码简单说一下,这个前面的这个的话就是他的命令,然后后面这个变量的话,就是你要做相关性的所有的变量,把他的名字给他打上去,然后销会说啊,他就会输出来这样子的一个表格。 然后接下来的话就是我们要做回归分析,那么相关性分析论初步论述了两两变量之间的一个相关性,那么我们要进一步去论证因果关系的话,是要去通过回归分析。那么面板数据和洁面数据不一样的点就在于我们在用 面板数据去做回归的时候,是要有一个检验的,就是面板数据他有三种模型,第一个模型叫做固定效益模型,第二个叫做随机效,第三个叫做混合效益模型。那么这三种模型的话,并不是说我预先一开始我就知道我要用哪一种模型,然后我就直接用,他是要根据我们的数据去进行检验,然后 得出来我的数据最适合于哪一种模型,它是这样子的一个思路。那么对于我们经济学来讲的话,我们一般情况下用到的模型最常用的就是固定效率模型, 然后对于一些比如说,呃,心理学呀啊这些这些专业的话,他可能就更常用到的随机效应模型啊,最少用到的就是咱们的混合效应啊,如果用混合的话,那其实可能就说明我们的这个面板数据他,嗯 啊,这个不太适用于啊,不太适用于去做一个面板数据了,所以在这块的话啊,有一个这个模型检验的这个图,这个图的话就是我们分别要做的检验,然后这个 f 检验的话,我们只带就你做 f 检验,可以从这两个模型里面去挑出来一个你,我们就发现这个检验他只能从凉凉里面去挑,所以 我们要从三个模型里边挑出来一个最适用于的模型,最适合的模型的话,我们至少得做两次检验。那比如说我先我一般的,我们一般的常规速度,因为咱们是固定小于模型,就是这个 f e 模型,这个是固定小于模型,然后这个 p o l 是我们的混合 r e 的话是随机 效应模型,那我们一般呃选择的是固定效应模型,所以咱们的顺序就是先做一个 f 检验,那么做 f 检验我们显著呃这个 f 检验的这个结果通过了,那么我们就说我在呃固定效应和混合效应模型里面选择了固定效应,但是随机效应我们还没有检验,所以我要再进行一个 hostman 检验, 进行下面的这个笔检验,那么下面的这个检验就能从固定和随机里去挑出来一个。当你的 f 检验和 hostman 检验同时都通过,就是 p 值小于零点零五的时候,我们就选择固定。当你 f 检验通过, hostman 检验没有通过的话,我们就选择随机啊,这是这个,然后分别呃下面的话分别就是它的两个代码, 然后这块有我们需要改的就是这个 y 指代的就是咱们的音变量, x 指代的是自变量,到时候我们要把对应的自己的 y 和 x 带入就行,下面也是一样的, y 和 x 是要变的,其余东西都不用变。下面的话就是咱们的回归分析啊,或者说啊回归分析里面我们包含一些中介机制呀,调节机制的检验,那么我们一般会把表格做成这样子的一种形式啊,做 这种形式,然后他的这个,嗯,代码的话,我们就在这边啊,一般情况下我们选择固定效应模型的话,就上面这个代码,当然这个代码的话,他他并不是说唯一的这个代码是最简单的一种代码,就我们直接一看我大家就能记住了,哎,这就是做固定效应模型的一个代码,那么如果我们想通过代码把这个输出的结果,因为他用这个代码输出的结果,嗯,非常的这个 就是不像,不像这块这么美观啊,不用你再去调整啥,你这个做出来的那个表格的话,他还需要你后期进行整理,整理成这个样子,所以啊,这个这个代码他就不是唯一的,我们还有一些其他的代码,但是比较复杂一点,他能够帮助我们去把表做成这个样子啊,这是我们大概了解一下, 这是回归分析,那么回归分析的话,我们主要就是去解释在这一块的时候,他就跟相关系数,相关分析那块不一样了,那我们通过相关分析可以简单的去描述一下边两两两之间的一个相关性,那么在回归的话,你就重点得去解释一下我们的回归系数是正的还是负的啊?是大于零还是小于零,然后解释它的显著性是 在多少的水平下显著,对吧?然后括号里的值,我们一般把它叫做呃 t 检验的值,这个值其实跟星号他们两个所代表的呃就是他们俩,他们俩所所展现的内容其实是相同的,都是在说我得到的这个回归系数他是显著的, 然后呃基本上星号和这个 t 值是呃对应关系啊主,然后如果,比如说我们自己的数据呃不太显著,然后有人把这个数据给他改了,哎,比如说,比如说这个值对吧?负的零点五六二六,那他本来是不显著的,然后我们呃可能有些人把它改成了显著,然后他下面的 t 值没有改那么一眼,那就是咱们了解 stata 的人一眼就可以看出来这两个是不对的啊。这是这个回归分析 下来的话,就是咱们的一个稳健性,检验稳健性的方法非常多。啥叫稳健性呢?就是我用另外的一种方法去验证一下我刚刚得到的这个结论是不是正确的,或者说我得到的结论是不是一个偶然性的结论。那么我们稳健性的方法的话,就比如说最常用的替换变量法,第二个的话就是改变呃 年份,就比如说你原来研究的是呃一零年到二二年,那我现在把它改成一五年到二二年,再次做上面的回归,看一下结论是否一致。那么替换变量法的话,顾名思义就是把我们某一个关键变量的量化方式给他换掉,那么咱们一般替换变量主要是替换音变量, 因为应变量是贯穿始终吗?不管你哪一个分析,他应变量都要参与,所以我们一般就把这个像这个企业绩效,他原先用的是这个 topico 值,我们就可以把它换成比如说这个企业的资产报收率啊,企业的净资产收益率啊等等这些指标。那么把这些变量换掉之后,我再一次去做上面的这个回归,看一下结论是否有差异 哦,但是要注意的是这个结论是否有差异,并不是只代到我的回归系数一定要相同,或者我的显著性一定要相同,这块指代的就是我所用两组数据做出来的结果。哎,他的正负性是否一致啊?他的显著性是否都显著,不用去管那一颗星,两颗星还是三颗星,只要他都显著就行,这是稳健性。嗯, 我们先从这个内生性检验的含义来讲,他就是说这个模型中一个或多个解释变量与误差项存在相关关系,那么说白了,这个解释变量就指的是咱们的音变量字变量,误差项指代的就是我们对音变量有影响的其他变量。那我举个例子,比如说我们去论证学习态度对对学习成绩的关系,那么 存在内生性的这个从他的含义来讲的话,就是我们的这个自变量学习态度和影响学习呃,成绩的其他变量存在相关性。如果有这种关系的话,我们就说,哎,可能会存在内生性问题, 那么呃,他并不是说,哎,他这个含义是这样子的,但是并不是说产生内生性就只有这一个原因。我们产生内生性的原因非常多,这里我们主要说 写作过程中最常遇到的第一个叫做遗漏变量。这个遗漏变量的话,其实就是在说我们文章中,因为你一篇文章研究的内容是有限的,你不可能把所有的东西都研究透,所以肯定会存在遗漏变量问题,那么你遗漏的那些变量就可能会与你的字典 有关系,就我刚才说的这个学习态度,他可能和一个我们没有研究到的,但是能够对音变量学习成绩产生影响的啊,有关系,他们俩有关系就可能会有内生性问题。 第二个的话就是互为因果,互为因果的话就是主要指咱们的呃解释变量和背解释变量,也就是字变量和音变量之间,我们理论上是认为字变量去影响音变量,就学习态度会影响我的学习成绩,但是有有很多情况哎,比如说我觉得这个例子 反过来也是可以的,就是当我的学习成绩比较高的时候,我的学习态度其实也会有一个变化,这个就是互相影响,互为因果,那么互为因果的话,他也会导致我们的内生性问题。当然还有一些其他的,我们这里就比如说一些呃存在测量误差呀等等等,我们在这块就不再去赘述,因为他呃没有办法解决啊, 就是在我们的写作过程中。然后第三个的话就是我们当我们存在内生性的时候,我们常用的最常用的办法叫做或者说呃文呃写作过程中最常用的办法叫做工具变量法,但是还有些其他的,我们这块就不过多展开。 然后我们对工具变量找寻的要求的话,有下面这两个要求,第一个的话就是要与 x 有关,第二个与 y 呃影响 y 的其他变量无关,也就与我们的残差项无关。那么这块怎么样去解释呢?就是内生性问题,我们用工具变量法去呃去检验它的时候的逻辑其实是这样子的, 是我们现在说 x, 它和我没有研究到的,但是能影响 y 的变量,它有关系,所以导致了内生性。那我现在能不能去找一个工具变量,它既能够, 嗯,跟 x 有关系,就是它既能够代替 x, 然后它又与这个影响麦的其他变量无关。那如果我能找到这个变量的话,我就可以拿这个工具变量指代我的字变量去进行回归分析,那这样子的话 就能够确保我的这个自变量就是咱们的工具变量,到时候就变成了自变量嘛,就能够确保咱们的自变量和呃残差效是没有关系的,那这样子就能够确保最终的结论他是不存在内生性的呃,但是往往呃我们工具变量的找寻的话,它的难度非常大。就是我们 如果是说论或者不是论文,甚至本科论文,如果我们要去做内生性的话,其实一般都不建议我们自己去创造这个工具变量,我们一般都是去别人的论文或者文章里面去找,比如说我还是刚才的例子,我们去验证学习态度和学习成绩等。然后现在我导师说了,这有内生性问题,你得去找一个工具变量, 我们就在织网里这两个变量作为关键词,去搜别人研究的相关文件,去看一下别人在去解决内生性问题的时候用了什么变量,我们直接照搬过来啊,当做我们的工具变量直接去进行使用就行。 下来的话就是最后一个我们的抑制性分析啊,抑制性分析的话他呃就比较简单了,他实际上就是把研究对象去分类,然后重复的进行回归分析,他实际上,呃,因为有,有时候有有些人把抑制性他叫做检验,严格来讲的话抑制性我们一般是一个分析的内容,就是我对回归分析的进一步说明,那我回归分析,假如说论证出来 这个自变量对音变量有一个显著的正向影响,那我的意志性就是我把我的研究对象给他分成呃细小的类。比如说刚才是对企业 进行分析的,那么我们把企业分成了这个江苏,把企业按照不同的省份给他分类了,分成了江苏省和浙江省,那么我对不同的省份去进行一个回归分析之后发现,哎,是不是浙江省和江苏省他们两个之间的回归结果是有差异的?那如果有差异的话,我就要去解释一下为啥这两个省之间有差异。 当然这个分类的方式的话,他并不是唯一的,也不是说固定的,我们要根据自己的研究内容,比如说你是企业,那你就可以分成国企、非国企,那如果你是研究污染相关的,你就分成污染企业和非污染企业,还有咱们的一些呃,大规模呀、小规模呀,甚至企业成立的时间等等。

给大家分享一个胎儿指数的一个计算的一个讲解。首先呢分为两部分,就是第一个是胎儿四种胎儿指数的一个模型的讲解,以及其他的一个应用范围。然后第二个是四种胎儿指数的计算 啊,在本个视频中呢,将运用运用本能制作的一个新密呢,就是就是这个胎儿幺幺这个命令就是可以非常快捷的计算胎儿指数,有四种模型的胎儿指数,然后开始今天的内容讲解。首先是 四种胎儿指数模型的一个讲解,就胎儿指数呢,你会发现在目前的很多文献中呢,他运用是比较广泛的,那他可以来帮助我们分析某一个指标啊,他在不同群主间的一个差异, 就就是我们可以把一个总体他分为不同的群主,就是比如我国分为东中西三大区域,你就可以借助胎儿指数来分析,比如你研究的是碳排放,你就可以分析碳排放的东部、中部、西部,他们的差异是什么样的意见, 他们的一个时间的一个演进的一个规律。然后企业呢,他也可以分为国有企业和民营企业,你可以分析企业,就比如他的净资产收益率就等等这些的差异在国营企业和民营企业之间的差异,那上市公司他可以按照不同行业,比如制造业呀,还有 还有什么煤炭啊,眼睛啊这些行业等等。然后再划分好群主之后,我们就可以利用胎儿指数进一步分解为主内差异和主间差异,就是他可以帮助我们揭示总体的一些结构上的一些特征,然后以及借助胎儿指数呢,我们可以区别就是不同部分在整体的一个差异中的一个贡献,这个就要用到我们胎儿指数的一个贡献率, 当然这仅仅是一个,就是文字上的一个宏观上的表述。然后呢我们下一步可以看胎儿指数,他其实分为他的模型呢,是有四种,就是这个概念呢,就是在目前很多文献中是没有做很多区分的,就是他实际上是就是胎儿指数他 在文件中的慢慢的慢慢的演变发展,他其实有四种的,就第一种呢,他就是这种呢,就是就之前用的比较多的就是 就是以 gdp 为权重构造的胎儿指数,它就被称为胎儿 t 指数,然后以人口为权重构建的胎儿指数的胎儿 l 指数,这是第二种。然后此外基于广义商就是基于这种广义商,像 广义商这个应用就比较广了,就像商职法呀,然后什么托普商、权法呀,都是基于广义商这个处罚的。然后当阿尔法等,就是阿尔法是其中的一个参数,当他等于一时,他这个胎儿指数被称为胎儿记忆一,然后当这个参数等于零的时候啊,自己打错了,这个是阿尔法,当这个阿尔法等于 等于零的时候,它这里就是胎儿 g 零,就是它分为四种。然后我们可以看一下这四种胎儿指数呢,就是它的对数据的要求是不一样的,就是胎儿 t 指数,它的分析呢 它需要两个指标,就比如你研究的是在这里,当然我这里举个例子,就是人口与 gdp 之间的一个关系呢,就是 t 胎儿指数,它是以 gdp 为权重,就后面我们会看一下它的一个计算的一个模型的公式。然后 l 指数呢,它跟胎儿 t 指数它是相反的,它需要它也,它也 啊,相同的是具有也需要两个指标。但是泰尔啊,这边是 l 指数,泰尔 l 指数他是以人口为全中来计算的一个指数。然后第三种呢,就是泰尔基一指数,这个计算呢,就这个模型呢,它的运用范围就比较就更广一点,他只需要一个指标就可以分解。就比如你计算出来了一个 要是生产率啊,还有看排放效率啊,然后以及一个城市的一个区域的一个发展的一个效率啊等等这些你只需要这一个指标,你可以把把一个范围区分,为什么东部、中部、西部啊等等,借助这个基因指数来 进行一个差异的一个分析,就是还是非常的实用的。然后这个 g 零呢,就是他也只需要一个指标,但是就是他的这个参数呢,他是阿尔法等于零的时候,就前面这两个他是就是 类似的,然后下面这两个是类似的,就是他们的模型上有一些细微的区别,这个需要区分一下,就现在很多文件他没有做一个详细的区分,就是很多人其实用了,但是他其实没有明白他的字,他是有四种的。 然后首先我们来看一下胎儿 t 指数的一个模型,然后在这个的里面呢,我们可以看一下, 呃,就是这个 i 呢,它就代表一个区域, j, i 代表一个个体, i 就是代表分组,就是 group 一、 group 二、 group 三这种。然后 j 呢就是分组里面,就比如我国东部,我,我就区分一点吧,假设东南部地区,假设 是第一个分组,东南部地区可能有广东啊、广东、福建啊,然后江西啊等等这些省份是,这是 i 代表一个分组,然后 gi 代表分组上面的一个个体,就这个含义。然后这个 y 呢代表 呃, gdp, 它可以代表很多指标嘛,就是在这里的话就代表 gdp 等指标,然后 yij 就代表某一个省份的 指标,然后这个 y 呢?大 y 呢?它就是代表,就比如我国所有 gdp 的一个和,然后这个代表个体,这个代表所有,然后这个 n 代表总人口,就是我国的总人口,然后 n i g i 代表就是某一个省份的一个人口。然后这个是 刚刚我们展示的,这个是一个整体的胎儿指数,就这一个它是一个 人, 这个计算的是一个整体的胎儿指数,然后这一个你会发现这个胎儿指数,你会发现跟上面这个公式基本上是一样的,对吧?它其实是一个区域胎儿指数, 这个是个区域胎儿指数,然后下面这一个你会发现,嗯,这个大 t 就跟这个是一样的,这个是个整体的胎儿指数。整体胎儿指数它可以进一步的分解嘛? 然后这一个它代表就是 w、 r, 这一个它是代表的是一个区域区域内 胎儿指数,然后这一个 啊,这一个它代表区域间 tire 的数,这代表区域间胎儿指数。然后我们可以来进一步看一下, 就是你会发现在计算区域内胎儿指数的时候,这个 t i 它其实是区域胎儿指数,然后去乘以这个各个区域啊,它占, 就比如东南部区域啊,它占我们全国的这个 gdp 的一个占比,就乘以它,然后再加上就一个汇总,它等于一个区域内,这个可以理解为这个区域。胎儿指数可以理解为这个那种,比如东南部哦,中 部啊、西部啊等等这些区域个体吧,然后这个区域内其实就是他们的一个家权平均,可以这么理解吧?然后这个区域间的胎儿组成,他就他就是一个整体吧,他可以认为跟别的指标没有太大的联系,就是这里唯一注意的就是 就是这一个指标,它跟这个区域内它的计算是有逻辑关系的,就你可以就记住这三个东西它是有逻辑关系的,就可以, ok。 然后 然后胎儿 t 指数的话它的计算不对,然后 l 指数的话,它它其实它的模型的话它是以 t 指数,它是 就是基本上是一致的。然后他只是把刚刚我们举例的这个 gdp 啊人口,他把这个字母换了一下,然后 它就变成了胎儿指数,然后下面一个就是基胎儿指数的一个模型,然后这个运用范围就很广了,就是比广医信息商的一个胎儿指数,然后它的一个计算公式呢,就是这个,然后它的嗯,就是这个东西, 它的原始的这个模型是这个东西,然后然后你会发现这中间有一个参数,对吧?这个就是阿尔法,我们前面提到的当阿尔法等于零时,这个其实就是阿尔法 等于一十,就比如,然后当 alpha 等于一或者等于零,它实际是是 会有极限吧,你会发现他二八等于一,这边是不是就等于零了?这边其实要求一个极限吧,如果当他等于一时,这个利用我们高等数学的知识,可以把这个极限给做出来吧,做出来之后就等于这个,这个就是这个模型呢, 就是积一一积一胎儿之数,然后当阿法等于零时,你把这个积线可以求一下,他求出来等于这个这个胎儿指数就是积一零了, 对吧?所以说这个其实他还是有一个,有一个也推导的一个过程,这个就是你可以还是得简单知道一下,就是还是说他其实是有刚刚我们现到现在为止,我们已经把四种模型的一个大概基本上都讲了, 然后我们再细细致的展开一下 g e 模型,它的表达式到底是什么样子,我们来看一下,然后我们来讲一下这个 g e 模型。 首先呢这个是一个总体胎儿指数,看到这个大 t, 无论什么都看到的大 t 都是总体胎儿指数。然后然后我们这里有一个简写啊,就是这个 u 呢,它代表的是一个 y 的一个 平均值,就是这个 y 代表你要求的一个变量嘛?如果这个 y 呢?呃,我我用这个来写一下, 就是这个大 y, 嗯,代表你要分期的变量,它可以是绿色全钥匙生产率啊, 以及什么效率啊,还有什么什么都市经济发展水平啊, 然后还有什么就是污染程度啊,就等等等等,就是这些你都就是 y, 代表你有 分析的病,因为基它只需要基,它只需要一个指标就可以分析了,你就把这个可以把它求一个胎儿之主,你可以先把它划分为东部、中部、西部等等,这些就是根据你的情况来划分, 所以说他也是比较简单。然后这里我做了一个简写,他代表就是整体的一个平均值,然后这个就代表跟前面我们讲的类似,就是一个, 这是一个个体的一个值,就是个体的一个数值啊,这个也是个体的一个数值,整体的平均值,然后这个就代表 分组,然后这个代表某个分组里面的某个个体。就比如继续用用我们前面举的例子,就比如我们有一个分组叫 东南,东南部吧,东南部,然后东南部里面有哪些省份呢? 这个有这个加一,可能就代表广东、福建、江西等等这些成分,对吧?然后同理,同理这边也是类似的,就是这个恩爱代表就是某一个分组里面的个体的一个数目, 你看 i 代表分组,对吧?然后这个 n i 就代表分组里面个体的数,然后这个 i 就代表这某个分组里面的一个个体,你看注意这个下标,这个代表分组,然后分组里面的某个个体,然后把这个球和这个这个球出来的其实就是 某个分组的一个胎儿指数,你会发现就是跟之前的是类似的,就是就这个整体的胎儿指数啊,跟这个某个区域的胎儿指数,你其实就会发现他们的计算公式基本上是一致的,只不过他这个范围更大一点,他是以 整体为研究对象,然后这个东西他是以某个分组为研究对象,我们基本上是一致的。然后到了第三个公式,就是一个分解了,就整体的胎儿指数,这两个东西是相等的,整体的胎儿指数他会等于你会发现这里 t i 右边这个东西是有联系的吧?那么对吧?我可以把它用一个细的笔来勾一下这个东西, 这个东西是有联系的吧?然后这个东西它就是这个东西,然后你会发现这边其实本质它还是一个笔直,对吧?它还其实就是这个,这个是叫什么? 嗯,这个我们前面说过叫鱼内太和别墅, 你可以把这个区域内胎儿指数看成是就是前面这个个体啊,经过一系列加强,平均得到一个与内胎儿指数,然后这个 b r 呢?代表什么?区域间肽儿指数,它其实这些模型呢?你不要害怕它,它其实不是特别复杂。 然后这个东西呢?嗯,有足以解释讲,这个就代表整体的个数吧,整个研究对象有多少个整体的个数,然后这个这个恩爱代表第 n 个分组里面他有多少个个体, 然后这个 mui 呢?它就是 e i 个个体里面,然后这个 y 的一个平均值, e i 个分组里面 啊,这个也同理。然后这个是整体的,然后他这个,嗯,不是很复杂 啊,这个是 g e 的还有指数的一个模型,然后我们继续看一下 g e 零的一个太阳指数模型,它的这个,嗯,整体的思路的话,其实跟上面差不多吧,就这一个就是 胎儿指数,整体的一个胎儿指数,然后这个是某个区域的胎儿指数,然后这个分为乳内、乳间,你会发现到现在你会发现他这边依旧是一个, 你会发现区域,就是这个区域内它其实就是各个区域整体的胎儿指数的一个加权平均,对吧?然后这个区域间就是正常的计算, 那所以说这个模型还是就是按差不差吧?然后模型的话我们现在就讲到这里,然后我们来看一个一个实操,看胎儿指出的一个实操,接下来将用到本轮制作的一个。