粉丝785获赞2152

哈喽,大家好,那么最近收到私信表示面板数据我们都知道做简单的固定效应模型,但是具体的命令又有好几种,然后大家可能有点稍微的分不清楚,那么这期视频就把最常见的几种代码给大家分享一下,希望对大家有所帮助。 然后对于面板数据呢,我们最常用的就是这四种方法,嗯,总体来说这四种方法都特别简单,只是每一种就是稍微有一点点需要注意的地方,那么这里给大家简单的解释一下。那么 呃,然后我的这个数据仍然是我常用的一个面板数据的一个教学示范数据,然后就是个体是 province, 然后年份是 e, 然后后面是 y x c x 三这样子的一个数据。那么第一种命令呢?我们主要是 呃通过,如果要做双向固定的固定效应模型,一般是通过引入虚拟变量来代表不同的个体,可以取起起到和固定效应这个组类估计一样的效果, 那么区别就在于我们要引引入虚拟变量来代表不同的个体,那么这种就就称之为简单经典的一个呃,最小二成虚拟变量方法 through lsdv, 那他们的优点就是可以对个体, 也就是可以对个体进行一个抑制性的估计,那么缺点就是如果你的个体 pro, 我的是 province, 一般不会大,就是固定的,如果大家是公司啊或者是银行啊什么的,就是在嗯,特别大的情况下,可能会要引入特别多的 呃,虚拟变量,那么自由度损失太大了,可能会超出 stator 所决所允许的解释变量个数,那么可能就 这,那么这可能就是他的一个缺点,那优点呢?就是他对数据格式是没有要求的,他是横截面数据啊,面板数据啊,都可以使用的。 那我们接下来先跑一下第一种结果,但是第一种结果你如果做面板数据,你要控制时间和个体的话,就只能通过这种加入虚拟变量的方式而来进行控制, 所以他的结果,所以他的结果会报告一大串串那种虚拟变量的回归结果,你看我有多少个个体就得包包多少个虚拟变量的结果,一儿也是的。然后你看, 如果你这里的,呃,我的,呃,如果你这里的个体很多的话,那么可能会很多很多跑下来,呃,如果如果特别多,那可能 会超出他解释的个数,所以,嗯,很大的话,那么这个命令就不太行啊。这是第一种比较简单,我把结果保存一下,等会一起导出来对比看一下。 嗯,第二种呢?我们用的很少,那么第二种命令是对第一种命令的一个优化,它,它对数据结构也没有要求,嗯, 他唯一对他改进的就是指,就是 i 点 promise, 就 i 点个体, i 点 id 这种。因为我们有时候在回归中控制很多虚拟变量,但是又不想生成, 呃,这么多的,生成这么多的虚拟变量的时候,不想报告虚拟变量的回归结果,那么我们就可以使用这种,使用这种命令,那么这种命令就是可以更快的汇报这种更简洁的结果,那么他的局限就是这个,额不,字儿里面包含了这个分类变量,是只能加 一个变量的,如果你是要估计是要进行双向固定效应,或者是更高维度的固定效应的话,那么还是得使用这个 idea, ear idea 什么的方式来映入一个序列的变量。 但是我现在写的这个代码跟 d 中的代码是等价的,结果其实是一样的, 那么这是第二种情况,我们也把它保存一下。你看这里,我把 year 把 province 说错了,加入这个 oppo zero 里面进行控制歌词, 把个个体进行控制的时候,他就不会报告易产川的这种虚拟变量的回归结果。所以在 n 很大的话,我们可能就不用第一种,就用第二种 mini 比较方便一些,那么接下来是第三种。嗯,第三种呢,是我们最最最 常用的,因为这个是呃 state 的一个固定效应的一个官方的命令,那么是最为纯正的吧。应该这样说,它是一种组类的估计量,但它要求的必须是针对面板数据,因为它是 x t, 它是针对面板数据的。所以我们在使用这个命令的情况下,前提下一定要先定义呃 个体维度和时间维度。 我的个体是 province 的,年份是 year, 我们先要进行个体和时间维度的一个定义, 那我们一旦在这个固定效应后面加上这个 f e, 呃,不是这个回归效应,加上 f e 就表示使用固定效应组类估计的方法。如果这里是 r e 呢?就是随机效应,那这 这个代码呢?因为我们如果加了 f 一,就是使用固定效应足类估计,那么这个代码是默认我们是控制了个体了,所以这里不需要再用 idid, provinceididid 或者是 idid。 呃,什么什么?呃,就是你的个体的变量名来进行控制你的个体,因为这个命令 这个 mini 是只要你这里加了 f 一,它就自动是控制了个体的,这种固定效应是自动控制了个体,大家一定要记住,所以这里不要再加 i 点 i 点 id, i 点 province 什么的。但是呢,如果我们要控制时间的话,我们还是要通过引入虚拟变量 i 点 e 而来表示不同的时间。 嗯,这种是这种方,这种固定效应呢是通过一种呃泥叉变换消除了不同个体的组间差异,保留了每个个体的一个组类差异,所以这种方法我们一般称为组类估计,这种是一个 组类的估计,那么需要主要的。呃,需要注意的是,就是同一个个体不同时间的扰动项可能相关,所以说我们也可能存在一定存在一定的组类字相关,所以我们还需要使用以每个个体为剧类的一个剧类稳健标准物,也就是后面的后面的这个操作, 剧类文件标准为个体为剧类。然后我后面发现我每个代码后面都都进行了这个操作,因为我为了让四种尽可能的一致嘛。然后接下来我们跑一下这个最纯正的一个固定效应模型, 它这里也不会报告你的个体的一个虚拟变量,因为它是直接自动控制了个体的,所以这里只需要用 i 点 e 来引入虚拟变量控制年份就可以了。 然后我们可以把这个回归结果保存一下。嗯,接下来要要分享啊,文字, 文字,算了,讲完了之后再拍他。然后第四种命令是一个多维的固定效应模型,因为有的时候我们需要控制一个多个维度,有时候我们的个体 可能会先分城市,再分区域,再分什么或者是银行,呃,先分先是具体的银行,然后再分一定的行业 或者是公司,把,公司也会通过某一个指标进分,再分一定的行业什么的,所以这里有时候会有个 industry, 或者有个什么区域的划分就是,嗯,所以我们会,所以我们就叫多维固定,他除了他不止可以控制时间,个体还可以控制更 高维度的,这是它一个最大的一个优点。但是在我的这个,呃,我的这个面板数据里面,我没有这个更高维度的需求,所以我这里就是还是以 ear province 来进行控制。就是我这里强调这个命令就是为了想告诉大家它是可以进行多维固定的。如果我们还要 对更高一个维度进行控制的话,那么这个固定效应模型是,呃最方便的,那他们的他的 运行速度也比上面的命令都要高一些。但是呢,这个命令是一个外部的命令,所以我们执行这个命令的时候,嗯,必须要先安装一下,也就是 s s c in store 安装一下。 那安装这个命令的时候,有的人会说会出现一定的报错,然后报错的时候他下面不是会进行一个提示吗?你点进去看的话,你会 会发现他还需要再安装一个辅助工具箱就可以了,就点击一下就可以了。那这个命令就是多维的固定效应,我这里是没有更高维度的一个需求,先把它删了。 嗯,这个就是多维固定效应,然后它跟与前面的 mini 相比呢,它不会不需要使用 ident province, ident year 挨一点 province 挨点也或者挨点什么来引入虚拟变量,那他会方便很多,而且也不会报告呃,就是易缠穿的一个虚拟变量回归结果,所以他总体这里都比较简约, 比较好看。上面的话都会报告很多的虚拟变量的结果。因为我这边我的数据量不大,所以你觉得这些虚拟变量对你的结果什么的没什么影响,但你如果数据量很大的话,你就会发现一定的不变性的。 那我觉得这种 mini 是前面的一个 mini 的一个更高的优化哦。接下来我们把这个 mini 也保存一下, 然后接下来我们把这四个 mini 一起导出来,看一下这四个 mini 的一个估计的差别。 a step mini mini 结果导出这个我有教学视频的,我们我们 a step 四个 mini, 然后用表格用 reg 一来进行表达,然后后面这些参数的话,大家学习的话可以看我另外一个视频。 然后因为我里面有些变量都报告了虚拟变量的结果,所以我这里只知道除了 x 一二三对外的一个回归结果的一个结果汇报。 然后我们把四个结果导出来,点击一下, 我们看到这个结果导出来了,然后我们看一下这个结果。首先呢,我们看到这个回归系数基本上都是一致的,是没有什么差别的,因为我做命令的时候我就会尽量把,呃,尽量就是保持一致, 嗯,就是在等价的方式上进行这个代码的一个变换吧,然后他们的回归系数基本上是一致的,没有什么变化,变化的唯一的就是这个标准物,标准物可能会略有差异, 我们可以看到二三这两种标准物是一模一样的,因为这两个估,呃,这两个估计结果的标准物是一致的,因为这两个命令背后的估计方法是 特殊的那种混合的 ols, 也就是最小二乘法,所以他们两个的那个呃结果是等价的回归,连标准物都是一致的。那么一和四的标准物呢? 呃,也是一致的,因为他们两个人,他们两个命运的背后是组类的,一个估计是一个固体效应的一个估计结果,所以一四等价,二三是等价的,但是,但是标准会稍微有点差别,倒也不太有影响。 那么最后再把这四个命音给大家讲一下呢,就是强项,重点就是 这三个。第四个命令是一个多维的固定效应,我们需要呃对多个维度进行控制的话,又先又先选择第四个,又先选择第四个命令, 然后再强调一下,第一个命令是 state 的一个官方命令,它是自动控制个体的,所以有时间需要时间固定效应,需要引入时间虚拟变量进行控制,但是个体是自动控制的,那么这两种命令呢,都是一个最小二乘法的一个回归结果。 嗯,他对于这种第二种情况,是个体和时间都需要通过引入虚拟变量的方法进行控制,那他相对来说就会速度,运行的速度会比较慢,但是他会汇报详细的一个虚拟变量的结果, 那么它是可以控制一个虚拟变量,它是可以,呃,就是它相比于第二种情况的话,它是可以汇报一个更简洁的结果,如果你的 n 很大的话,然后你可以考虑试一下使用三, 没有说哪个命令最好。嗯,但是你这个二三是不挑数据的,它是横截面数据也可以的,那么意思都是针对一个面板数据的,尤其是一,所以大概就是这四种模,呃,大概,哎,我这么讲的被我自己把我自己绕进去了呢, 反正以上就是这个四种固定效应模型的一个简单的一个讲解。嗯,希望对大家有所帮助。那么我们自己在日常的写论文什么的,一般用的比较多的都是一和四,如果是面板数据的话,如果是很简便数据的话,那就是二和三, 那么在横截面数据中优先使用二和三,横截面数据中 n 比较大的话,我们就使用三,那么如果是面板数据,我们优先选择一,然后如果是面板数据中,我们需要对多个效应的多维固定,就除了时间、个体还有更高的一个区域进行需要控制的话,我们就使用四, 简而言之就是上面的这些。嗯,那么今天这期视频就到这里结束,大家如果还有问题的话可以在评论区留言,嗯,谢谢大家。

实证小助手雷塔做实证的时候,是不是经常遇到命令无法识别的报错提示?那是你没有安装该外部命令。雷塔安装外部命令一般有三个方法,第三个方法一定能够安装成功。 第一个是直接从 ssc 数据库里安装,执行 ssc install 就可以了。第二个是翻 dit 加外部命令。我们以 logo out 为例,只需要找到对应的 ado 文件,点击安装即可成功。 第三个是直接从某度上下载该命令的 ado 文件,放到 stata 对应的跟末录像就可以了。下课点赞加关注,实证不迷路!

我们今天主要来说一下,当我们去做时政性论文的时候,导师或者学校要求我们去做 state 面板数据回归的时候,我们要去做的一些板块。那么首先的话就是说我们面板数据的一个适用性,它的话比较适用于我们的金融、经济、会计、统计等等这些啊,偏经济类型的这个专业, 我这些专业的话,可能,呃做这个面板数据回归的话,他的嗯通过率会稍微高一点,那么下面的话就是做这个输了面板回归的这个主要内容。咱们这一次的这个 呃视频的话,主要是针对我们的这个说论写作的啊,主要是针对写作内容去进行的一个说明。那么我们写作内容的话主要分成这以下八个板块, 第一个描述性,第二个多重贡献性,三相关死模型啊。到第八个,那么我们针对每一个板块进行一个简单的说明。首先就是我们的描述性分析这块,我是截了一个已经发表的这个论文,那么这个文章的话,呃,我们看一下描述性分析,一般情况下他的这个模式就 下面这个图表,哎,他第一列就是咱们的变量,第二列是个数啊,就是你收集了多少组数据,然后我们一般情况下去标注的数值就是极大、极小和均值标准差,那么通过极大值、极小值还有我们的均值的话,我们大概就能知道这个变量他目前处在哪一个。呃,分级上, 比如说我们这个 to be q 值,他指的是这个企业绩效,那么我们看最小值零点七,最大值十三,他的均值在百分之,呃在二,那就说明我们所收集的这个研究对象,他整体来讲企业绩效是处在较低水平的,对吧?他二和零点七,呃,零点七和十三,哎,我们去去取他的均值的话,可能在七左右 啊,六左右,那么呃实际上他的均值在二,那他远远小于我们理论上算出来的均值。所以啊,这块的话,我们可以通过这种就是比较简单的方式去描述一下。那么标准差的话,他指代的就是我们说了我的整体他处在一个中等偏下的水平,那么各个企业之间的差异大小情况是怎么样的?我们就从通过标准差去进行一个说明,标准差 他越大,说明各个企业之间的波动程度越大,这是这个描述性分析。那么描述性分析他的目的主要就是去说一下我们整体收集了一份数据,那这个数据假如说我们是对企业去进行描述的,那我们收集了这些企业的分布情况,大致一个怎么样的一个情况?有没有一些极端值? 比如说这个透明 q 值,我们都知道企业绩效,那如果说我有一个极大值,他是几千或者几万,那可能这块就有点问题。我们通过这样子简单的一个排布就能够看出来我数据第一个我数据有没有问题,第二个我数据的这个均值情况,他是否符合现状啊?跟现状去对比一下,如果跟现状严重不符合的话,那也说明我们的数据是有问题的。 所以这块的话就是去简单看一下数据的分布情况,看一下数据是否贴合实际情况,那么我们做描述性分析代码的话,这是一个呃简单的代码,然后第二个的话就是多重贡献性检验,这个的话,嗯,其实有一些争议,就是有些人觉得呃不应该去写这个多重贡献性,就没有必要去写,有些人他又觉得这个多重贡献性 他是呃比较有必要的,那么我们在这块的话就可以根据实际情况啊,就是说如果我们你可以看咱们学校呃历年来的一些文章,他有没有写这个都是关键性,如果没有的话,那咱们也可以不写,如果有的话我们就给他加上,或者后期导师要求加上的话,我们就给他加上。 那么这个多重贡献性的话,他的本意是想去说我所选择的这几个变量,他的多重贡献性就是他的,他们之间没有一个强相关性, 那呃啥意思呢?就是说假如说我选了 x 一到 x 七七的变量,那如果说我 x 一和 x 二它们两个的这个相关性非常强,比如说 x 一和 x 二相关性零点九几, 那那是不是就说明 x 一和 x 二他们所解释的东西啊?有百分之九十的这个信息都解释的是同一个,那我 x 一 x 二保留一个变量就可以了,对吧?那多重贡献性的话,他其实就是去呃降低因为变量和变量之间相关性太高而导致的。对,最后我们的回归结果的一些差异,那么我们通过多重贡献性检验, 我们主要是通过这个 vif 的值,如果 vif 是小于十的话,我们就认为没有严重的都是贡献性,那如果有的话,我们就得把有都是贡献性的那个值给他剃掉,然后他的代码啊,就是这个代码。 然后第三个的话就是咱们的相关性啊,相关性他的表格的话展现就是这样子,一个倒三角的形式,然后里面的这个值的话,就是我们的相关系数啊,一般是负一到一之间,那这个相关系数的话,嗯, 也是有一些问题,就有些人觉得相关系数是不是越大越好,或者啊负向的越大越好,其实这个值的话就是多少就是多少,我们主要看后面的这个显著性。当然如果你的相关性太大了,他并不是一件好事。就我刚才提到的,如果相关系数,就你的所有变量之间的相关系数,他都非常大,比如说都大约的零点八、零点九, 那么我们就可能啊变量之间存在这个严重的贡献性,哎,导致你后面的结论可能有问题。那么我们一般的这个思路就是我先做一个相关,然后我通过相关发现,哎,我的这个系数啊,我的相关系数的话,他都比较正常,就是,哎,零点几啊,零点一, 一级,二级啊,三级啊,这些其实都正常的啊,如果没有那种满天都是零点八、零点九或负的零点八、零点九,那么我们就不用做,都是贡献性。如果你满天都试的话,你就得做一下,看看要不要去提出变量, 这是相关性分析。然后这是他的一个代码啊,这个代码简单说一下,这个前面的这个的话就是他的命令,然后后面这个变量的话,就是你要做相关性的所有的变量,把他的名字给他打上去,然后销会说啊,他就会输出来这样子的一个表格。 然后接下来的话就是我们要做回归分析,那么相关性分析论初步论述了两两变量之间的一个相关性,那么我们要进一步去论证因果关系的话,是要去通过回归分析。那么面板数据和洁面数据不一样的点就在于我们在用 面板数据去做回归的时候,是要有一个检验的,就是面板数据他有三种模型,第一个模型叫做固定效益模型,第二个叫做随机效,第三个叫做混合效益模型。那么这三种模型的话,并不是说我预先一开始我就知道我要用哪一种模型,然后我就直接用,他是要根据我们的数据去进行检验,然后 得出来我的数据最适合于哪一种模型,它是这样子的一个思路。那么对于我们经济学来讲的话,我们一般情况下用到的模型最常用的就是固定效率模型, 然后对于一些比如说,呃,心理学呀啊这些这些专业的话,他可能就更常用到的随机效应模型啊,最少用到的就是咱们的混合效应啊,如果用混合的话,那其实可能就说明我们的这个面板数据他,嗯 啊,这个不太适用于啊,不太适用于去做一个面板数据了,所以在这块的话啊,有一个这个模型检验的这个图,这个图的话就是我们分别要做的检验,然后这个 f 检验的话,我们只带就你做 f 检验,可以从这两个模型里面去挑出来一个你,我们就发现这个检验他只能从凉凉里面去挑,所以 我们要从三个模型里边挑出来一个最适用于的模型,最适合的模型的话,我们至少得做两次检验。那比如说我先我一般的,我们一般的常规速度,因为咱们是固定小于模型,就是这个 f e 模型,这个是固定小于模型,然后这个 p o l 是我们的混合 r e 的话是随机 效应模型,那我们一般呃选择的是固定效应模型,所以咱们的顺序就是先做一个 f 检验,那么做 f 检验我们显著呃这个 f 检验的这个结果通过了,那么我们就说我在呃固定效应和混合效应模型里面选择了固定效应,但是随机效应我们还没有检验,所以我要再进行一个 hostman 检验, 进行下面的这个笔检验,那么下面的这个检验就能从固定和随机里去挑出来一个。当你的 f 检验和 hostman 检验同时都通过,就是 p 值小于零点零五的时候,我们就选择固定。当你 f 检验通过, hostman 检验没有通过的话,我们就选择随机啊,这是这个,然后分别呃下面的话分别就是它的两个代码, 然后这块有我们需要改的就是这个 y 指代的就是咱们的音变量, x 指代的是自变量,到时候我们要把对应的自己的 y 和 x 带入就行,下面也是一样的, y 和 x 是要变的,其余东西都不用变。下面的话就是咱们的回归分析啊,或者说啊回归分析里面我们包含一些中介机制呀,调节机制的检验,那么我们一般会把表格做成这样子的一种形式啊,做 这种形式,然后他的这个,嗯,代码的话,我们就在这边啊,一般情况下我们选择固定效应模型的话,就上面这个代码,当然这个代码的话,他他并不是说唯一的这个代码是最简单的一种代码,就我们直接一看我大家就能记住了,哎,这就是做固定效应模型的一个代码,那么如果我们想通过代码把这个输出的结果,因为他用这个代码输出的结果,嗯,非常的这个 就是不像,不像这块这么美观啊,不用你再去调整啥,你这个做出来的那个表格的话,他还需要你后期进行整理,整理成这个样子,所以啊,这个这个代码他就不是唯一的,我们还有一些其他的代码,但是比较复杂一点,他能够帮助我们去把表做成这个样子啊,这是我们大概了解一下, 这是回归分析,那么回归分析的话,我们主要就是去解释在这一块的时候,他就跟相关系数,相关分析那块不一样了,那我们通过相关分析可以简单的去描述一下边两两两之间的一个相关性,那么在回归的话,你就重点得去解释一下我们的回归系数是正的还是负的啊?是大于零还是小于零,然后解释它的显著性是 在多少的水平下显著,对吧?然后括号里的值,我们一般把它叫做呃 t 检验的值,这个值其实跟星号他们两个所代表的呃就是他们俩,他们俩所所展现的内容其实是相同的,都是在说我得到的这个回归系数他是显著的, 然后呃基本上星号和这个 t 值是呃对应关系啊主,然后如果,比如说我们自己的数据呃不太显著,然后有人把这个数据给他改了,哎,比如说,比如说这个值对吧?负的零点五六二六,那他本来是不显著的,然后我们呃可能有些人把它改成了显著,然后他下面的 t 值没有改那么一眼,那就是咱们了解 stata 的人一眼就可以看出来这两个是不对的啊。这是这个回归分析 下来的话,就是咱们的一个稳健性,检验稳健性的方法非常多。啥叫稳健性呢?就是我用另外的一种方法去验证一下我刚刚得到的这个结论是不是正确的,或者说我得到的结论是不是一个偶然性的结论。那么我们稳健性的方法的话,就比如说最常用的替换变量法,第二个的话就是改变呃 年份,就比如说你原来研究的是呃一零年到二二年,那我现在把它改成一五年到二二年,再次做上面的回归,看一下结论是否一致。那么替换变量法的话,顾名思义就是把我们某一个关键变量的量化方式给他换掉,那么咱们一般替换变量主要是替换音变量, 因为应变量是贯穿始终吗?不管你哪一个分析,他应变量都要参与,所以我们一般就把这个像这个企业绩效,他原先用的是这个 topico 值,我们就可以把它换成比如说这个企业的资产报收率啊,企业的净资产收益率啊等等这些指标。那么把这些变量换掉之后,我再一次去做上面的这个回归,看一下结论是否有差异 哦,但是要注意的是这个结论是否有差异,并不是只代到我的回归系数一定要相同,或者我的显著性一定要相同,这块指代的就是我所用两组数据做出来的结果。哎,他的正负性是否一致啊?他的显著性是否都显著,不用去管那一颗星,两颗星还是三颗星,只要他都显著就行,这是稳健性。嗯, 我们先从这个内生性检验的含义来讲,他就是说这个模型中一个或多个解释变量与误差项存在相关关系,那么说白了,这个解释变量就指的是咱们的音变量字变量,误差项指代的就是我们对音变量有影响的其他变量。那我举个例子,比如说我们去论证学习态度对对学习成绩的关系,那么 存在内生性的这个从他的含义来讲的话,就是我们的这个自变量学习态度和影响学习呃,成绩的其他变量存在相关性。如果有这种关系的话,我们就说,哎,可能会存在内生性问题, 那么呃,他并不是说,哎,他这个含义是这样子的,但是并不是说产生内生性就只有这一个原因。我们产生内生性的原因非常多,这里我们主要说 写作过程中最常遇到的第一个叫做遗漏变量。这个遗漏变量的话,其实就是在说我们文章中,因为你一篇文章研究的内容是有限的,你不可能把所有的东西都研究透,所以肯定会存在遗漏变量问题,那么你遗漏的那些变量就可能会与你的字典 有关系,就我刚才说的这个学习态度,他可能和一个我们没有研究到的,但是能够对音变量学习成绩产生影响的啊,有关系,他们俩有关系就可能会有内生性问题。 第二个的话就是互为因果,互为因果的话就是主要指咱们的呃解释变量和背解释变量,也就是字变量和音变量之间,我们理论上是认为字变量去影响音变量,就学习态度会影响我的学习成绩,但是有有很多情况哎,比如说我觉得这个例子 反过来也是可以的,就是当我的学习成绩比较高的时候,我的学习态度其实也会有一个变化,这个就是互相影响,互为因果,那么互为因果的话,他也会导致我们的内生性问题。当然还有一些其他的,我们这里就比如说一些呃存在测量误差呀等等等,我们在这块就不再去赘述,因为他呃没有办法解决啊, 就是在我们的写作过程中。然后第三个的话就是我们当我们存在内生性的时候,我们常用的最常用的办法叫做或者说呃文呃写作过程中最常用的办法叫做工具变量法,但是还有些其他的,我们这块就不过多展开。 然后我们对工具变量找寻的要求的话,有下面这两个要求,第一个的话就是要与 x 有关,第二个与 y 呃影响 y 的其他变量无关,也就与我们的残差项无关。那么这块怎么样去解释呢?就是内生性问题,我们用工具变量法去呃去检验它的时候的逻辑其实是这样子的, 是我们现在说 x, 它和我没有研究到的,但是能影响 y 的变量,它有关系,所以导致了内生性。那我现在能不能去找一个工具变量,它既能够, 嗯,跟 x 有关系,就是它既能够代替 x, 然后它又与这个影响麦的其他变量无关。那如果我能找到这个变量的话,我就可以拿这个工具变量指代我的字变量去进行回归分析,那这样子的话 就能够确保我的这个自变量就是咱们的工具变量,到时候就变成了自变量嘛,就能够确保咱们的自变量和呃残差效是没有关系的,那这样子就能够确保最终的结论他是不存在内生性的呃,但是往往呃我们工具变量的找寻的话,它的难度非常大。就是我们 如果是说论或者不是论文,甚至本科论文,如果我们要去做内生性的话,其实一般都不建议我们自己去创造这个工具变量,我们一般都是去别人的论文或者文章里面去找,比如说我还是刚才的例子,我们去验证学习态度和学习成绩等。然后现在我导师说了,这有内生性问题,你得去找一个工具变量, 我们就在织网里这两个变量作为关键词,去搜别人研究的相关文件,去看一下别人在去解决内生性问题的时候用了什么变量,我们直接照搬过来啊,当做我们的工具变量直接去进行使用就行。 下来的话就是最后一个我们的抑制性分析啊,抑制性分析的话他呃就比较简单了,他实际上就是把研究对象去分类,然后重复的进行回归分析,他实际上,呃,因为有,有时候有有些人把抑制性他叫做检验,严格来讲的话抑制性我们一般是一个分析的内容,就是我对回归分析的进一步说明,那我回归分析,假如说论证出来 这个自变量对音变量有一个显著的正向影响,那我的意志性就是我把我的研究对象给他分成呃细小的类。比如说刚才是对企业 进行分析的,那么我们把企业分成了这个江苏,把企业按照不同的省份给他分类了,分成了江苏省和浙江省,那么我对不同的省份去进行一个回归分析之后发现,哎,是不是浙江省和江苏省他们两个之间的回归结果是有差异的?那如果有差异的话,我就要去解释一下为啥这两个省之间有差异。 当然这个分类的方式的话,他并不是唯一的,也不是说固定的,我们要根据自己的研究内容,比如说你是企业,那你就可以分成国企、非国企,那如果你是研究污染相关的,你就分成污染企业和非污染企业,还有咱们的一些呃,大规模呀、小规模呀,甚至企业成立的时间等等。

各位同学大家好,今天的话主要介绍一下,就是一个关于斯蒂坦里面的一个结果的输出,那个日志就是很很多时候我们导师想要自己的一个原本的输出,而不是自己整理的一个结果,这个的话我们就需要用到那个日志这个东西,然后创建的方式的话,先点击文件, 然后这里写日志开始,然后这里你就会数字名字会创建出一个路径,这里我就不继续做下去了,然后的话他这里会出来一个路径,然后你把你的那个路径复制好,然后放在你的度文件里面,你就前面是个 love you siri, 然后输入你的路径, 然后再写一个 reps, 然后的话接下来就数字代码,代码都输完之后,运行完之后的话再点那个 logo, 然后的话你这边 就会生成你要的那个嗯, log 的日志,就是他这里就会把你刚刚所有运行的一个结果全都给你原封不动的保存下来, 哎,这样的话就是一个关于结果输出原本保存的一个方式,谢谢大家。


实证小助手今天给大家分享三个 stat 表格,说出非常好用的命令,特别是第三个,超级好用。第一个是 otareg two, 在 stat 做完回归结果后,只需要用 otareg two 就可以生成论文中非常标准的实证表格。 第二个是 logo out, 这个命令能够将菲塔所展示的结果完美的复制出来,不过该命令大多用于相关性分析和多重贡献性检验的这类表格。 第三个是一侧 table, 这个命令我认为是最好用的,它可以在 stat 和 word 模式随意切换,为我们回归测试过程提供了极大的便利。和 altar x 相比, 表格变量间多了一个空行,同学们可以根据论文排版需要自行选择用什么命令输出表格。 所有的输出代码及详细的命令介绍都放在这里了,有需要的同学可以收藏一下,下课点赞加关注,实证不迷路!

今日课堂如何用斯塔塔做空间计量?最近很多小伙伴私信想学习空间计量,我们先来看看 c 刊上的相关论文,这篇论文综合运用了多种方法进行分析,也是做宏观想法好期刊的一个趋势。 其中里面运用了空间计量模型。还记得之前讲的空间计量第一步要做什么吗? 没错,空间之相关,再来看哈空间之相关的含义主要是看本单元与邻近单元要素 是否存在空间趋同。如果存在空间字相关,那么可以进一步采用空间计量模型进行时政分析。比较常用的空间模型包括空间误差、空间之后、空间笃彬。我们 可以看到惨靠文献种全局墨兰字数在所有年份内均现诸为证。文章进一步运用局部墨兰散电图进行局部空间思想观分析, 这部分之前有讲过,这里就不再追溯。当然衡量局部我们还可以运用 lisa 及居图。 当然,我们走完墨兰自述戒烟不思设,马上就要用那种空间模型来走回轨。严格来说,我们需要走 l、 m、 l、 奥特斯曼等各类戒烟,确定我们要用哪种模型?文章中各类戒烟均表明要使用空间毒品模型。 这个时候我们就可以奏回归啦。这里是把三类模型的随机固定都奏了回归。 如果你的模型走出来,上述都显著,也可以这么放,但是具体分析的时候以模型检验的结果为准,其他部分作为稳健性检验。 一定要记住哈,肉和栏目的一定要限注,通常来说核心变量的 box 项也要求限注。下面我们进入实操环节,建议我们把数据、据针等文件放在一个文件夹,第一步要定一文件路径, cd 寿险来奏全局默爱你这一例我子似拥以重俱真。我们可以看到,在绝大部分年份里,墨兰自述现诸为整,禁又少,书记年补现诸。 此前有朋友泛应少数年分不限注得不得行,再强调一边完全没问题,又不 分谁看,就是如此。下面再来奏局部墨兰,因为之前讲过,我这里就带过一下具体三点图,嫌疑可以看之前的视频。 下面我们再来看 lm 检验怎么做。 lm 检验的原价说是不存在空间字相关,也就是说在 os 和空间模型中,我们要使用哪个?首先我们做一个 os 回归, 然后需要构建一个界面的矩阵,我们这里数据年份是十四年,所以 xdw 后面的数字我们接十四 来看看结果。这一步会有一点点慢,尤其数据量大的话更慢。我们可以看到检验结果大部分都为零,只有 robust a lamleg 部分大于零点。一有的论文这里直接得出使用空间误差模型的结论。个人认为还需要做 l 检验再确定 nr 检验,一个是看空间度比是否会退化成空间误差或者空间之后,另外一个是看双向固定是否会退化成时间固定或者个体固定。 我们来看看结果见胭脂批值为零,表明空间杜比无法退化。再来看另外一个退化, 这里屁值也都为零,表明双固定也无法退化。我们再来看看空间号斯曼检验,只需要在命令后面加个号斯曼就 ok 了,这里屁值也是零了,所以我们最后用空间读 并双固定效应模型分析。当然很多论文还会做 mod 检验,看看 usd on 还是四二三模型,我们也来看看,结果也都为零。具体检验的解释可以参照论文。 首先我们要管猪肉一定一定限猪,同时莫克斯香我们一般也要求限猪,一般我们来说再走一个效应分解,看看直接效应、间接效应和总效应。当然我们这里结果不是很好, 我们可以尝试两种方法进行调整,第一是在代码后面加点冰箱, 我们可以看看到宾之家了核心变量,核心变量的间接效应显著了,但是一定要注意家乐逗比你的模型形式 是有变化的,也就是这里的 wox 值,包括你的逗比项。第二种方法,尝试用动态空间,也就是在代码后面加的那个项。当然我们这里结果也很一般。 还有细心的朋友会发现,这类模型不收敛,严格来说不能用这个结果,需要通过 form copy 调整凑四值,但是这个调整真的好艰难。不要自赞收藏,快点关注!

斯达特如何计算墨兰指书?归之墨兰散电图我们先来看下 say 坎上的论文。墨兰指书衡量地理要素的空间急居程度, 也是做空间计量模型的必要步骤。墨兰指数为证,表明要素呈现高值与高值,低值与低值的真空间集居。这里墨兰指数就是显著为证。上面我们看的是全局墨兰,下面再看下局部墨兰 有点累,你们自己看下这段文字,理解一哈。 通过闪电图可以知道每个地区所在乡鲜。下面我们进入实操环节,这是俺之前做的三十省份绿色金融数据数据复制粘贴到 stop, 可以看到数。 数据是类似洁面格式,我们来转换成面板格式。你是不是在 excel 里面一个一个拉成面板,我们用 receive 命令一键转面板,这样我们的数据流成面板格式啦。 当然,我们也可以把面板格式的数据转成类似洁面的。依然是 reshape。 言归正传,我们来计算墨兰之书。我们要准备 story 命令以及相关矩阵,需要的话可以敌敌我。 以荆棘军离巨毡为例,可以看到墨兰指书全部争相现著。接下来我们再看下如何挥之墨兰散电图。邓啊邓啊邓啊邓啊 噔啊噔啊噔啊噔啊噔啊噔终于来了!把三个图合并成一张图, 我们对图稍加修饰,此处省略一万字,如果你不想显示省份,把这部命令后面删除就可以啦。有些论文会展示每个地区所在象限,我们这里阔顿就是啦。 我们还可以用其他巨针进一步验征。建立燕斯以哈领结巨针和范居里巨针 perfect 斗现注,完成任务。

啊,大家好,我是毛三万,这个视频和大家分享如何将一张整理好的可以用于报告的时辰表格导出到 word, 然后添加表头和复注的内容。 根据前面的内容,我们已经得到了一张包含多个回归并且调整过格式的,可以用于报告的回归表。我们还是使用 e s t t a b 这个命令,然后在 estimates 的后面, 在逗号的前面加上 using main result, 点 rtf, 这里的 using 是参数, main result 是呃给输出文档取的名字,点 rtf 是输出文档的格式,也就是 rich text format。 啊,一个通用的文本格式, 然后我们敲击回车,就在下面得到了一个可以打开的文件,然后我们弹吉他, 这样就将我们的实证表格输出到了 word 里面。 首先我们需要添加一个表头, it 就是文章中的 表二,这个表头通常是包含了一个表的顺序,然后这个表格报告的回归的内容, 然后我们要标记一下辅助 复数,一般包括四个内容。第一个是说,啊,我们表格中星号,三颗星,两颗星,一颗星所代表的显著性, 也就是在输出表格的时候,我们这里进行了一个标注。第二部分是要声明一下,这括号中报告的是 t 值还是 p 值,然后我们在输出的时候是选择了 t 值来报告,那这里就说明一下,报告的是 t 值, 然后我们要说明一下,呃,在回归中,我们对标准物的使用,那这里用的是稳健标准物,也就是我们在回归的时候, 这里选择的是 robus 的文件标准物。那如果你使用了剧类文件标准物,那就声明一下,这里使用了剧类文件标准物就可以。 那还有一个部分呢,是说我在报告的回归表中是省略了一些什么内容,这里是省略了 控制变量和长竖向,通常我们是会将长竖向给审阅掉,然后将控制变量给报告出来啊。在论文,在学位论文或者在期看论文的时候,都是需要去报告这个叫控制变量的 啊。但还有一些情况,比如说在期刊审稿的最后一轮的时候,或者说已经就接收了,然后因为篇幅的限制,那会在最后的修改的时候把控制变量给闪掉,或者在做论文汇报的时候对控制变量进行一些的省略。 那这个审对的方式呢?就是把这个内容给删掉,然后在这里对控制变量进行一个标注, 这样我们就得到了和啊这篇论文一样的一个结果, 那这个内容就和论文所报告的表格是基本一致了, 那大家只需要对呃对行间距和前面的表头进行一些调整就可以了。