粉丝1127获赞6599

我们今天主要来说一下,当我们去做时政性论文的时候,导师或者学校要求我们去做 state 面板数据回归的时候,我们要去做的一些板块。那么首先的话就是说我们面板数据的一个适用性,它的话比较适用于我们的金融、经济、会计、统计等等这些啊,偏经济类型的这个专业, 我这些专业的话,可能,呃做这个面板数据回归的话,他的嗯通过率会稍微高一点,那么下面的话就是做这个输了面板回归的这个主要内容。咱们这一次的这个 呃视频的话,主要是针对我们的这个说论写作的啊,主要是针对写作内容去进行的一个说明。那么我们写作内容的话主要分成这以下八个板块, 第一个描述性,第二个多重贡献性,三相关死模型啊。到第八个,那么我们针对每一个板块进行一个简单的说明。首先就是我们的描述性分析这块,我是截了一个已经发表的这个论文,那么这个文章的话,呃,我们看一下描述性分析,一般情况下他的这个模式就 下面这个图表,哎,他第一列就是咱们的变量,第二列是个数啊,就是你收集了多少组数据,然后我们一般情况下去标注的数值就是极大、极小和均值标准差,那么通过极大值、极小值还有我们的均值的话,我们大概就能知道这个变量他目前处在哪一个。呃,分级上, 比如说我们这个 to be q 值,他指的是这个企业绩效,那么我们看最小值零点七,最大值十三,他的均值在百分之,呃在二,那就说明我们所收集的这个研究对象,他整体来讲企业绩效是处在较低水平的,对吧?他二和零点七,呃,零点七和十三,哎,我们去去取他的均值的话,可能在七左右 啊,六左右,那么呃实际上他的均值在二,那他远远小于我们理论上算出来的均值。所以啊,这块的话,我们可以通过这种就是比较简单的方式去描述一下。那么标准差的话,他指代的就是我们说了我的整体他处在一个中等偏下的水平,那么各个企业之间的差异大小情况是怎么样的?我们就从通过标准差去进行一个说明,标准差 他越大,说明各个企业之间的波动程度越大,这是这个描述性分析。那么描述性分析他的目的主要就是去说一下我们整体收集了一份数据,那这个数据假如说我们是对企业去进行描述的,那我们收集了这些企业的分布情况,大致一个怎么样的一个情况?有没有一些极端值? 比如说这个透明 q 值,我们都知道企业绩效,那如果说我有一个极大值,他是几千或者几万,那可能这块就有点问题。我们通过这样子简单的一个排布就能够看出来我数据第一个我数据有没有问题,第二个我数据的这个均值情况,他是否符合现状啊?跟现状去对比一下,如果跟现状严重不符合的话,那也说明我们的数据是有问题的。 所以这块的话就是去简单看一下数据的分布情况,看一下数据是否贴合实际情况,那么我们做描述性分析代码的话,这是一个呃简单的代码,然后第二个的话就是多重贡献性检验,这个的话,嗯,其实有一些争议,就是有些人觉得呃不应该去写这个多重贡献性,就没有必要去写,有些人他又觉得这个多重贡献性 他是呃比较有必要的,那么我们在这块的话就可以根据实际情况啊,就是说如果我们你可以看咱们学校呃历年来的一些文章,他有没有写这个都是关键性,如果没有的话,那咱们也可以不写,如果有的话我们就给他加上,或者后期导师要求加上的话,我们就给他加上。 那么这个多重贡献性的话,他的本意是想去说我所选择的这几个变量,他的多重贡献性就是他的,他们之间没有一个强相关性, 那呃啥意思呢?就是说假如说我选了 x 一到 x 七七的变量,那如果说我 x 一和 x 二它们两个的这个相关性非常强,比如说 x 一和 x 二相关性零点九几, 那那是不是就说明 x 一和 x 二他们所解释的东西啊?有百分之九十的这个信息都解释的是同一个,那我 x 一 x 二保留一个变量就可以了,对吧?那多重贡献性的话,他其实就是去呃降低因为变量和变量之间相关性太高而导致的。对,最后我们的回归结果的一些差异,那么我们通过多重贡献性检验, 我们主要是通过这个 vif 的值,如果 vif 是小于十的话,我们就认为没有严重的都是贡献性,那如果有的话,我们就得把有都是贡献性的那个值给他剃掉,然后他的代码啊,就是这个代码。 然后第三个的话就是咱们的相关性啊,相关性他的表格的话展现就是这样子,一个倒三角的形式,然后里面的这个值的话,就是我们的相关系数啊,一般是负一到一之间,那这个相关系数的话,嗯, 也是有一些问题,就有些人觉得相关系数是不是越大越好,或者啊负向的越大越好,其实这个值的话就是多少就是多少,我们主要看后面的这个显著性。当然如果你的相关性太大了,他并不是一件好事。就我刚才提到的,如果相关系数,就你的所有变量之间的相关系数,他都非常大,比如说都大约的零点八、零点九, 那么我们就可能啊变量之间存在这个严重的贡献性,哎,导致你后面的结论可能有问题。那么我们一般的这个思路就是我先做一个相关,然后我通过相关发现,哎,我的这个系数啊,我的相关系数的话,他都比较正常,就是,哎,零点几啊,零点一, 一级,二级啊,三级啊,这些其实都正常的啊,如果没有那种满天都是零点八、零点九或负的零点八、零点九,那么我们就不用做,都是贡献性。如果你满天都试的话,你就得做一下,看看要不要去提出变量, 这是相关性分析。然后这是他的一个代码啊,这个代码简单说一下,这个前面的这个的话就是他的命令,然后后面这个变量的话,就是你要做相关性的所有的变量,把他的名字给他打上去,然后销会说啊,他就会输出来这样子的一个表格。 然后接下来的话就是我们要做回归分析,那么相关性分析论初步论述了两两变量之间的一个相关性,那么我们要进一步去论证因果关系的话,是要去通过回归分析。那么面板数据和洁面数据不一样的点就在于我们在用 面板数据去做回归的时候,是要有一个检验的,就是面板数据他有三种模型,第一个模型叫做固定效益模型,第二个叫做随机效,第三个叫做混合效益模型。那么这三种模型的话,并不是说我预先一开始我就知道我要用哪一种模型,然后我就直接用,他是要根据我们的数据去进行检验,然后 得出来我的数据最适合于哪一种模型,它是这样子的一个思路。那么对于我们经济学来讲的话,我们一般情况下用到的模型最常用的就是固定效率模型, 然后对于一些比如说,呃,心理学呀啊这些这些专业的话,他可能就更常用到的随机效应模型啊,最少用到的就是咱们的混合效应啊,如果用混合的话,那其实可能就说明我们的这个面板数据他,嗯 啊,这个不太适用于啊,不太适用于去做一个面板数据了,所以在这块的话啊,有一个这个模型检验的这个图,这个图的话就是我们分别要做的检验,然后这个 f 检验的话,我们只带就你做 f 检验,可以从这两个模型里面去挑出来一个你,我们就发现这个检验他只能从凉凉里面去挑,所以 我们要从三个模型里边挑出来一个最适用于的模型,最适合的模型的话,我们至少得做两次检验。那比如说我先我一般的,我们一般的常规速度,因为咱们是固定小于模型,就是这个 f e 模型,这个是固定小于模型,然后这个 p o l 是我们的混合 r e 的话是随机 效应模型,那我们一般呃选择的是固定效应模型,所以咱们的顺序就是先做一个 f 检验,那么做 f 检验我们显著呃这个 f 检验的这个结果通过了,那么我们就说我在呃固定效应和混合效应模型里面选择了固定效应,但是随机效应我们还没有检验,所以我要再进行一个 hostman 检验, 进行下面的这个笔检验,那么下面的这个检验就能从固定和随机里去挑出来一个。当你的 f 检验和 hostman 检验同时都通过,就是 p 值小于零点零五的时候,我们就选择固定。当你 f 检验通过, hostman 检验没有通过的话,我们就选择随机啊,这是这个,然后分别呃下面的话分别就是它的两个代码, 然后这块有我们需要改的就是这个 y 指代的就是咱们的音变量, x 指代的是自变量,到时候我们要把对应的自己的 y 和 x 带入就行,下面也是一样的, y 和 x 是要变的,其余东西都不用变。下面的话就是咱们的回归分析啊,或者说啊回归分析里面我们包含一些中介机制呀,调节机制的检验,那么我们一般会把表格做成这样子的一种形式啊,做 这种形式,然后他的这个,嗯,代码的话,我们就在这边啊,一般情况下我们选择固定效应模型的话,就上面这个代码,当然这个代码的话,他他并不是说唯一的这个代码是最简单的一种代码,就我们直接一看我大家就能记住了,哎,这就是做固定效应模型的一个代码,那么如果我们想通过代码把这个输出的结果,因为他用这个代码输出的结果,嗯,非常的这个 就是不像,不像这块这么美观啊,不用你再去调整啥,你这个做出来的那个表格的话,他还需要你后期进行整理,整理成这个样子,所以啊,这个这个代码他就不是唯一的,我们还有一些其他的代码,但是比较复杂一点,他能够帮助我们去把表做成这个样子啊,这是我们大概了解一下, 这是回归分析,那么回归分析的话,我们主要就是去解释在这一块的时候,他就跟相关系数,相关分析那块不一样了,那我们通过相关分析可以简单的去描述一下边两两两之间的一个相关性,那么在回归的话,你就重点得去解释一下我们的回归系数是正的还是负的啊?是大于零还是小于零,然后解释它的显著性是 在多少的水平下显著,对吧?然后括号里的值,我们一般把它叫做呃 t 检验的值,这个值其实跟星号他们两个所代表的呃就是他们俩,他们俩所所展现的内容其实是相同的,都是在说我得到的这个回归系数他是显著的, 然后呃基本上星号和这个 t 值是呃对应关系啊主,然后如果,比如说我们自己的数据呃不太显著,然后有人把这个数据给他改了,哎,比如说,比如说这个值对吧?负的零点五六二六,那他本来是不显著的,然后我们呃可能有些人把它改成了显著,然后他下面的 t 值没有改那么一眼,那就是咱们了解 stata 的人一眼就可以看出来这两个是不对的啊。这是这个回归分析 下来的话,就是咱们的一个稳健性,检验稳健性的方法非常多。啥叫稳健性呢?就是我用另外的一种方法去验证一下我刚刚得到的这个结论是不是正确的,或者说我得到的结论是不是一个偶然性的结论。那么我们稳健性的方法的话,就比如说最常用的替换变量法,第二个的话就是改变呃 年份,就比如说你原来研究的是呃一零年到二二年,那我现在把它改成一五年到二二年,再次做上面的回归,看一下结论是否一致。那么替换变量法的话,顾名思义就是把我们某一个关键变量的量化方式给他换掉,那么咱们一般替换变量主要是替换音变量, 因为应变量是贯穿始终吗?不管你哪一个分析,他应变量都要参与,所以我们一般就把这个像这个企业绩效,他原先用的是这个 topico 值,我们就可以把它换成比如说这个企业的资产报收率啊,企业的净资产收益率啊等等这些指标。那么把这些变量换掉之后,我再一次去做上面的这个回归,看一下结论是否有差异 哦,但是要注意的是这个结论是否有差异,并不是只代到我的回归系数一定要相同,或者我的显著性一定要相同,这块指代的就是我所用两组数据做出来的结果。哎,他的正负性是否一致啊?他的显著性是否都显著,不用去管那一颗星,两颗星还是三颗星,只要他都显著就行,这是稳健性。嗯, 我们先从这个内生性检验的含义来讲,他就是说这个模型中一个或多个解释变量与误差项存在相关关系,那么说白了,这个解释变量就指的是咱们的音变量字变量,误差项指代的就是我们对音变量有影响的其他变量。那我举个例子,比如说我们去论证学习态度对对学习成绩的关系,那么 存在内生性的这个从他的含义来讲的话,就是我们的这个自变量学习态度和影响学习呃,成绩的其他变量存在相关性。如果有这种关系的话,我们就说,哎,可能会存在内生性问题, 那么呃,他并不是说,哎,他这个含义是这样子的,但是并不是说产生内生性就只有这一个原因。我们产生内生性的原因非常多,这里我们主要说 写作过程中最常遇到的第一个叫做遗漏变量。这个遗漏变量的话,其实就是在说我们文章中,因为你一篇文章研究的内容是有限的,你不可能把所有的东西都研究透,所以肯定会存在遗漏变量问题,那么你遗漏的那些变量就可能会与你的字典 有关系,就我刚才说的这个学习态度,他可能和一个我们没有研究到的,但是能够对音变量学习成绩产生影响的啊,有关系,他们俩有关系就可能会有内生性问题。 第二个的话就是互为因果,互为因果的话就是主要指咱们的呃解释变量和背解释变量,也就是字变量和音变量之间,我们理论上是认为字变量去影响音变量,就学习态度会影响我的学习成绩,但是有有很多情况哎,比如说我觉得这个例子 反过来也是可以的,就是当我的学习成绩比较高的时候,我的学习态度其实也会有一个变化,这个就是互相影响,互为因果,那么互为因果的话,他也会导致我们的内生性问题。当然还有一些其他的,我们这里就比如说一些呃存在测量误差呀等等等,我们在这块就不再去赘述,因为他呃没有办法解决啊, 就是在我们的写作过程中。然后第三个的话就是我们当我们存在内生性的时候,我们常用的最常用的办法叫做或者说呃文呃写作过程中最常用的办法叫做工具变量法,但是还有些其他的,我们这块就不过多展开。 然后我们对工具变量找寻的要求的话,有下面这两个要求,第一个的话就是要与 x 有关,第二个与 y 呃影响 y 的其他变量无关,也就与我们的残差项无关。那么这块怎么样去解释呢?就是内生性问题,我们用工具变量法去呃去检验它的时候的逻辑其实是这样子的, 是我们现在说 x, 它和我没有研究到的,但是能影响 y 的变量,它有关系,所以导致了内生性。那我现在能不能去找一个工具变量,它既能够, 嗯,跟 x 有关系,就是它既能够代替 x, 然后它又与这个影响麦的其他变量无关。那如果我能找到这个变量的话,我就可以拿这个工具变量指代我的字变量去进行回归分析,那这样子的话 就能够确保我的这个自变量就是咱们的工具变量,到时候就变成了自变量嘛,就能够确保咱们的自变量和呃残差效是没有关系的,那这样子就能够确保最终的结论他是不存在内生性的呃,但是往往呃我们工具变量的找寻的话,它的难度非常大。就是我们 如果是说论或者不是论文,甚至本科论文,如果我们要去做内生性的话,其实一般都不建议我们自己去创造这个工具变量,我们一般都是去别人的论文或者文章里面去找,比如说我还是刚才的例子,我们去验证学习态度和学习成绩等。然后现在我导师说了,这有内生性问题,你得去找一个工具变量, 我们就在织网里这两个变量作为关键词,去搜别人研究的相关文件,去看一下别人在去解决内生性问题的时候用了什么变量,我们直接照搬过来啊,当做我们的工具变量直接去进行使用就行。 下来的话就是最后一个我们的抑制性分析啊,抑制性分析的话他呃就比较简单了,他实际上就是把研究对象去分类,然后重复的进行回归分析,他实际上,呃,因为有,有时候有有些人把抑制性他叫做检验,严格来讲的话抑制性我们一般是一个分析的内容,就是我对回归分析的进一步说明,那我回归分析,假如说论证出来 这个自变量对音变量有一个显著的正向影响,那我的意志性就是我把我的研究对象给他分成呃细小的类。比如说刚才是对企业 进行分析的,那么我们把企业分成了这个江苏,把企业按照不同的省份给他分类了,分成了江苏省和浙江省,那么我对不同的省份去进行一个回归分析之后发现,哎,是不是浙江省和江苏省他们两个之间的回归结果是有差异的?那如果有差异的话,我就要去解释一下为啥这两个省之间有差异。 当然这个分类的方式的话,他并不是唯一的,也不是说固定的,我们要根据自己的研究内容,比如说你是企业,那你就可以分成国企、非国企,那如果你是研究污染相关的,你就分成污染企业和非污染企业,还有咱们的一些呃,大规模呀、小规模呀,甚至企业成立的时间等等。


哈喽,今天给大家带来一个我自己在做回归的时候,常常会去筛选我们的控制变量是怎么筛选的,然后我结合市面上现代所有筛选控制变量的这个嗯,代码吧,然后我自己做了一个这个小程序,就首先你运行的时候可能会 初次要加载它嘛,加载它的话可能就会这里会安装一个环境依赖包,可能会比较慢一点点,然后的话我们就可以上传我们这个已经清洗匹配的数据了, 然后的话就是上传完数据之后它会先进行一个分析,然后的话你的被解释变量你可以选择 t f o p 或者是 t f l p 嘛,然后的话我们这里的 x 的 话就是我用的是试点政策嘛,所以需要先选 d i d, 那 么我们后选择控制变量的话就可以, 你现在这个原始数据里有多少控制变量都可以加上去,加上去的话一般不用必选这个控制变量,不用管他,因为我可能是觉得他是正向的吗?就我点一下,然后这些标准误线啊,就可以先不选,只选这个 固定效应是双固定,然后控制变量个数大大改化,就是你可以填十个距离变量,我一般也是不选,因为我这个显著性会被压掉,那么我们先估计大概就是六百个模型试试吧,然后就是这里的话就填我们 p 值 显著性,然后点击运行回归,那么此时我们这个就会出现我们这个固定效应,且组合较多,就是 因为他是有一千零二十四个模型吗?就是你可以先少量试一下他卡不卡,如证明你这个网速如果快的话,就是你可以继续点击吗?然后在这里的话,你就可以看到我们这个 看这个系数嘛,就是你在这里也可以看见嘛这个系数啊,是怎么样的?然后 p 值就在这里 p 值,然后你此时就需要你自己去看一下你需要找几个控制变量,控制变量肯定我觉得我肯定会调很多, 所以说这个就是要看个人的喜好了, 然后的话可能这个程序还是不太完善的,所以我在这里再调一下一零二四最大的这个数量,试一下, 然后必选的控制变量,我肯定是,那我再加一个必选的控制变量吧,最起码得选个七八个吧,然后就让他自己试一下, 然后我们在此时再点击一下这个运行违规, 那么此时的话我们这里就会弹出我们这个,我们筛选大概就是一二三四五六七八九,大概是八九个控制变量,这个的话就是你需要自己后期去尝试的, 然后的话我们这里就是推荐的这些模型,因为刚才我们可能只有八个模型,因为你这里是必须要控制这几个嘛,所以说我们点击下面的话,我还没有上 token, 所以 说先不用管这个东西,然后你就可以点击这个按钮,一键生成我们的这个推荐的, 然后我们可以检查一下我们这个推荐的这个文档,此时看见这个系数也是可以的。 然后大概也有我们的控制变量 yes 以及我们的固定模型啊,阿方都在这里体现,有就是可以大家尝试一下, 就由这工具我后期还会进行完善,所以说有需要的时候,到时候可以共享给大家。

好,前两个视频呢,给大家讲了怎么做进行这个实时分析的数据清洗啊。这个最关键的一个点啊,就是那个数据清洗的时候千万不要踢出去是值啊, 一定要在回归之前再踢,在这里再踢啊,千万不要在数据清洗的时候踢出去是值,因为有些变量如果你没认上的话,最终会导致你的结果,导致你的数据。 呃,这个缺失的样本比较多,把一些不需要剔除的样本剔除了啊。好,今天给大家讲一下这个时政分析该怎么做啊?首先我们是因为是数据,就是大家是已经清晰好了的啊,我前两个视频可以就是进行到那个数据清洗 呃,合并成了一张表格。然后我首先给大家介绍一下这个人同学研究的是这个沪深港通持股对那个股票流动性的影响的啊,我们就把这个股票流动性就是股票流动性的指标,我们把这个股票流动性的指标计算好了, 然后嘞他那个持股,我看一下这个解释变量,找一下这个解释变量在哪里啊? 这个,这个就是富城卡通牛股的他,呃,富城卡通持股的他这个是占,找一下啊,持股量,这个是占 a 股流通市值的比均的哦, 就是这个变量,这个变量是占占流通 a 股计算占 在牛头 a 股,在牛头 a 股计算他那个附生港通的持股。然后这个是我们的减式变量,这个是我们的被减式变量。首先呢,做实时分析之前,我们就是第一步导入数据,这个 import 就是 导入 excel, 就是 导入的是 excel 的 数据。 然后先紧接着就是你的保存数据的那个文件的路径,然后 first load 就是 第一行作为变量名。 clear 就是 把清除以前 state 里面一定有的数据。好,我事先给大家导入一下这个数据啊, 然后我们不需要在这个命令窗口去运行的啊,选中它,直接选中它,然后 有一个这个运行的这个符号,这个这个这个标志 ex execute 就是 执行,或者是我们右键单机剪辑这个工具也也有个 ex execute selection, 就是 就是执行你选中的那一个代码, 就这样运行就可以了啊,不然你就搞到这个 command 里面去运行,就选的比这个水平比较菜。 然后呢,首先我们这个啊,为了简洁一点啊,这个证券代码首先给他命名,全新命名,命名为 code 或一二,当然有些同学喜欢用 id, id 一 二也行, 然后 sd 赛啊,这个大家都知道是设置那个密码的,然后这个是给行业进行编码,然后是给这个变量改名字, 哦,这个流通古树啊,是改改了,然后这个改改个名字,然后有些计算的呢,就我们就计算一下,这是常用的控制变量啊, 研究上市公司的很多同学都研究上市公司,这常用的变量是哪些呢?企业规模自然就是自然整机的对数,还有这个资产负债率,负债合计除以资产,整机 整资产净利润率就是净利润除以整资产现金流状况就是这个经营股份的现金流净格除以资产等 级。还有这个呃,企业年啊,两次可一啊,独立等资产比等社会规模,第一大股东持股比例,产权性质,这些都是我们最常用的一些指标,还有他这个他计算出来的一些指标,他做用借或调节的啊,计算出来一些指标,做好这些之后,我们再给他剔除趋势值, 一定要记住啊,千万不能在那个数据清洗合并的设题啊。做完这些工作之后,然后我们就是缩尾,缩尾就是用这个命令缩尾的,就是我们对我们的解释变量,被解释变量,还有我们的控制变量进行缩尾啊,缩尾的话和对中介啊调节变量都可以缩尾的啊, 然后缩尾的话就是 winso a 这个命令啊, w i n s o r a 跟这个命令缩尾的目的就是为了剔除那些异常值,有些根是在某些年份,它存在一些特殊事件,导致它那个值特别大或者特别小,我们把这些值给它处理一下, 然后描述性啊,描述性我们一般是用这个 s u m a d o c x, 用这个命令就比较方便,但是哎呀,这个相关性分析啊, c o r a d o c x, 但是这两个命令要 state 十五点零以上才能 这个安装啊,所以建议大家把那个版本更新一下,然后我们首先给大家介绍一下这两个命令啊,这个 描述性统计命令就是这个,然后我们剪辑的描述性嘛,我们只需要对我们的背景式变量,解释变量以及我们的控制变量做描述性统计就可以了啊,中介调节一般是不需要做这个啊描述性跟相关性的, 然后先选这个命令,然后再选你的背景式变量以及控制变量,然后 u c 就是 我们保存这个描述性统计 这个结果的,这个后面接的就是我们保存这个结果的文件,当然你我这写的是没有数据点 d o c x, 当然你如果想改其他名字,你自己改就得了啊。 然后约 place 的 话,就是如果我们的这个文,这个路径下面啊,有一个叫做,比如说硬盘寄点 d o c x 的 文件,那我们就把它覆盖掉,就是相当于把这个文件先它删除,然后新建一个,比如说硬盘寄点 d o c x 文件,它以前的内容我就不要, 这是这是这个有 place 的 作用啊。然后在 s t a t s 就是 我们用报告的统计量,会报告哪些统计量呢?样本样本量平均数 标准差最小值,中位数最大值,这个九点几,九点几就是我们挑小数的位数的,九点二就是两位小数,九点零就是啊,不得不保留小数,大家,我建议大家全部选成九点三, 九点三就是保留三位小数,建议大家都这样保留啊。然后这个 title 就是 描述性统计,就是我给大家运行一下,运行一下大家可能就比较好了解一点。 好了,我们打开这个描述性统计啊,这个是我们做做好的描述性统计了,然后就是 变量名字 variable, 变量名字 obs 就是 样本量,样本量,我们在这个删除确定值之后,这个样本量就是统一的,然后这是平均数,标准差最小值,中位数最大值。呃了,背景式变量,我们的减数变量,我们的控制变量 就是这样的,然后这个小数点,你看刚刚我不是改成九点三了吗?还有三位数,我建议大家就这样操作啊,然后还有一个 一些同学经常问到的这个负点幺三九,这个什么意思啊这是,其实是有个零的,但他导出来就是这样的结果,他零给你直接忽略掉了啊,这个自己把零加上就好,就是比如说性相关性分析, 我们也给大家跑一下啊,相关性就是这个变量,就这个命令,然后掐上你的背景这边显示面板,控制面板,然后也是用用前面这个文件去保存它的结果就是我们就不用重新再新建一个文件了,就是直接 open 往后面加, 然后就啊这个这个东西啊,大家可以呼吁,然后直接直接写上就可以了,然后再 type 就是 相关系数。举重,他刚刚就没有数据统计里面的 type, 没有数据统计的啊,就是这个,这个就是你的 type。 好, 然后我们关掉啊,关掉,先关掉,然后我们再运行,运行后面的相关性相关性分析,然后我们运行一下, 然后我们打开好,然后我们就看到相关性相关系数,相关性检验也就在这里了。首先我们相关性主要看哪些东西呢?主要看它的这个解释,变量与背景这背景式变量,它们的相关系数, 他的相关系数是正的,初步就表明这个东西啊,这个减时变量对背景时变量是有增项影响,并且在三个心上显著初步表明,然后还有另外我们大概就是看一下控制变量之间的相关系数, 只要控制变量之间的相关系数啊,基本上都是小于零点八的话,那我们就不需要做多重更新型检验了,因为初步表明他没有明显的多重更新性, 这个就是我们做相关性的那个主页的目的啊,好,我先关掉啊,然后还有一个啊,这这个是这个是做什么呢?就是这个系数太大或者太小,如果这个系数啊,这个 这个系数太大太小,我们就调这个量缸,就是调那个单位,例如你万座单位或一座单位,我们做出来系数会相差一万倍,但是他的那个显著性是不变的。 一般来说我们系数大小不是特别关心,我们只关心他的显著性。所以说我们可以在这个回归之前啊,这也是在描述性、相关性之后,描述性我们还是用原始数据,然后这个 没出现相关性之后,我们就做一个这个啊量高的变化,然后我们再看一下主回归,主回归列,我建议大家啊,就是做两列,第一列就是你直接用减时变量对被减时变量进行回归,然后呢这个是, 嗯,第二列我们就加入这个控制变量,做两列啊,嗯,有些同学呢,喜欢用那个逐步回归,就挨个往里面加控制变量,但说实在的我觉得没必要 主回归论,我们一般用 r e g h d f e 这个命令啊,就是高维固定效应,我们就是在先写到这个命令,然后写到你的背景是面料,整个是减饰面料,然后打个逗号,然后我们就加我们的固定效应。 absorber 就 加我们的 固定效应的,然后打个括号,写上你要固定的哪些固定个体跟年份,然后呢? v c e, 我 们是加我们的矩阵的标准物的,我们是矩阵的个体, 然后如果说这个这个坑字个体跟年份不显著的话,我们也可以坑字行业跟年份并没有这个一定要坑字个体跟年份的,坑字行业跟年份也是 ok 的。 好了,然后我们给大家跑一下,结果 我们跑完结果之后就发现这个样本量是幺幺三幺零, f 字是六十一点三零, 然后这个呃阿方是零点五九零五,调整后的阿方是零点五零,阿方也是还是比较可以的啊。然后我们这个没有加 cos 变量的,它的这个 h 就是 你的背景是变量,我们主要看它的系数, 你看它的系数是零点零零零八四七三,然后 p 值是零点零零零, p 值越小代表它越显著, p 值小于零点一就代表它已经显著了, 小于就是零点零五到零点一之间就是一个星显著,零点零一到零点零五是两个星显著,零点零一以下就是三星显著,我们这个是三星显著的啊。 然后这个加入控制变量之后的我也给大家跑一下,然后这里还报告了啊,报告了我们的有多少个公司,多少个企业是一九四九个,一九四九家公司。好了,然后我们再跑一下这个加入控制变量的, 加入控制变量的我们做出来系数是相对要小一点,但是同样是批次是比较小的,也是同样是显著的,所以说这个结果就是 ok 的。 然后我们在啊跑完这个回归之后,我们就把这个结果导出,首先我们把这个结果保存在 est store r 一 就是把这个上面这个回归结果,把这个回归结果保存在 r 一 这个变量里面, 然后下面是保存结果,保存在 a 里面,然后把这两个变量导出,然后我们把这两个结果导出,我们也同时用,也是同样用这个描述性统计点 d o, c x 文件,然后也是往里面加,往刚刚我们的相关性描述性之后面直接加在他的后面, 然后我们报告亚本亮,报告阿方,报告挑战的阿方,还有这个 t 值这些,然后 title, title, 我 们是主要是搞个集中回归, m title 是 m title, 就是 那个列的那个变量。好,我们给给它运行一下,给大家看一下 option vc cluster code 拉的 a lot, 看一下哪里有问题啊? 我们是运行一下上面的,上面的是没问题的,上面这个都是没问题的,这里我看一下我哪里写错了, 把它覆盖掉,应该是哪里写错了,可能是,好,我就运行出来我们结果了,然后我们再把下面那里运行一下。 哦,这个 vce 不 能加到这里的, vce 是 不能加到这里的,这是回归里面才加这个 vce 矩阵的标准物的 aimed, 对, 然后我们我们把结果保存一下,然后这个是这个是我们的结果好了,然后这个首先今天给大家详细介绍一下,就这个 m titles 是 哪里嘞?我们加的这个这两个是哪里嘞?这个就是 m titles, 就是 我们的背景式面料,你有多少个回归,你就加多少个 m titles, 按顺序每一个回归它的背景式面料是什么,我们都加到这里, 我们都加到这里,然后几种回归 type 一 几种回归就是我们的 title, 就是 这个东西, 好了,我们这是跑,跑出来的结果就是这样的,然后你看一下他这个系数太小了,系数太小了,我们就说一说,我们也应该在这里做量缸调整, 就是这样的,然后我们这是主回归的结果,中建效应啊,中。然后我今天再给大家讲一下中建效应,明天再给大家讲调节,还有倒 u 型,还有一次性,还有稳定性。明天我再给大家讲剩下的。然后中建 军界的现在最真最最大的争议是什么呢?是两步法跟三步法,但是我建议大家还是用两用三步法。 第一步就是你的减式变量 x 对 你的 y 进行回归,也就是你的积分回归,这是第一步。第二步就是你的 x 对 你的军际变量进行回归, 也就是你的 x 对 m。 第三步它们两个同时对你的 y 进行回归,然后控制变量,我们要所有模型都要保持一致,然后固定效应,还有这个稳距离稳定的变量,我们所有模型都要保持一致,然后用三步法, 然后把结果导出,同样是用这个 r、 e, g, a, d, o, c, x 啊,这个是结果导出的命令啊, 然后其他的都跟上面的相同,然后 title 我 们就改掉,你做个什么中介效应,写上你的中介变量啊,再加上你个中介效应, 你看一下这是有三个模型,所以说第一个模型的背景是不是是这个?所以说,嗯, t r s 的 第一个是这个, 第二个模型它的它的背景上面是这个,所以说这背景上面就是这个,然后第三个,第三个一对应起来啊,这个是不能加在这里的。好了,然后我们把这个结果也导出,也运行一下啊, 好了,我们就看到结果运行完了,因为我这个是 mac, 我 必须把前面一个文件关掉,我们才能打开新的那个文件,不然他不会往里面加的。 好了,我们就现在看到描述性、相关性主回归,还有这个情绪,这个投资的情绪的均值效应我们都导出来这里了。第一个系数太小啊,系数太小,你看出现零点零零零零这种情况啊,我们就做晾干调整了啊, 就是我这里的晾干调整乘一百或者除一百都可以啊,一定要做晾干调整。然后 第一步就是看他对他的影响,第二步就是看 x 对 m, m 的 影响,他是促进了这个提高了这个投资的情绪的。第三步就是看他们俩共同是对他的影响,你看他这个 减时变量,你现在减时变得不显著了,但是你的周期变量是显著的,他属于他是一个完全周期效应。但如果他显,他是显著的啊,他也是显著的,那就是部分周期效应啊,这个大家要分清楚, 然后你看系数就是比较小,有做晾干调整啊。再次强调,不能出现这种零点零零零零这个系数显示不出来的情况。好了,这个是军机摄影三步法跟两步法的区别呢?就是第三步,没有第三步剔除掉,那就是我们那个僵挺的两步法, 然后只做了这个 x 对 y 的 影响,还有 x 对 m 的 影响,就是 m 对 y 的 影响,那你就用其他人的研究结果,用其他人研究文献去解释为什么会有第三步了,所以说三步法还是比较好解释,两步法你就参考其他文献了。 好,今天的那个我们就讲到这里啊,明天继续给大家讲调节效应、倒油型、抑制性还有稳健性,又能做哪一些东西?该怎么做?

大家好,我们继续上节课的基础回归篇,来继续讲一下这个。呃,接着讲一下,大家记得上节课我们讲到哪了吗?上节课我们是不是做了,做了时政的回归,对不对?基础回归 r, e, g, h, d, f, e, 然后呢?音变量是我们的这个 roe 对 不对?因为 roe 它是不显著的。然后字变量呢?是啊, size, 然后控制变量,我们还没有选举,对不对?然后逗号, 然后固定向量 a, b, 然后,然后我们用了,呃,个体固定和时间固定,让我们会发现是什么样是 正向不显著,我们可以试一下这个是不是行业来上节课,行业代码和时间对不对? 对,行业固定和时间固定,大家可以看到这是三颗星显著,对不对?怎么看呢?第一列这个回归系数是正的对不对?零点零零三,说明书都要整齐,会促进企业的财务绩效。然后这个 p 值啊, 这一列 p 值可以看到大家 p 值是小于零点零一,它是三颗星显著,对不对?是三颗星显著,然后我们把这个回归代码放到这,那放到这之后呢?我们是不是要选举控制变量?但是有时候随便加控制变量 它是不显著的,那我们怎么该去选举这个控制变量呢?包括我们选举控制变量是要依据什么样的原则去选呢?然后我们接着讲一下啊, 我们讲一下控制变量的部分,在写尽管实证论文的时候,很多同学会有疑问,老师我是不是把所有的控制变量都要加进去啊? 对吧?那看有些论文它控制十个,有些论文控制六个,那我到底是加六个还是加十个?那么什么是控制变量?控制变量加的是越多越好吗?控制变量的原则是什么?我们今天仔细讲一下 控制变量,大家想一下我们时政回归模型当中,它实际上为什么要加控制变量呀?因为我们既然研究数字化转型对财务绩效的影响,那我们直接去把数字化转型财务绩效去做一个回归,不可以吗? 得,这不现在就是我们刚才做这个回归吗?他不是也得出这个正向的影响了吗?那这个论文就可以写了呀,那为什么还要加入一些控制变量呢?实际上加入控制变量的目的啊,它是为了解决我们模型当中一个固有的问题,它叫做内生性问题, 它叫内生性问题。那么内生性问题当中有一种问题叫做什么内生性问题当中有一种问题叫做什么遗漏变量问题啊?那么控制变量的加入目的其实是为了一定程度上缓解内生性问题当中的遗漏变量问题。 我们可以继续说一下,你看我们研究数字化转型对财务绩效的影响,那么现实中对财务绩效有影响的变量难道只有数据化转型吗? 并不是,对不对?比如说 size, 企业的资产对不对?然后企业的啊,那个 gross 营业收入增长率对吧? board 是 不是 formage? 那 这些对企业的这个财务绩效是不是都有一定的影响啊? 对吧?所以说除了自动化转型这个自变量之外,还有一些比较重要的影响因素,也对应变量财务绩效有着比较重要的影响。所以我们在实际回归当中的时候,我们应该把这些对应变量有影响的变量也放到我们的实际的这个回归模型当中去, 他才可以最终得出的这个回归结果,他才是叫做无偏估计,对不对?没有偏误的。所以控制变量的目的,他其实是为了干嘛?控制一些可以观测到的对变量有影响的因素,然后其他减少加因素的影响,让我们的回归结果更加稳健,对不对?所以控制变量就这样的目的。 那么选举控制变量应该怎么选?选举控制变量的话,我们控制变量越多越好吗?并不是啊,控制变量并不是越多越好,我们实际当中呢,控制变量选举八个左右,企业数据选举八个左右就足够了啊?八个左右就足够了。 那么控制变量怎么选举呢?其实选举的原则就是选举这个常用的一些控制变量,比如说我们企业数据当中有这个啊, size 对 不对?资产规模 l e v 资产负债率 growth 应收入增长 board 独立董事会规模 in deep 独立董事比例啊 do, 那那个是否两值合一对不对? loss 是 否亏损 for each 啊?且成立年限对不对?有好多比较常用的控制变量,我们从这长的控制变量里选举一些就可以。那么选举的原则啊,我个人认为控制变量选举的原则最最最最重要的一点是什么?要让我们的主回归能够显著, 就是你选举这些控制变量加进去之后,我们的主回归依然是显著的,我们可以随便选一下啊,我们随便选,你看现在是这个因变自变量,因变量自变量,对不对?后面加控制变量,我们比如加一些 size, l, e, v, 对 不对?然后 cash, flow, growth, loss, board, deep, 对 吧?然后是,呃, form, age, 对 不对?我们加这些 加进去之后,大家会发现回归结果产生了什么样的变化?产生了什么样的变化,是不是啊?本来是那个应该是正常显著的,对不对?但实际做出来成了什么样的显著了? 实际做出来之后变成了负向的一个不显著,对不对?那说明什么呢?没有加入控制变量之前,回归结果是显著的,那么加入控制变量之后,回归结果反而不显著了,那是不是由于控制变量的原因啊?对不对?由于控制变量的原因,所以我们要对控制变量进行一个筛选, 那么对控制变量进行筛选的时候,手工筛选其实非常非常慢的,手工筛选非常非常慢,所以我们可以通过一个代码,那么有个大神他编写了一个代码啊,他叫做这个 one click, one click 这个代码啊, one click 这个代码有个大神编,呃,编写这个代码, one click 这个代码,它的工作原理是对这个控制变量进行一个排列组合,但是对样本数据呢? 不造成任何影响,但它不是万能的,只是在一定程度上可以对我们这个工作量进行一个减轻啊?工作量进行一个减轻, 然后我们大概讲一下这个 one click, one click 后面首先放 y 音变量,再放 control, 再放控制变量,然后放自己的回归的方法,放自己希望的 p 值,然后 fix 的 里面,呃,是你需要每次都要出现的这个,呃,每次都要出现的这个 啊,叫做什么啊?组合 fix 里面什么意思?都需要出现的一些组合啊,然后 o 呢?是里面要放的是这个什么啊?回归方法加选项啊,比如说固定效应之类的啊,然后我们对这个啊,回归啊,做一个控制边做一个筛选啊, 我们可以找一下这个回归的代码。 嗯,找一下 winclick 的 代码啊, 先放 y, 再放一些控制变量。那么控制变量啊,可以放 size, l, e, v, cash, flow, growth, loss or, 我们可以先放一些啊,因为它运行速度会有一些慢啊,它运行速度会有些慢,所以可以先放一些。但是我们实际在操作中的时候, on click 里面控制量放的越多越好啊,然后 fix 点 x 里面, fix 里面放你自变量,自变量数值化转型, 然后 p 值,我们希望小于零点零五吧,希望有两颗星,然后固定向于是行业和时间,对吧?行业和时间, 我们直接运行一下这个 one click, 然后运行的时候,他说啊,有一个具体预估的时间啊,我们等一下他啊,具体预估这个时间,让大家可以往后加速啊,一会儿是直接加速跳到他啊。这个 one click 结果出来的时候, 好啦,我们已经看到这个 one click 的 结果,它就运行出来了。运行出来之后呢,在你的文件夹的部分,它会出现一个 subset 这个选项,我们打开它, 我们首先把我们数据保存一下,保存之后我们打开这个 subset, 它会生成一个 d, t, a, 然后打开数据编辑,那么这里就是你的这个回归能够达到显著的组合啊,能够达到显著组合 positive, positive 就是 它积极的选项嘛?积极就是它能够显著的,你看这就它给我们筛选出来的,我们可以随便复制一下这个控制变量,然后呢?呃,把它放在我们的控制变量部分,然后打开之前的这个回馈数据, 打开这个回馈数据,然后运行一下, 我们会发现最终得出的回归结果就是什么样的,正向的显著,并且是三颗星对不对?而且控制边呢大部分也都是显著的,大家看到没有?这就是汪克利的魔力啊,它能代表帮助我们通过这个啊,减少一些手工,筛选一些繁琐工作 啊,就是排列组合,然后呢我们可以做起来快一些啊,然后今天就讲到这里,然后下一期开始讲中介调节,继续分析。好,谢谢大家。

各位同学大家好,欢迎大家来到知己数据分析课堂,今天呢,我们一起学习一下如何用 stata 来进行逻辑回归分析。 那么逻辑回归分析呢?其实之前我们讲到过,我们主要使用的就是一个二元逻辑回归,它指的是我们的阴变量呀,它是一个二分类的,要么是零,要么是一,要么是二,所以它只能有两种情况,有两种选项, 它的具体的结果呢,也只有只能是两个数字的这种音变量呀,我们成为二元的一个音变量,那对于自变量呢,是对于连续还是离散的,那都是可以的,这是我们的逻辑回归, 大家可以稍微回看一下之前 s p s s 软件讲的那个,要讲的稍微细致一点。我们今天呢,主要是来讲一下如何用 stata 来去做一下。 那么在 stata 软件之中呢,我们默认的一个命令呀,就是 logitech 命令,它的是逻辑回归分析。后面简单的是啊,音变量,自变量,控制变量啊,这变量的顺序一定不能够进行调整啊,尤其是这个音变量呀,必须要放在这个第一个位置上。 那我们就举一个例子,哎,我们这里面这个合格考试及格情况呀,就是零和一,哎,就是及格和不及格,那么它就非常符合一个二元的一个特征啊。我们再找一个自变量,就是努力程度, 我们看一下,你是不是越努力,你的这个及格可能性越高啊。控制变量呢,我们选择的是啊,性别和年纪。 ok, 我 们这样来运行一下,哎, ok, 结果就要出来了,我们发现呢,努力程度果然是啊,正向影响的, 但除此之外呢,我们还可能会用到什么呀?我们之前讲过的离散的 哎变量,比如说这个喜欢的科目,这个科目它是不是一个称名数据呀?所以说不能够直接将它进行放到我们的模型里面, 需要进行虚拟变量的设置。那么在 stata 软件之中呢,虚拟变量的设置啊,就可以在前面加一个 i 点就可以了。 ok, 我 们运运行一下这个结果啊,我们发现了 我们这个喜欢科目呀,已经设置为了两个虚拟变量,是吧?因为我们的选项呢,是有三个,三减一就是二。 ok, 这是我们对于常用的逻辑回归分析在 stata 中的一个操作。我们讲到这里,大家再见。

一步,呃呃,就是设定面板数据,用 excel, 我 相信这个你也做过。对,用 excel, 然后设定面板,这是我们的第一步,设定完面板了过后,它它会说明一下一个大致的情况,然后也可以发一一五年到二十年的数据,然后啊, python, data, 微软,微软,然后设定完过后, 那我们开始跑回归,那现在是这样的,就我们现在所有的基础回归,我们都用的是逐步回归法,就第一列不加控制变量,第二列加控制变量的这种啊,这种做法,那为什么我们会采用这种做法呢?那我下面给你解释一下,就说我们控制我们,我们的这个 控制变量的选举是不是具有极大的这个随机性啊?就主观性啊,你会发现每一篇文章他的这个呃控制变量都不一样,对不对?基呃基本上都是不一样的控制变量,所以这也就导致就你认为你的控制变量选择的很合理,但是并不代表别人认为你的控制变量很合理,这句话能听懂吗? 对吧?然后,然后,所以啊,这时候你做完过后,肯定会有人会呃,会,会质疑你,会质疑你这个控制变量选择的问题,对不对?那你为了避免这种问题呢?过后的存在呢?你就会说我第一列不加控制变量,我第二列加控制变量这样去做,就我不加控制变量的时候,它也是显著成立的,加完控制变量过后,它还是显著成立的,这就是直接,对,这个就是我这种, 我这个基本假设的这个成立啊。呃,成不成立啊?其实跟我的控制变量选择其实没有太大的关系,能理解吧?就说明这一点。还有人他是这样去解解释的,就说我们为什么要去做逐步回归法?因为你会发现我们的这个一篇文章的机制分析和意志性分析都是建立在基础回归成立的前提下,对不对?那么你必须要让你的基础回归具有极大的说服性, 所以你要用逐步回归法去做增加它的说服性,包括你后面的这稳健性及内心性检验,都是建立在都是在说明机制回归的这个问题,对不对?都是在不断的增强他的这个说服性,毕竟你的机制分析就是那个现在论文也是,就是文章,他都是那个逻辑演绎法嘛,就这原因好不好? 这种我们要为什么要用这个方法?然后,然后你的被解释变量是 d i r, 对 不对?然后解释变量是 ip, ok, 我 们首先不控制个体和行业,我们试一下结果, 好, ok, 你 会发现结果是不是显著为正?这里是我们只需要看两遍第一点和第四点,这个是系数为正,这是不是显著,嗯,对不对?然后是不是符合假设了,对吧?然后这时候我们再去,再去干嘛呢?我们固定年份和固定行业,而在这里呢是本节课的第二个细节点,打错了,那个 id, 哦,不是 id 就是 id, 哦,对,这就是我们,我我我这节课讲的第二个细节点,就是就是, 呃,固定效应回归,它是有两个代码,一个是 i t i g f e, 这个是史蒂塔里面它自带的一个固定效应回归,它本质上就你,你在设定面板的时候都设定了,就已经设定了这个 id 是 个体,它,所以它就会自动去固定了,理解意思吧?还有一个代码,固定效应回归是用的是这个, 呃, h d f e, 然后后面加 autobot 的,是吧?然后 id, 然后 e, 啊,对不对?是不是这样?它这个全称好像是 autobot, 应该是这个吧,对吧?然后把它这个固固定,个体需要在这里去体现,然后我在这里去想跟你讲的讲的这件事情就是说 ok, 为什么会有两个固定效应回归呢?就是因为一开始我们这个 stata 在 十四版本,十五十四版本以前,这个命令啊是外部命令,我们只能用外部命令实现固定效应回归,用,呃,用, 只能用外部命令这个这个命令去实现固定效应回归。然后后来呢?固定效应回归成为学术的主流过后呢?然后 stata 官方呢?它就自动把它,把它加到官方数据数据命令里面了。所以后来我们就看会看国外的会比较多,国外的会用 fie 比较多,呃,国内的还是用 fie, 这个它默认自动固定个体的。 然后在我们文章里面,其实呃,很奇葩的是,目前就是中国的北河的二区、三区这种核心刊,它它会视为呃,就是很多,我看很多,呃,很多,它是这样的, h d h d f e, 然后 over over 的 括号 id, e 啊,它把这个视为双向固定效益回归。 那我想在这里表达的给你表达一点,就是说这个不叫双向固定效益,叫做单向固定效益回归,为什么呢?因为你个体固定是本身就要固定的,你的个体如果不固定的话就是这,那它还叫固定效益回归吗?它不是,它是混合回归, 他是。呃,随机,随机效应回归,他不是固定效应回归。所以我们个体是必须要固定的,你在固定个体的同时再去固定行业和年份,这个才叫双向固定效应回归。你去看北河里面的二区、三区或者很多 up 主,他在文章里面是在做在销售这一点的时候,尤其是涉及到宏观数据, 就是宏观数据,你知道就审计面板数据,对吧?然后因为你也知道审计面板,面板数据,这个个体就是省份,对吧?他没有行业,他把它称之为双双向固定效益回归,其实这种这种不能称之为双向固定效益回归,能理解吧? 喂,哈喽,能理解哦。嗯,你大概知道这个意思,就是就这个说法是不对的,其实从本质上来讲,但是目前 ok, 嗯,就很多人都这样,做生意也不了了之。然后这个 i t i t i g 和 fe 啊,它这个,这个就固定个体,除了固定个体,完了过后我们还固定了行业和年份。对,然后你再去。哎, id 我 们没有实现吗?哎,是不是只有一个行业,还多个行业?喂, hello, 好 像我也不太没事,清楚,就在 id 就 ok 了。 好, ok, 那 我们就设定刚刚这,因为我们没有那个行业的这个虚拟变量,所以我们生成了一个行业虚拟变量,然后你会发现看到没,这是不是行业变量?这是不是年份虚拟变量?看依然显著,对吧?然后这时候我们就加固定。加,加什么呢? 加我们的这个控制变量了, size, l e v r v growth, 我 们先把这四个加上去, 然后你可以看下,看下结果。为什么我会先把这四个加上去呢?就就是你在所有的期刊里面去去看我们的控制变量,虽然各各个各不相同,但是我们基本上 size、 l e v, r v growth 这四个是必有的。 这四个必有的就是我们的这个公司,公司层面的数据,它分为 b 加项和选项,斜规模、资产负债率、 lv 和格罗斯分别代表着规模、呃,负债、负债情况、盈利情况和这个成长性这四个。这四个方面,这四个指标是必加的,能够理解吧?在 b 加的情况下,我们再去加些选加的。你就比如像这个,它是不是已经显著,且且是正相关,对不对? 如果他不显著怎么办?就如果,我就比如, ok, 我 们解释变量是 l e v 的 话,他是不是不显著,对不对?对,不显著,这时候怎么办呢?他,他百分之十水上显著,也不是说他不显著,他在百分之十水平上显,但你要你要知道我们这种回归要达到百分之五和百分之一水平上显著,如果是百分之十水平的话,太牵强了,说服性不高,所以我们思维他不显著, 所以这时候我们干嘛?我们只能通过增减控制变量调整显著性呢?就这样一个个加控制变量,你会发现加开启 flag 过后,这个 l e v 就 我我暂定,我先暂定,这 l e v 是 你的解释变量,看到没有?它的控制变量是它的 p 值是不是下降了?对,下降,下降了我们就把它保留。如果加了开启 flag 过后,这个 p 值上升,我们就不要它,就把它踢掉,能够理解吧?嗯,然后紧接着我们去加这个公司啊,这个错了,公司治理治理水平 board 就是调整显著性,没有捷径,只有这一种方法,通过增减控制变量去调整显著性。看到没有? boss 加进去过后,它是不是显著性?这个水平慢,对不对?没有变动对不对?所以我们再不加它,我们再换下一个 啊?因为一会发现就这样看到没有,然后它这 p 值又没有变动,所以我们不用它。但当我们加完过后,然后我们还有 top one, 然后这个上市年限我们也经常会加,然后还有什么脱冰秀我们也会加,这样。 呃,最最,最后我们是把所有的控制面都试了一遍,然后它最终是不是显著了,对不对?你看到没有? p 值是不是下降到百分之一水平上显著啊? 对吧?然后然后呢,也会有一种什么?也会有一种极端的情况存在。极端的情况是什么情况呢?就说你加完了,你把这里所有的控制量一个加进去,加完过后过后它依然不显著,但是它此时它的 p 值是是最小的。是比如它的 p 值是零点一三四, 它 p 值零点一三次,但是它依然不显著,这时候怎么办?就就最后我加完过后,我会发现,哎,这种控制变量得到的这个结果是最优的,但是这个最优的结果的 p 值仍然不显著,这时候怎么办? 我们再重头加,像比如这这一组控制量是最好的,然后这时候我再重头加,就比如一开始我加开启 flow 的 时候,它可能不显著,对不对?它可能会使得 p 值增大,但此时我再加一遍它,加一遍开启 flow, 它的 p 值可能就会变小,然后你再把这些没有加的再重新放进去去测试, 然后就会基本上百分之八九十的题目都可以得到显著性水平的,这个正正的正向的调整出来,能够理解吧 已经。嗯, ok, 那 最后我们我们找了一个这个变量,然后我们数一下,基本上我要八个以上的控制变量,呃,五个加四个,九个,九个控制变量,所以这时候我们就把结果导出来,然后 ok, 这是第一步,然后我们把这结果保存了, 就我们调的显著性。没有,没有,没有捷径,就这个,你只能是说什么熟能生巧,在不断的做的过程中逐渐积累经验。 然后 ok, 这第一步,然后这是第二步,然后保存为一杠二,因为他们都要导出一个表,然后再把这个结果应该是这个结果吧。这个结果,然后保存为一杠三,因为是第一个表的第三列嘛,然后 ok, 把它导出来, 这里因为是导出来一杠一嘛,看一,它本身是一杠一,二一杠二,一杠三,但是我这里可以用星星直接直接代替它的,就把表一的所有结果导出来,然后括号在双引号里面的内容改为你自己的路径。对, ok, 这个就是你的这个回归结果,然后我们去看一下你的回归结果,去分析一下。啊,等一下啊,我把你这个这个结果保存到 word 里面, 加一取对数,这个,这个是加一取对数,没有取对数 这边呢?哦,这个是 top 一 对,这反,到时候还确定你现在控制变量不确定吗?对吧? ok, 我 们速度出现了三列结果, 对吧?嗯,那在这三列结果里面呢,就我们来进行,我跟你讲这个学术逻辑和学术语啊,就在这三列结果里面,最有争议的是第一列和第二列。那有有些人他会认为什么?他有些人说,哎,我必须要这个双向固定,你看第一列和第二列的这个区别是不是在这里啊? 一个双向固定的,一个没有双向固定,对不对?看到没有就有一个有叫第一页,就第一页是不加年份和行业,第二页是加年份和行业的固定,对吧?那就这时候就会产生争议,那有些人说, ok, 我 到底是用第一页还用第二页呢?有些人说第二页好,因为我双向固定了,有些人他说他,他说第一页好,因为第一页他没有加双向固定,然后去测试一下结果,其实我想表达的是 这两组结果都是 ok 的, 这两列结果都是 ok 的, 这个屁值啊。这个啊, square 的 我们不需要去看,然后这里会有个导出命令的 bug, 就是 它,你知道的这个,呃,相关系数的曲值范围是不是零到一之间,不可能为负数的,所以它这个负数就直接去掉就好了。对,手动把它去掉就 ok 了,那你会发现,呃,其实你从结果上也可以看到这个,呃,这个,这个结果是错的。 这个 square 的 它这个是导出命令的 bug, 你 看是不是零点二五三八呀?看到没有?哎,不是这个, 是这个结果,我们直接坐下,是不是零点二九二九二四啊?不是零负零点负零点,这个零四幺啊?就把手动的改一下,这是导出命令的这个小 bug, 很多人不在意,就说这两个结果,我们到底用哪一个?我想表达的是这两个结果都可以用哪个结果好,我们用哪一个能够理解吧?但是这一点是必须要有的,能够理解吧? 喂, hello, 等你一起啊。然然后呢?这控制,然后我们得到这个结果,完了过后我们再看一下控制变量,控制变量我们要求的是大部分显著,我们不,我们不要求全部显著,但是我们要求大部分显著,好吧。第二点看这,然后紧接着我们看这个 ascal 的, 其实 ascal 的 这个相关系数啊,我们现在基本上是已经不分析的, 你去看所有的文章,基本上不分析的,如果你要去这样这样把你去要分析的话,你只能这样讲,就说零点,像这个 ascal 的是零点三四八的话,就说明这个也是程度 达到了百分之三十四点八的解释程度。那又又,然后又有同学呢?他,尤其是集中于本科生,他可能不懂,然后他,他就会导致一个一个问题,什么问题呢?他就会要求,要求我阿芳给他做到零点五,零点零点八以上, 然后然后我会告诉他, ok, 做不了。那为什么呢?你去看所有,尤其是公司方面,公司层面的数据,我们的结果基本上是分布在零点四以下,大部分是分布在零点一上下。 如果我们的阿方太高的话,就说明你在数据上做手脚了,毕竟你你可是有三四千家企业的这个两万多的样本数据去做出来的,这个它严格来讲分是符合正态分布的,它的啊, square 就 礼盒是不能太高,太高的话就说明这个数据你绝对做手脚了。当然宏观数据是可以达到的,但是微观数据是达不到的,能够理解吧? 所,所以很多你会发现很多文章里面这个 aspect 他 不分析,但是他必须要摆在那里,为什么摆在那里的时候让看你这篇文章结果的这个,看你这篇的神稿人知道你的数据结果到底是个什么结果,因为通过很多细节可以判定你有没有在数据上做手脚,在结果上有没有做手脚,能够理解我这个意思吧? 然后这个说完过后呢?然后我们 ok, 我 们再紧接着看,这个是系数,这个是显著性水平,这个是括号,里面是 t 值,这里说明有,因为这个 t 值和这个这个其实是一一对应的关系,和屁值是一一对应的关系。所以有些人他他这里可能不显著,然后他他耍小聪明,他把它改了显著, 其实,其实,其实他是可以,其实什么?其实这个可以干嘛?可以看出来,好吧?然后我们分析的时候其实也是很简单的,我们分析的时候,呃,第一个你要去说明就三要素嘛,第一个要说明这表里面做的是什么内容,证明了什么东西。第二个说明描述这个表的结果,就描述这个结果到底是什么,分析这个结果,最后再去提出他证明了什么东西,这个就基本合规,好吧? 其他没有什么,而且呢我们去做一致性分析。然后我想跟你讲的是就 ok, 我 们一致性分析啊,他讲究的是差异性, 他讲究的是差异性,讲究的不是,不是什么,不是显著性。就比如 ok, 像你这个我们第一组做的是什么?是不是属性的错配啊?对不对?因为国企和非国企是不一样的,对吧?国企他追求的是什么?他追求的不是盈利最大化,就他企业的企业经营的最大化目标是什么?企业经营的目目标是什么?是行政地位, 就他的 ceo 追求的是行政地位。但是对,对于非国企企业的话,他的这个企业经营的目的是什么?就利润最大化,所以两个不同典型的,而且中国是目前世界上最大的一个国企,就是国企企业存在最大的一个国家、一个地区。所以就国企和非国企我们一定要去做, 然后我们把它保存为二杠一,然后用,我们用 ev 函数来调用,如果 s o e s o e, 你 知道的是虚拟函数依旧为国企,零就为非国企嘛,对吧?然后这样调用, ok, 好, 把它导导出来,我们来看下结果, 然后在这里你可以发现,呃,我想问一下,这种结果成不成立? 这是国企,就你肉眼看的话,它成不成立? 喂,哈喽,嗯,帮我判断什么?这个要怎么判断?就目前上来讲的话,大家就是北核里面二区、三区的奇刊的话,有一部分人它是怎么判断它?它是比较细数, 通过细数大小来比较,就比如零点二五六七显著大于这个零点幺八二三,然后就说明什么?就说明这个 ip 对 这个 d i r 的 这个被解释变量的正相关影响更强,那它假设就是相比较非国企而言,解释变量对,被解释对呃对呃,国企的 d r 的 促进作用更突出,这样, 但其实我想表达是目前上来讲的话,大家更通向于什么?用显著性水平来表示,如果他们都是三颗星显著的话,就说明他们没有差异,如果一个三颗星,一个两颗星的话,就说明什么,他就就有差异,能够理解吧?能够明白吗? 但但是现在目前有很多文章他确实是用显用这个细数来表示的,所以这没办法实现。好吧,那我想表明的就说,如果你是发表了很高水平的这个奇刊的话,那么还是要比较比较这个显著性水平,显著性水平越高,他就差异越越大,如果他们都是三颗星的话,就像这个就说明什么,就说明我们一致性分析不成立,能理解吧? 那,那紧接着我带我我,我带你去,我带你去读一读这篇文章,这篇顶刊。嗯,你看这篇顶刊,你看会发现我们平时是不是在文章里面讲就是讲一次性分析对不对? 但是你在在于在顶刊上面以后会发现你不能讲一次性,他就,他就不会讲一次性分析,一次性太土了。他会讲什么?属性错配、领域错配和阶段错配。属性错配其实就是什么国企和非国企, 看到没有?属性错配就是国企和非国企,领域错配就是什么制造业,非制造业。我们来看一下他的这个实践结果,就会会发现顶看他的这个 不仅仅是思路的是比较创新,或者不仅仅是思路的眼底线,更体现在文字上的一些专专业化。因为我们经济解决的本质是什么?是不解决资源配置的问题,资源配置正是因为资源配置存在的不均,所以才有了经济这个学科,对不对? 哦, ok, 然后你就看这个看到没有?然后他分,他是分为的,将企业分为国企和非国企,为考察一下,为考察属性错配问题,把企业分为国企和非国企。如果是我们的文章我们怎么写?我就说,哎,为为了解决这个意志性分析,为了考虑这个属性的意志性分析或企业性质的意志性分析,我们分为了国企和非国企,但其实不是的,更高级的说法是属性错配问题, 因为本质上就是他的这个属这个企业,他属性产生了错配,错配就是不均嘛,产生了不均,所以我们才会发现他把这个领域错配问题是分为制造业的这个生命周期。 然后我们再看结果一下,首先第一个盘盘中 a 里面的这个回归结果,非国企看个人驱动,你看他是不是在比较这个显著性水平,他全程是没有比较,你看没有比较什么?没有比较系数吧?你看那在这个非国有企业里面,这结果在百分之五水平上通过显著性水平的,然后在国有企业中数字金融并没有展现出偏向性,就不显著,然后然后再去产出这个原因,看到没有? 这就是我们普通的这个人写和顶开合一去看看的这个关于结果的这个逻逻辑上的差距好不好,那这个这个就是你的国企和非国企的一个一致性,那紧接着,紧接着我们再去给你做做什么呢?做做行业的一致性一致性, 然后 g, n, 哇, and d, 然后我们要,哎,不对,你的题目是什么?题目是工业互联网还是平台?能够显著全行业是吧? 工业互联网平台啊,等等,会吧,这我看到了,就工业互联网平台对企业什么任性的影响吧?对,数字,数字创新,任性数字创新的都是全行业啊。 嗯,要解决的,像你这个工业户数据化的话,那我们一定要去做什么?做行业属性分析,我们是不是 c 行业? c 是 不是制造业,对吧?所以我们要产生一个新的虚拟变量,叫 i, n, d, d, 它就是制造业的这个虚拟变量,然后 i, n, d, d, 然后这样,然后三,把这个结果表明为三,然后一会还说 i, n, d, d, d 等于零的话,就是非制造业。 那我们为什么制造业的这个意志性分析不对?行业的意志性分析会区分,会,会区分为制造业和非制造业。第一制造业的种类会非常多,在我我这节课就跟你讲了,四千多家企业里面,至少有两两千多家都是制造业。第二,制造业的这个这个企业大家都基本上都是劳动密集型企业或者是一个工业型企业,他跟其他行业是不一样的,所以 ok, 所以 我们一般 行业分类的话,行业一致性我们就自动的默认为是制造业和非制造业,能理解吧?那你会发现制造业和非制造业他们的这个水平也没有,这个从显著性水平上并没有差异,只能通过系数去比较,然后这个是制造业, 制造业,然后非制造业。对,那这制造业和非制造业做完过后呢?我们一般的还会做什么?还会做这个企业规模,对吧?我相信你也看到,那企业规模我们是怎么去判定的呢?我们去用 size, size 是 不是企业规模 就变量,对不对?我们用 size 来表示,那它怎么表示呢?就用 size 中位数,看到没有,它是不是中位数?你后面加 detail 就 会有中位数,看到没有百分之五十就是它中位数。那这时候我们再用把一函数调用出来,然后用 size size 大 于中位数之前的我们称为大企业,你看就这样调用,然后 ok, 然后小于等于,小于等于它就是小企业,中小、中小型企业就这样。然后这就是另外一种的一次性分析, 没事你不用写文字分析,到时候我会给你写,你现在就会听听,然后会做就 ok 了。好,这有大企业和中小型企业的一个一致性。然后呢?做完这个过后呢?还有一些人他会做什么?做东部、中部、西部的一区域一致性,那他怎么去做呢?首先我们是不是他是这样做的?是我们是不是他每个企业他所注册地是不是有个省份啊?对不对? 然后 ok, 我 们生成一个新的变量,叫做 sf, 等于这个省份,我这人比较懒,对这个这些这些代码都被我总,就我自己有个笔记代码,笔记就我可以直接生成的。对, 然后我生成一个 sf, 然后变量,然后我,然后紧接着我开始进行对,产生新的,再产生一个新的变量,叫做的士对虚拟变量,然后我再用一函数来做, 来做,来复制用。如果 excel 函数是等于北京的话,这个地址就等于一,如果是等于天津的话,就这样复制,然后一下就可以复制出来了,然后可以复制就产生一个新的变量,到地址再变掉,然后地址就等于一、二、三,然后一就为东部,二就为中部,西三就为西部,然后这时候我们再去做,用 excel 函数去做地址, ds 等于一,然后这样,然后保存为五,然后 d 四等于二的时候等于中部企业这样,然后 d 四等于三的时候,就表示西部企业。 那为什么我们会去做做这个区域一致性?因为你是企业数据嘛,一旦有人会会纠结,为什么我们,我们,我们会做你企业的数据,为什么还要去做,还要去做区域的一致性呢?是这样的 背后的逻辑原因就是说我们的东部、中部、西部他的经济发展程度是不不一样,他的市场发展起点也是不一样,东部他就比较完善了,中部和西部他的市场化程度就比较低,经济发展晚,对不对?那么那么对于 工业化对企业创新效率的话,如果你看这如果显著大于他,显著大于中部企业,但是落于西部企业,那为什么会出现这个结果呢?我跟你讲第一,中东部企业,东部地区他的经济发展早,市场化程度高, 对不对?然后企业创新创,企业创新活力强,对吧?所以他的这个,他这个,这个工业化,这个对这个企业创新韧性具有显强于中部企业。那么西部企业为什么会最高呢? 是因为西部企业发展晚,他的基数低,他的编辑效率高,所以显显示出工业平台对西部地区的这个创新韧性的促进作用最强。能够理解这意思吧?编辑有个编辑效应,我们经济学经常说的。 这个听过没有?喂? hello, 听得到吗?啊?可以,这个,这个编辑效应你听过吗?听过。对,那因为西部地区啊,它的基数比较低嘛?它的基数比较低, 基数基数低,那么你每每投资百分,每投资百分之一的这个这个资源,它可以产生百分之十的增长。但是对于东部地区,它市场,市场,市场发展已经非常完善了, 你,你每投入百分之一的这个资源,资源赋能进去,资源进去,可能你仅仅只能获得百分之二的这个回报。所以,所以从显著性水平上来看的话,就工业。呃,工业化这个平台对企业,对西部地区的企业创新水平的促进作用最强。这就是这个为什么会产生区域一致性的原因,能够理解吧? 你就抓住两个点,第一个市场化发展水平,还有一个这个基数低,编辑效率就 ok 了,就可以完整的去解释这个问题了。好吧, 其他的没有什么了,然后本节课就讲到这里了,那下节课讲机子分析。下节课讲机子分析的话,我会分两趴去给你讲,先给你讲理论部分,然后再给你讲。呃,实践部分就是史蒂塔实操部分。好吧,那我等下会给你发两篇文章,然后你下去先提前看一下。好吧,那这节课先到这里说呗。好吧。

大家好,我是太空鼠,我们今天接着给大家讲这个系列啊,在这个保姆级实证系列之前,我们讲了这个 啊,数据的一个下载,对吧?数据的导入,数据的清洗,包括啊,描述性统计,怎么做,相关性分析,供应链检验,对吧?然后还有基准回归,是不是这些都讲了?然后基准回归,包括基准回归不显著,我们应该如何去调配这个控制变量,让我们的回归达到我们想要 得到这个显著性的结果,对不对?然后呢啊,做完基础回归之后,我们应该做什么呢?是不是就应该做这个机制分析啊?那么机制分析有两两,两个机制两步嘛?一个是这个什么?呃,中介效应,一个是调节效应,对不对?然后我们今天就来讲这个中介效应 啊,我们这次采用了一篇论文啊,然后给大家去啊,仔细去进行实操,试了一下这个中间效应,如果需要数据也可以去自己去这个复现啊,然后大家可以看一下这些评价。 那么中介效应呢?有中介效应的三步法和中介效应的两步法。那么关于中介效应的三步法呢?他是在怎么呢?他是温钟林教授啊,他在这个二零一四年,在这个心理科学进展上,他发表了一篇文章,那么他发表这篇文章之后呢,我们大家都开始去用这个中介效应啊, 然后中介效应分析,它是研究自变量和因变量作用机制中间的啊,作用机的手段之一啊,中介变量它是在自变量和因变量中间的一个渠道,那么三步法呢?啊,它是一个 三步法,是相对旧的一个办法,因为它是提出的比较早嘛,对不对啊?三步法的话,首先检验的是自变量 x 对 因变量 y 的 一个总效应。首先我们要验证一下自变量对因变量它是有这个影响的,那么这个其实就是我们的基准回归,对不对? 然后第二步,三步法的第二步呢?验证是自变量对于中间变量 m 的 一个模效应啊,就是说我们首先自变量对因变量有影响之后,那么其次自变量对对中介变量有影响,那么自变量如果对中介变量都没有影响的话,何谈通过中介变量去影响因变量呢?对不对? 然后第三步,第三步我们需要检验的是这个第三步,我们需要检验的是啊,进行一个回归模型,构建回归模型 y 等于 e 三加 d, x 加 f m, 哈,然后这个第三步的话,也必须要显著,并且这个符号也得啊相符,这样我们这个中间相应三步法才算成立。那么我们一会可以说一下它具体是啊,怎么样一个显著,怎么样一个符号相符啊?但是当前尽管学者他是 批判这个中介效应的,可能因为呢,中介效应它本身它也不是我们经管土生土长的经济学土生土长的一个方法。中介效应是起源于温温钟龄二零零四年的这个心理科学进展上,这篇文章啊,是国内首个引用量过万的中文论文,但这是心理学领域的论文,它应用在经管领域呢,它可能会有这个严重的一个内生性问题。 然后接下来中介效应的两部法,那么在二零二二年的时候,在二零二二年的时候将停, 将停在这个啊,那个中国工业经济上面,中国工业经济上面发表了一篇文章叫因果推断经验研究中的中介效应调节效应,那么他就提出了一种新的做中介效应的方法,是中介效应两步法。那么中介效应两步法呢?相对于中介效应三步法的话,他会简单一些, 那么中间向两步法它是以将停的方法为代表。第一步呢是本质上还是和文中的一样,是继转回归对不对?探讨 x、 y 的 影响?那么第二步呢?也是探讨 x、 y、 m 的 影响,但他在实证部分,他前两步就已经结束了,但是我们会发现 前两步结束了之后啊,前两步结束了之后,它还有哪一步没有验证呢?是不是中介变量 m 到变量 y 这个渠道是不是还没有验证?中介变量 m 到变量 y 没有验证,那么这个渠道如果没有验证的话,是不是不行? 但它也不做实证啊,两步法它是怎么办的呢?两步法的话,它是通过文献或者理论支撑去陈述 m 到变量 y 之间的影响啊, 然后它优势是避免这个内生性问题,通过分离 x 到 m 和 m 到外的检验,减少因连力偏误导致这个估计偏差。而且呃,中介效应两步法它相对呃做起来的话更容易显著一些,相对做起来更容易显著一些。 那这是 stata 实操啊, stata 实操的话我们一会再讲啊,我们一会根据这个实际的这个结果去讲,那么我们可以看一下,先看一下这个中介效应三步法,中介效应三步法的话,这个是一个 d, i d 是 自变量对不对? 然后音变量是这个 employ 是 雇佣,对不对?首先第一步是自变量对音变量的回归,对不对,是吧?它这个中间效应是数字化转型,大家可以看到,那么第二列是不是自变量对中介变的回归,对不对? 是吧?第三步呢,是自变量对中介变的回呃,自变量对音变的回顾当中去又加入了这个递推式数字化转型这个中介变量。那我们首先啊,第一步它肯定是要正向显著, 那么第二步符号说这个政策是快加快这个速度大转型,那的话,这个符号必须是正的,对不对?然后显著性必须也是显著的,对吧?那么第三步是最关键的, 第三步怎么就算通过呢?首先啊,嗯,他要两个都显著,包括呢符号也是对的。第三步的这个速度大转型,因为本身第二步就是正的,对不对?所以第三步的这个系数也得是正的才可以啊, 然后字边也得是正的才可以,这样才算通过这个三步法,我们可以接下来去做一下啊啊。 然后接下来我们结果解读版,在我们写论文的时候,我们应该如何选择两步法和三步法呢?其实我个人的建议就是说,即使说哪个你能显著就用哪个,因为我们论文其实 是以这个显著啊,为这个是唯一判断标准的,对不对?显著了才能用嘛。所以我们实际写论文的时候,不管三步法还是两步法,其实我们不用考虑太多,说啊,三步法被批判啊,两步法是一个新方法,我们只要是实际上我们哪个显著用哪个啊?三步法能显著,你用三步法,两步法你能显著就用两步法啊。 接下来我们可以举一个例子,我们给大家进行一下实操啊,举例进行实操,然后这个论文的话,我们可以首先看一下它,它这个啊是税收优惠对于这个全要素生产率的一个影响啊, 税收优惠对全要素生产率,我们可以看到这个即转回归,即转回归应变量是全要素生产 lp 法,对不对?然后自变量是税收优惠, 我们可以看到是不是正向的两颗星显著,对不对?对吧?基本回归是显著的。然后它的中介效应呢?是这个专利的数量啊,专利的数量,那么专利的数量的话,第二步它是做的是什么呢?第二步它做的是什么? 第二步是不是做的自变量,对中介变量呀?两步法是不是?第二步对,做的是自变量,对中介变量,所以说是 创新专利作为应变量,对不对?对吧?税收优化就自变,那税收优惠是不是肯定会增加这个专利啊?对吧?所以他应该也是正向显著,对不对?那么这个两步法其实我们已经通过了,只要我们再找一个专利增多,会对企业的这个全要素生产率产生一个影响,能找到相关的理论支撑, 或者说是这个相关的一个文献,那我们就这个两步法就通过了。那我们既然两步法通过的前提下,我们再做一下这个三步法是否能通过,那么三步法的第三步是不是相当于把这个 专利,对吧?加到我们的这个几种合格的模型当中去,在税收优惠后面加上这个专利,对不对?加上这个专利之后呢?哎,我们会发现,首先税收优惠 正向显著对不对?专利也是正向显著,那么三步法明显也通过,那你看这个论文是不是两步法?三步法他都通过了,那么三步法相对两步法我们不用找文件支撑是不是?所以是不是会省事一些?所以这种情况下你就可以去使用三步法,那么实际当中三步法和两步法的一个使用的话,就根据自己的这个实际做出来结果选择就可以了。啊。 好,我们今天就到这里,好,谢谢大家。接下来我们下一节课我们会跟这个调节效应应该怎么做?