哦,大家好,我是山东大学的陈强,那么这一期的视频号呢,我们就来介绍中介效应的 stat 操作的上部分。 那么前面呢,因为有二零二一年经济学落奖的颁布,所以我做了三期关于今年经济学落奖的视频号,所以呢,原来关于这个中介效应的这个视频号,就中间间隔的稍微时间有点长了。 如果你觉得前面的关于中介效应的原理部分,如果有一些遗忘的话,建议你可以去看一下我前面关于中介原理介绍的视频号。 那么先来回顾一下中介效应估计的基本框架,也就是这里呢,首先会有一个自变量啊,这个 x 啊,那么在我讲的那个例子中间,这个就是 support 啊,就是 proceed supervisor support, 就是说员工 所感受到的管理层对他的支持。而我的结果变量呢,就是这里的 perform, 也就是他的这个 job performance 这个员工的业绩。而这个 m 呢,就是所谓的中介变量啊,这个 mediator, 那么这里呢,是 satis, 也就是表示 job satisfaction, 也就是说员工所感受到的管理层的支持呢,他既可以直接的通过 cprine 这个渠道啊,有这样的一个 draft 而作用到我的这个 y, 那么也可能呢,会通过一个中介变量 m 啊,这个 mediator 来间接的作用到这个结果变量 y, 那么这里呢,就是说从自变量 x 到中介变量 m 的这个渠道呢,被称为叫做 a 啊,那么就是说,你的这个管理层的支持,使得员工更加对于工作的满意 度增加了,而工作的满意度这个 mediator 增加之后呢,他又会有一个因果的作用啊,作用到这个员工的业绩,也就是这里的 y 啊,那么从 m 到 y 的这个路径呢,被称为叫做 b, 那么这边呢,就是 baron and can 一九八六年所提出来的这个中介效应的一个估计的框架啊。那么第一个方程呢,就是外对 x 来做回归,那么这个是所谓的总效应,那么他是用这个 c 来表示他的这个作用的这个力度啊,也就是这里的总效应。 而第二个方程呢,是把 m 这个 media 的中介变量对自变量来做回归,这里的 x 前面的这个回归系数呢,是记为 a 啊,那么表示的就是说是这个自变量对中介变量他的作用力度 有多大。而第三个方程呢,就是你把这个 y 呢,同时对 x 这个自变量以及 m 这个中介变量来做回归,那么它相应的回归系数呢,是 c pri 和 b, 也就是这里的 c prime b。 第二个方程 a 呢,就表现在这啊,那么这个第一个方程那个 c 呢?我这里没有写出来,在这张图上,但是以前也给大家展示过。 那么在介绍中介效应的 stay 打操作之前呢,我还想回答一位朋友在评论区的问题,据说这个问题困扰了这位朋友有十年之久啊,那么他的问题呢,就是说如果你有面板数据,那么应该怎样去估计这个中介效应? 其实呢,从这三个方程我们看到说每一个方程都是用最小号乘法来估计的,而如果你有面板数据的话,其实对于 面板数据最常用的方法就是双向固定效应模型,也就是说你在 os 回归中间只要加入个体的虚拟变量与时间的虚拟变量,那么就可以把个体固定效应和时间固定效应都给控制住,然后呢,你就照常做 os 回归就可以了。 因此呢,在面板数据中使用中介效应,其实在原理上并没有什么太大的区别啊,只要你把相应的个体虚拟变量以及时间虚拟变量都放入回归方程,那么就可以了。 那么在介绍中介效应的 stay 塔操作之前呢,我们再简单的回顾一下,这个中介效应究竟是如何来检验的。首先呢,这个中介效应其实就是 a 陈 b, 因为这里有一个因果作用的链条, x 到 m 的作用力度是 a, 而 m 到 y 的作用力度是 b, 那么这个渠道呢,是一个所谓的中介效应,也称为间接效应,那么它的整个的作用力度呢,最终就是 a 成 b, 那么因此呢,中介效应的这个最著名的 soba test, 其实它就是来检验这个 a 成 b 是否等于零。 那么就以这个作为我们手表检验的原假设,那么这里的主要的麻烦的地方就是说,因为 a 乘 ba 和 b 都是回归系数,而这两个回归系数存在一起,那么就不是我们传统所说的那个线性假设了, 因为如果是线性假设的话,那么只是把回归系数做一个线性组合,然后你去检验这个线性组合是否等于零或者某个长数,而这里呢,是两个回归系数存在一起,所以呢,它本质上就是一个非线性的约束啊。那么对于这个非线性的约束呢,如果你要去 做检验的话,你同样可以去设计一个梯桶剂量,那么这个梯桶剂量呢,在大案本下也是服从渐进的标准正态分布的,但是呢,因为他是一个非线性的约束,所以你要去估计他的标准物的话,就会比较的麻烦。 那么早期在文献中间有出现了三种这样的不同的计算的公式啊,一个是手表一九八二年,一个是这个哥们一九六零年,还有另外一个也是哥们一九六零年所提出来的方法,那么这三种方法都是根据公式的推倒做了一些假设, 那么其实呢,当代的做法就是说通过自助法,因为自助法是不需要任何的假设,所以它是最为靠谱的,而且适用于任何的样本容量,只要这个样本容量不是太小就可以了。那么要做中介效应检验呢,有一个 stay 命令啊,就叫 说这个 sg mediation, 其实这个 s 呢,就指的是 soba, 而 g 呢指的是 goodman, 因为前面我们讲到了有这个 soba 和 goodman 所提出来的那些不同的计算标准物的方法,所以这个命令呢,就叫做 sg mediation。 那么他的下载方法呢,你可以从这个金管之家去下载这样的一个包啊,因为他并没有放在通常的 ssc 这个平台上,所以你没有办法直接通过 ssc installsg 米 ta 选来下载它, 那么就是你可以到金馆之家的这个网页啊,就是啊,或者你搜索一下也行啊,然后去下载这个 sgmda, 选这个压缩包,然后解压之后呢,就放入你的 stata 的一个文件夹啊,这个就是 ado pluss 这个文件夹,那么如果你不知道这个文件 家在哪里的话,你可以在 stay 中间输入一个命令,就是这个 season dia, 就是 system directory, 然后你可以看一下这个路径是在什么地方啊,就是 ado plus, 这个就是通常是放所有的这个非官方命令的这样的一个地方,而这个 s 呢,因为我们这个命令呢,是以 s 打头的 sgma 选,所以一般会建议你放在这个 s 的这个文件夹里面。 那么这个命令的基本句型呢,也很简单啊,就是 sgmda 选,后面跟着你的这个背景是变量,也就是你的结果变量了,那么就是我们通常所说的 y, 然后呢后面有个 mv, 这里面跟着 mdacean variable, 这里呢就是放着你的这个中介变量, 而这个 iv 呢,就放着你的 independent very, 这里的 iv 呢,并不指的我们通常所说的那个工具变量的 iv, 而是指的是 independent variable, 然后呢这个 c v 呢,你可以放一些这个 coberry, 就是一些斜变量,也称为叫做控制变量,比如说你可以这样来写, 就是 sd mediationy, 然后逗号,那么逗号后面的这些选择下呢,就是指定以 m 作为我的 mediator 中介变量,而以 x 作为我的 independent variable, 也就是质变量,而这个 z 和 z 二呢,作为我的 covari, 那么这两个呢,就是斜变量, 我们就以 stata 光碗的一个数据级啊,也就是我们前面所一直在举例的关于这个 job performance 的 data 啊,这个其实呢,是 stay 塔公司自己造的一个 fictional data, 也就是说它是一个虚构的一个数据级,但是并不影响我们作为案例来演示啊。那么你通过这个命令呢,就可以直接从 stay 塔的关 当晚下载这个数据集,然后你可以用 describe 看一下这里面都有哪些变量啊,那么其实呢,就是这些变量我们应该比较熟悉了,像这个 perform, 这就是我们的 y, 表示的是员工的 job performance, 而这个 saddis 呢,就是表示的是员工的 job satisfaction, 就是员工的工作。网易度 好,这个 support 呢,就是我们的这个自变量,那么它就是这个 perceive supervisor support, 也就是员工所感觉到的这个管理层的支持啊。那么这个 setis job satisfaction 其实就是一个中介变量, 那么这个数据集里面呢,还有一个变量叫做 branch 啊,他其实是指的这个 department store branch, 也就是说你可以想象这是一家百货公司啊,那么他在各地有不同的这个分支机构。这个 branch 呢,其实我们到后面,我们可以用它来作为鞋变量来 控制每个分支机构的这种 branch 的 fixing fat 啊。我们先用上面来看一下这些变量的基本的统计特征啊,然后我们会看到说这个 ops 就啊是一千五百,那么也就是说样本容量是一千五百,然后这里汇报了一些 means and deviation, ming 跟 max, 你可以自己看一下。然后呢我们就套这个 sg mediation 这个命令的剧情,后面跟着 perform, 这是我的 why? 然后这个 mv 呢,里面就是我的这个 mediator, 也就是中介变量 satis, 然后 iv 呢,是我的 independent variable, 就是这个自变量 support 管理层对员工的支持, 那么这个是他输出的第一个结果啊,那么其实是给我们汇报的就是总效应,也就是所谓这里所说的 pass c 啊,那么就是说,其实呢,很简单,就是 你把那个 y 对字变量去做回归啊,而你的回归中间并不包括中介变量,那么这个回归系数的口音非选啊,零点八二幺八,他就是这个总的效应了,偷偷一份 啊,我们看到他的配置是零点零零零,因此是非常显著的。然后接下来就会汇报这个自变量对中介变量的作用啊,也就是这里的 model west mediator regrets on iv pass a 啊,这个就是那个中介效应的那个 a 的那一段,也就是从字变量 x 到中介变量 m 的那一段,被称为叫做 pass a, 就是这个 a 这个路径。 那么其实呢,很简单,就是你把这个中介变量 satis 对 support 去做回归啊,那么这个回归的系数呢?是正的零点二二八九啊,那么他的屁直也是 零点零零零,因此也是非常显著啊,那么这个就是中介效应能够成立的,这个其中的链条的一段,就是从 x 到 m 这个中介变量,那么我们发现说他是非常显著的。 接下来就是汇报这个直接效应与间接效应,也就是这里的 model was dependent variable regrets on mediator and independent variable pass bnc prime。 这个就是我前面所展示的那个第三个方程,也就是说你把那个结果变量同时对自变量和中介变量做回归, 那么这里的中介变量 satis 的回归系数呢,是零点八九八四,他的 p 值是零点零零零,非常显著,而这边量是破的回归系数呢是六点六一,他的这个 p 值也是零点零零零啊,都是非常的显著啊。那么最后的一个输出的结果呢,就是所谓的 sobel goodman tess, 也就是我们通常所说的那个 soba test, 你会看到说他这里汇报了三个指标,也就是这个 sobel goodman one, goodman two 啊,那么其实就是对于我在前面所介绍的就是说 手表有提出来一个标准物的计算方法,而哥们有提出了两种标准物的计算方法,那么他们分别依赖于不同的假设, 那么这里你会看到说他们所得到的这个扣一分选的这些扣一分选的其实就是 a 乘 b 啊,那么更准确的说是 a 害乘 b 害,也就是 a 的那个回归系数的估计值乘以 b 的回归系数的估计值, 那么这个是他相应的标准物。然后这个 z 统计量呢,就是把这个口语非选出以这个 standard 所得到的这个 z 统计量,那么最后一列所汇报的就是这个检验统计量相应的 p 值了,那么都是 非常的小,这个是亿的负的十三次发,那么这里他所用的这个临界值呢,其实就是标准正太的那个一点九六。然后后面这里汇报的其实就是给你更详细的啊, a 的扣一分选等于多少? b 的口语非选等于多少,然后呢,这里的 indie refeit 呢,其实就是 a 乘 b, 也就是说这个零点二二八九乘以零点八九八四,应该就会等于零点二零五六,然后呢也汇报了 de ready fed 和这个 total fed, 然后呢,这里还计算了几个比例啊,比如说 propulsion of totalfield is midait 啊,零点二五零二,那么这个呢,其实就是你把这个 individyfant 除以 totalfield, 也就是说你在总的效应是等于零点八二幺八,那么这里面间接效应,也就是那个中介效 效应占多大比重呢?你就把这个零点二零五六除以零点八二幺八,然后就会得到这样的一个比例,那么就是等于零点二五零二,也就是大概四分之一是通过这个中介效应来起作用的,而剩下的四分之三呢,那么就是属于一个直接的作用。 但是传统的收表检验呢,其实他是缺陷还是比较明显的,因为虽然收表检验的统计量是服从渐进的标准正态分布, 但是在有限的样本中间啊,通过一些这个蒙特卡罗模拟,我们会发现说他其实未必接近于标准正态,那么经常是会有右偏的,而且是非对称的, 主要原因就是说它其实是两个回归系数沉在一起沉积的方式,那么因此呢,如果你使用一点九六来作为零戒指的话,可能会导致误差, 而且呢,就是说个手表也好,或者这个根本所提供的那两个标准物的计算方法,其实呢,这些都是大样本的标准物,也就是说他都有一些假设,然后呢,要嗯比较大时候,他才会是比较准确的。 因此呢,在有限的样本中间,手表 test 里面所提供的那三个标准物可能都会有偏差,未必是靠谱的, 那么解决的方法呢?最初就是说,大家觉得啊,那你如果不能够用一点九六来作为零戒指,我可不可以把这个零戒指给他调的更加的准确一些, 因此呢,在文献中间也出现了其他的临界值啊,那么后来呢,大家就发现说,无论你用什么样的临界值去做检验,其实你是没有办法用一个预设的通用的一个临界值去套用到适用到所有的数据中取啊,因为不同的数 数据他可能收敛的速度是不一样的,而这个每一个检验他所使用的样本容量也不一样。那么解决的方法呢?其实单带有一个非常好的解决方法,就是你可以做自助法啊,也就是通过 boss 出来的方法, 然后呢去针对你的这个数据与样本容量得到他相应的临界值。那么更准确的说,一般来说,我们是用这个自助法去得到一个更加可信的一个自信区间,那么有了自信区间呢,其实你同样可以做假设检验, 那么使用这个 boss 在自助法呢去做统计推断呢,其实这个想法非常简单,也就是进行有放回的再抽样啊,比如说你可以做一千次的 resembling with replacement, 那么也就是说你每次呢都是有放回的抽取一个样本啊,然后得到一个样本容量,跟原原 原始的样本,他的样本容量一模一样的一个自助样本,然后你可以去重复这样的过程,比如说重复一千次,那么你就会得到一千个自助样本,这个所谓的这个不需要商博,那么使用这一千个自助样本呢,你就可以计算一千个 a 害成 b 害这样的样本观测值, 然后有了这样 a 害成 b 害一千个的样本观测值之后呢,那么你就可以把他从小到大排个队,然后你可以找到他的,比如说百分之二点五的分位数 与百分之九十七点五的分位数,那么在百分之二点五的分位数到百分之九十七点五的分位数之间呢,他就是百分之九十五的自信期间,也就是所谓的百分位法。那么当然呢,也可以使用这个残差的自助法,这个所谓的 residue booststrap 啊,那么后面也会谈到啊, 这个,当然这个长插支柱法其实是不那么可靠的。那么在刚才我们使用 sgmda 选这个命令的时候,其实他会有这个存储下来一些结果啊,比如说我们可以看一下这个,你用这个 display 啊,括号 int 啊,下滑线 if, 其实这个就是 individe, 也就是间接效应,换句话说就是那个中介效应,那么他就会给你汇报这个结果,就是零点二零五六,那么这个就是 individe, 也就是 a 害成 b 害了。 然后呢,如果你想要知道那个 divide 的话,你可以用这个 display r, 括号 d i r 下滑线 e e f f, 然后就会给你汇报这个直接效应呢,就是啊,零点六一,六一。 那么有了这个之后,我们就可以来设计一个做自助抽样的一个命令啊,我们首先设一个 随机数的种子, sixty one 啊,这个 one 呢,你是随便可以设的啊,比如说你设成一二三一二三四五六随便设都可以,目的呢就是说因为涉及到随机的自助抽氧,我为了能够可复制我的结果,那么我需要设一个 同样的一个随机素的种子,只要我的随机素的种子是一样的,那么每次我所得到的这个结果呢,也应该是完全一模一样的。 然后呢,我就用 stata 的这个 boost 在这个命令啊,那么后面跟着呢,是我的啊,括号 individify 和啊 dividify, 那么这个两个是我想要做 boost 的统计量啊, 其实在大多数情况下,我们真正感兴趣的可能就只是这个 indirect effect, 那么后面的这个啊,括号 diradify, 其实你可以省略掉。然后呢,这个逗号后面呢,就是一些选择,像像这个 rap 一千啊,那么就是说你去抽取一千个自助样本,然后这个 bca 呢,是让他去计算一下这个 buyers correct and accelerated 自信区间啊,就是所谓的偏差矫正于加速的自信区间, 那么默认的是不去计算这个 bca 的自信区间啊,那么在后面我会去给大家再进一步说明啊,其实这个 bca 的这个自信区间呢,虽然比较费时啊,但在理论上他是最好的最靠谱的一个自信区间。 然后呢,这个冒号后面就是说你到底要怎么样来计算这个统计量?那么我们就是通过 sg mediation 啊, perform 逗号 mv satis 和这个 iv support 啊这个命令来计算前面所列出来的这个 indie ready fea 这两个统计量。换句话说,这个命令其实就是 stay, 非常简洁的来帮我们做这个一千次自助抽样的一个命令啊,也就是说他每次呢就是说先得到一个自助样本,那么然后呢,我对这个自助样本, 我去用这个 sg mediation perform 这个命令去做这个中介效应的回归分析啊,然后就会得到那个 a hi 跟 b hi, 那么也就是我可以通过这个啊 indivantify 跟 rdivertify 去提取, 那么这样的话,你重复了一千次的自助抽烟,你就会得到一千个这个 indirect frag 跟 diragifi 的样本观测值,然后呢,你就可以用这个去构造相应的自信区间了, 那么这个就是 boss 在说汇报的那个结果啊,当然这个直接汇报的这个结果呢,其实并不是特别可靠,因为他是一个 normal based, 也就是说他其实呢是这样,就是说我用这个 a 和 b 害的一千个观测值,我可以去算他一个样本的标准差,然后呢有了这个样本标准差之后呢,我如果假设 a 害跟 b 害是一个服从正态分布的话,那么我就可以基于这个正态分布, 我就可以得到一个他的自信区间了,也就是说你只要把这个一点九六乘以他的标准物不 stress standard arrow, 然后就可以得到这个自信区间的半径了。 但是我们前面说过,我们之所以要用这个自助法来构造自信区间的,其实就是因为我们不太相信这个统计量在有限的样本下是服从正态分布的啊,所以这个其实是 并不可靠的,只不过这个计算比较方便,所以 stay 他马上就会作为一个默认的一个汇报的结果。因此呢,我们其实还需要再追加一个命令,就是这里的 instead booststrate 啊,然后一个逗号选择箱, 哦,那么这个就是说所谓的这个 post s tvation command 啊,就是这个以这个 east 带来打头,那么这个哦呢,就是说让他汇报所有的不同方法所构造的自信区间。 那么这里面会包括什么呢?一个是 n 啊, n 就表示 normalbase, 也就是我们刚才已经见过的。还有一个是 p 呢,就要表示这个 posenta, 就是我刚才所说的, 你把 a 害成 b 害的样本关这值从小到大排列,然后去找到他百分之二点五的百分位数与百分之九十七点五的百分位数啊,由此来构造一个自信区间啊。 但是用普山塔的方法,它其实会有 buyers, 然后这个 bc 呢,就会给你做一个 buyers correction, 也就是说把你的这个偏差给较正了。为什么会有 buyers 呢?就是说因为你的这个自助法,其实是把这个样本看成是一个总体,然后不断的 从这个里面去做自助抽样,比如说得到一千个自助样本,但是这个样本的毕竟不是总体, 这个样本和总体的区别之一呢,就是说如果这个总体他在两侧尾部有很长的尾巴的话,那么因为他这个在尾部抽到的概率非常小,所以呢,这个作为样本来说,他通常你就看不到这样的尾巴了, 因此呢,你用这个样本把它看成是一个总体,不断的从中间做这个自助的再抽样的话,那么其实你得到的那个分布呢,就没法去再现这个总体中间那个两侧的很长的尾巴了,所以呢它会有一定的巴尔斯啊,那么统计学家就发明的这个方法,能够把这个巴尔斯做一些矫正, 而这里的 bca 呢,就是把这个 bias correctly, 然后又加上的 accelerator, 其实他就是把这个 bias correction 这个偏差矫正的方法做的更加的精细了,同时呢又具有这种加速的这个作用。所谓加速呢,就是说 看他这个收敛的这个速度,就是说你把这个八 s 给他趋向于零的速度到底是有多快啊?那么这个如果你是用的这个这个一般的这种 postato 百分位法的话,那么他的这个八 s 消失的这个速度呢,是根号 n 分之一,也就是通常的这个 loot and convergent。 那么这个根据这个 fron 和这个 tpeiran 里,在一九九三年他们写的一本书里面啊,就是 introduction to booster, 他们是推荐使用这个 bca 的方法, 最大的好处呢,就是说他的这个偏差收敛到零的速度呢,可以加速啊,那么他可以提高到 n 分之一啊,那么 n 分之一衰减到零的速度显然比根号 n 分 之一衰减到零的速度是大大的提高了,他是他的一个平方倍的速度。那么这个 f 让大家知道他是这个 booster 的发明者, stanford 统计系的教授啊,然后 tippy ready 呢,是他的学生,也是拉手的发明者啊,所以他们写的这个书呢,应该是非常权威的啊,所以在这个书里面 他们就推荐了这个 bca 的方法,作为这个最为靠谱的啊,但后面我们其实会看到,在有些情况下,这个八 s correctly anna serverit, 其实他和这个八 s correct 他俩是一样的,也就是说其实你可能没有必要去做这种更加精细的这个调整,或者是更加精细的调整的那个结果,和你一般的这个 boss corrected 的这个结果还是一样的。那么这边呢,就是我们所得到的最终的结果啊,你会看到说我们关心的当然就是这个 bs one 了,也就是这里的 这个,因为 bs one 它是对应的是这个 indirect fed 的这个统计量。然后呢,我们会看到说,因为我刚才使用的这个 east stat blushtad, 哦,这个选择像啊,所以他汇报的这个自信区间呢,就有这四个啊,有 n, 有 p, 有 bc, 有 bca, 那么这里也告诉我们他们的 k 啊,就是解释啊, n 就是表示 norm, 也就是说基于正态分布的说得到了自信区间啊,那么我们前面说过这个是不靠谱的, 然后这个屁呢,就是比较直接的啊,就是从小到大排序,然后去找一下百分之二点五和百分之九十七点五的分位数,这个所谓的 postantial 百分位数法啊,那么这个呢,是会有偏差的 啊,所以呢,这个统计学家就发明了后面这两种啊,那么 bc 呢,就是八 s correct, 而这个 bca 呢,就是把这个八 s correct, 然后又加了一个 accelerating, 其实它是一个更加精准的来做这个八 s crash 选的方法。那么我们看到这里呢,其实这个两个这个 bc 和 bca 得到了结果是一模一样的啊,也就是在这个数据的案例中间踏两其实并没有区别。 而且呢,我们还看到说,无论你用 n 或者用 p, 就是说基于这个 normal distribution 这样的一个自信区间,或者是用百分位法不生产所得到自信区间,跟你用这个 bias correctly 或者这个 boss correctly and assert ready 这些方法,因为这两个都是一样的,其实这这四种方法得到了结果是差不多的。 为什么会这样呢?因为我们这注意到就是说我们的样本容量其实很大,就是有一千五百个观测值,那么这么大的一个样本容量,那么因此呢,其实无论你怎么做得到的结果都是差不多的啊, 因为样本容量有一千五百个这么多啊,所以呢,无论你用哪种方法,其实他都会收敛到正态分布的那样的一个渐进分布,所以呢,对于这样的大样本,其实你用什么样的检验的方法其实差别并不大。 那么关于中介效应的 stay 打操作的上部分,我今天就先介绍到这啊,那么在下一期呢,我还会继续介绍中介效应的 stay 打操作的下啊,那么主要会涉及到残插自助法 以及啊,有一些人建议说用结构方程来做中介效应的估计,那么我也给大家来做一个介绍。好的,谢谢大家,再见。
粉丝212获赞771

大家好,今天和大家共同分享一篇文章,题目是你几点睡,就是什么命?我们一起来听。 睡眠影响我们的身体,睡眠决定我们的健康,睡眠充足,精神焕发,睡眠不足,萎靡不振,你几点睡就是什么命? 不早睡觉,总熬夜的人,身体不好,精力不佳,注定是输家。 你要记住,你熬的不是夜,是命。很多人喜欢熬夜,刷手机、追忆影剧,不把早睡当回事。一旦熬成习惯,晚睡上瘾,身体就会发出抗议,头晕目眩,胸闷气短,食欲不好,手脚发酸,甚至诱发 体内的疾病,带来生命的危险。由相关研究证明,睡眠时间在六点五到七点四小时之间,死亡率最低, 而那些少于四点五小时或高于九小时,死亡率增高。所以,千万不要低估熬夜带来的危害,你熬的不是夜,而是命。如果你再不改掉熬夜的恶习,身体生病危及生命,你的人生也就到了尽头。 再有呢,是自律的人生,要从早睡开始。真正自律的人呢,都喜欢并习惯于早睡,把睡眠看的很重要。 他们坚持早睡,注重身体,每晚临睡前都能放下手机,督促自己早点休息。这样的人从来不会自己任何 熬夜的机会。他们珍惜生命,注重健康,把时间用在值得的事情上,保持充沛的精力,养好自己的身体,精神百倍,状态极好,做起事来呢,也是得心应手,成功也就向其更加靠近。 你要记住,真正厉害的人,懂得掌控睡眠。一个人情商高不算什么,而睡商高最让人羡慕。 睡伤高的人,把睡眠看成自我约束和修行,能在睡觉的时候清空大脑,不会胡思乱想影响睡眠,他们不会轻易被人和外界干扰,很快就能入睡,睡眠质量很好。 高税商不是天生的,而是靠自己后天养成的。睡前关掉手机, 给自己营造安静的睡眠环境,会长期坚持让自己养成固定的作息时间,能清空心灵,让自己放下烦恼,不胡思乱想,心里无事一身轻,才能早点睡好觉。 好好睡觉,你就赢了!睡觉是缓解疲惫的方法,睡觉是治愈一切的良药, 无论遇到了什么样的事情啊,只要睡一觉就能忘却。好好睡一觉,释怀所有的不悦,身心得到了放松,消除所有的烦恼,心情瞬间的变好, 好好睡觉,你就赢了!每天保持八小时的睡眠,每晚坚持早点上床睡觉,睡眠充足,精力就充沛,身体健康,生命就旺盛。 每个人都要睡觉,但未必能早睡觉,熬夜是对自己的不负责任,熬夜久了,身体必生病,所以千万不要熬夜,晚睡了好好的睡觉,早点睡觉, 养好健康的身体,保持充沛的精力,你才能轻松的应对一切,拥有成功的工作和事业,过上幸福的人生和生活,成为有福的命好之人。

好,同学们好,呃,今天我们呢来学习计量经济学的一个金奖内容, 那么在学习本门课程之前呢,首先给大家介绍一下我们的本门课程的一些具体章节的啊,一些知识框架,那么大家可以看到我们本门课程呢计量进行学呢,总共是包含十张, 这十张的具体内容呢,一起来看一下。第一个呢是第一张训练部分,训练部分呢主要介绍到了我们的这个计量证据学,他的产生啊,还有他的这个提出者以及他的一些发展的一些啊过程。 然后再就是我们的这个尽量经济学,他涉及到一些具体内容,他的基本呢啊概念以及呢我们 这个尽量分析行为,他的一些具体包含的内容,这是第一章,那么第二章呢是回归分析概述, 回归分析概述呢是作为我们大本门课程的一个重点,重中之重,那么他同时也是我们考试的一个高频考点。 那么回归分析概述呢,主要是介绍了我们的最小二元回归方程以及呢最小二乘法原理和他相应的这个假设,满足最小二乘分析的假设,基本假设。这个基本假设呢也是我们考试的一个重点 啊,涉及到了比如说还有我们的贝塔一和贝塔二,他的推倒有他的表达式是怎么来的,呃,我们如果是要用这个经济建造学的软件的话,怎么样去得出贝塔一,贝塔二他背后的原理是什么? 这个就是我们和一个分析概述啊,这个在考试的部分呢,他经常会出现简答,名词解释,计算题,还有我们的单选和多选, 说说他是一个重点内容。那么第三章呢,主要是违背经典假设,回个模型,那么他是一个重难点,也是我们经常会考到了啊,违背经典假设,前面我们回个分析,当中有一个满足最小二乘法, 呃,这个经济假设的话呢,那么第三张我就考虑如果是违背了这样一个假设,他会出现哪一种,哪一些状况?比如说什么是一帮差,什么是多重贡献性,还有什么是相关性啊,什么是模型设定偏误,那么他在每一种情况下啊,出 线的违背纪念假设的状况是什么?这个呢就是我们的啊,第三张水啊包含的内容, 那么第四章呢,是虚拟变量和变参数模型,虚拟变量的话呢,主要是比如说我啊,呃,考虑到了其他一些因素质的影响,比如说我这个模型当中,如果我对象是男性或者是女性,如果我的研究, 如果我的文化程度不一样,小学、初中、高中还有大学以及这个研究生和博士,那么他还要说世界变化 的不同影响。类似于这种我就要设定一个虚拟参数,那么因为这个虚拟变量他不能够,比如说男性女性,你不能够用具体的数字来衡量他是一些性质,所以呢你 只要设置这一个啊,虚拟变量,呃,模型,那么还有我们的变参数模型,就是把这个模型进行变换之后,你又怎么去啊?研究他,去设定他 好。再就是呢,我们的第五张,呃,分布之后模型,分布之后模型呢?这里是由于考虑到了我们的啊一些之后,比如说啊,这个 涉及到一个时间训练,他有一个致厚性,比如说上一期的这个啊,经济情况,收入情况,他 会影响到下一期的这个消费水平。那么如果是这样的一些情况,我们又用到的是这个分布句号模型,分布句号模型呢,就主要是介绍啊,他模型的具体的情况啊, 以及我们怎样去利用这个参数啊,这个估计去进行一个估计。好,那么第六章呢,就是我们的这个连立方程模型,连立方程模型呢,就设计到了啊,两三个模型一起,他是一个体系里面的。 好,第七章呢是微观经济啊,剂量模型,微观剂量模型呢,比如说我们研究经济行为分分为微观和宏观,对不对?那么微观的话,比如说具体的这个某个厂商,他的这个 销售情况,或者说这个价格与销售的影响,或者是说消费者而言的话,价格呢与需求量的一个影响啊,涉及到了一些模型,那么还有我们的宏观剂量模型,宏观剂量模型呢,在我们的宏观经济当中,比如说 我们的这个消费,还有我们的这个投资,以及这个进出口政府购买,他对于国民收入的一个影响。那么这个呢,就涉及到宏观计量经济模型 啊,第九章的话呢,是经济剂量模型的评价运用,就是你在前面啊,考虑到了他的这样一些啊,模型之后,我来判定啊,最终经过这个参数的估计等等我来判定。哎,这个经济剂量模型呢, 他的这个跟我们现实他实际的,嗯,这个经济行为之间礼盒度强不强,我怎样去评价他,然后以及他在应用的过程当中会有哪一些问题,或者是哪一些优势,我就要去进行评价。那么第十章呢,是他的一个弱 若干性的发展,这个呢,就是啊,我们在啊这个金脑经济学在后期的时候,他流行一些领域所包含的一些内容。 那我们看一下重点章节部分的话,这个第二章一个重点,第三章一个重难点,还有呢第四章特别是虚拟变量也是一个重难点,那么分布之后模型呢,他是一个难点,可能有一些同学不太理解他的这个制号模型是什么样的, 以及呢我们这个年龄方程模型,重点的话呢,还有我们的微观计计,微观计量模型和我们的宏观计量模型。 这个呢,从可以来说,从第二章到第九章呢,都是我们整个这门课程的一个考试的核心。好, 那么我们接下来呢学习啊,第一章序论部分。好,那么我们再来看一下我们的这一章他的主要的一个重难点分析。 那么呢通过本账的学习的话呢,主要是要了解这个经济剂量学他的产生的一个过程,还有他学科有哪样一些特点,以及他的这个基本概念和经济剂量分析工作的一个程序 啊,就是说他有哪样一些步骤,按哪样一些流程加深呢?对我们的经济剂量学与数理经济,数理统计的一个关系的一个研究, 其中还有介绍 a, 什么是变量,什么是模型系统啊,什么又是数据啊等等,加一些概念,回归方程又是什么样的 有概念了解。好,那么我们接下来再来看一下本章的内容构成。第一节呢,主要是讲啊,这个经济技能学,他的产生和发展提出人是谁?重点啊, 第二个呢是这个经济剂量学他的一些基本概念。第三个呢,是啊,经济剂量分析的一个工作流程包含了哪一些内容?好,那么我们接下来学习第一节啊,经济剂量学的产生和发展, 经济教学的产生,发展呢,离不开一个人,那么这个呢叫做啊费,呃,这个费希里啊,那么这个有翻译的教材不同,有人说是费里希,有人说是费希里,那么啊,在考试过程当中,不管是哪一个,你只要看到爱他 心肺是心肺的这个人提出来的啊,不是马希尔啊,也不是什么卡恩斯,对不对啊?这个也不是亚当斯病,所以说大家注意啊,看到心肺的这个人哦,你就要知道他是这个计量经济学的提出人, 那么呢,他是挪威经济学家啊,是第一届诺贝尔经济学奖得主,是在一九二九年 啊,一九二啊,一九二六年,一九二六年呢提出来的,那么这个经济量学呢,他产生是在十九世纪啊,十九世纪啊,十九世纪初,那么呢,发展是在二十世纪开始发展,达到高潮的, 那么他的题处长主要是呢,起源于对经济问题的一个定量的研究,什么叫定量研究呢?就是我们 说他的这个数量关系一样的,对不对?好,那么呢定性的研究的话呢,已经不能满足经济学者了,就之前在这之前呢,有很多个经济理论分析,众说纷匀啊,比如说啊,比如说啊,这个有人认为呢,消减工资呢,他 啊这个有利于生产,因为呢消遣公司,可能啊压缩了这个成本,对不对?然后呢啊使更多的这个啊,这个资源或者说资金呢,用于这个生产材料或者是生产记忆的一个提升,然后来促进生产。 好有认为呢,增加工资有利于这个生产,因为你增加工资了,那么呢,你的人民群众他的这个收入水平提高了,然后收入水平提高了,会加 加大我们的消费,对不对?这样的消费了,然后从社会需求的角度而言,哎,需求增加了,那么是不是有进一步带动我的产出呀? 好,这个呢,是这样的一些定性分析,他各有各的观点。那么还有人认为呢,比如说这个消减利息率和提高利息率对新中企业的一个影响, 那么就是说呢,这个啊消减利息率了,那么实际上呢,就也是啊,增加一个成本,对不对?可以对企业来说可以增加利润。还有呢说提高利息率,提高利息率呢,可以增加这个元这个积极性。 那么呢这个你看一下,如果是从定性分析的话啊,你不知道哪一种情况对于这个经济影响,或是对于这个啊,另外一个因 出的影响到底是正向了还是负向了?你只能停售,在停留在一个理论的解释 啊,这个时候呢,在这样一个背景下,我们就啊这个费的啊,这个经济学家了,费斯尼,他提出了我们的这个量化的角度呢,去提出决策来看到底是谁对谁的影响,谁对谁影响多少啊?这样的一个分析。 好,那么随后呢,在一九三零年的十二月二十九日呢,我们的这个国际啊,经济剂量学家呢,啊, 啊,他们呢,在美国的这个啊,俄亥俄,克里夫兰呢,去成立了啊,一个研讨会,那么当然我们的这个啊,费西里呢,经济学家,他也参与到了, 那么这个会的主题呢,主要是啊,就是说呢,是促进啊,经济理论呢,在统计学, 还有呢数学,他们这个学科之间的一个发展应用的一个国际学会。 好,那么一九三三年啊,一首三三年,这个啊分离新的提出了啊,这样的一个经济质量学与经济统计学不一致的研究。这个呢, 所以说我们这个计量学与统计,还有那我们的数理经济啊,数理经济和数理统计,后面会有大会给大家提出的啊, 这个数理经济还有呢数理统计他们三者之间的一个 交叉关系。 好,有人会说这样学是这样学,数理经济是数理经济,数理统计是数理统计,也有人说这样新学,他涉及到了我们的 数理经济,就是社交了,数学也涉及到了我们统计学,是三者一个啊统一。那么他呢,这个我们的这个啊,弗西里呢啊,或者是弗里西啊,他提出来的这个计量经济学呢,与经济统计学不一致的这样一个观点。好, 他的观点是怎么样认为的呢?他说这个经济技能学的任务呢,是以经济学、统计学和数学之间的统一为前提,为充分条件的去实际理解呢,这个现实 经济生活当中的一个数量关系,这是他提出来的。好,我们看一下啊,看一下这个经济剂量学与这个数理经济学和顺理统计学,他们三者之间是怎样的一种关系和区别与联系。那 我们现在知道呢,这个经济剂量学,他是我们的数学和我们的统计学, 什么数理统计学,数理经济学对不对啊?他的一个有机的一个结合,就他涉及到了他们的几个内容,但并不是质量经济学就等于数理经济学,就等于数理统计学,他们之间又有一个区别,对不对? 他是他们的交叉。那我们看一下啊,这个数理经济学和数理统计学呢,他是建立经济学的理论基础,就是我们经济剂量学是在有了 数理统计学和数理经济学这样一个基础的前提上面呢,去发展而来的。 好,那么我们这个经济计量学呢,是经济学和统治学的一个交叉学科,那么他具有独立的这个研究任务。那么注重呢,我们的这个经济变量,你的一个随机特性啊, 大家看到这三个字,就在考试过程当中,选择题,他会提出送经济学和送统计学区别,那么你就注意到一个学习性好,那么借助呢,我们的统计方法呢,去建立我们的经济变量之间的一个定量关系。 那么怎么说呢?怎么说我们这个经济剂量学的话呢?他主要是研究学习性,就是说注重 限量的一个学习性好。而我们的数理这个啊,经济学呢,他是注重 啊,不是学习性,而是注重一个精确变量,他可能会设定一个未知数,或者是说会设定一个经济变量,然后呢再去求解,得到的是一个精确的,那么而我们的 可以这样理解,这个数理经济学的话呢,他更像是一个空匣子。而我们的这个计量经济学呢,他是涉及到了我 设定随机变量之后,我涉及到其中的这个参数的估计,还有的如果遇到参数估计不一致,或者是说啊,一些不太合理的情况,我又怎样去解决这种变量关系?那么他更像是在这个空奖 里面去填充的这样的一个东西。好,这个是啊,质量经济学与数理经济学的一个关系,那么我们还有一个数理统计呀,那么大家知道统计的话,我们呢,他是不仅仅是有这个自然自然的这个 现实的这一个主观的一个啊,世界为研究对象,那么他还涉及到自然界的一些啊,比较客观的,不仅主观,也有客观的一个统计的,那么他更多的是涉及到我们怎样用一些啊?涉及到一些统计资料,对不对? 那我们的计量经济学呢?他是在统计学的基础上借用这个统计的,这样就是把这个数理统计学当做一种工具,然后更好的去完成这个 空匣子。好,那么我们看一下这个啊,重点标黄的部分,嗯,这个具体界定了也是比较重要了,大家重在理解啊,重在理解, 我们看具体界定是怎么界定的?他说啊,他是啊,这个在定性分析的基础上呢,专门讨论如何用经济数学模型方法学定量的描述呢? 具有随机特性的一个经济变量关系的一个边缘科学, 或者说呢,他是数理经济学和数理统计学的一个交叉学科,所以说最终的落脚点是一个交叉学科。好,那么简单的可以理解为呢,数理统计方法 呢,是填充我们的数理经济学空匣子的一个基本工具,你们看一下,数理统计学和数理经济学的这个界点都出来了。 好,那么以客观这个经济系统中啊,具有随机性特征的一个经济关系作为呢研究对象啊,注意啊, 他是以随机特写做研究对象的,那么呢,用数学模型的方法呢,去描述具体的这个经济变量关系, 为我们的这个统计,为我们的经济计量分析工作呢,提供一个专门的一个指导理论和我们的一个分析方法。好,那么这个呢,就是刚刚 介绍完了我们的经济剂量学和数理统计,数理经济学,那么这里有一个更形象的图来表示他们之间的学科关系啊,学科关系,那我们看一下这个数学 还有呢,统聚合合经济学,他三者如果进行交叉重叠,最后你们看一下是不是产生的这样经济学啊,对不对?这样性学呢?所以说他 是我们的数理统计,数理经济和这个经济统计学的一个有机的统一重叠交叉, 所以说这个尽量进学,他不仅有定性了方面的研究,有定量的方面研究,对不对?而且他设计到了我们的统计方法,也用到了我们数学里面的一个啊,变量了这样一个关系进 关系。好,这一节呢,是关于我们的经济变经济质量学与数理经济学和数理统计学的关系的一个概述。好,本期的内容呢,到此结束,谢谢。

好,大家好,我是山东大学的陈强,今天的这期视频号呢,想跟大家谈谈经济学应该使用中介效应吗? 那么为什么要谈这个话题呢?也是因为最近呢,在当代财经杂志有一篇公众号 就说到,关于中介效应模型是否应该在经济学中间使用这一篇公众号呢?采访了一些计量经济学与时政研究的学者, 然后呢得到了一个结论,就是说一般情况下不太建议经济学的学者使用中介效应分析啊,那么伊朗采用经济学所常用的 大家所习惯的机制分析就好了。那么这篇公众号这个发出来之后呢,引起了很大的反响与争议啊。 现在这篇公众号虽然已经被删除了,但是在当代财经的官网上依然保留了一篇类似的文章,只不过是经过了一个修改,然后使得措辞的变得更加的委婉而谨慎了, 题目就是叫做慎用中介效应模型做经济学机制分析。那么当代财经杂志社写这篇公众号或者这个官网的这篇文章,肯定也是出于好心,就是害怕中介效应在经济学中间被滥用, 所以他们提出了一些上亿的提醒,主要的理由就是说,因为中介效应分析呢,是源于心理学啊,那么在管理学中间用的也很多,那么因为他涉及到做三个回归,而且通常都是以最小的乘法来做,那么这样的话, 医学家自然是很担心有内生性,因为我们通常都只做一个回归,可能就会花费很大的精力在一篇论文中间去使用不同的因果推断的方法去建立这样的一个从 x 到 y 的因果关系, 而这个中介效应分析呢,他要需要做三个回归,那么这样的话,就很可能这个内生性的问题可能就是过于严重或者过于繁杂,以至于你无法去确立一个因果的关系。 这个是他们这篇已经删除的公众号,以及在当代财经的官网上依然有的这篇文章的一个主要的观点啊。那么因为我曾经做过关于中介效应的一个视频号的系列啊,所以对于这些中介效应的文献还是比较熟悉的,所以我也想来跟大家谈一谈,我们经济学究竟是 是否应该使用中介效应。那么简单的回答就是说,一个是应该用,但是确实也需要小心用。机制分析和中介效应其实是有着密切的关系啊,经济学呢,一般是使用机制分析或者叫做机制检验啊, mechanism test, mechanism analysis。 而中介效应最早是起源于心理学,后来也在管理学中间有大量的应用。其实呢,中介效应与机制分析他们二者的概念框架是完全一样的, 这个方面其实并没有什么区别,因为大家都是想要知道除了 x 导致 y 这样的一个因果关系之后,那么 x 究竟是通过哪些渠道去间接的影响到外。大家不同的学科其实对这个问题都非常感 兴趣,经济学这边呢,叫做机制分析,而心理学和管理学那边呢,叫做中介效应。那么不同的这个名词呢,学术术语倒是无所谓的,但是呢,在具体的做法上面也有一些不同,所以就导致了一些学科上的一点小小的可能互相不理解,甚至有点冲突。 中介效应分析他的优势相对于机制分析包括哪些呢?我个人认为主要是有这么两点啊,一个就是说中介效应的分析呢,其实他做了更为深入而严格的检验,而这个机制分析呢,可能就是只做了其中的一部分。 那么另外一个就是说中介效应他的一个优势,就是说他可以提供一个中介效应占总效应的比重,一个定量的这么一个比重到底是多少的一个估计? 而经济学的机制分析呢,通常因为他没有把这个中介效应整个的所有的那个步骤都做完,所以他一般来说并不提供这样的一个比重的具体的估计值。 当然了,中介效应的这个缺点呢,就是说他可能会存在内生性的问题,因为通常来说是做三个 o s 回归, 这样话就难免会有一些内生性的问题啊,虽然在最早起源于心理学的时候,他们可能不太需要担心内生性的问题,因为可能他们用的是实验数据,或者在心理学的场景下,那个因果关系的链条呢,是非常明显的。 而对于经济学中间这一些观测数据,而不是 visional data, 可能内生性就是非常普遍的一个问题了。那么这个问题呢,其实也不是不能解决啊,就是说 传统的中介效应分析是做三个最小合成法的回归,但其实这个并不妨碍我们把它,比如说你中间的 os 回归,你可以把它改为用工具变量法去估计,或者你可以用 iv probe 都可以啊,后面我会举个例子啊,就是说 在这个美国经济评论上的文章就有使用二阶段最小的称法以及 i v proby 去做这个中介效应其中的一些回归的步骤的。 那么说的更具体一点呢,这个中介效应的分析呢,基本上是这样的,就是说首先呢,你会有一个 total effect, 一个总的效应,也就是说我关心 x 对 y 的这样的一个因果效应啊。那么假设你在论文里面 花了很大的篇幅,那么通过各种因果推断的方法,不管是 d i d 呢?还是 i b, 还是断点回归 归,还是自然实验,总而言之,你建立了这样的一个因果的关系,那么这个关系呢,可以用 c 来表示啊,那么也就是说 x 增加一个单位会引起 y 增加 c 个单位,那么我就把这个关系呢,也就给它称为叫做 c, 那么这个是一个 total effect。 而这个最初提出中介效应分析的是心理学家 baron and kenny, 一九八六年他提出来的方法叫做逐步因果法, 也就是说,除了我们刚才所做的这个第一个方程的回归,把 y 对 x 回归, x 是自变量, y 是你的结果变量。 那我现在想知道说 x 究竟是如何去影响 y 的?那么除了可能的直接效应 direct effect 啊,我这里给它继承叫做 c prime, 那么它其实还可能会有一些间接的效应,也就是说它出 通过另外一个中介变量,比如说叫做 m 啊,因为这个 m 就表示 mediate 就是一个中介变量来起作用,那么这样的话,我们要去验证这个中介效应是否存在呢?我们就需要去验证这两个关系,一个是从 x 到 m 的这个关系,那么这里呢,是记为 a, 呃,另外一个呢,就是从 m 到 y 的关系,那么这里就是记为了 b。 那么也就对应于这里的两个回归方程,也就是说你把 m 对 x 做回归,也就是把这个中介变量 m 对这个质变量 x 做回归,那么这个关系被称为 a, 那么这个 a 呢?也就是这里的回归系数 a。 另外呢,就是说你可以把这个 y 呢这个结果变量同时对自变量 x 和中介变量 m 做回归,也就是这里的这个方程 y 等于 于长竖向,再加上 c prine x 再加上 b m 再加上 april three okay。 那么这里的 c prior 呢,就是一个 direct effect, 而这里的 b 呢,就是从这个 mediator 你的中介变量过来的。对 y 的这个作用的这个力度就是用 b 来表示。 对于经济学的机制分析,那么很多时候呢,可能就只做了一个 m 对 x 的这样一个回归,也就是说去检验一下 a 这个系数是否是显著的。那么 从 m 到 y 的这个 b 的这个作用呢?有时候就没有去检验,而是通过逻辑上认为这个是显然的。比如说这个二零二零年在美国经济评论上,周里央老师等人呃,发表的一篇 arrival of yantellen 就是知青上山下乡啊。那么他 他的基本故事呢,就是说知青下乡了,能够提高当地的这个农村儿童的教育年限,就是这个 greater exposure to the send on use significantly increase ruler children's educational achievement。 那么这篇论文呢,也有一个这个机制分析的部分啊,那么他找的这个机制变量,这个所谓的机制变量也就是中介变量了, 主要是说知青下乡之后,那么有相当一部分知青呢,就变成了当地的老师,因此呢,就会增加当地中小学教师的功绩啊,所以呢,可以提高这个小学教师的密度与中学教师的密度, 也就是这里的 density of primary school teachers 和这个 density of secondary school teachers。 然后呢,他把这两个中介变量或者叫做 机制变量,对这个知青下乡的这个核心的这个质变量做这个回归,然后发现说他们是显著的, 那么因此呢,这个机制就得到了验证啊。那么至于说中介变量 m 是否对这个结果变量,也就是当地孩农村孩子的这个受教育年限有促进作用呢?那么他们认为这个就是一个显难,逻辑上是很显难啊,确实是比较显难的, 就没有再去做。那么这里面可能就是说你要去完整的估计这个很困难,也可能是因为有内生性, 那么这个是一种做法,就是说我就主要是验证了从 x 到 m 的这个作用起到 a, 而这个 m 到 y 的这个作用起到这个 b 呢,我就认为说 a 这个是非常显难的,那么我就没有去验证了。这样做的好处就是说内 生性可能不太需要去担心啊,只要这个 x 本身呢,它是一个外声变量,那么就没有问题了。 但是有个问题就是说,如果你不去把 m 对 y 的这个作用,这个力度 b 给它估计出来的话,其实你就没有办法知道说 我的这个中介变量或者机制变量究竟起到了多大的作用。也就是说我如果我把这个 x 对 y 的这个总效应偷偷以再做分解的话,那么到底有多大的部分是通过这个中介变量来起作用的。如果你只做了这个 a 的这个回归的话,其实你是没有办法回答这个问题的, 那么这个也就是这个心理学的中介效应分析的它的价值所在。就是说如果你把 a 和 b 都做出来的话,我就可以去算出来这个中介效应占总效应的比重啊,那么其实呢,就是 a a 乘 b 再除以这个 total effect, 这个 c 这个比重马上就算出来了,而且你还可以得到它的这个标准物显著性水平, p 值等等,这些都可以得到。 这个也就是我以前举过的一个例子啊,就是这个在管理世界上发的一篇论文,就是说研究中国货币政策利率传导有效性,研究 中介效应和体制内外差异,也就是说他研究的是一个货币政策,对企业借款利率起到了显著的影响,那么这个 y 呢,就是这个企业的借款利率,而 x 呢,就是货币政策。 那么从货币政策到企业的借款利率呢?其实可能英国的链条比较长,因为这个里面有可能很多的不同因素都会起作用。那么这一篇论文呢,就主要是以这个 shiber 来作为中介变量来进行 中介效应的分析。在他的中介效应分析的结果汇报中呢,除了给出了 sobel test 这个显著性以外,还给出了这个中介效应占总效应的这个比重是高达了百分之八十九点零六。那么这个如果你只做了机制分析, 只做了 a 那个部分的回归的话,那么其实你是没有办法得到这样的一个中介效应占总效应的比重的。那么回头来看这张图,其实呢,这个中介效应的存在是依赖于两点的,一个就是说 a 要有显著的作用, b 也要有显著的作用, 那么反过来呢,就是说,如果中介效应不存在的话,其实我只需要 a 或者 b 不显著,这两个只要有一个不显著,那么这个中介效应其实就不显著了。因此呢,严格的中介效应简 验其实是考察这样的一个原角色,就是说啊,我的 h 零呢,就是 a 等于零或者 b 等于零,因为只要 a 等于零或者 b 等于零,那么这个中介效应的这个因果链条它就不存在了。 这个原角色呢,我可以更简洁的写为就是 a 乘 b 等于零,那么就是说这两个的乘积为零,那么中介效应就不存在了。这个就是中介效应中最常用的 sobel test 一个基本的框架。 他的麻烦之处就是说这个 a 乘 b 等于零呢,这个其实是一个非线性的约束,因为他是把两个参数乘在一起,并不是我们既然经济学中间所熟悉的那个线性约束,如果是线性约束的话,就应该是 a 等于零,而且 b 等于零,那么就是两个线性约束。当然现在的他是 a 等于零 或者 b 等于零,然后呢,这就等于 a 乘以 b 等于零,因为有个乘法,这个参数相乘等于零这样的一个形式,所以它其实是一个 lonelinear constrain, 要检验它的话就就会有一些麻烦, 这个麻烦主要是涉及到如何去估计他的标准物,尽管这个他的你去构造这个体统计量,他也是一个这个渐进标准正态的,但是这个标准物如何才能够计算的更加准确啊?那么当代的方法就是一般是用这个 boost drive, 在我的视频号系列里面已经做了详细的介绍,包括 stata 的操作,这里就不再赘述了。最后呢,我还想再举一个例子,就是说在经济学中间,其实也并非总是只检验 a 那个部分,也就是说把这个中介变量对 x 做回归,而没有去 考虑中介变量对 y 的作用。其实在有些的论文中间,包括发表在顶刊的这个论文中间,也同时考虑了从这个 mediator m 到 y 的这个作用的这个力度 b。 那么这里要举的这个例子呢,就是二零一一年发表在美国经济评论上的一篇论文啊,作者是哈佛大学经济系的前主任 annisiner, 很不幸,他在去年是意外的去世了,英年早逝啊。那么这篇论文呢,题目是叫做 segregation and quality of government in across section of countries, 就是通过一个横截面的数据来研究这个一个国家在语言或者人种上的这种这种分裂的程度与政府的质量的关系。可以来稍微看一下他的 这个摘药,它的主要的发现是什么呢? we find that more ethnically and linguistically segregated countries that is rose where growth lives more specially separated have a lower quality of government。 就是说他们发现呢,如果一个国家他在人种或者在语言上更加的分裂, 那么他的这个政府的这个质量就会更低,这个作用的渠道究竟是什么呢?他发现了一个很重要的渠道,就是这个信任,就是这个 trust trust is an important channel of influence it is lower in more segregated countries。 那么就是说有,如果一个国家在地理上或者是人种上更加的分裂的话,他的这个信任人们之间的信任度也会下降,这样就会 影响这个政府的质量。那么在这篇论文中间是进行了比较深入的这个机制的分析,这里的 table nine 就是汇报了机制分析的结果。 segregation and potential channels of inference。 那么这个呢,就是以这个 generalized trust 作为这个中介变量,其实他是考虑了三个不同的中介变量,那么另外一个就是这个 separates movement, 就是一个分裂运动的一个 dummy, 就是说如果你这个国家在地理上或者人种上或者语言上更加分裂的话,那么你会更倾向于 有这种分裂的运动啊。 separates movements。 还有呢,就是另外一个中介变量,他们考虑的就是这个 ethnic party dummy。 就是说如果你人种更分裂的话,那么你很可能会 更可能会有一个以人种为主要纲领于构成的这样的一个党派,那么这样的话都会影响到这个政府的质量,因为他有三个不同的这个中介变量,那么他就分别来做了。最上面的这块就是汇报了,以 generalized trust, 就是以这个信任度 来作为中介变量,那么他做了 o s 的回归,那么这个就跟心理学里面所做的那个是一样的,也就是说你把这个中介变量对这个 x 去做回归,那么这 x 就包括这个 segregation 跟这个 fractionalization, 就是指的是语言上的分裂程度, 考虑到有可能有内生性,因为他这篇论文里面其实是有工具变量的,所以呢,他也用的二阶段最小二乘法来做,也就是说再给我们一个启示,就是说心理学那边 很多情况下是用 os 来做那三个回归的,但是呢,其实他既然是做回归,其实如果有内征性,你完全可以用 iv 的方法来做,或者其他的因果推断的方法来做,是没有问题的。 另外呢,针对这个 separates movement dummy, 因为这个中介变量是一个虚拟变量,那么你再用 o s 回归就不合适了,因此呢,他就用了 probit 来做回归,那么又考虑到有可能会有内生性,因此呢,他又进一步使用了这个工具变量法, 那么就是 i v probe 来做这个 a 那个部分的回归啊。所以这个也给我们个启示,就是说你可以用 o s, 你也可以用 probet logic, 还可以用 iv, iv, probe 等等啊。其他的主要是取决于你的数据的类型,以及你有没有这样的 工具变量。对于这个 sd party dummy, 因为它也是个虚拟变量,所以他在做这个 a 这个部分的这个中介效应分析的时候,也是用了 pro b 和这个 i v pro b 的方法来做的 啊,那么这个是论文中间汇报的,把中介变量对质变量去做回归的这个 a 这个部分,那么这篇论文里面他也做了 b 这个部分, 那么就是这里的这个 table ten horse rays of segregation and potential channels of inference。 也就是说当你把这个 x 和 m, 也就是质变量和中介变量都放到回归方程里面去的时候, 那么这里就认为说实际上相当于你的这个 x 和 m 这个中介变量,他们有一个比赛,对吧?看谁对 y 的那个作用更大。也就是说当我把这个中介变量 放到 y 的这个回归方程里面去之后呢?那么如果这个中介变量是起作用的,也就是说有一部分的这个 x 对 y 的作用,其实是通过这个 m 来起作用,而一旦我把 m 这个中介变量给控制住的话,放入了回归方程里面, 那么这个 x 对于 y 的这个直接效应,那么在理论上它就应该变小了,那么更准确的说就是说它这个起作用的这个绝对值是应该是变小,因为有一部分已经通过那个间接效应被控制住了, 那么这个也是他这里所汇报的结果啊。那么这个第一列呢,就是 os 啊,那么是没有包括 m 这些中介变量,而第二列呢,是包括了加入了 trust 这个中介变量。而第三列呢,是把所有的中介变量都放进去的啊,那么有考虑到有可能会有内申性呢, 那么这个第四列呢,就是用的阿胶状最小而成法,那么这个呢,不包括任何的中介变量。而这个倒数第二列呢,也是阿胶状最小而成法,但是他加入了 trust 这个中介变量,而最后这一列呢,依然是阿胶状最小而成法,然后呢,他把所有的中介变量都放入了 这样的一个汇报的结果,我们可以看到什么呢?譬如说这里面的一些 os 的结果也好,或者是二阶段最小人法的结果也好。你可以看到说,一到你加入了中介变量之后,如果这个中介效应是显著的话,那么你应该会看到说 啊,原来的那个 c, 原来那个 total effect, 它的这个回归系数呢,就会变小了,比如说这个它的回归系数的绝对值就会变小了,比如说从这里的大概是降到 商,然后这里也是商,那么这个原来如果用你用 iv 来做的话,这个绝对是原来是四,那么就降到了二,这个降到了二点五,所以这就说明说是有这个中介效应的存在,因为你一旦你把这个中介变量给控制住之后,那么 x 这个质变量对 y 的那个作用, 这个 c prime, 他就会比 c 原来的那个 total effect 更加小了,显著的更小。所以呢,这个在他这里被称为叫做 horse race of segregation and potential channels of inference, 也就是相当于把这个 x 和 m 进行那个比赛,看谁对 y 的那个作用更大。 也就是说经济学中间的机制分析其实也有做这个 b 这个部分也不是没有做的,而且呢,也可以用像 iviv, proby 这样的一些英国推动 的方法,那么总而言之呢,就是说啊,经济学中间是否应该用中介效应的分析,我觉得还是应该鼓励大家使用,当然另外一方面也确实需要小心,可能会有内生性, 如果你担心这边有内生性的话,那么你可以把经济学中间解决内生性的方法也可以用上,比如说 iv 啊, iv proby 啊,或者其他的这些方法,你可以尽量的往上用, 至少你把这里面的这个 b 比如说估计出来了,那么这样的话,给我们一个定量的一个度量,就看一下这个中介效应到底占总效应的比重有多大。我觉得这种定量的度量还是很有意义的, 即使担心有可能从 m 到 y 这里有内声信动,那么你可以在这个你的论文里面进行 说明,就是说我提供的这样一个分析,但是有可能会有内生性,我暂时也找不到非常可靠的工具变量,但是呢,这个至少给我们提供一个启示,就是说这个效应是否显著,或者是究竟中介效应占多大比重,我们可以是一个初步的一个探索。 其实呢,话说回来,就是说这个 i v 的估计在很多情况下,后来大家发现也未必就那么可靠,因为这个工具变量的外生性有时候也是靠不住的,甚至这个也有人认为 o s 的估计结果可能比 i v 还更好,因为 i v 的估计结果 在很多时候甚至会比 o s 还要更大,甚至大好几倍。所以呢,也有学者就觉得这个 i v 除非你那个 i v 的外渗性是非常可靠的, 你可能不见得就能够那么的相信 iv 的结果,总而言之呢,这个目前的这个潮流应该是这个经济学中间越来越重视,对于中介效应的更加深入严格的分析了,这个是一个趋势啊。 那么当我们这个经济学的学科特点就是说内生性比较普遍,所以呢,大家用的时候还是要小心一点啊。那么尽量的把我们经济学用来解决内生性的方法,我们完全可以和中介效应分析相结合, 这样的话也可以把它看成是我们经济学家对于中介效应分析的这样的未来的一个贡献。好的,这一期的视频号就讲到这,谢谢大家。这应该是我在这个牛年所做的最后一期视频号了,预祝大家古年 心想事成,再见!