hi, chuck huber, here for the state of youtube channel i'd like to show you how to compute a t test for two independent samples so let's open some example data by clicking file on the top left scrolling down to example data sets click that and we're going to click example data sets installed with stata and we're going to be using the bp wide data so let's click use next to that to open the data we'll close this window let's take a quick look at our raw data by clicking the data editor in browse mode and for each row we have one individual, so we have patient we have information on sex h group bp before and bp after your bp is blood pressure, so let's concentrate on the variable bp before for a moment, so let's close the data editor and before i compute statistics i like to look at graph, so i'm going to go under graphics and come down to histogram and click that and i'm interested in the variable bp before maybe it's baselined blood pressure and i'd like to look at this by sex, so let's click on the by tab over here and check the box next to draw sub graphs for unique values of variables and then i'm going to select sex and close that and now i'm going to click okay, i'm not going to be doing anything with this graph other than viewing it so now i can see blood pressure before males and for females and i might be interested in testing in all hypothesis that the mean blood pressure in these two groups is the same okay uh, we can get a feel for that by looking at the graph they don't look radically different, but maybe they are maybe they aren't, but it's if i find it helpful to look at the distribution of the data before i compute tests so let's close this window and to compute our test statistic let's go under statistics summaries tables and tests and then we're going to come down to classic tests of hypotheses and we want to come down to two group mean comparison tests don't confuse this with the one right above it to sample mean comparison test we want two group mean comparison tests so click that and the dialog box opens for t tests and we're interested in the variable bp before so let's select that for variable name and then the group variable name is going to be sex because we're interested in comparing the two groups by sex and now let's click submit and take a look at our output here in fact, i'll minimize this for a moment so the command is going to be t tests the variable were interested in as bp before and then we'd like to see this by group, so we have the option comma by sex after that now the output will show us the summary statistics for males and then we also see summary statistics for the females as separate groups we also see the combined summary statistics here on the next row if i can keep this in one line here and then we also see the summary statistics for the difference so the mean difference between the two groups is five point three and change six three and change we have the standard error for that difference as well as a confidence interval uh stator reminds us that the null hypothesis that we're testing is that the difference between the two groups is equal to zero ah, it also shows us the tea statistic for our test is two point seven two point seven eight four eight with one hundred and eight degrees of freedom and then at the bottom of the output, we have three choices for alternative hypotheses the typical, one is the two sided alternative that the difference between the groups is simply not equal to zero could be greater than zero could be less than zero either one is fine so we in that case we would report the two sided p value of zero point zero, zero six two now there are times when you might be interested in reporting the one sided p value we're doing a one sided test assuming that the difference is great excuse me the difference is less than zero in which case we would report the one sided p value of zero point nine, nine, six, nine the other alternative hypothesis we could consider is that the difference between the means is greater than zero in which case we would report the one sided p value of 0.0031 okay, so that's kind of a quick tour of the output let's open our dialog box here again, i just had to minimize so i can pop it back up very often the standard deviations or the variances are not equal in the two groups, so we can check the box next to unequal variances here and click submit again and the output will look essentially the same let's minimize this with the exception of the degrees of freedom if we check on equal stateable report the satirth weights degrees of freedom which is slightly lower than it was before okay and then the p values will be recomputed based on that those degrees of freedom now, we could also if we like we could report welshes to welshes approximation for the unequal variances, so we can click okay there we're about done here and that would compute welshes degrees of freedom in that case okay if you're not familiar with those terms and what they are then please refer to your standard text statistics book okay so that's how we compute a t test for two independent samples in stata i hope this was helpful, thanks for stopping by。
粉丝1205获赞1894

各位同学大家好,今天介绍一下关于这个恶魔型的建立,基于斯贝塔。首先的话我们就是打开这一份,就是导入你的数据之后,首先我们要进行一个年份的设定, tsa, 然后的话我们第一步做的就是单位跟减,单位跟减有两种方法,第一种的话就是通过代码生成一些差分之后用 dflur 命令来进行做,我们可以运行一下, 然后这边的话就是我们生成的一个单位跟的一个结果,然后可以通过这个表格可以看出这个是对 love led 做了一届差分之后的一个表格,他的那个 z 指师傅的六点六三五 p 值是等于零的,所以可以拒绝人员假设,说明经过一些差分之后他是稳定的,同样我们也可以对那个呃利润也做一个同样的一个底分了。 嗯,第二步的话我们就是要做那个斜针减压,斜针减压的话主要是通过一个回归产生一个残叉,这是我们残叉的一个名字,嗯,然后的话这个就是残叉名字这个地方是可以变的。然后我们做一个嗯, dfo 的一接的一个回归,我们可以看一下结果, 这个就是我们的一个回归方程, rack 是我们的回归方程,然后这个 predict 就是我们预测的一个残杀,然后对残杀做的一个单位跟检验,然后这是我们检验的一个结果,它是负的,二点八六零是比这两个的绝对值,这三个的绝对值都要达,说明我们的模型的残, 他是通过了卸妆检验,说明他是长期稳定的,长期存在均衡的稳定,因此我们可以建立旺膜型, 嗯,按摩型的话,他这里的话就是 visoc, 这里选择我们的两个变量 max like 就是我们这里可以选任何一个数字,只要比二代大就可以。然后的话我们就是选择我们这个 vi 模型的一个 比较合适的一个之后接触,然后这个看法主要就是看那个心在哪个上面,哪一行打多,我们就选几接,然后在一我们这边就选一接之后模型,所以的话我们在估计这个望模型的时候,这个 lens 就选一, 这个就是我们得到的一个估计方程,然后这个是分别这个这个的话就是让那个浪 l 而作为音变量,这是浪 l d, 而 d 作为音变量得到两个估计的回归方程。 接下来的话我们就是要做一个自相关检验,自相关检验的结果就是说他都屁直都比较大,这里我们直接可以看到他是没有自相关的,什么模型也是可以用的。下一步的话我们做那个单位跟检验, 就模型整体的一个模的单位跟可以看到他全都位于园内啊,这个位于圆边缘上的点到底是不是的话,我们可以看这里零点一零零七四六也是非常低的,我们可以就是说他满足了一个稳定性的假定, 即使就因为他低,高出来的部分很小,我们一般是要需要这个模式小于一的,但现在也不错。 接下来的话我们做那个格兰杰英国检验,嗯,通过这个表的话,我们可以看到这边的配置是比较显著的,上面的配置不显著, 所以我们就说 l l d 是那个他的啊,一个原因就是说 l l l l l l l d 的一个原因 就是它是 y, 它是 x, 而且是显著的,但是这边的话它就不显著,就说明它落完了 d 不能作为原因。然后的话,下一步的话我们就是考虑镇交化的脉冲小音图去衡量到底是一个什么样的变动。 这两行命令的话就是我的这个数据,他可能出来的图是看不到的,可能就是数据不太合适,但是我们的命令今天主要就介绍一下命令,所以这两个命令我们可以换在其他 他的数据,当样本量多的时候,他也就出来结果了。这就是关于 stat 里面恶魔型建立的一个整个过程,大家如果有需要代码或者什么的可以私信我,谢谢大家。

携整检验误差修正模型。第一步,依次输入 linywin lix 二、 liex 四、绘制线图的目的,判断是否存在线性变化趋势, 即是否存在随时间变化出现增减变化。第二步,建立回归模型,输入 lsycx 二 x 四,点击内容保存。 第三步,建立残插序列一一方法一,在回归估计下方输入 january 一一等于 reseat。 方法二,在模型中找到残叉序列空白处,单击右键新建一个序列, 在模型窗口找到序列 residuo 的述职,复制 residuo 下面的述职粘贴到新建的序列。 如果怀疑用 general 的到的数值和 resitual 的数值不一样,可以打开序列一一进行对比, 两者差别不大,退出进行下一步。 第四步,残差序列单位跟检验 三个选项,结局项、趋势项二者不存在,都做一遍,保留替职。最小的检验结果 只看 adf 值,下方零借值以及其他数值均不看。结合第一步限图结果,查写整检验零借值表,找到变量三长数项无趋势项对应的数值。 拿出课本副录,写整检验临界指表下方有备注方程,将述职引入方程中,替为样本容量, 因为 t 等于负四点五二五九零三 c 等于负四点一四三八四三五,说明协整关系成立。 如果斜整关系不成立,做自相关和一方差检验,修正后再求出残差,重复写整检验步骤, 本立方程不存在自相关。 第五步,误差修正模型,输入 nsdycdx 二 dx 四一一一 点击内容保存。如果出现 p 零点一的情况,采用逐步回归法剔除变量。 本例误差修正模型结果如上显示,在短期内,如果受到外部冲击,使变量之间的关系偏移了长期轨迹,将由每年以零点八八比例的力度使变量之间的关系被拉回。

大家好,欢迎来到塞塔数据分析入门课程,我是车水老师,本节课我们要讲的内容是相关性检验以及差异性分析。 相关性检验呢,我们主要讲用皮尔森相关系数做数据之间的相关性检验,然后差异性分析呢,也就是我们经常用的两样本均值体检验。我们先来看相关系数检验, 相关系数检验呢,有两个命令,第一个呢是 colulate, 然后第二个呢是 pwcorr, 然后他们的使用方法呢,都是直接在命令的后面加入要检验相关系数的变量名称,嗯,然后这个变 量的个数是没有限制的,多少个都可以,也没有。呃,是否是连续变量或者分类变量的限制? 然后,嗯,使用完这个相关系数之后,我们再来学习一下如何将结果导出,非常的方便快捷。好,我们用随塔来操作一下, 打开度文档,然后还是要记得先保存一下 相关信检验。好。嗯,我们来调用一份 数据,我们今天来调用一下,嗯,我们还调用我们之前比较熟悉的吧凹头,然后我先 ctrl d 运行一下 samurais, 我发现啊,这些数据,那我要计算这些数据之间的 p 二三相关系数呢,那我用第一种方法用 correct, 然后直接在后面加入变量名称,比如说第一个是 press, 第二个是 mpg, 嗯,第三个是二一 p 七八,然后再加一个,比如说 weight, 就或者 nice, 我用这个做一个示范,好,运行一下,然后他就会出来 这个 p 二三相关系数的这个表格非常的快。然后第二个命令呢,跟这个很类似,但是它前面的命令呢是 pwco 二二, 然后我们发现这两个表格其实是一样的,但是这个 pwcr 他相比于 covene 他有一定的改善,就是他在后面可以加一些选项,比如说,呃,我可以加一个显著性的选项, 就可以标出来显著性来试一下。好,这个他就会在下面呢,在每一个相关系数的下面标注这个相关系数的批值,就很 很清晰的看到这个相关系数他是否显著。然后还有一种方法呢,是直接在后面加,就是我不想显示这个相关系数的批值,我想显示他的呃 是百分之一的显中性水平显著还是百分之五还是百分之十,通过加星星来显示。比如说 如果批值小于小于零点零五的话,那我就在后面加一个星,那我所以这个后面的选项应该是四二,后面括号 号里面是零点零五,来运行一下,发现就是添加新号的这些, 那他代表的是系数在百分之五的显著性水平下显著,比如说这个零点九四六零是为和烂之间的 p 二三相关系数,然后他的批值呢是零点零零零零,是小于零点零五的,所以他后面带了一个信号, 就是这个意思。在平时的使用中呢,我们通常的情况下会用这个 pwc o r r。 好,然后我们来学习一下如何将这个这个表格的结果导出,当然我们可以直接这样全选,然后复制,但是那样的话,嗯,就是粘到卧的里面, 可能他就会很乱,不太不太好。我们来学习一下如何直接导出我们用这个 logos 这个命令,然后他的使用方法呢?是啊, logos, 然后逗号, 然后后面的选项呢?是要保存保存的名称,比如说我起的名字是 c y, r, 然后后面如果你要保存成 word 格式呢,就在后面加点 docdoc, 就是 word 的后缀,然后面再加一个 word replace, 然后 冒号,后面加我们刚刚的那个检验相关系数的语句就可以了。 logos, 然后逗号, 然后取一个名字,比如说我叫 c o r r d o c, 然后我要保存的格式呢?是 words, 然后冒号,然后现在我们要换行,所以用三个斜线来换行,第二行呢就写这个还扶持过来,我们来运行一下。 好,这样的话呢,我们这个结果就保存在这这里了,直接点击这个蓝色的就可以。 好,我们就发现了这个,呃,相关系数矩阵就已经输出到卧的里面了。 然后还有一种导出方法呢,是直接用啊, as, 这个在之前也是讲过的,然后在后面直接添加我们要做的这个命令就可以 啊,这里就发现,哎,等会后面再加一个 replace 的选项,因为他可能和之前的一起合并。 好,这就是我们的那个相关系数矩阵图,皮尔塞相关系数,那这两种方法都可以很好的导出, 我们平时呢用哪一种都是可以的,都比较方便快捷。然后第二 个第二部分,我们来学习一下如何做良药本。嗯,君子体检验 主要的命令呢,就是这个 t test, 这个就一目了然吗?我们要做 t 检验,所以就 tit test, 然后他使用的方法呢?就是 t test, 后面加要检验的变量名称,然后后面的选项呢?是 啊,两个样本的分类,分类标准,比如说我要检验已婚和未婚这两个,嗯,样本中的工资差异,那我们就要写 tetes, 然后 工资逗号,他的分组的类别呢?是已婚这个变量, 我们来引用一下那份工资的 for you。 好,那我想看就是不同的,呃婚恋状况,那他的工资有没有显著的差异?我们用 t test 位置,然后后面是 by marry 来看一下。 好,他呢,他就会给出,呃,因为 mary 的这个变量有两组,他给出两个组别中的,嗯,观测个数,嗯,均值标准差,标准物 标准差,然后百分之九十五的致信区间,然后呢,我们要关注的是最后一行,就是两个均值之间的差值, 然后他的原假设呢,是差值等于零,就是这个值等于零。然后贝则假设呢?有三种,第一种,贝则假设是单边检验吗?就是 这个均值,这个差值小于零。第二个倍则假设是差值不等于零。第三个倍则假设是差值大于零。然后我们平时可以用这个中间这种,也可以用后面这种, 那么我们看批值是否小于零点一,或者是否小于一点零五就可以知道,那这个原甲设是否要被拒绝,这就是 t 检验。那如果我想知道,就是 呃已婚和未婚这两组情况,这两个组别中啊,除了工资,我还想知道他们之间啊,我再看一下别的别的, 比如说除了工资之外,我还想知道这两个组别中的年龄是否有显著的差异。那我能不能在 tits 的位置后面直接加入一个 h 年龄这个变量呢?我们来试一下, 发现不行,他说你定义的这后面跟的变量个数太多了,所以我们就是知道这个 t 太子后面他只能加一个变量,那如果我想知道两个变量的差异怎么办呢?那我们就用第二个命令来执行。第二个命令呢 就是太体态爆粗,然后后的他的作用呢是可以检验两个以上的变量在不同类别下面的,呃,均值是否有差异,他的使用方法呢?就是后面跟上你的, 嗯两个以上的变量,然后面选项呢是,嗯不同组别的分类标准, 比如说我想知道 ttpo, 我想知道不同外面状况下工资以及年龄的差异,那我就后面跟上工资和年龄,然后再加选项。失败 运行一下就发现呢,这一就他两个变量的差异都 会给出来。这一这一组呢是单身的组别,这二这一组呢是已婚的组别,那他会给出 两个组别的均值,然后最后一列呢是两个组别均值的差值,然后这个星号呢代表显著性水平,我们现在不知道这个星号就是还是百分之几的显著性水平,我们可以再加几个变量进来。 you're all great, 呃,还有奥尔斯这个工作小时数,然后经验这么多,我都想知道他们的差异,这样呢我们就可以看出来了,就是三 一颗星呢是百分之一的显中性水平,一颗星是百分之十的显中性水平。嗯,比如说最后一行 totespens, 他在单身这一组的均值是十二点九二,在已婚这一组的 啊,均值是十二点三二零,然后他们的差值也就是第一组减减去第二组的差值是零点六,那这个差值呢?在百分之一的显著水平他下他不为零。所以说 啊,我们就可以的是结论说单身组和已婚组,他们两个组别的 经验是有显著差异的。好,所以这就是啊,显著性差异他的做法。这就是本节课的内容,我们讲了皮尔森 相关系数的计算以及导出,以及讲了如何用随他做均值体检验。

同学们大家好,欢迎来到极乐数据课堂,我是倪老师,今天给大家介绍的一款软件叫斯贝塔,它是一款统计软件, 我先介绍一下我们的课程特色啊,相信大部分同学都去网上看过一些视频,特别是连老师的视频啊, 林老师的视频其实讲的非常好,每一个视频的时长也是比较长的,内容讲的非常的细,主要是从理论然后实践操作这么整个过程来说。但是对于刚入门学习斯蒂达同学来说啊,这类的视频我还是不建议大家去看,因为 通过一个半小时的学习下来,你可能真正掌握的内容其实只有一点点,比如说你只会导入的一个数据,对吧?但是你浪费了你一个半小时。我们这个课程的特色呢,就是经练啊,比较干货,并且偏应用。 大部分同学来学习我们这个软件主要还是为了去啊做一个实证分析,然后完成你的毕业论文,或者是头一片好的旗开。 那么我们的应用其实就非常重要。这个课程啊,我们的特色就是啊,在较短的时间里,然后让你掌握斯德塔,并且能够自己去做一篇论文。 那么我们啊讲了我们的课程特色,那相信大部分同学啊,还不知道实证是什么东西,那我这边先给大家简单的介绍一下什么叫实证实证,简单的说就是去用数据验证我们的一个结论。 那怎么用数据去验证我们的结论呢?我再举一个粗俗的例子啊,比方说我们现在有一个研究主题,就是想研究饭量对上升高的一个影响啊,我们都 知道饭吃的越多,人就长得越高,对吧?这个其实就是我们的一个理论预期,现在我们去找一份数据,比方说你把全国所有人的一个 饭量以及身高的数据被统计下来,然后我们去研究这两者的关系,基于这一份数据去研究这两者的关系,并且得到了 饭量是促进长升高的啊,那你现在做的就是一个实证分析,就是通过数据去得到一个结论。好,那么 我们现在来看一下整一个课程啊,我们会讲到哪些东西啊?接下来我们所有的课程就是按照这一个思路来的,那这个思路我主要是按照实证分析的啊,一个框架给大家梳理的。那么在做实证分析之前,大家都知 知道啊,我们需要有一份数据,那这份数据我们肯定是要对他进行一个整理和清洗,不然的话你是没有办法进行实证分析的啊,除非你这份数据是哪里买来的,对吧?相信大家自己下载下来的数据啊,都是一份一份零散的,必须要进行清洗和整理。 那整理完数据之后,我们要做的就是实证分析了,实证分析主要分为四个模块,第一个就是对于你对于你前面那份数据的一个描述性统计啊,它里面主要分为五个,一个是 n 就是你的样本量, me 就是样本的一个均值啊, m i n m a x 就是样本变量最小值和最大值, sd 就是标准差,主要包含这五项指标来对你的数据进行一个详细的描述,做完数据描述之后就进 我们的第二步主回归,主回归就是去验证我们这篇文章的一个主题结论,也就是主要的结论 还是从我们前面的那个例子来说,我们想研究饭量对长身高的影响,那么你的主回归就是要去验证你的饭量对你长身高的影响是什么?是促进的还是意志的?那当然这种影响我们必须存在于一些模型去做。 接下来我们的课程中啊,会讲 ous 模型,也叫混合回归模型, fe and r e 这个叫固定效应模型和随机效应模型, gmm iv 啊,以及 did。 did 这个模型呢,其实和前面的模型差别有点大,它是一个啊,独立的模型,就是跟前面其实没什么关联啊,为什么要讲 did 这个模型?因为这个模型现在比较流, 而且他发好的期刊非常好发,所以说我把它单独拿一块出来讲。第三部分叫扩展研究,也叫深入研究, 也就是把我们的文章的结论进一步挖掘,我们验证了饭量会促进一场升高。那么如果我把这份样本划分成两份,一份是男性,一份是女性,我们去比较男性和女性之间的一个差异,也就是吃同样的饭,男的长得高还是女的长得高, 这个其实就叫深入研究啊,也就是我后面给大家列出来的一个分组回归这么一个东西。当然我们后面还会介绍更多的一个深入研究啊,就是中介效应以及调节效应。 第四部分就是我们的稳健性检验了,稳健性检验主要是对我们的主回归进行一个进一步的验证,也就是你前面做了一次,结果其实 存在一定的偶然性,不太可靠,我们让这个结果更可靠一点,就要做一个稳定性检验。稳定性检验 啊,主要是包括以下三种方式,一个是替换变量,一个是变换模型,一个是数据样本的变换。 我们前面用吃饭,用饭量,呃呃,我们前面去研究饭量对长身高的影响,那么饭量如果我们前面是用一天吃饭的次数,就是吃一次饭还是两次饭,吃三次饭来衡量的话,呃,我们可以得到吃饭的次数越多, 你的身高越高,其实也就是验证了饭量越大,你的身高越高,对吧?那么如果我把这个次数 啊变成另一个东西,就是饭量,我不用次数来衡量,用我一天吃几斤大米来衡量,那其实吃的大米的斤数越多,也其实能够 说明我们的饭量越大,对吧?从而也是验证了我们饭量对长身高的影响,就是说把次数换成了吃几斤纳米, 这个就叫做替换变量的五金星。当然我们的方法还有后面两个啊,这个在后面的课程中我们会给大家强详细的介绍。经过上面四个步骤啊,其实我们就把 整个实证分析给做完了啊。在做完实证分析之后呢,我们其实还要讨论一下文章的一个内存性 啊,内生性它是一个问题,它会造成你回归结果的一个偏恶,所以说这个问题啊非常重要。为什么重要? 因为我们在发一些比较好的期刊的时候,神高老师只要看到你的文章中没有去讨论这个内存性,你的文章一定会被 d 稿,所以说我把它单独列为一个专题来给大家进行详细的讲解。 呃,接下来就是我们显著性调整的一个专题课,因为我们理论是理论,实际是实际,真的我们去做一份实证的时候,你做出来的结果往往是不显著的 啊,基本上两篇里面就有一篇是不显著的,那这个时候你怎么办呢?不是说直接换个题目对吧?或者是重新再找一个数据去做,我们其实是可以通过合理的计量方法给他调整到显著的啊,所以说这一个专题课程呢,实用性非常的高, 到这里为止,我们整个实证分析就已经做完了,那么接下来你就是要去写你的一个 论文的文字了,那么论文的文字其实它里面也有很多的讲究,也有很多大家不了解的东西,接下来我会给大家梳理,就是论写论文的一个重点是在哪里?就是每一个 章节里面到底该怎么去写他,你的导师才会喜欢,省高老师才会喜欢,文章才会更好发。最后就是我们的一个实战训练营,就是基于我们前面学过的一些内容,我会给大家进行一些实战训练啊,来巩固我们所学的一个内容。 最后的话我再给大家看一个呃,实证做完的一个呃案例是怎么样的? 刚刚我们讲过啊,实证分为四个模块,一个是描述性,那其实这个就是我们描述性统计的一个表格做出来的样子,就是这样子的啊,其实这个表格并不需要我们手动去做啊,斯贝塔 会给我们直接输出出来,最后就是长这样。第二块就是我们的主回归,也就是去验证 x 对外的一个影响 啊。最后做出来的表格是这样子的,这个其实软件也会直接给我们说出来,通过银行代码就可以了。 第三部分是扩展研究,其实我们这里做的扩展研究也就是对样本进行了划分,分为的 state 为零, state 为一的两个样本,然后去研究这两个核心,解释变量对你应变量的一个影响是怎么样的 啊?这里其实就是做了一个分组回归。最后第四步骤就是我们的稳定性检验,也就是 啊对主回归的结论的进一步验证。这里用的方法是替换变量啊,但是这里做了两个,一个是替换了 y, 还有一个是替换了 x。 前面我们可以看到用的都是罗恩佩特的,一,这边换成了罗恩佩特的,二替换了音变量,然后前面用的都是 siri ems, 二,一,这里替换成了 siri rms, 二, 替换了你的核心音变量,这个叫替换,呃,变量的一个文件性。好,那我们第一节课就先上到这里。

stat 做数据分析,分类变量 森林图 敏感性分析, 挨个检验学会了吗?

嗯,美国的汽车价格的这个数据,这个是 star 官方自带的数据,等会我会展开跟大家说。这个各类的这类数据到底从哪能够查看到啊?那现在不管了,就是你现在调了一份数据进来, 这个数据呢,就存在我们的内存里边啊,大家也可以像看 excel 表格一样啊,你点上方的这个数据浏览器, 如果不想用那个鼠标啊,像我平时不太动鼠标,你就用键盘。 br 啊,是 bros 的这个简写, 你就可以直接来浏览这份数据了,这个就是一个标准的 excel 表格的形式,你可以看到这些数据有的是红色的,这是字符串的,黑色的是纯粹的数值。还有一类呢,是这样的, 就这种蓝色的啊, 蓝色的这部分呢,它其实表示的是数字,这个本质上是数字 啊。有的人说,那为什么显示出来的是文字啊?它是个两面派,背后呢,它其实对应了一个零,显示出来呢,叫 domestic。 那下面呢?还有一些,呃,我往我没办法现在往下拖啊,我比如说换一个吧,这个地方它显示的是 foreign, 他也是个两面派,背后呢,实际上存了一个数字,一显示出来是这个。这个跟你的手机通讯录实际上是一个道理啊,我们每次打电话的时候,拨出来的是手机号,可 不是小猪啊,小狗啊,你标的那个昵称不是这样子啊,那这个很方便啊,尤其是在一些问卷调查里面,我们会把大家对某一件事的态度分成一二三四五五种意见,一代表不满意, 五代表非常满意,还有一些中间状态,那你如果是标一二三四五,经常搞不清楚一是最好的还是五是最好的。如果是用这种数字文字对应表的方式呢,就比较方便了,这个在 style 里边的专有的名词叫数字 文字对应表。呃,这个等一会我会讲专门的定义方法啊,就是你可以指定说,呃零代表 domestic 还是代表国产, e 代表 foreign 还是代表进口,这个都可以去处理它, 我尽量的把一些我认为重要的东西都给他截下来,下课以后呢,我会把这些图片都统一发给大家,所以你上课的时候如果记笔记不方便,你也不用太担心啊。 好吧,这个就是浏览了一下数据啊,比如说我想看一看这里面到底有哪些变量,你就可以输入一个 d s 啊, d s 呢,是 describe 那个单词的 简写,甚至可以简写为 d 啊,就私下里边的好多的命令都可以简写到两三个字符而已啊。比如说你敲进来以后呢,这个 domestic 进来, 他就告诉你说我们这个数据啊,存在什么地方了啊?你看一下啊,这个是存储的 地址是吧?嗯,那你知道说我们这刚刚这个命令是 this use altar 这些用的是私下自带的这些文件啊,这自带文件其实,呃就跟这个数据文件的首字母有关系,首字母为 a 呢,它常常就存在我们这个 base base, 我想大家前两天 呃装自己的课件的时候都知道这个东西啊,他是在官方的这些命令存放的位置,那下面是有 a 一直到 z 二十六个此文件夹子啊,那我们 alt 这个文件呢,就存在这个名称为 a 的这个小的文件夹里面啊,那如果随后我们就调别的数据,就是以那个字母开头就放到那儿了,所以这个谁还自带的?这 mini ccu 也不是说从天上就来了啊,它也是存在我们电脑里面,然后接下来就告诉你说有七十四个观察值,这边呢有十二个变量。呃,剩下的就是这些变量的名称,这边呢是变量的,我们把这个 labor 呢称为标签, 你可以视为对于这个变量的一个更详细的文字解释啊,因为如果只看变量名的话太过简单,有些时候不太理解什么意思,我们在后面就加上这个什么单位啊,相关的说明啊之类的。这接下来呢就是他存储的格式和显示的格式,这个先不管他。 呃,刚才我不是提到一个数字文字对应表吗?叫 value label 啊,在这儿呢,它就有, 所以你很清楚啊,就是光看这个 describe 的结果。呃,你就知道说我们在这个数据里边有哪些变量,到时候用 pros 命令显示的时候,它会显示成蓝色的啊,但凡是有数字对应表的这些变量的都可以显示为蓝色。 呃,如果你不用这个命令呢,我们可以用另外一个命令啊,这里边呢就是涉及到 stat, 还有一些可以安装的外部命令,比如说我写一个 d s r describe two, 这时候它的好处是什么呢?呃,除了刚才 d s 显示的那些命令以外, 其实你这些东西都变成蓝色了,你看啊,刚才这个就是蓝色,是没办法点的,我现在换一个模板给你看你就知道了哈,你可以现在加载这个首选项啊, 看一下常规的首选项。刚才我们不是说结果这个窗口可以有很多选择方式吗?啊?我可以选一个这个 啊,这个还是这样的,这些蓝色的呢,就加粗以后就可以点开了啊,你点这个 make, 它就是一张表格,你再去点这个 orange, 它就会列出零代表 domastic, 一代表 foreign。 啊, 这谁还有另外一套工作机制,就是官方呢,提供了几百上千个命令。呃,我们这些用户呢也不停的在官方命令的基础上 呃,开发出很多衍生的版本来,通常呢要么是让语法变得更加简洁,要么是让功能变得更加强大啊,那剩下的大家也可以去做一些,反正你知道,刚才你看我可以反复的去输这些命令啊, 我知道有这么一些变量,我就特别想知道这些变量的基本统计量我们就可以算啊。 sum 是 summer 那单词的简写啊,不是求和的意思。呃,你默认呢?他就针对所有的变量呢,就去算一个基本统计量,这里面就均值啊,标准差,最小值,最大值 啊。我如果是对其中的某一些变量感兴趣,我们就画一个三点图,比如说 scatter price, wheat 啊,汽车的价格,汽车的重量,这个图呢很快就出来了,对不对啊?像我刚才一开始的时候点,我说,哎,我设一下他这个绘图的模板, 这时候你再画的图呢,可能跟刚才那个就有点差别,哎,你看这时候图就比刚才那个要漂亮一点,对吧。嗯,这些都可以改啊,就变成说我无论是 stat 的界面里面的字体啊,颜色的搭配, 对啊,还是我画图的时候这些图形的标签啊,整个图形的风格啊什么之类的,我们全都可以改,而且可以改的很快啊。像刚才这个,我就 set 模板变成一个干净的这个绘图模板,他就自动把我绘成这样了。 接下来我们还可以做一些回归啊,比如说我就想看一下,呃,价格跟重量,还有长度、油耗之类的这种关系,是吧? 我们啪啪就敲了几这么几个变量,他就会出现一个大家非常熟悉的呃, os 回归的这样一个结果。 当然这个结果呢,看起来还算方便,但是呢,你的论文里面没有办法用哎,我们还会用 esctab 之类的这些命令,你就直接输入他,他就会把刚才你做的这个事呢,用这种论文里边比较接受的回归表格的形式呢,就帮你呈现出来了。 甚至我后面再稍微加一点点这个复指令和选项,它就可以很方便的帮我输出到 word 呀, excel 啊这些文档里边去。

大家好,欢迎来到 sita 数据分析入门课程,我是车水老师,本节课我们来进行第一节 sita 的简介, 主要包含三个部分,分别是熟悉随他的界面,熟悉随他的基本设定以及设置我们自己的工作目录。首先我们来进行第一部分,熟悉一下随他的简界面, 所以他的界面呢,包括四组窗口,两个菜单栏以及一个 输出结果窗口。四组窗口呢,分别是历史代码窗口,密令栏窗口,变量栏窗口以及数据性质窗口。在此基础,在此基础上呢,我们要学会如何浏览数据 和使用度文档。我们来打开斜塔,实地操作一下。双击打开, 我们发现,呃,最先映入眼帘的呢是中间这一部分,它是我们的结果输出窗口。呃,四个窗口呢,分别是 历史代码窗口,是最左边的这一列,比如说我在命令窗口进入一行命令之后呢,在左边他就会出现这个历史记录,如果我双击这历史记录的某一行,他就会重新再运行一次。 第二个窗口呢是命令窗口,我们可以把塞塔的指令呢在这里面建入,然后按回车就可以执行。第三个呢是变量窗 窗口,在右上角,我们可以在这里呃看到每一个变量的名称以及他的标签。第四个窗口呢是性质窗口,在右下角我们可以看到这份数据的名称,标签。呃,数据类型以及 嗯,变量的个数和观测值的个数以及这份数据的大小等等。然后两个菜单栏呢,在最左上角呃,用菜单栏我们可以进行一些基本的统计分析,做图,导入,导出数据等等都可以。 然后呢第二行呢是我们平时用的比较多的,比如说打开文件保存,嗯,然后打开读文档,浏览数据等等。嗯,在 基础上呢,我们来学习一下如何浏览数据。我们主要用的是这两个按钮, 这样单击就可以出现我们的数据,然后第二个按钮也是一样的,他们两个的区别呢就在于第一个按钮可以修改数据,比如说我第一个是一,第二个是二,呃,这个技术上 如果我想要修改的话呢,我打开,比如说我想把第一个数据变成零,那我就直接可以是零 就可以了。但如果我用这个第二个浏览数据的窗口呢,我想把它这个数据再变一下,就不可以这样直接改了。 所以在平时的使用过程中呢,我更推荐大家用第二第二个指令,它类似于指读,呃,这样呢,我们可以减少我们嗯,误误操作导致的数据的变化。然后 接下来呢,我们要学会使用杜文档,杜文档呢,就是这个类似于幕布一样的按钮,我们单击可以打开,在这个里面我们可以写入我们的命令,然后呃选中纸, 点击这个三角形就可以运行。克里尔的意思呢是清除数据,那我们就会发现这里面的数据刚刚进入的数据已经没有了。呃,相比于运用这个命令栏呢,相 我更推荐大家用杜文档,因为杜文档呢,我们可以随时的修改保存,以及和合作者同时使用的时候,我们可以把我们的写过的杜文档发给对方,然后在对方呢在你的杜文档基础之上再进行 修改呀,运行之类的都是可以的,这样就更方便更有嗯,修改的余地和更有操作性,也对我们的合作有一些有很大的帮助。嗯,比如说我们 来举个例子,如果我想浏览一下系统的数据呢?我们用 ccuse 这个命令,比如说系统有一份数据叫做 out, 嗯,我们可以 选中,然后点击这个三角形运行一下,就发现我已经把这个,呃一九七八年的机动车的数据 已经掉入进来了。是这个,那我们就可以发现呢,在看右上角可以看到变量的名称和标签,右下角可以看到这一份,嗯,变量的名字, 呃,数据的名字以及数据的标签,然后观测值的个数,嗯,变量的个数都是可以看得到的。好,我们 现在呢来看一下随他的基本设定。呃,因为刚刚开始了解一个软件的话,我们要呃把它设计成我们 喜欢的样子,我们如何设置呢?在 id 的这个里面呢,最下面有一个 praprans, 我们打开这样的 praprans, 我们就可以设置我们这个界面的, 呃显示的属性,比如说这个这个里面有主题,是标准主题,或者是呃什么经典的主题都是可以的,比如说我用标准主题点击 ok 就可以了。呃, 然后呢,第二个我要说的是要学会嗨老婆功能,可以让我们的效率事半功倍。比如说有一个命令叫做三木 s, 是用来做描述性统计的,但是呢,我不知道这个三木 s 是什么意思,那我就要在前面 加一个嗨,然后呢,嗯,直接回车来执行一下这一份,这个代码就可以出来了,他就会跳出来一个嗨,要普文档,告诉你这个三 ms 的命令是用来干什么的,他首先跟你解释这是一个用来做描述性统计的命令, 然后告诉你这个秘密应该怎么用。呃,首先进入三木 s 或者是 su, 就代表了三木 s 这个单词,然后 后面呢加入你的,嗯,变量的名称,后面再加 f 选项,应选项括号呢代表嗯,可加可不加是, 嗯,可以根据自己的需要去加的,然后可以加一些选项,然后有哪些选项呢?后面都会给你列出来,然后呢在后面他会 告诉你用菜单栏呢如何实现这个功能。呃,然后后面呢会给你举一些例子,让你更深刻的来理解这个命令。 所以说如果遇到一些不会使用的命令的时候呢,我们一定要学会使用哈尔普文档,然后也要学会如何阅读哈尔普文档。好,第三 部分呢是设置我们的工作目录,首先我们要来看一下当前的工作目录,用 p wd, 用 p wd 这个命令来实现。 没车,我们就发现当前的工作目录呢是地盘下的四件套。呃,那如果我想改变我的工作目录该怎么办呢?我用下面这一个命令 cd, 然后呢再把我的想要进入的目录在 写进来,比如说我想进入的目录呢是 f 盘。好,那呃,我已经设置到 f 盘,我们来验证一下,用现在的 p wd 发现呢当前的工作目录呢是 f 盘了。呃,还有一个呢是要查看系统的目录,用 casd 啊, diydl 呢,就是 draxdrax, 就发现呢有,所以他呢有六个文件夹,然后分别的系统的路径在哪里?我们如果想改变其中的一个呢?啊?当然是 都是可以改的。我这里演示一个,比如说我想改变这个 plus, 他的路径用 cs 镜。 啊,我想改变 plus, 所以我要把 plus 加进来。然后你想改到哪一个路径?比如说我想改到 fpard, 比如说我想改到地盘的四件套 的 a 度下面的 pass。 那执行一下就可以了。那我验证一下我这个改成功了没有?再用一下 cs, 然后呢就发现我的 plus 已经到了我刚刚设置的这个目录下面了。好,这就是本节课的内容, 我们学习了 cta 的界面、 cta 的基本设定,以及如何设置我们的工作目录。

做实证分析很难吗?其实真的很简单,在大多数情况下,我们去做一篇论文的实证,其实主要是为了去说明 x 对外的影响,那么我们只要把这么一个结论给说清楚就好了。 在接下来呢,我们再把这个结论进一步挖深,也就是做一些拓展研究,把他的研究进行深入,去解释 x 对外为什么会有这种影响,或者是在不同的分组情况下,他为什么会表现这种差异。最后我们再对基本结论进行进一步的验证,也就是我们的稳定性检验。好, 我这边把整个时政分析剖析成四个步骤,第一,描述性统计,也就是对于你的这份数据的一个概况的描述。第二,基准回归,就是得到你 x 对 y 的影响 究竟是怎么样。第三是拓展研究,我们可以去解释一些内在的机制,或者是一些意志性,也就 就是不同分组情况下的表现是怎么样。最后就是我们的稳定性检验,我们需要对我们的基准回归进行稳定性检验,让我们的结果变得更加可靠。

各位同学大家好,今天我们主要讲一下 alleged 回归。 alleged 回归就是它针对的应变量,是一种有序的应变量,比如说债权等级,它分为一级、二级、三级,由 劣质到优良字的一个分类,那它就是一个有序的变量。所以当我们的音变量是有序变量的时候,我们就用 or logic 回归,后面跟着音变量次变,然后做一个文件的标准物,然后的话我们可以做一个 merge 音词,然后看一下它的那个平均编辑效应, 然后他的这个我们就看 dydx 这里的一个影响,然后他这里的一级我们这边命名的,他是一个不好的一个债券评级五的话,就是优良的债券评级负十一,他的系数是负十一点四零,就代表当这个当 oa, 当一个公司的 lv 增加一单位的时候, la 就代表的是一种公司比较良好的一种业绩指标,就是公司的业绩指标上升一单位的时候,这家公司被评为劣迹。呃,债券的 债券被评为劣迹债券的可能性概率就会降低十一点四零,百分之十一点四。 当 la 增加一单位的时候,这家公司被评级为良好债券的概率就会提高百分之七点五六。好的,这就是关于 log 回归的一个相关内容和系数解释,谢谢大家。

各位同学大家好,接下来的话我们介绍关于历练表分析和卡方检验,嗯,然后列列表分析,卡方检验的话主要就是用到这个 tap 和 c h i r 卡方,然后这些都是算他相应的期望值之类的, 然后他这里就会出现一些不同的结果,我们都可以自己在做的时候会试一下,这边就会出来相应的列联表。 嗯,接下来的话我们就可以看一下 如果做 t 检验, t 检验的话他就是 ttes 的,我们要检查那个变量,然后我们要是一个二分类的话,那么就白针的,然后的话在百分之九十五的水平下也是不均等的检验,都可以做,都可以进行运行,然后封插奇经检验的话就是 sdtes 特,然后 一单因素和放叉分析,就是用弯位,然后还可以用放叉分析的话可以用 an n novo, 这个是我们的一个单音素放叉分析,然后这个 novo 也是我们的一个防晒分析,这边的话我们可以画三点图,他这里是用到了一个 lift 利福特出来的话,就会看到我们还画了一条线,这个就是可以做那个相关系数,并且带线带有线条的相关系数,这个是关于相关系数表,我们可以做各种皮尔逊的之类的, 然后单变量的侦探性检验,我们有 sk test, mv test, 然后对竖进一卷, 让他满足正态项目可以用到这两个代码, laderglider, 然后这里有四匹阿曼相关系数,肯德尔相关系数, 这边的话就是我们主要的一个关于嗯,历练表以及风差分析的一个主要代码。好的,谢谢大家。

大家好,我是文龙,今天继续给大家讲 psm 轻性的为匹配,嗯,有需要,嗯,终极耐用的小伙伴可以加我上方加我的微信。 上一个我们讲的内生性问题,然后讲了,呃,工具变量来解决内生性问题。工具变量就是基本能解决所有的内生性问题,但是工具变量问题是这工具变量很难找到。 然后内存性问题不有分为五种吗?要么选择偏差,这个呢,就可以用金项得分匹配来解决。 嗯,假如呢,你要研究企业的 rnd 投入对 profile 的影响,那么 pv 的意思就是这样,假如两家企业 rnd 投入明显不同,但其他的各方面呢?呃,都相同, 公司规模,干了率,说出行业,公司治理等,那么其他各方面都高度相同。相同的情况下,这时呢,就可以把公司的 perform 的差距归结,归结到 rnd 投入的差距, 要么你算那个,这个意思就是说,要么要么就是别的因素不同的时候,你就没法比较这两个的差异,只有当嗯,其他因素都相同的时候,你才能比较这两个差异。 这种找到一种一个控制主的个体,得到该个体与处理主的个体在除自变量外,其他各因素都相似,也就是匹配,再通过自变量的差异解释因变量差异的行为,这就就是匹配的意思。 嗯,大概的步骤是呢?或者是大概的意思,嗯,就是呢,通过解释变量,也就是上面说的啊,你得投入 给他分组,然后,嗯,举个什么分组呢?举个例子,就取中位数,然后大于中位数的一,小于中位是零,然后生成一个新的变量,新新的组,这个组呢,他只只有零或一, 零就是小于中位数,一就是大一点,然后再通过啊自变量对分组的 分配,再通过自变量对分组做逻辑回归,找出,哦,找出那个分值相似的进行匹配。嗯,大概就这意思。嗯,具体呢? 因为我这个呃讲解呢,主要是针对应用性应用,就是模型应用讲解,并不涉及一些具体的复杂的一些背后的公式还有逻辑,大家有兴趣可以自己查一下啊,这些都是这这个, 嗯,匹配,你回归这个背背后的一些公式,背后的一些算法到底是什么回事我就不在这里说了,有很多人已经讲的很明白了,我是主要讲究 然后这个是那个减压匹配的那个啊?不是减压匹配,就是。呃, psm 的,这是谁说的? psm 的莱尔。 然后呢?嗯嗯, ps m 呢? 那个 snake 有可能。嗯,不带这个命令,所以要自动自动安装,安装这个,然后这几个是,这都是固定的,这都不需要改。 然后这个是 p s m two, 这也是公定的。然后这个呢,这个就是分组变量, 你把你那个核心自变量给他分个组,通过某种方,某种方式,中位数呢?像我用的中位数给他分组分成零组,这个 bb 是零一二元,有二元标领变量, 零一那种变量才可以,然后这些都是自变量,然后这个这是卡,好的,卡后边是,并且那个加 我得直接变量,未解释变量,然后这个是,呃,意思是罗毅回归,然后是,然后是最临近匹配,然后一呢就是一比一,二呢就是一比二, 然后。嗯,这个匹配方法呢,除了最临近方法,还有半球匹配和盒匹配, 具体这些都是代表什么呢?大家可以自己进行自己找相关资料进行查找, 然后太和 comman 的这个直接放着就行。嗯,大家想知道什么意思也可以去查一下, 当做完这个 p s m 结果之后呢,然后我们可以再做一个 呃匹配检测,这,这是匹配,匹配完之后再做个匹配检测, 这就是把你的一些自变量都换了,最后做完 pk 检测之后呢,然后把一些没有匹配的给删除,重新做回归 啊,一会运行业看一下,先看一下结果。呃,先运行一下吧,看一下结果, 但是这些衣服都删了, 这是安装,这个就不说了, 一万多。然后这是运行匹配, 他先把这个逻辑回归给你写出来, 回归就是我们这个,呃,这个是 y, 然后这是一个音量,一个一个逻辑回归,然后这是匹配结果, 匹配结果我们看这个是没匹配之前,这是匹配之后,只要看 a p p 就行,然后看这个是呃 difference, 就是说,呃,匹配之后,这个 控制变量和被控制变量它的它俩的差值是多少? 嗯,没事解释,也就是说这个值,就是说呢,呃, 就是这个值负的零点八五八五零七,意思就是在他匹配变量一致的情况,在其他匹配变量一致的情况。次变量 啊,是一与字变量是零,就是分组式的一或者分组是零的时候,导致音变量的差异是是负的零点二八零七五个单位, 这就是我们要求的一个系数。然后呢,接下来看这个 t y 六, t y 六,这里没有个 p y 六,这用这个 t 用 看 t, 呃, t 一点七六对应的值是零点零五,一般呢大于一点七六呢,就是差异显著,这里的差异都显著。 嗯,就是说,嗯,在没有匹配的时候呢,他的差异两种差异是显著的,就是不是然后呢,我们匹配之后控制了,呃其他的因素的时候呢? 其他严重都相都相都差不多的时候,他皮他的,呃差异还是显著的,那就说明呢?呃,就是说,呃,我们的音面量对 我们的自变量,对音变量是有差异的啊,自变量的不同是对音变量有差异,是影响,是影响音变量。 然后我们再看这个运行完之后,那个运行一下 pk 结果 就是这个匹配,结果的意思就是在这它这个 base 要小于 m 十才是好的匹配。 你看这个原来匹配不好,就是 bass 比较大好,匹配完这下边是没匹配的,下边是匹配的,匹配完呢,结果呢?是零,就说明他这个匹配比较好,嗯,也可以通过看这个 py, py 的这个值。 py 六大于零点五的时候呢?八零点零五的时候呢,没有显著差异,就说明这两个,呃,他俩是没有没有显著差异 啊。刚才说的话不对啊,就是说你这个这个 bat 越小的时候呢,就是说明啊,这带一个字变,这一个字变亮下它的啊。匹配了匹配之后呢,它那个差异是很小的, 因为你同样一个字变量,他他差异本来就应该应该很小,所以你要匹配之后呢,他差异就会别控制别人的严肃,之后呢,他的差异就很小,但是你不控制别人的严肃之后 后呢它的差异就大,所以这 p y 六呢大于零点五,说明没有显著差异,就说明匹配之后呢它就没有显著差异。嗯,这个就是看它的结果。 然后呢?最后呢?呃,这最后,最后呢?你匹配之后呢?还要运行,你要做回归的话,你你你已经找出来了,已经匹配了,然后你要解决内伤性问题,然后你去运行回归,这个回归呢就把那个 呃就是没有匹配的去掉,你们看你运行运行运行完了之后会他会给你生成一个,呃,会生成一些新 新的面料, 比如这几个都是新生成的 这个位置呢,这个空空的就是没有匹配到的。然后我们运用回归的时候呢,就把这些没有匹配到的去除,通过衣服,这个衣服不等于的这个点,这个这个来来删除啊,没有匹配的数据。 嗯,好了,今天就讲到这里,有什么不明白的大家可以在下面留言讨论,谢谢大家。

实证小助手我们一起运用 stat 自带的数据库来快速完成一篇妇女受教育程度对工资影响的实证文章。一篇完整的实证至少包含四个表格,分别是描述性统计、基本结果、深入研究和稳定性检验。 首先是描述性统计,我们对这份数据的概况进行的统计,主要包含样本量、标准差、均值、最小值和最大值五项统计指标。 然后是基本结果,我们得到了妇女受教育程度越高,工资越高的这么一个结论。如果你觉得一列表 表格太单调,我们可以做成两列,第一列只放核心解释变量,第二列再把控制变量加进去。如果你觉得还是太单调,我们可以把控制变量逐步添加。最后把结果输入到 word 里面就可以了。接下来是深入 研究,我们根据妇女是否结婚,把样本分成两份来看妇女受教育程度对工资的影响差异。最后是稳健性检验,我们换了一个模型来做得到的和基本结果一致的结论,那么我们这样的结果就是稳健的。 这样我们就快速完成了一篇实证文章。所有的命令我都放在这里了,大家可以收藏下来反复观看,下课点赞加关注,实证不迷路!

各位同学大家好,今天的话我给大家讲一下邹志庄检验,也就是我们经常说的周检验。然后的话第一步的话我们首先要进行一个安装,这个车 rap 车就是周检验的一个简称, 嗯,然后我因为已经安装过了,所以我就把它嗯就不再安装了,你们直接写好这一行之后点一下回车就可以。 下一步的话我们就是要进行一个检验,这个就是我们一个检验的代码,这个太平一二三你都可以自己选择啊,这个的话就是看你要哪一种做检验,然后我们这里如果要不选择的话,就是最普遍的那一种, 就是他包含有交叉项,还包含有这个定龄的虚拟项。然后这个我们可以看一下这一行代码,抽 ray 的话就是我们之前安装过的一个命令,他主要是进行一个 做检验回归的一个代码,然后这里的话写音变量,然后再选择字变量,这里的 dnm 就是我们在哪一年发生那个突变 啊,我们就把看前面有多少行数据,我们这里的大 dnm 后面就写多少,就写数字多少。所检验的话主要是用来检验一种经济结构的突变,比如石油下跌是否对某一种事情造成一种影响,对经济造成影响这样的一种突发性的经济结构的变化, 我们就经常会有周检验。然后如果要是这里的 p 值,这里的时候他如果他的 p 值如果要小于零点零五,就说明他的影响是显著的,那我们就去检验假设。好的,谢谢大家。

stat 做数据分析,连续性变量 森林图 敏感性分析, 挨个检验,学会了吗?