粉丝86获赞361



咱们讲一下初始化,所谓初始化的话就是说对一个变量我们定义的时候会进行初始化,如果说你没有初始化,他默认的话就默认初始化,默认初始化是零初始化,通过这个点那等号复制来进行初始化。 而初始化的话就是我们在结构体啊初始,我们在里面例子中有讲,讲解了他们鸽子的初始化初始化方式。 而初始化这个我们一般的话就是他会通过一个 sc 表达式这个值来进行初始化,而这个 sc 表达值的话一定是一个确定的值,而这个表达式的话可以通过加减乘除函数操作来进行,但是这个一定是一个确定的值。 比如说我们现在这个处的话,定一个变量,是吧?他十二指这个处确定的,然后还是通过一个加法进行确定。另外还可以通过这个通过有个函数函数这个指令结果也是确定的 啊,就是我们通过确定了这进行出示化。要说明一下这个全级变量表的变量一边一般是先出示化,在这个本地变量出示化之前进行出示化。另外的话就是刚才说了数字和结构体的出示化,在定义的时候已经说了这是出示化章节。

哈喽,大家好,今天咱们来说一下 cdr 如何恢复初始状态,恢复初始状态呢,是趋于我们对这个软件做了一些误设置,然后呢不懂得如何给他啊还原,比如说哈,比如说哈这个颜色我们给他选中之后呢,我们误给他删除掉了,比如说在这里呢,直接点击这个 删除颜色哈,可以看,这样呢,他就删除掉了,然后还有这个哈,这个相当于是去除轮廓色或者是填充色,我们选中他之后呢,在这里啊,同样也是给他呃,不小心搞丢了哈,或者是怎样的,然后呢,或者是这个面板被我们误关掉了啊,误关掉之后呢,找不到了,还有这些其他的哈, 那么如何来通过 cdr 的这个恢复处理状态呢?那么也是非常简单的简单介绍一下啊,通过 f 八这个快捷命令,那么在这里呢,是先要把它保存一下哈,保存好之后呢,把这个软件关闭掉,关闭掉之后呢,这个是我们 cdr 的这个 软件哈,然后呢,我们在选中了这个图标啊,也就是这个图标呢,再单击一下之后呢,按住 f 八,然后双击这个软件,然后呢他现在就会提醒哈,提醒呢,是啊,问我们哈,确实要用出厂默认值覆盖当前的工作区吗?我们点击试试哈, 然后呢他这个软件就相当于是恢复了出厂设置啊,也就是覆盖了原先的一个设置,相当于我们这个手机啊,一系列的这个软件恢复原厂一样啊,可以看到他现在就恢复好了啊,可以看就是我们刚安装好软件之后的一个状态, 然后呢我们要对这个软件重新进行一个设置啊,可以看一下单击这个软件,按,按住 f 八,按住 f 八双击这个软件啊,双击这个软件,然后呢就可以对他进行一个啊,恢复为默认值,覆盖原先的一个工作区的一个设置啊,这也是他的一个后台的操作啊。


哈喽,今天给大家讲一讲如何进行一个数据处理,那就我们进行公司金融的数据的时候,比如像这种进行公司金融的数据的时候,我们,呃,这些数据处理是如何进行的? 大家可以看一下这篇管理世界的文章,也可以看到哦,他还有很多,今天我们就给大家讲解一下如何进行数据处理。对,然后我们首先把 c 他打开,点击这里。对, 我们把这个死给它打开,打开完了过后,我们点左上角会会有一个 file, 然后 import, 然后因为它是 excel 数据,所以我们点击 excel 数据,完了过后我们把这个数据找到,因为这数据已经被我下载好了。对,在这里,然后点 open, 然后他会读取,因为数据有点大,然后涉及到控制变量都会。我今晚把三个报表出来的,是平常大家平常用的控制变量全部都搞齐了。对, 然后他正在读取,这电脑可能会有点卡,因为数据要比量太大了,从一一年到二二年的数据,然后应该有二十多个控制变量吧。对,三个报表都被我下下载了。 对,这是三三包,就是指甲附带表,现金流量表和那个表,然后我们三个表都会给他下下下载下来的 啊,所以整个数据会比较庞大。然后本期视频呢?呃,也分三个视频来给大家去逐步去讲解。然后第一个视频主要讲解的是,第一我们如何导入 数据,呃处理数据,然后第二步是我们如何进行剔除。呃,缺失值, st 企业、金融企业。对,这里这都是我们常用的,大家可以看到顶刊,顶刊也是会有这种处理方方式方法的,你看他看这篇文章的话,他就是说,哎,我用呼声 ago 数据,然后二零一一年到二零二二他是用的 八年的数据,然后他是第一剔除金融类房类房地产企业,第二个就是 st 和推迟企业,第三个就是说呃,针对 ipo 的这个和我们因为有些文章他需要,有些文章不需要,所以这不是一个 范式讨论,所以我们基本会处理第一类处于金融企业, st 和呃推市企业,然后呃这个也是看个人吧,我我是比较喜欢是三连冠的,对,三连冠以上的五连冠有点多的,然后剪刀再进行缩微检验。那我们首先第一步就是呃导入数据,大家可以看到 ok, 这个数据已经被我正在导入这里是状态了, ok, 这三包, 呃,这第一个是大家都可以看到,这,这财富代表,第二个就利润表,然后第三个就是 ok, 就其实就很简单,就是现金流量表,那我们首先做第一步, 对,然后第一步的话,哎,我们导出,导出完了过后,然后我们进行这个,首先我们进行公司规模的这个处理,公司规模,公司规模就是用 size 去来表示,大家经常用 size 表示,用 im 资产总计,然后就生成了一个,然后可以看到这有缺失三个数值,然后就生成了一个新的变量, 然后这边上你看为了之后我们方便了,我们可以进行 label, label 我们可以怎么去做呢?因为我们可以把它解锁了,然后直接在这里设置设置为公司规模,如果大家嫌麻烦的话也可以进行代码号,代码号就是 label verbos size, 然后双引号,公司规模。对,然后这第一步,然后第二个就我们常用的资产负债率,然后也是 也是一样的。对,那这里我就直接复制了。然后第三个就企业盈利性,我们通常用 r v 和 r o e, 他就这样去设置就好了,然后都是资资产周转率,然后我们把这个一整个全部,呃, 对,一整个全部类似的这些全部都撤场了,我这里就是直接复制吧,对,是 ato, ok, 我们设置到这里,然后这里可能这里就不需要了,对,这里就不需要了, 然后这里就我们就生成了很多新的变量,看,他们都已经找好,因为十一号他导出来,导出来就是中文的,因为导出来中文的话他会那么大。对,然后我们设置完了过后,啊,哎,对,好,还有 topic q, 哦,这里我们要设设置一个 id 啊,然后是不是有两个变量?看到没有亮红色就是没有,没有 replace, 我们没有设置好。 ok, 然后再补一下就好了,这没关系的。对,然后我们把这个全部都复制一下, 上面是设置了托宾 q, ok, 这所有的变量已经被我们处理好了,都在这里。对, 然后此时,哎,下一步我们进行干嘛?我们进行行业,大家可以看到,哎,这,这有行业,行业代码,但是好,你知道,大家知道的行业代码的话,大家要求的是除制造业以外只保留第一位,就是 a b, c, a, b, d, e 什么这些就只保留前面的英文就好了,数字不要,然后特,制造业它比较特殊,制造业要保留 后面的,就是连后面的这个数字也要保留,所以我们首先要我们也是一样的。呃,去第一个就是,嗯,设置一下这个行业,第一个就是 ok, 设置一下这是行业,然后 因为它专业比较特殊嘛,所以我们用衣服还是衣服?如果这个制造业是,呃,是 c 的话, c 就是制造业,如果这行业是制造业的话,那么我们就保留这个行业代码第一位到第二位,对,然后我们再把这个 label 设置一下就 ok 了,大家可以看到, ok, 有有这么一个行业,对, 设计联盟,对,然后大家可以看到此时的这个,此时的这个看到没有? 这行业已经是,那我们之后可以先对他进行复制化。今天视频就讲解到这,然后下一次视频就进行对大家进行,第一就是 t 除 st 金融企业,第二个就是所谓检验,对。

哈喽大家好,欢迎来到本期数据分析的课堂。最近有不少同学在做回归分析的时候遇到困扰,比如说大家跑逐步回归的时候,每次都是手动添加一个控制变量,这样操作比较繁琐,而且会发现 我们加入的呃控制变量或者是解释变量不同的话,这个核心解释变量他的这个显著性和回归结果会跟着发生变化。其实呢,这种情况在时政研究中是非常常见的,那么不同控制变量的组合呢,可能会影响到核心变量的一个显著性和方向, 手动一遍遍的加入变量可能会比较麻烦,所以这期视频呢,我想和大家分享一下如何用这个循环语句, 就是自动化跑回归模型,实现控制变量的灵活筛选,同时保证我们的一个核心解释变量的显著性,这样不仅可以提高效率,还可以让我们的回归结果更加符合我们的一个研究假设。废话不多说呢,那我们就直接开始。 首先呢,我们以最小二乘八 o l s 回归为例,那么我们跑普通的回归就是 reg x 一, 然后加上一对的控制变量,就放变量名放在后面就可以了,那这样子呢,就是一个完整的一个基准回归的一个结果, red y x 一 二三四,然后控制年份稳健 输出模型 m 一, 然后用 excel 命令把这个 m 一 导出为 o l s 点 r t f。 这个后面就是我们导出的一些格式要求,括号里面是 t 值,保留三位小数,报告 r 方,调整 r 方 f 值, n 值就是大概就是这样子的, 那我们先输入这个命令跑一下,右边是命令,左边就是我的教学数据集个体年份,然后被解释变量 x 一 二三 c 一, c 二, c 三,这样子, 你看,我们先跑了一个回归,输出为 m 一, 用 s 倒出来,并会出现一个 o, l, s 点 r, t, f, 这个就是最简单的一个几种回归的一个结果,那这样这是一种情况,但是呢,当我们要跑逐步回归的话,那么很多同学会这样子,一遍遍的输入好几个回归,然后用 s, f, m 一 二三四这样一点点导出,实际上呢,我们用逐步回归可以一次性导出。 那么接下来呢,我们就讲这个逐步回归的这个循环命令。首先 logo control 这个入手化我们的一个控制变量,定义一个本地的红变量 control, 这是第一步。接下来呢,再 先定义完这个这个控制变量之后,我们再来跑这个循环语句,循环语句第一个 v of v, i n s x 一 二三,也就是说循环一四处理 x 一 二三四五六七, 这个 local control 就是 把我们的控制变量 v 加到 control 这个红里面,这个 v 加到这个 control 的 红里面, 这里呢就是我们的一个回归命令 red y, 然后这个 control control 呢,就是这里的 x 一 二三四五六七,然后控制年份文件,这个就是最小二乘法的一个命令,然后再用 alter 把它们的命令导出在一起,这里用的是 app 的 这个命令,就说明是纵向的追加结果,把逐步回归的每一个结果都报告在一个 o, r, s 的 r, t, f 里面去, 这样就是一个完整的一个循环语句。那大家在用的时候呢?呃,只需要改变这里的解释变量,就是一系列解释变量和控制变量的变量名,以及这里的命令,如果你是最后二乘法,你就是这样子的,然后这里放入 y, 然后控制年份文件。 大家跑的时候,这个都是要在一起跑的,我们可以跑一下,看一下结果, 然后我们点开这个 rtf, 你 看这个 rtf 点开了,因为控制变量比较多的话,它就会比较大,我们需要在布局这里把呃指向方向变为横向的就好了。 看这里,首先这里是 x 一 对外,然后 x 一 x 二对外, x 一 二, x 一 二三对外,对吧?我们很多时候呢,看到文献里面跑逐步回归,就是为了验证这个我们的核心解成分。 x 一 在加入不同的控制变量的情况下, 他对外都是一个正向显著影响,这个正向显著的影响是非常稳健的,那我们如果是这样比较一致的,这样的一个逐步回归的结果就比较好,就适合报告在论文里面。 这里呢就是我们的一个控制年份的一个结果,这个结果我们可以直接删除就可以了。然后这个是长竖向, 这个是观测值, r 方调整 r 方 f 值, n 值观测值,对吧?这样子呢,就是一个文献常见的一个象限表格的形式,实际上这个控制年份的这个结果我们是可以直接删除就可以了, 删除这样这样大概文件的常见格式大概就是这样子的,这里呢,我们有的时候会看到它在这里会加一个呃年份,这里是控制吧,或者是呃 yes 这样子的一个表现形式。 如果说我们所有的变量名取的都是,呃,都是这样子,中文的英文的名字,那这里我们就是 year, yes, yes, 如果是中文,这里变量名都是用中文格式的表达,我们就是用中文的年份,然后控制控制,这样子统一会比较好看一些,大概就是这样子的, 那么这个呢?是最小二乘法 o l s 的 逐步回归。那如果我们是面板数据,像像这个一样,面板数据固定效应的话,其实整体上还是一样的, 我们可以对比一下,那固定效应呢?我们就是跑这样的命令, xreg y x 一 二三四,然后控制年份 f e, 对 吧? 然后 e s 缩入 f e, 再用 sm 命令把它导出为 f e, 导出为 f 一 点 r t f, 对 吧?这个大家应该都是有一些基础会的,那这里的循环语句其实跟上面是一模一样的。 首先也是先定义一个本地的红变量,然后这个 y, n s, x c, r 三四五六七也是一样的, 这里一样,只是变了这里,这里的一个命令,我们前面的命令是 rag y, 然后 ctrl, 这里就变成了 x t rag y, 然后 f 一。 因为我们要跑 fix effect 固定效应模型,所以我们换成自己的数据的时候,我们只需要变这里的变量名,然后 这里的被解释变量换一下其他的就是不用变其他的。如果是跑固定效应,就是这样子的形式,如果跑 o l s, 就是 这样的形式。如果说要跑其他的回归命令的话,我们只需要把这里的命令改变一下就可以了,其他的基本上都是比较一致的。 然后这个是导出命令,我们可以跑一下这个固定效应的循环语句。 跑完之后这里会出现 f 一 点 r t f, 我 们点开一下, 呃,也是一样的,把布局改为横向的, 嗯,可以看到这里也是先是 x 一 对外, x 一 x 二对外,然后 x 一 二三对外,这样依次 依次加入,我们可以看到在加入不同的控制变量情况下, x 一 对外都是一个负向,显著影响也是非常稳健的。但是在 x 五六这里有一颗星,可能结果说没有那么好,那肯定都这样,两颗星是最好的,对吧? 都这样,两颗星或者是几以上,那么这样的结果肯定是最好的。然后这里面就是控制年份的一个结果,我们可以删除, 然后后面的这个是参数项,然后这些我就不介绍了。然后这里呢,我们我们也经常会在这里加入一列,加入,加入一列,但是因为我们是面板数据,我们跑的是固定效应,所以他肯肯定控制了个体,同时呢他也控制了一个年份, 我们会这样个体年份,然后控制或者是用中文的 yes 都可以的,这也可以变成 a province ear, 对 吧?都可以的,按照自己的表现一个形式,就这样子的格式,这个就是面板数据的固定效应模型的一个循环语句。 那么这篇这个视频对应的这个 do 命令,大家可以直接拿到这样的 state 的 一个度命令。 那么接下来呢,就到我们本期教学的一个重点,就是筛选控制变量,保持我们的核心变量 x 一 显著且控制变量最大化的一个组合。首先呢我们定义控制变量,假设在我的数据集中,我的控制变量是 c 一 到 c 八, 我想研究的重点是 x 对 x 一 对外的一个影响,我是面板数据,所以是固定效应。然后呢,清空我们的控制变量列表,逐步添加我们的控制变量,保证我们的 x 对 y 是 一个显著影响的。 那在这个循环语句里面,最重要的就是这里一个回归命令,就是逐步添加当前的一个控制变量来跑,回归 检验我们 text, x e 就是 检验我们变量 x c 的 显著性,检查我们的 p 值是否小于零点零五,这里用了个 e f 语句, p 就 代表 p 值, r p r p 小 于零点零五才是显著的。如果说显著,我们就是保留当前控制变量, 就是 variable skipped, 对 吧?保持 typed, 然后最后来输出当前保留的一个控制变量,就是保留哪些控制变量可以保证我们的 x e 对 y 是 一个显著影响的, 这就是这个循环命令的一个作用。那如果换成我们自己的数据,我们只需要改变这里的一个控制变量的变量名,换成你自己的,然后 y 和 x e 也变成你自己的,对应的这个循环语句里面也调整一下就 ok 了,其他的其实都不用变。 那么后期呢,我也会将我这个这一期代码放入我的公众号里面,大家可以去呃学习 这个这样子一起它就是一套来跑的,其实我们点这里也可以,点这里也可以跑,但是呢,我习惯性把它复制在这个命令窗口里面,让大家 看的更加清楚我跑的是哪些模型,就是哪些命令是在一起跑的,方便大家进行一个学习吧。 首先定义这个控制变量列表,然后我们的重点是要检查 x 一 的一个显著性,如果它的 p 值小于零点零五,我们就保留当前的控制变量,这就是这个循环语句最重要的部分。然后输出最终的模型,我们可以跑一下,看它最后输出的是哪个结果。 我们看到它前面,我们不用看这些,这些都不用看,我们只需要看它最终输出的一个控制变量。 保留的控制变量是 c 一 到 c 八, c 一 到 c 八都保留下来, x 一 对外是一个非常显著的影响,那这样的结果无疑是最好的,就是所有的控制变量都被保留了, x 一 对外仍然是一个显著影响,那这样的结果就是很好的,那这是一种循环命令的一个用法。 那么接下来来讲第二种情况,就是我们也是筛选,筛选显著的控制变量组合,且保证我们核心解释变量。这里我假设我的是 x 一, 且是显著的,且是正向的,这里比上面一个要求又多了,加了一个是正向的,对吧? 那命令呢?前面这些都一样定义控制变量的初设模型,对吧?这些都是一致的,变化的,就是这里的循环,这里的循环命令里面 同样是这一 y x 一 对外的一个固定效应模型,然后检验 x 一 的显著性,空一个。 首先呢,获取 x 一 的 p 值,那么比上面多了一步,就是我们同时要获取 x 一 的回归系数,因为我们上一步只要求了 x 一 显著的控制变量最大化的组合在这里呢,我们又进一步要求 x 一 显著的控制变量最大化的,所以这里必须要获取 x 的 回归系数。 if, 它的 if 语句里面首先是 p 值必须小于零点零五是显著的,且它的 b 也就是回归系数要大于零,因为是正向显著的,那这两个要求同时满足,如果系数同时满足,则保留该控制变量, 最后输出显著的正向控制变量一个组合,这样这样子的一个双向固定效应模型,那我们如果要跑的话,我们也只需要全部复制下来,然后跑到这个迷你窗口里面看一下结果, 呃,可以看到它最后输出的一个保证。我们 x 一 对外是正向显著影响的控制变量组合是 c 三和 c 五的时候, x 一, 呃,可以看到,我们要求的明明就是要求的是 c 三 c 五要求正向显著,但是他最后跑出来,他不是正向显著。我们可以看到,在我们跑这个回归的时候,我们跑的是固定效应模型,我这里是没有加 i 点 e 年份的,对吧? 但是呢,我在这里最终模型的时候我加入了,但是如果我们不加入,我们可以看一下他这里最终显示的控制变量组合是 c 三和 c 五,那我们这里就应该是 c 三,然后 c 五。然后呢,我跑循环的时候没有加 i 点 e, 我 就应该把 i 点 e 去掉, 你可以看到去掉控制年份的 c 三和 c 五对,呃,加 c 三和 c 五, x 一 对外是一个正向显著的,它是满足我们这里的呃循环命令的要求的。 那为什么到这里显示的不同,是因为我在这里跑回归的时候,筛选控制边的时候,这里没有加 i 点 i 点 e, 所以呢,这里输出加入 i 点 e 跟上面是不匹配的,那这样子才是一个完整匹配的。如果呢,我们要跑双向固定效应模型,我们就应该是在这里加上 i 点 e, 对 吧?那么在这里的回归命令里面也应该是加个 i 点 e, 那 么这样子的才是又是完整的一套的,对吧? 所以呢,看到我们刚刚跑出来的结果 a 和我们筛选的不一样,所以说大家在修改我们这个命令的时候,就根据自己的需要,根据自己的需要前后匹配的,然后认真的改好,就是要核对好。 那接下来我们再跑一下一个双向固定效应模型,就是控制的年份之后, x 对 y 是 否可以达到一个真相显著的一个结果,我们可以跑一下,我们仍然是一起复制跑, 我们可以看到它最终呃输出的正向 模型,可以看到我们它显示呃最终输出的正向控制变量,这里是没有的,也就是说明要控制的年份之后, x 对 y 只能是负向显著影响,它没法做到一个正向显著影响, 代表我们目前的这样的一个数据集里面是做不到保证 x 一 对外正向显著的一个控制变量组合,那就说明不论是统计学上,我不就是从这个数据学角,数据角度来看, x x 一 对外就是一个负向显著影响的, 如果说你要想它正向显著,你只能跑这个不控制年份的里面加 c 一 和 c 三就是我们前面跑的这样的一个循环命令,前面一个命令得到的一个结果, 嗯?在哪里? 就说控制了年份之后, x 对 x c 对 外只能是负向显著影响,做不到正向显著。如果我们要求是要要求正向显著的,我们就可能需要把这个年份的因素去掉, 我们把这里 i 点 year 去掉,这里也要,这里也要去掉,让我们跑 这里。正向控制变量是 c 三 c 五加入 c 三 c 五 x 一 对外是正向显著的,但是这里就是没有控制年份的,一般情况下肯定是我们控制的因素越多,对吧?年份效应也控制住,那么 x 一 对外的一个显著的结果才更加客观,肯定是更好的。 所以说筛选这个显著性,我们也只能根据呃数据的客观情况来合理的调,我们没法说逆天改命,对吧?那没法逆天改命,这个大家要理解一下, 那么最常用的我们就是这两种。第一种,保证核心解释,核心解释变量 x 一 显著且控制变量最大化组合,这个是保证 x 一 显著且方向是正向的这样的一个控制变量的组合,但有的时候它并不一定 就是他,并不一定完全会有。但是呢,你可以通过这个呃循环命令去初步判断我们的一个数据情况,我觉得也是很不错的。那接下来呢,这里我是给大家写了一个模板,是为了保证多个解释变量显著。 这里呢,我们把 y 定义为 y x 一 x 二,我要关,我要关注的就是 x 一 和 x 二。比如说我们有两个解释变量, x x 二都显著的话,我们就是需要这里检验 x 一 的显著性,检验 x 二, 如果它两个都显著, a 就是 p 值都小于零点零五,我们就把这样的控制变量保呃保留下来,然后形成最终的一个回归命令。那在这个回归里面,我跑的也是一个双向功率小模型控制的年份呢?大家可以看到这里一定要一致。 那大家在换成 g 的 数据的时候,只要把这里的 y 换成你的 y, 比如说你的 y 是 什么?嗯,大家都验,比如说你的 y 是 esg, 你 的 x 一 是什么?嗯 嗯, gdp, 对 吧?然后这里的控制变量也都换成你的变量名就可以了,那这个里面的命令就是不用变的,它就可以自动给你筛选出多个解释变量, x, x r 都显出的一个控制变量组合,就这样子大家只需要改成自己的变量名就可以了, 那在我的里面我的 y 就是 y, 然后我的 x 一 就是 x 一, 这里 x 二,那我可以给大家跑一下看一下,看看保证 x 一 和 x 二同时显著的控制变量的组合是怎么样的一个情况。 那它最后保留的控制变量是 c 一, 一二三四五七,对吧? 所以它最后跑出来的这样的一个双向固定效应是一二三四五七,跑出来, x 一 对 x 一, x 二对 y 都是一个,这里的 p 值都是显著的,对吧?都是显著影响的, x 一 是负向显著, x 二是正向显著的。 那么这样的一个回归结果呢?从我们统计角度来看就是非常好的,对吧?控它的两个核心解释变量, x c、 x r 都显著,然后控制变量也大部分显著,所以这样的结果也是很不错的,且控制的年份,对吧? 大家在利用这个循环命令的时候呢,都只需要改变成自己的变量名就能跑出来了,嗯,这里就是给大家做了一个模板, 这里假设我们的被解释变量,然后核心解释变量一,核心解释变量二,这里放我们的控制变量一系列的控制变量 c 一, c 二, c 三,定义完了之后,这些都是不用变的。那这个命令它我在这里都标注了, 若都显著且系数为正,也就是 x x 二都显著,且是正向显著,则保留。如果呢,我们想要它负项显著,我们就把这里的 b 就是这个 x 的 系数 b 改为小于零,它就是一个负项显著,或者 x 二改为小于零,那它也是一个负项显著。大家根据自己的需要,只需要动这里的细节部分就可以了,那其他的都不用变。这样的就是一个大家可能呃可能用到的一个模板, 只要改变这里的被解释变量核心解释变量的一些变量名就可以用了, 就是还挺方便的。以上呢,就是本期关于我们 cata 自动化 呃逐步回归和控制变量筛选的一个呃全部的内容,但是我需要提醒大家的是,嗯,虽然这些方法可以提高回归分析的一个效率,帮助我们快速筛选变量组合。 具体的模型设定呢和变量选择还是要结合我们实际的研究背景和理论基础,不能完全依赖这个自动化筛选的结果。 本时期,那么本期视频的代码和方法仅供大家参考和学习,实际应用的时候,请务必结合自己的领域知识、数据特点以及我们的研究目的,科学合理的进行模型设定和变量解释,对应的这个教学的这个数据集和这个 命令,呃,我都会放在我的公众号小飞 stata 里面,希望大家在实证分析中既能提升效率,也能保证一个严谨的科学态度。特别感谢大家的支持,那我们下期视频再见。

粉丝投稿面试备问,建立一个元素数量为十八的 hashmap, 应该出示值设置为多少?问这道题,面试官不仅想知道你背过的原理,还想知道你能否根据实际场景计算出最优的出示值,这是从理论到实践的考察, 下面我们一起来详细看看吧。哈喽,大家好,我是专注加把干货分享的灰灰。前几天我一个粉丝去某团面试,而在伊面的时候,他遇到了一个问题,他没有回答好,导致面试失败了。那么今天我给大家分享一下这道题。为了帮大家更系统性的准备面试,我整理了包括各阶段的面试题, 加把面试突击学习路线,以及精选的简历模板。需要的小伙伴五官六六六,我发你这道题是一个元素,如果为十八的哈斯麦普,初试值会是多少?也就是我在去又一个哈斯麦普的时候,如果我指定它的容量为十八,那么它的容量到底有多少? 我们都知道,哈斯麦普作为一个容器,为了防止内存浪费,我们一定会去设置一个容量,就算在使用的时候我们不去设置,默认也是十六。那么如果我去指定了容量,它的初试值会是多少呢? 我们可以从它的源码里面得到答案。我们看哈希 map, 它有一个构造方法,它可以传入一个初使的容量值,假如传的是十八,最终它会通过 type set four, 然后得到我的这个容量的大小。我们关键的源码在 type set four, 我 们把源码考过来,然后来看一下它会最终得到一个什么结果。 假如我传的是十八,那么这个时候十八减一,也就是十七,好,十七去往右边移动一位,再跟 n 一, 或,那么牵扯到未运算,那么我们把它转化为二乘值,十七的二乘值,也就是零零零幺零零 幺,好,再往右边移动一位,那么得到的结果是零零零零幺零零,好,这个是其实就是 n 往右边移动一位的值, 然后再与 n 进行,或等于就是我去跟他进行货运算,然后再复制给 n, 跟他货运算以后得到结果。我们发现有一个为一,就是一得到结果就是零零零幺幺零零幺, 那么这个是第二步得到的一个 n 的 值好, n 的 值以后再往右边移动两位,再跟 n 获得移动两位的结果是零零零零零幺幺零,好,再跟它获零零零幺幺幺幺幺,那么这个是我们得到的 m, 再往右边移动四位,那么移动四位。零零零 零零零零幺,这是往右边移动的四位,再跟它获得 m, 那 么同样的还是零零零幺幺幺幺幺幺,这个时候你看没变, 再往右边移动八位,移动八位的结果是多少?零零零零零零零,再跟它获得同样的,得到的结果还是零零零 幺幺,同理,往右边移十六位,因为它还是零,所以得到结果还是跟原来值是一样的。这里 n 小 于零是一,所以就算你传一个小于零的值,它默认也不会是一, 这里是大于零。为什么?因为这个转化为时间值是三十一啊,所以他会加一,得到结果是三十二,那么我们得到一个结果,你传入的值虽然是十八,但是他的初时值会是三十二,那么这个结论就是不管你传什么值, 只要你不是小于零的,那么我得到的一个容量都是你传进去值向上最接近二的密,假如你传十八,那么向上最接近二的密是二的五次方,也就是三十二。 如果你传的是十二,就是默认是十六,传的是十六,默认还是十六,那么这样设计的目的在于确保我的容量都是二的命,保证在计算下边的时候的性能以及可以去降低我的哈希冲突,并且保证在添加数据的时候不会超过宿主的长度。