灵活的把题目中给的这个数据带入到我们对应的公式中去,求解我们的 y 与 x 的 限行回归方程,并且如何根据我们的限行回归方程进行预测这样一类题目。 首先呢,我们看这道题目,他说的是我们二五年的全能新能源在盛新台阶,全国全口径发口径的发电量占全球总发电量的百分之三十点四,稳居世界第一。 他说为了为了为智能算力的爆发性电力需求提供稳定的保障,某些小组收集二零零二一年到二零二五年我国的全口径发电量相关数据,根据数据制作了如下的表格和散点图,他做了一个表格,对吧?年份代码和他的发电量,并且做了一个散点图, 他从图中他近似的认为我们的这个服从一个什么宪性回归来拟合,让我们请用宪性相关系数加以说明, 也就是我们算它,看它 r 到底是多少,它的 r 绝绝对值越接近一的时候了,我们知道它肯定相关程度越强,所以你要算 r 的 时候,我们需要把 r 的 公式呢跟它每项带进去。题目中给了我们一些具体的数据,这样我们直接可以把这个数据带入到 r 的 这个关系,说关系中是不是就可以了?比如说我们知道了有体可知, 我们的 i 平均,可以算出来 i 平均等于个三,那我们的 r 等于多少? r 等于 c 个码 i 从一到 n, 然后嘞 x, i 减去 x 平均乘一个 y, i 减去。 y 平均比上一个 c 个码 i 从一到 n, x, i 减去一个 x 平均的平方,再给它乘以一个 c 个 i 从一到 n, y i 减去 y i 平均的平方,这是它的公式。这样的话呢,你发现我们要算它的分子和分母,分母里面 y i 减 y 平方给了,我们就要算它,它要算它的分子,分子的话来它没有给,所以我们在这把所要算的这个数据给它算出来就行了。那就是说 sigma i 从一到五, 然后嘞 x i 减去 x 平均的平方,我们是不是可以给他算?因为每个数据是不是都给他了?那就是说一减三的平方加上二减三的平方,加上三减三的平方,再加上这个四减三的平方加五减三的平方,那这个算出来呢?我们等于个十, 再算它的这个分分子。第一个嘛,第一个要算的我们已经算结束了。第二个要算的,那我们也去算一下 c 码 i 从一到五, x i 减去 x 平均,乘以一个 y i 减去 y 平均,那这个人家没给,我们需要去算,所以呢我们就会得到 把这个式子给它是不是展开,因为题目中给了我们 c 码从一到五 x i y i, 所以 这个展开大家一定要会化解。它就等于个 c 码 i 从一到五 y i, 然后嘞再减去五倍的 s 平均,乘一个 y 平均, y 平均给了九点五,所以呢我们直接往进带,那就是幺七四点八六,减去一个五乘以 y 平均三, y 平均九点五。看我们就可以把这个东西算出来,是一个五点三六,所以我们可以带入到 r 的 公式中,我们 r 的 公式带进去,它就等于五点三六比上一个根号下 十乘以二点九,那就等于根号二十九,这就是五点三六,比上一个五点三九,也就是说我们约等于一个零点九九,我们算出来这个 r 呢,你发现这个 r 很 大,对吧?我们就说啊,因为 y 与 x 的 相位系数近似的为零点九九, 所以呢,它 y 与 x 的 限性相关程度相当之高,对吧? y 与 x 限性相关程度很高, 从而可以用宪性回归逆核就可以了。这个呢,就是我们的第二问,他说建立 y 关于 x 的 经验回归方程,并预测二零二六年我国全口径的发电量是多少。那这个是要算 b 尖,发现 b 尖的公式这边人家还给出来了,所以我们直接算他的 b 尖就行了。 b 二 b 冒的公式,我们把它带进去,就等于一个 c 码 i 从一到 n x i y i 减去一个 n 倍的 x 平均。 y 平均,我们直接用化简后的公式就可以了。 c 码 i 从一到 n x, i 的 平方减去一个 x 平均, n 倍的 x 平均的平方就可以了。你发现这两个数据我们刚刚是不是已经都算出来,对吧?那就是五点三六,比上一个十等于零点五三六。我们的 a 帽要把我们的样本中心是 x 平均的 y 平均,样本中心 y 平均就是我们的三斗九点五,它带进去数把 a 帽算出来, 那么那 a 帽就等于一个 y 平均,减去一个 b 帽乘以 x 平均卷半径,那就是九点五减去零点 五三六,零点五三六,再乘以一个 i 平均是三,这样的话呢,我们算出来它等于个七点八九二, 所以呢, y 关于 x 的 回归方程是不是就可以算出来了? y 关于 x 回归方程呢? y 加等于一个零点五三六倍的 x 加上一个七点八九二。此时我们说要算二零二零年二零二六年我国全口径发电量,只需要把 x 等于六带进去,说当 x 等于六十, 我们的 y 加等于一个零点五三六,乘以一个六,再加上一个七点八九二了,把它带进去会得到十一点一零八,它单位万亿千瓦时,是不是这样我们就可以得到我们预测的 全口径发电量了?所以我们说预测二零二六年全国全口径发电量为十一点一零八万亿 千万是 ok。 那 么这道题目就到这里,有问题的同学再来及时跟老师沟通。
粉丝6363获赞3.8万


高考救命课第十六期,限性回归方程,这类题型出题套路非常的固定,没有复杂的难点,接下来咱们就先去把求限性回归方程的完整步骤梳理一遍。第一步,先求 x 八 y 八,求 x 八 y 八这两组平均数。第二步,计算 b 帽,那一般 b 帽的这个公式会给大家的,所以我们就是套这个公式,一步一步做就可以了。第三步,算 a 帽,它就等于 y 八,减去 b 帽 x 八,将 b 帽 a 帽带入到 y 帽,等于 b 帽 x 加上 a 帽中,就可以求得线圈回归方程,那它的口诀就是一算平均数,二算 b 帽,三算 a 帽, 四代入写方程。好,这就是他的口诀,那只要记牢这个做题的顺序,直接往里代数,轻松就能拿满这个分数啊。接下来咱们一起来看一道高考真题的改编例题,带着大家完整的实操一遍来看。这道题的第一问就是求限性回归方程, 所以我们严格的去按照我们的四步走就可以了。第一步,求出 x 八外八就是 x 八,就等于一加二加三加四加五,然后再除以三看外八,就等于五点八,加上 五点二,加上四点五,加上三点七,加上二点八,然后再除以五,算出来结果是四点四。看第二步,求 b 冒,那这个 b 冒的公式题目中已经告诉了它是有两个公式的,那我们现在去选择第一个公式啊,那第一个公式看起来还是相对比较复杂的,所以我们可以把它去拆成零部件去算啊,咱们可以把它拆成这样的四个零部件, 一个、两个,三个、四个。先来看第一个零部件,那就是四个码, a 等于一,那这个 n 就是 五,因为有五组数,那 x a、 y、 n, 那 这个符号它是一个求和符号啊,它拆开的意思就是 x 一 y 一 加上 x 二, y 二 加上 x 三, y 三加上 x 四, y 四加上 x 五, y 五,代入数值之后,我们就可以算出来是五十八点五。那第二个零部件,那就是 n x 八, y 就 等于五乘以三,再乘以 四点四,算出来是六十六。第三个零部件, i 等于一五, x i 的 平方还是一样的,用求和符号给它拆开,就是 x 一 的平方加上 x 三的平方,加上 x 四的平方,再加上 x 五的平方,结果是五十五。第四个零部件,也就是 n x 八的平方,也就等于五乘以三的平方,最后是四十五。好,那所有的零部件都出来,最后把它组装一下,那所以那 b 帽是不是就等于五十八点五减去六十六,比上五十五减去四十五,算出来结果是负的 零点七五。接下来看第三步,求 a 帽,那 a 帽是不是等于 y 八减去 b 帽,也算出来是负的零点七五 减负的,那就这块加上零点七五乘以三,算出来就是六点六五。第四步,是不是把 a 帽 b 帽带入到回归方程之中去,也就是 y 帽就等于 b 帽, x 加上 a 帽带入进去就是负的零点七五, x 再加上六点六五。好,这就是第一问的现行回归方程。看第二问,预测该路口二零二五年不礼让行人的车辆数, 那要求车辆数是不是也就是求的是 y 貌,那要求 y 貌,我们是不是得知道 x 呀?那看题目, x 是 不是指的就是执行时间为 二零一八年后的 d x 年,那从二零一八年到二零一年是不是刚好经过了七年?所以的话呢?那么也此时 x 是 不是就是七,那也就是到二零二五年该方案执行七年,那所以是不是 y 貌就等于 负的零点七五乘以七,再加上六点六五就等于一点四,单位是百量啊。好,这就是这道题啊!那我们掌握好这套固定的解析步骤以后,遇到这个限性回归方程直接去套用就可以了。最后请同学们来查收一下本期作业和下期预告。

之前全部都是限性回归方程的问题,就是你最后拟合出来是一条直线,那有的时候呢,我们也会再深入一点考察非限性回归。 比如有的时候,我这个散点图,你一画完,它明显是个曲线,比如说这像是一个,呃,像是一个对数函数,这边一画呢,像是一个指数函数。那我在这种非限性的啊,曲线的这种回归之下,找到它对应这个参数 a 和 b, 就 叫非限性回归分析怎么做? 仿照着我们刚才讲的限行回归一样的做法, for example。 现在这么多点啊,都是一致的。我让你找到这条,呃,像对数函数的这个曲线的 a 和 b 是 多少? 你会什么?我只会直线的最小二乘法,对吧?那这个曲线能不能变成直线? of course。 你 看啊,如果我把这个 long x, 呃,我换个圆,我设它等于 t, 你 现在告诉我 y 和 t 是 啥关系?是不是多少 t 加多少,这不就变成一条直线了吗? 那在图上怎么体现这个换元的过程?现在每一个点它的横坐标都是 x, 我 画到图里面,这是 x 轴,现在每一个点的横坐标我带进去,把 long x 这个新的值算完,作为 t 这个新变量的值, 再把新的点在 y t 这个新的平面直角坐标系之下,把这些点全都重新画一下,你会发现它就在一条直线上了。 比如啊,举个例子,其中有一个点,呃,原来是六八,如果把横坐标六带进去, t 的 值就是 line 六,然后重新一划,这个点的坐标就变成 line 六。逗号八这一句话。非限性回归分析怎么做?你换元变成限性回归的做就好了。 举个例子啊,二零一五年新课标一卷考的是非限性回归方程,为了确定下一年度我这个宣传费要给多少钱,我要了解一下宣传费用和我的销售量之间的一个哈,还有年利润 z 之间的一个影响哦,妈耶,三个变量,那先研究谁呢?我先研究近八年宣传费 和销售量的关系,是一共有八个数据做了初步处理。啊,现在发现这个图呢,长这样儿,明显它不是一条曲线呀, 任贤是谁呢?第一问,根据散点读判断,你用直线来拟合它还是用曲线啊?这个根号 x, 根号 x, 这个图像是不是正好长这样的?感觉跟这趋势非常非常像,对吧?问题,哪一个更适合做我的回归方程类型啊?傻子都知道这个更合适, 我接下来就用这个进行非限性回归分析。然后第二问问啊,你根据你刚才那判断结果,还有表中的数据,表中数据是不是啥东西都帮我算好了呀?让我建立起来 y 和 x 的 回归方程,也就是把这里面的 c 和 d 给我算出来。第一步,先换元,谁烦人根号烦人,根号 x, 我 不会,我把它换掉啊,比如说我换个字母啊,我设成什么呢?设成 人帮你设好了,不用自己设,设成 w, 所以 现在 y 等于 d, w 加 c, 那 我估计的话, y 要加尖, d 要加尖, c 要加尖。好,那我代公式,公式在这那这公式里面。哎呀,怎么是哎,跟我以前学的不一样呢,这怎么是 u v 然后阿尔法贝塔呢? 啊,这字母随便换,人家给的是一个赋表,对于一组 u v 以 u 为横坐标, v 为纵坐标的,然后 arab beta 为参数的这样一个最小二乘积。这里面的 beta 也就是我的斜率啊,斜率也就是这个 d, 对 吧? d 等于 横坐标减横坐标,纵坐标减纵坐标。那这里面应该是横坐标是 w 求和上下的。我懒得写了啊。 w i 减 w 均值, y i 减 y 均值, 下面再求和,下面求和是 u 减 u, 也就是呃,横坐标相减。那在这里面的我横坐标取的是 w, 所以 说白了,你需要把人家给你那个呃公式不一样的字母,你换成你能看得懂的这表里面有的字母, w i 减 w 平均值整体平方,它等于来代数吧。 w w y y 谁呀?是不是这个?这数是一零八点八,下面 w 减 w 平方在这呢, 一点六算完之后六十八,那 d 间有了, c 间怎么求啊?呃,这一条直线一定经过的是横纵坐标均值,横坐标是 w 八,纵坐标是 y 八,没有任何原始数据,人家已经帮你算好了, 经过的是六点八,逗号五百六十三,所以这个 c 间等于 y 减 d。 w, y 是 五百六十三减 d, 刚才是六十八,乘以六点八算完是个小数啊,一百点六。 所以在第一件 c 件让我算完的情况下,我这方程不就有了吗?我再把刚才换完圆的这个 w 给它剔掉,得到 y 等于一百点六,加上六十八根号 x。 哦,因为这是你求完的一个回归方程,它是一个估记出来的一个值,所以最后别忘了那个 y 上面要有尖。接下来第三问,刚才研究了 x 和 y 的 关系,现在呢?加上这个 z 了,未知 z y x 的 关系式是这个,这里个式子里面既有 y, 又有 x, 又有 z。 根据刚才的结果回答以下问题。第一小问, x 取四十九的时候, 年销售量和年利润的预报值是多少?销售量是 y, 年利润是 z, 这就已知 x 求 y 呗。你把 x 四十九带进去,根号 x 九不是七嘛。所以这一带成七一算 y 有 了,算五百七十六点六啊。 y 有, 再带进去, z 不 就有了吗? z 是 六十六点三二,然后问宣传费是多少的时候,年利润 z 能取得最大值。我,我就把 z 的 表达式先算出来啊。 y x 有 关系的, y 有 这样的关系,所以我把这个 y 换成 x 就 好了。变成单变量那个函数 z 等于 零点二,乘以零点二就五五分之一,对吧?所以它除以五六十八,除以五是十三点六,这个除以五应该是二十点一二,最后别忘了再减去一个 x, 所以 最后变成一个有关 x 的 什么方程呢?这刚才括号圆,如果是 w 的 话,那这个就是 w 方,应该是有关 w 方的 二次方程,负 w 方加一十三点六, w 加后面这个数,开口向下的二次函数取最大值。对称轴 w 应该取的是负二,它分之它 令 w 等于它除以二,也就是六点八的时候, z 的 估计值是达到最大的。那为什么呢?问 x 是 多少?你刚才求完的是 w, w 和 x 的 关系在这呢, x 得对 w 平方啊,所以它的平方得算一下,此时 x 是 六点八方四十六点二四, 这就是非限性回归问题。不难吧,换个圆不就得了吗?反正你想方设法的把它变成一次函数就好了。 那这道题的非限性方程里面,它是根号啊,那有的时候呢,如果出现对数,出现指数,你都得会。这俩例子,我给大家举一下,这俩你会了,别的你全都会了。 如果考试说啊,你 x y 俩变量满足的是这个,这是一个 m 函数的一个方程,让你进行非限性回归方程分析。你怎么把它变成一次函数啊?非常简单啊,你看两边,因为 b 呢,脑袋上有东西。我最讨厌脑袋上有东西,所以怎么办呢?两边取对数, line y 等于 line ax 的 b 密, 那真数相乘,它等于 line a 加上 line x 的 bc 啊。 b 脑袋上有东西,我下的公式等于 b 倍的 line x。 依次函数出现了,你把它看成一个整体,这个也看成一个整体,这我设成 u, 这我设成 v, 那 么两个变量 u 等于 b 位的 v, 再加 line a, 就变成一次函数,不能做了吧。所以第一步取对数很关键啊,你得会那密函数都会了,哎,指数函数,你会不会? x 跑上面去了,怎么办呢?怎么让它下来呀?我还是取对数啊,一样的,变成 let a 加 let e b x, 这谁呀?下的公式,它是 b x, let e 就是 e, 所以 就是加 b x 又变成你会的题了,设它为 u, 这是一个新变量 x 我 不用动,对吧? b 我 也不用动,你把它呃,整体看成一个参数 u 等于 b x 加朗 a, 你 这样去省,那严格来说,音变量要加上小尖,不知道这个参数也要加上小尖。 举一道题目作为大家今天的作业,二零二五年湖北期末,我们来一起读读题啊,给大家提示一下,中华文化博大精深。口感和茶叶和水的温度有关,我们获得了水的温度和时间的回公率。那肯定是随着时间的推移,温度越来越低了, 你得符合热力学定律啊,对吧?然后我一看,哎呦,这看着呀,像一条曲线。所以第一问问这个直线还是曲线,哪一个更适合作为的回回方程?选错的可以自杀了啊。选第二个,那根据,呃,表中数据,我要找到回回方程的话,找到这里面的 c 和 d 是 多少?哎呦妈呀,我得想办法 把它变成一个一次函数啊,是不是啊?这怎么变?有同学觉得自己好聪明,他觉得把这个看成一个整体,设它为一个变量,比如说设为 v, 那 么 y 等于多少? v 加二十五哈,他就算出来了,这对吗? 大哥,你在换元的过程当中, u, x 变成 v, y 变成 u 的 过程当中,你这个等式里面不能有别的变量啊, 你就是老变量和新变量的关系,你不能有别的你再不知道的数了。刚才这题也是,你把根号 x 换成 w 的 过程当中, x 是 老变量, w 是 新变量。建立完这个等式里面有别的数没?没有别的新的你不知道的数,但是你要这么建立起来关系,你说 v 等于 c 的 x 四米,好,我问你, x 是 几啊?你知道 x 是 几不?我即便每一个点的 x 坐标你知道,因为你 c 不知道,所以心变量 v 的 值你照样不知道,所以这么换元一点用没有。 那该怎么换呢?这是什么?这是指数函数,指数函数,我们一定要两边取对数,但你现在直接取对数,这边 line, y, 这边 line 里面取成这样 做不了,怎么做能做?人家其实给你提示了啊,但是如果人家没有给你提示,你也得给我想的到,就你想把 x 下头的话,你一定这个地方要取 line 的, 所以二十五没有用,移到左边去就好了。你要把 y 构造出来一个 y 减二十五,那这里面是不是有 y 减二十五提示你了?所以 y 减二十五 等于 d 乘以 c 的 x 次幂。现在我两边取 line, 左边 line y 减二十五,右边我直接写了啊, line d 加上 line c 的 x 次幂下的公式是 line c 再乘以 x, 我 把这个整体看成一个新的纵坐标,横坐标我没变对吧?然后求完的这个函数斜率是它,拮据是它 来。那我开始求啊,这个公式呢,已经给我了,贝塔,也就是这个斜率等于来开始列公式,分子是横坐标减横坐标,然后呢?纵坐标减纵坐标, 那我这个新方程里面的横坐标是我没变的啊,还是 x 减 x, x i 减 x 八乘以纵坐标是它啊,题目已经帮我设好了,这个纵坐标是 w, 所以 w i 减 w 平均值, 然后分母 x 减 x 平方,那这数肯定是人家题目给我的,这个是他啊,负二点四,这数是多少?妈耶,人家没给我没给我,我只能自己算,因为人家这个散点图告诉我了,是不是一共现在是七个值, 一二三四五六七啊,那每个点对应的这个值一二三四零,一二三四五六呗,都有,所以这七个值我要带进去它的平均值,首先应该是三对不对,一二三对三,正好是中间的这个, 然后每一个值减均值平方求和的话,它等于零减三平方,一减三平方,也就是四二减三平方,一的平方,三减三零的平方。不写了啊,四减三一方二方,最后再来个九,所以这个值算完二十八,这一笔是负零点零八啊。 好,那 line c 有 了 line d 怎么算?它一定经过的是两个变量的平均值。 omega 平均值告诉我了,是三点八五,它等于 line d 加上,呃, line c 是 刚才算完的,再乘以 x 平均值是三,所以我们能得到 line d 的 值四点零九吧。最后要求什么?要求这个 c 和 d 具体是多少?我刚才求的是 line c 和 line d。 已知 line c 是 一个定值,那么 c 的 值就是 line 移过去是 e 的 负零点零八, e 的 负零点零八。题目肯定得告诉我,要不然我不会算是零点九二, 全都是高一的这个对数知识啊,不会算的,赶紧去搜索对数计算去。接下来 d 加任意 d 是 它,那 d 就是 e 的 四点零九六十。 这第二问的最终答案是, y 等于把 c d 加进来六十倍的零点九二, x 自密加二十五。 好了,那最后一问,已知该茶水降至六十度的时候,六十度,谁是度数啊? y 是 度数,所以想让它得到六十度。根据二刚才这个结果问,这个相同情况下泡茶水我得放多少时间啊?把这个 x 求出来,解方程问题, x 等于六十减二十五是三十五,三十五除以六十,算完的就是这个值,剩下除以五的话,应该是五七三十五七比 十二,然后我怎么办?同学们,你看啊,我想解这个 x, 呃,那这个 x 的 值呢?你如果真正写的话,它是以 log 零点九二为底,十二的十二分之七十,零点九二为底。骂完没有啊?人家都是以一为底的,所以 怎么办?我们在这个位置上两边取 line, 左边 line, 右边 line, 你 这不才能用上题目条件吗?左边下的公式 x 这么多倍的 line, 零点九二,谁是 line? 零点九二确实人家没给你,但是跟零点九二相关的 有这个值,对吧?所以我这地方不写零点九二了,我写 e 的 负零点零八你就会了,把它应该再换回去,这个 line e 多少就是这个值本身,所以它就是负零点零八。 我只要把这个 rhyme 七比十二,哎算出来就行,它是 rhyme 七,减 rhyme 十二。题目给我 rhyme 七了,没给我 rhyme 十二。 rhyme 十二,我拆成三和四,这是 rhyme 三加 rhyme 四。那你前面有符号的话就是减 rhyme 三,减 rhyme 四,谁是 rhyme 四? rhyme 四是二的平方。 下头公式,把二提到前面去,一二三仨数带进来除,呃,除以负零点零八, x 值就算出来了, 答案七点五。那么以上就今天想给大家分享的全部内容,我们讲了限性回归方程它是怎么来的,以及最后你要背下来的这两个公式,还有如何判断。哎,我拟合完这条直线,呃,好还是不好,合不合适?以及最后的非限性回归分析, 我讲的非常非常清楚了,希望大家能学懂。晚节早啊!

hello, everybody。 上节课我们讲了线性相关关系,我们发现,有的时候吧,两个变量,它们的数值之间非常明显的在一条直线附近,那么我们就称两个变量之间存在线性相关关系。 那今天我们要研究的是,对于给定的数据,它到底在哪条直线附近?这条直线方程怎么求?这就是我们今天的任务。 那我要说一下啊,这条直线可不是你随便画的,我画成这样,有的人可能画成这样,换个人可能画成这样,我最后选哪个?作为我们最接近的这个直线?我得先确定一个标准, 你看,我要是这么画,显然是不对的,因为这每一个点到这条直线,呃,这个数值的这个距离都很远,对不对?所以我得选一条直线,使得 相对来说,每个点到我的数值距离最短。 understand。 好, 那么接下来我要进行推导了,这个推导过程呢,稍微有一点点复杂,基础不是特别好的宝贝可以跳过。咱最后是有公式的啊,对数学特别感兴趣的宝贝可以跟我一起听。首先,这条直线呢,我得有一个直线方程吧,比如说啊,我记为 y 等于 b, x 加上 a。 哎,那有同学要道了,你为什么写 b x 加 a, 不 写 ax 加 b? 这是我们在现行回归问题里面的一个习惯,我们把 b 放在斜率上, a 放在这个结句上。 ok, 好, 现在呢,我们有好多好多点,对吧?那么这个点呢,我就记为 x i y i, 这是 x 一 y 一, x 二 y 二,一直到 x n y n。 好 吧,那现在呢,这个数值距离怎么算?我姥姥也会求 我这点坐标已经有了,我把这点坐标取回来就好了。这点坐标的横坐标也是 x i, 对 吧?它的纵坐标我只需要把 x i 带进去就好了,它是 b, x i 再加 a, 那 么这个数值距离是纵坐标减,纵坐标 y i 减 b, x i 再减 a。 那我为了表示距离啊,宝贝们,那因为有的点呢?他在这条直线之上,有的点呢,在这条直线之下,所以我光这么写的话,这个向呢,是有可能是正的,你再点到上面的时候,他大的减小的就是正的,你点在下面的时候,小的减大的,他又变成负的了。所以这个距离,按理来说,严格来讲, 我们最后要加绝对值,然后从第一个点加到第 n 个点求和。严格来说确实如此,但是呢,因为我们绝对值是比较难去掉的,所以为了方便起见啊,我们在实际应用中,不看每个点到我这条直线的数值距离之和,我看它距离的平方和 这平方是我人为加的,因为加完之后呢,这个绝对值就没有了,我就可以给它写成括号了。这样对我们计算来说,对我们研究来说已经好算。我现在想尽一切办法找到这条直线的 a 和 b 啊,使得整个这个值算完求完和它达到最小值。 那 what can i do? 谁是参数?这里 a b 是 参数, x i y i 是 在变的,那既然其中已经有一个参数自己放在一起了,那我就把呃含 x i y i 的 呃这个看成一伙儿,后面它自己看成一伙儿。这样两项平方和大家比较好展开,它等于 它方减二倍,两者乘积加上这一项平方,那我们之前讲过了,你这三项的求和,相当于你把三项分别进行求和, a 方的和减。第二项求和。第二项。我发现啊,二和 a 都是数, a 虽然我不知道是几,但是最终它是一个数,跟这个 i 是 没有关系的。所以二 a 呢?我可以提出来让里面进行求和。 然后我又发现,哎,里面你这不也能继续拆吗?对不对?我直接括起来他的求和,减他的求和就好了。一会我再看,这一个个都是什么妖魔鬼怪啊。最后他求和 一个一个来,第一个 a 方, a 方是一个数,你从第一项到第 n 项,一共 n 项,每一项都是 a 方, n 个 a 方向加,那就是 n a 方。 往后看 y i 的 求和。呃, y 一 加 y 二加加加加到 y n, 这是什么?这是不是 n 倍的它的平均值啊?你班数学成绩的和,不就是你班人数乘以平均成绩吗? 大减 n y 八减啊,每天这个 b 呢?我先提出来啊,必备的 x i 求和,那不就是 n 倍 x i 八吗? x 平均值嘛。最后一项太复杂,哎,我不动嘞,我把这个 n 呐提出来,写成二 n y 减 b x, 最后再乘个 a, 太顺利了,我发现这变成了一个什么呢?我最后要求 a 和 b 的 一个值,使得啊,你整个式子呢,是最小的。那目前呢,我是不知道 a 和 b 是 几的, 所以其实相当于 a b 目前,哎,我不知道是几,它是未知数,是一个有关 a 和 b 的 二元的一个函数。你要找到一个合适的 a b 值求函数最值,这是一个有关 a 或者 b 的 什么函数? 咱刚才是把 a 分 离出来,它是一个语文 a 的 一元二次函数吧,能看出来不?多少 a 方多少 a, 后面有 a 没,是不是没 a? 所以 二次函数这个开口呢,显然还是向上的,那它的最小值就肯定在这个对称轴处取得,对吧?因为 a 我 们前 a 不知道是多少 a 你 是随便取的,零也好,正无穷也好,怎么取都行。 最后,想让二元函数得到那最小值,那么 a 一定得满足,它是负二,它分之,它负二 n, 我 发现这也有负二 n, 对 吧? ok, 是 吧? y 杠减 b x 杠,所以 a 的 值就是 y 杠减 b x 杠。 哦,我得到了啊,一个有关 a 和 b 的 表达式,它一定满足这个式子。那接下来我只要确定 b 是 多少就可以了。那我刚得到 a 的 一个表达式,我是不是可以把它带进去?这里面 a 不 就没有,就只含 b 了,对不对? 我先想象一下,最后可能会是一个什么形式啊?首先 a 是 多少多少 b, 所以呢,这个 a 方,哎,你化简完应该是有关 b 的 一个二次函数相关的哈。 然后第二项这里有一个 b, 这个 a 里面呢,又有一个 b, 所以 b 乘 b, 你 化简完也是一个有关。呃, b 方什么什么东西的有关 b 的 二次,那后面就更不用说了,这直接 b 方 b 的 二次函数, 所以中间过程我给大家省略了啊,把 a 消掉,最后一定是一个有关 b 的 二次函数。那么多倍的 b 方减去 b 的 一次式,长得蛮恶心啊。 x i 减 x 八, y i 减 y 八, 然后最后一下是不含 b 的 常数项,那是不是就可以仿照刚才的过程,我把它看成有关 b 的 二次函数什么时候取得最小值?它还是一个开口向上的二次函数,在对称轴处取得最小值,此时 b 等于负二倍的,它分之,它 这项本身就有个负,负负约掉了,所以这个分之这一大坨蚂蚁那都写不下了。你看,最后这个式子里面就不含有 a 和 b, 就 只有 x、 y 这些数据的坐标了, 说明只要给我一组坐标,我一定能找到一个 b, 再把 b 带进去得到一个 a, 这俩式子就它取最小值的取等条件就是我想要的这条直线的 函数。我们整个求这个式子最值的过程,叫最小二乘法,最终得到这条直线叫限性回归直线,最终得到这个 a 和 b 的 值啊,叫最小二乘估记。 哎,为什么叫估记啊?因为这条直线本身是不存在的啊,是我根据已有的点的数据进行了一个汇总,总结出来的一条直线,它告诉我们这两个变量大约是朝着这条直线去走的,所以叫估记。 那我们凡是跟估记值相关的啊,同学们,你要注意,我们在严格写的时候,参数 a, 参数 b 是 我的估记值,估记值脑袋顶上我们画一个小尖尖来表示啊,它是我们估记出来的值啊。这里个这个 b 也是估记值, 然后再严格一点,呃,这条直线也是我估记出来的直线,所以参数 a 参数 b 是 估记出来的参数,最后得到的这个函数值本身它也是不一定是真实存在的, 也是我估计出来的一个小夹夹,但是 x 哪个点不要放小夹夹,因为 x 是 自变量,自变量不需要你估计,由 x 得到的函数值才需要你估计,所以接下来简单总结一下有关最小二乘法和限性回归方程的这个计算。你需要知道三件事,第一件事, 限性回归方程当中的 a 和 b 我是 可以算出来的。第二件事,你算出来这个直线方程呢?它一定经过一个定点,这个定点呢,是所有数据横纵坐标的平均值必定经过它 y, 你 来看,这就好了,我给他一个项,你会发现它等于 y 的 平均值,等于 b 加 x 的 平均值,再加 a 加。哎,你这直线方程不就是 a 加等于 b 加 x 加 a 加吗?那你会发现这俩式子区别在哪?就是把 x 代成 x 八, y 代成 y 八, 也就意味着我 x 八外八正好在这条直线上,它是由我这个式子决定的, ok。 第三点,我们这条直线的斜率决定了 x y 的 正负相关性。那显然,如果是来变量正相关的,你求完那条直线,它一定是斜率为正的。如果反过来是负相关的,你做求完那条直线,一定是长这样的。 举几道题目练练手,看看你学懂没啊?二零一七年深度更好说。我研究某班学生,哎,这个角啊,长不长还有身高的关系。那我觉得应该是个正相关角,越长越高。 要从该班级随机抽取十名学生测量散点图看出啊,有限性相关关系满足回归方程是他,这里面 ab, 呃,谁给我了?后面把这个 b 尖给我了,哎,有 b 尖我怎么算 a 尖来着? 是不?只要用这个式子,呃,就可以了,有 b 加 a 加就有了。这个是代表什么?代表着这个直线一定经过平均值点是不是? 所以这道题这式子跟什么有关?是不跟平均值有关?你 x 求和是二百二十五,那我 x 的 平均值就是二十二点五。通理, y 的 平均值应该是不是一千六,而是一百六,那因为这条直线一定经过这个点,所以把它俩带进去,你得乘以一百六,等于二十二点五倍的 b 加 a 加, 嘻嘻, b 间告诉我是四了,所以 a 间一求七十,那限性回归直线就让我求出来了。我估计这条直线长的样子是四, x 加上七十。 我提醒一下,当你把这个 a 间 b 间的值算出来的时候,这个具体值上面就不用加间了啊,好,直线有了,那人家问,现在已知一个学生角长告诉你了,二十四,你估计一下他的身高是多少?我这条直线不就是用来估计的吗? 角长是 x, 我 把 x 再带成二十四,我看一下 y 加是多少呗。四乘二十四加七十,答案选 c, 轻松又愉快。 好,再来说对有限性相关关系的两个变量 x, y 进行统计分析的时候,得到了下面的这个数据,这数据当中呢, x 取五个值,其中 m 值不知道, y 取的五个值我都知道,但是啊,限性回归方程给我了,这考啥呢? 这条直线是不一定经过 x, y 的 平均值点呀。 x 平均值把这五个数加起来除以五,也就是五分之一倍的二十二,三十三十四加 m, y 的 平均值简单一算,三,六十一,十七,五分之十七。我把这俩数啊带进去,它得成立,那最后就只有 m 这一个自变量,那 m 一 解解出来, 你算完发现它等于六,自己去解啊。然后他问,哎,这三个样本点哪一个到我回归直线方程最近, 呵呵,那我算一下呗,是吧,横坐标分别是四六八四的时候我的估计值带进去零点八,六的时候我的估计值带进去二点一。 这考试的你都得自己算啊。我再把八带进去,答案是三点四,然后我就看看他的实际值一二三到他的估计值这个哪一个最小是吧?他的绝对值一和二点一,差的是这差的多了,差零点四。 最最近的点就是它,全是小学数学啊。 ok, 举了两道题目了啊,最小二乘法的考点,呃,几乎就这么点,如果考的想再难一点点能怎么难呢?你看我们上节课学的那个宪性相关系数里面也有这么一大坨式子,对不?当时说了 那一坨呀,哎,它有一个第二个表达形式是不是?那有没有发现你这个的分子和我们今天讲的这个分子是同一个分子?这分子能怎么写来着?它等于 x y 的 求和减 n 倍, x y 平均值备好了, 意味着它也有第二个公式, x y 求和减 n 倍, x y 平均值。那你把上面式子当中的 y 都换成 x 的 话,下面就等于 x 乘 x 的 求和减 n 倍 x 八平方。我们举一道高考题 给大家看一看。二零一四年新课标一卷啊,从一七年到一三年农民家庭收入 y 的 数据表格如下。哦,这个 y 呢,跟这个年份是有关的。呃,二零零七年,他记为代号一零八年二,然后三四五六,一直一三年的话是代号七。 一共七年呗。收入从二点九,三点三,最后四点多,五点多啊,大约是一个,呃,限性的增加的一个关系正相关。第一问啥都没给我啊,直接让我求限性回访证,怎么求 人?这道题目什么都没帮你算,表格里面给的是你原始数据,你需要把这七组原始数据真的带进去,带到公式里面把它解出来。 人考试的时候,考场上真就这么考你?你有恒心有毅力,这题你就满分,否则一分没有。今天我跟大家一起算, 想算任何事,你得把两个变量的平均值先算一下,选 t 的 平均值从一到七。那他的平均值呢?啊,难求一点,他是七分之一倍的,来加吧。方法一, 一个一个加六点多,呃。十点多,一加加加加。呃,算是能算的啊,就麻烦一点。这算完之后呢?呃,是四点三,但是呢,我个人喜欢用另外一种算法,你从二点多,三点多一直到五点多,我最后啊,我感觉上你这个平均值最后应该是 四点几的数啊。那具体是四点多少,我就把这原始数据跟基础这个值四去比, 比如说二点九,照我的基准四来说,他应该差的是,呃,一点一,少了一点一,这少零点七,这少零点四,这多了零点四,多了零点八,多了一点二,这多一点九,我把它多的这个部分求一个平均值就好了。 这加起来可快啊。他俩加完没有了,呃,这俩加完剩零点一,零点一加他就是负一负一加他零点二,零点二加一点九是二点一,所以一共富裕了二点一,那一共是七个数,二点一除以七,平均多了零点三呢。最后答案就是四的这个基础上加上零点三、四点三, 如果你能懂这个逻辑的话是更好的,算起来会快一点。好,那平均值都有了,算 b 间,他给的。我是这组公式。那对于这道题来说,另外一组公式会不会更简单呢?你给算之前先简单分析一下啊,不差这十几秒。 上面是变量乘积的求和,减去 n, n 是 减 n 是 七倍的 t 八 y 八, 下边是把 y 都换成 t t 乘 t 方 t t 七 t 八平方 t 八外八,你都算过了。其实呢,比较这俩公式,谁更简单?如果你用第一个公式,咱每一个原始数据, 你要减去它的这个平均值,这肯定是一个小数,然后呢,这是什么? t 是 整数,然后呢? t 八也是整数,哎,整数减整数,它是整数。所以呢,其实还好,你只需要算一个整数乘以小数,然后把小数加起来,这样匀算量。 那如果是用第二个公式, t i y i, 你 需要,呃,这个乘,这个乘,这个乘,这个乘啊,也是整数乘小数,然后加起来。所以呢,在这道题目当中,两个公式计算量我感觉都不大,你用哪个都行啊。今天呢,呃,我用这个,我强烈建议大家你自己回去 用这个算一下。首先 b 间 t i y i 乘起来,二点九,六点六,十点八,这个是四,四十六,十七点六,这玩意五八四十四,五二十二十四二六十二五六三十三,十一点二,最后四十一点三,这是这个部分,我要减去七倍的这俩数相乘。 好到这没办法了你,你这这,这得算了啊。然后我看下面这个天平方,一四九十六,二十五六六三十六七七四十九,减去七倍四的平方,这份子分母一算完,一比一啊,最后能算出来一个值,算正好是二分之一。 ok 啊,那 b 加有了 a 加怎么算?这式子代表着我这条直线方程一定经过那个平均值点是吧? a 加等于 y 八,四点三减去 b 加零点五乘以四等于二点三。所以第一问现行回归直线方程,这没个十分钟,哎,肯定算不完啊。 y 加等于,注意是 b x 加 a, 可不是 ax 加 b。 别写反了,你先算完的二分之一是斜率二分之一 x 啊,不是,不是 x 啊,这题应该是 t 是 吧,再加二点三。 第二位,让我利用一中的回归方程分析一七年到一三年该区域收入的变化情况。怎么写啊?二分之一是大于零的, 所以收入外跟年份之间是一个正相关关系。随着年份的增加,我的收入呢?稳步增长是吧?好话就往上写呗,人家想让你夸,你就夸呗。然后最后最关键的,呃,预测一下该地区二零一五年的纯收入, 哎,一五年的代号是几啊?一三年是七,一四年是八,二零一五年应该是九,对吧。所以我把这个 t 呢代成九,把 y 加算一下,就是纯收入的一个估计值。二分之一乘以九加二点三,四点五加二点三,六点八。这么多钱, 哎,单位是多少啊?单位不是万啊,是千。哎呦,你这一家人均六千,而且是一年。 呃,这怎么讲呢?那一年十二个月,你平均一个月那就是五百多块钱是吗?这可咋整啊,有点心疼了,不敢说话,还是下一题吧。

预备开始高考数学救命课第九期,今天我们正式来说一下限行回归方程。限行回归方程非常非常简单,考试时候公式他也给啊,重点呢,我们就知道这个公式怎么用就可以了。来,在正式讲这个题之前,老师想介绍一下这个玩意是啥意思?这个玩意读作习个嘛,意思就是求和 啊,就是求和的意思。老师先举个简单点例子,你比如说这个吧,习个嘛, i 等于一,然后上面我写五 x i, 这啥意思?它代表的意思就是 i 从一开始就 x 一 加求和嘛,求和就是加 x 二加 x 三,加到谁算拉倒,加到 x 五算拉倒,就这意思。好,我们再来,这个东西什么意思? 它的第一项是 i 等于一,那就是 x 一 的平方加习哥曼的意思是求和嘛, x 二的平方加 x 三的平方,加到谁算拉到?加到 x 五的平方算拉到。为什么?因为 i 的 五嘛,对不对?再来, 这个是什么意思?这个的意思啊,它的第一项是 x 一 y 一, 它的第二项是 x 二 y 二,中间都有加号,加这个点,加到谁算拉到?这不是十吗?加到 x 十乘 y 十算拉到,就这意思。好吧,这是习惯的定义,非常非常简单。 好,紧接着老师想介绍第二件事,大家帮老师判断一下,这两个东西是不是一个东西,大家看 还有这个, 这俩玩意是一个东西吧,有同学说,哎啊,他瞅着有点像那种,就是呃,乘法那个分配率那种感觉啊,这个 a 一 倍的那个 b 加 c 啊,又等于 a b 加 a c 啊,大家说的不是一个事啊,但瞅挺像的 啊,大家帮我判断一下,它俩是一个东西吧!而先上结论,它俩绝对不是一个东西啊,它俩绝对不是一个东西。上面这个东西代表啥?上面那个东西,它的第一项是 x 一 减 x 平均,块二平方乘 y 一 减 x 平均,块二平方乘 y 减 y 平均,块二平方加。在这加到谁算拉到 啊?下角标是五的时候, x 五减 x 平均,块二平方乘 y 五减 y 平均块二平方好不好?而下面那个呢, 这个东西和这个东西完全属于两个系统,不是一回事,它代表的是什么?它代表的是 x 一 减 x 平均的平方加 x 二减 x 平均的平方加点点点加 x 五减 x 平均的平方。这一堆玩意算出来代表一个数 好吧,而后面那个呢,是 y 一 减 y 平均的平方加 y 二减 y 平均的平方加点点点加 y 五减 y 平均的平方,算出来又等一个数,第一个数乘第二个数,代表下面那个东西的意思,好吧,老师举这两个例子就想说明啥呢?就想说明习哥嘛,这个符号只是代表求和,他什么这个计算性质都没有 好吧,它什么计算性质都没有,大家一定要记住这个事,那么同理老师再给大家举个例子,大家帮老师判断一下这两个东西是一个东西吧。还有这个 有同学说,根号下再啊那个平方再开根号,那不就绝对值吗?大家帮老师判断这俩玩意是一个东西吧,绝对不是一个东西啊, 这个东西代表什么?这个东西代表 x 一 减 x 平均的平方加点点加到 x 五减 x 平均的平方,算出那个数, 这个数再开个根号,这是下面那个东西,上面那个东西代表啥?上面那个东西代表 x 一 减 x 平均得绝对值加 x 二减 x 平均得绝对值加在这点加到 x 五减 x 平均得绝对值,算出来等于一个数。 好了,它俩绝对不是一个东西。老师举这对例子就想说明啥,习个嘛,就代表俩字,求和好不好。习个嘛,什么计算性质都没有。老师再说一遍,习个嘛就代表求和,习个嘛,什么计算性质都没有,好不好就完事了。好,那知道这件事了,那剩下的事就纯是求和。习个嘛,什么计算性质都没有,好不好就完事了?来啊,怎么求?这个 b 非常非常简单。 习,哥们,代表求和吗?分子的第一项代表什么? x 一 减 x 平均的平方乘啊,没有平方,不好意思乘上。 y 一 减 y 平均 加 x 二减 x 平均,括号乘 y 二减 y 平均加点加点加到谁算?拉倒啊, n 一 共有多少组数据啊?一二三四五,一共有五组数据,那就是 x 五减 x 平均,括号乘 y 五减 y 平均。这对玩意作为分子 分母是什么东西啊?一项 x 一 减 x 平均得平方,加 x 二减 x 平均得平方加点点点,一直加到 x 五减 x 平均得平方,就这回事。好吧,非常非常简单, x 一 是谁? x 一 直到 x 五,分别是一二三四五, y 一 一直到 y 五是一点二,一点八,二点五,三点二,三点八。把这一堆数字往里一带就行了啊。 x 平均代表啥玩意?一加二加三加四加五,除个五 y 平均是啥玩意?这五个数相加,除以五就得了,最终算得这个 b 等于零点六六啊,大家代入计算一下, a 等于什么东西? a 啊,他给公式了, y 平均减 b 呗, x 平均是不是啊?就完事了?把相应数据往里带,等于零点五二,所以最终那个方程,大家看他不是给 a 的 公式了吗? 如果把这个 b x 平均挪左边去,那不就 y 平均等于 b, x 平均加 a 吗,对不对?所以说你设的方程就反照它, y 等于 b, x 加 a 就 完事了,好不好啊?就完事了, ok, 嗯,这个 b 脑袋上带一个尖,啥也不代表啊,同学们,就是,你就照它抄就得了,代表这个 b 是 个不缺一个暂时待定的数啊。别没啥别的意思,就设 y 等于 b, x 加 a 就 行了。 好,那就是 y 等于零点六六, x 加零点五二就得了呗,是不是?好?他问这个二零二六年的时候新增的数量,二零二六对应的数据是几?二二四年是五,二五年就是六,二六年就是七, 是不是就代入 s 得七,算一下这个 y 值就得了,非常非常简单。所以说,对于现行回归方程,老师就要求大家一件事一定一定要记住,这个习嘛是什么意思?就俩字,求和啊。再一个习嘛,没有任何计算性质啊。然后我们就按照这个老师讲的那个方法,一点一点一点往里带入计算就可以了。好吧。

销售不交学历吧?我不上学,我干销售也奈何自己。你不上学,不学现金购货方程,你干销售连自己赚多少钱你都不知道。比如第一个月你挣了一千,第二个月挣了三千,第三个月挣了三千,第四个月挣了四千,第五个月大概赚多少钱你知道吗?我是算命的,我上哪知道去。你 用现金购货方程一算就可以了呀。 b 二等于求和,从 si 减 si 减 si 减 si 的 平方。 第二个变形等于球壳从 d 向到 d 向 s i y 减去 n 倍的 s 八倍八。比上球壳 s m 平方减去 n 倍 s 八平方。一计算, b 帽等于零点九, a 帽等于 y 八减 b 毛 s 八 a 帽等于零点五, y 帽等于 b 帽 x 加 a 帽把。第五月代理大概能赚五千元。这也太慢了,我不上学,要干半年才能赚这些钱。你出了窍门就知道钱多难赚了。

那接下来, hello, everybody 欢迎大家来到我们最后时刻概率统计,接下来我们来看成对的限性回归分析。 咱学三件事,分别是限性相关系数、限性回归方程以及非限性回归方程。首先来看限性回归系数, 先了解一下正相关和负相关。正相关就是整体是一个单调递增的一个趋势,比如咱每周看医术视频的时长越长,数学成绩那大概率那就会越来越高。但是如果你用手机不看医术视频, 你去玩游戏,那你每周玩手机的时长越长,数学成绩那肯定就越低喽,这就叫负相关。 ok, 那 你知道什么是正相关了,什么是负相关了?但是我发现有的时候吧,两个数据 x 和 y, 我 画在平面直角坐标系里面的话,它有可能这个线形关系,哎,特别明显,就说这些个点点啊,都在某一条直线附近很近的一个位置,但也有可能离我这个趋势。这条直线啊,你大概看着啊,也确实是一个负相关,但是每个点离我这条直线都比较远, 那如果像这种特别特别散的啊,你根本就看不出来,呃,是单调递增还是单调递减的,那就几乎没有现行相关性了。那这个现行相关到底是强还是弱,咱是不是得有指标来衡量一下呀?这个指标就叫现行相关系数,用小二来表示, 怎么算呢?左边这个是第一个公式,考试几乎就给它,你会代入,就想怎么代。比如说任何一组数据啊,它坐标那肯定有个横坐标,我记为 y i, 那算这个现象相关系数之前,我得先把所有的 x 横坐标平均值先给它算出来,然后纵坐标平均值也给它算出来,然后用每一个点的横坐标减去平均值,乘以纵坐标 减平均值,乘起来再相加,这就分子分母每个点横坐标减平均值,平方完相加之后再开根号,这个是纵坐标也开根号。一般来说,公式都会给大家,你会代入就行, 但是有的时候大家注意它等加的变形式,你也得会,这就得靠自己背下来了哈。跟我们讲方差的那两个等加式子特别像,你可以先算这个数,把每一个数据横坐标乘以纵坐标,然后相加起来,横乘纵 加横乘,纵加横乘纵,最后啊,全都加起来之后,再减去 n 个,你有几个数据, n 就 取几呗。平均值相乘 特别重要,你别不当回事,一定要记一会给大家举例题。那有关这个线性相关系数本身还有一点点小知识啊。这 r 呢,它是有取值范围的,它在正负一之间运动,你算这个值一定是正负一之间的数,不是的话,那说明算错了啊。 这 r 如果是正的,它就是一个正相关,那如果 r 是 负的,它就是一个负相关。如果 r 的 角值越趋近于一,就意味着 r 越趋近于这两个端点值的话,那么 x 和 y 这数据呀,它的线性相关性就越强。 当 r 如果取一的话,那,那不用说了,每个点都在直线上啊,那反过来,当 r 无限趋近于零时,越趋近于零,向量相关就越弱。 那现在要问问题啦,每年都问判断对错。一个乘对数据 x y, 如果你用刚才的公式算完,哎,它的向量相关系数 r 等于零,那是不是 x y 就 没有相关关系嘞?是对还是错?五秒钟时间判断一下。 经典错误这句话是不对的,当现行相关系数二等于零的话,你只能说 x 和 y 没有现行相关关系,它有可能有别的非现行的相关关系,我只不过不是在一条直线上而已,但是我 x y 可以 是相关的,可以是相互影响的, ok, 这是一道判断。那么给大家举个例题吧,二零二二年全国一卷,太经典了,也是每年都讲绿水青山八八八,我为了估计啊,这个邻区树木的总采集量啊,啥意思不知道,我选取了十棵树,我测量横截面积和采集量,一个是 x 啊,一个是 y, 他 俩的关系 ok, 一 共呃,十个数,怎么样呢?哎呦,他把这总和都帮我算好了,那就是他的总和除以十个数零点零六, y 的 平均值就零点三九。 然后你看他还非常贴心的出题人自己心里知道,一会让你算数了,那太多数据了,你别算了,帮你算好了, x i 平方 y i 平方, x 乘 y i 全都给我了,然后第二问问我这 x y 样本的现行相关系数, 哎,你看很好心是吧,公式给我了,你用吧,把每一个值哎,减去刚才算完的平均值啊,再乘以 y 啊,减去平均值,一个一个算,算十遍,最后加起来啊,分母也一样算去吧。当然可以算,但是你是不是没用上 x i 方 y i 方 x 乘 y 这些人家给你的数据你没用啊,咋用? 是我得用向量相关系数这等加形式里面它才有 x i 乘 y i x i 方 y i 方啊,人家是给你公式了,但是没用,你得带你自己背的这个公式来开带啊。第一项题目,给我的零点二四七四减去十个数,平均值相乘。 ok, 那 接下来来看一下这个分母。 第一项,根号 x i 平方啊,加起来了是零点零三八,减去十倍的平均值的平方,那直接算了啊,它是零点,呃,零零三六,乘以十的话,就是零点零三六, 下一个数 y i 平方加起来减去 n 倍的零点三九的平方。这没办法了,你真得算三十九乘三十九是吧?然后两数一乘啊,上面分子也一算,最后化简 得到一点三四,比上根号下一点八九六。哎,这这这,这不会算呢,人家给你了,大约是一点三七左右,把这数带进来,得到一个答案,零点九七。第二问 结束。重点,咱其实就想着讲这第二问,告诉你这公式啊,你得背第三问,对应乘比例不,不讲了,太简单,答案一二零九,自己算去。来看下一个问题。 我们刚才呢,用这个小 r 来表示 x y 啊,它的限行相关系数强不强?好,那如果限行相关性很强,那几乎就在一条直线上了,那这条直线的方程怎么求呢?这是我接下来要研究的问题,叫限性回归方程。 我把 x y 能取的所有值全都列在表格里了。那想求这条直线,那直线呢?无非就是 y 等于 k, x 再加 b。 但是我们在这个向量回归方程里面,我们设的时候,呃,不设 k 啊,我们设 y 加,等于 b 加, x 加 a 加, 其中 b 间是它的斜率。具体呃都怎么算?有公式的,你不用担心,那有关这条直线,你会三件事就行了。第一个事得到的,或者说你和完这条直线一定经过的一个定点是 x y 平均值一定的啊,如果不经过,那那是不可能的。第二件事,其中这个 b 间怎么算? 公式?在这我要求大家,这个公式你得会背下来,刚才那现行相关系数小 r, 那 公式你可以不背,这个我还是建议你背一下,我怕我担心人家万一出题不给呢?而且它也有一个等价形式,哎,和刚才都一样的哈,就是 x 减 x 乘 y 减 y 啊,加起来等于 x 和 y 先乘加起来,再减去 n 倍的均值相乘。 其实所有公式的等加变形,你会背这一个就已经够了,因为你想下边这个平方指的是啥呀?平方说白了不就自己乘自己吗?那我再仔细看看,那这跟上面有啥区别啊,不就是把 y 换成 x 而已吗? 所以上面那个你如果一旦背下来了,下边你推也能会推,把这里的 y 都换成 x, 那 你看看,呃, x 乘 x 了,是不是 x y 平方, x 乘 x 是 不是它平方一模一样的呀?总而言之,言而总之,你把上面这个背下来就行, 带到公式里面去, b 加这个斜率求出来了。那 a 加有公式没?没有题目会给你 a 加的公式, a 加得自己求咋求?你一条直线斜率已经知道了,那还经过一个定点,我把这个定点带进来, 我就能得到 y 平均值等于 b 加刚才算完的乘以 x 平均值,再加上 a 加,这仨数你都有 a 加一解出来了。那今天给所有的宝贝留一个必须要做的作业,这是曾经的高考原题, 一二三四五六七七组数据,直接光给你公式啊,啥都没给你提前算好,任何参考数据都没有让你手动开算。限性回归方程里面的 a 间 b 间咋算?一个一个,一个一个往公式里带,考不考要耐心, 你考试想得分,要不要作?必须要作,谁知道今年考试抽不抽分,让你在考场上真的就再算一遍,听话,宝宝一定要算。我把答案贴在这, b 间算完零点五, a 间算完 二点三,课上没时间带大家一点一点算了哈,大家自己回去算去。我们来看下一个问题先,假如说现行回归方程让你求出来了,那我如何评价你拟合出来这个回归方程?哎,这个拟合的好不好呢? 什么叫拟合好不好?说白了就是,哎,你这些个实际的真实的数据,这个点到我拟合出来这条直线呀,他远不远?哎,你要是越远越偏离,那意味着你拟合效果就没有那么好, 你要是一个一个全都在之间上,那就意味着你拟合效果就好。拟合效果我们有两个参考数据,第一个叫残差,我们用实际的也就是一个个点的纵坐标,然后减去 这点横坐标对应的直线的纵坐标。哦,说白了,拿这个点来说,这点坐标呢,是比如说 x i y i, 这是实际真实的数据,那在横坐标为 x i 的 时候,这条直线啊,我拟合出来我估计的这个值,估计值,我用这小尖来表示, 用这两点纵坐标之差作为我的残差,那么显然,如果点在直线的上方,那这俩相减的话,它是一个正值,那如果点在下方,那你这个点纵坐标减去它对应的,呃,估计值点的纵坐标 小的减大的,它还有可能出现负值,所以记住了,残差有正有负。那具体谁减谁,你别减反了啊,你要用真实的数据,什么叫真实数据?就实际存在的啊?这个点的坐标减去虚拟的,减去你估计的,减去假的,这个数据用真的减假的, 就这么记, ok, 这是我衡量我你和好不好的第一个指标。但是你光用残差来表示吧,说实话有点麻烦,因为你想,比如我这组数据一共有,呃,十个点吧, 你十个点是不是就有十个参差?那我问你,你这组数据到底你和他好不好?你不能给我咣当,因为把十个数据糊我脸上对不对?我们尽量用一个数据来总结你和好不好这件事,起个名字叫决定系数。 r 方怎么算?公式也有,我们是用一减去一个分数,分数这个分子是一个东西平方再相加。哎,这,这啥东西啊这是?正好是残差呀,我们把这个分子这个数啊记为叫残差平方。和刚才你算的那么多残差平方一下再求和分母是啥呢?这老生常谈了, 咱把每一个真实数据减去它的平均值,平方再求和 r 方有什么意义呢?如果 r 的 绝对值越大,那就意味着你和效果就越好, r 的 绝对值如果越小,逆核效果就越不好。很简单啊很简单。以上就是限性回归分析的几乎所有内容了,那我稍微给大家补充一点,我们来讲一讲非限性回归分析。 我们知道有些数据呢,天然并不是在一条直线上的,它明显不是一条直线,比如说是一条曲线,那有可能是一个指数函数的图像,或者啊,对数函数的图像。那这个时候我怎么求这个类似于指数函数的这里的参数 m 和 n 呢?这就叫非限性回归方程的计算,我们永远是把非限性 转化成弦形的。哎,它出现这个指数了,哎,指数,哎,太难受。出现指数,我不会呀。没关系,我两边取对数,左边 y 取对数,右边整体我也取对数,真数相乘,相当于我对数相加,我写 like e n x, 再加 line m。 呦呵, line e n x 啥玩意儿啊?以任何数为底, a 的 x 私密都是 x 本身,所以它其实就是 n x。 当然你用下头公式也一样啊,它下头出来就是 n x, 背的 line e 就是 e 嘛,就是 n x。 哎,那是又怎么样呢?我发现现在已经没有指数了, 它变成了这样的形式,你如果看着不太舒服,我换个圆你看看。但如果把浪 y 看成一个整体,设成一个大 y, 大 y 等于多少? x 再加多少,看出来没?我小 x, 小 y 确实不满足线性相关关系,它是一个非线性的指数,但是我 line y 和 x, 它满足的是线性相关关系。 求完的 b 加就是这里面的 n, 然后求完 a 加就是呃,绕 m 转化一下大 m 是 多少也就有了。哎,你看着好像挺抽象,但是特别简单。在题目里面举个例子,挑选一百名学生进行记忆测试,讲解一百个单词之后,时隔十分钟进行听写。哎呦,讲一百个还不少哈。 现在发现间隔时间跟答对人数之间的一个关系。那肯定时间越长,呃,人数答对的应该越少吧。我判断对不对, t 越来越大,发现答对人数也越来越少了,这太正常了哈。 然后这个时间 t 跟答对人数 y 究竟有什么关系呢?我发现 t 和 y 本身它是长这样的一个关系,显然这是一条曲线。但是我如果把这个人数 y 整个所有的值啊,每一个都取一个多位数之后,我发现, 哎, line y 跟 t 好 像就非常近似于一条直线了。第一问,通过散点读判断啊,这个直线,呃,跟这个,哎,这不就 line y 跟 t 的 关系吗?哪一个更适合作为向量函数模型?啥子都知道,这个更适合选它。那第二问,我不看我都知道,让人问我求这个 c 跟 d 分 别是谁是吧? 来求吧。我先求这个斜率,斜率呢?公式肯定是给我的,直接来求, c 等于 u v 是 什么东西? u v 是 它的横纵坐标是吧?横纵坐标相乘再相加。题目里面有没有大家告诉我用这个数据还是用这个数据? 你傻了,现在谁是纵坐标? line y 才是我真正的纵坐标,所以我乘的时候应该用横坐标, t 乘以 line y 用,用右边这个啊。所以这数应该是六百二十一点七,减去一共几个值?一二三四,一共十个值吧。不是一百个值啊,乘以对应的平均值, 十到一百的平均值,这再算错。别玩了啊,是五十五,不是五十哈。纵坐标纵坐标是 line y, line y 的 平均值。题目里面有没有没有他给我求和了?求和是十三点五二,那十个数就是一点三五二, ok, 一 切都非常顺利。来看分母。哎,我才反应过来,这题还挺仁慈的,直接把这个变形式给我了哈。 u i 方啊, u i 是 横坐标,横坐标是 t, t 的 平方加起来三万八千五,减去十个数,平均值的平方平均值五十五吧。接下来谁也帮不了你了,你这些数啊,得自己算, 就算是负的零点零一五是个负相关关系,那斜率有了,这个 d 怎么求呢?整个直线一定经过的是横纵坐标的平均值,横坐标 t 的 平均值, t 平均纵坐标是 log y 啊, log y 作为整体的一个平均值, 分别是多少来着?呃, t 平均值是五十五, log y 帮我加好了,十三点五二除以十一点三五二带进来一点三五二等于刚才算的 c 负零点零一五乘以 t 平均五十五, 再加 d, d 算式二点一六六,直线方程都有了。第三位让我做个,估计很简单,几个不等式就行哈。答案我贴在这,大家自己做。这就是非限性相关关系,其实很简单对吧?转化成限性的就好了。


上大学有什么用,我表姐初中数学干销售一样能涨工资。你学算命的呀,你咋知道下个月他工资往上涨啊?你看他第一个月赚一千, 第二个月六千,第三个月两千,第四个月三千,工资很明显上涨啊。你很明显没有学过相关性的计算,相关系数 r 等于六个公式,把你表姐的工资往里一算,就等于零点一二, 他的绝对是小于零点七五。说白了,他的消费性很弱,前四个月挣的钱跟第五月没有什么关系,第五月有可能为零元。那他为啥劝我辍学跟他一块干啊?你辍学了他就不是全家最没出息的了呗,拿你当电妹子。

老师们好,我是抖控散人,今天这个视频我们来讲讲这个课程的使用啊,这个课程是咱们课本中一百零六点那个一元限行回归模型随机误差的说明,咱们先点重置按钮,这里边所有的复选框就相当于清空了, 然后我们勾选这个相关系数啊,就给咱们自动算出来这些散点的相关系数啊,然后勾选直线一,现在这个直线一呢,咱们是通过两个自由点来控制的啊,我们还可以点这个按钮进行切换。直线一呢,咱们是通过两个自由点来控制的啊,我们还可以点这个按钮进行切换,咱们这个坐标系里边了, 如果点这个直线呢,他就跑到外边来了,这个直线呢,我们是可以自己拖动这个直线,然后呢我们勾选误差一,这个时候就是过这个直线往这个三点上做出来这些随机误差,然后勾选文本一,这里边就得到这个随机误差的均值和这个方差,我们就希望拖动这两个点的时候呢,使得这个均值为零方差最小, 但是我们在拖动的时候呢,很难保证啊,真值为零方差最小。另外呢我们点这个特值这个按钮,那么这时候这个直线呢,他就和这个横轴是平行了,我们再点直线一,我们可以拖动这个直线,拖动的时候呢,这个直线始终是和横轴是平行的, 那么这两个点拖动这两个点的时候,不太容易让真值为零方差最小,所以我们就在想,那么这个直线是不是应该过某一个特殊的点呢? 好,我们勾选这个直线二,这个直线二呢,这里边这个点就是所有这些散点的这个叫样本的中心点,你可以理解为啊,就是这个点是有所有这些散点的那个横坐标的平均值啊,和所有纵坐标的平均值啊,也就是两个平均值,横坐标的平均值和纵坐标的平均值啊,得到这个样本的中心点, 然后呢这又是个自由点,我们就是用这个样本的中心点和这个自由点来得到这条直线点,线段呢,就是只出现在这个里边, 现在我们啊勾选这个误差二,也就是过这个直线往这个三点做出来这个随机误差,然后勾选这个文本二,现在我们拖动这个点的时候,我们观察这个数据啊, 我们会发现这里边这个均值始终为零,这个方差的在改变,往上的方差越来越大,所以咱们往下拖, 我们希望这个方差最小嘛,就越来越拖,越来越拖。哎,现在可能到这个六点一一的时候就比较小,六点一可能是最小的,因为咱们再往上拖就变大了,往下拖呢也变大了,但是毕竟咱们手拖的时候很难保证到这个是方差最小,因为即便你拖到这个六点一的时候,因为我们这个显示的小数比较少啊,我们可以通过这个选项精确度, 这是保留两个小数,你要是保留更多位数,保留五位数啊,你再拖的时候就更难拖到刚好是最小啊。 现在咱们勾选这个直线三,这个直线三呢,我们可以看到它就是过这个样文的中心点啊,然后这儿咱们也是可以进行切换的啊,整个一条直线是吧?只出现在这个坐标系里边,然后点勾选这个误差三, 也就是过这个直线往这个三点上做出来这个随机误差。看这个文本,这时候这个文本是吧?均值除以零,方差最小啊,六点一零,一般咱们这个精确度保留两个小时就够了啊,好,现在咱们把这 三条直线的这个文本是吧,全部都勾选出来,可以做一个对比啊。第一条直线这个均值啊,很难拖到那个刚好为零的时候啊,方差就更别说了,刚才那个方差最小。第二条直线呢,只要你过这个样本的中心点是吧?样过样本的中心点,那么这个均值为零,但是你在拖的时候,这个方差呢,也很难拖到这个最小的时候,我们可以先重新来一下啊, 这个直线二拖了时候很难拖到那个刚好最小。 直线三的时候啊,就一定是过这个样本的中心点,过这个样本的中心点,然后它为什么能够保证这个方差最小呢?因为这条直线是咱们就是利用刻度中讲的最小二乘法拟合出来的最佳直线啊。啊,好,今天这个视频呢,咱们就讲到这里啊,感谢老师们的观看。