粉丝1070获赞6942

卡方,你和优度检验做什么用?怎么用?卡方,你和优度检验研究类别定类数据的实际比例与预期比例是否一致,例如研究样本男女比例与预期比例四比六是否一致。拖拽样本进行期望值设置,如不设置默认期望值相等。开始分析卡方,你和优度检验。 从上表可以看出,性别全部均没有呈现显著性。 p 大于零点零五意味着接受原假设及数据分布与预期一致。你学会了吗?


同学你好,这一次呢,我们来介绍基于数据的建模方法啊,所谓的数据拟合啊,那么在大家呢,在现实当中啊,经常能遇到啊,拿到了很多的数据啊,他们拿到这些数据之后,我们想得到它里面变量的一些关系 啊,那么除了这个之外呢啊,如果说我们拿到的函数表达是啊,非常复杂,不利于做一些运算和分析的时候啊,我们呢都可以呢用数据礼盒的方法来解决啊,比如说呢,像这样的函数 啊,你无论是对他求打也好,讨论和单调性也好,都非常困难啊,那么这个时候呢,我们可以考虑啊,用简单的函数呢来对他做逼近啊,那么我们来看啊,首先我们来介绍呢现行礼盒最简单的一种情况,如果说我们拿到一串数据之后啊,我们呢 把它涂画一下一看的话呢,发现呢数据的特征啊,具有比较显著的线性规律啊,那么在这种情况下呢,我们就给假设 y 跟 x 之间呢呈现一种线性的关系啊,比如说 y 等于 a 零加上 a x, 那么接着呢,我们就是要让这个 a 零和 a 一,让他呢尽量的使得这个呃平方,呃差的平方和呢最小化 啊,让这个差的平衡和的最小化啊,那么这个呢,在这个数学里面叫做呢最小二乘法啊, 也就说呢,我们要通过一些运算啊,找到一个最佳的 a 零, a 一,使得呢这个函数呢最小化啊,那么大家呢,也可以用 matelab 软件呢来直接来进行计算啊,用它里面的现行拟和命令啊, poly feet x y e, 这样呢就可以求出来啊, e 呢表示呢是一次多项式,也就是线性啊,线性函数。 好,我们来看一个例子啊,比如说呢,我们现在呢有这么一串数据啊,那么你呢把它数据呢,一旦画成图的话,你会发现哎,这个比较显著的服从一个现行关系。那好,我们呢把它的 x 变量的输入啊,然后呢 y 这个数据呢,输入成一个项链 啊,这样呢就构成了 x y 对应的一组项链啊,那么完了之后呢,用这个 polyfit x y 一来 输入啊,那么一算的话呢,得到两个系数,一个二点九三五七啊,还有一个呢副的四点六六零七啊,那么这样的话呢,把它转化成一个多项式的形式,这就是我们所要求的这个线性,你和 结果啊线性拟合呢,大家注意啊,我们看我们画的出来的线,它呢并不能保证过每一个节点,但是呢,它能够让啊,这个每一个节点跟这条线呢都尽可能的接近啊,这是线性拟合呢,它的一个主要的价值。接着我们来看, 除了新型礼盒之外,我们还可以做恩赐的多项式礼盒,恩赐的多项式礼盒啊,比如说呢,我们拿到这么一串数字啊,那么你呢把他图呢画出来一看, 这是不是明显的不符合这种现行关系啊啊,他不符合现行关系,我们就可以把它假设成一个恩赐多项式的关系 啊,那么你假设 y 跟 x 之间呢,满足这么一个哇,这么一个恩赐多样式的关系里面呢,有一串的系数,未知的系数啊, a 零 a 一,一直到 an 啊,我们的目的呢,就是要想办法呢, 找到这些 a 零 a 一一直打烟,使得这么一个差的平方和的取到最小值啊,那么呃,现在呢,我们不用自己去算,我们用 matalebu 软件里面的这么一个,呃,多项式,你和命令啊, poli 啊, xyn 往里面一输呢,就可以得到对应的结果啊,我们来看一个例子啊,比如说呢,这是我们有的 x 的对应的值,下面呢是我们有的 y 的对应的去值, 那么我们现在呢可以用啊 polixy 三来输入啊,我们用三呢,意味着我们要做的是一个三次多项式 啊,把它往里面一带的话呢,得到这么一串系数啊,那么这就意味着我们把这个 xy 啊拟合的话,我们得到的是下面这个多项式啊,一个三次多项式啊,一个三次。 其他的呢?其他的那些呢?这个比如说 x 平方向啊,那么还有呢长出像呢,因为呢呃他的系数太小,所以就把它撇掉了啊,就剩下这些啊,那么这是我们所做的这个恩赐多项式礼盒啊,恩赐多项式礼盒啊, 我们可以看看啊,效果好不好呢?呃,实际上呢,它呢能够吻合一些点数啊,但是有的时候呢偏差可能比较大啊,那么这就说明呢,可能呢在这个方法上啊,在这个数据上啊,我们要用这个恩赐多样式来拟合呀,可能效果呢不会太好 啊,这是说呢数据本身的这么一个问题,那么我们现在呢继续呢,把这个数据放在这,然后呢我们另另外一个礼盒的方式来做一做,我们来看现在呢,我们用的是一个五四多项式来礼盒啊,你 合的结果呢?得到这么一个结果啊,那么,呃,咱们再来画图看一看啊,拟合的效果啊,我们现在呢往往是要看图,然后呢,我们也可以呢啊,门太了,把这个命令里面他可以输入啊,相应的这个误差,结果啊,我们现在看图 啊,那么一看图啊,非常好,对不对?看起来呢?呃,我们这这个五四多,央视啊对这个数据啊,拟合的非常好啊,但是, 但是大家要注意啊,你在做多项式拟合的时候啊,这个密次啊,不要太高啊,往往呢是密次不要太高啊,因为什么呢?如果你密密次太高的话,往往可能会出现一个过拟合的情况, 我们来看多先生你和他的有这么一些的局限性啊,有什么样的局限性呢?首先啊,如果最高次密为偶数,而且他的系数 为正或者为负的话啊,就是最高次密啊,他的系数是正的,或者是最高次密是负的时候,会有什么现象呢?我们来看,如果你的最高次密是正的话,那么梯区于啊正负无穷的时候, 那么你的多项式的极限呢,都会趋于正无穷,对吧?啊,然后呢,如果说呢,你的这个最高侧面的系数是负的话,那么 t 区正负无穷的时候,或者说 x 趋于正负无穷的时候,那么你的极限都会趋于富无穷 啊。然后呢,如果说你的最高私密是基数,而且系数为正或者为富的时候,那么情况呢?跟刚才有点不一样啊,那么这个呢是系数为正的时候的情况啊,哎,在这个 x 区正无穷的时候,那么多项是区正无穷, x 区富穷的时候呢,多项是区域富穷啊,如果 说呢你的系数为负的话呢,情况反过来是这样啊,那么这就是导这个什么情况啊?如果你的数据啊,咱们说呢不满足这些特征的话啊,你要用高速多样式来做,你和那么往往呢会使得呢,我们要来做预测的话偏差会比较大啊,会存在这样的问题 啊,这是他的一个呃一个局限性啊,然后呢再一个呢我们用多项式来拟合的时候,我们不能保证啊,你取得的这个曲线呢,他就能够经过每一个已知的节点啊,实际上很多时候啊很有可能我们拟合出来多项式啊,他不经过任何一个已知的节点 啊,这他可能会有这样的情况啊,那么呃除了刚才的多样式礼盒之外我们还有其他的数据礼盒的方法啊,有哪些呢?我们来看啊, 那么如果说你发现数据具有明显的指数函数的特征啊,什么叫指数函数特征啊,你会发现呢增长啊越来越快对吧啊增速越来越快啊。那么像这样的情况呢,我们可以考虑啊用一个指数函数呢来做拟合,那就说呢 b 乘上 e 的 ats 方拿它来做拟合 啊,那么这个呢它不属于线性函数,拟合起来比较困难,我们可以怎么做呢?对它两边取对数,两边取对数的话呢,那么就做成了一个关于 x 的一个线性函数了,对不对啊?这样呢再去做你和就方便多了。 我们来看啊,假设呢原有的数据啊,是 x 跟 y 之间的这么一个函数啊这么一个数据,对,那么现在呢,我们把它呢转化成了 x 跟 long y 之间的一个对应关系啊,接着呢我们就来 计算啊, x 跟 long y 之间服从什么样的这样的呃线性这个关系啊,那么拟合出来之后,我们可以反推出来, a 是多少, long b 是多少,对吧?我们就可以得到呢,呃,这是所谓的指数拟合的结果。那么还有 如果说呢,你发现数据具有明显的波动特征,我们看啊他就比较明显的这样的波动特征,那么这个时候呢,我们可以考虑啊,用忽略变换的方法呢,来加以礼盒 啊,覆裂变化呢,本身呢也是来你和一些具有这种周期性波动的这种现象啊,那么呃是怎么做呢?假设 x 是一个数据项链,我们呢可以用这个命令啊, y 等于 fftx 啊,你把这个 x 的项链啊定义出来之后,然后呢用这个命令来做一个礼盒啊,那么呃 这个地方呢,情况比较复杂啊,所以说大家如果呃有这样的需求的话,那么就可以看一些专业的信号处理方面的教材啊,这是一些其他的呃数据礼盒的办法啊,如果说 xy 之间是更复杂的其他的表现关系,比如说 y 呢,等于 a 的 x 负二次方加上 b 啊,那么再有呢, y 等于上面有一个 ax, 一下面的有一个 cx, 二在分母里面,那么这个时候怎么办 啊?那么这个时候呢,我们就要想办法呀,呃对数据做一些变换啊,所以就需要对数据呢做一系列变换,变换之后再去呢讨论他们之间啊服从什么样的现行关系啊,总而言之,我们的目的呢,都是要做一系列的数据变换,然后呢把它考虑啊, 转成一个线性的,或者说呢啊,非线性的多项式的拟合的这样的关系啊,这样呢可以得出最后的结果了啊,那么这是我们说的这个其他的一些数据拟合的方法, 我们这样做的依据是什么啊?你注意啊,你呢可以参考文献里面,或者说呢做一些激励分析啊,那么你认为他们呢是服从这样的关系啊,比如说 y 跟 x 二具有明显的反的函数的关,这个导函数的关系 啊,那么你根据他的纪律分析的角度来分析他,或者说呢,你观察数据啊,观察数据,你发现啊,你猜测他会服从什么样的关系 啊?那么在这呢,我们应该怎么去做呀?我们要提出假设,然后呢做一些检验,检验假设对不对啊,如果对的话,那就没问题,就是这样的,如果一检验不对的话,那 好,你这个假设就是错的啊,要重新的再去做新的,呃,一些,呃,假设啊,好,这是咱们所说的这个数据礼盒的方法啊,好同学啊,我们这次课呢就讲到这啊,再见。

给 nasa 标准曲线 r 的 二次方大于零点九九就稳啦,别被这个数字骗了,它只能说明值,不能说明准。 那怎么判断标准曲线靠不靠谱?第一,看残差图,残差点应该在零线上下随机分布,要是残差有规律的变大或变小呢?说明线型关系不成立,可能是高浓度饱和了。残差绝对值有要求吗?有,通常不应超过最大吸光值的百分之十。除了残差还要看什么? 第二,看百分之九十五,自性区间,区间越窄,预测越精准。自性区间怎么看?低浓度区间不能覆盖零,全段宽度要均匀。如果低浓度区间下线是负值,说明那个浓度不可性,别用来检测低浓度样本。所以正确的判断流程是三步走,一 二个平方过基础,门槛大于零点九九二,分析残差分布要随机,偏差要小。三、检查区间低浓度不复零,宽度要均匀。还有选对工具很重要,轮舱设的以 lfa 式结合,会让你能更精准的评估曲线质量。

我们继续来学习过礼盒,搞懂了风险啊!咱们来聊聊过礼盒这个毛笔到底是怎么来的?技术团队又该如何去治理这个过礼盒?我们先说说原因, 用学生备考的比喻一看就懂原因。第一,模型太复杂,就像学生能力太强,不仅记住了知识点,连课本的装订线、纸张的纹理都记住了,抓错了重点。 第二个原因,数据训练的数据太少,学生只做了一本题型,题型见的太少。第三个原因,训练的时间太长,反复刷同一本题几百遍,越学越钻牛角尖, 对应的解决方案呢,也特别好理解。第一个方法呢,就是多找样体,收集更多元的训练数据,让模型见多识广。 第二个呢,要简化要求,换个没有那么较真的模型,强迫他关注核心规律。 第三个呢,就是要盘点规矩,用正则化的技术限制,死记硬背一模型总结方法。 第四个呢,就是要及时提炼,发现模型在脑体上的成绩不涨,反而钻牛角尖,立刻停止训练。 这些呢,是技术团队的活儿,你不用亲自干,但是得知道他们有没有干这些事情。

我们说模型礼盒度的这些, a g f i g f i, 然后 i f i c f i t l i 这些模型的这个相似性指标呢,我们都可以在这个这个公式里面跑出来,同时呢,相应性指指标 r m s e a 等于零点零八一,这个相应性指标也能跑出来,但是没发现,我在我们做模型模型礼盒度的论文当中的这个三星表格当中,除了这些指标之外, 我们还需要看到的就是这个 s r m r 指,这个相应性指标在我们刚刚的这个公式当中是并没有出现的,这里并没有 s r m r。 所以现在的话呢,我要讲告诉大家如何在这个界面之中去把 s r m r 给操作出来。那么首先呢,我们进入这个 dragons, 点击, 然后在这下面呢找到 standardize rmr, 然后出来一个框框,我们这个框框不要关闭,然后我们在左侧的这个界面当中再用这个 calculate 再跑一次数据, ok, 跑完之后你就会发现在这个框框当中出来了一个值,那么这个 standardize rmr 等于零点零 九八零,那就是我们的相应性指标。那注意哦,这个相应性指标的值并不理想,他应该是低于零点零八才是理想的。我们说这个相应性指标 s r m r 和 r m s e a 它们都得低于零点零八才是比较符合标准的,而我们刚刚计算出来是零点零九八,那这其实是不太好的数据啊,所以呢,还得要重新再去检查一下自己的数据包的问题啊。这个表格我们也答题讲完了,嗯,在整个表格当中包括这个自由度啊,还有后面的这些值当中我们的这个模型都已经体现出来了。自由度在哪里呢?自由度就是 这个区杠 square 除以 d f 啊,这个就是我们的自由度。你看,跑出来是我们的自由度,先跑出来是三点七。 yes, 那这个指标其实也是不合格的,而是要低于三,低于三,自由度一定要低于三,看小于三,我们这个指标才是比较符合规范的啊。好,那今天就讲到这。

老铁们,分段限行礼盒今天搞里头直接选中数据框框,对出三点图,点菜单来分析礼盒,限行礼盒弹出对话框直接选,从图 中选择范围,鼠标框选你要礼盒的那段数据点,确定横框直接选否,再点确定这一段礼盒线,直接拿捏死死的。接下来重复这套操作,分段限行礼盒直接框框搞定,一点弯路不绕,最后高低给图画个妆,妥活!就问你这操作简不简单?回答我, look at my eyes!

在感觉正的时候,高层拟合里有三个选项,固定叉、 t o。 曲面拟合如何选择呢?固定差记平移四、取控制点和测量点之间的高层差平移值作为固定的平移量 适用范围。当控制点将前车型的线性分布或者控制点只有一个或两个的时候,采用固定叉 to 算法的原理是在几个控制点的中心拟合出一个相对准确的 圆点,以这个圆点作为基准,假设测距内高差乙和值均匀变化通过北通方向的高层乙和值变化量来确定。带转换坐标的高层乙和值。 to 算法的适用范围是控制点大于等于三个,并且高差乙和值相对比较均匀,取快乙和值。 四、二阶多项式曲面拟合办法是纯数学的方法,它是将构成一层近似的看图一定区域内的各座边的曲面拟合函数计算出曲面拟合系数,进而推算出 发生一场和个点坐标之间的函数关系。他的适用范围是大于等于六个控制点的时候,尤其适用于标准起伏比较大的社区。总的来说,他们算法不一样,许愿你和更准确一些,但是需要他的重点更多。


开奖了,今天一条视频教会你如何使用 origin 做数据拟合,拿基础的点线图为例,点击分析,选择拟合,再选择限性拟合, 点击拟合曲线图,勾选致信袋和预测袋,最后点击确定,需要美化一下就再点击图片,选择符号,改变一下图案形状,大小,颜色, 再点击标签勾选起用,自己选一个喜欢的再勾选,若偏移超过则显示指引线,最后点击确定,点击图例单机右键,点击属性选择边框,将边框设置为五,点击确定就完成了。

老铁们这种隔壁姑妈看了都直呼好的现金礼盒怎么做?今天就来搞!里头看好操作,数据导进来后,直接来到右侧,直接点开 graph maker, 进来之后 a 列修的拖到 x, b 直接对到 y 站,点图立马就出来了。紧接着把公式选项全勾选上,再狠狠勾上直线和预测带步行直接拿捏,这不贼快!接着操作它 双击图里的闪点,先换个顺眼的形状,大小调到位,再给他对上妈祖律。姑妈看了都怪,切到标签选项直接起用勾选直引线标签形式选对应的 c 列,选中标签,按住鼠标拖一拖,整整齐齐排列,好看的贼舒服。最 后收尾,修细节,改样式,来点姑妈喜欢的颜色透明度,把边边角角全修理,利索搞定!就问你学费没?回答我, look at my eyes!
![WorldQuant工程师揭秘:如何用3个测试识别过拟合 WorldQuant官方防过拟合指南:系统讲解样本内(IS)与样本外(OS)性能评估的核心原则。提出80-20数据分割黄金比例,以及50%性能下降阈值和70%鲁棒性测试标准。详解Rank Test和Binary Test两大鲁棒性检验方法。强调简洁原则:≤3个数据字段、≤8个操作符、避免线性叠加。附跨区域测试技巧,帮助量化研究者构建真正可泛化的Alpha因子,避免回测陷阱。
#过拟合 #Overfitting[话题]# #样本内 #样本外 #IS #OS #InSample #OutOfSample #回测陷阱 #数据挖掘偏误 #前视偏差 #幸存者偏差[话题]# #Alpha因子 #因子研究 #量化策略 #策略优化[话题]# #交叉验证 #训练集 #测试集 #验证集 #泛化能力 #模型鲁棒性 #稳健性测试 #压力测试 #夏普比率 #Sharpe #适应度 #Fitness[话题]# #数据分割 #80-20法则 #时间序列分割 #滚动窗口 #RankTest #排序测试 #BinaryTest #符号测试 #性能衰减 #收益下降 #风险调整 #回撤控制 #参数优化 #超参数调优 #网格搜索 #贝叶斯优化 #特征工程 #数据字段 #操作符 #表达式复杂度 #简洁性原则 #奥卡姆剃刀 #模型选择 #信息准则 #线性叠加 #因子组合 #集成学习 #多因子模型 #跨区域测试 #地域鲁棒性 #市场适应性 #普适性 #量化研究 #Alpha挖掘 #策略回测 #实盘验证 #机器学习 #深度学习 #正则化 #Dropout #早停法 #EarlyStopping #学习曲线 #验证曲线 #偏差方差权衡 #BiasVariance #欠拟合 #模型容量 #数据泄露 #信息泄露 #未来函数 #点位选择偏差 #WorldQuant[话题]# #BRAIN #量化平台[话题]# #量化投资[话题]# #量化交易[话题]# #社区指南 #风险管理 #投资决策 #组合优化[话题]# #资产配置 #Python #Pandas #Backtrader #Zipline #统计显著性 #T检验 #置信区间 #P值](https://p3-pc-sign.douyinpic.com/tos-cn-p-0015/o4gAzVippIBYE4CAplqgfJiD0PIzeCpAC4N8lB~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2083010400&x-signature=TIu4tfVWG1AGmnIZEDrkqv1k47k%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=20260106064810A1DC256FC1CEDA87CD4A)