好,那我们紧接刚才的视频来讲述一下我们的 美赛 ct 版本三和版本四的一个具体的求解方式。版本三的话呢,是基于博弈论,用我们的 shepard 值分解的一个真人秀淘汰机制进行鉴摩和分析。具体来说呢,针对问题一,在已知每周评委评分与淘汰结果, 但粉丝投票未知的一个背景之下,文本的话呢,将我们的一个淘汰流程抽象为评委粉丝双方的一个策略博弈。基于呢,我们的神经网络集成与博弈论的一个均衡 联合建模来分段的呃,分阶段的估计各个明星每轮粉丝的一个投票数,并且的话呢,基于此,进一步的构建我们的 呃,进一步构建结果一致性的衡量指标,与我们的一个确定性分析体系实现呢,剩呃是最终实现的一个结果的话呢,是剩余一百九十余次淘汰,预测率接近百分之百,就是基本上与我们的一个实际结果是一致的。 相对来说的话呢,他的一个问题二的准确率是更高的,并且的话呢,我们纳氏均衡解呢,收敛充分且权重策略分明。这里这里的话呢,跟大家讲一下什么叫做博弈论建模,他的话呢,是一种比较常用的数学语言和逻辑框架 来形式化的描述分析和预测。在特定规则之下,多个理性决策者,通常呢,在可以简称为什么局中人或者参与者进行互动决策的时候呢,可能产生的一个过程和结果。 呃,如果不理解的同学呢,我们可以理解为什么战略互动一个 situation 建立一个简化的,但是呢抓住要害的实验室沙盘或者是数学模型,也就相当于是抓主要矛盾吧, 在此基础之上呢,结合我们的一个神经网络进行预测,采用的话呢是 纳审均衡迭代与收敛这样的一个规则来进行。我们可以看到我们的预一个预测结果的话呢,像这样的一个收敛率的一个数值是百分百,也就说呢我们的一个所有轮次均收敛了, 通过呢我们的神经网络特征分析,多层感知机学习曲线与投票结果的一个分布,也可以看出来 评委份额和这个 score 分 数和排名对我们的一个粉丝的投票率贡献是最大的。在这里的话呢,我是整体的准确率是百分之八十八十三点六二第一。呃,那个关于主流的 percentage 记分法在记一致性呢是达到了百分之百, 相对来说还是按照刚才的一个道理来讲,因为之前的话呢,可可能是刚开播节目刚开播采用的一个赛制,并不是说那么的公平和公正,所以说呢,导致我们的一个 准确率有所下降,基于还有就是基于我们的一个因为版一个样本量的一个太少,所以说导致的一种准确率的下降,这都是在我们的一个可接受范围之内的 通过呢。问题一我们就可以得到模型在主要赛季就是 s s 三到 s s 二十七赛季嘛,能够完全由评评委打分来复原粉丝的一个投票数 相当相当于是评委打分是比较公平的,并且能够推断出粉丝的投票分布。在不同选手赛季和周次当中呢,都具有较高的区分度, 精确度的话呢,有我们的一个表二及相关的图像,其实也可以看到,是不是我们的一个神经网络的一个泛化能力,还是相比来说是不错的。这里的话呢,我也跟大家 将我们的图像和代码都已经进行上传了,我们可以看到在我们的一个资料里面,就是每一个部分不同的呃,每每每一个题目里面呢,都包含的是我们的一个图像的分析,还有关于它的一个 结果的预测啊等等等,就是基本上来说我们就已经是全覆盖了,大家能够直接的就看出, 当然呃,当然的话呢,如果是还呃确实是可以通过就是对我们的一个 python 比较了解的话呢,也可以根据自己的一个理解自行的话呢,进行修改和可适化的呃和可适化的一个优化。 那么我们先来看一下关于第三个问题,第三个版本当中的问题一是采用的一个深度神经网络加上博弈论均衡框架跟大家运行一下, 还是大家一定要记得把我们的一个路径改了,不要用我之前的一个路径啊。这里的话呢,其实在我们的版本当中,按理来说问题一其实是有五个版本的,因为我是之前又生成了一个关于生存分析,加上我们的一个呃 copper 依赖 产生的,其实他的一个结果也很好。但是的话呢,在我们的跑代码的过程当中,我感觉问题一的话呢,如果你的电脑性能不是太好的话呢,尤其不是不是游戏本的话,估计得跑很久很久。呃,在我们的这个地方我是采用的是我们的一个超算,用了两块 四零九零,加上我们的一个三百 g 的 内存才相对来说是跑的比较快的。所以说呢,我就并没有把我们的像生存分析这样的一个方法放入放入到我们的一个主流方法当。呃,过程当中一方面呢,也是考虑到大家的一个复现确实是不太容易的, 所以说呢,这呃这一块呢,我就没有放,仅供一个参考。就说呢,如果是想再再再进行一个模型优化的话呢,其实是可以采用这样的一个方式的。 嗯,跟大家看一下,这个确实是比较慢的,就是他跑一个赛季,呃,他跑一个赛季用我的一个电脑,如果不用超算的话,我的电脑是四零六零的,跑差不多半个小时才跑了, 才跑了是七八个赛季还是多少?反正就是相比来说是比较慢的。所以说呢,呃,咱们就不推荐了,因为万一出现了一些差错,你要再继续再进行跑的话,那是确实是比较浪费时间的,那我就直接在这里进行。呃,直接在这里停止了。 好。问题二的话呢,其实也是基于我们的博弈论 shapley 值模型与我们的一个机制公式进行一个简单的设计啊。这里的话呢,在问题二过程当中 还是对于我们的一个排名法以及百分比法进行综合的一个计算。这里的话呢,采用的是 shapley 值进行一个权力的分解, 结合典型争议选手及我们的一个特特殊的赛制案例,系统分析评委与我们的粉丝的影响力,权力平衡和公平性的一个差异, 那么 shapley 的 值的一个计算逻辑是什么呢?就说呢,为了公平,那么我们 shapley 就 认为一个人的最终分配份额应该是他在所有可能的加入顺序当中所带来的一个边际贡献的平均值。这里的话呢,我就不具体 太多赘述了,因为一说又说多了。这话呢,和我们之前如果有数学能力比呃数学基础比较好的同学的话呢,可能稍有了解,如果不理解的话呢,大家可以自行的去 c s, d n 或者是百度谷歌上进行搜索来了解一下我们这样的一个机制。 这里的话呢,我让玩家设定就是说呢,核心决策参与者仅包括评委团阵与粉丝群体 f, 每回合呢,可以选择只依赖评委评分,只依赖粉丝投票或者是两者结合的一个三种机制 来分别应用设置评委联盟、粉丝联盟和我们的完全联盟。通过我们的一个结果显示呢,其实可以看到百分比法,百分比法提升提升粉丝发言权并缓释极端争议,而我们新增评委拯救就是我们的一个插件 c 五, 他确实呢能够降低我们的一个分歧率,并且的话呢能够降低十九个百分点,相比来说是一个非常呃大的一个进步啊。所以说呢,推荐还是用百分比法和评为保护为我们的问题二当中的未来优选方案是不是和我们之前的一个结果也是保持一致的? 嗯,这里话呢就不过多叙述了。那么问题三的话呢,其实也是一样的,只不过呢还是一托的是 shift, 呃, shift 值的一个分解,通过量化明星的年龄,舞伴胜率等等等等各种因素来判断一下它的一个影响。 通过我们的一个分析结果呢,我们可以看到年龄是影响最大的因素。在这里的话呢,其实和我们的第一个版本是相匹配和相符合的,同时的话呢,我们的 舞伴胜率是次之的,评委的话呢,其实更偏向于我们的一个技术,而粉丝则倾向于亲和力及其故事性。粉丝的话呢,其实肯定是带有一定的滤镜的,他不管你的实力怎么样,只要你喜欢他,那么肯定在后面的话呢,对他的一个呃, 对他的一个投票或者是支持度一定是最高的。并且的话呢,在舞伴经验上展现出偏好的一个分歧,能够有效的解释淘汰机制当中的一个群体心理权重问题,还是关于群体喜欢谁就投谁,并不是按照我们的一个专业技术来的。 这个的话呢,就是关于我们的问题三当中的一个结果,那么问题四当中就是采用了在问题三的基础之上还是动态权重加评委保护,因为问题四的话,我感觉其他的一个效果都没有那么的好,我认为还是 就是结合基于之前的一个结果,我们采用的是 d 八 d w v s 的 动态加权与评委拯救机制,是最好的一个关于问题四的解决方法。呃,当然的话呢,它的一个效果确实是不错的,所以说呢,我还是通过这样的一种方式。 呃,在我们的不同版本当中,我的问题四的格式化的结果也是不一样的,当然权重不同,他的一个加分不同,采用的方法不同,因为你一二三问的方法就一二三问的方法不同,导致了你的粉丝的一个投票,总投票数的不同,也间接的导致了我们的问题四当中的一个各种 评分的不同,这些的话呢,都是正常情况,这里的话呢,综合得分就相对来说比较高了,能够达到我们的八十二点一分,这个就是我们的问题。呃,第三个版本,接下来来看一下版本四 版本四的话呢,是用了一种新的方法,是基于信息论与自适应策略的一个模型的优化和摘药啊。这里的话呢, 我们来具体的看一下问题的话呢,我就不多叙述了,因为已经讲了很多遍了。那我们来直接看一下问题四是具体来说用什么样的一个方法,它的话呢,其实是构建的是最大商原理下的一个投票分布的反推框架, 就是我们的一个最大商推断模型的一个理论基础。通过这样的一种方式, 呃,大家在写的时候也不一定按照我的一个方法来啊,其实可以大家从网上搜索,或者从知网,呃,谷歌学术等来搜索一下关于我们模型的原理部分,然后 根据自己的一个实际理解进行整理,因为如果所有人都用这一套的话呢,也有可能会导致我们的查重率是比较高的。呃,关于我们的一个最大商推断模型, 嗯,简单来叙述一下它,其实呢就是一个将我们的一个信息论,也就说信息商嘛和概率论以 和我们的统计推断完美结合的这样的一个思想框架,用一句话来简述,就是说呢,在已知部分信息 就是就是在我们的一个约束条件之下选择呢是最均匀最无知最不确定的一个概率分布,也就是我们商的定义就是商最大的一个分布,作为我们的最优推断模型,这个呢通常来说是一种比较保守和客观的推断原则。 呃,他的话呢,在我们的一个实际的应用场景当中也是比较常见的。好,通过这样的一种方式的话呢,我们就能够 来呃,得到了一个问题一,问题一,先用最大商原理,然后呢再来消除约束与联合分数,就是每周实际淘汰选手为我们的一个综合分最低嘛, 然后采用的是 k l 散度和信息增益来刻画我们的。呃,为了刻画模型的一个确定性嘛,就是引引入了这样的一个分布来计算出它的一个距离。通常来说的话呢,是采用的均匀分布,之后的话呢方面我们采用叠带比例拟合的一个方法来进行 后续的一个操作。这里的话呢是涉及到的概率论和梳理统计比较多,可能有很多我们不并不是这个专业的同学,我跟大家简单的讲述一下什么叫做 k l 散度和信息增益吧。呃,其实我们的 信息增益就是从某个初始之出发,在观察到我们这样舞蹈的一些数据之后的话呢,它的分布是发生了改变,这种改变 所对应的就是我们的 kl 散度,也就说呢,我们的信息增益是 kl 散度,在特定场景之下,比如说我们的机器学习当中的决策树用的是比较多的,通常来说的话呢,都是通过信息增益来判断出我们最终呃决策树 呃训练流程过程当中,它是属于哪一类啊?呃或者是什么分类或者回归模型的一个预测。 而我们的 k l 散度呢,就是衡量两个概率分布 p 和 q 之间的一个差异程度的非对称性度量。 什么意思呢?它表示呢,当我们用分布 q 来近似真实的分布 p 时,它所损失的一个信息量,通常的话呢,用我们的比特或者纳特为单位, 这里话呢就简单的先说一嘴吧。然后呢用我们的一个每周最大商粉丝投票分布来求解。对于每周活跃的一个选手 n 评委的一个评分进行归一化之后,那么我们呢来进行了一个解数, 这里的话呢,就是我把我们的一个伪代码也写出来了,方便大家了解一下它具体的一个过程,就是收敛之后,那么我们是如何进行投票来算出我们的一个概率分布的? 那么我们在问题一当中他的一致性,呃一致性性能的一个评估,以及模型的一个准确性指标,可以看到我们的模型结果预测每轮淘汰的一个准确率是相对来说也是比较高的, 能够达到九十七点八,在这里我们可以看到图像当中九十七点八相对来说还是不错的,呃具体的核心结果大家可以自行拿到资料之后来自行的来,自行的去再阅读啊。那么问题二的话呢,就是 还是根据问题一呃的投票估计来进行呃来进行我们的一个预测, 这里话呢,其实都是一样的,还是通过就是问题一当中的信息增益、信息商以及信息贡献贡献率等之类的进行繁衍和推理,得到的一个结果的话呢,是我们的分歧率是百分之十点八,相对来说还比较少的。 嗯,后面的话呢,就是关于我们的争议选手他的一些拯救角色,什么意思呢?就是说其实像像这样的一些有争议的一个选手,最终呢都是其实是有我们的一个粉丝支持的,他们粉丝量比较大,所以说在面临这样的一个争议的过程当中,他们也能够取得一个不错的成绩。 问题三的话呢,还是就是通过这样的一种信息论的因素分析模型,来 通过信息商和信息增益等方式来看一下哪一些因素对我们的最终的评判结果是有较大的一个影响的?通过我们的这样的一个好呃,通过这样的一个规则的话呢,我们能够看到 行业因素对粉丝投票的一个信息量贡献率呢高于评委的两两倍以上。那么我们的一个信息通道分 分解呢,也能够显示出评委与粉丝的评价标准的具体的一个本质差异,相关性有限,以及强调后续选拔的过程当中及机制优化,同时考量技术与娱乐性。在这里话呢,行业差异这里边其实我是分了一个, 我是分的稍微比较细啊,跟大家来简述一下一个代码,因为我们的行业过程当中它可能有不同的,比如说是演员,它有男演员和女演员,在这个过程当中我们要注意一下 具体的一个划分啊,其实呢,不管是男演员 actor 还是 act actress, 它都是属于我们的呃一个演员的一个行列范围之内的。所以说呢,在这里画的我们并不能够分开去论述,而是把它们归为一类。 还有呢就是关于我们的一个 singer 或者是 rapper, 就是 唱说唱的还有歌手。其实在这里的话呢,我也是分成一呃分为一类了,毕竟唱我们的说唱的其实也相当于是一个歌手吧,这里的话呢就是它的一个分类标准,我们要掌握清楚,具体的话呢,代码呈现我跟大家稍微找一下。 好在这儿啊,就是我们可以看到就是说如果是歌手或者是 rapper, 然后或者是呃 musician, 我 们都返回我们的一个 music, 叫音乐家, rapper 和 singer, 歌唱家,什么说唱家还有什么的,我们都统一地归为我们的一个 music 这样的一个行列, 像 actor 和 actress 我 们都归为我们的 acting, 然后像 assassin 运动员嘛,还有我们的 rsi, 像这样的一个跑步竞技选手,我们都分分布到我们的体育行业过程当中,通过这样的一种形式呢,能够帮助我们更好地来分析出行业的一个状态。 呃,接下来的话呢,就是我们来呃结果的话呢,我啥的我就不讲了,具体我们直接来看一下问题四吧。 问题四的话呢,就是根据信息分布与竞赛透明性的一个痛点设计的一个 a i w 自适应的权重系统,和之前的动态加权是略有一些差别的,它的话呢是按照投票分散度和评为意见分歧动态来调节双方的一个决策权重, 它相当于是动态权重调整的过程当中的一个细分,就采用的是一个自适应权重系统吧,它能够通过自适应的进行调整来选择一个相对来说的一个局部最优解等方式。 保证呢,我们在保证呢,我们的一个结果在可行性的一个约束之下兼具公平性和娱乐性。 系统呢,有效的降低争议指数是六到九,相对来说还是比较高的。 咳,嗯好,以上的话呢,就是关于我们的呃美赛 c 题当中版本三和版本四的一个具体的一个解析,如果大家想获取资料的话呢,可以关注我们的 b z d 数码社公众号进行获取资料的一个获取。
粉丝2555获赞1.6万

有人说主播,主播为什么不选择 ct 而选择其他题目?首先我们组考虑的是就是美赛 ct 选择人数是最多的, 就是数据不用自己找,然后文献查一查就可以了。那我竞争压力肯定是税大。所以我们组就把 ct 排除了,虽然我们上次练习的是 ct, 然后这次并没有选 ct, 虽然这次可能是我们组选其他题目也不一定能拿到一个比较满意的奖项, 但是尽力就好。不知道有没有兄弟?兄弟在那个 b 站或者。嗯, qq 上买了助攻啊,不知道有没有?不知道有没有兄弟买助攻怎么样?好用吗?

好,大家好,那么这个视频呢,跟大家讲一下本次美赛啊,我的选题建议以及各题目的这个思路啊,那么我这里已经准备好了一个十一页的啊,这个思路文档,呃,包括 a t 幕和 c t 幕,我个人精准校对之后的啊,这个翻译, 呃啊,我都跟大家去讲,那么在这个思路的讲解过程中呢,我也会把啊大家可能会忽略到的一些关键的信息和雷区注意点,我全部都会跟大家一一讲清楚啊,请大家务必有耐心的把这个视频呢仔细的去看完啊,防止大家在做起过程中呢挖到什么坑。好,那我们首先来看一下这个选择题建议, 那么我们这次选择助攻呢,是 a 题目啊,以及这个 c 题目,那么后续呢,都会完成这两道题目完整原创论文以及相应的代码和结果啊,这个呢,跟我往期的这个比赛都是一样的啊,大家可以继续看我往期的这个视频啊,我现在发布的是这个选题建议和思路视频,那么后面呢 啊,我们预计会在明天,也就是一月三十一号的中午左右就会更新完毕。呃,这两道题目完整的原创论文以及相应代码和结果的这个 教学,那关于这个后续完整成品的说明呢,大家可以看这个视频的评论区啊,这好的不多说啊,我们来看一下这个选择题方面,那么这次这道的六道题目呢, 呃,这个 a 题目啊,是比较硬糙的,加一个智能手机电池的耗电建模,这个呢,题目也明确告诉我们了啊,就要建立一个连续实践数学模型,这个其实就是微分方程模型,这是非常非常经典的啊,大家如果说,呃,你们有受过学校的建模比赛的话,这就是其中非常经典的这种微分方程类的问题。 再一个非常经典的这个题目就是 c 题目了啊,也是往年大家每次都选择最多的这个题目啊,就是纯数据分析类的题目。这次的 c 题目呢,呃,也比较复杂一些,因为它里面有很多规则,包括这个数据说明 啊,这个数据本身呢,也比较复杂一些啊,就是我们或许要去读取和这个处理比较复杂一些,所以呢,在我稍后的讲解过程中呢,我也会把我们在所有的数据读取中啊,可能会出错的地方,我们需要去关注的一些啊,关键的信息和雷区注意点我都为大家讲清楚,好吧, 好,那其余一个题目呢,我不推荐大家去进行选择啊,因为呢,呃一方面获奖率并不高。呃,再就是呢,可能有的题目比较水一点,比如这个 b 题目呢,这个利用太空电机系统建立月球直径。 呃,这道题目呢,估计很多人可能会用 ai 去做这个,呃,就稍微水一点,然后这次的 i、 c、 m 这三道题目啊, d、 f 这三道题目。呃, d 题目的主要难点呢在于我们要去收集一些相应的数据。呃,这个是比较困难的,那再去这道题目呢, 就我们能够采用的模型也比较有限啊,就你想要做的出产的也比较困难啊,比较有限。然后这个 e 题目,被动式遮阳和这个 f 题目啊,这个 e 题目呢, 呃,难度其实并不算高,而且主要是建立这个非稳态的热平衡方程,这个呢,在以往的建模型材里面呢,也比较多一些,但这次这个 e 题目呢,如果我们从横切去从这个获奖角度而言的话啊,眼目图眼大剧进行选择啊,包括这个 f 题目也是一样,这个 f 题目呢,呃, 一方面我们要去收集一些这个相应数据啊,这个稍微能困难一点,再个用这个 i 题目呢,也比较能做得出彩啊。总归呢, 这是为什么推荐大家去选择 d 题目和这个 c 题目呢?因为这两个题目呢,呃,都是大家这次比赛呢,比较容易做得出彩的啊。这个类型的题目, a 题目比较容易做得出彩的地方在于呢, a 题目比较硬核一点啊,我们只要建立合理的违反方程,那么后续呢,我也会跟大家去讲这个啊, a 题目详细完整的建模思路。 好啊,包括一些相应的数据呢,我已经完成了初步的这个收集啊,其这道题目的数据呢,只需需要去收集一些新的参数就可以了。好, 这个呢,做好的话呢,咱们大家这道题目的获奖概率呢,还是很高的好吧,呃,然后就是 ct 目啊,这个数据分析类的题目,呃,我们只要去啊,把各种我们能考虑到的啊,这个数据的参数呢 和注意点我们都落实到位。再一看美国,我们建立合理的注出页模型啊,把题目每一问都解达到位,那么这道题目的扩展率呢,也是比较高的。好,那么选题建议呢,就讲到这里,那么本次的 a 题目和 c 题目呢,我们或许都会完成这个完整的原初论文集现在代码和结果。那关于这个完整的整理的说明呢?大家可以看这个视频的评论区,我们有机会在明天就是一月三十号的中午左右就会更新完毕。 呃,这两个题目完整的原初论文集,现在代码。好,那么废话不多说,我们现在来看一下这个 c 题目的思路。 好,那么这个视频先给大家讲一下这个 c 题目的思路,那么稍后我会再发布的视频去讲解 a 题目的详细思路啊,大家敬请期待。好,我们来先看一下 c 题目。 c 题目呢啊,这也是我人工教对之后的一个精准的翻译版本 啊。呃,因为这样节目的翻译是比较困难的啊,大家容易很多地方出错,如果用 g 翻的话,简直得有一个完整的啊,这样的一个翻译版本。那关于这个, 好,我现在讲解的这个思路,文档呀,包括 a 题目啊, c 题目啊等等的这些人工教对的翻译啊,文档啊,包括这个完整的说明呢,大家都可以看这个视频的评论区。好吧,我来看下 c 题目,那么几乎被讲的我就不多说了。好吧, 他第一位呢,向我们开发一个数学模型。呃,然后呢,为每位参赛者在他们参赛的周四中生成估算的粉丝投票数,那么这个粉丝投票数呢,他是未知的,且被严格保密保守的秘密。就题目给我们的这个数据呢,它里面是只有这个评委的投票数啊,评委的投票数是给出的,但这个粉丝投票数呢,他是完全没有给出的。 然后大家这里面有分了几个子问题啊,一方面是问我们这个模型是否去正确估算了,导致与每周谁被淘汰的结果相一致的粉丝投票啊,提供一个一致性的度量。再一个呢,我们生成的这个粉丝投票数呢,有多大的确定性?那么这种确定性呢,我们要去进行度量。好,我们来看一下这个 ct 目第一问的这个思路, 那么其实呢,整个这个 ct 目呢,它的核心难点就在于我们的粉丝投票数据呢,它是一个未知的引变量啊,我们是只知道粉就是评委的打分和它的输出,输出呢就是谁被淘汰了嘛,对不对? 我们需要根据这两个呢去反向推导出我们粉丝投票的分布,这是我们的这个问题的核心难点所在啊,也是我们必须要去完成的一步,就是我们第一步呢,先把这个完成,之后呢,我们后面呢才有的做,能理解吗?所以我们基于这个推导出的数据呢,才能够进行后续的政策分析和模型优化。 好,我来看一下啊,针对于问题一,问题一呢,这个估算粉丝投票模型呢,这就是一个参数估计和引变量推断的问题啊,那么这里的模式给大家讲这种三种方案,这三种方案呢,首先第一种方案啊, 就是这个用限行规划或者约束满足模型,那么我们这个呢,就是说把每一周的比赛看做一个方程组,那么假如说每位选手某位选手被淘汰了,而另一个选手就晋级了,那我们当时呢,是必然满足当时的规则约束的啊,比如说他的这个得分啊,是比令格高的,我们把这个粉丝投票占比呢作为决策变量来满足啊,所有淘汰约束为条件 去建立一个优化模型啊,我们建这样优化模型啊,我们的目标函数呢,就是去最大化粉丝投票分布的方差啊,或者最大化商议,就是说在没有信息的时候是最随机的,然后我们去做一次性检验就可以了, 就是计算模型生成的这个排名呢和实际排名的这个系数啊。那么这种思路他的优点呢,就是在数据推导上是比较严谨的,而且我们呢能够生成出一个可行解。那么缺点呢,就是在于他对于排名真的涉及到这个主规划问题就求解呢,是比较困难的,而且可能会存在多克几。 那么在针对于这个本次竞赛而言呢,呃,这个竞赛的潜力还是比较高的啊,就是得分潜力,呃, 就针对于以往这种剑魔比赛而言呢,这是一个比较标准的这样一个运球学剑魔的方式呃,结果是比较稳健的。那么另外一种也是我这次推荐大家去选择的这样一个做法呢啊,就创新性比较强的呃,也比较能够呃帮助大家去进行获奖的这样一个, 我这样去打讲吧。那么第一种方法呢,可能竞赛的获奖潜力就是 h 奖啊。那么第二种就是美赛评委比较喜欢的这种创新性比较强的做法,那我们的这个思路呢,其实就是贝耶斯马尔可夫列蒙特卡罗方法, 我们这个时候就是说不由不要求去求一个单一的追优解,而求这个粉丝投票的概率分布啊,我们假设粉丝投票呢是服从某种鲜艳分布的,然后我们根据每一周的淘汰结果呢,作为观测数据去更新我们的后焰分布啊,正是它的这个相应数量形式。 然后我们过去呢,可以去啊,去研究他这个确定性度量,那我们这个确定度呢,度量呢,就可以直接通过后验分布的标准查或者这些区间去回应题目中关于这个确定性度量的问题,因为这个题目呢是明确要求我们啊,要去看一下我们这个粉丝图标总数呢,有多大确定性的 好。那么这种方法呢啊,它的优点呢,就是我们可以去完美的回答关于确定性的提问啊,而且在理论的这个思维程度上是比较深的,这个难点就在于它的计算量比较大一点,然后代码编写复杂,但这个呢,大家不用去管啊,我这个代码呢,我会呃去完成这个十一的编写,然后大家到时候直接运行我给出的这个 python 代码就可以了 啊,还是跟以往的时候比赛一样,我都会给出这个代码和结果的。好吧,那么这个在竞赛获奖前提方面呢,基本上是能够拿到 m 的 o 奖的。就这个思路方面, 这种模型呢,在求解这种不确定性的繁衍问题上面,基本上可以说天花板了啊,就顶级方案啊,当然还有一种思路呢,就是采用奇葩式模拟或者说遗传算法。呃,这个呢,结果是疑心比较大一点啊,这个我们作为一个备选方案啊,就是说假如我们前面两种方法呢,真的要做不出来的话,就根据实际数据学求解啊,很难跑或者跑不出来的话 啊,那么可以作为一个备选方案。好吧,这个就不跟大家多讲了,来看一下他的第二问。待会他就问呢,让我们根据这个粉丝投票估算值和其余数据啊,就说现在我们这个数据已经得出了,对不对 啊?那包括其他数据,然后根据这些数据呢?我们先汇总完了之后往下看一下,开始让我们去比较和对比节目使用了两种结合屏幕和粉丝的方法啊,解决出排名和百分比在各级产生的结果,然后如果能在结果上出现差异的话,那么是否有一种方法似乎比另一种更偏向于粉丝投票啊?当然再就是我们去检查应用于特定领域的投票方法, 那么然后说世界名人身上呢,都存在争议,也就是存在这个分歧,大家问我们的结合评委方法和 vs 投票的方法呢?是否会导致这个结果相同?再一个就是加入评委,选择淘汰倒数两对中哪一对的额外方法会产生影响结果。这个答案看不懂啊。这个后后面关于数据的注示啊,以及投票方案的制定里面, 呃,人家都有跟大家详细讲,当然大家如果这个呢看起来比较复杂一些,大家可能会听不懂,没关系啊,我在后面呢,我有一个汇总了整个这个关键信息,以及每一问里面我们可能要去注意的一些关键的鉴摩点和注意点,我一会跟大家去讲吧。好吧,呃,我们先来讲下这个思路啊。好, 第二问,我们就是做这样的一个交叉验证模拟,呃,其实我们问题一呢,现在已经得出了对不对?我们就是只是根据问题得到这个推断数据呢,去进行反式式的推理就可以了啊。行,我们第一步呢,我们该先做这个交叉验证的模拟,我们建立一个仿真器,然后我们的实验组啊,第一 就说针对于这个,我原来是百分制笔制的这个数据呢,我们去应用排名制,然后针对于原排名制的数据呢,去应用百分笔制啊这样的一个规则。 ok, 这个我们可以解答呢,是否有一种方法似乎比另一种呢更偏向于粉丝投票问题?好,那么关于第二个看一下 啊,就这个针对于特定案例的分析啊。好,那么前面一个呢,我应该跟大家讲清楚了啊,就是要去后面去做一个偏差度量嘛,就定义一个评委友好度的指标,然后去比较一下这两种机制下这种指标的差异啊, 来看一下是否是会存在啊,这个粉丝一边倒去覆盖评分的这种情况。那么另外一个,接下来针对于这个针对特定案例的一个分析,我们先去提取出来这些人的这个数据,然后我们集中在于以下他们在另一种规则之下的这个新生存概率 啊,嗯,针对于这个加入评委选择抛开倒数两对中啊,哪一对的额外方法呢?会如何去影响结果这样一个问题呢?哎,这里呢就是说关于这个评委拯救环节啊,这就这个条件概率问题就是假如说某个人在某个模型中啊,落入倒数两瓶里面, 并且他的评委分呢是高于对手的,那么假设他被救回来,回去分析一下这是否改变了最终的结果就可以了。那么这个问题二的鉴物术呢,是比较确定的,就说只要问题的数据生成好了啊,那么问题二呢,主要是进行统计和进行逻辑判断啊,思路是比较确定的,来看一下问题三, 问题三就是说使用我们的粉丝投票估算值数据呢,去开发一个模型,来分析各种职业舞者以及数据中可用的名人特征,比如年龄啊,行业啊等等这些影响,然后去分析一下这些因素呢,在多大程度上去影响了名人在比赛中的表现,以及他们以相同的方式影响,是否是以相同的方式影响了评委的评分和粉丝投票。好, 这个呢就是一个典型的回归分析和归音分析的问题,那么这里呢有两种方案,一个呢就是这种混合效应分析 好,我们可以把职业五指呢设定为随机效应,然后把明星特征呢设置为一个固定效应啊,然后呢给出具体的模型,我去分析一下啊,来看这两个方程的,这个评委和粉丝两个方程里面呢,系数悲叹的显著性和大小啊, 来看一下这个系统呢,在这两个模型中呢啊,它们的是否显著的这个问题啊,那么这个呢是我比较推荐大家去进行选择的啊,这种混合效应模型呢,是比较能够去啊,比较好的去处理面板数据的,比普通那种心灵回归模型呢是要好一点了。那么另外一种方案呢,就是这个随机森林或者是啊叉子 boss 啊,其实就是基于树的那些模型啊,比如角色树啊,随机森林啊,就是基于呃树啊,对这种模型 积极学习模型。那么这个呢,就比较无脑一点啊,应该大家大家做过数据分析的题目应该都懂啊,就是你直接把它导入进去,然后跑一遍,就可以得出每一个侧重对于结果的贡献度了 啊,这个呢,优点呢,就是我们能够很好去捕捉非现金的这种关系啊,就直接周谷会跑出来一个重要性的排行啊,这个大家做过数据分析类和积极学习的人都懂, 那么这个呢,就是缺点就是它的解释性能差一点啊,就是我们不能从内部的机理和因果关系呢去很好的解释啊,我们只是跑出来这么一个结果,就传用数据进行驱动啊,这个呢,我后续这样的方案我都去做一下吧啊,看一下哪个效果更好啊,当然目前我推荐的是这个,大家去选第一方案是核像也模型好, 那么最后呢,就是要去提出这个新赛制的嘛,对不对啊?提出抑郁症,每周使用粉丝投票和评委评分的这样的一个系统 啊,让这个系统更公平,或者是在某些方面更好,比如说让这个节目更刺激啊之类的啊,我们自己去选择一个目标,然后呢,哎,去提出一个新的系统就可以了。好, 这样呢,大家就比较自由了啊,有很多种方法,比如说啊,你可以采用加卷法啊,这个理由呢,就是说,呃,好处呢,就是我们可以兼顾名次和表现的差距啊,我们保证每一跳都有这个价值, 要么呢,我们就基于等级分的这样一个动态权重系统,哎,我们随着赛季的进行呢,评委评分的权重呢逐渐降低,然后粉丝权重呢逐渐升高,这样的话,只是大家越看越刺激了,越看越刺激,呃,我们的目标就是追求刺激,对不对?那么再就是啊, 我们可以结合这个评委拯救啊,比如说啊,我们的评委分如果说排名前三的话,那么本周啊,那么无论粉丝投多少票都不会淘汰,我们可以保证那些技术最好的选手呢进入决赛,并且呢同时呢剩余的名额呢交给那些粉丝去进行,我们这个投票就是兼顾了这个公正与这个观赏性 啊,这个呢,大家比较自由了啊,这个关于这个新赛季的提议,大家可以再去提出一些其他的方案,我这里呢也只是给出三种啊这个建议啊,那么在整体的建议上面呢啊,呃,我们大家必须要拿下分,是问题一和问题二,我们要去构建一个稳健的将这个蒙特卡洛模拟框架,去解决这个数据缺失的问题。 好,再一个就是我们后面会拉开差距的分啊,就是会让大家拉开差距的分,一个是问题一的不确定分,不确定性分析是比较重要的,然后呢,问题三的这个混合效应模型,这两个呢,我们在过程中必须要去展示非常漂亮的啊,这样一个自信区间图和系数显著性的这样的一个表格图啊。好, 接下来我给大家讲一下这个题目,我们的一些关键信息和雷区以及注意点,你们大家可以看到呢,这个题目呢,呃,这个数据的注视啊,描述,关于数据的这个描述注视啊,然后包括呢各种投票方案的势力,以及一些规则啊,规则,比如说呢他 啊,这个 a 值是什么意思啊?零分是什么意思等等这些东西,这个是非常非常复杂的,所以呢,我把题目中一些比较关键的信息和连续注意点呢给大家提取了出来啊,那么在视频的后面呢,我来相信大家去进行一个补充啊,防止大家容易踩坑的点。好, 首先是呢魔剑魔里面最容易出错的地方就是这个关于规则变迁的时间线,我们的代码呢,必须要能够根据我们这个赛季呢则自断的去自动切换它的计算逻辑阶段一就是这个排名制,它这个使用赛季呢,是第一赛季和第二赛季啊,这个逻辑呢是这样的 啊,排名制他们的淘汰规则呢?是这样的啊,我就不给大家多注注了吧,好吧,据说数值越大的排名呢越靠后,然后呢他数值越大的就会被淘汰,就这个投票排名制的同排名的制,这个题目里面的这个我后面也给大家讲了啊,后面也跟他讲了, 就说排名越大越靠后。好,那么这里呢我们要去注意一个问题,那如果说我们的总排名是平局怎么办呢?这个题目是没有说的啊,我们需要去进行一个合理的假设,这也是大家需要注意的个点,就是如果说排名出现了平局怎么办这样的一个问题。 好,那么另外一个就是基站案也就这个百分比值,这个呢是在第三赛季到第二十七赛季里面去啊,然后这里是他的这个排名的逻辑 啊,就是各自有各自在帮占比的这个百分比。那么啊,评委分是这样的,某选手的评委分,我们这个百分比的设定呢,就是说这个百分比的设定呢,就是说意思就是说啊,评委分的百分比,就是说某选手的评委分除以当中所有选手的评委总分, 当然了另外一个就是这个粉丝的这个百分比呢,就是说啊,这个选手的粉丝票数除以当中总粉丝的票数。好,我们它的规则呢,就是说 数值最小者被淘汰。接待三呢,就是说啊,从这个第二十八赛季到第三十四赛季,这题目是假设从第二十八赛季开始啊,就是具体的是从哪一个赛季开始的,是并没有说的啊,题目里面说的是假设哦, 那么这个呢,是重新回到了排名至区区三,咱们综合排名这里呢,关键差异呢,就是跟我们最开始的这个排名的这关键差异呢啊,就是有一个综合排名倒数两轮,这个选手呢会进入生死 pk, 那 么最终会淘汰谁呢?是由评委现场投票决定的,而不再是由综合排名决定的,能理解吗? 虽然在在我们建模里面会有产生一个影响,比如说在第二十八赛季到第三十四赛季的这个逆向推导过程中呢,如果说某一个人排名综合排名呢,是倒数第二,但他没有被淘汰,这是非常合理的,因为评委把他救了,他能理解吗? 好,那么另外一个问题呢,就是在我们数据清洗和处理方面会存在一些雷区。首先是关于零分的这个含义啊,比如数据中呢是零的,就代表这个选手已经被淘汰了, 然后呢评委人数的变化,有的时候呢可能是三个评委,有的时候呢可能是四个评委,在这个处理方面呢,我们就不能直接用总分了啊,我们必须得去归一化啊。再有个关于这个小数的处理问题, 包括这个 na 值, na 值呢代表的是缺席啊,这个评委或者说休赛周,这个呢,我们在主取出局中呢啊的时候呢,要进行剔除啊,最后呢就是多余一人淘汰,或者说无人淘汰啊,这只是我们相应的处理。 好,那接下来给大家讲一下每一问啊,我们前面的思路已经跟大家讲过了,我们接下来要讲一下每一问的这个注意的点,那么在问题意义里面呢, 前面的思路我们给大家讲过了啊,这点重点就在于我们如何去回答这个确定性的问题,那么有些中呢,这个评委的分叉是很大的啊,粉丝投多少票都破去改变它的结果,那么这种情况下呢,它的确定性是比较低,大家能理解吗? 那么另外一种呢,就是说评委分是比较接近的,所以呢粉丝投票的微小变化就会导致他们的排名会出现很大的变化,那么这种数据呢,就会意思就是说它的吸引力呢是比较高的 啊,这个答案应该能理解什么意思吧啊,就是假如说分差很大,因为咱们是通过这个评委分和排名去逆退他的粉丝投票嘛,假如他分差很大的话,那如果说你这个粉丝投票呢,多少都不改变结果的话, 你偷懒出来这个趋利性可能是比较低的呀,因为你任何值都可以嘛啊?你偷懒出来任何值都行嘛,你高或者低都无所谓的,那你的趋利性当然很低了,就说它的可信比较差啊。另外一种呢,就是说你这个评委分比较低的情况下 啊,他为啥变化就导致他排名逆转,那么这个时候我们再通过排名和评委分综合起来去逆推他的粉丝投票的话呢?哎,这个就是我们趋利性非常高了,大家能理解吗?啊? 所以这个这部分我们的衡量指标就是我们的可行结空间的这个奇迹,或者说我们的卡罗样品的方差啊,去看一下它方差大还是小好。然后针对于问题二里面呢,我们的核心 写就用我们去我预测出来这个票数呢,去套用不同的规则,然后呢去针对于具体的案例进行分析啊,比如针对于这个人,他在百分比之下呢,是赢了的啊,我们要去计算一下,假如说他采用了这个评委拯救规则,他会不会在半路就被评委给淘汰掉, 哎,那么再比如说这个第二个赛季的这个人,他在排名之下是亚军,那么假如说换成百分之十的话,他的这样低的分数呢?会不会被这个粉丝投票给拉回来?大家能理解吧?好, 对着问题三里面的这个影响因素分析里面啊,我们前面给大家讲过了,我们要去做这个回归啊,和这个相关性分析, 这里我有这么几个关键变量啊,首先是这个职业舞者啊,这是非常关键的,因为有些职业舞者呢,他的粉丝是非常多的啊,他们能够去带飞队友去演演投票, 我们需要去把职业舞者呢作为一个分类变量啊,进行编码来,或者说作为一个学习效应啊,一直说三四,最后加一个,在数据表里面加一个判定啊,就是看看他是否是职业舞者这样的个灵异判断啊,可以作为一个变量去导入进去, 或者说把它作为一种学习效应进行考虑。哎,那么另外一个就是他的职业归类,比如他的职业呢,如果说是什么球员呐,什么真人秀明星呐,什么老牌演员呐,哎,这个呢,我们也要把它作为一个变量考虑进去, 能理解吧?就在我们这个分析影响因素的时候,我们哪些变量都需要去进行考虑,我先给大家讲一下啊,关于这个职业问题,我们也得考虑进去。 那么再一个呢,就是这个年龄问题了啊,啊,比如某的老某些老人呢,他可能会有些情怀分啊,他的粉丝票呢,可能会比较高一点啊,那么比如说年轻人呢,可能会呃,票都好,那么就偏位分比较高。哎,这个呢,我们只是最开始的这个初识判断啊,只说具体有没有关系,我们就是看后面的那个回归和相关性分析了吗? 对不对?在我们最开始的这判断的时候呢,我们也先研究一下,大概哪些因素呢,可能都会产生影响,能理解吧, 而且我们在这里呢,不仅要去分析这些影响因素呢,对于结果的影响,还要去分析对于评委分和粉丝票的影响啊,因为这个题目呢也没辙,问了他们对于评委和粉丝的影响方式呢,是否是一样的? 好,那么大致的这个 ct 幕完整的思路呢?和一些啊,这个在我们纠结过程中啊,要去注意的一些关键的信息和雷区啊,以及一些注意点呢。我这个视频呢,应该都跟大家讲清楚了, 那么这个 c 级目呢,完整人生的问题,现在代码和结果呢,预计会在明天就是一月三十一号的中午左右就会更新完毕,那关于这个完整成为的说明,大家可以看这个视频的评论区。好, 稍后呢,我会再跟大家去讲一下这个 a 级目完整的这个思路啊。呃,我们这次呢会选择 a 级目和 c 级目呢,两到几目啊会同时进行,那么 a 级目思路呢,我一会会再出一个视频,那么这个视频呢啊,大家也可以转发到你的队友群里面,和你的队友呢继续商讨一下选题。 呃,以及呢,假如你们队伍选择 c 一 梦的话呢啊呃,给你们队伍呢啊,转到你们队伍群里面啊,可以去一起看一下,你们在休闲课中呢,可能容易踩了一些坑个点, 呃,包括这个题目的赛前思路,大家都可以去看一下。呃,希望能够帮助到大家啊,呃呃,希望大家呢都能够获得满意的奖项啊,谢谢大家。

现在已经崩溃了,做了二五年 ct 梅赛练手,现在模型建立出来,但我发现数据太多了,太多几万条数据,然后我还得去找数据, 比如说几千个人,几千个人的,在不同年份的 年龄我得填上去,我得搜索,有些不能直接得出,太难了。 而且这个整合数据我感觉最麻烦的就是这个数据了,你要是有这个数据倒还好,你有了这个数据,你还得整合数据,你还得处理这个数据,这数据不并不能让你直接用,感觉最多了。就是这数据量太庞大了, 一下子几万或者几十万条,太难了,现在感觉精神状态非常不好现在。嗯,搞了一下午加一晚上,数据还没有搞完,代码还没开始写。

hello, 大家好,下面我给大家讲解,完全用我们这个 ai 这个豆包完成美赛的一个完整的一个论文拿下 m 奖。这个论文是去年完全用这个 ai 生成的, 这是翻译以后的这个文章,我们可以看一下最后拿的是 m 奖,好吧,我们可以看一下这个完全就是这个文章翻译的。 好。下面我给大家详细的演示如何用这个 ai 拿下我们这个 m 奖。好,下面是我们详细的演示,已经有美赛了吗?演示一下怎么样去用我们这个就是目前受众可能说最广的这个豆包和这个 deepsea 去完成一个美赛题目的一个解析。我以这个二零二五年这个 ct 为例,给大家演示一下怎么样我用这两个软件去完成我题目的一个解析,这篇这篇文章是用这个 ai 完成的,我这个文章在去年把它翻译成这个英文,它是拿了这个 m 奖,完全用 ai 去生成的,大家可以看一下这个 感觉 ai 上证的。好吧,教一下大家怎么样我能够拿到一个美赛的题目,把这个题目怎么样一步一步的拆解,把这个题目去解决出来,还能拿到一个不错的奖项。当然我还是建议大家在这个 ai 辅助的技术上, 自己也能够去进行一定的修正,画一些好看的图加进去美化一下,那我相信大家拿一个 h 奖以上应该也是非常容易的。好吧, 好,我们现在说怎么样给大家去演示一下,主要用的就是我这个给大家总结好的这个 提示词,我教大家怎么样去一步一步的去拆解这个题目,怎么去把这个题目写出来?这个提示词还有相关的资料,大家可以看这个置顶评论看获取,都是免费获取的。好吧,好,我们来看一下这个题目怎么去拆解。 首先拿到这么一个题目,首先我们可以拿到是英文,这个翻译成中文,你可以关注一些公众号,公众号上一般都会发,或者你等不及自己翻译,就把这个直接丢给英文,丢给 ai, 你 翻译出来这个还不是难事,你可以适当的进行一下的语句的修正,这都是可以的。 好吧,下面说这个,我们当然还是翻译过来以后再去做题。好吧,其实第一步大家是先翻译,翻译完以后相当于我现在这个题目一样。好,那我们怎么样去做题?第一步 先就是什么问题背景,我们就是以这个文章的行文为例,当然摘要是我们最后写好目录,肯定是最后生成的。好,第一步问题背景怎么整?生成这个直接我们看一下这个多少字,大概是七百六十五字,这个还是有点多的,为什么?因为我们最后要把它翻译成英文拼符,在二十五页 以内,我记得是你中文,相对于如果是二十四页可能会比较多,最后这个也是进行了一定的筛选好,所以说大家肯定要是先把这个什么刚开始要少一点,为大家推荐的就是六百字。好,我们来试一下这些内容其实可以直接用,是用这个 豆包去做就可以,我们可以把这个,你看我们可以把这个东西复制过来啊,你,你就可以把这些下面是说的数据了,这些东西就可以不用,也可以复制过来,这个影响不大。好吧, 我也可以把这个题目,就把哪一块内容,把数据,不是把这个问题上面的这些部分全部 像这些东西,关于数据的就可以不复制,关于问题的前面这些东西都可以复制过来,复制过来以后呢?你可以用我们这个指令,问题背景的指令,好吧,好,直接输给他,其实整体底下这个过程非常快的,好吧? 我们可以看一下,当然深度思考,你如果写问题背景,你完全没有必要去开看更快一点,但是也没必要,时间还是挺长的,你也不用说那么紧张。好,这是这个问题背景,我们可以看一下,你可以完全把这个东西复制过来, 我们可以看下这个内容还是写的非常好的,复制过来以后你可以放到这个文章里面,再放到这一块,这块就完成了。其实数据这个东西建议大家你可以这个东西你可以 直接丢给,也可以数据,这我没有。这个主要就是说你首先第一步你把这个数据有哪些,你可以丢给他,让他去写数据有哪些,还有表仪的这些东西, 下面还有这些,你看这个是直接复制的,你会发现了,你看数据文件,这个是直接复制的,一模一样,所以说这个东西就可以你自己写,也可以直接去复制一下,也没影响,因为最后还是要翻译成英文的,所以这个查重基本上没问题,美在不用担心这个问题。 好吧?第二个说第二步是写什么?解决问题的时候直接丢给 ai 写就行了,不用麻烦了,这怎么写呢?就会把这个这几个问题全部直接丢给他, 用我们的这个指令,这是三个问题,那就直接把这个改一下,好吧,这个你自己改一下呗,就是很快的,整个过程你会发现非常的行云流水,最后你再去精修,还整个过程非常的流畅,你会发现这个 行文是不是有点多了?可以,这个时候你就可以什么简化一下,你写美菜的论文的时候,你前期写中文的时候,你 自己心里有意无意的去控制一下字数是最好的,因为后面你还要筛选,还是会很麻烦的。好吧,看着他比较多了,你可以让他简化一下,这个是很灵活的一个过程,你看这样其实就非常简洁了,你就可以把这个复制过来放到我们这个文章里, 这个其实是有点多,后面到处也是筛选了很多的好假设部分,你就可以你把问题给他了,所以他已经知道你的问题是什么了,所以你完全可以直接再丢给他,一般就是四个或者三个选四个比较好。好吧,这完全就是让他给你去解决这个问题,还是你自己 去看了一下这个篇幅怎么样?好吧,你有意无意的控制一下,到最后你就不用说还要花费很多的时间去减字数。看这个还是有点多,因为他一般都会给你偏多一点,所以你可以自己去看着一点去简化,现在其实就非常的完美了。把这四个你复制过来,复制到这个里面, 这个可以加粗一下都可以。好,这个符号说明就不说了,对吧?你自己的事了。好,这个当然是问题分析,当然也还写了就是一条指定的事,就是这些东西其实 你要说哪一块是有你自己的思路的思想,其实还是一会我再给你说模型建立部分,好吧,你看这个东西还可以,这个篇幅其实也还行,因为问题分析你还是字数,字数其实可以了。好吧,这个是有点多。 好,下面就是具体的问题,具体问题部分我给大家有一个思路。好,我们看一下这个具体的问题,这个题目在说什么?在说什么?开发一个模型预测,所以在说什么?预测, 所以你不管他后面多么滑,他主要在说什么预测。那这个为大家提供两个思路。第一个思路就是说你是新手小白,你不知道哪些预测模型,你不知道哪个更好, 那你就可以什么把这个问题你要再重新去,一个一个的再给 ai, 你 不要再基于前面的基础,那样会不惊喜。好,这个时候你就把整个问题再丢给他,你可以问他解决这个问题,先写代码。 好,先写代码,为什么呢?因为你先看这个代码能不能跑通,他给的代码如果能跑通,那你就可以继续用这个模型了。好,这是一个对小白的措施,说我们可以直接用这个指令就可以,这个没有什么太,因为前面已经数据没有,一般 没有什么数据。这个,好吧,这个就是说给我使用什么样的给我解决问题的完整的代码。好,这个我给大家举个例子。 好吧?这个预测,这个也是个预测模型,这个预测模型可以直接用吗?可以,当然我建议你可以,如果你有自己的想法,你可以换一下,用自己想的这个模型,让他给你写代码,或者说如果你是小白,你就可以把这个问题抛给他, 我有哪些模型可以解决这个问题?或者说我怎么样去解决这个问题?让他给你模型, 好吧?当然我建议大家去有自己的筛选,好吧,就可以直接用了。他这个携带码还是现在他也很净化,基本上给你大烟扫过去也没有什么问题, 核心框架他肯定都是搭了尾腰。对的,当时我们这个代码也是用这个 ai 跑的,你可以看一下导数据数据清洗,对吧?好,你看下这个数据,这是什么数据?这个是他的运动员的数据,这个是下载的,你可以把这个数据下载一下,好吧?到时候你就最好的是什么?你把这个数据给他, 再给大家演示一下,你一个数据你肯定是自己下载的。对,你下载数据这个工作不难的。下载数据,因为题目你看他告诉你了,说这个数据是哪些,你看他告诉你了,告诉你这些数据了, 所以你这个东西你不难的,你把这个东西下载下来以后,你把这个东西丢给他,好吧?好,你可以把这个东西复制给他,告诉他说使用我真实的数据,其实,哎呀,这不这么很灵活,你要灵活的去用它 去随机应变。好,我们这可以再新建一个。好,他终于也是写完了,写的还是非常的完善。好,我们可以把它放到我们这个代码里面,这个路径应该都是对的。好吧,那这应该正好有, 我们来运行一下,测试一下,你看他告诉你了缺少酷,他会告诉你,你就可以安装一下就可以,这个不是什么大事。哦,我们安装完成了。好,再来看一下,我们刚才不是安装完成了吗?再来继续看一下。哦,不是,这个弄成之前的代码了, 刚才是我有点卡,我来看一下。好,应该是有问题的。这个问题主要是什么?说我们刚才其实刚才用的时候发现一个问题,这里给大家说的是先把数据传给,所以说其实你如果直接去把这个名字给他,而没有把数据传给他,他是很难去说把它 去做对的。所以我们尽量什么还是去把这个 ai 去,我们去把这个东西传给他,好吧?把这个数据尽量还要都给他,他了解这个数据的情况下,这个时候我们才什么才能 去更精准的把这个代码他可以编辑出来,否则其实他很难说去了解这个真实的情况,那可能就会出一些偏差。 我们先用这两个,因为你看一下他这个问题,其实他并不是说每一个题他都要用到全部的,你看他这个是还有这个,其实所以说每一个你要自己进行一定的筛选,看一下他会用到哪些数据, 好吧,我们这个就先以这两个为例,好吧,你我们再用这个,好,这个时候就对了,所以刚才流程其实还是有一点问题的,说你先要什么,这个这个多了其实影响也不大, 你可以先筛检一下,或者到时候你可以自己去删一下。那这个东西其实量有点大,但是他其实你只用前面的一部分也可以了,比如说我们之前没写一个代码,你看他只用了其中两个,还是比较少的,也可以把这个问题解决。 所以说另外一个你如果再遇到这个梅赛的题目,他可能有两种,第一种是说没有给你数据, 这个时候你要自己搜集数据了。另外一种就是说给他的数据,但是数据量非常大,这个时候你其实可以适当的去,如果不好处理的话,这个数据可以适当的进行一部分的筛检,或者你只提取某一部分去进行做。因为 其实美赛他对这个结果的看重并没有那么特别大,他可能更看重你,你解析的这个思路 是不是?所以说这大家一个思路说他数据量可能会非常大,那这个时候你就自己进行一部分的筛选,或者说有一定的代码基础的同学,可以什么自己去使用其中的某一部分提取出来去做,当然你也可以自己去什么编辑的这个代码量更大, 但是因为这个豆包它是对这个文件是有限制的,所以这个部分就要求大家可以只用一部分,或者说你可以自己去写提取数据的代码,后续让这个 ai 辅助一下,但你也可以用 jpt, 是 jpt 是 可以的,我记得,好吧? 好,这给大家提供思路。好,我们可以试一下这个。好,我们来试一下这个路径的问题,路径, 注意这个路径,因为我们就直接在这个目录下面的,所以说这个路径的问题你要改一下,这是成功读取了,当然也是有报错,但是成功读取了这个数据, 但是它里面有一部分是没有找到的,你们可以再把这个去你如果遇到的问题可以直接丢给 ai 去调试,如果你是小白,但是这个其实你 如果你有一定的技术,也可以自己去改一下。好吧,刚给大家演示的就是说你是纯小白,你怎么样去一步一步的去解决它,这过程可能会比较慢,但是 你其实也还好,教程完了。好,我们来复制一下过去,当然有他写代码过程遇到各种问题是非常正常的,路径一般是你需要自己去改的。好吧, 可以检查一下,因为 ai 它其实多包,其实还没有那么特别值得,所以大家遇到这些问题,你完全可以说 boss 复制给他,让他帮你解决一下。 好吧,这就是小白,你去这么去做,就给大家演示的时候,站在我一个纯零基础的一个小白身上,怎么样去解决这个问题?路径你改成你自己的路径,一般你就直接在这个文件下面放便会很方便,你就直接用它这个路径就可以了。 好,我们来看一下。本该应该是有错误来继续就说你这个过程就是你不断的发给 ai, 然后 a 改错就可以了, 这个过程其实就是一个不断的反复的一个过程。好,我们来看一下这次的情况,这个过程你不要嫌烦啊你,你要用 ai 给你写,肯定是这样的一个效果。 ok, 试一下,还是有列名错误,他是说哪个文件,我们可以看一下这个文件。好,我们这个时候就可以什么也可以把文件丢给他, 还要一直保存,你可以把文件再丢给他,让他看一看。这个文件是刚才说我们不用的,这样,我们改一下,好吧? 因为刚才我们说了不用那个文件,这个文件因为刚才我们说了他有点大就可以受限了,那我们可以这里,比如说我们只用这个两个,好吧? 就好。这就是刚才我给你说的,如果你有两种方法解决,一种是你自己有一定基础,你可以自己去编写,或者说你可以把这个大量的文件去给它进行一个删减,丢给这个呀,或者你用 gpt, 好吧,因为他这个是有他的能力是有限制的好吧?作为他演示给免费的这两个软件,他免费,他在能力方面肯定是有限制的,因为 gbt 用起来还是有低的门槛,好吧。当然这个用的这个流程是不变的, 所以你能用了 gbt, 那 也更好,你可以去用 gbt。 总而言之,这个流程其实都是不变的。首先就是这个论文的行文, 从这个背景到数据,到解决问题,到假设不好,你自己写就可以分析到模型的建立部分。整个流程你不管用哪个 ai, 基本上都是这个流程。 我让他给先写代码,代码跑通以后,把这个代码丢给任何一个 ai, 让他给你写这个内容,好吧?一个过程,因为那个文件它是太大,你没有一定基础是很难处理的,或者说你可以直接去 b 站上搜一下相应的一部分的教程也可以, 好吧,你毕竟想做的更完美,肯定是要多考虑一点。好,我们这一次来试一下,这次应该就可我来停止一下再重新运行,好吧,刚才这个问题是说这个图像没有中文保存的,这个问题 好,差不多前面这个报错可以无管他。好,现在差不多就运行出来了。好,这就整个的流程,这是这个图像也可以改一下上场了。好,所以总的来说这个过程就是这样, 你肯定会遇到错误。我给大家演示的也是说我在事先没有一定的排练的情况下,面对一个题目怎样去解决?这是错误,肯定是会经常出现的, 你其他的那种就是一下给你生成出来。那我想可能是前面已经进行了一个一定的预演,你面对一个实际的之前没有解决过的问题,那肯定是有可能会遇到各种问题。那刚才解决的方案我给大家提供了,把这个报错去给 ai, 让他帮你解决,一步一步的调试,到最后成功这样一个过程。好吧,代码跑通了以后该写论文了。好,这个时候干什么呢?那基于这个内容给你写,你看 把 ai 给你的代码重新丢给他,根据这个代码,这不用丢给他,因为刚才刚用的代码这个问题,这个步骤他给写,这个时候就该写什么啊?正文,正文部分 ai 都可以完成的。好吧。这些图可以自己去画一下,也可以去织网上, 比如这个 l s t m 模型。那可以去什么去知网上找,直接解锁 l s t m 模型,从它论文里面抠一些图,接下来放进去,或者你自己再复现一下这个图,好吧,非常完美的方式。 前面全部都是搬运工,这个过程也可以写的,其实也还行,你可以自己去找一些文献一下,加一些公式, 好吧,都是可以的。你像这些东西其实都是从文献里边 copy 的, 你可以直接解锁一下 l i c r 模型相关的文献,把里面的一部分内容可以 copy 过来,那就可以更完美了。 好的,这个文章主体部分内容的编解方法,你可以让 ai 结合你的代码去生成这个东西,也可以你去知网解锁相关的模型的文献, copy 一 些过程。好吧,你能自己手动结合一下题目那是更好。你不能那也可以了。 结果这些东西吧,你看这个结果不就是这个结果吗?一个图像结果没那么重要,你看这去年这个图这么样,最后也可以得奖。 结果生成出来以后,就比如说把你生成的结果给他根据这个内容给我写一段话的分析,是吧?你看这个分析一定要有上面结果,下面配分析,这个一定要有参与一个这样流程就可以。你可以把你图像放这, 再截个头像,让他给写分析,他用的指令是一样的,还是说根据这个内容给我写一段话的分析指令是一样的,好吧?好。看,这个写的篇幅也挺好的。 好,写完这些东西以后问题二、问题三是一样的,就不给大家具体演示了,这个流程都是一样的。好吧?好。最后到了一个知识点怎么写?把整个文章抛给他, 你再把这个指令附过去就可以了。最后写完以后再把整个文章给他,再用最后这个指令就可以了,我来给大家演示一下,好吧,完全 ok 的, 整个文章就 ok 了,当然这个数量你可以自己改一下。好吧,都可以, 我是给他写了一个四个的,当然他也可以用。这个就先不用了,其实这个流程是一样的。好,要登录我就不给他演示了。好,你看非常天赋也挺好的。好吧。 好,最后这个东西可以删减。好吧,可以自己根据篇幅删减改进推广,大家都可以写了,这样微信自己找就可以。好吧,这个路径你按照他的格式从翅膀上自己添加就可以。好,最后这个摘药也是一样的,就按照我这个指令也可以。最后摘药一定要什么 自己再精修一遍,你和你的队友每个人去修改,精修再精修是最重要的。好,自己的文章就到这。好吧。好,谢谢大家。

大家晚上好。呃,今天早上这个美赛 a 题的这个数学建模的这个题目出来了,它就是关于一个 soc 估计的一个题目。 然后今早也是有些同学来私信我来问我这个他自己的描述以及以及一些要点是指的是什么意思?然后然后刚好我是这个状态电池状态估计研究方向,所以我今天就给大家讲一下这个大概要点,讲下这个题目大概是什么意思吧。 它这个意思就是你先搭建一个电池模型,然后要预测它的这个核电状态,就是你的剩余电量嘛, 然后然后再根据你现现在的电量去预测它你这个电池还能用多少时间。那么这个意思就是你首先你得先预预测准你的 soc, 你 只有预测准了 soc, 你 才能再进一步去预测这个使用时间。 好,那我今天就给大家主要讲的是这个 soc 估计方面是它的具体要求是什么 啊?首先它这里说的是,呃,你的数据是得用这个,用这个公开数据集,或者说就是别人已经发表的实测数据,那这种数据一般一般就是, 呃,像这种,这个数据就是一个马里兰大学的一个 c a l c e 的 一个数据,大家可以在这里找数据,找一些放充放电数据吧。啊,这这些就是不同的电池,然后大家可以按照自己的需求来选, 然后这边是它的 socov 曲线的一些,就是一个 h p p c 的 一个实验, 这个也是,然后这边是它的不同的工况,不过这些工况呢,它它是属于那种汽车行驶方面的啊。然后这边我就是给大家大概描述一下这个公开数据集大概是怎么样的,如果大家有 有具体的需求可以需要自己去找。然后这个一般的这些公开数据局一般有什么呢?一般有这个马里兰大学的,一般有那个 nasa 的, 就是那个美国有航天局的嘛,还有一个是牛津的,主要就是这三个吧,应该还有别的,大家可以网上再找一下。 然后然后还有一点就是关于这个这个模电池模型的 soc, 估计它这里有三个,三个是你必须不能玩用的,这个模型 就是仅通过离散曲线离合,时间不回归以及黑箱机器学习方法。那这三个方法是什么意思呢?离散曲线离合,呃,我理解的是在 soc 估计中,离散曲线离合指的就是开路电压法,就是根据你的测量的电压去 去估计你的 soc。 那 这个就需要你去进行一个根据一些,根据你之前的一些一一开始的数标定的实验数据去标定你这个时候的电压对应的这个时候电量是多少,然后 然后去推算它的 soc 嘛,就根据你实测的电压去推算 soc, 它这个意思就是你不可以用这种开路电压法,就是太太简单了嘛,可能是。然后时间不回归呢,就是那个安时计分法,安时计分法就是, 嗯,就是根据你的容量,根据你的电流,根据你的采样时间去呃,一点去累积的一个一个 soc 估计方法吧,它也是一个最简单的方法。 然后这个黑箱机器学习方法就很简单,就是你不可以完全的用数据驱动去计算这个 soc, 他的,他的要求是什么呢?你必须得去,嗯,你必须,你,你必须要用一个有物理意义的电池模型, 然后是不可以仅仅采用这个什么离散曲线离合,不可以用这种统计回归的方法, 你必须用一个物理模型,那这个电池模型一般有什么呢?一般有 r c 一 二阶 r c 模型,还有什么电化学模型?但是在 soc 估计中,我们大部分人 用的可能都是 r c r c 这个电路模型,因为它相对来说参数较少一点,而且然后它的计算量也相对少一点嘛,电化学模型的话,它可能更多的是,呃,更偏向于它的电化学机理方面的一些推算吧。 然后这边的主要目的是为了去探,去预测我们这个剩余时间嘛,然后大家基本上就这两个模型来选择,然后一般可能大家看论文都知道是这个 rc 模型会用的比较多一点。 嗯,然后还有一点呢,他这个是什么意思?他这个当你的建模假设参数取值,嗯,以及你的使用模式发生随机波动的时候,那你这个预测结果会怎么变化?嗯,那他这个参数取值和 和它的使用模式突然间变化是什么意思呢?啊?其实我理解的就是啊,比如说你的初使电量啊,我直接给大家演示一下吧。呃, 比如说你的初使电量是不对的,但是你如何要通过你的模型去校正这个这个真实的电量呢? 啊?这个就是我的一个继续电池模型的一个 soc 估计方法吧,然后这边是一个真实值的一个估计,它的初使电电初使 soc 就是 百分之八十,就是零点八嘛,然后我给大家先跑一遍, 然后它就会,然后就跑出这个平均的一个误差,就大概是这样 录屏的, 然后这边是它跑出来的一个图标,那然后它这个参数变化什么意思呢?那假如说 它真实的 soc 出使值是零点八嘛?那我这个时候我可能这个电池,可能这个手机出点问题了,然后这个 soc 出使 soc 出点问题,我就改把它改成零点四,它的要求就是让你 当你这个出使值有问题的时候,但是你这个模型依然可以校正的了, 嗯,就是这样,就是一开始的时候是是错的嘛,零点四,但是它会不断的不断的去靠近这个真实的 soc, 然后最后汇聚到,然后变成一个较真到一个正常的 应该的一个 soc 中,就是这样子。 好,然后我这边有一些相关的文档, 就是关于电池模型或者 soc 估计等等,大家如果有兴趣的话可以来私信我,然后今天的视频就到此为止,感谢大家的观看。

美赛已经开赛差不多十三个小时了,不知道兄弟们经过一上午的选题及下午的琢磨,选的是哪题啊?做的怎么样啊?我相信大多数人都是做有数据的 c 题吧。 嗯,还有还有 a 题吧, a 题也比较容易一点。你永远想象不到我们组选的是哪题。我们组选的是一题。一题,有一样的吗?就是那个。 嗯,遮挡阳光的那题。被动式遮阳模型的那题。有一样的吗?感觉有点崩溃,但幸好。呃,压力最大的不是我,压力最大的是剑魔手。嗯,那题感觉看起来就是有点难的。祝大家好运,加油!

二零二四梅赛 cto 讲及思路这篇消息系被叶斯网络简直吓疯了。今天我要带大家扒一扒一篇二零二四年 mmc 题网球系统问题的结痂论文。第一步,怎么衡量表现难点? 网球比赛里发球方优势太大了,直接看的分率,根本看不出谁状态好稳。对操作,他们没有只看简单的得分,而是引入了滑动窗口加曲线下面机的方法去造球理,通过计算短期内的概率差异, 画出了比赛的流动图。曲线下面机法,用曲线下面机值来量化某一时间段内选球的统计力。当曲线高于零点五,说明你在压着对方打。 第二部势头真的存在吗?这一部分剪辑是易洋新意的典范。先莅临假设,假设比赛得分是完全随机的,独立同分布事件没有势头接回信暴力测信,用了 l n 杠 box q 检验和流程检验, 结果惊人,大部分比赛的 p 值都大于零点零五,无法借鉴原假设,也就是说,统计学像看起来像是随机的峰回路转。旋习胜利 发现,赢球后紧接着赢下一球的概率确实比输球后赢下一球的概率高了那么百分之一。结论虽然微弱,但势头确实存在。点评, 这种先否定,在微观论证的过程体现了极高的学术严谨性,比直接说肯定有要加分太多。第三部核心大招如何预测势头?这是全篇最下劣的部分。 step 一 玻璃硬实力 他们先建立了一个朴素二象形模型,利用显小的世界排名来计算一个理论性率。这就好比根据排名,你是第一名,我是第十名。理论向你每一球赢我的概率是固定的。 step 二,定义势头,他们定义势头等于实际表现杠,基于排名的理论期望,这就把硬实力和临场状态剥离了,剩下的那个残差就是纯粹的势头。太聪明了。 step 三, 双十四被夜思网络,为了预测这个残差,他们建了一个复杂的网络,先变量,发球级的非嗅破信息物往前得分等 前变量,这是最嗅的。他们引入了心理学与生理学指标,生理状态、掌控感、自我效能感、 双习系结构,不仅看当前的球,还连接了过去一段时间的状态,用期望最大化算法进行训练。第四部实战检验拿二零二三温网决赛,阿尔卡拉斯对阵德约科维奇做测试模型精准预测了比赛的大部分波动。 但在第四盘,因为德约科维奇的衔机异形反击模型出现了一些偏差就很惊喜,毕竟人类意志力很难完全量化。

美塞欧奖悬坐复盘,二零一九年 a 级养龙模型,简单到离谱,但逻辑强到可怕。美赛即将到来,你还在死磕那些根本看不懂的高级算法吗?快停下!今天必须给所有准备美赛的同学暗投安利一篇二零一九年 a 级养龙这道题的欧奖论文 tim 幺九幺零二四六看完这篇论文,你会发现一个颠覆印机的真相,拿奖根本不需要你用多学学的模型,甚至连代码都不需要多复杂。真正的高手是把最基础的模型讲出最顶级的故事。 为什么强烈推荐这篇论文?很多同学一看到属于连续性问题的 a 题就想完了,是不是要用篇微分方程?是不是要搞流体力学?结果这篇幺九幺零二四六号论文直接打脸全篇核心模型就是最基础的 logistic 模型和简单的物理类比。 它的过联基础完全在于逻辑闭环无敌,从生物学到物理学再到生态学,环环相扣,作图水平顶级,不系仅有 matlab 截图,还有手绘蜥蜴图, 故事感极强,把数学建模写得像生物科普文章一样通透。核心亮点拆解一,物理特将建模简单到令人发指的类比问题,龙怎么长多虫多长?普通人思路,到处找恐龙的秀技,然后瞎凑一个复杂的拟合曲线。 欧奖大神思路,体重直接用 logistic 组织增奖模型。是的,就是那个大一高数或者生物修像最基础的 d n d t 等于 r n e n k, 它们只是加了一个温度影响因子 t, 就 完美解决了环境对星奖的影响。伸长 这里简直是玄来之笔,它们没有搞复杂的生物结构,而是直接把龙的心体内比成一个名为 elastic cylinder 的 弹性圆柱体,利用材料力学的弯曲公式, w l 四集体就与心强的四次方成正比,直接推算出成年龙心强二十到三十五米。 点评,这就是美赛评委最爱的物理级别模型,不一定要高大上,但一定要有物理意义支撑。爱能量泄露,不仅算吃,还算喷火。亮点, 这篇论文在计算龙的能量消耗时,不仅对比了人类、冰原狼和麻雀来计算飞行与代谢消耗, 最杰德系建立了喷火化学动力学模型,他们通过全牛理论化蝶的场景推算火焰文读 e 二八六二 c, 然后对比各种燃料,发现一色蚁迷最接近结着一本正经的 写出了生物合成蚁迷的化学方程系,甚至画出了龙体内储存蚁迷的线底结构图。点评,这就是自驾,哪怕题目系虚构的龙,你也要用科学的态度去一本正经的胡说八道,且让评委无法反驳。 三、生态影响较为清晰的微分方程核心模型 dragon 杠 sheep 杠、 habitat model, 其实就是经典的 lotka 杠 volt era 捕食者与被捕食者模型的变体,它们把所有猎物简化为羊。 讨论了环境容纳量 k 级的临界点,如果 k 太小,龙气光阳,生态崩溃。如果 k 足够大,生态平衡。最后得出一个结论,养一条龙至少需要四零零平方公里,也就是约一二零个纽约中央公园大小,以及四零零零挤羊 眼。评,分类讨论是美赛拿奖的关键,不要只给一个结果,要告诉评委在什么条件下 系统会崩,在什么条件下系统会稳。给我们的备赛起信拒接公系堆气,重在过程推挡,千万不要一向来就扔一个既复杂的公系,评委看着头疼。这篇论文每一个公系的变形,比如在 logistic 方程里加温度项, 都有详细的 biologico, just patient 及生物学理由。美赛中过程,国赛中结果。在美赛,你需要像给外婆讲故事一样,把你的剑魔思路通过文字娓娓道来,也是最重要的。 作图作图作图,去看看这篇论文的 figure 一 和 figure 六。 figure 一 是手绘的龙的身体结构示意图,文中特别标注系字会以避免板前问题,显得非常有诚意。 figure 五做了一个极简的对比图圆 versus 狼、 versus 麻雀 versus 龙,一目了然。 图表现论文的脸面,一张好图能醒起评委阅读五零零字的时间,好感度直接拉满。

好,大家好,那这里是本次美赛 c 题目啊,第一问完整代码以及结果的讲解视频, 那本次这个代码呢,量是非常大的啊,因为这个 c 题目呢,数据库处理啊,包括后面这个实际求解啊,这个步骤是非常繁琐的啊,我收获都跟大家去讲清楚啊,包括这个数据处理之后什么样的样子啊,后面就求其结果,因为我们要得出那个投票数嘛,啊,就这个观众的投票数 啊,我都会一一的去给大家展示啊,请大家务必有耐心的把这个视频呢仔细的去看完啊,那目前第二问代码也是已经完毕了啊,等我后面把三四问全部解决完毕之后,我再给大家录一个完整代码的讲解视频吧。好吧,那么这个视频呢,就先给大家讲一下这个第一问吧。呃, 还有就是这个 a 题目啊, a 题目呢,第一问的代码呢 啊, a t m 这个完整代码我也是已经完成了。呃,一会我会再录一个视频给大家讲一下这个 a t m 的 代码,好吧,好,那么这个 a t m 和 c t m 完整原创论文以及相应代码和结果的说明呢, 大家可以看这个视频的评论区啊,我们预计会在明天,也就是一月三十一号的中午左右就会更新完毕这两道题目的完整论文啊,即刻的代码。好,那么废话不多说,我们来看一下这个梅赛 c t m 的 第一问。呃,题目背景 好,包括这个思路呢,我就不用再给大家去多说了吧,因为我前面这两个视频呢,都跟大家讲过了啊,大家可以继续看前面讲个视频,我就直接从代码开始入手了,好吧,呃,首先我们带人第一步首先要去处理这个数据,我们可以看到呢题目给出我们这个原始的数据呢, 他这个非常非常长的这样一个宽表啊,什么叫宽表?就是他很宽,就是他这个宽度呢?大概是有 这个五十三列吧,应该五十三列,然后呢他这个行数一共是这个四百二十二行,然后包括呢这个题目后面有很多的关于这个数据的一些描述啊,包括呢这个数据的一些注示啊,比如说 n a 指是什么意思,那么进零分的是什么意思啊? 啊?再比如说一共矮有四位评委啊,然后各种周次啊,反正各种中东西啊,那么这些呢,都是我们在数据处理过程中需要考虑到的东西, 能理解吧?啊?当然我们这个数据处理呢,在第一步的时候,我们最重要的是要把这个数据呢这个官表呢处理为一个适合我们建模的这样一个长表的格式啊。然后在这个处理为长表的这个格式的过程中呢,我们再去把每一个变量 啊,每一个数值啊,包括什么空值啊,零啊, n a 啊这些呢,都做统一的处理,能理解吧?好,我们来看一下这个具体的数据与处理的过程。 呃,还那句话啊,这道题目呢,还是比较复杂的。呃,目前呢,也可以看到网上各种满天飞的什么完整的每一问的代码呀,思路什么的都出来了,我只能说大家 见仁见智吧。啊,就是你这么快的速度,要是把每一问的代码和结果全部都得出的话,那这个质量你可想而知吧啊,总之呢,呃,我只做好我自己的这个代码和结果啊,呃, 好,大家自己去看一下我这个代码就知道了。好,我们来看一下第一步,呃,我们把这个数据呢先上传到这里啊,这是题目原始的这个数据 啊,这原始的数据,我们首先呢第一步先去读取数据,那么这对于原始数据数据中呢?啊,还有这个 n a 的 这个字符串的我们进行处理,然后呢清理列名,去除掉可能会有的空格,然后呢统一进行小写啊,这是为了方便我们后去读取列名, 接下来我们要去解析他们的淘汰周数,那么关于这个思路的方面呢,我们前面就免费思路的原因给大家讲过了,就是我第一问都用的这个模型呢,是这个 mcmc 啊,这个模型这个方案。那么在后面我不是给大家讲了一个这个 每一问的这个关键信息和一些雷区和注意点吗?啊,包括这个阶段一怎么处理百分比置,然后阶段三这个混合之家评为拯救, 然后在数据惊喜中的一些雷区我也给他讲过了。呃,这个呢,大家自己去看我之前的那个数字讲解视频就可以了,我在这里就不多做赘述了。好吧,就顺着代码去跟大家讲吧。总之第一问我们的目标不就是通过题目之后给我们的啊,这个他是否淘汰以及评委的 啊,这个评分啊,包括一些其他的各种数据来去推断出来,他最初时的就是反建构出他最初时的这个粉丝投票数嘛,对不对啊?这是题目要求我们的第一问要去做的这个事情,看一下题目第一问估算的粉丝投票数,好吧, 好,来看一下数据处理。呃,然后呢,接下来下一步呢,我们是要去解析他们的淘汰周数了,我们需要去知道每一个选手到底是在第几周被淘汰的,或者说他是进入了决赛,那么假如说他是没有结果的话呢,那么他就是说啊,坚持到了最后 啊,这是第一个处理,那我们把决赛的处理呢啊,决赛的这个选手呢?进行一个处理啊,就是说假如说 是这样的,那么他们说明他们参加了所有周四啊,我们可以给他们很大的一个数字,一直去表示他们直到这一季的最后一周他都在,那么这个最大数字呢?我就设置为九十九了啊,大家也可以设置为其他数字都行了的啊,都行的, 这个呢,我,我无所谓的,就是你随便设置一个比较大的数字啊,一一百多也行,总之代表就是说他们一直是重活到了决赛,能理解吧? 好,然后接下来是应用这几级函数,然后我们构建这个长格式数据,去构建这个长格式数据表,我们获取一下它的最大周数,然后提取它所有可能出现的周数, 提取完之后我们去构建这一周这个评委翻数的列名和列表。那么我们这里是假设最多有四个评委,为什么要这样假设呢?因为题目呢,原初始的这个 数据说明里面我们跟我们说过了啊,就是这个 n a 值,通常用于一个,就是说第四位评委的分数啊,假如说这周没有第四位评委,就是一般有三位啊,就是意思就是说最大就是四位嘛,这么个意思。好, 显然在这里我们假设是最多有四个评委,然后提取这一周的分数,然后把这个 n a 值啊和控值呢全部处理 过滤完了之后呢,我们只在这一周有有效分数时候才记录该条数据啊,这周呢,我们就把那些被淘汰之后的周次,我们就自动过滤掉了,因为这个被淘汰之后的周次呢,他的得分都是零嘛,对不对?好,那么接下来就是个长表,他都包含一些什么样的这个 变量啊?一个是他的赛季,一个是他的这个周数啊,然后包括有这个原始列吧,他可以查啊,评委的总分,评委的数量,他是三个还是四个,有的时候可能是三个,有的时候可能是四个,然后呢?这个是本周 啊,由于结果被淘汰的,然后这个全居记录何人该时淘汰,然后呢?这是一个最终名次,这是一个预处理之后的数据啊,这是最终整理出来这个场表 啊,一共就这么几个变量,对,淘秒呢,一共就是两千七百多。行了。好,然后我们去提取它的技术信息表啊,用于这个我们的第三问,这个建模啊,我们一行这个处理就可以了, 处理完了之后呢,我们做一个比较简单的一个结果检查,然后保存这个结果就可以了,我这个结果呢,是保存为了一个域处理后数据啊,那么大家大家可以继续改这个表名啊,这我就不用读,跟大家读说了吧。啊,好, 呃,我们检测的最大周数呢,是一到十一周这个范围,假如呢,我们数据处理之后呢,一共是两千七百七十七行,然后一共是九列包含的总赛季数量呢,一共三十四个赛季嘛,根据这个题目来说, 然后我们检查两个具体的例子吧。啊,好吧,我们来看一下题目给我们的这几个例子, 这个结婚呢,是给我们了一个第一季第四周啊,这几个参赛者,他们最终的这个排名情况啊,排名情况和他们预估的这个粉丝投票数啊,我们就根据这个例子来做一下,来看下代码, 我们可以先看一下这个 s 一 啊,被淘汰的这个人啊,那么他呢是在第四周就被淘汰了,对不对?好,我们来看下代码, 所以呢,他就应该就是说运行完之后呢,他应该被标记为在第四周是淘汰的。其实大家可以看到呢,这个 week 四啊,就是第一赛季的第四周,那么这个人呢,就被标记为淘汰了,后面是个处,对吧?那么另外一个例子就是 s 一 的这个冠军 啊,就是这个评委评判排名的啊,这个第一哦。啊,他就是呢,一直没有被标记过淘汰啊,一直没有被标记过淘汰。好, 那么整个这个数据处理步骤就完成了,然后呢我们检测了一下这两个视力啊,也是正常的合理的啊,但是你们大家也可以去踩,就是说啊,使用一些其他的例子去验证也可以啊,也可以。 ok, 那 么在数据处理全部完成之后呢,我们就要去做这个 啊,实际的我们估算他每一个周四中产生的这个粉丝图飙数 啊,那么这部分的思路呢,我前面也给大家讲过了啊,就是我这题采用的这个模型呢啊,我最终采用的这个方案的是这个避风啊,也是个 mcmc 啊,就是求粉丝投票的这个概率分布情况。 好,我们做一下模拟,那么这部分的核心代码呢?我就不给他展示了,这个核心代码呢,也比较长,呃,也很难,那么这个呢?呃,大家都能拿到我这个论文和代码的人,自己去看就可以了。好吧,呃,我这我就不多赘述了,因为我要保证这个限量,我就给大家展示一下最终这个结果啊,那么最终这个结果呢,我们模拟完之后 也可以得到这样的一个结果,那么这个结果呢啊,我们可以做一些结果分析啊,这个非常非常合理的。然后这里呢,我们求出来其实就是他这个占比,就是投票的占比,大家能理解吗?啊,这是一个投票的占比, 因为我们这个种票数呢,他是不定的啊。这个是还那句话,这个题目在求解决过程中有许多我们需要去注意的点,大家千万不要去忽略啊,去瞎写,哎,记住, 可以看到就像网上各种满天飞的各种思路啊,什么代码视频啊啥的,可能有的很多人都没有讲到这个问题,这是个总票数呢,他是不定的,这是未知的,所以呢,他只是选择一个假设值去产生最终的正确排名,而且呢,这个总票数呢,是我们永远无法得知的,大家能理解吗? 因为我们这个总收视率的是不定的啊,你,你这个总票数可能是,呃,一百万,有可能是一千万,这个没有人能知道,没有人能知道,我们在书学方面成层面的 最多最多就只能纠解出来他们的投票占比,能理解吗?啊?所以在纠解完这个之后呢,我们得到了他最终的这个结果啊,保存为这个,我们打开给大家看一下这个结果这个结果表格,那这就是他们最终得到这个结果表格啊。我们反推出来这个粉丝投票数, 那么当然了,这也就是我们得出来的这个反推出来的是粉丝投票的占比。投票的占比,那有人要问了, 可是人家题目要求的是让我们给出他们的粉丝投票数呀,对不对啊?人家第一位让让我们给出他具体的粉丝投票数呀,我们估算粉丝投票数呀,包括我们第二问,第三问也都是要用这个粉丝投票估算值和其余数据来计算呀。那,那那以现值投票占比怎么办呢?啊?没关系的,没关系的,这这个呢很好处理, 首先代码里面呢,我们再加入这么一段,把这个估算的份额呢去转换为具体的票数就可以了。那么怎么转换啊?其实就是根据它们的舒适率假设一下,假设一下能理解吧, 那它这个,呃,一般来说啊,这个电视节目呢,都是早期赛季是比较火爆的,那么后期是略有下降的,是我们可以设定为啊,早期的这个 s 一 到 s 十是一千五百万票,那么 s 十一到 s 二十是一千万票,那么后面的这些数是六百万票,那么当然在这个数值大家可以自己去先假设, 而且呢这个数值怎么假设呢?跟我们后面两三位的二三位的求解呢?是没有关系的,能理解吧?就后面二三位呢?有人可能要问了,那这个你假设为这么个票数,那么前面赛季是一千五百万票,后面是六百万票,会不会导致我们第二三问求解的时候,出现这个求解不一致的这个情况呀? 对不对?这个是完全不会的,因为我们求解一个人淘汰呀,什么排名啊?这情况呢,都是在单个赛季内去完成的, 不存在说是你这一个第一个赛季跟第三十四个赛季进行对比,这个我情况的是不存在的,那样理解吧。啊,所以我们都是在这个单个这个赛季里面循行求进, 所以呢,当然你们也可以设置为 s, 一 到 s 三四都是稳定的,都是一千万票也行,都行,这个呢,我们只是想把这个投票占比呢去转化为他们的 绝对票数而已,这个呢,其实意义也没有多大,包括这个 a 多少万票,你们给黑市进行修改啊,拿到代码的到时候也可以自己去进行修改啊,我这里设置一千五百万票,你刚刚可以把它设置为你一百五十万票啊,这个这个你多减个零也行嘛。啊,这个这个影响都不大的, 因为我们题目上面给出这个意思呢,哎,他也这个票数呢,也是一个估算的,这个估算的好,我们转化完之后我们就可以得到这样一个结果,我们把这个结果打开给大家看一下啊,那这里就是转化之后的啊,这个总的票数我们拖到最后,我们也给大家看一下 啊,那这里就是最后的这个这一点啊,就是他们的这个投票总数了啊,啊,投票数,这这一点就是他们的投票数。好, 那接下来啊火美这个代码呢,就是做这个一致性的检验和确定性的检验了吗?对不对?这也是题目明确要求我们的,其实我们要去看一下啊,他这个一致性的度量啊,是否是一致性的,然后呢再一个就是呢,这个投票总数呢,是有多大的确定性? 这个一致性度量呢?其实就是说我们这个求解第一问这个模型呢,是精准还是不精准啊?你要就一致性的很低的话,那证明你完全是错的嘛,你投票总数就关键是求解错了的, 就你根据这个投票总数我现在去计算啊,他还跟咱们的淘汰这个结果是完全一致的,比如说我们第一问的这个模型呢,是完全正确且合理的啊,这就是一致性度量的意思。另外一个就是说这个投票的总数呢,有多大的确定性 啊?就这个训练型呢,对于每一个参赛者,每一周或者是总是相同的,是否是总是相同的啊?提供我们一个训练型的度量,这个呢就是我们这个思路得兼独厚的一种优势,因为我们采用这个 mcsm 模型呢, 我们的确定性读量呢,就直接通过我们后延风格的这个标准差和执行区间呢,就会完全能够就直接回答其波中说提出的这个确定性的问题了。哎,所以这也是我为什么最终舍弃掉了其他两个方案。其实我们这个呢,在回答确定性上面呢,是一个非常非常好的一个顶级方案。好,我们来看一下代码, 那么这部不带马的实际确定性度量和一致性检验的这个核心结构,我就给大家展示了,我来开案就用这个结果吧。好吧,那么我在这里呢,我是哎 啊,就是查看了两个人啊,一个是第一个赛季的这个和第一个赛季这个做了一个一次性检验和确定性的毒粮,然后做了一个二十七第二十七个赛季的这个一次性检验和毒粮,那么我为什么会采用二十七赛季呢?啊?这也是根据提议 啊去确定的,就在这个提议里面呢,他是从二十八赛季不是开始变这个规则了吗?啊?二十八赛季开始变规则了,这是因为呢,我们前面中期的这个到二十七赛季发现这个可能啊,这个规则可能不太好或者怎么样的翻开,二十八开赛季不是变了吗?而而且这个二十七赛季呢,不是冲见出现了一个争议吗?就这个人 啊,可能就是因为它出现争议啊,所以最终导致二十八赛季这个规则改变了,所以我们呢最好呢是把二十七赛季呢啊去做一个展示啊,当然你们采用其他赛季也行啊,也行,那我这里给大家展示一下这个第一个赛季的吧。啊,二十七赛季我就给大家展示了,那我这里就会生成一个第一赛季的这样一个趋势图 啊,这就是一个不确定性范围的这样的一个呃呃,图啊,然后这里是他们的不确定性的热力图啊,这是他们的不确定性的热力图, 颜色越红,那就是表示他越不确定啊,那么颜色越淡呢,就是表示他越确定啊。大家这就是完美回答了这个节目中所提出的这个问题啊,一方面我们的一致性呢,全部检验完毕了,再一个呢,我们也就确定性 啊,我们给出了注量啊,也计算出来了啊,然后呢,对于每一个参赛者或者每一周出是否总是相同的,那当然不相同了吗?对不对?那代码这里面热力图都已经给出了吗?每一个这个人啊,每一周他的这个确定性的注量都不一样,我们热力图也获取出来了, 那就完事了啊,二十七赛季的我就不给他多展示了。好,那么第一问完整的这个代码和节目呢,大致就是这个样子啊,我们把第一问的所有决定目标全部都学完毕了,对不对?再来回顾一下啊,这个我们也纠结完毕了,这个也纠结完毕了,这个也纠结完毕了,全部完成了。好吧,呃, 那再给大家说一下,到时候大家拿到我的这个代码和论文的人呢,这个所有代码图片的颜色也都可以进行修改啊,那么关于这个代颜色怎么修改,我到时候在代码里面也都会有注置, 大家到时候拿到我代码和这个代码操作视频的人呢,自己去看就可以了。好吧,那关于问这个完整成品论文和代码的书们,大家可以看这个视频的评论区。 呃,我预计会在明天中午,也是一月三十一号中午左右就更新完毕。呃,美赛 c 题目啊,完整的原创论文签代码和结果,那么到时候呢,也会有一个完整代码和论文的详细视频,那么这个视频呢,只是给大家讲一下第一问, 希望能够帮助到大家,特别是关于这个数据处理部分。呃,希望能够帮助到大家吧,好吧,那么就说到这里吧,呃,谢谢大家。

好的,小伙伴们,大家好,接下来我们讲 c 题哈,大部分同学呢,我看了一下后台的选择题数据哈,大部分同学都会选择这个 c 题哈, c 题的话呢,怎么说呢,你选这个没问题啊,同学们,我告诉大家哈,你选 c 题没问题,但是你必须要有创新啊,因为大部分的同学都在选这个 c 题,目前 c 题比例已经达到了恐怖的百分之四十哈, a 题百分之三十, c 题百分之四十,两个题目加起来接近百分之七十了,老铁们哈,百分之七十的人都会选这个 c 题啊,都会选这个 c 题 啊,所以说呢,我建议同学们哈,要慎重啊,其实我是非常不建议选这个 c 题的,我觉得吧,你就是大家大部分同学选这个 c 题都是为了图简单啊,但是呢,我告诉你们啊,图简单,不要去图简单哈啊,不要去图简单, 为什么呢?因为 c 题你看着哈,但其实它很麻烦啊,很麻烦 啊, c 题很麻烦,所以说,我建议你们不要去盲目的去做这个 c 题啊,不要盲目做 c 题,好吧,老铁们,我建议你们避开它,因为因为这样的话,获奖是比较难的,你不要图简单,大家说实话都知道,数据都知道,怎么建, 那你说对不对?你,你说你怎么获奖呢?你的创业点怎么来搞呢?对不对?所以说,我不建议大家选 ct 啊,真的,我,我是真心的劝大家啊,要慎重哈,要慎重好吧 啊,老哥,选哪个题?我建议我建议选 a 题或者选 b 题啊,你最好就是选,要么选冷一点,冷门一点的,这样选的人少,竞争压力会小一点,对吧?你选这个 c, 那 么大家都选这个 c 了,所以当然了,我,我不说,不给你分析哈,我给你分析,但你要慎重,你想拿奖,你必须要有创新点, 你必须要有创新点,如果你做这个 c 题没有创新点,那就白搭了,而这个 c 题的创新点 百分之大部分的都是两种创新方案,第一种改进的模型就是你用改进算法去做,第二种融合模型啊,就你选择不同的模型一块来做, 你说交叉你行不行?交叉创新的话,在这个地方的话啊,也可以试一下。好吧,只能也可以试一下,因为我们创新模型的话一般就有这么几种方案吗?所以说这几种方案的话没法说,但是改进算法的话,我觉得在这个地方是最常见比较常见一点的,所以大家呢,如果想做 c 的 同学呢,你要慎重, 你要能够有创新。好吧,你要有创新啊,真的哈,啥也不会,只能选 c 你, 那你,你不至于啥也不会,老铁们,真的不至于,你有 ai 了,理论,你没有不会的题目了,好吧,你没有不会了,而且 c 题呢,也没有那么简单,还是比较复杂的,大家都做, 所以说呢,就看谁做的好了,你想做的好的话,我觉得你和高手竞争是有很大的压力的哈,要有压力的,所以建议同学们呢,要慎重一点哈,要慎重一点 哎, ok 啊,这个这个大家呢要慎重哈啊,与这个题目的话呢,我们简单阅读一段的话,就是与星共舞啊,美国为美国,美国节目舞动奇迹啊, 然后呢,这个这个我们前面呢就是专家投票吗?专家通过什么在线投票?这是他们最喜欢的情侣啊,观众的话每周可以投票一次或多次,上下为当中公布的次数,然后呢,还有就是评委也可以投票之类的,然后选出第前几名来,对不对 啊?评委投票和得分和观众投票的组合方有多种,在美国版节日前两季采用基于排名的组合方式。第二季因什么什么啊啊, 然后,然后呢,就修改了这个争议哈,第二十四季又出现争议了对不对啊?评,尽管评委得分低,仍赢得冠军,作为回应,二十八级就说白了他的他的评分吧,是由评委和 评和这个观众投票来综合决定的。有的时候呢,评委觉得不好,但是观众觉得好,那观众投票多了,那么就有可能得得得这个最终的这个成绩了。但是,但是呢,又因为不专业,比如说一二流子一些选手,那么特别会讨观众喜欢,那也有可能对不对? 还有有有,如果,如果评委特别的占比权重比较大,观众占比比较少的话,那有可能这很多啊,迎合评委的啊,评委的角度不能代表大众的,所以有可能引发歧义啊,就来构建一个比较合理的评价的这么一个啊,评分的这么一个模型啊,这就是整个题目的核心哈, 来开发数学模型啊,估算每个选手在其参赛的每周获得观众投票数啊,就估算这个呢,就是一个基础的预测模型了啊,每个每个这个来,同学们,来,大家告诉我哈, 开发数学模型一个和多个来,你告诉我到底开发几个?首先啊,首先到底开发几个?这个是一个要点哈,到底开发几个? 你们记住哈,那就一定要开发多个。你想做 c, 我 还那句话,你必须是勇士,你必须要有胆量, 你必须要牛逼,对吧?要不然你要说你就开发一个,你开发一个非常基础的,你做 c 题,哪讲?我就这么说,你再创新也没有希望,因为因为选 c 的 人太多了,高手太多了。老哥这里统计了百分之四十的同学会选 c 了,都是勇士啊。说实话,所以你必须要开发多个, 而且多个模型来估算明白吧,来估算明白吧,你的模型估测关注投票结果是否能得出与每周淘汰结果一致的结论啊,提供一致性的衡量标准就是你要,你要能什么? 你要结果要准确,你不能结果不准确,对不对?确定性如何?每种确定性这个就需要有验证了,就你的结果也有验证,说白了我我告诉大家哈, 真的,这个地方就看谁的模型精度高了,但是你们记住你们的精度啊,很多情况下来大家告诉我,来来,我问一下哈, 我问一下哈,来,这个的话你说老哥,我不单纯的用美赛官方给的数据,我用别的数据来佐证一下,可不可以?老铁们,就是我用一些达人秀,或者我用一些别的投票的一些结果来做,可不可以?老铁们,别的投票的模型来做,可不可以? 可不可以?老铁们,你们跟我说完全可以,反而会把你的模型的这个精度啊,反而会提高的比较高。来这个地方一定要注意两件事一定要注意两件事哈, 一定要注意,除非他明确的说了啊,你可以看了没,你可以自行选择纳入信息或其他数据。看了没?其他数据,但必须要记录数据来,同学们, 我这地方要注意两件事,第一个叫什么过你河,第二个叫欠你河。来,你们觉得哈,你们觉得你们最容易做预测模型的时候最容易出现的一个问题是什么啊?最容易出现的一个问题是什么? 就是你们如果来做这个题目啊,后面会有啊,我会讲到啊,你不用担心啊,啊,你会讲到来 你们容易出现了一些问题是什么?做预测的问题,做回归问题啊,过你河,我告诉你们,你们最容易出现的就是过你河了,真的,所以说你们一定要注意一点,好吧,不要出现过你河 啊,这个很关键啊,很多同学呢,做预测经常会出现过你和还有同学这么这么来做的哈,来,还有同学这么来做的,我们来,来啊,我,我后面会讲到哈,这里有一个完整的看了没?完整的来 看一下啊,来,看到没,他有一个完整的解析思路,第一步,一定要做数据处理。第二步, 观众投票预测构建贝叶斯啊,这是基于概率的模型,以评委得分选手特征周次为自变量,以淘汰结果为约束啊,预测观众投票数,预测知信区间。来这个地方呢,很多同学这么来说的, 我看你们的方案了哈,你们说老哥我预测他的投票得数,那我这样不就行了吗?啊,我,我这样不就行了吗? 来,我直接就是用他每前几个周的得数预测他未来每个周的得数可不可以?老铁们,原来这样来说的哈,我用他前几个周的得数来预测他后几个周的得数 来。老铁们,你们觉得这样的行不行啊?你们觉得这样行不行啊?我刚才有同学在上面是这么说的啊,在评论区留言啊,包括在那个老哥私信我这么说的,行不行?老铁们,行不行啊? 为什么啊?包括你们告诉我为什么?我告诉你是百分之百不可能的,不行的哈, 你别乱搞哈,你记住哈,投票结果是未知的,严格保密的,你不可能说用这个是吧?哦,前一个数据来预测未来几个周的数据,你就你就,你就完整的变成时间序的预测了, 知道吧?你是不可能的啊,你,你别乱搞,你别乱整哈,你别乱整来。 但是我可以构建一个什么样的模型呢?老铁们告诉我,既然如此, 那我就不能用时间虚的预测预测了,对不对?但我可以用什么预测来,我要我现在要做的一个一个参数叫什么?观众投票数,他和很多项数据有关系,包括什么评委的得分打分,包括一些其他的。哎,这地方有哈,包括其他的 看啊,哎,在这地方包括他的年龄,包括行业啊,包括一些是吧?他的这个这个是吧?这个这个选手的一些特征,包括他日常的动态,包括一些其他的淘汰的一些结果。来 来,同学们告诉我来,我相当于我要预测一个指标,它和若干个指标有关系。那你告诉我要构建的是一个什么样的模型啊?啊?要构建的是一个什么模型啊?这是这种预测方案不叫持续预测,这叫什么预测?老铁们, 哼哼,叫什么预测呀?到现在啊,大家都提出了有用 xd 版的啊,随机森林对吧? 这就是回归吗?对不对啊?某一个变量和若干变量有关系,不就是回归吗? 是不是?那不就是回归吗?所以说你这个地方既然构建回归,你们就记住我刚才就要返回来,我刚才提到那个那个逻辑了,不要出现过你河,也不要出现欠你河,好吧,过你河就是你回归的模型,太美完美了。 来,你告诉我这种未知的投票数量的能过于完美吗?老铁们,所以说谁的预测的模型的精度达到百分之百,你反而应该要慎重了,你百分之九十六九九九你都要慎重, 你的精度不可能那么高的。我可以告诉你哈,因为他是未知的,而且这两组变量之间理论上没有什么必然的情况, 不能说他评委得分就高,他观众投票就高,对不对?也不可能说,但是呢,来评委投票高,有没有可能观众投票也高啊,也有关系啊,也有可能啊,那评委投票高,有没有可能观众投票低呢? 也有这个可能,对不对?所以说哈,这里面比较麻烦,比较复杂, 你呢,一定要慎重啊,一定要一定要考虑,就是自变量和一变量之间没有很强的关联度,没有很强的关联性,这个是很关键的哈, 明白吧,做这个做回归理论者是一个大忌,就是自变量和一变量之间没有很强的关联性,我们说这属于大忌,但是呢, 不代表说他俩没有关系,往往会呈现一个啊,就是典型的比如大部分选手可能评委投票比较高,观众得分也会比较高一点,只是说有一个大概的对不对?但是你要考虑极端场景之下的一些情况 啊,因为因为前面说了吗?对不对?来前面说了,以前面已经给你讲了很多了,对不对?说有有可能会出现专家评分高。所以说呢,这个 第一小问啊,我建议你们不要你合的精度太高。好吧,不要你合的精度太高啊,太高了确实会有问题的哈。来 第二小问啊,利用你的观众投票结果估算结果和其他数据比较和对比节目使用的两种投票方法,排名反而百分之在各季产生的结果是吧?就每一季对应的两种结果,如果结果再查也其中一种方法似乎更清,更似乎偏向于观众投票, 对吧?就是比较吗?对不对?和个体产生的结果比较结果的结果,如果,如果结果存在差异,那么其中就哪一种方法可能会偏向接受投票,说白了就是看看哪一种方法和观众投票的相关度更高吗?对不对? 然后考察这两种投票之外存在两种投票方法存在争议与观众或观众意见存在分析的特定选手的拥有情况,投票组组合方法的选择是否会导致这位每位选手的结果相同,是吧?每周什么什么的啊? 然后呢,咱们就那个一考虑一些具体的视力,把你建立的模型,再把具体的视力,然后呢这个考虑进去,然后呢,利用包括投票观众估算结果,在你的数据开发、模型分析、专业舞者以及数据中可用的名人数据的影响 对不对?这些因素对名人在比赛中的影响有多大啊?说白了就是你前面不是估算了一个观众投票的模型吗?对不对?利用观众估算投票结果在你的数据啊, 开发模型分析专业舞者以及数据中可用的名人特征的影响啊,这些因素对名人在比赛中的表现影响有多大 啊?啊,就你那个像年龄啊,特征啊,对比赛影响到底有多大?来评来他们对评委得分和观众投票的影响是否相同,这个也是要建立一个合适的模型哈啊,也要建立合适的模型的 啊。然后第四位提出另一种每周观众投票结合系统认为系统更公平。说白了就是就是啊,提出另一种每周结合观众投票评委的问题,说白了就是你提出一个新的打分方法啊,打分方法不是传统的这两种方法了,提出新的解决方法来哈,这样的话呢,你就需要全新的设计一种投票组合方法了哈, 让我们看一看完整的一个解决方案哈,来第一个啊,第一个来美赛啊,第一,一共四个小问,第一小问预测类题目,第二小问评价加决策类,第三小问影响因素分析,第四小问优化设计类啊,因为第四小问的话,它涉及到 新的投票方案嘛,对不对?所以说需要用到用到这个优化设计类问题哈,优化设计类来每一个小问,第一个问,预测每位选手每周的观众投票数,验证一致性和确定性,说白就验证精度啊,验证投票的这个预测的精度到底怎么样? 评价两种投票方法的优劣啊?分析争议的案例,提出决策建议,就两种方法,他有没有什么两种投票方法啊?选人的方法有没有什么对错优劣啊?这叫是吧?那第三个分析专业舞者和名人特征对比赛结果的影响啊,然后呢?这叫做影响因素的分析吗?对不对? 然后设计新的投票方案,这叫设计新的投票组合方案。系统一般就是优化了,对不对?优化方案找到最佳方案吗?对不对?最佳的这个投票组合方案,来,我们看一下理方法哈。方法 来,第一个用预测类模型,我们说了不能用单纯的时间性的预测模型,这个地方是不适用的,而是要用回归预测的思想,比如 c g c 的 模型加广义县域回归也可以啊, b e s 模型可量化观众投票的不确定性 对不对?然后 glm 能整合评委得分啊,选手特征等预测变量适合小样本高维度的需求,所以这两个模型组合,那个这叫组合创新,类似的组合创新还有很多很多的 好吧?很多很多的组合创新,比如说,比如说你这个地方可以用模特卡罗模拟,模特卡罗模拟来来得到与观众投票的不确定性数据,因为观众投票不确定性数据可以用模特卡罗模拟来做一做, 然后再结合一些预测模型来做,更好了啊,结果更,这样的话更好了好吧。有很多种创新方案,说白了就是你这个地方你不能上来就构建一个基础的方案,比如 igbo 的 cc 零,那这样的话是不太合适的,你要考虑到很多的不确定性因素好吧,而这些不确定性因素反而成了获奖的关键, 明白吧?啊?活跃的关键啊,你这里构建的模型呢?就是小样本高维度的预测数据。因为维度数据比较高,指标特征比较多吗?所以需要构建高维度的啊,高维度不能用基础的什么灰色预测什么的,不可能好吧,不可能的就是老哥老哥我用深度学习神经网络可不可以也可以 深度学习神经网络本身也适合于高维度的预测,但是呢,你的数据量最好大一点好吧,数据量太小的话很容易陷入过你核的现象啊。 啊过你和因为神经网络还有这个这个深入学习很容易过你和。所以说你需要有大量的样本来做哈来做。 还有第二个就是评价了啊,评价两种方案的对比。你可以啊,选择量量化两种方式的多维度,比如说两种方案每一种方案的公平性是观赏性 等等,如何?然后看到系数呢?看到系数用于衡量结果的一致性,这是评论结论,这两个组合起来也可以解决这个第二问啊,就是评价类评价两种方案的一个优劣吗?评价就是是吧,先构建评价指标体系,比如说公平性,观赏性是吧,这个效率之类的效率 啊,成本啊之类的,你可以都把这些特把这些呃,样本把这些指标啊,然后呢构建一个评价指标指标,然后呢再构建这个相关的一个权重 来这个地方你们最好来,你们告诉我啊,权重怎么来确定啊?要用双权法, 双权法能有公平性观赏性能能确定吗?啊?专权法能确定吗?做 a g p, 这是最最基础的一种做法了,因为公平性观赏性这玩意 甚至有模糊综模糊综合评价法,因为里面有很多模糊因素。公平性?什么叫公平?什么叫不公平观赏性?什么叫高傲低啊?较高傲,较低,这有很多大量的模糊因素,所以说用模糊综合评价法, a g b 模糊综合加模糊综合评价法,这个地方是比较适合的。好吧,你用双减法什么的,没有数据支撑压根对不对, 只能用这种模糊综合啊来做啊,来,还有影响因素分析,可以用多元现金回归加随机森林,如果你上面用过随机森林了,在这个地方我建议你就不要再用随机森林了好不好?不要再用随机森林了,你上面如果用了这个地方就不要用了哈,你如果上面没用这个地方啊,第一位也可以用这个地方,就需要换个别的哈,好不好? 影响因素分析啊,你可以用随随随心回归加随心随林啊,回归模型量化限性因素效果。然后呢,这个随心随林捕捉非限性和交互效率,全面分析各行的重要性。说白,用随性回归来评价每限性 量限性影响啊,限性影响哪些因素啊?是限性限性哪些限性因素他的影响影响效益是比较大的,因为这样的话,他的限性限性参数里面的那个参数值参数影响会比较大一点吗?对不对?那么非限性参数, 那么就需要用 c c 森林了,来得到哪些非限性参数啊?来,你那个因素是比较重要的啊,这两个综合来考虑。哎,这个挺好哈挺好啊,营养因素分析用这种两种方法来分别构建限性因素和非限性因素,哪一个影响分别影响是最大的啊?这个反而挺好哈挺好的 啊,还有优化方案的设计第四位你必。你如果想拿奖,整个废题,你不能单纯的就上来就是提个建议或者等等之类的,或者随便上一个方案。你需要构建一个优化模型 啊,你优化模型的话,这样的话是有说服力的啊,不要多目标优化啊,既满足什么?满足公平性又满足观赏性,这样的话两种目标对不对? 然后建立一个优化模型来得到一个最终的一个新的模拟,新新的一个投标系统来做新的一个一个打分系统。来来来得来得到哈。这打分系统既兼顾了观赏性又兼顾了平稳公平性。好吧,这样的会更好一点更好一点啊, 来,这个题目的难度呢?在三点五分左右,我的难度系数呢?中等吧。中等啊,不算高也不算低哈啊,不算高也不算低啊。首先呢比较复杂,就是他不是一个常规的时间训练预测模型啊, c 题就是很多预测都是用时间训练预测来说,但这个题目不是啊,他比较麻烦一点 啊,需要整合很多,又里面又有评价又有预测又有影响又有优化四种题型他完全还改了,你还要做到创新是吧?你没有创新还不行 对不对?你没有创新的话,因为本身原有的方案就有就不好了对不对?你还没有创新,那你怎么能获奖呢?对不对? 所以就是他,他就是要求你创新,他不是说不要求他要求你创新啊,他就数据量工作,数据处理工作量也比较大, 因为题目给了你大量的数据集,你需要做数据处理,你不做也不行,对不对?数据处理比较大,你万一漏了那也不行。而且 c 题百分之百数据是有问题的哈,我告诉大家每赛官方的尿性,百分之百数据是有问题的,你不做也不行哈。 啊,难点啊,刚才说了是吧,投标的间接预测,无直接数据交准是吧?说白了就是你,你需要人为人为的来判断一下一致性,没有数据作为交准,未知的投票结果,观众投票结果都是未知的哈。 两种投票方式你需要兼顾公平性、观赏性这种呢?公平性和观赏性吧,本身就属于模模糊数据级,又要把它变化成量化,所以需要构建成吗?绿水多函数, 这个函数的构建很关键,到底是限行函数还是还是一些其他的非限性函数来,你和这个量化指标,这个就很关键,你要构建一个模糊综合的话,你需要你绿水多函数,这管重要是吧?这个绿水多函数一旦做错了,那就很危险啊。 来,还有选手的特征,评委得分啊,很复杂啊,既有这个年龄行业又有得分,又有主观客观的一些内容交杂在一起就复杂的建模啊,很麻烦哈。还有新的投标系统吧,也比较麻烦,一种条件怎么来设定 对不对?目标函数怎么来制定?目标函数又要兼顾两种,两种内容,这两种内容又不是那种传统的量化那种,他整个题目真的是既有哎,预测优化,模拟。哎呦我的妈呀,我头大,我头有点大了啊。真的啊, 头有点大了是吧,还要脸?数据处理必须要做对吧?零得分啊是吧?控制啊,都需要补充是吧?预测需要明确假设条件,量化不确定性是吧?有很多的不确定性,你还需要量化他 对不对?你不像这个 b 体吧,太空电梯吧,有些不确定因素我们还能知道是吧?异常了,别结果突然变大,结果变小的,这玩意不确定性怎么来量化对不对?比较麻烦 是吧?还有评价指标的确定,指标的确定呢?还都是一些啊,一些难以量化的一些模糊指标, 对不对?也很麻烦对吧?新系统设计还要既要保证效率,还要你不能整的太过于复杂是吧?你整的太过于复杂的话,那就可推广性,可朴实性,就朴实性就比较小了。所以这个题目看着简单,实际上一包子坏水哈,一包子麻烦哈, 来啊,首先解决思路,先数据处理,然后呢啊,选举选手特征,变量,年龄,行业,然后构建观众投票,观众投票预测模型。贝叶斯这样的模型是不是 以什么评,以评委得分,选手特征周期为自变量,以淘汰结果为约束,观众预测投预测,观众投票数,计算预测执行区间 啊,这两种模型来分别构建啊,以什么为质,变量为什么为约束什么的,然后投票方法评价啊,设计指标评价体系,如争议、防范力, top 三偏重等于得分,用 h b 量化权重。然后呢,分析差异, 第四个要因素分析,构建回归和森林分析,专业舞者啊,来来和对投票的一个影响程度啊。然后呢?第五第五种设计多目标优化模型来确定啊,这整个的这个这个思路啊,还是比较比较明啊。思路倒是比较明显了啊。思路第一步,第二步,第三步,第四步该干什么?我们刚才的分析已经比较明显了啊, 要点就是创新,必须要融合多元信息的创新。好吧,这个模型的创新之管重要。这个我觉得这个题目的关键就在于创新,你到底能不能得到一个创新性的一个评价,一个预测模型,一个一个那个,呃,打分模型这个很关键啊,都是逼着你创新, 还有就是量化结果啊,量化结果是吧,给出投票的准执行区间,预测区间,这个说白了,你这你的预测值和预测区间千万不要太高,我建议不要整个百分之百,你说老哥我就等着百分之百,那你这是过你河了啊,一定是过你河了哈。 还有就是这个可制化哎,最好做一下可制化分析,模型检验也最好做一下啊,模型检验啊,然后呢?呃呃,擅长哎,这个题目就比较擅长数据处理。擅长擅长擅长。那个数值分析的题目推荐做, 计算机人工智能的也推荐做,功课的就不要不推荐了,因为里面也没有你能发挥的余地,全都是一些统一建模的东西啊。功课的不建议你做,尽管的呢,也还能做哈,也还能做哈 啊。然后呢,这个零基础的啊,我也不太推荐啊,比较麻烦。中等基础的也可以,高基础,中等基础,基础能力比较好的可以做一做,因为这个题目呢,写的人多,意味着你比较有创新点啊,看着简单,但是入手很麻烦,你看啊,一步一步的很麻烦,你千万不要觉得这个题目简单,我反正做到了,我没觉得很简单哈, 我真是觉得比 b 题都麻烦哈,真的哈,你可以你可以试试啊,你想做的同学,好吧,然后呢,我们一会呢还是会用我们整个的 ai 的 这个这个教程啊, ai 的 教程来给大家全详细的做一遍哈,来把这个是吧,尤其是注重创新,看到没, 我这里面还是会注重创新啊,这个方案二里面会注重创新,然后呢,把整个 ct 完整的从零到一的建模过程,代码调试都给大家做出来哈, 然后呢,我们把相关的代码包括我们的老师也在研发了,到时候相关的原代码都给咱放在这里面,好吧,我们导出的原代码都给大家放在这个里面哈, 好吧啊,大家到时候一定要去领取一下,千万不要忘记领取哈啊,不要忘记领取相关的原代码,相关的参考资料,相关的代码成品那边都给咱放在里面了,你到时候可以比对一下老哥团队做的和你们团队做的到底怎么样,好吧 啊,不一定,我们做的完全就百分之百对,仅供做一个参考哈,相关的源代码资料,每个题目的源代码资料,还有相关的解析文档之类的,就给大家放到我们我们的网盘链接里面去了,大家一定要去领取一下哈。 ok, 谢谢大家。

好,大家好,欢迎来到数魔加油站。那么本次给带来的是二六年,然后的话美赛的一个历年赛季分析,以及我们的一个考量预测。那么我们知道之前在国赛的时候,我们也做了这么一期的视频,然后的话当时的话是 五道题压中了四道,对不对?整个的一个准确率的话还是比较高的,那么美赛的话作为我们这样的一个比较大的一个比赛,那么的话我们肯定也不能够缺席。我们来看一看这个美赛他到底考些哪些东西, 我们应该怎么去准备,然后整体的一个考察趋势是什么?我们的重点应该放在哪些地方,然后这个地方的话会给大家带来我们六道题的一个整体的一个分析,加上我们的一个总结。 那么梅赛的 a 题的话,我们可以看到它其实考的东西是很乱的对不对?有什么真菌,又有自行车,又有植物,又有什么资源性别,这个是动物, 然后又有什么台阶磨损,看起来的话非常非常的乱,而且的话它的考点也很杂对不对?里面有包含什么东西, 什么动力学方程,然后的话什么作业控制, d p, 然后的话统计空间统计, largest 叉分,然后的话微分方程,对吧?各种各样的分布, 动力学仿真贝叶斯估计看起来的话完全没有规律,完全是杂乱的,完全是乱的不行。那么我们怎么去找到它的一个整体趋势呢? 那么它主流的话主要是考察它的一个这样的一个生态这一块的东西, 对于美赛而言的话,其实生态的话一直是一个非常核心的一个点,六道题里面有两道到三道都是会和我们的一个生态去挂钩的, 所以说在我们之前的一个主要的考点的话,其实就是在生态学这一块,然后里面主要涉及到的方法的话,就是生态学的一些方程,比较典型的就是逻辑,对吧?和他的扩展型逻辑卡 这两个模型的话,在每赛里面的出现频率是非常非常非常高的,而且不仅仅是 a 题里面 a 题、 b 题、 e 题这三个题目里面,这个模型的出现频率是非常非常之高, 所以说的话我们一定要重点关注一下。对于我们要备赛这几个题的同学来说,而现在呢,现在它一个最优化就是它的一个反问题, 那么原先的话只要求你会正着推过去,那么现在的话还要你会反着推回来, 那么反着推回来他有个难点,就是说比如说我们有一个,对吧? y 等于 abc, 那么我我们之前是已知 abc 去求 y, 那 么现在的话我们要已知 y 去反推 abc, 但是的话我把 a 乘以二,然后的话 c 除以二,那么他们得到的答案是不是一样的呢?对吧?是一样的。说实话反着退回来的话,它里面的话不确定性就会更高, 对于我们模型的要求和稳定性也会更高。所以的话可以看到的话不仅仅是美赛各种各样的比赛,在近两年来特别喜欢考的一个点就是贝耶斯, 用贝耶斯的话是不是就是从正着推过去到反着推回来这样的一个模型对不对?那么它整体的一个考察趋势呢?就是动力学是重中之重,是一个非常基础的一项。 在动力学的基础之上,我们要去保证我们模型的稳定性,要充分的去处理模型的不确定性,然后在我们多个指标之下,我们要提出一个可以衡量解决方案,对吧?可以衡量各个指标的解决方案, 整体的话更加看重于你模型的一个落地能力以及它的一个稳定性,因为我们现实生活中是充满不确定性的,而我们的话我们怎么算才算一个好模型?就是能够在我们不确定的现实生活中来得到一个确定的解。 说实话你们主要考的东西就是动力系统,这个是基础,然后的话有多对象进行交互,然后随机性是必考的,然后的话优化和控制,然后近些年的话,对啊,近两年特别喜欢考的东西就反演加推断, 同时我们要保证我们的模型是有作用的,它是可以落地的。最后的话就是我们要干嘛?我们要写类似于那种书信的形式,然后的话去用我们的一个非数学性的语言把它给表达出来。 那么现在他主要考察的东西的话就是这么几个,一个是我们随机环境下面的一个连续系统,比较典型的就是我们去年,对吧?去年的那个楼梯, 然后的话还有一个是二三年的一个自行车,应该是二三年吧,对吧?二三年那个自行车的问题 外部会有各种各样的因素来干扰来影响你,而你要做的就是把这些东西给它梳理清楚,哪些东西是我们需要考虑的,哪些东西又是我们不需要考虑的哪些东西我们应该怎么去对它进行模拟,哪些东西我们应该去找真实的数据, 这个是非常重要的。那么其次的话就是我们的一个多目标策略优化,目前在 a t 里面多目标考的频率不是很高,但是的话会涉及有,偶尔会涉及到一些, 那么基本上对于美赛的多目标问题而言的话,基本上我们用的模型的话就是一个 n s j 二, 那么第三个点的话就是我们的一个繁衍与推断,那么这个是我们近两年来这个数学建模竞赛里面非常大的一个趋势,就是我们的一个繁衍推断,主要是要把我们的一些内容和我们统计学相结合起来,那么统计学的话是现在的一个大的趋势嘛,对吧? 基本上什么东西的话都喜欢带点统计学内容,那么的话现在每次的话也不例外,那么比较典型的话就是用我们的背页式方法去做繁衍。然后最后一个的话就是我们一个具体的一个角色的建议,用非数学性的语言,然后去表达清晰,当发生什么样的情况的时候,我们要做出什么样的决定, 那么我们要去备赛 a t 的 话,我们要去准备什么呢?那么现在对于整个的一个数学建模竞赛而言的话,你去准备单个模型的话是不太够的, 现在的话数学建模的话还是比较考察你的一个综合能力,单模型在我们数学建模竞赛里面已经不是很常见的,那么的话对于 a t 而言的话, 一般的时候我们需要把它作为整个模块来进行考虑,整个系统的话里面可能会有多个模型,我们需要把它们进行堆叠组合,然后来形成一整个模块, 那么这个模块的话就包含了系统动力学,然后的话我们外部驱动因素,然后我们的一个繁衍,然后包括我们的稳定性分析,然后我们的一个模型验证以及我们最终的一个决策。 要保证我们的一个模,我们的一个模块它是一个整体,它是可以连续起来,它是可以拼接起来的,它们之间没有什么太大的缝隙可以插进来,同时的话也不能够直接把它抽出去,抽出去的话就会导致整个模块崩塌,要让它们保证在 要保证我们这个模块在一个比较平衡的一个结构里面, 那么对于 b 题而言的话, b 题的话一样的话也是一个优化的问题,但是的话你可以看到基本上现在考察的东西的话都是跟什么相关, 是不是我们的一个可持续发展呀?对不对?而里面涉及到最多的算法的话,就是我们的多目标优化,也就是我们所说的美赛里面最常用的一个优化模型 n、 s、 g、 r, 专门用来解决我们的多目标优化问题的。 同时的话,其实你们也会和我们的系统动力学去挂一点勾,会去沾点边,但是的话它里面考察系统东西一般考的比较简单,一般就是一个像这种趋势性的一些东西, 比如说增长啊、衰退啊这些东西,它的话一般会涉及到一点系统动力学的一个内容, 那么虽然说我们的一个 e 题才是可持续发展的主题,那么的话,但是对于 b 题而言的话,近五年考了四次,它的一个频率也是非常非常高的。 比如说你可以看到这个可持续发展这个主题的话,其实在我们的 a 题、 b 题和 e 题里面都是有出现的,所以说我们在备赛的时候一定要特别特别注意一下这样一个主题, 那么只要提到了我们这种环境相关的问题,可追相关的问题的话,基本上的话我们有一个模型,它就是逃不开的,就是我们前面收获到的什么东西,对吧?逻辑色,然后的话以及它的衍生和罗特卡, 罗特卡是这美赛里面出现频率非常非常之高的一个模型,这个一定要注意一下, 那么对于整个 b t 而言的话,它还是以优化为核心的,但是的话它里面又会涉及到一点其他的东西,因为我们是要走可持续发展的道路,所以说的话你不能只在当下稳定,你要保证你在未来的一段时间里面也是稳定的。说实话里面有可能会带有一些什么东西,带有一些长期预测的一个内容, 同时的话因为我们未来它的一个变化它是有波动的, 那么我们怎么去把他这种波动的变化率给他模拟出来呢?就需要我们的动态仿真,最后 未来是充满不确定性的,那么我们的这种模拟我们到底能不能够去贴合我们现实,我们的这个误差有多大?他的一个误差区间是多少? 他的一个自信区间又是多少?那么的话我们就需要干嘛去用不确定分析来表明我们的一个模型,他稳定的区间在哪个范围里面去,在哪个区间里面稳定,遇到什么样的极端情况他可能会崩塌,他又能够抵挡什么样的极端情况,这个就是我们要考虑的内容了。 其次的话就是我们要去学会编辑这种非技术性的报告,我们怎么能用非专业非数学的语言能够去清晰的把这个事情给他讲清楚,能够让非技术人员能够看得明白,同时知道我们应该去做些什么东西。 这个就非常考验大家对于自己模型的一个理解能力,对于我们这个场景的一个理解能力,以及我们这样的一个写作能力了。 也就说他现在不完全是要求你只会做一个呃,这种小型肚皮虾只会答题,你现在不仅要会解的出来,而且还能够真正的能把它落到实处去,能够讲还能够把它讲的明白, 这个是我们非常考察我们综合能力的一个点。那么对于 b t 而言的话,主要的话就是要求我们有一个跨学科问题,但是的话现在 b t 的 话基本上也是跨学科比较多, 不怎么再去考考察那种比较纯粹性的那种数学建模题目了,基本上都是和交叉挂钩模型的一个要求不是很高,但是的话对于你这种对于交叉学科的一个要求很高, 那么其实的话就是找数据的一个问题,那么找数据的话基本上就是我们在我们的一个文献政府报告,然后的话我们的公开数据库里面去获得,不要去什么 c、 s、 d、 n, 什么知乎,什么简书这些平台上面去扒, 虽然说它有可能也是引用的某些政府的数据,但是的话整体这个平台,对吧?那个数据平台它是所有人都可以发布的,它的平台的这个数据来源它就不可信。所以说你要去建模,你要去找数据的话,你一定要以官方为准, 否则的话你从数据上面都去都出了错误,那么的话你基于这个数据分析出来的东西,那不都是完全都是乱说吗?对不对? 那么对于 city 而言的话,呃,他可以看到在往年的话,我们说二一年是数学建模竞赛的一个比较有代表性的年份,因为二一年前后它的一个考点的话变得非常的大, 那么二一年的话你可以看他考虑什么东西, cv, 对 吧?然后的话 n、 n, 然后还有什么扩散模型,整体的话考察的东西是比较前沿的,更加的偏向于模型。而到了二一年之后呢?量化, 然后的话预测 what 有 结果?网球动量、奖牌预测越来越偏向于传统性的,偏向于理论测了,这个的话就是它的一个区别所在。 那么二二年的话是关于我们一个量化投资的一个问题,主要的话是包含我们那个时间训练,以及我们对应的一些交易行业里面的一些模型,比如说什么回测呀,对吧? 然后我们要去分析什么 k 线呀,对不对这些东西。然后 word 的 话它是一个训练模型,它是有一个关于文本的一个内容,但是的话它没有考得那么深,所以说你也不需要用什么什么那种 transformer 啊, 那么我们来看一看它到底考下来些什么东西。那么对于我们数据题的话,那么数据清洗肯定是必不可少的, 那么比较常见,对吧?我们缺失值处理,我们异常值处理,我们的多表关联,我们的分组聚合查询,对吧?这些一些比较常见的一些数据清洗的一个内容,然后还有什么,呃,这种编码对不对?特色编码 等等等等,这个的话对于我们数据来说的话是一定会出现的。其次的话会要求你对于我们这样的一个不确定性进行一个评估,因为对于预测模型来说的话,本身的话就是带有一定不确定性的,它本身的话就是一个黑盒的比较模糊的一个概念, 那么你的核心的话就是在我这个模糊里面去找到清晰,从不确定里面去发现确定,确保你的一个预测是可信的啊,比较常见的,我们的 boss, 我 们的蒙特卡洛贝耶斯,对吧?然后去得到你预测的一个自信区间,他的一个位置在哪里。 然后第三我们这个模型性能评估,那么我们比比较常见的我们回归,对吧?阿尔方,我们的 ms 一 ma 一 rms, 一 分类的话,我们的 f 一 分数,我们的准确率、精确率,召回率, 然后剧类的话我们的带维生保定指数,对吧?然后的话我们的轮廓系数 诸如此类,那么有的时候我们还不能够仔细看整体,我们要发现某一个特征之中是否存在一个预值,然后的话当突破这个预值的时候,这个我们的一个预测结果就会完全不同, 那么我们就要清晰的去梳理我们发现这个预值的一个过程,然后的话清晰的说明我们做这个分层的一个依据,然后各个层级之间他们有什么共性,什么特性,你的一个分层的一个理论是怎么样的? 然后其次的话就是我们的一个时间训练,那么的话训练模型是我们非常常见的一个模型,训练状态模型,像我们的这个去年的这个奥运会,前年的网球,然后的话带大前年的我们的 vivo, 其实的话都是在我们的一个训练模型的一个范畴内, 然后优化和决策的话,不太会涉及到这个优化和决策的内容, 只是说你需要用这种思想去衡量,对吧?去把它的一个不确定性给稳定下来,但是的话一般的优化模型是不怎么会用到的。然后还有一个比较核心的一个点,就是我们现在的一个因果和效应的一个识别。在过往的话我们一般做分析的话就只用做一个相关性分析就完事了, 但是现在的话相关性分析的话,他能够得到的一个因果效应太弱了,我们要从我们的相关走向我们的效应,再从效应走向因果去真正的能够深层的发现这个数据背后他的一个规律所在, 到底是什么推动了他这样的一个发展。那么还有一个的话就是我们这个多表关联和层级建模, 那么的话这个是在我们这两年里面用的比较多的,它会给你多个表的数据,然后的话它们里面你要用,对吧?要用外界连接的方式将它们聚合起来, 然后他要涉及到我们的多表查询,而且有的时候他们这个键,他们的一个命名还不是统一的,你还要去进行规范统一。最后一个的话就是我们一个面向非技术人员呢,也是我们所说的我们要去编辑报告,编辑我们的决策建议,那么的话这个东西也是我们现在必考的,基本上是必考的一个点, 我们要用非数学性的语言给他描述清楚,这个的话,他的一个权重是越来越重的,现在的话基本上已经快上升到和栽药一样的层次了,因为的话 从栽药里面可以看出来你的一个权威的工作到底严不严谨,从你的一个报告里面可以看出来你对于什么样的情形会做出什么样的决策,这个决策是否能够真正的落地。所以说这两个东西都是只有一页,但是的话这一页的权重是非常高的。 那么在过往的话我们的一个不确定性是可选项,但是现在的话我们的一个不确定性是我们的一个必选项,那么对于我们不确定性的话,我们的一个概率题,我们的一个统计题,对吧?我们的数据基本上的话就是用的 bootstrap、 蒙特卡路和贝叶斯或者分成, 尤其是我们的贝爷斯,贝爷斯在近些年的一个出现频率非常之高,基本上的话如果说你要去准备出季末季赛的话,你最好还是要去懂一些这个贝爷斯的一些相关理论,不是说你只知道一个贝爷斯公式就完事了,那只是我们的一个入门, 那么相比比之前的话,我们的一个现在对于你的一个模型的一个验证,它的一个要求会更加严格一些, 你必须要保证你的一个模型在当下,对吧?是最优或者是近是最优的,能够放在这个场景下面去稳定的运行。那么怎么证明你的一个模型是比较优的呢?那么的话你就需要一个对照基线有有一个基线模型来和你进行对照, 所以说我们一般都会建议大家,对吧?先比赛的时候先做一套最简的一个架构,然后的话在最简的架构上面去做修缮,这样的话你就能够非常清晰的知道你做什么步骤可以提高你模型的一个能力,你做什么步骤会降低你模型的一个能力,从而的话你就可以理清楚一个非常清晰的一个链路。 那么第二的话就是我们那个从相关性分析,对吧? p h c p r 浏览器, 然后呢或者是说做一些什么分析,做一些那个假设检验,我们就能够得到他们之间是有一个什么企业比较强的一个相关性的,但是的话现在的话他需要进行更加细致的分析,你有相关性,到底相关性体现在哪里?是什么原因造成的这个相关性? 他们的一个变化到底是有一个其中一个的变化会对另一个造成多大的一个影响,你都把它需要把它给量化出来。那么现在的话一些比较常见的一个控制混杂的一个手段的话,就是我们的分层固定效应模型和我们的差分, 那么其次的话还有一个是用在我们的一个因果推断里面,一个非常常用的一个思维,就是反事实的一个推断, 用反事实的方法去作为我们的对照组,看看他到底会有什么样的影响。同时的话我们一个相关和我们的因果之间,他们还是有一个非常强的界限的,所以说的话,你在我们的一个描述里面你就不要说, 对吧?因为他们相关所以说是什么造成的什么那个原因,这个的话是非常不严谨的。那么现在的一个考法基本上就是有三种考法,一种是预测加解释加决策, 比较典型的我们建立一个回归或者分类模型,对吧?那么一般的话就是我们的 g b t t, 然后随机森林 s v m, 然后的话逻辑式的心情回归诸如此类的模型, 然后我们做了之后的话,我们就要去进行解释,那么解释的话我们还要我们比较常用的我们的下铺纸, 对吧?我们之前一直给大家说了,用下铺纸去解释你的模型,尤其是机器学习这一块,然后的话用我们的像我们 bootstrap 呀,对不对?这个是非常常见的,在我们预测模型里面, bootstrap 方法,或者是说你用蒙特卡洛方法去得到你模型的一个自信区间,看看你的自信区间到底有多宽, 你的不自信心到底能不能够收敛,然后基于你的一个模型的结果和你的一个因果的一个推断,然后的话去做出相对应的决策,当发生什么事情的时候,你要去做出什么样的决定? 那么其次的话就是我们的一个训练模型加上我们的一个检验的一个过程,那么训练的话一般会伴随着非常大的一个不确定性,因为的话 一般训练模型的话,它是针对于单个训练而言说的。呃,一般的话在我们的睡觉模式里面很很少会考到我们的一个多训练的一个模型,那么单训练的话你就只能够基于过去去推断未来,然后的话它的话就会有非常大的一个不确定性,同时的话 呃,还会存在一个误差传递的一个过程,那么你的一个核心的话就是怎么可怎么样,尽可能的减少这样的一个误差的传递,同时的话让你的这样的一个单训练能够稳定下来,这是一个非常, 这是非常考验你这样的一个数据处理的一个功夫的一个能力的一个考法。你怎么把这种胡啊杂乱的序链能够处理,能够理清一条比较清晰的链路,然后再选用合适的模型进行建模,这个非常考验你的一个基本功。 那么一般的一个考法的话就是我们的一个状态切换点识别,我们在什么情况下应该去切换我们那个状态,然后的话我们在什么时候,当到达什么值的时候,我们要去进行预警,比较典型的我们的那个量化对不对? 那么第三个的话,我们的一个层级面板加上我们的一个效应分解,那么的话面板数据这个的话也是我们美赛里面非常喜欢考的一种数据类型, 那么比较典型的话就是我们的贝叶斯方法,然后我们的分层拨松,还有我们的固定向与回归,或者是说我们的差分,差分的话在我们的一个因果领域的话是用的非常多的一个方法。那么我们 ct 的 话,到底应该要去准备哪些东西呢?首先的话比较典型的考点预测加解释加决策, 所有的方法的话,就是比如说我们要用一些集成部学习啊,就是我们的一些 gbt 啊,什么收集森林,什么超级 boss 的, 什么来 gbm, 什么开 boss 的, 对吧? 或者说用一些比较简单的模型,心情回归,逻辑回归,然后什么决策树,然后什么贝叶斯朴树,贝叶斯,对吧?然后用我们的 bugstop 方法,然后的话来衡量它的一个不确定性, 最后输出我们的一个决策,并且给出我们决策的一个依据所在。那么第二的话就是我们的一个训练或者说状态模型加上一个检验的一个过程。 那比较典型的话就是我们的一个野马模型,然后的话加上我们的一个置换,或者说我们仿真。那比较典型的应用领域的话,就是我们一个状态切换的一个识别,以及我们的一个预警的一个识别。 那么第三个的话就是我们的一个面板数据加一个效应的一个分析。那么比较典型的方法就是我们的一个分层薄松,或者说用我们的一些贝叶斯方法,或者说我们固定效应模型,或者是说我们的一些差分。 那么像美赛的话,现在这个差分也是考的挺多的,因为的话其实很多有些英国模型的话,他其实也是基于差分的思想去做的, 那么我们可以去给我们的一个 city 去做一个总结,里面的话包含了我们数据层,数据层的话我们要干嘛?趋势处理,异常值处理,分组聚合,对不对?我们说过了我们数据分析这常用的几个函数,对吧?分组聚合查询。 其次的话,我们的一个预测层里面包含了什么?包含了什么持续数据,然后的话比较典型的 lma, 一 般的话是作为我们的一个基线模型,那么除此之外的话有什么呢?比如说我们要预测多个时间序列的,我们一般会用什么?五二对吧? 向量值回归还有什么?呃,比较经典的一些的 prop, hat, l, s, t, m, 对 吧?其次的话我们还有一个用于计数和比例的模型,我们的 glm, 然后一般用于我们的回归和分类的,一般就是我们的一个 logist 和我们的一个 linear regression, 对 吧? 现金回归和逻辑回归是我们比较通明的一个机械模型。然后在不确定性方面的话,我们一般都用我们的 boss, 然后呢摩登卡洛贝尔斯。在分类这一块的话,我们一般用什么方法?我们去给每个类别去设置权重,然后来避免这种不均衡数据的一个影响。 其次的话我们可以手动的去更改这样的一个域值,判别域值,然后的话来减少这样的一个不均衡数据的一个影响。那么对于我们一些概率模型的话,我们还可以用我们的 platt 方法,或者说我们或者说我们的 icotonic 方法去做我们的概率校准, 对于我们训练模型的话,比较常用的我们的划窗模型,或者说我们指数加权回归,然后我们的银码模型辨别检测。那么对于角色的话,我们很少会考到模型,那么是一般考的话,基本上就是涉及到背包和排序,然后的话一个 m l p 就 ok 了。最后我们就要对我们的模型进行验证,确定我们的模型它那个效果是好的。那么我们一般怎么去验证呢?有我们的留一法对吧?留一法留出验证,或者说我们的一些交叉验证,然后对于我们一些金融模型或者时间训练的模型的话,我们有一些滚动回测, 对吧?然后的话对于我们一般的模型的话,我们有一个基线对照,然后确保我们的模型是最简加够,有没有溶于的部分。 那么对于地铁而言的话,地铁的话是一个非常典型的一个图论的题目,他每年的话都是考图的模型,可以看到二零二一年图的一个,对吧?音乐影响力社交图,二二年企业战略数据,这样一个企业图,市场图,对吧?二三年 可持续发的目标环境图,二四年这样的一个五大湖水怪钓位,又是一个环境图,对吧?水位图,二五年城市交通规划交通图,所以说它的数据结构是已经确定下来了,就是一个图, 那么它的考点呢?因为图论的话已经有非常非常多成熟的框架去实现了, 基本上你只要把这个图网络给它建立起来的话,那么里面的各种各样的模型啊,你基本上只需要一行代码就可以实现,所以说的话一般考这东西的话都不会考的很纯粹,但还会把一些其他的内容给加进来,比如说我们的决策对不对? 那么我们知道我们图的话有两个结构,一个是节点,另外一个是边,那么节点的话它是固定的,那么边呢?边是我们需要去衡量它的权重的,衡量它的边长, 那么因为我们图论里面的一些算法是已经相对而言是比较固定的了,他不能他没办法去考出什么新东西来,所以说的话他就只能够去把这个边让你去衡量这个边的权重, 他不会直接把边的权重给你,或者说他给你一个边,给你多个权重,然后让你去最后算出你的综合权重。那么这个时候我们应该怎么办呢?那么比较典型的我们就会用我们的一些评价模型去评,去评价这个边他这个权重到底是多少, 把它给量化出来,这样的话我们才能够把整个图网络给它建立起来,否则的话你拿到数据之后,你会发现它要么就是节点没有边,对吧?要么是节点没有给边的权重,要么就是一个边有很多权重, 那么图的话它是比较错综复杂的,基本上就是迁移法而动全身的这么一个结构,所以说的话对于我们图那么一个模型的稳定性的话,要求会更高一点。 那么比较典型的就是我们的节点失效,或者说边失效的时候,那么我们应该要怎么去动态的去变化,怎么才能够让这个图不会崩塌, 我们怎么去平衡这个图?它们之间的关系,怎么去做分流等等等等。这个是美在对于地题非常喜欢考的一个点, 那么的话基本上它的一个做法的话也比较相对固定,固定的首先的话根据它的给出的数据去构建我们的一个网络体系,然后的话用我们的商圈法,或者是说我们商圈法叫 a b h p 或者是双圈法叫 topase 去定权, 然后的话再去调用这个图论里面的那各种代码包里面的各种各样的模型,什么都最短路啊,最大流啊,对吧?最小费用最大流啊,最小生成数啊这些东西基本上只要我们把这个图给建立出来了,其他的内容的话,所有的算法都是一行代码都可以实现, 那么里面主要涉及到的东西就是有这么些,一个是网络分析对不对?可能会考到我们的网络流最短路。 其次的话评价和角色用来确定我们编的一个权重里面比较典型的 a h p 三乘法和 top space, 然后优化模型,我们一般图论的一些模型, 然后当我们决定和编失效的时候,我们怎么应该去仿真,怎么去模拟它,这个失效之后我们的这个网络会发生什么的变化,它是整个的一个,是一个动态的结构,我们要能够去适应这个现实里面的这个变化,然后的话来进行动态的调整, 然后还包含了一些数据科学的一个内容,那么的话数据科学的话里面的话可能会有什么组成分析呀,具类分析呀、回归预测呀这些东西的。然后去年的话还考到了我们一个 g s 的 一个空间分析,但实际上你不用 g s 做也可以。 那么像现在的话比较典型的很容易考的一个点的话就算了,一个网络的一个韧性,就是说怎么才能够让你整个网络不失效, 不会因为某些变动而直接崩塌掉,这个的话是近些年来考察的一个趋势,尤其是像去年的那那种题目。 所以说啊,他今年的一个考点的话,很可能就是和我们的一个网络韧性相关的,也就是如果说,呃,我们某一个节点或者某几个节点呃他中断失效了, 那么我们应该其他的东西应该怎么变化,才能够去保证我们整个系统它是能够正常运转起来的,而不会牵一发而动全身?全部一个失效,全部失效,我们它能够抵抗风险的一个预值是多少? 我们怎么做才能够提高我们的一个抗风险的一个能力?那么一题啊,是一个关于可持续发展的一个问题,那么的话他考的内容的话就比较杂了一点, 因为可持续发展的话,它是一个很大的一个主题,它里面的话涉及到的内容会非常非常的多 啊。比较典型的二一年你们有什么系统动力学,又有什么供应链?然后又有多信息分析,然后二二年呢?又考到了什么微分方程?又有什么动力学,对吧?然后我们都有多决策模型政策沟通, 二十三年又有我们的这个多目指标模型分类评估决策课。二十四年保险,保险行业的精算,只要说你不是这种保险专业的话,基本上你都不太涉及到这种精算这个东西,对吧? 所以说的话还容易考察的一个内容的话,就非常非常杂乱。如果说你想要去把这种一体可能会考到的模型全部都学一遍的话,这个是不太现实的,因为它里面总会有一些这种偏向于这种专业性的模型,是你平常可能完全都不会涉及到的, 那么这个时候的话就需要我们去查找对应的文献,然后的话去查找对应的资料来进行纠解了, 然后二五年,对吧?又是我们的系统逻辑群,所以说系统逻辑群的话在我们美赛里面是一个非常非常重要,也是一个非常非常常考的一个考点,尤其是我们这个挪的卡模型, 这个是频繁出现在我们的 o 奖论文里面, 那么在过去的话,它里面的话只会涉及到环境里面的某些单纯的情况,但是现在的话需要你考虑整个环境的系统,然后过去的话是我们考虑它里面的一些镜,是对静态的一个系统,对吧?静态的环境进行分析,而现在的话我们要考虑有整个环境它的一个动态的一个发展。 对于模型的选择的话,现在的话也不会考察你单一模型的,更多的是考察你对于组合模型的使用能力,最后要提供一种非技术性的报告,然后的话能够用非数学性的语言能够把它给讲清楚。那么对于一体而言的话, 他的话就要求我们对于整个题目有一个系统性的一个了解,有一个能够对他进行系统性的分析,然后里面会包含多个模块,我们需要根据不同的模块的结果,对吧?我们要把这个模块给他组合起来,然后综合他们的结果去得到一个你想要的一个答案, 根据他的一个输出去提供对应的决策的一个建议。那么里面比较常见的考点的话,就是我们一个第一个是我们的动力学,第二的话是我们必考的这种不确定性的分析。那么现在比较典型的考点的话,就是对于他的一个情景进行分析, 在不同的情景下面会有什么样的一个情况,他是一个理想的,而往年的话一般会考察一些连续性的这种敏感性的分析。 然后第三个的话就是我们怎么去找数据的问题,那么一般的情况下的话,我们都会在我们的世界银行里面去找数据, 或者是说一些这种啊这种官方的数据网站里面去找数据, 这个的话我们也跟大家说过了,千万不要去用类似于这种 c、 s、 d、 n 啊,知乎啊这些平台里面的一些数据,这个的话它的一个是没有经过验证的,这个的话它数据的话你是不能够保证它数据的一个可信性的。 那么 f 题的话它就是一个政策性的一个题目了, 那么 f 一 的话都是和我们政策相关的题目,然后的话一般的话都会用到一些这种政治经济学里面的一些模型啊,跟我们一般用的模型的话可能就不太一样, 而且的话像这种政治经济学的模型的话,一般的话也只会在我们的 f t 里面出现,所以说的话一般的时候的话,我们都没有去,对吧?刻意的去学过这方面的一些东西,因为在其他的比赛里面啊,这东西这些东西的话都出现的太少太少了,只有这个 f t 里面会涉及到这些东西。 但是的话说,虽然说它里面会考到这种政治经济学这种东西,它里面的模型的话一般还是用的比较简单的。 那么对于我们的一个 f t 的 话,虽然说它是一个政策的题目,但是的话一般的时候也会和我们的一个可持续这个东西去挂钩,所以说可持续的话实际上是每一项里面非常非常非常常见的一个考点。 那么对于 f 的 要求的话,它必须要求你使用这种真实数据,因为它是跟政策挂钩的,跟我们的政治挂钩的,你这种的话肯定不能够去编数据啊。像去年的话,它里面的话要强制要求了你使用那个 vcd 的 一个数据据, 用 vcdb 和其他的数据源作为你的一个数据支撑。然后其次的话就是用我们实证分析的方法去衡量它政策实施这样的一个效果, 然后根据我们政策实施效果的话,去给我们提供对应的政策建议,我们到底应该怎么去改良我们的政策到底应该去怎么做? 最后去验证我们的一个模型。那么像这些年来来考到的东西的话,就包括我们的政策法规呀,我们的人力公平啊,我们的国际合作呀,我们的数据安全这些东西 可以看到他基本上什么东西都会沾一点,考的非常的宽泛,对吧?考的非常的宽泛, 那么的话它里面可能涉及到的考点的话,今年的一个考点的话,因为去年的话是 a 建特元年,那么因为它是 a 建特元年的话,所以说它里面可能会考到一些和我们 ai 相关的一个东西。 因为美赛的 f 里的话,一般的话都是和我们实施热点去挂钩的,所以说的话像去年的话,像这么重要的一个年份,这么特殊的一个年份的话,他应该可能会考到这种 ai 治理,或者说 ai 的 一种相关的政策, 比如说根据我们国家的 ai 治理指数呀,对吧?然后的话去衡量各个国家的一个治理水平,或者是说我们的 ai 安全呀, ai 治理呀等等等等。 那么现在的话我们来总结一下,对于我们美赛而言的话,我们到底要干嘛?拿到元素数据之后,我们首先的话要去把我们问题去抽象, 抽象成我们数学语言去表达出来,然后的话再用我们的模型去进行建模,建完模之后我们要去验证一下我们的模型到底有没有用,它到底稳不稳定, 然后总结我们模型的内容,总结我们的输出,总结我们的决策,然后的话把它化为一个可以与非技术人员沟通的一个文章, 然后基于这个文章的内容的话,我们要去反思我们到底应该去遇到的什么样的问题,为什么遇到这个问题。然后的话我们在遇到什么样的情况的时候,需要去做到做出什么样的决策才能够达到一个最好的效果,然后的话最后提供对应的一个决策建议。 而对于我们每赛重中之重的一个灵敏度分析的一个部分的话,我们基本上的话会有这么几种情况,那么我们比较典型的我们要局部灵敏度分析,然后的话它主要是针对于连续参数,看看我们每个变动,对吧?对于我们这个模型会有什么样的影响。 其次的话还有一个是我们理想的情况,我们不同的情况,他的一个变动会对于我们整个模型有什么影响。那么第三个的话就是对于我们的一个不确定性的传播,也是比较典型的,我们要去算他的自信区间对不对? 那么比如说我们如果说输入是随机的,那么我们可以通过我们的大量的模拟,然后得到我们输出结构的一个统计分布,看看他的一个自信区间到底是在哪个位置,他的一个自信区间到底是宽还是窄,能不能够收敛,能不能够稳定。 我们给大家强调了,这个灵敏度分析是美赛的重中之重,一定是要配图的, 就算你的这个地方你只有表,那么也是不够的,我们灵敏度分析一定要配图,这个的话是我给大家是强调过非常多次的,这个是美赛对于这个东西有一个非常严格啊,应该要不, 应该也不算是非常严格吧,就是说他里面评判的时候,其实如果说你这地方灵敏度分析没有图的话, 会给评委,对吧?他们可能会给你这个权重拉的非常低,因为的话这个也是看了很多方面不错的论文,但是的话,呃,没有拿到什么奖项啊?他们里面的话就是没有什么图, 所以说的话美赛他这个会图大赛,对吧?这个外号的话也是没有白交。好,那么我们所有的资料就放在这个地方了,那么大家有需要的可以自行去进行领取。

好的,小伙伴们,大家好,接下来我们讲 c 题哈,大部分同学呢,我看了一下后台的选择题数据哈,大部分同学都会选择这个 c 题哈, c 题的话呢,怎么说呢,你选这个没问题啊,同学们,我告诉大家哈,你选 c 题没问题,但是你必须要有创新啊,因为大部分的同学都在选这个 c 题,目前答题比例已经达到了恐怖的百分之四十哈, a 题百分之三十, c 题百分之四十,两个题目加起来接近百分之七十了,老铁们哈,百分之七十的人都会选这个 c 题啊,都会选这个 c 题 啊,所以说呢,我建议同学们哈,要慎重啊,其实我是非常不建议选这个 c 题的,我觉得吧,你就是大家大部分同学选这个 c 题都是为了图简单啊,但是呢,我告诉你们啊,图简单,不要去图简单哈啊,不要去图简单, 为什么呢?因为 c 题你看着哈,但其实它很麻烦啊,很麻烦 啊, c 题很麻烦,所以说,我建议你们不要去盲目的去做这个 c 题啊,不要盲目做 c 题,好吧,老铁们,我建议你们避开它,因为因为这样的话,获奖是比较难的,你不要图简单,大家说实话都知道,数据都知道,怎么建, 那你说对不对?你,你说你怎么获奖呢?你创业点怎么来搞呢?对不对?所以说,我不建议大家选 ct 啊,真的,我,我是真心的劝大家啊,要慎重哈,要慎重好吧 啊,老哥,选哪个题?我建议我建议选 a 题或者选 b 题啊,你最好就是选,要么选冷一点,冷门一点的,这样选的人少,竞争压力会小一点,对吧?你选这个 c, 那 么大家都选这个 c 了,所以当然了,我,我不说,不给你分析哈,我给你分析,但你要慎重,你想拿奖,你必须要有创新点, 你必须要有创新点,如果你做这个 c 题没有创新点,那就白搭了,而这个 c 题的创新点 百分之大部分的都是两种创新方案,第一种改进的模型就是你用改进算法去做,第二种融合模型啊,就你选择不同的模型一块来做, 你说交叉你行不行?交叉创新的话,在这个地方的话啊,也可以试一下。好吧,只能也可以试一下,因为我们创新模型的话一般就有这么几种方案吗?所以说这几种方案的话没法说,但是改进算法的话,我觉得在这个地方是最常见比较常见一点的,所以大家呢,如果想做 c 的 同学呢,你要慎重, 你要能够能有创新。好吧,你要有创新啊,真的哈,啥也不会,只能选 c 你, 那你,你不至于啥也不会,老铁们,真的不至于,你有 ai 了,理论,你没有不会的题目了,好吧,你没有不会的,而且 c 题呢,也没有那么简单,还是比较复杂的,大家都做, 所以说呢,就看谁做的好了,你想做的好的话,我觉得你和高手竞争是有很大的压力的哈,要有压力的,所以建议同学们呢,要慎重一点哈,要慎重一点 哎, ok 啊,这个这个大家呢要慎重哈啊,与这个题目的话呢,我们简单阅读一段的话,就是与星共舞啊,美国为美国,美国节目舞动奇迹啊, 然后呢,这个这个我们前面呢就是专家投票吗?专家通过什么在线投票?这是他们最喜欢的情侣啊,观众的话每周可以投票一次或多次,上下为当中公布的次数,然后呢,还有就是评委也可以投票之类的,然后选出第前几名来,对不对 啊?评委投票和得分和观众投票的组合方有多种,在美国版节日前两季采用基于排名的组合方式。第二季因什么什么啊啊, 然后,然后呢,就修改了这个争议哈,第二十四季又出现争议了对不对啊?评,尽管评委得分低,仍赢得冠军,作为回应,二十八级就说白了他的他的评分吧,是由评委和 评和这个观众投票来综合决定的。有的时候呢,评委觉得不好,但是观众觉得好,那观众投票多了,那么就有可能得得得这个最终的这个成绩了。但是,但是呢,又因为不专业,比如说一二流子一些选手,那么特别会讨观众喜欢,那也有可能对不对? 还有有有,如果,如果评委特别的占比权重比较大,观众占比比较少的话,那有可能这很多啊,迎合评委的啊,评委的角度不能代表大众的,所以有可能引发歧义啊,就来构建一个比较合理的评价的这么一个啊,评分的这么一个模型啊,这就是整个题目的核心哈, 来开发数学模型啊,估算每个选手在其参赛的每周获得观众投票数啊,就估算这个呢,就是一个基础的预测模型了啊,每个每个这个来,同学们,来,大家告诉我哈, 开发数学模型一个和多个来,你告诉我到底开发几个?首先啊,首先到底开发几个?这个是一个要点哈,到底开发几个? 你们记住哈,那就一定要开发多个。你想做 c, 我 还那句话,你必须是勇士,你必须要有胆量, 你必须要牛逼,对吧?要不然你要说你就开发一个,你开发一个非常基础的,你做 c 题,哪讲?我就这么说,你再创新也没有希望,因为因为选 c 的 人太多了,高手太多了。老哥这里统计了百分之四十的同学会选 c 了,都是勇士啊。说实话,所以你必须要开发多个, 而且多个模型来估算明白吧,来估算明白吧,你的模型估测关注投票结果是否能得出与每周淘汰结果一致的结论啊,提供一致性的衡量标准就是你要,你要能什么? 你要结果要准确,你不能结果不准确,对不对?确定性如何?每种确定性这个就需要有验证了,就你的结果也有验证,说白了我我告诉大家哈, 真的,这个地方就看谁的模型精度高了,但是你们记住你们的精度啊,很多情况下来大家告诉我,来来,我问一下哈, 我问一下哈,来,这个的话你说老哥,我不单纯的用美赛官方给的数据,我用别的数据来佐证一下,可不可以?老铁们,就是我用一些达人秀,或者我用一些别的投票的一些结果来做,可不可以?老铁们,别的投票的模型来做,可不可以? 可不可以?老铁们,你们跟我说完全可以,反而会把你的模型的这个精度啊,反而会提高的比较高。来这个地方一定要注意两件事一定要注意两件事哈, 一定要注意,除非他明确的说了啊,你可以看了没,你可以自行选择纳入信息或其他数据。看了没?其他数据,但必须要记录数据来,同学们, 我这地方要注意两件事,第一个叫什么过你河,第二个叫欠你河。来,你们觉得哈,你们觉得你们最容易做预测模型的时候最容易出现的一个问题是什么啊?最容易出现的一个问题是什么? 就是你们如果来做这个题目啊,后面会有啊,我会讲到啊,你不用担心啊,啊,你会讲到来 你们容易出现了一些问题,什么做预测的问题,做回归问题啊,过你河,我告诉你们,你们最容易出现的就是过你河了,真的,所以说你们一定要注意一点,好吧,不要出现过你河 啊,这个很关键啊,很多同学呢,做预测经常会出现过你和还有同学这么这么来做的哈,来,还有同学这么来做的,我们来,来啊,我,我后面会讲到哈,这里有一个完整的看了没?完整的来 看一下啊,来,看到没,他有一个完整的解析思路,第一步,一定要做数据处理。第二步, 观众投票预测构建贝叶斯啊,这是基于概率的模型,以评委得分、选手特征周次为自变量,以淘汰结果为约束啊,预测观众投票数,预测知信区间。来这个地方呢,很多同学这么来说的, 我看你们的方案了哈,你们说老哥我预测他的投票得数,那我这样不就行了吗?啊,我,我这样不就行了吗? 来,我直接就是用他每前几个周的得数预测他未来每个周的得数,可不可以?老铁们,原来这样来说的哈,我用他前几个周的得数来预测他后几个周的得数 来。老铁们,你们觉得这样的行不行啊?你们觉得这样行不行啊?我刚才有同学在上面是这么说的啊,在评论区留言啊,包括在那个老哥私信我这么说的,行不行?老铁们,行不行啊? 为什么啊?包括你们告诉我为什么?我告诉你是百分之百不可能的,不行的哈, 你别乱搞哈,你记住哈,投票结果是未知的,严格保密的,你不可能说用这个是吧?哦,前一个数据来预测未来几个周的数据,你就你就,你就完整的变成时间序的预测了, 知道吧?你是不可能的啊,你,你别乱搞,你别乱整哈,你别乱整来。 但是我可以构建一个什么样的模型呢?老铁们告诉我,既然如此, 那我就不能用时间虚的预测预测了,对不对?但我可以用什么预测来,我要我现在要做的一个一个参数叫什么?观众投票数,他和很多项数据有关系,包括什么评委的得分打分,包括一些其他的。哎,这地方有哈,包括其他的 看啊,哎,在这地方包括他的年龄,包括行业啊,包括一些是吧?他的这个,这个是吧?这个这个选手的一些特征,包括他日常的动态,包括一些其他的淘汰的一些结果。来 来,同学们告诉我来,我相当于我要预测一个指标,它和若干个指标有关系。那你告诉我要构建的是一个什么样的模型啊?啊?要构建的是一个什么模型啊?这是这种预测方案,不叫持续预测,这叫什么预测?老铁们, 哼哼,叫什么预测呀?到现在啊,大家都提出了有用 xt boot 的 啊,随机森林对吧? 这就是回归吗?对不对啊?某一个变量和若干变量有关系,不就是回归吗? 是不是?那不就是回归吗?所以说你这个地方既然构建回归,你们就记住我刚才就要返回来,我刚才提到那个那个逻辑了,不要出现过你河,也不要出现欠你河,好吧,过你河就是你回归的模型,太美完美了。 来,你告诉我这种未知的投票数量的能过于完美吗?老铁们,所以说谁的预测的模型的精度达到百分之百,你反而应该要慎重了,你百分之九十六九九九你都要慎重, 你的精度不可能那么高的。我可以告诉你哈,因为他是未知的,而且这两组变量之间理论上没有什么必然的情况, 不能说他评委得分就高,他观众投票就高,对不对?也不可能说,但是呢,来评委投票高,有没有可能观众投票也高啊,也有关系啊,也有可能啊,那评委投票高,有没有可能观众投票低呢? 也有这个可能,对不对?所以说哈,这里面比较麻烦,比较复杂, 你呢,一定要慎重啊,一定要,一定要考虑,就是自变量和一变量之间没有很强的关联度,没有很强的关联性,这个是很关键的哈, 明白吧,做这个做回归理论者是一个大忌,就是自变量和一变量之间没有很强的关联性,我们说这属于大忌,但是呢, 不代表说他俩没有关系,往往会呈现一个啊,就是典型的比如大部分选手可能评委投票比较高,观众得分也会比较高一点,只是说有一个大概的对不对?但是你要考虑极端场景之下的一些情况 啊,因为因为前面说了吗?对不对?来前面说了,以前面已经给你讲了很多了,对不对?说有有可能会出现专家评分高。所以说呢,这个 第一小问啊,我建议你们不要你合的精度太高。好吧,不要你合的精度太高啊,太高了确实会有问题的哈。来 第二小问啊,利用你的观众投票结果估算结果和其他数据比较和对比节目使用的两种投票方法,排名反而百分之在各季产生的结果是吧?就每一季对应的两种结果,如果结果再查也其中一种方法似乎更清,更似乎偏向于观众投票, 对吧?就是比较吗?对不对?和个体产生的结果比较结果的结果,如果,如果结果存在差异,那么其中就哪一种方法可能会偏向接受投票,说白了就是看看哪一种方法和观众投票的相关度更高吗?对不对? 然后考察这两种投票之外存在两种投票方法存在争议与观众或观众意见存在分析的特定选手的拥有情况,投票组组合方法的选择是否会导致这位每位选手的结果相同,是吧?每周什么什么的啊? 然后呢,咱们就那个一考虑一些具体的视力,把你建立的模型,再把具体的视力,然后呢这个考虑进去,然后呢,利用包括投票观众估算结果,在你的数据开发、模型分析、专业舞者以及数据中可用的名人数据的影响 对不对?这些因素对名人在比赛中的影响有多大啊?说白了就是你前面不是估算了一个观众投票的模型吗?对不对?利用观众估算投票结果在你的数据啊, 开发模型,分析专业舞者以及数据中可用的名人特征的影响啊,这些因素对名人在比赛中的表现影响有多大啊?

好的,亲爱的小伙伴们,大家好,我是老哥啊,今天呢,给大家整理了二零二六美赛 a, b, c, d, e, f 体的这个翻译哈,这个相关的一些工具啊,我们用我们的超级的这个 提着头给大家整理出来了一个 a, b, c, d, e, f 题的,整个的一个赛题的一个啊,相关的一个解析啊,模型的选择,以及相关的一个创新点的总结,以及相关的难度分析和选举的建议哈,大家可以看一下哈,今年的话呢,美赛的 a, b, c, d, e, f 题吧,顺序有点颠倒哈, 往年的美赛的 a 题是不可能出这种题目的啊,往往会出一些比较偏门的一些,是一些什么微方程啊这种激励分析类的赛题,而这个 而这个 a, t 呢,呃,智能手机电池耗电建模啊,这个确实出乎了我们的意料啊,只不过呢,很多同学啊,用这样说,老哥,既然是预测的话,我直接用时间系列预测模型就不就行了吗?对不对?你们记住哈, 每赛我觉得 a, b, c, d, e, f 他 出错的概率是非常的低的啊, a 题呢,历年往往都不可能是一个单纯的数据分析类题目的,你说这个,老哥我用一个什么灰色预测,回归预测,直接预测 打那个耗电不就行了吗?啊,你直接耗预测和剩剩余时间随时间变化。函数,我直接用一个基础的回归函数,我直接用一个基础的回函数不就行了吗?你记住,这是 a 题, a 题往往就是机理建模,机理分析,所以说这个题目的核心一定是机理建模的,用一些数学物理的公式,哎,把耗电量和各种各样的参数,他内部之间是怎么关联的 啊?内部之间具体的机理机理的流程啊,只有你把这个串联起来,你才能够建好模型。 所以说 a 题啊,绝对不是一个单纯的时间训练分析题目,我们后面会给大家讲到怎么拿大奖,拿大奖的话,如果你想拿奖,我想拿一个 h 奖 m 奖,你用一个单纯的经历,一单纯的时间训练分析类,或者用普通的继续学习算法,是不可能拿奖的,所以大家一定要注意啊,这个地方要慎重,要慎重哈, 来啊,这是我们的 a t 的 一个翻译哈, a t 的 一个翻译。 b 题的话呢,太空电梯系统建立,求直微的,你不要被这个题吓到。首先啊,这个题的话呢,你千万不要被吓到,不管是什么太空 g t 还是月球 g t 还是什么火星 g t, 本质上来说就是优化 啊,本在本上来说就是涉及到多个系统的问题,他逃不出这个去的, 和本上和建一个医院啊,建一个修一个学校啊,基本上没有什么区别,所以你不要被他吓到哈,难就难在这个题目可能会涉及到数据的问题, 数据不好找而已啊,但是传统的我们常规的一些优化模型基本就可以做出来,大家呢,也不用担心好吧,这个题目呢,你也不用太担心,后面我会讲到一一的分析啊,就每个题目看了没,他会有一个完整的分析报告啊,到底评分依据或讲难点,解析要点,解析思路或讲要点哈,都给大家讲到的,所以你也不用担心啊, c 题,这是一个比较基础的一个机理机,一个数据建模题目了又,我说说的记忆学习分析题目啊,这个呢,就是有点,有点不太,有点就 突突兀哈啊,今年呢,就是搞了一个节目啊,搞了一个节目叫舞动奇迹啊,说白了就是观众投票之类的,人家得到相关的数据分析,给了大量一些数据表啊,今年的话呢,我们用 ai 是 今年我敢说是每赛历年获奖难度最大的一年,也是小白获奖最好获奖的一年。为什么?因为今年的 ai 将会是 ai 在 世界剑魔领域彻底渗透的一年,也是彻底渗透的一次比赛, 尤其是个 ct, 给的数据集竟然不多啊,给的数据集竟然不多啊,这也是超乎我的预料的啊 啊,你如果给的数据不多,那 ai 就 可以直接给你处理掉了, ai 就 可以直接给你处理掉,所以这个题目的核心就是你一定要做出创新性来,如果你没有做出创新性,你就利用了一个单纯的继续学习算法来做的话,那你这个题目想获奖就不可能。我们给大家讲了四种创新, 四种创新,对于啊,在这个位置上,那么你必须要选择一到两种创新来做,因为大本同学我估计会选这个 c 题好吧,因为这个 c 题给了数据,也给了相关的一个难度系数,也不大,给了相关的一些一些。那个啊,题问题呢,也不是特别的复杂,但大本同学我估计会选这个 c 题, 既然如此的话,那你必须要有创新,你没有创新的话, ar 十分一个小时就可以做完,我一会呢,会给大家演示 c 题,用 ar 怎么来系统来建模,而我们 给大家用到的这个提示词儿看了没?我,我的超级 ai 模拟题,求解题词儿里面啊,看了没?这就是完整的一个求解,一个系统的呃,数学建模题目,它的一个 ai, 一个提示交警提示词儿里面有一个,看了没? 第一,模型选择阶段啊,你看用 ai 提升的词和不用 ai 提升的词呢,结果完全是不一样的。用 ai 提升词呢,我会让他给我创新,看到没,而且有三种创新啊,你给我任意的每个小位必须要给我选择至少三种。三种创新方案是至少选一种, 第一个算法改进创新,第二个交叉领域创新,第三个算法组合创新。这个你必须要放在你的 a r t 你 的模型选择或者模型建立里面,如果你没有,你仅仅选了一个基础方案的话,那你拿奖是几乎是不可能的。 纠本呢,我们有四种啊,在这个地方我,我一般建议用三种就可以了。第四种只有一种场景,就是优化了,就是预测类问题啊,预测类问题啊,这三种的话,能解决百分之九十以上的数学建模题目,而且能够得到创新型的算法哈,这呢,后面会演示啊,后面我会一一的演示啊, 大家也不用担心啊,一会会一一的演示啊,然后具体呢,这个题目的话呢,难度系数就比较大了, 但是这个题目也是我认为获奖最好获奖的一个题目,因为大本同学,只要你没听老哥的视频的, 我相信你百分之百想不到相关的一些思路啊,你最多也就按照一个普通的啊,体育赛事的一个一个研究啊,就建模去做了,比如说 a 题呢用系统动力学, b 题呢用,呃,第二位啊,这个第一位的系统动力学,第二小位的话用,用我们的卡罗模拟或者一些其他的模拟情况来做。 但是这个题目啊,记住体育赛事也好,经管类问题也好,你们记住一个事情哈,就是你想获奖,你必须要用,尤其这种冷门,看了没?体育赛事管理,这属于偏冷门了,对不对? 没有说没,很很少有单独的模型是研究这个的,对不对?还有什么学校的管理,还有什么就是比如说一个部落的管理 啊,这些偏冷门的问题就是研究的没有那么细致的,你们记住一定要有创新,创新点核心就在于交叉创新。我们所说的刚才我给你们提的头里面看了没有?三种创新方案, 第一种算法改进,第二种交叉领域,第三种算法组合。这里面对于地体这种偏冷门的赛题的话,你们记住交叉创新是典型的,哎呦,因为没有人会研究一个专门的冷门的问题的,对不对?比如说球队运营, 我可以用养殖策略啊,我不是说贬低,也不是说歧视啊,我没有这个意思啊。啊,我比如说我可以用,是吧?这个这个养殖的一些策略,或者我可以用一些种群部落的管理,生态学中的一些种种群部落管理 啊,比如说,哎,我们一些种群哎,蚁群啊,或者是一些鸟群啊,哎,怎么去管理的?然后呢?对应的应用到我的体育赛事管里面,这叫交叉, 懂我意思吧?或者我用一些比较偏偏的一些方向,就像我说的传染病模型吧,我传染病模型 sm 型对不对?我原来的是用在传染病疾病的扩散领域的,我现在把它用在了舆论传播,新闻传播领域,这就叫做交叉。而对于这个题目,我觉得最好的创新就是交叉。 好吧,交叉交叉创新这个题目获奖非常关键哈,如果你没有用交叉创新的话,那你就要好好的思考思考了哈。 来,还有什么一体被动式太阳能遮阳系统这个题目的话,说实话哈,这个有点小难度啊,因为什么呢?这就是我们传说中的 a t 是吧,美赛的 a t 往往是这种类型的题目,就是一些比较冷门的设计,像什么让你设计一个对吧,浴缸啊,设计一个人机工程学的座椅啊,而现在的被动式太阳能系统让你用在了一体上面,这个题目超出出乎预测啊,因为一体的话一般是可环境和可持续之类的, 但这个的话也属于可持续哈,因为太阳能嘛,对不对?这个题目的话呢,你核心就是你就要 首先的话呢,知道啊,怎么构建相关的一些微型方程是吧?那个积累分析啊,积累分析必须要有的,像什么热传导啊啊之类的要做,还有就是常规的优化类问题,什么目标优化,优化模型要构建 对不对?这两个是核心啊,你必须要学会构建啊,一会呢,我们可以讲到,好的这个题目的话难度系数不大,但是呢就是难点就在于比较马就要求解的话呢,就是要对模型啊,建模的要求比较强一点啊,就就比较典型的数学建模难题,数学建模题目 啊,因为 ai 吧,也很强的,在这题目也不在话下,也不在话下。 f 叫政策类题目,政策类题目我们啊政策类题目的话,我们求解的一个非常关键的模型就是系统动力学模型,你们记住哈,解决政策类题目 啊,往往用系统力学是最典型的一种算法。做 f 题的话呢,大部分同学我估计都会用这个系统动力学模型, 因为要要评估政策对未来的一个影响,这个任何的模型都模拟不了任何的模型啊,只有系统的理学这种半积累模型,我们说才能够分析这个政策对未来这个影响。所以这个题目大家很关键啊,只要用好这个,这个题目就可以解决掉了啊, 来啊,整个的我们来具具体来看一下, a 题一共有四个小问,第一小问叫构建连续时间模型,描述电池剩余电量随时间的变化, 对不对?一定要考虑多种因素的影响,不能单纯的就用电池原来的电量和是吧。然后呢,预测未来的电量,这种是不能的,因为题目已经明确告诉你了多因素的影响啊。那第一小问呢,就具体分析,不是一个单纯的数据分析类题目,你们记住啊。 第二小问,预测不同场景下剩余续航时间,分析耗电系统,这个就是一个预测类问题了,预测不同场景下剩余续航时间吗?对不对?第三问,分析假设参数使用魔镜对影响,这就是一看这个问题就是 敏感性分析吗?是不是因为参数对结果的影响?这不就典型的敏感性分析,某一个参数的改变对于我的结果有什么影响吗?对不对?这个题目我觉得不应该单独作为一个小问, 为什么?因为单独做一个小问的话很匪夷所思哈,因为每这个是不,百分之百你必须要做的,对不对?你不是说哦,题目没问你是吧,没某个参数对结果的影响,你就不做了? 百分之百你是必须要做的。同学们告诉大家啊,百分之百你必须要做啊,你不做就不行,记住哈,百分之百必须要做的啊。还有就提出用户和操作系统层面的省电建议,这个就决策建议类了啊,就学一下 demo 之类的啊,学一下 demo 之类的啊,建议建议信相关的东西哈。 然后推荐算法啊,第一个激励分析类啊,推荐的算法是什么?什么扩展型,带为难等等效电路模型加温方程组 啊,这个推荐的是这个算法,这个算法的话还有点创新性的哈,来贴合锂电池电子化、电电化学基体可量化多因素对 soc 的 影响啊。这说白了就是你看融合了微方程,所以 a 体的话,你要但凡说我用时间系列预测模型,那有点小问题哈,第一问哈 来,第二本预测类,其实机机理模型的模特卡罗模拟啊,原因是什么?可处理使用场景的随机性,量化系数不确定性啊,因为使用场景是随机的,你可能上人厕所使用,也有可能听课使用, 也有可能在路上使用,也有可能看视频使用,所以你的场景非常的多,所以用模特卡罗来模拟多场景的,这可是关键。 来第三节问敏感性分析,这个就无所谓了啊,你只要做好敏感性分析就行了,这个官方推这我们推荐就是这个买水刷牙把和手把手把纸把。这个其实啊,都还好哈,你只要能把这个做出来就行了,你们改变参数的结果,看看 这个这个结果怎么变化,因为第一问和第二问才是获奖的核心啊,第一问第二问,大家不管怎么样,一定一定要把握好,一定要把握好,好吧, 来后面的政策建议类啊你,你多多少少吧,你想拿奖你就别整的吧,这个,这个太 low 啊,你可以什么多标规划之类的,用多标规划算法,多个省电目标,别续航时间长,使用体验,使用体验好之类的来找到一个自由平衡。因为你不要说把 f 题,把 a 题的最后一问就当成写个建议了, 老哥,我整合前面弄一针我我的小建议行不行?今年 a t 竞争非常激烈,同学们,我建议不管怎么样,你们一定一定一定啊,说白了啊,真的一定一定,老铁们,明白我意思吧,不要上来就用什么啊,不要上来就就说白了,老哥我那个 对吧,就就用一个,那个什么行不行就用一个啊,写个建议行不行啊?今年 a, 今年数学建模将是最难的一年,老铁们,我们不管怎么样,我们都要建立的有点创新性行不行? 政策建议类,你也要做出点花来好吧,但是不管怎么样,你们记住啊,一定要做出花来,好吧,你不知道怎么建模怎么内容的啊,老哥这里也有哈,我们 a t 到时候呢,相关的 solo 代码包里面还有 b t 的, c t 的, e d, f d 的 啊,我们都把相关的思路解析原代码都放到这个代码里面,如果你实在求解不出来了,你也可以看什么用老哥的超级 ar 提示词,我们 ar 提示词里面也有哈,在这个地方 啊,超级 ar 提示词里面也有有十七道。一会呢,我会幸好演示一下到底每一小问啊,就是到底怎么来做的啊,每一小问 a 题的话,超级 ar 提示词,他到底是怎么一步一步的把这个题目建出来的 啊?没有领取到咱们的这个思路代码的,大家一定要去领取一下,到时候我们会把 a t 的 相关原代码点击思路啊,论文答案之类的,包括我这个文档啊,我这个文档也都会放到我这个 a t 的 这个这个相关这个资料里面。好吧,没有领取到,抓紧去领取一下哈。来 啊,最后一问啊,决策建议类啊,你们必须要啊,不能说单纯的就上来就提供一个小建议就完事了啊,必须不能提供一个分析,好吧,一定要有一个分析哈,来, 这个难度系数,整体只整体是三分好吧,难度系数不大哈,这个 a t 的 话呢,整体的难度系数并不大哈, 然后评分的依据啊,模型复杂度是中等的啊,因为就要结合一些电化学记忆多因素融合是吧,这这个其实难度系数并不大哈,因为这些内容的话,我们在一些网上公开的一些资料都可以找到 啊,然后呢,数据获取难度低啊,可以通过一些公开文件厂商数据,这个的话呢,网网上也是资料比较多的啊,老哥这里给大家提供好,到时候提供好以后,我们直接就给大家放到这个 a t 这个里面好吧? a t 的 里面啊,给大家放到这个 a t 的 里面好吧?啊? a t 到时候直接给大家放到这个 a t 的 里面啊,相关的一些资料哈,啊,包括数据之类的给大家放到这里面哈, 然后就是这个,呃,创新性要求中等啊,但是我说实话哈,如果你让我来推荐大家做哪个题目,我给你们推荐哈,我百分之百会推荐你们做 a t, 为什么呢?因为这是一个非常非常典型的数学建模问题了,对吧?就是你按照流程来,按照老哥的要求来,你做出来之后去,说白了你起码来说没有那么大的坑, 对吧?像什么太空电梯啊,像什么体育赛事,说实话啊,都有点偏啊,都有点偏, 我最推荐的就是大家做 a t, 我 觉得这就是典型的数学建模题目了,难度系数并不大,说高也不高,说低也不低,每个人会的数据也不一样,所以大家得到的结果也不一样,有创新吗?哎,你的微方程那个地方,你只要弄的复杂一点 对不对?你只要最后一位上个目标规划啊,你只要在,是吧这样的,所以说这个创新硬有难度系数还不大,数据也没那么难,我觉得这个题目你要让我来做哈,老哥你要是你做,你会选哪个题目?我就会选 a t, 真的,老铁们,别的题目说实话都有点坑,对吧?都多多少少吧,有点麻烦,像 b 级吧,太空电梯有点小麻烦, c 题的话,与星共舞也有点小麻烦,数据量那么那么那么乱对不对?地理体育赛事吧,你说交叉创新,你能创业到什么程度?也有点麻烦, 这不是一体呢,你得有非常强大的这个,呃,这个这个,这个构建微方程啊,以及这个激励分析相关的一些能力啊,也不是很好做 f 的 呢。人工智能说很多同学都这个新动力学呢,豆芽都用这个,你很难创新,所以 a 体呢?你要创新有创新 对不对?要数据也不难,要好好深入的做,你就你就优化就行了,你就一点点的优化,比如说我参数,哎,我优化模模型可不可以再弄的复杂一点,就是你先构建一个基础模型, 基础模型就能够解决全额问题,然后你再一点点的生化,这样的话 a t 就 可以了。我们后面会给大家用全 ai, 用这个 ai 技术词哈,以完整的把 a t 的 给大家解出来, 直到生成一篇高质量的 a t 论文,你们再看一看啊,我用超级 ai 技术词来做的情况下,会做到一个什么样的效果?好吧,一会我们给大家直接来做哈,来演示,好吧,来,难点啊,难点就在于什么 啊?那建模工作量也也中等哈,难点就在于什么?多因素啊,就屏幕,处理器温度,每一个模块到底和耗电量是怎么耦合的,这是一个难点,只要这个解决了, 这个题目就可以解决了啊,这个题目就可以解决了,好吧。第二点,连续实现方正的构建,贴合电池实现,避免纯数学逆核啊,这个也是一样道理 对不对?这个的话呢,你不能纯属于你和你不能用一个基础的回归就完事了,你要顾及具体分析第三个不足,使用上下参数标准验证问题,这个蒙德卡罗模拟这个有点小难度对不对?你只要能把这几个解决了,好吧,这都叫小难度哈。还有就不确定性电话啊,不确定电话 啊,兼顾模型误差,有 c 超,这叫模型检验吗?对不对?你必须要做模型检验啊,要点就是第一个啊,是坚守连续时间见模合金,避免理散化处理。因为 a t 是 连续性问题,所以你别整成理散型问题了, 你 a t 要整成理散型问题,就背离了 a t 的 要求了,好吧,不要做理散化处理哈, a t 不要做理散化处理好吧, 比如说把整个的这个这个时间或者什么的场景模拟变成里散化数据不行啊,明确各耗电组建的低耗与参数取值模型,区分不同环境下使用对使用模式的一个影响,这个就说白了,改变吗?对不对? 这个就说明大量的场景,比如说温度高的时候,热带或者是海南岛是吧?我极地的向东北东三省 温度,冬天比较冷的时候,我怎么样?就你要考虑大量的场景,刷视频的时候怎么怎么耗电,对不对?拍照的时候,所以说你可以拓展的点特别多,你第一天,第二天你可以构建一个基础模型,在这个基础模型的基础上你再生化, 这样的话你们就得出来东西都特别的好哈,真的,就这样的话,我觉得你的模型会越来越深,越来越深,这才是 ai 的 贡献,明白吧? ai 不是 第一天你把你把你题目解出来了,而是第一天你,你可以用它做一个基础的框架,然后第一点后逐渐的生化,逐渐的生化,明白吧?逐渐的生化 啊,逐渐的生化,懂我意思吧?所以说哈,真的特别有意思哈,特别有意思 啊,我,我真的觉得特别有意思啊,这个题目啊,逐渐酝化,这样的话,你每一天都用 ar 酝化,每一天都用 ar 酝化, 来,老铁们,你们告诉我,你们这样的话获奖概率是不是比较大了?所以说你们啊,获奖套路就第一天构建一个基础的,第二三天不愿酝化, 比如说不同的场景,冬天夏天刷视频高耗电量是吧?然后呢?这个拍照,然后呢?这个普通的观看文本,数据文本的一些文档是吧?以及这个暗的情况下,亮的情况下,黑天白夜啊,你都不同的场景,那你肯定这个整个模型建的质量会非常的好啊。 点击思路,一步一步的怎么建模?第一问,构建锂,基于锂离子电池电化学反应建立基础 s o a 连续实践微方程,再逐一纳木屏幕啊,处理器耗电量等耗电组建,考虑温度对电池容量的修正 啊,先建立一个锂离子基础的耗电模型,然后呢,再把这些屏幕处理处理这些东西纳入到你这个微方程组里面,然后进行纠解 啊,参数估计是吧,建立好模型以后,基于相关的参数就是就是你,因为你建立好模型以后,你肯定要做参数修正啊,对不对?这个地方呢,我建议你们在这里增加一个内容啊,叫什么叫有限元法, 有限元分析啊,我建议你们在这个地方增加一个这样的模块啊,机理模型构建好了以后,最好先用有限元分析来模拟一下,然后再用真实数据来得到结果。好吧,这源于分析的话,你甚至可以做可直观演示,这就是获 o f 奖的标准了,你要拿 m f 奖 m f 奖的标准了。 做一个模拟啊,有限员模拟啊,因为我们知道你不管看网上的一些是吧,一些公开的一些耗电量,他会有一个像一些热力图一样的东西,对不对?看耗电时间,一个热力图一样的一个一个折线对不对?那个那个就非常的漂亮哈,给你们看一下哈。 哎啊,你可以增加这样一个模块,然后然后第二就是参数估计啊,收集到一些具体的行业数据了,然后呢?呃,把你这个据而成,因为你出你出来的数据特别的多,肯定, 所以说呢,参数肯定是有限的,所以你需要用最小而成来计算这些参数啊,最小而成计算这,然后这个就场景预测了是吧?利用是吧,这模特卡罗模拟,然后呢,设置不同的场景,说重度使用待机啊,低温啊,高温环境啊,来计算续航时间, 然后敏感性分析,用这种算法来做敏感性分析。提建议的话呢,我建议你们啊,刚才说了,建议大家可以放一个什么多标规划模型,或者是是吧,比如说使用场景最佳,或者是耗电量最小,甚至你可以用一个单标规划,没别多标规划,老哥太难了,我做一个单标规划可不可以?也可以哈, 来模型创新,在经典积累模型基础上融合多因素偶合模型是吧。啊,这是一种创新方案啊,模型创新 是吧,量化结果给出不同上一下续航时间及误差是吧,然后呢?呃,关键因素的敏感性分析组是吧,不同场景之下,这也是一个一个很好的一个获奖要点分析哈,还是格式化绘制 soc 啊,不同的,这个格式化也是一个获奖要点啊,你要想拿奖的话也可以把图做的美观一点哈, 然后模型检验啊,也计算一些各种检验,像二方 mse 啊,对不对?还有就是敏感性分析啊,灵敏度分析啊,鲁班性分析啊,都可以用,都可以,都可以拿来用一下好吧。 啊,鲁棒性分析老哥要不要做?我觉得这个地方也可以做一下,就极端的使用场景之下,别超低温,超高温,这叫极端场景之下来看看结果怎么样。所以说敏感性分析要做,鲁棒性分析我觉得也要做啊,这个地方呢,大家一定要记住啊,就敏感性分析要做,鲁棒性分析也要做哈, 然后呢,选题建议啊,就是这个啊,这个这个数学统一专业的推荐啊,然后呢,这个计算机专业的谨慎选择啊,因为避免过度依赖黑箱模型啊,因为这个地方呢,就数学物理专业的比较推荐功课这样的也比较推荐哈, 然后呢,这个文科专业的不怎么推荐,因为他涉及到什么机理建模了啊,涉及到什么电化学之类的东西了,所以文科专业的不推荐啊, 然后跨专业啊,工科的加计算机的可以读到零基础的不推荐啊,因为零基础的话呢,难度系数会相对大一点哈,微型方程,电池都都比较难哈,中等基础的慎重选择能力比较强的可以选择一下啊。 ok, 这就是我们的 a 题啊,难度系数整体来说不大啊。整体来不大啊,但是呢,我觉得获大奖很容易出现的 a 题啊。所以说,同学们啊,如果你能够读懂这个题目啊,你也会用 ai? 我 建议你们选 a 题。做 a 题的话,如果我来做了,我就会选 a 题啊,百分之。我觉得百分之四十的同学应该都会选 a 题哈,今年 ok, 来啊,我们再来看一下。再来看一下 b 题啊,太空电梯。

好的,小伙伴们,大家好,接下来我们讲 c 题哈,大部分同学呢,我看了一下后台的选择题数据哈,大部分同学都会选择这个 c 题哈, c 题的话呢,怎么说呢,你选这个没问题啊,同学们,我告诉大家哈,你选 c 题没问题,但是你必须要有创新啊,因为大部分的同学都在选这个 c 题,目前答题比例已经达到了恐怖的百分之四十哈, a 题百分之三十, c 题百分之四十,两个题目加起来接近百分之七十了,老铁们哈,百分之七十的人都会选这个 c 题啊,都会选这个 c 题 啊,所以说呢,我建议同学们哈,要慎重啊,其实我是非常不建议选这个 c 题的,我觉得吧,你就是大家大部分同学选这个 c 题都是为了图简单啊,但是呢,我告诉你们啊,图简单,不要去图简单哈啊,不要去图简单, 为什么呢?因为 c 题你看着哈,但其实它很麻烦啊,很麻烦 啊, c 题很麻烦,所以说,我建议你们不要去盲目的去做这个 c 题啊,不要盲目做 c 题,好吧,老铁们,我建议你们避开它,因为因为这样的话,获奖是比较难的,你不要图简单,大家说实话都知道,数据都知道,怎么建, 那你说对不对?你,你说你怎么获奖呢?你创业点怎么来搞呢?对不对?所以说,我不建议大家选 ct 啊,真的,我,我是真心的劝大家啊,要慎重哈,要慎重好吧 啊,老哥,选哪个题?我建议我建议选 a 题或者选 b 题啊,你最好就是选,要么选冷一点,冷门一点的,这样选的人少,竞争压力会小一点,对吧?你选这个 c, 那 么大家都选这个 c 了,所以当然了,我,我不说,不给你分析哈,我给你分析,但你要慎重,你想拿奖,你必须要有创新点, 你必须要有创新点,如果你做这个 c 题没有创新点,那就白搭了,而这个 c 题的创新点 百分之大部分的都是两种创新方案,第一种改进的模型就是你用改进算法去做,第二种融合模型啊,就你选择不同的模型一块来做, 你说交叉你行不行?交叉创新的话,在这个地方的话啊,也可以试一下。好吧,只能也可以试一下,因为我们创新模型的话一般就有这么几种方案吗?所以说这几种方案的话没法说,但是改进算法的话,我觉得在这个地方是最常见比较常见一点的,所以大家呢,如果想做 c 的 同学呢,你要慎重, 你要能够能有创新。好吧,你要有创新啊,真的哈,啥也不会,只能选 c 你, 那你,你不至于啥也不会,老铁们,真的不至于,你有 ai 了,理论,你没有不会的题目了,好吧,你没有不会的,而且 c 题呢,也没有那么简单,还是比较复杂的,大家都做, 所以说呢,就看谁做的好了,你想做的好的话,我觉得你和高手竞争是有很大的压力的哈,要有压力的,所以建议同学们呢,要慎重一点哈,要慎重一点 哎, ok 啊,这个这个大家呢要慎重哈啊,与这个题目的话呢,我们简单阅读一段的话,就是与星共舞啊,美国为美国,美国节目舞动奇迹啊, 然后呢,这个这个我们前面呢就是专家投票吗?专家通过什么在线投票?这是他们最喜欢的情侣啊,观众的话每周可以投票一次或多次,上下为当中公布的次数,然后呢,还有就是评委也可以投票之类的,然后选出第前几名来,对不对 啊?评委投票和得分和观众投票的组合方有多种,在美国版节日前两季采用基于排名的组合方式。第二季因什么什么啊啊, 然后,然后呢,就修改了这个争议哈,第二十四季又出现争议了对不对啊?评,尽管评委得分低,仍赢得冠军,作为回应,二十八级就说白了他的他的评分吧,是由评委和 评和这个观众投票来综合决定的。有的时候呢,评委觉得不好,但是观众觉得好,那观众投票多了,那么就有可能得得得这个最终的这个成绩了。但是,但是呢,又因为不专业,比如说一二流子一些选手,那么特别会讨观众喜欢,那也有可能对不对? 还有有有,如果,如果评委特别的占比权重比较大,观众占比比较少的话,那有可能这很多啊,迎合评委的啊,评委的角度不能代表大众的,所以有可能引发歧义啊,就来构建一个比较合理的评价的这么一个啊,评分的这么一个模型啊,这就是整个题目的核心哈, 来开发数学模型啊,估算每个选手在其参赛的每周获得观众投票数啊,就估算这个呢,就是一个基础的预测模型了啊,每个每个这个来,同学们,来,大家告诉我哈, 开发数学模型一个和多个来,你告诉我到底开发几个?首先啊,首先到底开发几个?这个是一个要点哈,到底开发几个? 你们记住哈,那就一定要开发多个。你想做 c, 我 还那句话,你必须是勇士,你必须要有胆量, 你必须要牛逼,对吧?要不然你要说你就开发一个,你开发一个非常基础的,你做 c 题,哪讲?我就这么说,你再创新也没有希望,因为因为选 c 的 人太多了,高手太多了。老哥这里统计了百分之四十的同学会选 c 了,都是勇士啊。说实话,所以你必须要开发多个, 而且多个模型来估算明白吧,来估算明白吧,你的模型估测关注投票结果是否能得出与每周淘汰结果一致的结论啊,提供一致性的衡量标准就是你要,你要能什么? 你要结果要准确,你不能结果不准确,对不对?确定性如何?每种确定性这个就需要有验证了,就你的结果也有验证,说白了我我告诉大家哈, 真的,这个地方就看谁的模型精度高了,但是你们记住你们的精度啊,很多情况下来大家告诉我,来来,我问一下哈, 我问一下哈,来,这个的话你说老哥,我不单纯的用美赛官方给的数据,我用别的数据来佐证一下,可不可以?老铁们,就是我用一些达人秀,或者我用一些别的投票的一些结果来做,可不可以?老铁们,别的投票的模型来做,可不可以? 可不可以?老铁们,你们跟我说完全可以,反而会把你的模型的这个精度啊,反而会提高的比较高。来这个地方一定要注意两件事一定要注意两件事哈, 一定要注意,除非他明确的说了啊,你可以看了没,你可以自行选择纳入信息或其他数据。看了没?其他数据,但必须要记录数据来,同学们, 我这地方要注意两件事,第一个叫什么过你河,第二个叫欠你河。来,你们觉得哈,你们觉得你们最容易做预测模型的时候最容易出现的一个问题是什么啊?最容易出现的一个问题是什么? 就是你们如果来做这个题目啊,后面会有啊,我会讲到啊,你不用担心啊,啊,你会讲到来 你们容易出现了一些问题,什么做预测的问题,做回归问题啊,过你河,我告诉你们,你们最容易出现的就是过你河了,真的,所以说你们一定要注意一点,好吧,不要出现过你河 啊,这个很关键啊,很多同学呢,做预测经常会出现过你和还有同学这么这么来做的哈,来,还有同学这么来做的,我们来,来啊,我,我后面会讲到哈,这里有一个完整的看了没?完整的来 看一下啊,来,看到没,他有一个完整的解析思路,第一步,一定要做数据处理。第二步, 观众投票预测构建贝叶斯啊,这是基于概率的模型,以评委得分、选手特征周次为自变量,以淘汰结果为约束啊,预测观众投票数,预测知信区间。来这个地方呢,很多同学这么来说的, 我看你们的方案了哈,你们说老哥我预测他的投票得数,那我这样不就行了吗?啊,我,我这样不就行了吗? 来,我直接就是用他每前几个周的得数预测他未来每个周的得数,可不可以?老铁们,原来这样来说的哈,我用他前几个周的得数来预测他后几个周的得数 来。老铁们,你们觉得这样的行不行啊?你们觉得这样行不行啊?我刚才有同学在上面是这么说的啊,在评论区留言啊,包括在那个老哥私信我这么说的,行不行?老铁们,行不行啊? 为什么啊?包括你们告诉我为什么?我告诉你是百分之百不可能的,不行的哈, 你别乱搞哈,你记住哈,投票结果是未知的,严格保密的,你不可能说用这个是吧?哦,钱有的数据来预测未来几个周的数据,你就你就你就完整的变成时间序的预测了, 知道吧?你是不可能的啊,你,你别乱搞,你别乱整哈,你别乱整来。 但是我可以构建一个什么样的模型呢?老铁们告诉我,既然如此, 那我就不能用时间虚的预测预测了,对不对?但我可以用什么预测来,我要我现在要做的一个一个参数叫什么?观众投票数,他和很多项数据有关系,包括什么?评委的得分打分,包括一些其他的。哎,这地方有哈,包括其他的 看啊,哎,在这地方包括他的年龄,包括行业啊,包括一些是吧?他的这个,这个是吧?这个这个选手的一些特征,包括他日常的动态,包括一些其他的淘汰的一些结果。来 来,同学们告诉我来,我相当于我要预测一个指标,它和若干个指标有关系。那你告诉我要构建的是一个什么样的模型啊?啊?要构建的是一个什么模型啊?这是这种预测方案,不叫持续预测,这叫什么预测?老铁们, 哼哼,叫什么预测呀?到现在啊,大家都提出了有用 xt boot 的 啊,随机森林对吧? 这就是回归吗?对不对啊?某一个变量和若干变量有关系,不就是回归吗? 是不是?那不就是回归吗?所以说你这个地方既然构建回归,你们就记住我刚才就要返回来,我刚才提到那个那个逻辑了,不要出现过你和,也不要出现欠你和,好吧,过你和就是你回归的模型太美完美了。 来,你告诉我这种未知的投票数量的能过于完美吗?老铁们,所以说谁的预测的模型的精度达到百分之百,你反而应该要慎重了,你百分之九十六九九九你都要慎重, 你的精度不可能那么高的,我可以告诉你哈,因为他是未知的,而且这两组变量之间理论上没有什么必然的情况, 不能说他评委得分就高,他观众投票就高,对不对?也不可能说,但是呢,来评委投票高,有没有可能观众投票也高啊,也有关系啊,也有可能啊,那评委投票高,有没有可能观众投票低呢? 也有这个可能,对不对?所以说哈,这里面比较麻烦,比较复杂, 你呢,一定要慎重啊,一定要,一定要考虑,就是自变量和一变量之间没有很强的关联度,没有很强的关联性,这个是很关键的哈, 明白吧,做这个做回归理论者是一个大忌,就是自变量和一变量之间没有很强的关联性,我们说这属于大忌,但是呢, 不代表说他俩没有关系,往往会呈现一个啊,就是典型的比如大部分选手可能评委投票比较高,观众得分也会比较高一点,只是说有一个大概的对不对?但是你要考虑极端场景之下的一些情况 啊,因为因为前面说了吗?对不对?来前面说了,以前面已经给你讲了很多了,对不对?说有有可能会出现专家评分高。所以说呢,这个 第一小问啊,我建议你们不要你合的精度太高。好吧,不要你合的精度太高啊,太高了确实会有问题的哈。来 第二小问啊,利用你的观众投票结果估算结果和其他数据比较和对比节目使用的两种投票方法,排名反而百分之在各季产生的结果是吧?就每一季对应的两种结果,如果结果再查也其中一种方法似乎更清,更似乎偏向于观众投票, 对吧?就是比较吗?对不对?和个体产生的结果比较结果的结果,如果,如果结果存在差异,那么其中就哪一种方法可能会偏向接受投票,说白了就是看看哪一种方法和观众投票的相关度更高吗?对不对? 然后考察这两种投票之外存在两种投票方法存在争议与观众或观众意见存在分析的特定选手的拥有情况,投票组组合方法的选择是否会导致这位每位选手的结果相同,是吧?每周什么什么的啊? 然后呢,咱们就那个一考虑一些具体的视力,把你建立的模型,再把具体的视力,然后呢这个考虑进去,然后呢,利用包括投票观众估算结果,在你的数据开发、模型分析、专业舞者以及数据中可用的名人数据的影响 对不对?这些因素对名人在比赛中的影响有多大啊?说白了就是你前面不是估算了一个观众投票的模型吗?对不对?利用观众估算投票结果在你的数据啊, 开发模型分析专业舞者以及数据中可用的名人特征的影响啊,这些因素对名人在比赛中的表现影响有多大 啊?啊,就你那个像年龄的特征啊,对比赛影响到底有多大?来评来他们对评委得分和观众投票的影响是否相同,这个也是要建立一个合适的模型哈啊,也要建立合适的模型的 啊。然后第四位提出另一种每周观众投票结合系统认为系统更公平。说白了就是就是啊,提出另一种每周结合观众投票评委的问题,说白了就是你提出一个新的打分方法啊,打分方法不是传统的这两种方法了,提出新的解决方法来哈,这样的话呢,你就需要全新的设计一种投票组合方法了哈, 让我们看一看完整的一个解决方案哈,来第一个啊,第一个来美赛啊,第一,一共四个小问,第一小问预测类题目,第二小问评价加决策类,第三小问影响因素分析,第四小问优化设计类啊,因为第四小问的话,它涉及到 新的投票方案嘛,对不对?所以说需要用到用到这个优化设计类问题哈,优化设计类来每一个小问,第一个问,预测每位选手每周的观众投票数,验证一致性和确定性,说白就验证精度啊,验证投票的这个预测的精度到底怎么样? 评价两种投票方法的优劣啊?分析争议的案例,提出决策建议,就两种方法,他有没有什么两种投票方法啊?选人的方法有没有什么对错优劣啊?这叫是吧?那第三个分析专业舞者和名人特征对比赛结果的影响啊,然后呢?这叫做影响因素的分析吗?对不对? 然后设计新的投票方案,这叫设计新的投票组合方案。系统一般就是优化了,对不对?优化方案找到最佳方案吗?对不对?最佳的这个投票组合方案,来,我们看一下理方法哈。方法 来,第一个用预测类模型,我们说了不能用单纯的时间性的预测模型,这个地方是不适用的,而是要用回归预测的思想,比如 c g c 的 模型加广义县域回归也可以啊, b e s 模型可量化观众投票的不确定性 对不对?然后 glm 能整合评委得分啊,选手特征等预测变量适合小样本高维度的需求,所以这两个模型组合,那个这叫组合创新,类似的组合创新还有很多很多的 好吧?很多很多的组合创新,比如说,比如说你这个地方可以用模特卡罗模拟,模特卡罗模拟来来得到与观众投票的不确定性数据,因为观众投票不确定性数据可以用模特卡罗模拟来做一做, 然后再结合一些预测模型来做,更好了啊,结果更,这样的话更好了好吧。有很多种创新方案,说白了就是你这个地方你不能上来就构建一个基础的方案,比如 igbo 的 cc 零,那这样的话是不太合适的,你要考虑到很多的不确定性因素好吧,而这些不确定性因素反而成了获奖的关键, 明白吧?啊?活跃的关键啊,你这里构建的模型呢?就是小样本高维度的预测数据。因为维度数据比较高,指标特征比较多吗?所以需要构建高维度的啊,高维度不能用基础的什么灰色预测什么的,不可能好吧,不可能的就是老哥老哥我用深度学习神经网络可不可以也可以 深度学习神经网络本身也适合于高维度的预测,但是呢,你的数据量最好大一点好吧,数据量太小的话很容易陷入过你核的现象啊。 啊过你和因为神经网络还有这个这个深入学习很容易过你和。所以说你需要有大量的样本来做哈来做。 还有第二个就是评价了啊,评价两种方案的对比。你可以啊,选择量量化两种方式的多维度,比如说两种方案每一种方案的公平性是观赏性 等等,如何?然后看到系数呢?看到系数用于衡量结果的一致性,这是评论结论,这两个组合起来也可以解决这个第二问啊,就是评价类评价两种方案的一个优劣吗?评价就是是吧,先构建评价指标体系,比如说公平性,观赏性是吧,这个效率之类的效率 啊,成本啊之类的,你可以都把这些特把这些呃,样本把这些指标啊,然后呢构建一个评价指标指标,然后呢再构建这个相关的一个权重 来这个地方你们最好来,你们告诉我啊,权重怎么来确定啊?要用双权法, 双权法能有公平性观赏性能能确定吗?啊?专权法能确定吗?做 a g p, 这是最最基础的一种做法了,因为公平性观赏性这玩意 甚至有模糊综模糊综合评价法,因为里面有很多模糊因素。公平性?什么叫公平?什么叫不公平观赏性?什么叫高傲低啊?较高傲,较低,这有很多大量的模糊因素,所以说用模糊综合评价法, a g b 模糊综合加模糊综合评价法,这个地方是比较适合的。好吧,你用双减法什么的,没有数据支撑压根对不对, 只能用这种模糊综合啊来做啊,来,还有影响因素分析,可以用多元现金回归加随机森林,如果你上面用过随机森林了,在这个地方我建议你就不要再用随机森林了好不好?不要再用随机森林了,你上面如果用了这个地方就不要用了哈,你如果上面没用这个地方啊,第一位也可以用这个地方,就需要换个别的哈,好不好? 影响因素分析啊,你可以用随随随心回归加随心随林啊,回归模型量化限性因素效果。然后呢,这个随心随林捕捉非限性和交互效率,全面分析各行的重要性。说白,用随性回归来评价每限性 量限性影响啊,限性影响哪些因素啊?是限性限性哪些限性因素他的影响影响效益是比较大的,因为这样的话,他的限性限性参数里面的那个参数值参数影响会比较大一点吗?对不对?那么非限性参数, 那么就需要用 c c 森林了,来得到哪些非限性参数啊?来,你那个因素是比较重要的啊,这两个综合来考虑。哎,这个挺好哈挺好啊,营养因素分析用这种两种方法来分别构建限性因素和非限性因素,哪一个影响分别影响是最大的啊?这个反而挺好哈挺好的 啊,还有优化方案的设计第四位你必你如果想拿奖,整个碎题,你不能单纯的就上来就是提个建议或者等等之类的,或者随便上一个方案。你需要构建一个优化模型 啊,你优化模型的话这样的话是有说服力的啊,不要多目标优化啊,既满足什么?满足公平性又满足观赏性,这样的话两种目标对不对? 然后建立一个优化模型来得到一个最终的一个新的模拟,新新的一个投标系统来做新的一个一个打分系统。来来来得来得到哈。这打分系统既兼顾了观赏性又兼顾了平稳公平性。好吧,这样的会更好一点更好一点啊, 来,这个题目的难度呢?在三点五分左右,我的难度系数呢?中等吧。中等啊,不算高也不算低哈啊,不算高也不算低啊。首先呢比较复杂,就是他不是一个常规的时间训练预测模型啊, c 题就是很多预测都是用时间训练预测来说,但这个题目不是啊,他比较麻烦一点 啊,需要整合很多,又里面又有评价又有预测又有影响又有优化四种题型他完全还改了,你还要做到创新是吧?你没有创新还不行 对不对?你没有创新的话,因为本身原有的方案就有就不好了对不对?你还没有创新,那你怎么能获奖呢?对不对? 所以就是他,他就是要求你创新,他不是说不要求他要求你创新哈,他就数据量工作,数据处理工作量也比较大, 因为题目给了你大量的数据集,你需要做数据处理,你不做也不行,对不对?数据处理比较大,你万一漏了那也不行。而且 c 题百分之百数据是有问题的哈,我告诉大家每赛官方的尿性,百分之百数据是有问题的,你不做也不行哈。 啊,难点啊,刚才说了是吧,投标的间接预测,无直接数据交准是吧?说白了就是你,你需要人为人为的来判断一下一致性,没有数据作为交准,未知的投票结果,观众投票结果都是未知的哈。 两种投票方式你需要兼顾公平性、观赏性这种呢?公平性和观赏性吧,本身就属于模模糊数据级,又要把它变化成量化,所以需要构建成吗?绿水多函数, 这个函数的构建很关键,到底是限行函数还是还是一些其他的非限性函数来,你和这个量化指标,这个就很关键,你要构建一个模糊综合的话,你需要你绿水多函数,这管重要是吧?这个绿水多函数一旦做错了,那就很危险啊。 来,还有选手的特征,评委得分啊,很复杂啊,既有这个年龄行业又有得分,又有主观客观的一些内容交杂在一起就复杂的建模啊,很麻烦哈。还有新的投标系统吧,也比较麻烦,一种条件怎么来设定 对不对?目标函数怎么来制定?目标函数又要兼顾两种,两种内容,这两种内容又不是那种传统的量化那种,他整个题目真的是既有哎,预测优化模拟。哎呦我的妈呀,我头大,我头有点大了啊。真的啊, 头有点大了是吧,还要脸?数据处理必须要做对吧?零得分啊是吧?控制啊,都需要补充是吧?预测需要明确假设条件,量化不确定性是吧?有很多的不确定性,你还需要量化他 对不对?你不像这个 b 体吧,太空电梯吧,有些不确定因素我们还能知道是吧?异常了,别结果突然变大,结果变小的,这玩意不确定性怎么来量化对不对?比较麻烦 是吧?还有评价指标的确定,指标的确定呢?还都是一些啊,一些难以量化的一些模糊指标, 对不对?也很麻烦对吧?新系统设计还要既要保证效率,还要你不能整的太过于复杂是吧?你整的太过于复杂的话,那就可推广性,可朴实性,就朴实性就比较小了。所以这个题目看着简单,实际上一包子坏水哈,一包子麻烦哈, 来啊,首先解决思路,先数据处理,然后呢啊,选举选手特征,变量,年龄,行业,然后构建观众投票,观众投票预测模型 vs 这样的模型是不是 以什么评?以评委得分,选手特征周次为自变量,以淘汰结果为约束,观众预测投预测,观众投票入计算预测执行区间啊,这两种模型来分别构建啊,以什么为自变量,为什么为约束什么的,然后投票方法评价啊,设计指标评价体系,如争议、防范力, top 三偏手等于得分,用 h b 量。

好的,亲爱的小伙伴们,大家好,我是老哥啊,今天呢,给大家整理了二零二六美赛 a, b, c, d, e, f 体的这个翻译哈,这个相关的一些工具啊,我们用我们的超级的这个 提示词给大家整理出来了一个 a, b, c, d, e, f 题的,整个的一个赛题的一个啊,相关的一个解析啊,模型的选择,以及相关的一个创新点的总结,以及相关的难度分析和选举的建议哈,大家可以看一下哈,今年的话呢,美赛的 a, b, c, d, e, f 题吧,顺序有点颠倒哈, 往年的美赛的 a 题是不可能出这种题目的啊,往往会出一些比较偏门的一些,是一些什么微方程啊这种激励分析类的赛题,而这个 而这个 a, t 呢,呃,智能手机电池耗电建模啊,这个确实出乎了我们的意料啊,只不过呢,很多同学啊,用这样说,老哥,既然是预测的话,我直接用时间训练预测模型就不就行了吗?对不对?你们记住哈, 每赛我觉得 a, b, c, d, e, f 他 出错的概率是非常的低的啊, a 题呢,历年往往都不可能是一个单纯的数据分析类题目的,你说这个,老哥我用一个什么灰色预测,回归预测,直接预测 打那个耗电不就行了吗?啊,你直接耗预测剩剩余时间随时间变化。函数,我直接用一个基础的回归函数,我直接用一个基础的回函数不就行了吗?你记住,这是 a 题, a 题往往就是机理建模,机理分析,所以说这个题目的核心一定是机理建模的,用一些数学物理的公式,哎,把耗电量和各种各样的参数他内部之间是怎么关联的啊?内部之间具体的机理机理的流程 啊,只有你把这个串联起来,你才能够建好模型。所以说 a 题啊,绝对不是一个单纯的实验训练分析题目,我们后面会给大家讲到怎么拿大奖, 拿大奖的话,如果你想拿奖,我想拿一个 h 奖 m 奖,你用一个单纯的激励你单纯的时间去在分析类或者用普通的继续学习算法是不可能拿奖的,所以大家一定要注意啊,这个地方要慎重要慎重哈。 来啊,这是我们的 a t 的 一个翻译哈, a t 的 一个翻译。 b 题的话呢,太空电梯系统建立,求直密地,你不要被这个题吓到。首先啊,这个题的话呢,你千万不要被吓到,不管是什么太空 g t 还是月球 g t 还是什么火星 g t, 本质上来说就是优化啊,本在本上来说就是涉及到多个系统的优化,对不对?就多目标或者是普通的优化类问题,他逃不出这个去的。 和本上和建一个医院啊,建一个修一个学校啊,基本上没有什么区别,所以你不要被他吓到哈,难就难在这个题目可能会涉及到数据的问题, 数据不好找而已啊,但是传统的我们常规的一些优化模型基本上就可以做出来,大家呢,也不用担心好吧,这个题目呢,你也不用太担心,后面我会讲到一一的分析啊,就每个题目看了没,他会有一个完整的分析报告啊,到底评分依据考讲难点,解析要点,解析思路或讲要点哈,都给大家讲到的,所以你也不用担心啊, c 题,这是一个比较基础的一个记忆机,一个数据建模题目了,又有人说的记忆学习分析题目啊,这个呢,就是有点,有点不太,有点就 突突兀哈啊。今年呢,就是搞了一个节目啊,搞了一个节目叫舞动奇迹啊,说白了就是观众投票之类的,人家得到相关的数据分析,给了大量一些数据表啊。今年的话呢,我们用 ai 是 今年,我敢说是每赛历年获奖难度最大的一年,也是小白获奖最好获奖的一年。为什么?因为今年的 ai 将会是 ai 在 世界剑魔领域彻底渗透的一年,也是彻底渗透的一次比赛, 尤其是个 ct, 给的数据集竟然不多啊,给的数据集竟然不多啊,这也是超乎我的预料的啊 啊,你如果给的数据不多,那 ai 就 可以直接给你处理掉了, ai 就 可以直接给你处理掉,所以这个题目的核心就是你一定要做出创新性来,如果你没有做出创新性,你就利用了一个单纯的继续学习算法来做的话,那你这个题目想获奖就不可能。我们给大家讲了四种创新, 四种创新,对于啊,在这个位置上,那么你必须要选择一到两种创新来做,因为大本同学我估计会选这个 c 题,好吧,因为这个 c 题给了数据,也给了相关的一个难度系数,也不大,给了相关的一些一些。那个啊,题问题呢,也不是特别的复杂,但大本同学我估计会选这个 c 题, 既然如此的话,那你必须要有创新,你没有创新的话, a r 十分一个小时就可以做完,我一会呢,会给大家演示 c 题,用 a r 怎么来?系统来建模,而我们 给大家用到的这个提示词看了没?我,我的超级 ai 模拟题,求解题词里面啊,看了没?这就是完整的一个求解,一个系统的 数学建模题目,它的一个 ai, 一个题,交警提示词里面有一个,看了没?对于模型选择阶段啊,你看用 ai 提示词和不用 ai 提示词的结果完全是不一样的,用 ai 提示词的,我会让他给我创新,看了没?而且有三种创新 啊,你给我任意的每一个小问,必须要给我选择至少三种,三种创新方案是至少选一种, 第一个算法改进创新,第二个交叉领域创新,第三个算法组合创新。这个你必须要放在你的 a r t 你 的模型,模型选择或者模型建立里面,如果你没有,你仅仅选了一个基础方案的话,那你拿奖是几乎是不可能的。 纠本呢,我们有四种啊,在这个地方我,我一般建议用三种就可以了。第四种只有一种场景就是优化的,就是预测类问题啊,预测类问题啊,这三种的话,能解决百分之九十以上的数学建模题目,而且能够得到创新性的算法哈,这呢,后面会演示啊,后面我会一一的演示啊, 大家也不用担心啊,一会会一一的演示啊,然后具体呢,这个题目的话呢,难度系数就比较大了, 但是这个题目也是我认为获奖最好获奖的一个题目,因为大本同学,只要你没听老哥的视频的,我相信你百分之百想不到 相关的一些思路啊,你最多也就按照一个普通的啊,体育赛事的一个一个研究啊,就建模去做了,比如说 a 题呢用系统动力学, b 题呢用,呃,第二位啊,这个第一位的系统动力学,第二小位的话用用我们的卡罗模拟或者些其他的模拟情况来做。 但是这个题目啊,记住体育赛事也好,经管类问题也好,你们记住一个事情哈,就是你想获奖,你必须要用,尤其这种冷门,看了没?体育赛事管理,这属于偏冷门了对不对? 没有说没,很很少有单独的模型是研究这个的,对不对?还有什么学校的管理,还有什么就是比如说一个部落的管理 啊,这些偏冷门的问题就是研究的没有那么细致的,你们记住一定要有创新,创新点核心就在于交叉创新。我们所说的刚才我给你们提的头里面看了没有?三种创新方案, 第一种算法改进,第二种交叉领域,第三种算法组合。这里面对于地体这种偏冷门的赛题的话,你们记住交叉创新是典型的,哎呦,因为没有人会研究一个专门的冷门的问题的,对不对?比如说球队运营, 我可以用养殖策略啊,我不是说贬低,也不是说歧视啊,我没有这个意思啊,啊?我比如说我可以用,是吧?这个这个养殖的一些策略,或者我可以用一些种群部落管理,生态学中的一些种种群部落管理 啊,比如说,哎,我们一些种群哎,蚁群啊,或者是一些鸟群啊,哎,怎么去管理的?然后呢?对应的应用到我的体育赛事管理里面,这叫交叉, 懂我意思吧?或者我用一些比较偏偏的一些方向,就像我说的传染病模型吧,我传染病模型 sm 型对不对?我原来的是用在传染病疾病的扩散领域的,我现在把它用在了舆论传播,新闻传播领域,这就叫做交叉。而对于这个题目,我觉得最好的创新就是交叉。 好吧,交叉,交叉创新这个题目获奖非常关键哈,如果你没有用交叉创新的话,那你就要好好的思考思考了哈。 来,还有什么一体被动式太阳能遮阳系统这个题目的话,说实话哈,这个有点小难度啊,因为什么呢?这就是我们传说中的 a t 是吧?美赛的 a t 往往是这种类型的题目,就是一些比较冷门的设计,像什么让你设计一个对吧?浴缸啊,设计一个人机工程学的座椅啊,而现在的被动式太阳能系统让你用在了一体上面,这个题目超出出乎预测啊,因为一体的话一般是可环境和可持续之类的, 但这个的话也属于可持续哈,因为太阳能吗?对不对?这个题目的话呢,你核心就是你就要 首先的话呢,知道啊,怎么构建相关的一些微型方程是吧?那个激励分析啊,激励分析必须要有的,像什么热传导啊啊之类的要做,还有就是常规的优化类问题,什么目标优化,优化模型要构建 对不对?这两个是核心啊,你必须要学会构建啊。一会呢,我们可以讲到,好的这个题目的话难度系数不大,但是呢就是难点就在于比较马就要求解的话呢,就是要对模型啊,建模的要求比较强一点啊,就就比较典型的数学建模难题。数学建模题目 啊,因为 ai 吧,也很强的,在这题目也不在话下,也不在话下。 f 叫政策类题目,政策类题目我们啊,政策类题目的话,我们求解的一个非常关键的模型就是系统动力学模型,你们记住哈,解决政策类题目啊, 往往用系统力学是最典型的一种算法。做 f 题的话呢,大部分同学我估计都会用这个系统动力学模型, 因为要要评估政策对未来的一个影响,这个任何的模型都模拟不了哈,任何的模型啊,只有系统的理学这种半积累模型,我们说才能够分析这个政策对未来这个影响,所以这个题目大家很关键哈,只要用好这个这个题目就可以解决掉了啊。 来啊,整个的我们来具具体来看一下, a 题一共有四个小问,第一小问叫构建连续时间模型,描述电池剩余电量随时间的变化, 对不对?一定要考虑多种因素的影响,不能单纯的就用电池原来的电量和是吧。然后呢,预测未来的电量,这种是不能的,因为题目就具体分析,不是一个单纯的数据分析类题目啊,不是一个单纯的数据分析类题目,你们记住啊。 第二小问,预测不同场景下剩余续航时间,分析耗电系统,这个就是一个预测类问题了,预测不同场景下剩余续航时间吗?对不对?第三位分析假设参数使用魔镜对影响,这就是一看这个问题就是 敏感性分析吗?是不是因为参数对结果的影响?这不就典型的敏感性分析,某一个参数的改变对于我的结果有什么影响吗?对不对?这个题目我觉得不应该单纯作为一个小问, 为什么?因为单独做一个小问的话很匪夷所思哈,因为每这个是不,百分之百你必须要做的,对不对?你不是说哦,题目没问你是吧,没某个参数对结果的影响,你就不做了? 百分之百你是必须要做的,同学们,告诉大家啊,百分之百你必须要做啊,你不做就不行,记住哈,百分之百必须要做的啊,还有就提出用户和操作系统层面的省电建议,这个就决策建议类了啊,就学一下 demo 之类的啊,学一下 demo 之类的啊,建议建议信相关的东西哈。 然后推荐算法啊,第一个激励分析类啊,推荐的算法是什么?什么扩展型,带为难等等效电路模型加温方程组 啊,这个推荐的是这个算法,这个算法的话还有点创新性的哈,来贴合锂电池电子化、电电化学基体可量化多因素对 soc 的 影响啊。这说白了就是你看融合了微方程,所以 a 体的话,你要但凡说我用时间系列预测模型,那有点小问题哈,第一问哈 来,第二本预测类,其实机机理模型的模特卡罗模拟啊,原因是什么?可处理使用场景的随机性,量化系数不确定性啊,因为使用场景是随机的,你可能上着厕所使用,也有可能听课使用, 也有可能在路上使用,也有可能看视频使用,所以你的场景非常的多,所以用模特卡罗来模拟多场景的,这可是关键。 来第三节问敏感性分析,这个就无所谓了啊,你只要做好敏感性分析就行了。这个官方推这我们推荐就是这个买水刷牙把和手把手把纸把。这个其实啊,都还好哈,你只要能把这个做出来就行了,你们改变参数的结果,看看 这个这个结果怎么变化,因为第一问和第二问才是获奖的核心啊,第一问,第二问,大家不管怎么样,一定一定要把握好,一定要把握好,好吧, 来后面的政策建议类啊你,你多多少少吧,你想拿奖你就别整的吧,这个,这个太 low 啊,你可以什么多标规划之类的,用多标规划算法,多个省电目标,别续航时间长,使用体验,使用体验好之类的来找到一个自由平衡。因为你不要说把 f 题,把 a 题的最后一问就当成写个建议了, 老哥,我整合前面弄一针我我的写个建议行不行?今年 a t 竞争非常激烈,同学们,我建议不管怎么样,你们一定一定一定啊,说白了啊,真的一定一定,老铁们,明白我意思吧,不要上来就用什么啊,不要上来就就说白了,老哥我那个 对吧,就,就用一个,那个什么行不行就用一个啊,写个建议行不行啊?今年 a, 今年数学建模将是最难的一年,老铁们,我们不管怎么样,我们都要建立的有点创新性行不行? 政策建议类,你也要做出点花来好吧,但是不管怎么样,你们记住啊,一定要做出花来,好吧,你不知道怎么建模怎么内容的啊,老哥这里也有哈,我们 a t, 到时候呢,相关的输入代码包里面还有 b t 的, c t 的, e d, f d 的 啊,我们都把相关的思路解析原代码都放到这个代码里面,如果你实在求解不出来了,你也可以看什么用老哥的超级 ar 提示词,我们 ar 提示词里面也有哈,在这个地方 啊,超级 ar 提示词里面也有有十七道。一会呢,我会幸好演示一下到底每一小问啊,就是到底怎么来做的啊,每一小问 a 题的话,超级 ar 提示词,他 到底是怎么一步一步的把这个题目建出来的啊?没有领取到咱们的这个思路代码的,大家一定要去领取一下,到时候我们可以把 a t 的 相关源代码解析思路啊,论文答案之类的,包括我这个文档啊,我这个文档也都会放到我这个 a t 的 这个这个相关这个资料里面。好吧,没有领取的抓紧去领取一下哈。来 啊,最后一问啊,决策建议类啊,你们必须要啊,不能说单纯的就上来就提供一个小建议就完事了哈,必须不能提供一个小建议,一定要有一个分析好吧,一定要有一个分析哈。来, 这个难度系数整体只整体是三分好吧,难度系数不大哈,这个 a t 的 话呢,整体的难度系数并不大哈, 然后评分的依据啊,模型复杂度是中等的啊,因为就要结合一些电化学记忆多因素融合是吧,你这个其实难度系数并不大哈,因为这些内容的话,我们在一些网上公开的一些资料都可以找到 啊,然后呢,数据获取难度低啊,可以通过一些公开文件厂商数据,这个的话呢,网网上也是资料比较多的啊,老哥这里给大家提供好,到时候提供好以后,我们直接就给大家放到这个 a t 这个里面好吧? a t 的 里面啊,给大家放到这个 a t 的 里面,好吧?啊? a t。 到时候直接给大家放到这个 a t 的 里面啊,相关的一些资料哈啊,包括数据之类的给大家放到这里面哈, 然后就是这个,呃,创新性要求中等啊,但是我说实话哈,如果你让我来推荐大家做哪个题目,我给你们推荐哈,我百分之百会推荐你们做 a t, 为什么呢?因为这是一个非常非常典型的数学建模问题了,对吧?就是你按照流程来,按照老哥的要求来,你做出来之后去,说白了你起码来说没有那么大的坑, 对吧?像什么太空电梯啊,像什么体育赛事,说实话啊,都有点偏啊,都有点偏。 我最推荐的就是大家做 a t, 我 觉得这就是典型的数学建模题目了,难度系数并不大,说高也不高,说低也不低,每个人会的数据也不一样,所以大家得到的结果也不一样。有创新吗?哎,你的微方程那个地方,你只要弄的复杂一点, 对不对?你只要最后一位上个目标规划啊,你只要在,是吧?这样的,所以说这个创新硬有难度系数还不大,数据也没那么难,我觉得这个题目你要让我来做哈,老哥你要是你做,你会选哪个题目?我就会选 a t, 真的,老铁们,别的题目说实话都有点坑对吧,都多多少少吧,有点麻烦,像 b 体吧,太空电梯有点小麻烦, c 题的话,与星共舞也有点小麻烦,数据量那么那么那么乱对不对?地理体育赛事吧,你说交叉创新,你能创业到什么程度?也有点麻烦, 这不是一体呢,你得有非常强大的这个,呃,这个这个这个构建微方程啊,以及这个积累分析相关的一些能力啊,也不是很好做 f 的 呢,人工智能说很多同学都这个新动力学呢,豆芽都用这个,你很难创新,所以 a 体呢?你要创新有创新 对不对?要数据也不难,要好好深入的做,你就你就优化就行了,你就一点点的优化,比如说我参数,哎,我优化模模型可不可以再弄的复杂一点,就是你先构建一个基础模型, 基础模型就能够解决结构问题,然后你再一点点的生化,这样的话 a t 就 可以了。我们后面会给大家用全 ai, 用这个 ai 技术词哈,以完整的把 a t 的 给大家解出来,直到生成一篇高质量的 a t 论文, 你们再看一看啊,我用超级 ai 技术词来做的情况下,会做到一个什么样的效果?好吧,一会我们给大家直接来做啊,来演示,好吧,来难点啊,难点就在于什么 啊?那建模工作量也也中等哈,难点就在于什么多因素啊,就屏幕,处理器温度,每一个模块到底和耗电量是怎么耦合的,这是一个难点,只要这个解决了, 这个题目就可以解决了啊,这个题目就可以解决了,好吧。第二点,连续实践房顶的构建,贴合电池实验,避免纯数学孪合啊,这个也是一样道理 对不对?这个的话呢,你不能纯属于你和你不能用一个基础的回归就完事了,你要顾及积累分析。第三个不足,使用上下参数标准验证问题,这个蒙德卡罗模拟这个有点小难度对不对?你只要能把这几个解决了,好吧,这都叫小难度哈,还有就不确定性电话啊,不确定电话 啊,兼顾模型误差,有随机场景,这叫模型检验吗?对不对?你必须要做模型检验啊,要点就是第一个啊,是坚守连续时间见模合金,避免理散化处理,因为 a t 是 连续性问题,所以你别整成理散型问题了, 你 a t 要整成理散型问题,就背离了 a t 的 要求了好吧,不要做理散化处理啊, a t 不要做理散化处理好吧, 比如说把整个的这个这个时间或者什么的场景模拟变成里散化数据不行啊,明确各耗电组建的低耗与参数取值模型,区分不同环境下使用对使用模式的一个影响,这个就说白了,改变吗?对不对? 这个就说明大量的场景,比如说温度高的时候,热带或者是海南岛是吧?我极地的向东北东三省 温度冬天比较冷的时候,我怎么样?就你要考虑大量的场景,刷视频的时候怎么怎么耗电,对不对?拍照的时候,所以说你可以拓展的点特别多,你第一天,第二天你可以构建一个基础模型,在这个基础模型的基础上你再生化, 这样的话你们就得出的东西都特别的好哈,真的,就这样的话,我觉得你的模型会越来越深化,越来越深化,这才是 ai 的 贡献,明白吧? ai 不是 第一天你把你把你题目解出来了,而是第一天你,你可以用它做一个基础的框架,然后第一点后逐渐的生化,逐渐的生化,明白吧?逐渐的生化 啊,逐渐的生化,懂我意思吧?所以说哈,真的特别有意思哈,特别有意思 啊,我,我真的觉得特别有意思啊,这个题目啊,逐渐酝化,这样的话,你每一天都用 ai 酝化,每一天都用 ai 酝化。 来,老铁们,你们告诉我,你们这样的话获奖概率是不是比较大了?所以说你们啊,获奖套路就第一天构建一个基础的,第二三天不愿酝化, 比如说不同的场景,冬天夏天刷视频高耗电量是吧?然后呢?这个拍照,然后呢?这个普通的观看文本,数据文本的一些文档是吧?以及这个暗的情况下,亮的情况下,黑天白夜啊,你都不同的场景,那你肯定整个模型建的质量会非常的好哈。 点击思路,一步一步的怎么建模?第一位,构建锂,基于锂离子电池电化学反应建立基础 s o v 连续实践微方程,再逐一纳木屏幕啊,处理器耗电量等耗电组建,考虑温度对电池容量的修正 啊,先建立一个锂离子基础的耗电模型,然后呢,再把这些屏幕处理处理这些东西纳到你这个微方程组里面,然后进行纠解 啊,参数估计是吧,建立好模型以后,基于相关的参数就是就是你,因为你建立好模型以后,你肯定要做参数修正啊,对不对?这个地方呢,我建议你们在这里增加一个内容啊,叫什么叫有限元法, 有限元分析啊,我建议你们在这个地方增加一个这样的模块啊,机理模型构建好了以后,最好先用有限元分析来模拟一下,然后再用真实数据来得到结果,好吧,这源于分析的话,你甚至可以做可直观演示,这就是获 o f 奖的标准了,你要拿 m f 奖 m f 奖的标准了, 做一个模拟啊,有限员模拟啊,因为我们知道你不管看网上的一些是吧,一些公开的一些耗电量,他会有一个像一些热力图一样的东西,对不对?看耗电时间,一个热力图一样的一个一个折线,对不对?那个那个就非常的漂亮哈,给你们看一下哈, 哎啊,你可以增加这样一个模块,然后,然后第二就是参数估计啊,收集到一些具体的行业数据了,然后呢?呃,把你这个就对应而成,因为你出你出来的数据特别的多,肯定, 所以说呢,参数肯定是有限的,所以你需要用最小而成来计算这些参数啊,最小而成计算这,然后再就场景预测了是吧?利用是吧?这模特卡罗模拟,然后呢,设置不同的场景来重度使用待机啊,低温啊,高温环境啊,来计算续航时间, 然后敏感性分析,用这种算法来做敏感性分析。提建议的话呢,我建议你们啊,刚才说了,建议大家可以放一个什么多标规划模型,或者是是吧,比如说使用场景最佳,或者是耗电量最小,甚至你可以用一个单标规划,每标多标规划,老哥,太难了,我做一个单标规划可不可以?也可以哈, 来模型创新,在经典积累模型基础上融合多因素偶合模型是吧。啊,这是一种创新方案啊,模型创新 是吧,量化结果给出不同场景下续航时间及误差是吧?然后呢?呃,关键因素的敏感性分析组是吧?不同场景之下,这也是一个一个很好的一个获奖要点分析哈,还是格式化绘制 soc 啊。不同的,这个格式化也是一个获奖要点啊,你要想拿奖的话也可以把图做的美观一点哈, 然后模型检验啊,也计算一些各种检验,像二方 mse 啊,对不对?还有就是敏感性分析啊,灵敏度分析啊,鲁班性分析啊,都可以用,都可以,都可以拿来用一下好吧。 啊,鲁棒性分析老哥要不要做?我觉得这个地方也可以做一下,就极端的使用场景之下,别超低温,超高温,这叫极端场景之下来看看结果怎么样。所以说敏感性分析要做,鲁棒性分析我觉得也要做啊,这个地方呢,大家一定要记住啊,就是敏感性分析要做,鲁棒性分析也要做哈, 然后呢,选题建议啊,就是这个啊,这个,这个数学统一专业的推荐啊,然后呢,这个计算机专业的谨慎选择啊,因为避免过度依赖黑箱模型啊,因为这个地方呢,就数学物理专业的比较推荐功课这样的也比较推荐哈。 然后呢,这个文科专业的不怎么推荐,因为他涉及到什么机理建模了啊,涉及到什么电化学之类些东西了,所以文科专业的不推荐啊, 然后跨专业啊,工科的加计算机的可以读到零基础的不推荐啊,因为零基础的话呢,难度系数会相对大一点哈,微型方程电池都都比较难哈,中等基础的慎重选择,能力比较强的可以选择一下啊。 ok, 这就是我们的 a 题啊,难度系数整体来说不大啊,整体来不大啊,但是呢,我觉得获大奖很容易出现的 a 题啊,所以说同学们啊,如果你能够读懂这个题目啊,你也会用 ai? 我 建议你们选 a 题,做 a 题的话,如果我来做了,我就会选 a 题啊,百分之,我觉得百分之四十的同学应该都会选 a 题哈,今年 ok, 来啊,我们再来看一下再来看一下 b 题啊,太空电梯。 好的,我们接下来讲解一下 b 题啊, b 题太空电梯啊,太空电梯的话呢,我建议大家不要去想那么多好吧,不要把它整的太过于复杂哈,它就是一个普通的优化类问题就可以了。好吧,然后呢,这是标准的翻译哈,标准的翻译大家可以看一下啊, 大家可以翻我们的任务啊,模型啊,前面就是一些一些基础的背景描述之类的啊,背景描述之类的,你的任务呢,就是 第一啊,这个模型啊,从二零二五年开始容纳十万人的游游基地所需的运输成本和时间关系表,你需要必要现在太空电梯系统的三个维和银河港,从选定发动机调传输方案的运输方案,这就是一个典型的优化类问题 啊,优化的问题只不过不是这么的这个啊,常规而已啊,比较冷门而已哈啊,考虑三种不同运输方案,将一亿材料用到十十万人的这个运输场地啊,是吧?利利用太空电梯,三个维也纳仅应用三种,就三种不同的方案,就三种优化优化场景吗?对不对? 然后呢啊,如果运输系统并非处于理想状态,那么你的解决方案都要发生变化啊,光懂这叫什么?鲁班这叫什么? 这叫做极限情况下,比如说我这种,这叫鲁班性分析,我们在数学建模领域,这叫鲁班性分析,就极限场景之下来判断结果的变化程度,别管结果的情况对不对。那么这这就叫做鲁班性分析啊。 然后呢,就来十万人用水需求,你的模型了解用水用一年内有足够的额外实验成本和实验表, 一年内的用水需求对不对?那么每个人用水需求是来固定的,那么十万人到了运营以后,那么这就是一个预测啊,预测相关的问题啊,我们可以把它一个预测啊来做 啊,然后呢?哎,后面我会继续讲到底的,具体怎么来做哈啊,整体来说简单来看是这样来做的哈啊,难度系数呢?并不是特别大,就是比较冷门,比较偏一点哈,比较偏一点, 来,我们来看一下啊,我们来看完整的一个建模过程来来,首先它属于一个优化类啊,加综合类的这么一个问题啊,一共有五个小问 啊。第三,第一小问优化类问题,第二小问鲁邦性分析啊,看了没?鲁邦性分析吗?对不对?第三小问预测加优化环境影响分析类啊,决策建议类哈,然后呢,每个小问第一个,设计三种运输方案啊,太空电梯,火箭和组合方案来优化运输成本和时间表,这就是个典型的优化类问题 啊。这个的话呢,我为什么说 b 题的话,我建议啊,你们做的同学呢,一定是特别擅长优化类问题的同学去做啊,不擅长任何的优化的我就不建议做了啊,因为本来就比较冷门,你又不擅长做,那肯定不行哈, 来分析运输系统啊,非理想状态的对运输系统的方案,然后第三个,预测月球质量,用水需求啊,优化额外运输成本时间表, 分析不同方案环影响,调整模型最小化环影响,然后向 mcm 啊,机构推下行动方案啊,这个呢,有五个小问哈,五个小问我们把它整理成五个小问,这个是你写问题分析用的哈,问题分析用的 来推荐算法。第一小问推荐的是混合整数规划,这个整数规划也是我们在做 b 题比较常见的,也是我们让你必须要掌握的高频算法啊,给大家讲过哈啊,因为精准,因为我们说 甚至啊,太空电梯也好,火箭也好。这是个 b 题,属于离散型规划问题,离散型规划问题往往有整数规划,零一规划,这个是比较多的,而且动态规划也是用的比较多的啊,所以说呢,第一小问用整数规划模型啊,比较好一点, 然后呢,目,目标函数就是我的,这个是吧,目标函数啊,约束条件啊,约束条件的话就是我的一些是吧,火箭的载荷呀,对不对?太空电梯的一些载荷之类的 对不对?我的目标还是什么?我的最终目标是什么?是不是能够首先运输,运输到我的是吧?运输的最大量是吧?载荷是最大的,就是你运输的能东西是最多的,但是就运输的时间成本是最低的啊,运输的时间成本最低啊这样的一些内容。 那么第二个就是鲁棒性分析啊,鲁棒性分析的话,你可以选择什么?一般我们做鲁棒性分析就是用模特卡罗模拟来做的,为什么呢?因为模特卡罗模拟的话,他可以模拟极限场景之下的一些一些结果分析,对不对?模特卡罗本身就是做模拟的,所以说你用模特卡罗来模拟极限场景 是吧?火箭故障啊,电梯停运这种极限场景之下来看看结果的变化程度啊,这样来做。第三个就是预测,呃,知名用水需求吗?对不对?这个就是典型的一个回归预测模型了,对不对?我用回归预测模型来预测,哎,逐年的,哎,一个用水需求对不对?这个没什么难度啊,没什么难度。 然后呢?只不过这个地方呢,可以让你再结合一个多描优化,为什么呢?因为这是数学建模,你第一位整数规划,第二位鲁班星,第三位回归分析,太简单了,所以你可以增加一个多描优化啊。 然后呢?第四小问环境分析啊,环境分析的话就是典型的就是做一下评价吗?对不对环境的影响?影响一般就是评价吗?对,构建一个评价模型就行了。 评价模型这个地方你要够注意,评价指标体系怎么构建?指标权重怎么确定,哎,最终的评价结果怎么划分?这个很重要啊,很重要 啊,这个的话你要按照这个流程来做哈。来,第五位啊,决策建议,决策建议的话,很多人直接就上来,上来就直接就写这个建议信了。我建议的话,现在今年每赛征每赛获奖的都会非常的大,今年是有史以来最难的一年了,因为大家都会用 ai, 所以 你最好的每一个模块都用一个,都用一个这个呃, 模型来做啊,这个地方推荐你用 topase 算法啊啊,比如多种方案那么多种多种的这个方案啊,比如你前面说了运输方案嘛,那么选一个最优的方案,你可以用 topase 来做啊, topase 来做,选最优方案啊, topase 就 有一个,典型的一个一个应用场景就选一个优方案嘛,对不对? 整个的 b 题难度系数在四分哈啊,我们后面呢,回答给大家, b 题完整的从零到一,用 ai 怎么完整的把 b 题建立出来?而 b 题的话,你想获奖也是要用创新的方案的。而我们再给大家提示词里面有三种创新, 第一种算法改进,比如说改进了 b b 神经网络,改进了知识向量机模型。第二个交叉领域创新,比如说将一只算法啊,将这个 sr 传染病模型用在了不同的场景之下,用在舆论传播之下。第三个是算法创算算算,小组合创新,那么灰色 b b 神经网络来组合来做这个题目,那么显然这个题目 b b 神经 网络来组合来做这个题目,那么显然这个题目 b 题这个题目哈,你用交叉吧,有点有点牵强了 是吧?组合呢啊,还能做组合,还能做一做哈,像,像这个,像这个,刚才的这个,这个啊,这个,第三位和第四位啊,以及第五位,你还能做组合还能做组合 啊啊,组合创新,但第一位和第二位我建议你最好用改进算法了,说改进的模特卡罗算法, 改进的整数规划模型,或者改优化后的整数规划模型,你最好不要上来就建立一个普通的整数规划模型和一个莫扎格的模拟,因为什么呢?因为你要拿你要用这个来做哈,大家都会用 的是吧?所有同学,老哥粉丝有上几十万对不对?所以光美赛应该有四分之三的同学今年是看老哥的, 所以说你要是没有任何的创新的话,你获奖量太大了,你不给老哥我不看你的行不行?你不看我的,你还不如这四分之三的人呢,对不对?你直接是四分之一的人了对不对?那你所以说你们最好要有创新,你不管任何三种创新方案,你但凡有一种我觉得就可以了,好吧, 相关的原代码资料之类的我们就给大家放在我们的网盘里面了,就这个里面了,好吧, b 题的思路代码答案,我们整个的解析文档也给大家放在这里面,大家一定要去领取一下相关的原代码啊,我们整个的 b 题的原代码,到时候我们老师啊求解出来以后,包括老哥 建立出来之后,把我的 a、 r、 t 词什么我都给它放到这里面了。好吧,大家到时候一定要领取一下啊,领取一下,然后呢?自己比着来比比较比较好吧,比较比较,然后做一遍啊,做一遍啊,然后这就是我们整个的这个,这个 b t 啊,这个一个一个基础的思路解析哈。 来啊,然后呢?推荐难度系数就是四分啊,难度系数比 a t 会相对的大一点哈。 啊,首先模型的话难度系数比较高,是说什么啊?多约束的整数规划,还是说不能场景之下难度系数比较高?获取数据获取更难了哈,我建议你们哈,你说获取数据的话,来,老铁们 你看哈这个地方啊,什么太空电梯,二零五零年来,你要想获取到准确的二零五零年的各种数据啊, 各种数据,老铁们,猎鹰几何这种数据,老铁们,你能不能获取二零五零年的数据啊?所以这个地方获取数据很难啊,你也不可能获取到 太空电梯的数据的。所以说老铁们你们注意啊,这个题目找数据很麻烦, 很多同学我估计都会用模拟数据,因为这个谁也不知道二零五零年会怎么样,所以你能够建立一个模拟数据,能够自然其说能够裁索,各方面都说的比较清晰,我觉得也是可以的,因为你找不着数据, 你说老哥我能找到当前的火载火箭数据,然后呢?我根据火箭计划,比如说他未来二零二五年规划火箭载和达到多少,是吧?那个推进速度达到多少?那可不可以?也可以, 你用现在的数据来预测二零五零年的也可以。好吧,这样你的数据更有说服力了,只能说这也是一个创新点哈,老铁们,这也是一个创新点哈,啊也也,你们也可以这样来做一做试试啊,来啊,这个就是呢。呃,这个 哎,在哪呢啊?这这这地方啊,然后这个就是创新要求比较高啊,你如果没有创新这个题目你想拿奖是不太可能的啊。不太可能的,创新性要求是比较高的哈。 然后呢难点啊,第一个啊三就是难点的话也给刚才给大家解析了哈,是吧,第一个就是三十分钟啊,时间和时间模型的构建啊,组合组合分配那么比较麻烦 啊,离非理想状态下不确定量别故障什么的,蒙德卡罗模拟也不是这么容易的是吧啊,月球基地知名预测,这个呢也没有任何的鲜艳情况,你只能用人类地球的来模拟月球的,所以说呢,这个怎么去做好这个模拟 怎么去用人类的生存条件来模拟月球的?这个我觉得还好啊,因为你不可能说人类在地球上喝多少水,在月球上你就不喝水了,那不可能对不对啊。然后还有就是环境影响的量化模型啊,也比较麻烦,什么环境评价的这些参数啊,这个评价指标体系怎么来构建也比较麻烦一点啊 啊,整个整个来说难点还是比较多的哈,难点还是比较多的,然后核心要点就是啊有明确运输系统上技术技术参数要载重啊,运输周期成本之类的 啊,如果你有数据啊,你有文献啊,你不能盲目的做,你不说载重随便给,周期随便来,你最好也是建立在一些相关的文献基础上做的,明白吧, 不要上来就是这个直接就是模拟,也没有任给出任何的模拟的理由来啊,模拟数据也是要有数据作为啊,相关的文献参考作为支撑的哈, 还有优化模型啊,需要考虑一些约束条件啊,什么预载能力,发展场地限制之类的,这些你不能落下哈。 还有鲁班小文一经历合理的故障场景和概率分布啊,就是你不能说这个概,这个这个这个呃,故障的是随,是那个是那个呃,随便给的或者怎么的的,你要你要给出故障出现的场景的概率来 啊。还有就是呃影响环环境影响评估需要聚焦关键指标,像碳排放、大气污染之类的,就是这些关键指标,你不要构建指标特别多 啊,这个这个环境你想评价吧,他不是一个评价重点,他只是一个子小问,而且是不是特别重要的小问啊,所以说这地方你一般构建那么五到十八,五到十个啊,你当然你别构建一两个那肯定不行啊,五到十个指标评价体系就可以了,别太多啊 啊,还有就是推荐方案量化对各方案的有点程度啊。这个地方呢,你你不要上来就直接,你要勾选一个模型, t o p s s 模型, t o p s s 模型来模,你不要上来就是直接出来建议了啊,你要有依据啊,最好有建模的依据哈 啊,思路啊,在这里呢,就解析的思路大概的就这样的啊,比如说啊,书记收集假设约定是吧,然后收集火箭猎鹰和太空载用的成本运输标准等啊,关键假设, 然后呢,基础模型的构建,建立三种,一中方的时间成本优化模型,就是整数规划模型最小化、最小化的总成本和运输时间为目标啊一个。所以说吨标有吨标啊,吨标规划嘛,吨标规划, 然后呢?一个是最小运输成本,第二个是运输时间最短啊,然后再有鲁棒性分析啊。第三部分是做鲁棒性分析,引入场景,所以这个地方呢,他的模型假设第一小部分,模型假设第二小部分,构建 动方案的优化模型。第三节我们做鲁班性检验,用我们的卡罗来做鲁班性检验。第四来继续来做什么?来用水需求,比如人口规模,用水标准,循环利用率啊,循环新预测年用水需求哈。 然后第四第五部分呢,就是环境评估了啊,比如说 l l a l c a 赛马量化各方案的环境足迹,加个 agp 确定指标权重。为什么 agp 啊?因为很多指标你是无法确定到权重的, 你没有那么大量的数据做支撑的,所以只能用 h p 确定指标的权重。我说老哥,我这个地方用 h p 行不行啊?你只能用 h p 了,你没有用,没有办法用别的了,对不对?你只能用它了,因为它没有什么数据做支撑嘛,这么多的环境参数对不对? 然后第六个小本方案优化,有 topase 来做,来做不同方案的对比啊,不要从时间啊,成本,时间,鲁班性环境来排序啊。啊,鲁 topase 里面的指标指的是这些指标哈,成本、时间,鲁班性环境这些指标来综合排序,这些指标你是能获取的,因为前面在求解嘛,对不对?所以你是能求解得到的哈。 啊,核心要点就是我们创新层面啊,设计一些动态组合优化机制是吧?然后呢,量化方案给出具体的具体的成本就是量化结果, 格式化层面可以挥之一个方案成本时间啊, pro 啊, p p a r e t o, 前沿环境时间对比,雷达图,鲁邦性分析,相应图像之类的就做着格式化分析,可以做得漂亮一点,因为美赛的话获奖对于格式化做图还是要点要求比较强的哈。那就是必须要做检验啊,灵敏度分析什么的,比如说应 用成本概率对结果的影响。那么做灵敏度分析啊,必须要做灵敏度分析哈,每一个题目 a b, c, d, e, f, 每个题目最好一定要做灵敏度分析哈。 然后就是啊,数据收集模型构建,多场景分析,推荐啊,完整的一套方案啊,就是每一个模块之间都有都有这个关联度,关联度是非常强的啊,别先做什么再做什么,最后做什么,对不对?关联度非常强啊,这个呢,你这个逻辑顺序就不要打错。 这个我觉得是一个获奖的要点,也是评选的要点,尤其真要里面你要体现这种关联度啊,第一问,第二问,第三问,第四,数据收集模型构建,多场景分析对不对?鲁班性分析,然后呢,呃,这个,这个,呃,关键决策,关键决策对不对?这些顺序一定要捋顺哈。 来选题建议来说的话呢,难度系数比较高啊,数学物理啊,专业的同学呢,比较推荐好吧,经管专业的话也不是特别的推荐哈。 然后呢,零基础的基础不再扎了,扎实的我也不建议推荐,因为他比较麻烦哈,模型复杂度很高,涉及到多种复杂算法哈 啊,适合那种中中等基础和基础能力比较强的同学可以做一做哈,这是整个的这个美赛的这个 b 题哈,难度系数比较大哈,我们像江哥的源代码还有思路解析还有 ar 技术词就放在这里面了。一会老哥直接讲, 用这个 ar 完整的每每赛 ar 完整的建模,求建模的提式词来做的一个过程哈,把这个,把这个完整的建模过程直接给你做出来哈,用这个 ar 提式词啊,用怎么创新,怎么改进,怎么优化啊,用这个完整提式词,看看这个 b 题是怎么一步一步的得到答案,得到结果的哈,给大家看一下哈, ok, b 题讲到这个地方,谢谢大家。好 的小伙伴们。大家好,接下来我们讲 c 题数据哈,大部分同学都会选择这个 c 题哈, c 题的话呢,怎么说呢,你选这个没问题啊,同学们,我告诉大家哈,你选 c 题没问题,但是你必须要有创新啊,因为大部分的同学都在选这个 c 题,目前命题比例已经达到了恐怖的百分之四十哈, a 题百分之三十, c 题百分之四十,两个题目加起来接近百分之七十了,老铁们哈,百分之七十的人都会选这个 c 题啊,都会选这个 c 题 啊,所以说呢,我建议同学们哈,要慎重啊,其实我是非常不建议选这个 c 题的,我觉得吧,你就是大家大部分同学选这个 c 题都是为了图简单啊,但是呢,我告诉你们啊,图简单,不要去图简单哈啊,不要去图简单, 为什么呢?因为 c 题你看着哈,但其实它很麻烦啊,很麻烦 啊, ct 很 麻烦,所以说我建议你们不要去盲目的去做这个 ct 啊,盲,不要盲目做 ct, 好 吧,老铁们,我建议你们避开它,因为因为这样的话获奖是比较难的,你不要图简单,大家说实话都知道数据都知道怎么建, 那你说对不对?你,你说你怎么获奖呢?你创业点怎么来搞呢?对不对?所以说我不建议大家选 ct 啊,真的我,我是真心的劝大家啊,要慎重哈,要慎重好吧 啊,老哥,选哪个题?我建议我建议选 a 题或者选 b 题啊,你最好就是选,要么选冷一点,冷门一点的,这样选的人少,竞争压力会小一点,对吧?你选这个 c, 那 么大家都选这个 c 了,所以当然了,我,我不说,不给你分析哈,我给你分析,但你要慎重,你想拿奖,你必须要有创新点, 你必须要有创新点,如果你做这个 c 题没有创新点,那就白搭了,而这个 c 题的创新点 百分之大部分的都是两种创新方案,第一种改进的模型就是你用改进算法去做,第二种融合模型啊,就你选择不同的模型一块来做, 你说交叉你行不行?交叉创新的话,在这个地方的话啊,也可以试一下,好吧,只能也可以试一下,因为我们创新模型的话一般就有这么几种方案吗?所以说这几种方案的话没法说,但是改进算法的话,我觉得在这个地方是最常见比较常见一点的,所以大家呢,如果想做 c 的 同学呢,你要慎重, 你要能够能有创新。好吧,你要有创新啊,真的哈,啥也不会,只能选 c 你, 那你,你不至于啥也不会,老铁们,真的不至于,你有 ai 了,你让你没有不会的题目了,好吧,你没有不会了,而且 c 题呢,也没有那么简单,还是比较复杂的,大家都做, 所以说呢,就看谁做的好了,你想做的好的话,我觉得你和高手竞争是有很大的压力的哈,要有压力的,所以建议同学们呢,要慎重一点哈,要慎重一点 哎, ok 啊,这个这个大家呢要慎重哈啊,与这个题目的话呢,我们简单阅读一段的话,就是与星共舞啊,美国为美国美国节目舞动奇迹啊, 然后呢,这个这个我们前面的就是专家投票吗?国家通过什么在线投票?这是他们最喜欢的情侣啊,观众的话每周可以投票一次或多次,上下为当中公布的次数。然后呢,还有就是评委也可以投票之类的,然后选出第前几名来,对不对 啊?评委投票和得分和观众投票的组合方有多种,在美国版节日前两季采用基于排名的组合方式,第二季因什么什么啊啊, 然后,然后呢,就修改了这个争议哈,第二十四季又出现争议了,对不对啊?评,尽管评委得分低,仍赢得冠军,他会回应,二十八级就说白了他的他的评分吧,是由评委和 评和这个观众投票来综合决定的,有的时候呢,评委觉得不好,但是观众觉得好,那观众投票多了,那么就有可能得得得这个最终的这个成绩了。但是,但是呢,又因为不专业,比如说一二流子一些选手那么特别会讨观众喜欢,那也有可能,对不对? 还有有有,这个如果评委特别的占比权重比较大,观众占比比较少的话,那有可能这很多啊,迎合评委的啊,评委的角度不能代表大众的,所以有可能引发歧义啊,就来构建一个比较合理的评价的这么一个啊,评分的这么一个模型啊,这就是整个题目的核心哈, 来开发数学模型啊,估算每个选手在其参赛的每周获得观众投票数啊,就估算这个呢,就是一个基础的预测模型了啊,每个每个,这个。来,同学们,来,大家告诉我哈, 开发数学模型一个和多个来,你告诉我到底开发几个?首先啊,首先到底开发几个?这个是一个要点哈,到底开发几个? 你们记住哈,那就一定要开发多个。你想做 c, 我 还那句话,你必须是勇士,你必须要有胆量, 你必须要牛逼,对吧?要不然你要说你就开发一个,你开发一个非常基础的,你做 c 题拿奖,我就这么说,你再创新也没有希望,因为因为选 c 的 人太多了,高手太多了。老哥这里统计了百分之四十的同学会选 c 了,都是勇士啊,说实话,所以你必须要开发多个, 而且多个模型,来估算明白吧,来估算明白吧,你的模型估测观察图片结果,是否能得出与每周淘汰结果一致的结论啊?提供一致性的衡量标准就是你要,你要那什么, 你要结果要准确,你不能结果不准确,对不对?确定性如何?每种确定性,这个就需要有验证了,就你的结果也有验证,说白了我我告诉大家哈, 真的这个地方就看谁的模型精度高了,但是你们记住你们的精度啊,很多情况下来,大家告诉我,来来,我问一下哈, 我问一下哈,来,这个的话你说老哥,我不单纯的用美赛官方给的数据,我用别的数据来佐证一下,可不可以?老铁们,就是我用一些别的投票的一些结果来做,可不可以?老铁们,别的投票的模型来做,可不可以? 可不可以?老铁们,你们跟我说完全可以,反而会把你的模型的这个精度啊,反而会提高的比较高。来这个地方一定要注意两件事一定要注意两件事哈, 一定要注意,除非他明确的说了啊,你可以看了没?你可以自行选择纳入信息或其他数据。看了没?其他数据,但必须要记录数据。来,同学们, 我这地方要注意两件事,第一个叫什么过你河,第二个叫欠你河。来,你们觉得哈,你们觉得你们最容易做预测模型的时候最容易出现的一个问题是什么啊?最容易出现的一个问题是什么? 就是你们如果来做这个题目啊,后面会有啊,我会讲到啊,你不用担心啊啊,你会讲到来, 你们容易出现了一些问题是什么?做预测的问题,做回归问题啊,过你河,我告诉你们,你们最容易出现的就是过你河了,真的,所以说你们一定要注意一点,好吧,不要出现过你河 啊,这个很关键啊,很多同学呢,做预测经常会出现过,你和还有同学这么这么来做的哈,来,还有同学这么来做的,我们来,来啊,我,我后面会讲到哈,这里有一个完整的看了没?完整的来 看一下啊,来,看到没?他有一个完整的解析思路,第一步,一定要做数据处理。第二步, 观众投票预测构建贝叶斯啊,这是基于概率的模型,以评委得分选手特征周次为自变量,以淘汰结果为约束啊,预测观众投票数,预测知信区间。来这个地方呢,很多同学这么来说的, 我看你们的方案了哈,你们说老哥我预测他的投票得数,那我这样不就行了吗?啊,我,我这样不就行了吗? 来,我直接就是用他每前几个周的得数预测他未来每个周的得数,可不可以?老铁们应该这样来说的哈,我用他前几个周的得数来预测他后几个周的得数 来,老铁们,你们觉得这样的行不行啊?你们觉得这样行不行啊?我刚才有同学在上面是这么说的啊,在评论区留言啊,包括在那个老哥私信我这么说的行不行?老铁们,行不行啊? 为什么啊?包括你们告诉我为什么,我告诉你是百分之百不可能的,不行的哈, 你别乱搞哈,你记住哈,投票结果是未知的,严格保密的,你不可能说用这个是吧?哦,前一个数据来预测未来几个周的数据,你就你就,你就完整的变成时间序的预测了, 知道吧,你是不可能的啊,你,你别乱搞,你别乱整哈,你别乱整来, 但是我可以构建一个什么样的模型呢?老铁们告诉我,既然如此, 那我就不能用时间虚列预测预测了对不对?但我可以用什么预测来,我要我现在要做的一个一个参数叫什么观众投票数,他和很多项数据有关系,包括什么评委的得分打分,包括一些其他的。哎,这地方有哈,包括其他的 看啊,哎,在这地方包括他的年龄,包括行业啊,包括一些是吧?他的这个,这个是吧?这个这个选手的一些特征,包括他日常的动态,包括一些其他的淘汰的一些结果。来 来,同学们,告诉我。来,我相当于我要预测一个指标,它和若干个指标有关系。那你告诉我要构建的是一个什么样的模型啊?啊?要构建的是一个什么模型啊?这是这种预测方案,不叫持续预测,这叫什么预测?老铁们, 哼哼,叫什么预测呀?到现在啊,大家都提出了有用 xd 版的啊,随机森林对吧? 这就是回归吗?对不对?某一个变量和若干变量有关系,不就是回归吗? 是不是啊?不就是回归吗?所以说你这个地方既然构建回归,你们就记住我刚才就要返回来。我刚才提到那个那个逻辑了,不要出现过你和,也不要出现欠你和。 好吧,过你和就是你回归的模型太美完美了。来,你告诉我这种未知的投票数量的能过于完美吗?老铁们,所以说谁的预测的模型的精度达到百分之百,你反而应该要慎重了,你百分之九十六九九九你都要慎重, 你的精度不可能那么高的。我可以告诉你啊,因为他是未知的,而且这两组变量之间理论上没有什么必然的情况, 不能说评委得分就高,他观众投票就高,对不对?也不可能说,但是呢,来评委投票高,有没有可能观众投票也高啊,也有关系啊,也有可能啊,那评委投票高,有没有可能观众投票低呢? 也有这个可能,对不对?所以说哈,这里面比较麻烦,比较复杂, 你呢,一定要慎重啊,一定要,一定要考虑。就是自变量和因变量之间没有很强的关联度,没有很强的关联性,这个是很关键的哈, 明白吧,做这个做回归,理论上是一个大忌,就是自变量和因变量之间没有很强的关联性,我们说这属于大忌,但是呢, 不代表说他俩没有关系,往往会呈现一个啊,就是典型的比如大部分选手,可能评委投票比较高,观众得分也会比较高一点,只是说有一个大概的,对不对?但是你要考虑极端场景之下的一些情况 啊,因为因为前面说了吗?对不对?来前面说了,前面已经给你讲了很多了,对不对?说有有可能会出现专家评分高。所以说呢,这个 第一小问啊,我建议你们不要你合的精度太高。好吧,不要你合的精度太高啊,太高了确实会有问题的哈,来 第二小问啊,利用你的观众投票结果估算结果和其他数据比较,和对比节目使用的两种投票方法,排名反而百分之在各季产生的结果,是吧?就每一季对应的两种结果,如果结果再差,也其中一种方法似乎更清晰,更偏于观众投票, 对吧?就是比较吗?对不对?和个体产生的结果比较结果的结果。如如果结果存在差异,那么其中用哪一种方法可能会偏向接受投票?说白了就是看看哪一种方法和观众投票的相关度更高吗?对不对? 然后考察这两个投票之外存在两种投票方法,存在争议,与观众或与观众意见存在分析的特定选手应用情况,投票组组合方法的选择是否会导致这位每位选手的结果相同,是吧?每周什么什么的啊? 然后呢,咱们就那个一,考虑一些具体的视力,把你建立的模型,再把具体的视力,然后呢这个考虑进去,然后呢,利用包括投票观众估算结果,在你的数据开发模型分析专业舞者以及数据中可用的名人说的影响 对不对?这些因素对名人在比赛中的影响有多大啊?说白了就是你前面不是估算了一个观众投票的模型吗?对不对?利用观众估算投票结果,在你的数据啊, 开发模型,分析专业舞者以及数据中可用的名人特征的影响啊,这些因素对名人在比赛中的表现影响有多大 啊?啊,就你那个像年龄啊,特征啊,对比赛影响到底有多大?来评来他们对评委得分和观众投票的影响是否相同,这个也是要建立一个合适的模型哈啊,也要建立合适的模型的 啊。然后第四位提出另一种每周观众投票结合系统认为系统更公平,说白了就是就是啊,提出另一种每周结合观众投票评委的问题,说白了就你提出了一个新的打分方法啊,打分方法不是传统的这两种方法了,提出新的解决方法来哈,这样的话呢,你就需要全新的设计一种投票组合方法了哈, 让我们看一看完整的一个解决方案哈,来,第一个啊,第一个来美赛啊,第一,一共四个小问,第一小问,预测类题目,第二小问评价加决策类,第三小问影响因素分析,第四小问优化设计类啊,因为第四小问的话,它涉及到 新的投票方案吗?对不对?所以说需要用到,用到这个优化设计类问题哈,优化设计类来,每一小问,第一小问预测每位选手每周的观众投票数,验证一致性和确定性,说白就验证精度啊,验证投票的这个预测的精度到底怎么样? 评价两种投票方法的优劣啊?分析争议的案例,提出决策建议,就两种方法,他有没有什么两种投票方法啊?选人的方法有没有什么对错优劣啊?这叫是吧?那第三个分析专业舞者和名人特征对比赛结果的影响啊,然后呢?这叫做影响因素的分析吗?对不对? 然后设计新的投票方案,这叫设计新的投票组合方案,系统一般就是优化了,对不对?优化方案找到最佳方案吗?对不对?最佳的这个投票组合方案,来,我们看一下理方法哈,方法 来,第一个,用预测类模型,我们说了不能用单纯的时间去的预测模型,这个地方是不适用的,而是要用回归预测的思想,比如 c c 的 模型加广义县域回归也可以啊, b e s 模型可量化观众投票的不确定性 对不对?然后 glm 能整合评委得分啊,选手特征等预测变量,适合小样本高维度的需求,所以这两个模型组合这个这叫组合创新,类似的组合创新还有很多很多的 好吧?很多很多的组合创新,比如说,比如说你这个地方可以用模特卡罗模拟,模特卡罗模拟来来得到与观众投票的不确定性数据,因为观众投票不确定性数据可以用模特卡罗模拟来做一做, 然后再结合一些预测模型来做,更好了啊,结果更这样的话更好了好吧,有很多种创新方案,说白了就是你这个地方你不能上来就构建一个基础的方案,比如 igbo 的 c c 零,那这样的话是不太合适的,你要考虑到很多的不确定性因素好吧,而这些不确定性因素反而成了获奖的关键, 明白吧?啊?活跃的关键啊,你这里构建的模型呢?就是小样本高维度的预测数据,因为维度数据比较高,指标特征比较多吗?所以需要构建高维度的啊?高维度不能用基础的,什么灰色预测什么的,不可能好吧,不可能的就是老哥,老哥我用深度学习神经网络可不可以也可以? 深度学习神经网络本身也适合于高维度的预测,但是呢,你的数据量最好大一点好吧,数据量太小的话很容易陷入过你和的现象啊。 啊?过你和,因为神经网络还有这个这个深入学习很容易过你和,所以说你需要有大量的样本来做哈来做。 还有第二问就是评价了啊,评价两种方案的对比,你可以啊,选择量量化两种方式的维度,比如说两种方案,每一种方案的公平性是观察性,是吧?等等,如何?然后看到系统呢?看到系统用于衡量结果的一致性,支持评论结论,这两个组合起来也可以解决这个第二问啊,就是评价类,评价两种方案的一个优劣吗? 评价就是,是吧?先构建评价指标体系,比如说公平性、观赏性,是吧?这个效率之类的,效率 啊、成本啊之类的,你可以都把这些特,把这些,呃,样本,把这些指标啊,然后特征,然后呢?构建一个评价指标特指标,然后呢再构建这个相关的一个权重来这个地方你们最好来,你们告诉我。

美赛马上要开始了,我看依然有很多同学完全没有头绪,没关系,只要你排版合理,再配上一个好看的图标,基本上都能拿二等奖。在这里我给大家推荐几个小工具,帮助大家做到以上两点,轻松拿下美赛。首先是 infmind 这个网站,专注于科研论文的工具, 美赛开始前夕,将你选好的论题直接丢给 inflight 跑一遍,跑出来的论文直接能用。然后再利用网站内置好的画图工具,搭建一个完美的图标,想不吸引评委都难。然后是排版,在这里我首推 t plus, 它的排版不仅合理,还支持多人合作排版与美赛的三人配置不谋而合,总之,大家赶快用起来吧!

好,大家好,那我明天早上六点钟呢,二零二六年的美赛就要开赛了,那本期的美赛呢,我也会跟以往的啊,所有比赛一样,会在啊开赛之后就会给大家发发布一个选集建议以及个体思路的这样的一个视频,那么之后呢,就会选择其中两道题目去完成他的完整原装论文以及相应的代码和结果。 那么比如说你看这个二零二五年,我做的是这个 c 题目和 b 题目等开赛后呢,会发布这样的一个视频,哎,之后你就会有一个每一部分代码结果以及格式化,包括完整原装论文的这样的讲解视频。 那么啊,这个二零二五年是 b c 题目,二零二四年那么做的是这个 c 题目和 f 题目,然后呢,二零二三年啊,我做的是这个 c 题目和 e 题目。好, 那本次比赛啊,二零二六年的美赛呢,我也是一样,我们团队一共是九个人呃,均是获得过国二或者美赛 m g 以上的双月硕士。那么开赛中呢,会嗲嗲之之内就会发布的选题一件以及初步的思路视频,之后呢,就会去完成其中两道题目的完整成品,那么我们大概就是 x m 和 s m 各做一道 关于届时这个完整成品的说明,大家可以看这个视频评论区啊,之后呢,就会到这样的一个文档链接里面去啊,大家也看到左边导航栏里面,我已经把大家可能会关心到的一些问题啊,全部都有跟大家去解释清楚 啊,包括这个选题型的哪样浓轮的时间啊,包括啊查出问题啊等等这些东西,那么这个视频呢,我就去跟大家详细的讲一下啊,届时我们提供的完整成品的说明啊,以及呢去给大家详细的看一下往年我们啊的这个美赛提供的完整成品的说明啊,比如这就是去年的 b 题目, 那么这里是前年的 ct 木打,包括所有的这个代码啊,我也会给大家去展示,就是往年我提供这个代码什么样的形式,大家到时候怎么样去运行,我都会在这个视频里面去给大家讲清楚。好吧,那么请大家务必耐心的把这个视频仔细的去看完,那么相信呢,呃,这个完整成品呢,可以大大的去提高大家的获奖概率。 好吧,那我在我的空间里面呢,是已经有累积长达四年上百场比赛,上千个学员,全部啊,所有学员的这个完整的获奖记录呢,我全都是有总结的啊,这也是全网唯一一家敢让任何人公开访问的。 那比如说我们来看一下二零二五年的美赛,最终一共是两个 f 奖啊,就是在我的学员里面啊,就是拿了我这个完整成品的人里面是两个 f 奖,然后六个 m 奖以及若干的 h 奖。呃,大家可以看一下,这是二零二五年比赛我当时发的这个总结记录啊,大家可以看一下二零二五年的五月二十号发的,那么这个呢?学员的, 呃,四和五呢是 m 奖啊,三是 h 奖,那么这个学员十呢,他是一个 f 奖啊,他们学校的这个 f 和 o 的 学分数是一样的加分,然后这个学员十次呢,也是一个,大家看一下也是一个 f 奖,好, 那么这个呢,就是当时在组做比赛期间啊,我发给他这个,包括这个梅赛 c e 的 打包文件啊,就是我这个完整成品的参考文件啊,那包括呢?相同说明视频代码出错、附件视频等等这些东西,那么稍后这些东西呢?具体这都是些指什么东西啊?我也会,也会在这个视频里面就给大家讲清楚啊,在这个成品包括什么这个栏目里面我会给大家讲清楚。好吧, 那再比如说一些其他比赛的,这是二零二四年研赛,这是学员是一个国一啊,这学员是个国一啊,这,这是二零二四年的美赛啊,是一个学员十七是 h 奖,那么学员十八呢?是一个 f 奖,葡萄奖提名 这个学员是一个 f 奖。呃,他们的助攻模式主要有个论,就是说必须在每一个每次都有一个人开头啊,他就是说呢,感觉我每次的速度都能带得动他们啊。 那么二零二二年国赛啊,这是二零二年国赛的总结,二零二三年联赛的总结啊,那么具体呢,就不给大家多展示了。好吧,这样大家有兴趣的去访问我的空间就可以了啊,那么在我的空间里面呢, 这四年来所有的比赛啊,上千场比赛,我全部都有总结啊,这可能是显示的 bug 啊。没事,我一会给大家拖动看一下,比如这是二零二二年啊,十月十号我发布的这个,我这个置顶说说啊,这是二零二二年的,给大家展开看一下吧。 呃,这个一到七呢,是一个第一次参加拿了一个省一的一个学员啊,他是拿了一个省一,然后呢八到九呢?是一个推入到国家答辩的,来问一下这个答辩的问题, 那么十到十二十一呢?是一个省二啊,那我就给大家看下其他的吧,比如我昨天发布的这个啊。 呃,那么还是那句话,就是我的空间里面呢,有所有的,我往期接四五年来所有学员上百场比赛啊,那么上千个学员所有的获奖记录呢?我全部都是我总结的啊,那么比如这是我昨天发布的,一月二十八号发布的吗?这是二零二四年美赛,学员是拿了一个 m 奖,那么这个学员在我这里也是做了 很多个比赛了啊,这个呢,我当时他做了一个小比赛,是拿了一个国一,我们后来呢,主儿美赛是在我这拿了一个 m 奖啊,这是当时二零二四年的美赛,二月三号我发给他的这个打包文件,含计相应的一些其他的视频。呃,那这个, 这个二零二五年国赛的学员二十八啊,这是我二五年八月二十九号发给他的这打包文件,他是拿了一个什么,然后他来预定这次的美赛 啊,这个就有很多了,我就不能一一个一个给大家展示吧,总之呢,我自己滑动一下,大家也能看到啊,是一月二十三号发的,给大家往后面拖拖拖一点。好吧,来看一下我们去年美赛成绩刚出来的时候,我是怎么发的。 呃,去年美赛成绩应该是四月多,还是说应该是四月多发布的?五月发布的,五月发布。好,那么当时发布之后呢?我五月八号就发布了这个总结的啊,这个说说,当时呢,五月八号的时候报喜的一共是有一个 f 奖和若干个 h 奖, 那么这个学员一和二呢,是一个 h 奖啊,这是当时去年因为我做的是 b 题目和 c 题目嘛,那么就给他发的是 c 题目啊,他是拿了一个 h 奖,然后呢这个学员啊,看一下啊, 看一下,给他发他也是一个 h 奖。好,那在网上看一下啊,比如说这个啊,爵士学院五是一个 m 奖,大家看一下。好,这个学员呢是拿了一个 m 奖 啊,这是当时美赛也是一月多的时候啊,发给他的这个梅赛 c 的 打包文件。这个去年是一个奖牌得分点的变化嘛,他要后面是有些答疑,就是说这个变化点的得分是怎么算的啊? 那么学员五呢,也是一个 m 奖啊,这是当时我来看一下他是他选择是 b 题目啊,因为去年做的是 b c 题目,我 b 题目呢,当时他是有问这个,比如说这个座驾坐标指示是啥啊,包括这些东西也是当时的 n 记录。那么他当时每赛呢是一个 m 奖啊,包括一些其他的,比如说这个,这个学员应该是个 f 奖啊, 这两个是 m 奖,然后这个是有一个 f 奖,然后包括其他我就不给他多展示了。好吧,我们大家在我的 qq 空间呢,都能完整看到。好,那么接下来给大家说一下,这个完整成品都包括一些什么东西啊?啊?在之前我再给大家讲一下啊,呃,一些其他的东西, 这个呢,我们现在每次比赛呢,其实老学员的复购比例基本上是在百分之七十以上的,包括本次美赛呢,大部分的人呢,大部分都是在我这已经学习过其他比赛的人啊,其实呢,新来的这个学员呢,是非常非常少的啊, 真的基本上已经都是在我这做了好几个比赛了啊,包括有学员在我这做了十几个比赛的,也有一次性就做预定四五个比赛。 那么接下来我还是要感谢一下啊,用这个视频感谢一下大家这些老学员的信任啊,认可。好吧,那么这也是对我们助攻指标的一个最好的证明啊,感谢大家的认可。好,那么接下来给大家讲一下这个成语包括什么东西。那首先是呢,是有一篇完整的原创论文,这个格式呢,是大学的 pdf, 那 么在这个 啊,我这个视频展示就给大家展示这个 p f 啊,就以这个 word 形式来去给大家看了,比如二零二五年美赛的 b 题目呢啊,呃,这就是我当时美赛 b 题目啊,一共是五十页的一个完整成品,那么当时呢,就包括这个摘药问题,如入问题分析,我先假设符号说明节目每一问的模型建立于求解。 那么去年的这个 b 题目啊,是这样一个诸诺市旅游的问题啊,大家可以看到呢,这里面我有发表论文,包括每位的目前建议群里面,大家可以看到的,里面包含很多个二级标题和三级标题啊,那么呃,这是因为呢,我要有非常有条理的把整个这个论文呢 啊,全部给它清晰的写出来,包括呢,每个问题里面当然会有将来如果很多个小的问题,我每个小问题都是需要去具体的解决的 啊,比如说,但是问题一呢,怎么?当然首先要去构建这个优化问题了,我后面呢,是这个实际的囚禁。呃,在优化问题里面呢,包括模型啊,目标函数构建,约束条件以及反馈机制的建模。那么包括第二问, 用模型适配和黑广的差异化因素的识别,按照编量以及参数的调整及模型适配的演示,包括影响重要性的分析啊,动态平衡策略啊及问题三,我去年的问题三呢,是要求有一个备忘录吗?对,好,包括整个论文里面,我也会有非常多的黄字提醒大家如何去进行修改,像虫,包括一些论文篇幅呢,也是显得比较长一些 啊。呃,好,那么放大给大家看一下这个论文的剧情是吧?好吧,以去年 b 题目为例, b 题目为例, 那么这里呢,是去年 b 题目的这个摘要部分啊,这是 b 题目的目录部分啊,这是问题重述及问题分析。好,那么这里是模型假设啊,然后呢,这是模型建立于求解部分。好,大家可以看到。好,那么这里呢,就是代码运行的错误的一些图片。 好,那么我来看一下啊,这五点一点三的一个模型灵敏度分析,大家也知道呢,美赛呢,对于这个模型灵敏度分析要求是比较严格的,那么基本上,呃,大部分需要去做这个, 就是能做这种灵敏度分析的啊,这个题目呢,基本上都要去做,所以呢,这个,这个不啊,栏目呢,我当然也是必不可少的啊,我基本上都会去做这个灵敏度分析啊,这里有灵敏度分析。 好,然后呢,这里是问题二,问题二里面的模型建立,然后这里是结果啊,好, 再来给大家看一下去年的 c 题目吧,那么 c 题目呢?去年比今年呢啊,去年这个 c 题目呢,比 b 题目是要稍微难一些的啊,所以整个这个篇幅呢,要比较长一些,因为它里面呢处理的东西太多了啊,就是大家可以看到呢,我这二级标题和三级标题分的非常多, 那么去年呢 b 题目呢,我也给大家奉它看一下吧啊,它 b 题呢,去年是一个这样的一个奥林匹克奖牌的模型啊,奥运会奖牌的模型, 这里是摘药部分,那么这里是目录部分,目录分大家可以看到呢,呃,问题一里面包括数据处理,然后去做格式化,然后构建一下这个预测的模型, 然后呢去进行一个具体的实现啊,去提取他的特征啊,然后去训练他的分类和回归的模型,然后后面是预测他首次获奖,然后呢再做赛事分析,模题二里面呢是做这个引入了一个贝耶斯变化点的检测啊,然后后面还要分析这个教练的贡献度,重述分析和假设,就给大家多说了啊,这是符号说明部分 好,包括呢里面会有很多拱王集体去告辞一些会员的说明,这个答案呢也都务必要去落实。就这个视频呢,也是给呃目前已经在我的预定过这个完整成名的人呢,给出一个指南啊,就是到时候你们拿到这个成品应该怎么去用啊?这个视频呢,也不必自己去看完哦。 我在这里建议大家画一个流程图,好吧啊,这里是做一个模拟器去处理,那么第一位呢,我们首先去做成数据处理啊,做一个数据清洗啊,这个就不用给他给大家多说了吧,这后面包括呢,这就是获取的这些图片。好, 那么除了这个论文之外呢,第二个就在我用借账过程中用到的所有的数据处理的表格和结果表格,包括代码,那么在代码部分呢,我们百分之九十五以上的概率,那本身每站呢,也会依然去采用 python 去进行纠解啊,那么这个呢,我们是采用 notebook 去进行编辑的, 这个呢,当然如果说不会 python 代码的话,也没关系啊,也没关系,我会给你代码的一个完整的运行操作视频,那么大家继续去看就可以了,那么零基础也可以完全的去跟着我的这个操作视频去运行,是很简单的,在运行工具方面呢,只要是支持运行 notebook 的 啊,呃,就可以了啊,比如 sps pro 啊, java 啊, py 叉门啊等等,这东西都行,但你即使门打开或者知道你的 python 不好也行啊,但是不太建议,因为这个呃知识弄得不可学的工具呢,看起来比较直观一些,也简单嘛,对不对啊?那有人说我没,我一接触过这个 python 代码怎么办呢?我完全不会啊, 无所谓的啊,无所谓的到上头你根据我这个代码速度视频来啊,你就直接打开代码就能看到这样的一个东西了啊,比如这是我去年每站 ct 的 代码, 那么这就是我,大家可以看到正好是一年前,对不对?一年前创建时间二零二五年一月二十六号,这是去年我美团的这个 ct 的 代码和结果表,包括中间预处理的所有表格,那么这就是代码部分,这是 q 一 啊,这是 q 一 的格式化部分,那么这里是 q 二。呃,打开 k 局给大家看一下,这里呢,前面是安装库, 呃,包括这个,怎么安装库?这个呢?我的代码速度视频呢,也有给大家去讲啊,其实呢,你无论是零基础,哪怕是高中生拿的代码速度视频也能给大家去讲啊,其实呢,你无论是零基础就可以操作这样的一个版本, 但如果你要是会拍成会弄图的话呢,那当然更好,对不对啊?我支付呢,你不贵,零基础呢,也无所谓啊,运行就完事了嘛,只导入一些数据啊。哎,这就是先去做这个数据处理清洗,这是去年的这个代码, 然后呢,我做了一个音设表,然后提取数据,然后进行计算特征的提取,然后呢啊,这只是做预测,这只是一些混合矩阵,这是分类预测嘛,这是混合矩阵图。哎,这里是这个 数值的预测部分啊,回归预测,哎,回归预测啊,特征重要性的排行。好,那么这里后面是啊,得到一些其他的结构表壳啊,这里是获奖概率的分布,大家都是题目要求的啊, 然后包括说后面有计算得出的这个奖牌的相关性和项目变化的相关性,哎,也得出了,那么后面呢,包括各项目和奖牌数的相关性也得出了, 然后呢,绘制他们的奖牌分布情况全部恢复至了啊,那么整个呢,这个绘制的图片呢?呃,形式呢,基本上是以尼手入门的这样的一个科研任务要求的啊,所以呢,来个看到这个图标呢,也是比较精致的,这是 q 一 的格式化部分哎, q 一 的格式化部分,然后这是 q 二的一些代码, q 二的一些代码, 这应该是去研究那个教练效用的啊, q 三是写一个备忘录就被他展示了,对吧?那再比如说啊,啊,这里是二零二三年 c 写的论文啊,他是当时一个打网球试图得分的一样的一个模型啊,这会我就不用给大家多展示了吧,比如这里是这应该是当时二零二三年 c 题目的一个代码啊, 大家看正好两年前吧,两年前啊,两年前的这样一个东西,好就给大家多展示了,好吧,总之呢,本次美赛我们提供的形式呢,依然是这样的啊,或者给大家给大家一这样一个拍摄的代码啊,那么当然呢,直接根据我这个 啊操作一些视频去操作就可以了,然后呢就会有一个讲解视频,那么这里呢,首先是有一个公开的版本的讲解视频,就是在我的 b 站上面会发布的 啊,这样的一个公开的视频里面会给大家讲一下整体我这个论文是怎么去完成的这样的一个思路啊,包括疑问的代码和结果的一个展示,当然这个展示部分呢,我是会进行打码处理的啊,包括一些重要的代码结构,重要的结果图片啊,包括论文中的这个展示呢,我都不会去完整的去给大家展示啊,这个公开版的视频呢,只是,呃,给大家讲一下这个思路具体是什么样的, 呃,因为我要保持这个限量嘛规避查虫问题好啊,所以呢大家也不用担心这个查虫问题啊,因为我 啊陪我四五年这以来啊只要是按照我论文中黄黄字提醒以及我的啊副这个降重出名视频啊去操作你的人呢啊是没有一个人出问题的,包括去年每三年没有任何一个出问题啊,前沿大前也是。好吧好那这是一个公开讲解的视频啊,最后呢就是一个降重教学视频以及操作的副线视频, 那么这个呢主要是让拿到论文的更好去理解论文中的结果如何去进行复现以及这个论文呢如何去进行修改成虫。因为我这个出的成品呢也是一个限量的成品啊,所以我会特别录制一个降重教学视频以及一个复现论文中所有结果的代码错漏付错漏视频 零基础也能看懂。然后接着呢我会和这个整体论文呢一块发放给你,请务必对照这个论文呢仔细巡查啊,那我这个参考成品呢是一个限量版本啊。呃还有一句话我前头不是给大家讲过了我是一对一的帮大家去做啊 呃 k i 型的务必注意好吧啊那么关于这个文档链接里面的一些其他部分包括说这个信用问题啊,查重问题啊啊是否报答奖啊这些大家自己去看我这文档链接就可以了啊。呃这个呢便捷的还可以玩啊,可以占这个 y g 完整成立的数呢大家可以看这十人的评论区好吧 ok 那 就说到这里吧。呃本次美赛啊我会跟去年的比赛刘冲呢是一模一样,会给大家带来这样的一个助攻。呃呃,大家等明天早上开赛吧啊,六点钟开赛之后,我就会第一时间发布全天 e 及作题速度视频,之后呢也会去实践的去完成其中的两道题目 啊,中兴兴盛呢,我这个视频呢也应该给大家讲的很清楚了。呃,希望到时候能够帮助大家获奖吧。啊呃,再创去年前年大前年美赛的这个辉煌啊,去年呢是两个 f 六个 m, 乐观的意识讲啊,希望今年呢,呃,大家的获奖情况比去年更好更上一层楼啊,希望大家呢都能够 拿到满意的奖项吧。好吧,呃,就说到这里吧,希望能够帮助到大家。那么关于这个美赛技术,我会出到这个完整层面的书门呢,大家可以看这个视频的评论区。好呃,就说到这里啊,谢谢大家。