粉丝2809获赞1.8万

好,大家好,那这里是本次东北三省数学节目联赛选择题建议以及做题思路的一个讲解视频,那么我现在也这里呢,也已经准备好了一个七二的思路文档啊,稍后呢我都会跟大家去详细讲解这样的题目具体的思路啊,那么这个思路文档的查看呢啊,大家可以看这个视频的评论区, 那么我先就这样一个主机调来针对于这次的 d b 展题目呢,呃, d 题目是这样一个非常经典的数据分析以及预测类的问题,然后呢, b 题目是这样的一个优化类的问题,其实从题面上来看呢,这样的题目呢,都不算难 啊,但是第一题呢,有一个问题,就是关于这个数据给出的形式啊,呃,是给的比较庞杂的啊, 关于人口普查的一个数据,然后打开其中就具体的数据呢,数据给出的形式呢,也不太规范,所以这道题目的数据去处理呢,会是比较大的一个难点 啊。再一个呢,可用的模型呢?呃,也比较固定啊,就只能用把那么几种常见的数据分析类的这个模型。呃,那么稍后我给大家去讲解啊,就具体能用哪些模型 啊?但是 b 题目呢,作为一个优化里的问题,呃,其实难度也不高啊,难度也不高,但是呢,针对于这种简单问题,我一定要提醒大家,那么大家就要去复杂的去做它,能理解吗?什么叫复杂?做它就是用尽可能呃这个更高级一点的优化算法,或者说优化模型, 来来去求解决这个问题,这样的话呢,才能能够帮助你在众多队伍中脱颖而出啊,这也是我一贯做数模的一个 思路啊,那就是针对这种简单问题,我们就把它复杂化好,所以呢这次呢推荐大家去选择这个 b 题目啊,只要我们建立合理的优化模型。呃,然后呢采用比较高级的优化算法去进行求解,得出一个合理的排标方案啊,这样望大家获奖的概率呢会高很多。呃, 那我们这次呢也会选择 b 题目去完成我们最终的完整的原创论文以及相应的代码和结果。呃,预计会在明天就是四月二十六号的早上左右就会更新完毕。 那关于这个完整原创论文和代码的书名呢?大家可以看这个视频的评论区。呃,还是跟我往期所有竞赛一样啊。呃,我会先发布上一个选题建议及做题思路的视频,那么之后呢就会有一个完整原创论文及相应代码和结构的讲解视频 啊,大家可以去看我网集视频去看一下。呃,其实我刚刚结束的这个啊,刚做完那个华中杯 a 题呢,也是一个优化类的问题,而且其实这个优化类的问题呢,华中杯 a 题呢,这个 a 优化算法呢,其实也可以套到这个 b 题面来啊,稍后我也会给他去讲解,就是怎么操进去啊 啊,这是我华中杯一起最终完成的一个整个的一个代码啊,这个代码量也是非常大,然后我采用的就是我一会会跟大家讲到的,呃呃,一个算法。好,那么届时呢,我东北赛车也会给出这样的一个代码形式。 ok, 那 么废话不多说,我们现在来看一下这样的节目的一个思路。呃,首先来看一下 a 题目, a 题目是这样的一个中国人口区分布和发展知识政策的一个多样化的问题啊,题目背景我就不多大家注意了,那么这道题目呢,它的一个首要难点就在于多元异构力数据的一个预处理问题, 因为它人口普查数据呢,它是通过多层文理阶层的形式存在的。我来打开看一下 啊,他是一谱到七谱嘛?然后他跟我们说的是一谱到三谱,是尽量作为的一个对比啊,就说,嗯,我们可以不怎么去用,对吧? 啊?基于第四次到第七次啊,但不限于这些数据啊,不限于这些数据,但其实这些数据肯定是够用了。然后我们打开其中,比如说四谱,那么我们打开其中,呃,任意一个,比如说文化程度啊,文化程度人口处打开之后可以看到呢, 哎,他这个数据形式的给出呢,是这样的一个形式啊,这个呢数据呢,我们后续都是要去进行处理的啊,因为你肯定要是批量举行处理,你不用手动的这个把把,这个冰他油表头,对不对啊?然后呢 啊,还有一些合并单元格,对不对啊?然后呢,一个一个表短词啊,会分两个小的分表等等这样的形式,这个呢,大家都会去多少知识点,比如说它这里面呢,它就包含了特别多的分表啊,特别多分表。那么所以说这档节目的数据处理呢,是非常重要而且比较困难的一个步骤, 因为他这个数据形式给出呢,他不是一个规范的形式啊,不是大家职业局能够进行录取的,并且呢处止出去的时候呢,大家也不能采用手动的方式去进行处理啊,这个话太太复杂了,因为你已有这么多人口普查数据,对不对?哎,他也是逐层建套的,仅仅是四普里面的文化程度呢,就有这么多的表格, 那么你具体要去选择哪些表格,然后怎么样去处理这些呢?也得去想一下,看怎么去,具体怎么去做好。呃,然后呢,你们把这个就说,咱们把这个数据弄完之后呢,还存在一个问题,比如说 啊,就在这个第四次到第七次的这个普查的跨越时间内呢,我们的这个省省级的行政区划呢,也发生了一点点变动啊,比如说一九九七年,同基本上只辖市了, 所以呢,在建模之前我们必须要进行数据的清洗,那就是说一个是我刚跟他讲过的多级表图的一个展屏,然后呢我们还要去查了他趋势值啊,因为这个,嗯,人口普查数据里面肯定是存在一定趋势值的, 然后呢还有统计口径的统一啊,我们把然后呢把历史数据呢统一到目前的三十一个市的自治区。 答案,假如啊,我们现在把这个数据是已经全部完成了,把这个多元溢沟历史数据啊,让我们整理成了可以导入到我们代码里面,可以进行处理的这样一个形式。那我们来看一下这是以几 啊开始这个问题的一个思路。问题是说呢,在近四次人口普查时间段内呢,基于普查数据的基本指标啊,增加必要的合理因素呢,去进行人口区域分布类别的划分。 那么因为我不具体去做这个 a 题目,所以讲解这个 a 题目思路的时候呢,我就给大家剪短一点,好吧,呃,我着重去讲一下这个后续的这个 b 题目的思路。好 啊,问题一呢,我是分为了普通版的思路和高级版的思路,普通版思路呢,就是基于啊,还有我们现在任务就是要基于这四次普查基本指标去增加合理的外国因素,然后对于全国各地区进行分类, 在这个过程中我们要去体现出来时间和空间维度的一个特征提取。嗯,混淆思路。就是基于结麦数据呢,去做一个静态句类啊,我们继续他的数据啊,或者说计算这四次普查的一个均值啊,建议大家去计算这四次普查的一个均值,就把这四次普查的数据呢都能用得到。然后 我们在人口指标之外呢,我们还在引入啊,各省份同级的一个 gdp 啊等等这些东西呢,作为它的合理因素。然后我们再去做降维,然后用 k、 minus 之类或者有层次句类, 把全国分为若干类啊,比如说有人口净流入的高教聚集区啊,人口流失的老龄化区等等这些东西,因为它有很多个指标嘛,对不对?有年龄的指标啊,有人口流入流出的指标,还有他出教育同度的指标啊,这些指标呢就可以用来做分类了, 这个可行性呢是比较高的,因为这个算法是非常成熟的啊,就是啊,贴近序类嘛,然后,呃,主成分分析降维嘛, 呃,但是它创新性的就比较低了啊,我们在这个过程呢,我们不能把那个动态演化过程去给它演示出来啊,只是一个镜面的啊,静态的一个细节分类, 呃,整体的得分显内来说的话,中等吧啊,就是我们肯定都是完肯定能完成问题的任务,但是你就要说啊,这个有多出才能不能让你在很多费尔达卷中脱颖而出呢?这就不一定了,这就不一定了。 好,那么高级版的书中就是我们基于时空轨迹的这样的一个面板数据动态矩阵的问题啊,我们可以把这次次普查数据的构建为一个面板数据啊,让我们增加一些合理因素,可以引入,比如说夜间灯光数据指数啊,然后或者说产业结构的高级化指数, 我们采用动态时间规整算法呢,或者说持续的序类啊,这种方法呢,我们就是不仅仅是只关注它的具体的数值,我们还关注呢它的一个演变的轨迹 啊,而且我们还可以结合呢空间自相关分析,通过空间权重矩阵呢去约束它的序类过程来保证它这个分类呢,在地理空间和发展轨迹上的一个双重的理性。 这个可行性呢,中等吧,就是难度稍微高一点,然后编辑代码难度呢会高一点。呃,假如你没有非常好的梳理基础以及编程基础的话呢,那么这种思路呢,大家不要去看了啊,也不要去进行操作了,因为这个确实实现起来会比较难一点, 但是呢这个创新性以及的分潜力呢,就会非常高了,就是我们能够把这个时间序的演变过程呢,就不是一个镜面切片了 啊,而是一个整体的这样一个时空聚合的,一个联合的聚类。好,那么第二问,他是问我们人口数量影响因素的一个变化,色征和量化的分析。他是说呢,在我们第一问分好的类内寻找影响人口音数量的因素,然后去对比这次普查期间这些因素以大作用大小的变化。 这个呢,普通话思路就非常简单了啊,就是大家以往参加过这种书约建模啊,然后做过数据分析的题目的人都懂啊,非常简单,就是 我们以这个围巾变量,然后以这几个都作为作作为自变量,然后我们去做多元信息回归,或者说计算他们的灰色关联度就可以了, 我们通过它的回归系数或者关联度大小的变化呢,就能够去说明哪些因素的影响深在增强了,哪些因素在减弱了,可结性呢,非常高,但创新性就比较低了啊,这就是非常标准,非常标准的一种说法啊。呃, 高级版书呢,就是采用时空地理甲醛回归和机器学习可解释性进行融合。 呃,一个是在宏观层面的,我们去构建这样的一个时空地理的加权和规模型,然后在微观层面的,我们可以引入随机森林啊,或者角色数或者叉 jboss, 就是 这些基于数的模型,我们去拟合得出它们的人口数量 啊,基数的一些学的这个机器学习模型,然后我们引入 sao 分 析啊,去会使他们的影响分布的这个特张图。那么 sao 分 析呢,就是现在非常常用的,也是目前前沿的,其他的我们是必备的啊,去做这种题目的一种方法 啊,去绘制它们的影响分布图,因为它能够精准的去量化某一个年份,某一个具体特征,对于最终人口数量预测的编辑贡献以及它的动态也没问题。这个可行性呢,也比较一般,因为它确实难度也会比较高,因为我要去构建这样的一个时空距离矩阵, 然后下铺分析。呃,以及这个树模型呢,这个就比较简单了啊,这个呢,大家直接叫云聚个库就好了。好,那么下一位, 嗯,呃,就是这个人口数量预测模型的构建,它让我们预测未来五年,十年啊,三十年各领域的人口数量。 那么大家一定要注意啊,第七次人口普查的时间是二零二零年,所以我们预预测未来五年呢,就预测到二零二五年了 啊,预测二零二五年了,因为我们现在没有第八次人口普查吗?请问就只能是基于原始的给出数据里面第七次人口普查数据去进行预测。那么普通版速度呢,就是采用传统的时间序列以及组合预测啊,哎,我们可以用时间序列模型,然后去做预测就可以了啊。这个就 这个也没有什么多讲的吧,就是关注人口预测时间就随时间变化的人口预测呀,等等。这东西呢也非常非常常见的一个套路啊,也没有任何创新性可言,也没有任何得分潜力可言啊。 呃,周瑜简单了,我就不给他多讲了啊。那么高级版的思路呢,就是说 我们可以采用 pma 分 方程和神经网络混合的动学模型啊,我们可以把以年龄结构引入进来,然后以我们由于未来的因素呀,可能会发生变化,所以我们可以采用 lstm 去预测第二文中汲取的一些核心的影响因子在未来的一个走势, 然后呢把这些宏观因子的预测结果呢转化为偏离方程的一个时变参数,然后呢通过数值修剪 pte 得到带年龄结构的这样一个未来总体人口的规模。哎,这个就是比较合理的了,因为我们最开始的这种思路呢, 就是他忽略了一个问题,那就是人口系统,他是个非常复杂的动觉系统,我们纯数学百岁就是做时间序列模型的,他是没办法去反应出来,比如说包括啊有出生率的下降,有人口老年化这些结构性的问题,但是呢我们引入了这个模型之后呢啊,那我们把这个时这些指标呢全部提取出来, 就可以把这些因子的影响因子的一个走势呢啊,就给他做出来,那么这些影响因子的走势呢,也可以作为参数去进而影响我们的预测。哎,这个就非常合理了 啊,我们可以把这样的一个物理机制和数据驱动呢去进行融合,我们能够保证人口演化的一个物理逻辑的严密性啊,而且我们还可以去处理这种非限性应慎的能力 啊,这个就比较好了,我们不但能够给出他具体的演化的面貌啊,然后呢给他的演化的结果,而且呢这个是非常具有学术深度的 好,那么最后一问,他是让我们说根据第三问的基准线,没有政策干预,设计差异化的政策,并且去量化这些政策实施之后,我们的人口出站变化。好, 那么普通版思路就是我们根据政策的导向,比如说发放生育补贴呀,优化托育呀,我们假设这个政策能够去提高先用的这个生育率,或者说降低死亡率,然后增加人口的迁入率等等这些东西。而我们针对于第一问,不同的区域呢,去设定不同的, 哎,比如说不同的这个生育率,哎,不同的迁入率,对不对?然后把这些参数呢带入到我们第三位,建立好的这个模型元去,然后再去跑渊云社就可以了。 但是这个参数的设置呢?呃,一般呢是比较难有一个坚实的支撑的,就是主观性比较强,所以呢,不太推荐大家去选择这种方法。那么高级版的书呢,就是采用呃系统动力学的仿真和合成控制法啊, 我们可以采用微观经济学中的一个呃谈深基础理论,我去查一阅我们这个数据,然后呢和相关的文献去建立一个政策投入 啊,对于生育指指医院指数和人口留住率的一个非限性的映像函数。然后呢我们建立这样的一个系统动力学模型,构建因果反馈的一个环图啊,比如说 资金增加,主义成本下降,收益率上升,人口增加,然后呢财政负担又增加了,然后呢这个补贴呢?又下降了,就这样的一个闭环,大家能理解哦,啊,这样的闭环,把它作为一个整个的一个复杂系统,哎,然后呢我们去借鉴借鉴研究学者的一个合成控制法, 进行政策效应评估的一个仿真,然后加入蒙特卡的模拟去显人们多次的扰动,然后呢去给出呃这个人口增长的一个执行区间 啊,这个的难度稍微高一点,就是重点在于构建这个因果流程图。这方面呢我们需要有一个非常深度的一个逻辑思考,然后去建立潜在的这个防控,但它创新性和得风险平台就非常好了。 那么整体而言这个 a 启幕呢?呃还是我刚跟他说的啊,一方面是数据的预处理方面的,呃非常复杂,然后难度也比较高。呃再一个呢,呃即便我们能够把这个数据处理呢这些东西全部做好,呃后续呢,我们采用这个模型啊, 呃普通版的思路呢,就是得分,嗯概率很低。然后高级版思路呢,可能有的地方呢,实践起来确实会比较复杂一点啊,然后这道题就如果说这样去做的话,那么篇幅就会特别特别长啊,可能会超出我们这个篇幅的限制。 呃总之呢总体啊,不推荐大家去选择这个 a 题目啊,不推荐大家选择 a 题目比较难做的出彩,然后呢获奖概率也不高。好,我们来接下来看一下 b 题目,也就是我们这次会具体去完成啊,呃,会完成这个完整原创论文,你现在代码的这个题目 这样的个优化问题。好,他是说呢啊,他要举办一场维持时间的一个大型的展销会,然后他是分为了十个小组,每一个小组的工作时间段呢是八点到晚上七点啊,一共是十一个小时,大家要注意。然后他是说连续工作时间,每个小组是共学连续工作时间,然后每天每一个小组每个小时的。 呃,临时工人数呢,由各小组提前上不了人力部门,然后根据这些需求呢去统一招聘临时工啊,临时工。然后他说呢,每名临时工呢,他每天工作八小时,然后有两个连续的四小时的时间段组成啊,就中间有个午休嘛, 然后十天的这个会期内呢,每名临时工还必须要安排两天休息啊,就是实际是工作是八天。 好,他给出了这个十个小组在时间内每天每个小时所需临时工的一个人数啊,这是我们的附件一 啊,可以看到呢,这是天数对不对?从一到十,然后这是他的时间段,八点到九点,九点到十点,然后十点到十一点,然后就是一个小时化划分一次,然后一直到这个六点啊,到七点,六点到七点,然后这里是十个小组。 哎,这十个小组的这个数据全部已经给出了啊,就这个需求的数据表嘛,对不对?好,那么第一问,他问我们什么呢? 呃,他是说呢,让我们去县里数学模型去求解所需最少的临时工人数和相应的排班方案。莫吉英,他是说每名临时工的十天只能服务于同一个小组 啊。好,我们来看一下这个题目的思路,其这道题目呢,本质上就是属于运筹学中的一个人员排班问题,呃和集合覆盖问题。其实呢,我刚刚做完那个华中杯啊,他是一个非常复杂的排班问题 啊,大家有兴趣有有兴趣的话呢,可以去看一下华中杯的这个加密视频啊,这是非常复杂的一个排版问题啊,但这个就是处于呃比较简单的类的这个排版问题了啊 啊,华中杯这个代码呢,我当时是编辑了三个万啊,加起来都有一万多横,那么这次呢,这个东北三省的这个题目啊, 做起来应该没这么复杂。好问题呢,他还是说每名临时工十天只能服务于同一个小组啊?他还是说那一我们先分析一下啊,就说现在我们是限制了临时工十天内是不能跨主的,他只能在同一个小组内一直工作, 所以呢这个问题就可以直接把它变成了十个完全独立的一个子问题,只需要分别去求出来每一个小组所需的去找人数,然后把这十个小组的最少人数的求和。哎,那他就是一个总人数了对不对? 那么临时工呢,他在时间内呢,是需要工作八天然后休息两天的,所以我们要从时间内去抽取八天一共是四十五种排班模式 对不对?然后单日内要由于有两个连续四小时的时间段,所以在十一个小时的营业时间内呢,可以去穷举出所有合法的单日班次的组合。所以我们的方案一意啊,也就是普通版的思路呢,就是基于穷举法和整出现金规划, 我们可以去构建班次模式的一个整数现金规划的模型,然后我们先去定义它的玄机啊,一个工人十天的完整班次的模式,然后我们把它角色变量的去 啊,设定为采用第 i 种啊十天完整排班模式的一个工人数量,然后我们的目标还是呢就是去最大化每个小组内的总人数,我们约束条件呢就是有对于每一天每个小时所有处于工作状态的工人总数呢,必须是大于等于我们对应时间的临时工的需求量的 啊,对不对?你肯定是要去大于我们需求量的,这个可行性呢是很高的啊,取取速度呢也非常的快。呃,但是呢创新性就比较一般吧啊,这就是我们解决这种人员排放问题最常规了最稳妥的一些方法了。 呃得分潜力呢,整体来说啊就是没有什么亮点,但是呢中规中矩吧,不会中举,那我方而二呢高级版的输入呢就是基于列升成算法 啊,这个呢也是我们目前的前夕康德文里面啊徐书记常用的一种标准算法,就是我们考虑到这种休息偏好呀或者说问题规模过大的时候我们就每举出来所有合法的时间排位模式呢,会导致这个变量数呢非常非常的多啊,变量爆炸。所以呢我们 采用列生成算法啊,是什么意思呢?我们主问题呢 啊,负责选择最优的盘盘集合来覆盖各时段的一个需求,然后子问题呢就是去生成一个新的合法的啊十天的个人还款模式,然后我们去通过计算不断的能够去将优化目标的列呢加入这个主问题,一直到我们求得这个追优解。 呃这个编程难度呢是稍微高一点的啊,当然这个大家不用管,到时候呢我会完成这个完整的拍摄代码,然后大家呢,呃你即便没有代码基础啊,完全不挪代码也没关系 啊,我会给你发一个代码的操作运行视频,大家自己去看就可以了啊,根据那个视频呢去运行呃不需要你任何基础啊,然后你运行就完事了好吧, 哎这个得分险点呢就比较高了啊,因为这是我们非常前沿的一个学术界的方法。好,那么问题二呢他是说 啊允许现在跨签了啊。呃不同田呢是可以服务于不同小组的,只不过一天之内只能服务于同一个小组而已啊。之前是时间只能用于在同一个小组嘛,现在是一天之内可以在同一个小组呃但是呢不同田可以去不同小组。好, 这个呢就是说我们把呃允许跨界更换小组呢去打破了问题意识的动用问题意识中的这种主别孤岛 啊,我们全区的最少人数呢不再是各组独立求结最少人数一个简单相加了,因为他担任的球员可以不换组,但他隔天他可以换组啊,所以我们必须要去按天结偶然后再进行局的聚合 啊。这呢我也分为两种思路,第一个就是普通版思路就是两阶段的启发优化模型啊。呃我们先去单独考虑每一天啊,因为他每一天内是不允许换主的嘛,就我们针对于每一天去建立出来一个混合的足够化模型去纠解出来第第一天 在所有小组中总共需要的最少出席人数 n d 那 么第二阶段就是去做全区休息日的分配了,我们得到时间之内每一天需要的最少在岗总人数。之后呢, 我们建立一个简单的组织规划模型,去安排工人员的这个工作或者休息的这样的格言状态啊,就是一比零,要么工作要么休息,然后呢,保证每天在岗的人数呢大于哎,这个最少在岗人数就可以了。 然后呢,并且呢每个人恰好休息两天,这个呢,逻辑是非常清晰的啊。然后呢,嗯,模型的难度也比较低啊,因为我们是分两步走嘛啊,先去做单日排班,然后再去做全区休息的分配, 呃,创新性呢,也还可以吧,中等吧,等一点呢,也还不错啊,比如我们这个排版表呢,是能够去做完整的输出的,但是这里面有个问题,就是我们去割裂了这个时空的关联了,我们先去做瞻日,然后再去做分配啊,这个就,嗯 啊,不一定是全书理论的非对称啊,这个我们高级版书呢,就是采用理论下去分析的这样的一个局网络的一个模型 啊,呃,我们去通过数据推导呢,去给出来一个局域最优解的一个底轮下界,然后我们确定完这个底轮下界之后呢,把这个问题可以转化为最小费用最大的一个问题。哎,可以构建这样的一个多层图,那就是说呢, 把时间修长前的这个约束呢,转化为图上的一个流量的容量约束,然后去寻找这个该图的一个可行流,然后一次性就可以求得我们的局域权优解了 啊。但这个呢,呃,有一定的难点呢,就是我们这个图论转化呢,需要一定的设计技巧啊。这个呢,我尽量或许会采用高级版思路去进行修剪。好吧,我会后面去试一下吧。 呃但假如说这个能做出来呢?哎这个就非常啊会让屏幕眼前一亮了啊,因为还有我像跟他之前跟他说的啊,就针对这种简单问题我们尽量把它做复杂一点啊,尽量采用呃其实完全没有必要的一些高级版的模型和思路啊和这个算法 这样才能够保证大家在各种队伍中能脱颖而出。你要全采用这种普通版思路那大家采用都是这个思路呀啊这个标准版的思路其实只能这样做没有什么意义啊没有什么意义你得出考量方法又能干什么呢啊你确实得到了最基础的分了但是你要获奖你不是靠基础分能不能拿到的对不对? 好,这个呢我或许尽量去做一下吧。然后呢就是我们的这个问题三了啊,就是说每面的施工他不仅可以挂天更换小组他还可以在同一天内服务于制作两个小组,然后每个小组呢连续工作四个小时,并且每两个工作时间段人呢至少还要休息两个小时。 哎这个问题呢我们来看一下。其实呢它看似啊它现在我们呃既可以跨间还可以跨市每一间内还可以服务为两个小主啊看似行制度很高但其实呢不是这样因为我们能每天总窗口只有十一个小时 啊,大家还记得吗这个数据它是只有从八点到晚上七点呀,只有十一个小时呀, 然后呢他还要一次工作四个小时然后呢休息两小时还要再工作四个小时啊,这个跨呢就应该有十个小时了,所以这种呢,在这种情况下呢,我们现在只有十一个小时的窗口,然后呢你的整个这个跨度呢是十个小时,所以呢班次组合呢,只能有这么几种组合,一个就是八点到十二点工作, 然后十二点到四点休息,然后呢十十二点到两点休息,然后两点到六点工作,然后内容就是你八点到十二点工作,然后呢?呃,这个十二点到三点休息,然后呢 三点到七点工作。要么你是九点到十一点工作啊,然后呢十一点到这个三点休息,然后呢三点到七点工作啊?只有这三种啊,只有这三种他自己应该有那么意义,对不对?所以说,呃, 现在已经有这个模板了,就只有这三种模板了啊。那我能普通版思路就是基于这个受限的模板呢,去做了一个全局的整数规划,我们把这个隐藏条件的去把它引入进来,然后把复杂的这个连续性和休息线的约束呢,就转化为一个直接的模板匹配 啊,然后呢我们把它约束给出来,那么这个核心呢就非常高了,这个规模就就降,然后可以直接采用传统的这个规划去进行求结了。 呃,这个其实得分险练的也还不错啊,因为我们现在重点就是在落定任务里面呢,必须要把这个核心的破题点给出,就是他只有这三种模板,因为他有时间跨度的约束啊。呃,但是呢, 德玛斯路还是没那么好啊,还是那句话啊,我们要的,我们要的不是只拿基础分,我们就是要啊有一些创新分啊,尽量能够在众多队伍中脱颖而出,所以 我们方案二高级版思路就是采用自适应的大领域搜索方法啊,这种方法就是我们为了去追求绝对的全句 z u, 我 们去构建这样的一种包含全时空变量的混合整数构法模型啊。呃,我们采用自适应的大领域输入这个奇葩算法,我们可以去粗式化一个可行的排位表,然后呢去设设计多种破坏算子 啊,然后呢通过轮盘赌极致呢自身选择算子,然后在大局解空间中呢去跳出局部 z u 逼进大局 z u 级,这个可能性呢?呃,中等吧啊,难度是比较高的。那么其实呢,我刚刚完成的是华中杯 a 企业的这个呃模型呢,就是采用这种算法的啊,让我大家看下这个代码吧, 这个难度确实比较高啊。呃优化算法 给大家看一下啊,这点我们的步骤四,我其实采用的就是这个组装码的优化啊,仅仅是一个单元格呢,就得有上千行代码啊,呃,难度非常高。然后呢包括这个乔三的过程呢,也非常的复杂 啊,简单过程也非常复杂啊,比如说这里有啥携带总次数可以调整啊,呃,然后呢有各种破坏比例啊,然后算子的权重的更新啊,对不对这些东西,然后我当时跑这个代码呢,呃也得二十多分钟时间啊, 但是呢他的正新性呢,是极高的,这也是我们目前工业界以及前银的奇康论文里面解决排放问题的一个顶尖的算盘框架,就是没有比这个算盘框架呢再高级一点算盘框架了,顶尖了已经已经封封顶了 啊,所以它的得分潜力是非常好的,我们如果说能够满整复现出复现出这个算法呢,并且是给出它合理的一个多项曲线,那么在算法的复杂度会是什么样呢?啊?是天花板级别的啊,天花板级别的,所以我后续呢也会尽量去采用四十亿大整数的算法呢,去求解这道题目。 好,那么整个这个 b 题目呢,大的思路就是这样了啊,但是根据我刚刚给大家讲解这个思路,哪一个能够看到? 呃,如果我们采用高级版思路去进行解的话呢,我们知道其实这道题目呢也没有那么简单啊,就说尽量想让帮助大家获讲话啊,然后呢去做出一些创新点出来,然后采用一些高级的模型和算法呢,难度还是比较高的啊,但你要采用基础的算法,那这道题确实是非常简单了好, 只不过那样的你也只能够拿一个基础分呃, ok, 呃,那么这大概就讲到这里啊,我们后续呢也会去完成这个 b 题,我们完整的原创论文以前的代码和结果啊,就是根据我刚刚讲解的这个思路去做 啊,预计呢会在明天也是四月二十六号的早上左右就会更新完毕啊,还是跟我以前说的视频一样,呃,我现在发布这个视频呢是选题建议做题的思路视频,那么之后呢就会有一个完整原创论文和代码结果的讲解视频了啊。呃, 大家可以期待一下。那么关于这个完整原创的混合代码的说明呢,大家可以看这个视频的评论区。呃,大概就讲到这里吧。啊,然后这个视频呢,你们也可以转发到你们的队友群里面,所以呢,队友呢也需去商讨一下选择题 啊。呃,然后呢,包括这个作息思路方面啊,假如说你不是你们队伍内负责建模或者是编什么队员,也可以和你的队友呢一起商讨着来啊。呃,一起看下这个视频。那么有什么地方有没有听懂啊呢?大家可以退回去再看。呃,就说这么多吧。啊,谢谢大家。

好,我们给大家录制一下赛踢黔西。呃,最近感冒了,所以声音确实给大家听感来了不便, 但是后续大概是我们会有两到四两三次更新,第一次更新就是这两天,我们要完成这每个问题每一问的四十种左右的球法,然后给大家写论文, 然后到了五一之前吧,我们会再录一个视频去讲解一百多种球法的讲解视频,给大家扩宽一下思路,那个时候声音就能正常去听了。啊,我们这个视频的目的是干什么呢?进行赛,赛季前夕,虽然说这个比赛半个月很长的时间,大家可以慢慢悠悠的去选题,但是还是尽早确定选题, 这样你会有更多的时间去做这个题目相关的东西的。好吧,然后我给大家简单讲一下这次的东三省书法竞赛,难度上来讲,如果去年的是一,今年的可能只有零点二到零点三, 甚至过犹而不及,为什么这么说呢?东三省他之前他确实有点偷懒,也是因为他的他的这个时间设定和深圳杯基本同轴,就会导致深圳杯出的题质量很高, 也是很也很难,他可以拿过来直接用,但是今年深圳杯时间上有点问题。然后我们东方省联赛的本质是什么呢?大家相当于东方省的省赛,也相当于大家每个学校的选高校国赛选拔赛, 通过这个比赛选拔一些队伍去正式的去参加我们九月份的高校设杯摔跤冠军赛。 所以作为这样的目的,我们深东三省联赛必须在宿迁举办,但又没有题,我们又不可能直接用其他省的题做咱们的题,这样确实有点出师无名,所以今年我们就自行出题,出了这么两个题目。 这两个题目难度呢?都不难,而且是基本是近四,一个是偏数据处理,一个是偏优化,看大家的这个什么,那感觉优化我不会,基础优化什么机制的纠结,你不会,没关系,因为这个优化很简单,像现在才过去了一分钟。哦,一小时吧, 基本上你看这正常基础算法的这个结已经全算完了,而且是现在展现两种算法的结, 所以那不要担心说那个。哎,这个是不需要担心的啊,这都很简单,即使这个优化问题它也不难,所以说,甚至于难度来讲的话, d a 会比 b 难一些。因为什么呢? a e 它不好做,它的数据不好找。那我们会详细给大家去讲,然后给大家去看看这两个题目具体的内容。 呃,首先是 a t, a t 就是 给的数据基很大,但是没有甚多用处,因为它只需要看近四次人口普查的情况, 所以包括问第三次,虽然不提了,但是基本也是近四次。为什么呢?因为这个数据的这个类型啊,从第四次之后才开始了一些有公共性的特征,然后第一、二次,甚至第一次大家可以看到是个 pdf, 这个 pdf 的 像素太低了, 如果大家想提取这个数据的话,只有一个方法,走动档,你要转什么 pdf 转什么的话,根本机器是识别不到这些数字的,那就很难受。呃,也是因为这种情况,所以题目一直在要求我们什么呢?前四次, 这样就会简单大大的简化我们的情况。呃,这是第一个,第二个屏幕上我们就说了,不仅限于这些数据,而题目现在聚焦的是中国的一些人口的情况,对吧?具体来讲就是我们第一问,根据我们这个人口的一些基本特征, 对人口区域进行分类。什么叫分类啊?就是比如说我们按省省进行分,分省份进行分类的话,大家可以看到 全国其实有几个省份他们是近四的,所以他们可以分成一类,反之近。比如我们我们的近西北啊,我们的鲁经济啊,就是这几个省份的人口特征是近四的话,那么我们可以把它用一一个 分组,应用后续的同针对于这个区间进行一个预测。进行一个什么?因为他们有近四的特征,所以说第一就是想把全国一些近四特征的地区给他划分成一类, 然后基于这个类别,我们再开始问题二的一些量化处理啊,以及问题三的一些预测。为什么呢?比如说我们路径记这几个地方,他们的地形、地貌、人文特特貌都基本 相似,所以这个时候你把它们用一个预测模型会比较好。你得说了,基于不同的这个类型建立不同的这个模型,就是因为他们这个地方的人口特征相似,所以就可以建模。哎,这是问题三的建模到问题四,对吧?我们需要量化, 有没有量化呀?呃,人口的发展大会发现,现在人口发展其实并不是太理想,有点抑制。那我们需要有三胎政策,此生人到后来有五胎政策鼓励人口,那么这样政策发布之后,对这个人口变化是促进呀、减少呀,其实这个地方是很复杂的过程, 因为人口的发展现在和经济、人文地貌完全息息相关的东西,所以我们题目现在收集的这各种各样的这个人口啊,城乡这个是不够的,为什么呢?因为经济特征,呃,宏观特征根本就找不到,怎么找呢?很简单, 大家可以去直接搜索统计年鉴或者叫什么,然后点击这个国家数据,就会到第一个网站上来,我们这个前面这些数据都不用看,因为什么呢?他们是国家的,这个红包数据你基本找不到。我们这地方要分组,要分成分地区, 然后就目前的数级来看的话,我们只能按着三十四个省级行政单位去分,就是我们按着省去分,你说我不行,我就是这个青岛市市南,我就要把青,不光要分,我还要分特分。就比如说我们像数级级的这个什么一样, 这个四看四谱啊,看四谱的话,四不是就是看看七谱吧, 各线对吧?我要按着各线式去分,这么去分,这么去分不是不好,有什么坏处呢?呃,我们需要找到每次统计年统计人数的时候,对应这些线份的各种各样指标,我告诉大家基本不可能,那你就说我就想做的最好, 而且确实按照省区分的话,这个省的人民地貌线差别很大。哎,确实如此,你可以按照市区分,但这样你的收集数据难度会更特别大。你需要收集多少个呢?两千,将近三千个, 我国一共的大学就有三千所,基本就是每一个县章有一个配套的群,所以它的收集难度 很大,我不会给大数据,我说,我实话实说,我不会,而且收集出来的话这数据基也误差很大。但是如果你想做的最好,那确实就是按着省县市进行划分,但是也没那么,其实这个题大家就按照省去划 分,就收集这些省的这个人口已经给已经给大家了,对吧?包括可以看我们这个人口普查,对吧?我们七普的话已经给了大家人口的结构, 就包含这个总各地区的人口男女比例,看这个这个都是这,这是宇宙,这是人口的性别,这是我们第七步的一个个的年龄段组成受教育情况,但这些是不够的, 因为这个生育政策,他和和和政府的政策呀经济相关。所以在刚才给大家看的这个里面,我们也可以去找,比如说我们可以看着综合的这个法企业人数可以代表着一个地区的综合国力啊,你看近十五年, 你看要不找到近十五年这些具体的,你看我们走每一年的一个法人数量,这个可以代表一个指标来代表这些。呃,这个当地的经济程度,他比如人口或经济的话来看每一个地区的生态统治,这是 gdp, 这是更需要的,因为整个经济的 gdp 其实是和嗯,人口息相关的,对吧?然后再去找把收入情况、支出情况 以及我们的纠结情况,包括其实我们有一个稳定的就就业率,那么就喜欢繁,繁衍后代,这可能会更多一些,所以就这些数据基本就去找吧,对吧?我后面也会给大家整理出一批来,我去解析能用到的指标,比如说能源也是,对吧?因为能源 这个能源他确实他也能影响大家的这个情况,然后他发现一些情况是什么呢?有些数据他缺失了,他只能更新到一九年或多少年,对吧?那怎么,那怎么办呢?像刚才那个 他只有一,那我们只能补充他,只不过我们再去补一补,你看这里我们二一到二四年没有,所以就想办法去补补充一下。 我后面会给大家练出来一套完整的,可能会有上百个指标,然后我基于这上百个指标来进行建模,来实现问题一的求解。 a t 的 求解说我们第一步先看一下,再增加要素。增加什么要素呢?很多要素, 很多很多,那尽可能的给大家完备这个问题,好吧?这个是 a 题的一个情况。呃,具体的思路我们后面会给大家找完数据之后,详细的给大家去这个做更详细的思路哈。但是先找数据,然后后面基本上就按照这个网站去找, 但是缺的数据我会给大家讲怎么给它补充啊?这是我们下个视频给大家做的事情,然后这是这个 a 题的,然后 b 题的。唉, 如果大家没做过树模的话,毕竟很难,你可以看。哎,我们要生产这个,这个其实很有意思,对吧?我们其实在生活,生活在我们实际生活中是很容易能出现说我们有十天的这个展期,然后有十个组,每个组需要聘请施工,那么怎么聘呢?这里有很多要求,每个凌晨工每天只能工作八小时, 那么一共多少时间?从八到从八点到十九点是每天十一个小时的时间,他要工作八小时, 所以中间有三小时的休息时间,其中四小时是连续的。有的说中间的三小时休息时间是你自行决定的,就是我,我们四三四或者是四四三, 或者是三四四随便,反正就三小时休息时间,同时十天内每一个员工必须工作休息两天,他累怕累死他,对吧?这个比如说第一个人,第一个员工他可以前四天工作,后四天工作, 那么这种两天休息在各种各样的情况,因此我们给出了十个组十天的所需要的,这是这是需要的人工数。那现在我们去看一下第一个,每个组 有有要求什么?每个人只能中一个组,那么进行一个排班,哎,出来个问题一的结果,这就是问题一的结果, 问题一,问题二,问题三的结果,以及每一个每一个结果对应的对应的这个这个人数, 你看都给大家列好了,其实已经 包括每一天实际的总的出行人数呀,以及这个情况呀,以及最终的这个 基本情况都给大家。你看,你看第一天每个时间段多少人出班,对吧?其实不难,而且也很简单,我们后面会给大家讲完这两题都不难,但是如何能做好数学问题,这也是我们后面在录视频的时候给大家讲解如何能够在这个题目上做的更好一些。 好吧,那我们就先这样下一个视频,我先给大家讲 a 题的数学上做的更好一些。好吧,那我们就先这样下一个视频,我再给大家去找一找,进行完善完善。

好,我们给大家去录制一下东三省 a t 的 数据问题,因为 a t 一 直需要补充数据,但是数据的获取其实一点也不难, 就只通过一个网站,我们中国自自己的统计年鉴,统计局发布的,大家可以搜索统计年鉴给大家展示过,然后来到这个界面叫地区数据,因为我们要分地区嘛,就按着省份去划分。那么大家如果直接点到这个首页的话,他有一个年度数据普查数据, 然后普查数据的话,大家可以在这里去查验我们第六七五次的具体数值, 这个是比给的大,给大家的那个其实会更轻松,看你又用不下来啊,大家可以用这,因为这个可以直接真的很舒服,这种是比给他给的还舒服的,这是其一,其二就是具体的数据,比如说我想看一下某一个省份具体的数据怎么看呢? 哎,我们在统计文件里面点开数据都是这个, 这里有地区数据,对吧?那么就分年度数据,而我们四次统计年建的时间分别是九零年、二两千年、一零年和二零年。而这里有个事实,什么事情呢? 香港、澳门回归是九七年和九九年回回的,然后重庆直辖市的车里时间是九七年,然后因为统计年建上并没有香港和澳门的数据,所以, 嗯,哦,没,没设时间,要设的时间是一九九零至二零二零一九九零, 他要给我们呈现这四十年的时间,那我们只选举二零年、一零年,呃,零零年和九零年就可以,然后它这里其实是三十一个省级行政单位,包括重庆, 所以就没办法,那为什么没办法呢?还有一个词,就是同一年间里面重庆的这个时间哈,大家可以注意一下,是这一行,对吧?我们来 有几个指标,就重庆是有数据的,就是重庆虽然是九七年建立的,但是它前面其实有几年是有数据的,我不知道为什么,但它确实有几个指标是这样的。 然后所以说我们是按三十一个地区去算,不是按三十三个,因为三十四个的话,包括台湾,台湾这里也没有,香港、澳门也没有啊,不是政治错误啊,就他就他就没有,所以没没一点办法,没有 就按三十一个算。同庆的话,我们第一次、第四次人工普查给它查一下就可以,所以就可以选择一下。因为我们这里有所有的指标,包括出生率、死亡率、自然率、平均寿命以及这个人口数、户数,这些指标我们都可以直接使用, 包括我们需要补充的能源、财政、经济、人口、生活,各种各样的指标我们都可以自行粘贴、复制。 所以对于问题一来讲, a、 a、 e, 不 不一一一直在说说,我们要补充数据吗?你想补充什么样的数据,你就补充什么样的数据。所以我现在正在给大家做的一个数据,就是想把所有的数据给他放到同一个表格里面去,方便我们后续的处理。这个正在做啊,但是还要做很长的时间, 因为一开始我想让豆包做,发现豆包豆包做的还挺准。准是什么准呢?人口很准,然后除此之外其他的都不是太准, 所以就只能后面大家看到。其实这每一页都在更新嘛,因为我都在人人工的去找人工去换,因为豆包给的是差的很多。差多少了呢?给大家展示这个这个精度误差哈,快快气死我了。 就是比如说这个人口性,人口这个性别比例吧。呃,其实北京的一零年的人一零年的时候性别比例其实是低于一百的,但是多包给我的是一是一百零六, 就就是这么大的差距,所以还是说自己在这个官网上自行拷贝的数据是最踏实的。好吧,那大概就这么的数处理方式。然后这个网站我再给大家进入一下啊,我们就直接搜统计年鉴, 搜完之后大家不要点官网,因为点官网的话我们进不去,进不去这个这个界面我们只能在就是它指的是一个这种界面,你要点击这个国家处点这个地方,然后跳过来之后就能看到我们刚才的那些具体数据值了, 然后具体数据值的话有就是就是这个这个界面,就是,哎,进的好慢,哎。对,然后我们直接点击地区数据的年度数据,因为别的数据都不需要啊,台湾的年这里也有台湾的年年度数据你也可以跳转,但是台湾的数据很有可能和我们正常数据对 不对齐,你知道吧?就是我们虽然很想将台湾划分到我们的这个,你看他的指标太少了, 就比如说我们万一要选择某些指标的话,台湾没有那就很难办,而且单位也不一样,台湾是按台币算的,我们是按人民币算的,应该是不一样的货币,所以,呃,我们虽然就是这个题还是不考虑台湾了,还是不考虑台湾了。 然后比如说我怎么去下下下载数据哈?就是我们比如说我就想看能源的这个数据,那好,我就要下载进 这里,可以选择哈,我们选择一九零零,逗号,二零零零,逗号二零二一,逗号二零二二,确定我们复制一下,因为这个后面我还会用, 可是不是不是,为什么?为什么不正确?是这个英文的逗号, 我不知道这行不行啊?通常我选的它是那个什么,哎,可以了,你看这就有了吧。然后我们选择所有的,就虚拟从北京都有,是吧?这这这正好就用了这四次普查的,你就直接点击下载, 下载的话就可以选择下载,然后需要注册啊,很有就是直接注册这里就出来了。那么这对应的就是我们每一个地方的这个,这未来过去四次普查的什么数据? 这个地区数划分数,这个没用啊,这这个没用啊,因为基本上都没变过,所以就通过这种方式进行下载拷贝就可以了。 那我们就先这样,我们下一个视频就为大家基于我收集好的数据进行详细的思路介绍。

好,我们给大家录制一个普通的视频,就是我们之前其实在这个网站里面发现了一个好玩的点,因为他这个网站更新了吗?我们最终得到了一页这样的表格,就是很,我觉得很很很不错了啊,就是 包含了我们从一九九零年到我们二零二四年,逐年的我们三十一个省份的六十多个指标,做做做了一个汇总。然后这个表格是怎么来的呢?这是完全真实无物没有编的啊, suv 这个网站, 哎,错了,这是这个网站,因为什么呢?这个网站现在多了个新功能,我也是近期,近期刚发现,就是在,哎,哪呢?我想这 有一个高级查询,那我们就是想,就比如说高就高级查询,我们就可以把我们想用的指标,哎,给它都都放进来,出生率啊、死亡率啊、人口总数啊, 对吧?城城镇沉没的,然后包括各种各样的指标,放下来之后这是指标,我们还可以选地区,我们可以选全国的三十一个行行政单位,少了谁呢?少了台湾、香港、澳门,因为那数据不好收集好,收集完之后我们可以第一直接点击查询数据, 他就会得到以指标名称命名的三十一个指标,或者是我们以指标每个地区来命名的具体的,然后我们选择时间选择的,是因为我们是跨了四十年嘛,一九九零到二零二四 财务指标的,得得到北京市的这些指标数据,然后其实我一共下载了六六十五个指标,我在选择过程中很多了,因为我觉得每个指标都有点关系,我都先下下来,不管它有没有用啊,那么基于这些指标的话,我们需要给它做合并。怎么合并呢?我用的笨方法,大家可以看我的下载记录, 我是全部都下载了一遍,为什么这么下载呢?因为是我让 ai 写了个代码,大家也可以知,这个代码是我们在完整版资料里面会有,但现在还没更新哈。就是 就是这个是放你的输出路径,然后这个是放你的存储路径,包括它的时间、年份啊,以及缺失率的余值。为什么缺失率?因为这些数据都不群,我们要它有一定有缺失,我给它补充了一下,我然后就是把这些数据做了一个合并来,我们可以直接看运运行一下啊,就是 他可以直接就是合并了我们刚才三十一个表格里面所有的数据,然后提取并且处理金额差值,最终得到一个表格。表格什么样呢?哎,就是大家看到这个样子,那么大家拿到这个表格再去处理就很简单了。好吧,那就先这样,基本这两个视频就能满足大家。呃, 东三省的数据学校,然后你会问,哎,为什么你找这么多的数据,不是就四个数据吗?我们下个视频会来讲,这里是到我们解题思路了,因为这个题的解题思路不简单,好吧。

好,我们给大家去讲一下 b 题,因为 a 题现在还在收集数数据阶段,呃,得由数据来决定后续的建国,所以我们先讲 b 题。 b 题从开头到现在其实已经写完了两篇论文, 大家可以看一下。这是,呃,这是初稿子,都都算初稿了吧。呃,怎么去说?这个就是 b 题吧,大家如果说知道什么有法莫行,你有很新的思路,那你可以去做,如果不是的话,我不建议做,因为它过于简单就会导致大家同质化过于严重。那么如何能在 b 题里面区分出来谁好谁坏呢?很难。 换而言之,只要你开始做 b t, 你 会发现 b t 都差不多的模型一样的结果,为什么?大伙为什么你差呢?很有可能就变成了一个卷排版卷细节的地方, 这就很难,就是很心累的地方,你知道吧,就是卷心,就是这个地方,他有多少你没多少,所以他赢了,就可能会出现这样的情况 做的。但是你觉得 a t 你 不喜欢,不想做 b t 就是 你擅长的领域,那就可以做,你也可以听听我讲的东西。好吧, b t 本质是一个很简单的就是任务安排调度问题,就是我们要看每天有几个人去干,去干这个工作,仅此而已。这个题目给大家读一下啊,就是首先得有十天,我们十天,每一个分十组,每天有十一个时间段, 那我们招人啊,每每天的这个十一个时间段都有不同的人数需求。嗯,对, 然后我们现在需要招人。招人干什么呢?这个人有也是有限制的,这个限制我给大家画了几个图,方便大家去理解啊。对于这个人来讲,第一个我们这个人一天工作十一小时的话,他只工作八小时,十一点八有三小时的时间窗口, 那么时间窗口就我给大家去,这个就就是刚才直播间有人说是 c 五三,就是一共就就就十五个情况就是我们就是就就是给大家做了一下,就是第一个连续的四,第二连续的四送三个,就是看这个三个小时怎么空出去的, 懂吗?就是这样的,就是一共十天,那么这十天怎么干活呢?也说了 我们有连续,我们必须有两天休息时间,这两天可连续,可不连续,对吧?相当于我们在十天里面选一天,我们再选一天。 c 十乘九九十, 对于单个人来讲,一共是九十种,乘十种,九百种,每个人都每个人都是这样,然后现在每天有多少个?那个具体的需求嘞?谁嘞? 每天的具体需求大家可以看这个表格,是具体的需求的人数没了,这就是这个题目。然后我们看一下我们应该在什么时候去招多少人来?干活 结束了,然后这里的问题的问的是什么呢?逐步的去放缩。问题一,我们十天只能供于一个小组,按组进行 进行售人。问题二,我们每一天只能服务一个小组,但是不同天可以跨组服务。问题三,不可以,不仅可以跨组,同一天也可以跨。我们一问,按照这个优化的话,每一问的这个优化人数应该是逐渐降低的,而且每一问的优化的 结果基本是不变的,我现在用了六种做法,每一种做法的问题一,都是五百七十一,基本就这么一个数据了,好吧?然后你就就简单看啊,比如说其实我们看这个问题 算了。问题一是吧,就是我们要只针对一天干一个人,且不能跨组,然后我们去用十天休息两天,每天工作八个小时,那具体就是一个很简单的整数规划,因为我们就是它的所有的可行域,其实可能只有 十万是百万,可能你跑代码就是你用穷举法的话,你跑一遍最多最多不超过五分钟就全跑完了,所以你可以练出来模型去说,哎,我们这题目有约束是吧?我们就是想看一下就要满足这个所有条件的时候的最后解,你把所有圈穷举一下也不麻烦。 怎么做呢?简单来讲啊,就是我们问什么设什么求基值吗?这个地方有点不算是求求基值,就是是求求人数的最小值,所以就设我们每天需要的总人,就是我们第二第这个组第第天安排的人数是 x, 所以那么总的招募人数就是 n j, 所以 我们最终的目标就是让这个 n j 加核最小,这是我们总的目标。那么基于这个目标,这个 n j 这个 j 它是有具体的取值范围的,有各种各样的约束,比如说需求的约束,我每天的这个需求对于大于等于它的需求数 出勤的上限就是我们不可能大于,呃,我们每不能超过他的总的招募数,然后必须休息两天,每天时间约束等各种各样的情况做一个总的约束。相当于我们在这个可行域里面组成了这个可行域,在他的里面去求我们这个的最小值,哎,出来个结果, 这是我们每天招聘的人数,这是公时了啊。我妈成,我这有长的时间,所以空,所以很大。这,这个不仅仅是那个什么, 可以看这个什么,然后这是问题一,问题二,跨小组,对吧?很,对于我们在语言的基础上,依旧是刚才的目标函数,只不过是引用了一个那个跨小组的一个什么,在这里最终出出来的结果是少了十个人,对吧?包括这些代码里面其实都有详细的描述, 以及基于这个代码写的一篇论文,然后这个论文的话已经发到群,大家可以直接下载,目前写了六种方案。 嗯, bit, 这是给大家看的那篇论文,这是看的那篇论文。那些格式化了, 就是代码的话,没写 matlab 的 时间,时间不太够,又又会写,就直接运行。如果出现我们具体每一天应该怎么去做以及输出的结果,你看,我们也读取了这个表格。一,每天的最小需要时长,然后进行纠解,输出了具体的值,它很快。因为这不是个很复杂的问题, 所以 b 题你如何能做的更好呢?我不知道啊,很难就变成了一个卷席,比如说你这里,哎,你这里有个空空行,他没有,所以他比你好,嗯,可能就这样,甚至于我们要上运筹学的话,这种题都可以手算。 我不知道为什么出了一个这样的题目啊。问题三,演示,问题三,相当于我们在语言的基础上 就是再加了一个跨休息两小时的约束,以及每天可以跨两组,依旧是各种各样算法。然后就是每因为我们是两个四小时嘛,对吧?我们可以 就有很多种可能性,对吧?一个是给他列个可能性,就是我们中间修两个或中间修三个,或者中间修两个,他们可以跨组来实现不同工作块的一个调动。来说说结果,呃,也不复杂,反正依旧是设了一些函数,大家可以直接拿这个文档去看, 然后结果的话也是的,这是这几个,然后大家看到我们如果大家拿个代码的话,哈,有一个 q 一 到三退一,然后到 t 二, t 三, t 四 t 五这意思,没有了不同的方法。为什么呢?因为这个题目太太简单了,我想能不能改改算法, 哎,用了很多这个题目不该用的算法,甚至甚至于像这个财经啊,模拟推理和 这种东西是不该用的,因为他不该适用于整数规划问题。但是我就想看看他会发现这个收敛不收敛。为什么不收敛?因为他一开始就已经取到了结果,所以他根本不可能收敛。 嗯,咱也没办法,就是想快,就是想算换换算法,给大家做更多的呈现,但也就这样了,所以这个题目想做的好,除非是你能找到新的切入点,要么就是比排版你确定你的可能性更美观一些,结果呀,模型啊,都差不多, 可能是我确实肤浅了,没有读到这个题目更深的地方,后续大家如果说有更新的认知的话可以指出来,然后我去点个心,好吧, a b 题就先这样,然后我再去给大家写 a 题的思路。

数模竞赛小白想拿奖到底有没有捷径?作为数学建模,国赛、美赛大满贯选手,建议大家呀,千万不要被三天拿过一的毒鸡汤给忽悠了。今天呢,给零基础的萌新彻底攻克信息差,一文讲解建模的全球城,照着做,至少能够帮大家少走半年的弯路。 首先第一点就是我们要搞懂游戏的规则,数宝比赛说白了,那就是三个人组队,在几天内呢,用数学工具解决一个开放性的问题。最后呢,交一篇论文就可以了, 我们要重点关注国赛、美赛、华为杯这几个高含金量的赛事。团队呢,有黄金三角,分别是剑魔手、编程手和论文手千万不要瞎选。剑魔手呢,负责大模型的骨架,编程手负责跑数据,论文手就负责把故事讲漂亮,各司其职才能够赢。 第二点就是要准备好三把斧了,编程手,我们要把 python、 metlab 的 环境搭配好,代码都能够跑通。剑魔手呢,要去了解经典的模型,什么遗传算法呀,预测评价都是要知道的,要知道有哪些武器能用。 论文丑呢,就是要把 word 的 排版要先学好,高阶玩家可以直接冲拉特斯克,排版丑真的会被评委直接挂掉。当然,给大家准备好了,往年数模的优秀作品和论文模板都在这里了,直接全部打包带走。第三个就是拿奖的隐形基因了, 评委呢,看论文非常的快,所以摘药呀,是命根子。其次呢,好看的图表能够救命,数据啊,可直观,做得好,印象分啊,直接拉满了。还有千万不要忘了做精准度分析,这是检验模型鲁棒性的生死线, 不做这个模型啊,非常的容易崩。第四呢,就是实战七十二小时的一个作战图了,前十二个小时,我们要疯狂的去查文献,查模型,比如说用谷歌或者高阶搜索都可以,我们去找找建模的思路。 二十四小时呢,我们把模型的框架搭建好,算法呀,敲定好四十八小时,要做一些模型的交叉验证。写完出稿,最后的五个小时内疯狂的检查格式,参考文献页眉页脚错一个标点符号都有可能,让我们同时大讲。 最后呢,提醒一句,千万别忽略了数据库处理垃圾数据放进去,模型直接报废了。所以关于组队或者是模型的选择有问题随便问,打起见!

欢迎大家关注我,收看我的频道,我是小凯, ok, 那 么新的一天即将开始,这一天怎么开?我的答案是七三开,因为我的生活七分欢乐,三分平淡。 说实话,再不更新,感觉真有点说不过去了,但这几天事情确实多简单,跟大家捋一捋吧。 首先是五月八号的数学建模大赛,就是我拍视频的这一天。怎么说呢,我个人对这个比赛还是挺感兴趣的,会不会作另说。 之前有一期乌拉提到过,原则上不允许大一学生参赛。起初我以为是因为我们的知识储备不够,限性代数和概率统计都还没学, 但后来才意识到还有一个原因,我们在新校区,学长学姐和指导老师都在老校区,跨校区沟通很不方便。昨天数学建模开了赛前会议,老师说原本应该线下进行,但考虑到有一组大一学生在老校区,就改成了线上会议。 不过指导老师的作用还是得落到实处,老师会在比赛期间的某一天专门来我们新校区开线下答疑会, 看看我们的课表吧,上午一节物理,下午一节物理,中间加一节体育。哎,现在这个体育是真的恶心,还得学太极拳,本身英语单词就背不下来,现在倒好了,还得背那个什么二十四十,一天不复习就得忘的干干净净。 我们现在出发去上体育课了,把书包直接放到上完物理课的教室了,反正我们上完之后,这间教室就没课了。其实最开始我是不知道的,我以为我们这节课上完了,别人会利用这间教室接着上别的课。后来我看别人都把书包放到原位了,才知道 我也放到原位了,正好为下午占座位了。上体育课最大的好处就是离食堂非常近,下课就可以直接冲向食堂。 中午吃完饭赶紧回寝室,趁着为数不多的时间睡一会,然后下午继续出发上物理。 今天虽然是周五,但实际上我们就当周四上就行,因为我们明天周六会补周一的课,算是五一调休。 上完物理课我们还不能直接回寝室,还得出发去听一个 ar 的 讲座,虽然我不太愿意听,但是强制去也没有办法。说实话感觉没什么用, 数学建模的题马上就发下来了,然后我现在出发去找一个空教室,用于我们讨论题,一会晚自习我们会上一会,等自管会查完之后,我们就直接走,就不请假了,太麻烦了。 现在快夏天了,天黑的是越来越晚了,以前冬天的时候这个点先不说有多黑,至少不会像现在这么亮。 然后呢,我们今天把第一问的思路大概弄出来了,派上元码都已经写好,明天起床在上数学课之前,我们把论文写好,然后下午开始着手第二问,我觉得我们的速度还是很快的。

好,我们给大家讲一下论文的问题,大家通常都是先写代码,然后再写论文,写完代码之后,论文怎么写呢? 其实在 ai 年代基本已经不需要手写了,我给大家讲一下啊,我们通常是把代码和题目发给 ai, ai, ai 提示,比如说我们的摘药要求,我们的模型假设要求,我们的方方面要求,以及我们证明要求。说基于代码写出公式加文字描述,崩分条,崩分段,怎么怎么怎么样, 论文给我们写出非常符合书页建模、论文规范的东西。而我们就用了一些智能体,在不同的板块,用不同的题词,用不同的 ai, 基于大家的代码和结果能直接生成一篇论文。 比如说,哎,展示了啊,这样的一篇物, pdf 论文, 你看只用十分钟就可以输出出来。再比如说大家能看到这样一篇 word 论文,也是十分钟, 所以这个虽然不能直接提交,但是大家改一改,或者参考这个去写你的论文,把这个东西出稿,相当于你的起跑线百米起跑,你的起跑线在八十米,而你对手在零米。 那么怎么能使用这样工具呢? for, 包括我们给大家很多代码,你说你完成了你的代码的组合,同时你把我的代码里面的格式化改成你的格式化,那好,就要出结果了,那要写内容,写用中文呢?你需要一个初稿, 这就可以生成两个工具。这两个工具我们都放在了群公告里面,一个是 pdf, 一个是 word, 它俩不太一样。 word 的 这个需要自行排版,排版是麻烦事儿,但是公式是可以编辑的。然后 pdf 的 这个,嗯,它用需要用 latx 语言,需要有 latx 基础, 所以可能需要有一点入门门槛,但是你只要不会,你也你也能用啊,所以就基于这两个,我给大家讲一讲。第一个叫做暮光 paper, 这个这是我大家进到首进,进首页之后哈, 可以直接选择这个第一个,因为后面这几个都不合适你国国赛,这个就可以选择四问,对吧?然后我们把 把题目复制过来,是,然后复制过来之后,我们后面就复制问题结果而化。那么对于问题来讲,比如我们问题一,比如说哈,我们选择运行了一个 q unit, 是 两个代码,我们先降维啊,我先选择降维的结果,我把降先降维的我们代码复制过来,会有一一二,对吧?那么降维之后呢?我还要运行那个句类,是吧?我先把降维的结果复制一下, 这是降维的结果,复制, ok, 然后降维之后再句类,那句类的话就是 q 一 二一或者 q 一 二二降消降维方式,这是层次层,层次序类,我们把代码 复制进这个代码框,然后把这个结果复制进结果框, 然后我们要放上传图,好,你就直接点击上传, 我们刚才选择的是 q 一 二一和 q, 呃,一二二,对吧?那就找到马北,不是马北,华中北,华中北,嗯,东三省 这个题 s 就 找是 q 一 一一二一,对吧?先找 q 一 一二,这是我们降,这是我们降。哎, 这个这个这个,这是我们降维的,然后 q 一 二二,这是我们最终分类的, ok, 图复制,然后这里需要上传图片的说明,大家可以写中文自行描述,或者你直接复制这个图片名称也不是不行, 反正它这个工作流的 a f 自己识别。好。问题一,问题二,是吧?问题二,我们一起给了大家三套三套代码 q 二啊 q 一 都可以自己选择,比如说我选择 q 二, q 二呢? 我选择 q q 二吧,我们直接把这个结果复制,呃,先把代码复制一下,那么那个结果图先等一会,先让它跑着点,然后我们先上传 q 二二 q q 二,呃,这几个图 上传,呃,这个它会覆盖之前上传的这个名称,你会,你要改一改,要不然它会报错,然后问题二的这个结果出来了,对吧?那好,把结果一复制。 哎,大家会发现超次数限制了,所以你就要删,你找一些只放最关键的结果就可以, 这里需要你去选啊,你不要像我一样乱删,我是为了快好,这是问题二,问题三,也是问题三,我们之前选择的是三三一和三四三一一三四四一是一样的,所以就选择我,我选选择这个, 如果我们选择算了,就是三一二吧,对吧?如果我们选择三一二的话,那我们要选择 q 四 e 二,就是一二一一二,它们是对对应的,然后让它去跑,然后我们在跑的过程中,我们选择导入三一二 q q 三一二。 insert 上传好,我们给它命名 v d, 结果它会很长,所以我们就复制一点点意思,意思就下了, 这是我们这个 v d 三 v d 四,我们要选择一二了,那我们 v d 四要选择一二,这样保持它目目前的一致性,对吧?那好, q 运行,然后复制这个结果 四一二,那选择四一二的这些图。 q, 四一二也传,要不然图太多了也也不好看。 ok, 那 我们只要把这个结果一复制, 看字数超了,那我就不管它超不超啊,我现在直接生成快报错错,我们现在字数超了,那我就应该删字数。 ok, 可以 了,这里这里这里,看这个图刚才是没上传上去,所以它会不显示, 看会汇报错的,应该应该会报错的吧,你看汇报错,为什么呢?因为这个图没有加载出来,所以就需要我们重新上传一下。这问题三是 q 三一二的图,对吧?找到三一二, ok, 再生成确定它就会没问题了。 ok, 你 看等五分钟就可以输出 pdf, 就 能输出什么什么界面呢?哎,这样的界面 就会直接得到一篇 pdf, 以及对应的这个编辑框,我要在这里编辑,比如说,比如说哈,我这里 这个以量化各因素,对不同类别区域人口规模,不是规模,是人,是人数。那我怎么改呢? ctrl f 找到这个地方的编辑的这个是规模,改成人数。 我们直接打拼音,然后刷新,这个时候这个 pdf 会语音随之更新,包括插入图片叉,三页表叉公式这些都可以,其实这个只要一看基本就会了。然后这个时候如果我们再去搜索 的话,你会发现 这里看我们刚才变的,这里也变了,它的一个实时就是它是一个能编辑 pdf 的 一个动态, 这是 pdf, 然后 word 的 这个其实也挺简单的,就是我会给大家卡密,呃,大家就就是直接来找我领卡密,卡密之后,然后你第一开始把卡密输进去, 然后查询这多少次数把题目,这是一定要做的哈,一定要做题目上上上去它会读这个题目,让 ai 都知道这是个什么题,然后再分析题目,分析题目之后,然后你再问题实现,它会给你一个思路,然后这个代码你可以跑,可以不跑, 因为我给大家卡密,没那么多次数,你跑二点五的话,这个这个代码基本可以直接运行,但是你没必要因为我们有代码了, 对吧?所以我们就可以直接跳过代码的这个板块,我们直接来这里,一般我给大家你选择的这个代码上传上去,结果用 t t x t 本文档保存,再上传图, 可以点击生成,他会直接给你编辑好了问题一的模型,建立求结,然后问题二的、问题三的以及最终的这个摘要模型,假设的这是 word, word 都是 word 文档,然后我们最后再编写成大家能见到的这样的 word 形式, 所以有了这样的 word, 有 了这样的 pdf, 有 了这样的初稿,大家再去写论文就很简单了,好吧,这就是我们的论文全流程之作。

宝子们,我来了!这一期就给咱新手小伙伴好好讲讲全国统计建模大赛该怎么准备。咱先在市场里搜索统计建模,找到统计建模大赛的模板,点下一步,输入论文标题,再点下一步就行,之后就等它自动解锁相关文献。 这一步每次进入小何学姐的写作空间都有点慢,大家可得有点耐心,等个三到五分钟,能看到整个模板的样子了。 接下来咱把自己的想法告诉他,让他先帮咱规划规划这篇文章该怎么写。我这会还没有数据集呢,就让他自己构造一个, 咱先根据这个构造出来的数据集完成文章的书写工作,争取在比赛第一天就搞出一个不错的初稿。要是你想看看他构建数据的操作, 就点开这里的听听,瞅瞅他每次都是咋想的。他还会自己反思构造数据集的情况,比如这里完成度太高,他会自己添加噪音,而且他会直接构造写论文会用到的图, 要是你不想盯着看,直接去睡一觉也成。我整体测试了一下,他完成出稿大概花了将近二十分钟,中间又是做实验又是绘图,还写代码,咱来从头到尾看看这个出稿写得咋样。整体文章的结构和实验的 严谨性基本都符合咱的预期。不过呢,这里有个小问题,图四出现了中文乱码的错误,我给大家演示一下怎么用截图功能描述问题。我先用 clear 命令清空上下文, 让 ai 专注于当前的任务,然后把截图发给他。我还使了个小技巧,告诉他去联网搜索怎么解决这个问题,让他自己修复图片里乱码的错误, 咱能看到他在排查哪些图片有乱码问题,还针对每个图片写了修复的代码,最后权威的效果大家也能瞅瞅。所以在这个过程中,不管他出啥问题, 像排版不对、格式不对啥的,只要你能跟他描述清楚,多利用截图和他沟通,他都能调整好。最后,我也是整理历年统计建模大赛的优秀论文,需要的宝子可以看看下一期的教程,大家想要看啥,欢迎给我留言。

哦, boy 起床看一下几点了。六点五十五了,该起了。看一下我的舍友都在睡觉,我也想睡觉,好困呀。开个灯,收拾一下, 把电脑和配件拿着,开始插电脑, 热个牛奶喝拿铁。 插上键盘开始干活。 做一杯拿铁喝。 拿出热好的牛奶,倒点水进去搅拌一下。 倒牛奶自制拿铁就好了,接着干活。 i apologize cause you are too。 喝口拿铁 i guess you were just understood you know i'm never。 早学结束,祝大家有一个美好的一天。

有没有东北的同学和我一样,每次刷到各种 ai 大 赛 ai 活动,然后点开一看,举办地不是在杭州就是在深圳,要么就是在上海。其实心里想,好像这 ai 活动离我们这些在东北读书的学生都太远了。但我想的是, ai 它不应该有任何的地域限制,它本身就应该属于每一个敢于冒险,敢于去尝试的年轻人。 所以我们决定把东北的首场大型 ai 黑客松落地在长春,他面向所有的在东北的所有在读的学生,不管你是大专还是说本科还是说研究生,不管你是什么专业,是什么计算机,是艺术,是任何零基础的小白都能来。 只要你有一颗敢于尝试的心,你都能来。我们只想给所有在东北的热爱 ai, 想要接触 ai 同学一个机会,一个名正言顺去折腾机会,一个说勇敢踏出第一步的机会。如果你想参加的话,也愿意相信我们的话,就请私信我报名。