粉丝872获赞2.1万

短短十分钟,我们就能完成基本的数据清洗、数据回归以及形成基本的论文。全网二十多万人看我的 ai 自动化写论文的教程,今天他来了, 哈喽,大家好,我是龙博,接下来我将用三分钟时间告诉你,如何不写一行代码,也可以完成一篇时政论文。 我们拿一个简单的主题给大家举例,题目是区域公共品牌建设能否促进农产品质量提升。基本思路是这样子的,解释变量 x 是 区域公共品牌建设。被解释变量 y 是 农产品质量提升。我们用是否有有机产品认证进行标识研究的层级呢?是城市杠年份层面。大家可以看到 我的桌面上有一个 test 文件夹,我们点开,其中存放着我的这次研究所需要的基本材料。很简单啊,就是一个 date 文件夹,里面放了三个不同的面板。 一张面板是解释变量,区域公品牌品牌建设里面包括了省份、城市年份,还有这个公共品牌的名称。第二张表格呢,被解释变量,有机产品认证,它包括了省份城市认证证书的编号,证书的发证日期以及到期日期。 第三张表呢,对应的是城市层面的控制变量,已经清洗成了城市杠。年份层面的数据包括人均地区、生产产值,户籍人口呀等等等等。如果我们手动处理啊,这里面就面临一个问题,三张表格,它对应的是三个不同的层级。去公共品牌,它是品牌层级的 有机产品认证呢,每一条对应一个证书,只有城市层面的控制变量,它是城市更年份的,我们需要把这三张表格都统计成城市杠年份 level 才能进行回归。 我这里已经给大家准备好提示词了,直接复制就可以了,只不过呢,复制之前要加上我们徐博的一个专门的 skill 们,输入美元符号,然后搜索 徐博 academic 就 可以了。这里提示词是这样子的,基于我们指定的数据集进行研究,其中解释变量,被解释变量,研究层级还是我们出示的研究思路。最后呢,我补充了两条额外的要求,将结果插入可以翻译的 la tech 门稿, 并补充上下文,讲解研究思路。同时呢,不要问我任何问题,一切按照你认为合理的方式执行,因为我们在拍视频嘛,我们希望这个整个流程更快一些。 我们可以看到这个左侧正在运行 codex, 已经在读数据集,并且已经在构思研究思路了,运行各种各样的 python 代码,它要读取我们的 excel, 了解 excel 里面到底有哪些对应的字段,以及如果构思研究的话应该如何构思。 因为我这里是在给大家录视频啊,电脑的温度比较高,整个运行起来会还是比较慢的, 大家可以看到,目前这个 ai 已经做了非常非常多的研究了,它已经了解了基本的这个数据结构。 接下来呢,他在执行啊,我这个我 skill 里面提到的步骤,比如我要生成这个年份面板,以及我要完成这个数据的清理和数据的分析,我要把这个文稿直接音符的到这个结果表格当中来形成的文稿,同时还要补上研究背景,识别思路变量定义等等等等。 好,大家看到没有,它又生成了一个度分析文件,度分析文件啊,我们可以在这里面看到它度分析文件的这个,呃,具体内容,它的改动内容有哪些?对于一些关键的操作呀,它会征得你这个使用者的批准, 比如说这里面谈到啊,你是否要执行某个命令啊,觉得一般都是默认批准的。这里面我就不得不提一个我们后面会给大家提供的一个点啊,就是 codex 操作 stat 有 一个非常重要的工具,叫做 stat mcp, 只有安装了这个对应的 state mcp 之后呢, codex 才能直接读取这个 state 的 结果,并且直接运行 state 代码。大家可以看到啊,我自始至终从来没有打开编辑过任意一行派放代码编辑过任意一行 do 代码。 但是大家也已经看到了,我已经有两个基本的文件了,一个是 analysis 文件,另一个是基本的数据清洗文件, codex 已经帮我生成,哎呀,只能等待了。 大家可以看到啊,目前这个已经生成到点 pack 文件了。 终于,总共耗时八分钟,我们得到了结果,核心结论是,在当前六十八个城市啊,二零零八年到二零二年年版没有得到我们预期的结论。这里面 codex 进行了一系列的尝试啊,它会告诉我们的结果, p 值是 p 等于零点五二三,接下来呢是 p 等于零点九五零。我们来看看文稿翻译的结果怎么样啊,大家可以看到啊,还是这个,根据徐博的配置,这个文档其实已经管理好了, data 是 原始文件 program 呢,里面存放的就是我的 clean 文件和 analysis 文件。再之后呢,我们看到这个 menu script, 哎,大家发现没有,我的 pdf 文档其实已经翻译好了, 大家发现这里面包括了我的题目是什么,摘要是什么,研究背景是什么,数据的基本情况是什么,以及我的模型有哪些,我的研究思路有哪些。同时大家发现没有,我的 代码结果已经变成了 latex 表格插入到了我的文档里面来,总共耗时十分钟。通过使用 codex, 我 就已经得到了一个完整的文稿。 这时候有人要问啊,这个徐博,徐博,你这个结果也不显著啊,今天主要是给大家做一些测试,结果不显著很正常嘛,我们可以调参嘛?这里我给大家提供几个这个呃,调参的 prompt 啊,你可以通过更换,控制变量,对变量缩尾等等各种各样的手段, 直到给我的结果。这个时候呢,我们的 codex 就 会使用这个 state mcp, 反复的测试,反复的测试,直到给你显著的结果。当然实在是不显著,那也没办法, 好朋友们,这个未来以来啊,短短十分钟,我们就能从三个简陋的 excel 文件完成了基本的数据清洗,数据回归,以及形成基本的论文。大家可以看到啊,我已经形成了一个这个呃,总共 总共三页的文档,其中的这个表格包括表注是什么,表格的排版已经非常非常规范了。这里面呢,我会跟大家分享一些基本的配置,比如 codex 和其他的 agent 呢,怎么安装?还有这个 stat 以及 m c p 如何安装?