今天说一下 r a g 如何来做快瑞改写的,就首先我说一下他为什么做快瑞改写,因为用户的提问方式就和知识库里面存储的内容不太匹配。 嗯,比如说用户提问非常口语化,很模糊,或者就是问题里面夹杂了很多容易的信息, 那这样直接去解锁的话,效果肯定不好快。而改写的核心目的就是把用户的原始问题翻译成一个更适合解锁的形式,让我们解锁结果更加精准。 那具体怎么做?我就一般用到以下几种常见的方法。第一种就是最直接的查询重写,这个思路就是用大模型把用户的问题改写的更加专业,更加清晰。 然后就比如说用户问某个产品的新版本怎么样,这个问题就太口语化了,我们就可以让大模型直接把它改写成请介绍某个产品最新版本的功能特点,还有性能的提升。 改写之后他的问题就更加规范,嗯,提示时也更加明确,解锁的时候就更容易匹配到相关的文档。第二种就是多查询生成, 这个方法就是把一个问题展开成多个相似但角度不同的问题,然后同时去解锁。最后就是把结果合并,比如用户提问如何提高 ig 系统的性能,我们就可以把它变成三到五个变体, 或者是比如 ig 的 性能优化方法,提高 ig 解锁精准率的技巧。然后就是 ig 系统的性能瓶颈和解决方案, 把每个遍体都去解锁一遍,然后把结果汇总,这样它的覆盖面就更广,不容易漏掉一些关键的信息。这个方法就特别适用于用户问题比较笼统的场景。 第三个就是只查询分解,这个是针对复杂问题的,就有些用户的问题特别复杂啊,一下子包含好几层意思,就比如对比 gpt 和 cloud 在 代码生成和长文本理解上的表现差异。 这个问题它其实包含了两个维度,代码生成还有长文本理解还要做对比,就我们可以把它拆成不同的子问题,然后每一个子问题单独的去解锁,再把答案整合在一起,这样逻辑就会更清晰了。第四种就是做假设性文档嵌入。 这个方法就是比较有意思的,他不是直接改写问题,而是让大模型根据问题生成一个假设的答案或者是文档片段, 然后用这个假设的文档去做解锁。就为什么要这么做?是因为有时候问题和答案的语义表达方式差别很大,就直接用问题去解锁的话,可能匹配不上, 但如果用假设的答案去解锁,就因为语义更接近实际的文档,匹配度就会更高。 然后第五种就是后退提示,这个思路就有刚好相反,他不是让问题更加具体,而是让这个问题更加宏观通用。比如用户问某个产品的价格是多少, 这是一个很具体的问题,但是如果知识库里面没有这个具体的信息,解锁就会失败。那后退提示的做法就是先退一步问一个更宏观的问题,比如这个公司的定价策略是什么,或者是同系列相似产品的价格体系。 嗯,先解锁这些背景信息,然后再基于这个背景信息回答原始的具体答案,这样即便没有直接的答案,也能够给出一个合理的回复。 就在实际的项目里面,我们会把几种方法组合起来用,比如先做查询重写,把问题规范化,然后再生成多个块去解锁,最后用重排序模型对这个结果重排序,这样效果就会更好一点。 关键还是要根据具体的业务需求来选择和组合,就经过不同的测试,找到最合适的方法。 我已经把二零二六年大模型进阶的最新路线整理好了,如果你也想进阶大模型,我可以给你一份大厂内部必读的文档,里边包含模型原理、产品落地、思维框架,内容非常全面,需要的话我直接安排。
粉丝1.2万获赞6.9万

大家好,我是咕噜猫啊,之后前期最近看有个齐博士,罗根,还有什么超级 ip 啊,这种智能体 啊,最近比较火啊,我也去买了一个,学习了一下之后破了墙卖五十多万,确实确实厉害,这东西啊,之后我测试测试,这是齐博士的,呃,很简单,就是把你比如说是我们抖音看到的这一个 这里网络链接啊,比,比如你想克隆一个这种,呃,这样短视频怎么样呢?把这链接复制到这个位置, 点提取文案,他就会把这个所有的文案提取下来,就改写文案,一键改写都是几秒钟的事啊。改写完了以后,你可以上传一个音色,上传你自己音色也好,或者你像克隆的音色也好,或者系统自带音色,点克隆之后自动就把这个文案克隆从这个声音来了, 你可以听一下,感谢一个晚上,三个小时,两个人,罗根和齐博士一晚上卖了一百万八千九百,之后这样克隆丸,这声音只有你在在这里上传一下你的素材 啊,上传一下就形象,就树蛋酿,你还这我的上传的形象啊,随便上传了一个,就别人录的一个形象,上传了以后 在这里选择这个形象啊,选择这个形象,选择完了之后点生成一下就出来了啊,也非常的快,你这个都是几呃几几几十秒就出形成一个一分钟的视频啊,非常的快。 之后在这里你可以这个选选字幕啊,选选 bgm 啊,加个这个,而且还可以涉及下封面啊,设一见钟情,全都是之后 带一句,基本上一分钟内就能生成一个这样的短视频,非常的快啊,只有可以看看效果,大家感谢一个晚上三个小时,两个人,罗根和齐博士,一晚上子木也都是弄好了,原先九百九十一单卖的是短视频口购智能体,我当时一看就乐,这不就是我平时随手搭个扣子加数字真的工作流吗,他们就 啊还非常逼真啊,而且这个口型效果也非常好,而且这是一键发布啊,这里你可以直接选择你的抖音账号直接再去发了啊,是过了年某手啊,什么小红书啊,都可以啊,都是一键发布的啊。呃,确实是厉害,之后我一看网行是多少,这是七九九啊,八九九啊,永久 之后我把这单包下下来以后啊,给它发现这些都是对接的 api 之后我用一个晚上给它对接出来了一个啊,功能一样啊,我改了改页面啊,这这些就给大家免费的去用啊,测试测试,但而且主要是你如果你那个 而且是连的我们服务器的啊,你用的是我们服务器算力,不用你电脑算力啊,如果有想要的哈,可以找我啊,一样的东西,我,我以为很复杂,东西 其实很简单啊,其实这里也拆解一下,这就是一个豆包的模型啊,豆包把提取提取文案 啊,豆包改写文案啊,这是豆娟的一个 api, 这里克隆呢,就应该是个一点五直接就克隆好了啊,一点就克隆了啊,这里数字人是用的,我看我有的用的比较好的叫 infor 什么的,一个 talk mouse 啊,游戏,我感觉效果还非常不错的啊,你自己大家可以看一下这个逼真程度啊, 感谢一个晚上三可以看一下口型,罗根和齐博士一晚上卖了一百万八千九百九十一,单卖的是短视频口锅智能体,我当时一看就乐了,这不就是我平时随手搭 啊,就是就,很简单,就是,其实就是个扣子工作流啊,就他们确实这个价格有点高啊,轱辘毛给打下来了,轱辘毛给你想办法给他给你 给你二创了一下啊,这个我,我为什么不怕不犯版权呢?因为我们都是自己连的豆包,自己连的 indice 一 点五,自己连的这个黑连,或者说是 infomos 这个 数数字人模型啊,自己对接的这个剪映的这个端口啊,直接就形成的,就所有的底层的全都是没有版权的啊,所以说是我们就直接给他拿过来用了啊。嗯, 可以说是,现在我看他已呃,我也准备创品牌,叫咕噜猫呢?还是叫呃某博士呢?都可以啊,大家想用的话可以找我, 感谢一个晚上三个小时,两个人。罗根和齐博士一晚上卖了一百万八千九百九十一,单卖的是短视频口播智能体,我当时一看就乐了,这不就是我平时随手搭个扣子加数字真的工作流吗?他们就套了个好看的页面,于是我用 ai 编程 web 智能体加了老板 ip 文案智能体 能用人寿故事案例背书,还能从爆款文案里提取内容,再搞声音克隆,数字人生城混剪字幕,配素材,解标题,在线调试完直接多平台一键发布,全打通了。另外还做了个爆款视频复刻工具,调用豆包 cds 二点零直接升视频。最牛的是我全程没写一行代码,我不会写也看不懂英语,想加功能直接跟 ai 对 话, 说人话就能改。手里就有两样东西,一是工具本身能直接卖口播智能体,二是教你用 ai 编程,自己动手做业务需要的自动化工具和应用,不用等英语不用懂编程这些我都趟过坑,整理成适合小白 不懂英语编程老板学的方法论。你说我这个价值是不是比那个八九九的大的多?咱们争取一晚上干一百万。

一条视频教会你扣子工作流搭建,本视频共计三十八分钟,我们在魔都里的搜索扣子,搜到第一个就是我们直接点击免费体验的按钮,直接点击免费使用,好,这样我们是进入到扣子的,大家可以看到他又改版了, 直接就来到了扣子空间,他的界面一个通用智能点的界面,好,那我们是要想进入扣子开发这个平台,对不对? 好,那我们直接点击扣子编程,那在这里大家可以看到这是他的一个新改版的一个扣子,也就是我们所说的扣子二点零的一个界面,二点零的一个界面。好,我们随便打开看一看, 这里项目开发里边有各种各样的应用智能体技能,我们在这里都可以看到资源,包括有插件,有工作流,知识库,还有什么提制词,数据库,总之各种各样的都有,都在这个里边, 那我们在这我们切换一下,我切到我的个人空间里边,那在这个个人空间里面,那这个就是我们现在的开发平台这个页面了。今天我们去搭建一个属于你自己的智能机工作流, 你学到搭建的一个能力,你可以结合自己的业务需求来去一步一步的进行一个搭建,最终来解决你的问题。那我们打开这个资源库菜单,在这里我们直接 点击右上角这有一个资源的按钮,右上角这有个资源的按钮,我们点击第二个创建一个工作流,在这个页面就弹出创建这个工作流的这个界面了,我们在这里给它起一个名字,那我们今天要带大家去搭建一个自媒体的工作流,可以帮我们去提取 某音的这个是文案,去改解文案,并且我们能把文案这些内容写到保存到我们的非主流表格里边,那我们给他起一个名字就叫做抖音, 当然这里不能是不能是中文的,我们只能用英文或者说汉语拼音,那我在这里我就用的汉语拼音抖音文案。好,那我们的这个工作流描述是什么呢?你这个工作流是干什么的?用这个你的大白话把这个工作流干什么的详细描述一下。那我们刚刚说了,我们今天这个是想去 提取抖音视频文案,改写文案,并且保存到飞书作为表格。好,这是我们今天的这么一个要搭建的这么一个工作流的一个,这个需求。好,我们直接点击右下角确认的按钮, 这样我们就来到了工作流的搭建页面,那在这里只有开始和结束这两个默认的节点,那在这我们就要在基于开始和结束这两个节点中间,我们去进行一个搭建。那在这个之前呢,我先给大家简单的看一下,我们简单的做一个零线怎么练? 打开点开我们的开始这个节点,我们在这里去输入一个,比如说我们今天是要搭建一个提取抖音视频文案的,所以我们在这里输入一个,比如说输入一个抖音的链接,叫做 url 视频的链接,那这个输入就是输入的这么一个链接,我们 直接把这个连线连下我们的结束的这个节点,结束的节点我们直接把输出出来配置一下,那大家可以看到这就是我们一个非常最简单的一个工作流,我们就搭好只连,把这个开始和结束的连一下, 我们点击运行,我们给大家跑一下,看一下这个结果啊,比如说我们在这里输入了一个链接,或者说我们今天就输入一段简单的一个文字,比如说 大家晚上好,欢迎来到大新的直播间。好,我们点击运行,我们来看一下他能输出什么内容。好,你可以看到我们在这里输入了什么内容,他就在我们的结束的这个节点就把这段内容输出出来了,一字不落的输出出来了。 那当然有些朋友就说,你把开始和结束节点连线完之后,把输入内容输出出来,其实没有什么意义,对实际上确实也没有什么太大意义,但是我们要在开始和结束节点中间来进行一个具体的搭建,要根据你的需求,根据你的业务来去搭建,这样就有意义了。 那我们今天先简单的作为做了一个连线,这个只是让大家初步对工作留有这么一个直观的印象,把它就想象成是一个什么工厂的流水线,我们通过这样的一个连线 去根据你的需求一步一步进行搭建,就好比是工厂你的流水线每一个环节要做什么事情,要解决什么问题,我们来进行具体的一个搭建。好,那接下来各位 你这个作为工厂的厂长,接下来你要做的就是去雇佣你的员工来去完成你的这个任务,那我们就要去雇佣,先把员工 给招进来,再去分配任务,让 ai 这个员工帮我们去干活。好,那现在我们正式开始搭建,那第一步就是雇佣这个员工,我们第一个需求是什么来的?提取这个抖音视频的文案, 那我们在开始和结束这个节点连线的中间有个加号按钮,我们点击他,大家注意看,我们点击他,好,他会弹出这么一个界面,这个界面啊里边提供了各种各样的工具,大家可以看到有各种处理业务逻辑,有输入输出的,还有处理数据库的,知识库的啊,各种图像 音频视频处理的这些工具啊,总之你需要去用什么样的工具解决问题,你都可以在这里进行一个对,在在这里进行一个查找,那在这里我们要去找一个能够帮我提取抖音视频文案的那么一个插件,要找到插件在哪?在这, 那我们第一个方式去点击这个插件的按钮,我们去点击一下,你可以看到这个是什么,这个弹出来这么一个界面,那这个就是整个插件的一个市场,大家可以看到 这里有很多的插件,有很多,那我们在这里可以进行一个搜索,那就是去搜一下啊,通过关键词的搜索定位, 找到你需要的那款插件,因为这里边有成千上万个插件,那成千上万个插件,你不可能这样一个一个的去找,那得找到什么时候,就需要通过关键词的一个搜索,那我们在这里你就可以搜索,比如说跟搜索跟抖音相关的 来缩小一个范围。抖音工具我们去找一找,这里就有很多了,就有各种很多的工具工具箱,大家可以看到非常多, 我们去找一个抖音,我看看,去搜一个抖音视频工具。好,大家可以看到这儿,这儿有一个插件,对,这个插件是我自己开发的一个插件,对,是免费的,大家可以免费去用,现在已经有这个调用量是八点九 k 了,引用量也有二点五 k 了, 用的还是比较多的,看一下成功率百分之百,平均耗时十二点八秒就能把这个文案提取出来,还是可以的。好,我们直接打开 这个插件,你可以看到这里边有有一些不同的方法。好,那我们在这里我们可以直接找到一个什么叫做这个 get video content 的 这个方法通过抖音链接能够直接提取视频的文案内容,这个插件我们直接点击后面这个添加的按钮,把它添加进来。哈, 大家可以看到,那我们的我们的第一个员工,我们就到位了,这个就是帮我们去提取文案的,我们给他改个名字,让大家看的更清楚,我们点这个三个重命名,那他就是我们的第一个 ai 的 员工。对,一号员工,一号 员工帮我们干嘛呢?对,帮我们提取文案,我们的第一个一个员工我们就招进来了,但是我们先不着急来去配置他, 我们先把所有的,我们今天搭建工作的所有需要用到的员工,我们先都先招进了再说,接下来我们继续去添加员工。好, 我们现在有哪通过一号员工提取到文案了?接下来有了文案之后,我们接下来要干嘛?我们接下来要去二创去改写访写文案,所以我们在这里一号员工跟结束的节点中间,我们去 点这个加号的按钮来,我们去添加我们今天的员工。二号 ai 的 员工是上面就是我们的大模型员工,好,我们点击鼠标的鼠标的左键,把它添加进来。好,那这样 我们的这个大模型啊就加进来了大模型,这个就是咱们平时用的这个豆瓣用的 deepsea 也好,只不过你们平时可能是在啊网页里头直接输入这个网址去进行一个访问使用,或者说在你的手机去下载一个 豆包的 app, 或者说第四个 app 去使用,其实我们在工作流里头去用,其实这个原理是一样的,只不过它的这个形式不太一样而已。那我们今天的大模型呢?今天招进来的第二个元宝,我们 给第三点重命名啊,同样我们去重新命名,它就是我们今天二号的 ai 元素,帮我们去改写文案,访写文案赋予它的第二个能力。好, 接下来我们今天先把所有的你作为这个工厂流水线呢,这个厂长,我们先把所有人招进来,再对他进行培训。那我们今天招进来第三个员工是干什么的?好,在我们的二号跟 结束的节点,我们就根据我们的需求是干嘛?我们现在有了文案之后,我们想把文案的,比如说我们想把文案的内容标题,包括之前的 ui 链接,我们想把所有的这些数据,最终想把它保存到飞出的多余表格里边。 好,怎么去操作好?那在保存到飞出作为表格之前,我们需要做一个动作,我们需要去把这些数据进行一个处理,所以我们在二号员工跟结束的节点中间,我们再去添加一个什么,再去添加一个大模型,在这里。 好,这个节点把它添加进来,我们点这个从命名我们还是给他,他就是我们的三号员工,重新念一下名字,三号员工,他是干嘛?帮我们干嘛?帮我们去对处理数据的 处理数据处理什么?数据?处理成你要把人家飞出多余表格去写数据,要要符合人家飞出表格的 规则,规范的数据人家才会给你写,所以我们在写入之前我们需要通过一个大模型来进行处理,所以在这里我们就添加了我们的第第三个员工,就是大模型再给员工,啊来帮我们去处理数据。好,好,那接下来我们 要继续继续搭建,接下来我们就招聘我们的第四个员工了。好,第四个我相信很多,这个咱们朋友很多就已经能够举一反三了。好,怎么去多添加?在我们的三号员工跟结束节点中间, 在连线的中间有个加号按钮,我们点击加号的按钮。好,我们在这里去添加一个插件。什么插件?对,就是我们的飞出的插件。好,刚刚我又教过大家去找插件的插件的功能去点进去。好,但是这次我们 教大家另外一种方法,省事的方法。什么方法?你可以在这里在这个搜索框里头直接输入关键词来去 进行一个查找,比如说你在这里搜索飞书。好,他这里就会给你列出来,对不对跟飞书相关的这些插件的工具了。比如说你可以缩小范围飞书多维表格,好, 那这里在你的插件商店里面,这里是不是就有一个非输多一表格?好,我们点开它之后,那在这里我们需要去添加有个 add regos 这个方法,这个是干嘛?这可以往非输多一表格里头去 插入数据,去新增这个数据。好,我们直接把这个方法添加进来,当然前提你得有有已经有飞出的多维表格了,你已经创建好了啊,当然如果你没有创建好,也可以通过工作流来去自动化的帮你创建这个飞出的多维表格。 因为我现在已经创建好了,所以我这里直接可以使用飞出多表去往里头去写记录,去插入数据就可以了,所以我直接把这个 atrecord 这个方法 添加进来,我们点击鼠标的左键。好,那这样我们把它添加进来了,他作为我们的四号员工,我们给他改个名字,他就是帮我们去写入数据,保存数据到飞出到这里, 我们的所有的员工就把招到位了,大家有没有问题啊?没有问题,我们继续了,接下来我们就要针对我们的一号员工来进行 这个配置了,来进行培训了,所以我们左鼠标左键啊,打开这个就是他的一个配置页面,这个就是他的一个配置页面,大家可以看到我们来对他进行一个配置,其实这个很简单,因为这个插件对我已经给大家封装好了, 你在这里只需要配置两个参数就可以了,我给大家去讲一下这两个参数是干什么的?第一个 视频的链接,这个视频的链接是什么?你需要去提取的抖音的视频的链接,我们直接点击这个小齿轮, 我们找到开始节点,这个输入的 url 是 不是就是你输入的抖音的链接?你要提取视频文案的链接啊?我们直接点击左键把它进一个配置,那这个是不是就没有问题啊?那这个又是干嘛呢?一打一个很长串的一个名字啊,我们把鼠标放在上面,他有中文的一个提示,他是干嘛的?他是告诉你 这里需要输入的是阿里云百炼的 apikey, 那 这个是干嘛呢?那这个就是什么?它就是一个什么 apikey, 就是 一个密钥。什么意思?说?我们需要 通过我们通过用到阿里云百炼的这个大模型来帮我们直接去提取视频的文案提取,用它的一个能力去提取,所以你需要去填入它的密钥,那这个密钥怎么去获取?直接通过去搜索 阿里云百店,我这里就已经有了。在这里你进入之后,如果大家不知道他的官网地址,去不知道在哪的各位啊,你可以看一下我的主页,可以去这个去问我好不好? 我告诉你这块是网址,如果你们不知道去哪找的,看一下我的主页。对,你们进入到阿里云百店的官网之后,他有一个秘钥管理,在这里他可以创建 a p i t, 很 简单,点击它,随便这里勾选一下,点确定 就可以帮你生成新的这个 a p i t, 新的一个 a p i t。 好, 我们直接点击这个复制按钮,我们来进行一个获取。好,复制成功之后,把这个 a p 直接输入到这里就可以了,大家能理解,放到这里就可以了。 好,我们放到这里,那这个就是我的阿里云百变的 ipikey。 好, 那这两个变量有填好之后,我们直接可以单独对我们的一号,一号的员工提取完的员工来进行一个测试。怎么测试?很简单,点击这个黑色的小三角。 好,在这里去,你随便去找一个,这个随便找一个抖音的视频链接,我们来去试一下。好,我们在这里去找一个视频, 在这里我们随便去找一个,我们在这里比如说我们去找一个吃火锅的一个视频。啊,有很多朋友是做这个做团购的,本地生活的,我随便去找一个视频,比如说要吃饭就说随,要吃饭就说随便,哪有 好?比如说要吃饭就说随便,哪有那么多分享。人生在世吃喝二字,要吃就吃好,吃的要好,我们就拿到了他的一个什么, 我们就拿到了一个他的一个分享力,我们直接在这里把他的分享力复制粘贴到这个输入框里边,然后点运行,我们来测试一下,看看能不能帮我提取到文案。好,大家可以看这里是不是已经运行成功了,那我们点这个 输出,这里是不是空的?这个里边这个字段里边就帮我们提取出来的一个文案。要吃饭就说随便,哪有那么多随便,人生在世吃喝二字是吧?是跟这个视频的内容一样,是不是就提取出来了?好,来,各位有没有问题?今天我们的一号 员工提取文案的员工就配着完了,来,大家应该没有问题,对, a、 b i k, 大家自己获取一下,不知道怎么获取的,去看我的主页,可以去找我。好,来各位, 我们继续,那接下来我们去给大家去进行我们的,我们接下来二号员工配置去改写文案,我们左键打开我们的这个大模型,左键打开我们的这个大模型。好,大家可以看到,那这个就是我们整个的大模型的一个配置界面, 那这个模型我们首先打开出来让大家看一下。首先我们去选择一个模型,那这里有很多的模型的列表,非常多,有豆包的二十几个, tipsy 也有很多,还有 kimi 什么阶月星辰。好,那这么多模型怎么去选择?你就根据你的需求灵活的去选择。这句话怎么讲?好, 给大家举个例子,比如你现在就选择一个什么,你需要现在速度比较快一点,性价比好一点的。好,我们直接就选择豆包一点五 pro 三十二 k 这个模型就可以了。好,你想选择能力强的, 那你就用这个豆包一点八深度思考最新的这个模型。好,如果你想要这个,用这个什么用这个?对,你想上传一个图片,想让他去理解,去分析。好,那我们这里就可以用这种视觉理解的模型, 大家看到没有,我不同的需求,我可以去选择不同的模型。好,那这里我们就很简单了,我们就 快速给大家去演示一下,我们就用豆包一点五 pro 三叉二 k 这个模型,我们点击鼠标左键,好,把它进一个配置。好,那我们就模型就选择好了。好,在这里足够用了。好,那接下来我们就来到我们的输出的一个配置以及提示词的一个书写。 好,那在这里我们先说一下输入输出,这个对大家可能这块不太好理解,尤其是咱们没有搞过技术的啊。那我在这里给大家换个说法,输入,你就把它想象成是什么,我们我们作为员工工作所需要原材料输出,你, 你通过原材料加工之后,你输出的一个劳动的一个成果,劳动的一个成果。好,那打个比方,比如说你是一个蛋糕师,你是做蛋糕的。 好,那在这里你输入的原材料就是你的奶油水果蛋糕这个批子。好,这就是你输入的原材料。好,那我们在这里输入的原材料就很简单了,祝我们什么?对,祝我们一号员工所提取出来这个文案在哪?就在这个 content 的 字段下面,我们点击左键给他进一个配置。那这个名字,大家这个对于这个名字就是英文,有些这个朋友说我的英文不太好的,没关系,我们这里就写,改成汉语拼音文案就可以了, 就改成这个文案就可以。好,那这个就是你的书,因为我们这里就一个输入,对不对?就一个输入。好,那我们输出是什么? 好?输出我先不填,我们先去写一下这个提示词,先去写一下提示词。好, 来,那我们在这里接下来就来到我们的一个重点了,就把提示词的一个书写。那为什么我说这里是是是重点,重中之重,因为提示词就是 提示,什么是提示?其实就是你们平时用 deepsea 也好,用豆包也好,你们再去提问的提问的时候,你们写的那一串问题,其实就是提示词指令。好,那为什么说它非常重要呢?是因为什么?对,因为你写的这个问题,你的提问 的好坏决定了豆包一个这些大模型给你输出的一个答案的一个质量的高低,给你回复的一个质量的高低,所以它非常重要。那在这里我们简单的带着大家去写一下,首先我们,我们在这里给他 第一个角色,那这个角色就是干嘛?我们这个要去改写文案,你改写成什么样的文案?比如说你是想改成短视频文案,小红书笔记,还是公众号文章,还是这个还是头条等等其他的。好,那我们就可以给他,比如说你是一个优秀的 编导老师,上长写各种短视频完。好,他是上长写这个文案的短视频文案的好, 这个角色就有了。好,那接下来我们要赋予他一定的技能,或者说我们叫做任务,叫技能,技能是什么?任务是什么?他可以根据根据输入的文案 内容去改写,生成一篇爆款的短视频。完。好,那这个就是我们,我们要让他去, 要让他完成的一个任务,这是我赋予他的一个能力,让他帮我们去做这个事。好,那,那有了这个技能,我们想让他怎么输出?输出哪些东西?好, 我们可以把输出格式来指定给他。输出格式好,按照我们的要求去输出,比如说想让他输出一个标题,可不可以把内容完的内容,可不可以输出这两个?当然可以了。好,这就是我们输出的一个格式。那接下来 我们还要加一些限制,那这个限制是什么?告诉大模型,你不要给我这个回复,其他乱七八糟的,你只回复上,这就是我们做的限制,只回复与这个,不要回复与 与短视频文案不相关的话题。好,那这个就是作弊,那你可以再加一个字数,字数比如说这个是三百五十个字,或者说五百个字。好,那这个都是限制。好,那这样大家可以看到 就是一个非常标准的一个提示词,结构化的一个提示词,这里我们就写好了。当然有些情况你没有输出格式,没有什么硬性的一些 要求,或者说角色都没有,你就是一个技能,给他一个任务,你想让他干嘛?说清楚,用大白话交代清楚就可以了。好,那这就是我们的系统提示词啊,我们就大家写到这里。 好,那用户提示词就是好,用户提示词就是我们其实在系统提示词你写完之后,有些同学说我写完之后,我感觉写的比较简单,或者说感觉不够专业,有这种感觉。好,没关系, 你们只要把这个,你的这个就是你你要求的这个,你想达到什么目的,一步一步写清楚,要求一步一步写清楚就可以了,把逻辑写清楚就可以哈。你想优化想变得更专一点, 那怎么让 ai 帮我们去进行一个优化?这里我教大家,这里在最后有一个按钮看到没有扣子,他这个扣子系统他给我们提供了自动优化提示词的这个功能,那我们直接点击他。好,他就会针对你的现有的提示词来进行一个优化。好, 如果你这里没有,你可以在这里进行一个把你需要优化的提示词写到这里,当然我们这里有直接点击这个自动优化的按钮,他就会根据我们已经写好的这个提示词进行优化,我们稍微等一等。好,大家可以看到,你看, 给我写了这么多,还在写,我就这么几句话啊,还给我们写了这么长的这个字的,你是一位精通短视频运营的编导专家,擅长什么?好一,提取,抖音视频文案的提取,在这 好,爆款文案的生成非主流。好,我们先不管他,我们在这里我教给大家怎么去优化,但是这里我就不替换了。好,来, 那我们现在有了这两个,我们用户提示词是什么?用户提示词在这里就是用户输入的这个变量是什么?就是这个文案,就是这个原文啊。好,我们在这里进行一个写好,这个文案内容是什么?好,把它写到这里,把它,对,把这个变量写到这里。 怎么写?很多同学看,好,我教一下大家。按住键盘的 shift 键上党键,按住了,打出大括号,当你打出大括号的 左边这个括号的时候,他会自动弹出这个这个文案,这个名字看到没有?弹出来,你要做的就是什么?点击你的鼠标左键或者回车啊,好,把它写到这里,大家看到没有?把它写到这里,这就可以了,当它变成这种蓝色的,说明你已经写成功了,就是引用成功了。 好,那这样我们的系统提示用过提示就完了。写完之后,接下来我们在这里来配置一下输出,大家还记得我们这里输出还没有配好,我们在这里我们要配置什么?输出是根据你的什么这里 内容来的。好,第一个我们要输出标题,标题,好,我们在这里就写成标题,这个中文的汉语拼音,对,点开这个小箭头,我们这里可以备注一下标题,好,我们再点击加号的按钮,因为这还有个内容。 好,我们在这里再去写一个内容,还是汉语拼音。好,我们点击这个小箭头的按钮,在这我们去写一下标注美备注下的描述 内容。好,那到这里我们整个的我们的什么二号员工就配置完了。好,来,接下来,对,接下来我们就来进行我们三号员工的一个配置,我现在大家应该把这个东西真的不难, 大家可以看到我中间没有去写任何的代码,没有写任何的编程语言啊,我就是通过这样的一个模块的添加配置啊,连线全是这些基本的这些操作,就是动动鼠标的这些操作啊。所以各位朋友,各位同学,你们这个不管你是不是搞技术的, 我觉得都可以去学你们各行,因为现在真的是 ai 的 出现给大家都相当于现在就没有这个什么的,对没有技术的门槛了。以前你们要去 开发一个什么应用 app, 开发一个网站,你需要干嘛?对,你是需要去啊,学编程语言需要去写代码的啊,但是我们现在通过 ai 的 能力,我们自己可以去搭了, 我们自己可以通过这种方式去搭搭智能体,搭工作流,来解决我们具体的一些问题啊,所以啊,所以各位,咱们各位大家都可以去学,完全没有问题好不好?来, 对,我现在正在一步一步的教大家怎么去搭建这个智能体工作流,怎么去搭?那你学会了这样一个搭建的能力,你就可以结合自己的行业,根据自己的需求进行一步一步的一个搭建。好, 接下来我们进行我们的第三个员工的一个一个配置,配置了,各位好,我们直接点我们三号员工是干嘛?大家可以这个名字能看出来帮我们整理数据的, 为什么要有这一步?为什么?是因为我们想把我们我们提取出来的文案,包括原文,包括链接,还有深沉的新的文案以及标题。啊,我们想去保存起来,保存到哪?保存到我们的非书的多位表格里边。 好,那在保存之前对,我们需要处理一下数据来满足我们的四号员工他的一个要求,你要按照人家的要求去写,所以 人家要求是什么?大家可以看到是这样的一个数据的要求,我们点开我们四号员工,这是他的一个数据的一个格式,你要往人家这个里头去插入数据,是这么一个要求,大家可能看这什么玩意好,对,格式不要怕这个东西其实 我们就是什么照猫画虎,他的一个格式好,我们现在有这样一个格式之后,我们又让我们以前我们怎么去处理?以前你要去写代码去处理好,那我们现在可以怎么处理?我们可以通过大模型,通过豆包,通过 dec 版来帮我们处理这件事哈,所以在这里我们就添加了我们一个 三号的员工来帮我们做这件事。好,我们鼠标左键来打开它,来,各位打开它之后,同样我们首先去选择一个模型,刚刚说过了,这里有很多的模型的列表,非常多。 好,那我们在这里去选择这个豆包一点五 pro 三十二 k 足够用了,速度又快,性价比又高。好,我们直接选择它。好,选完它之后来我们的输入这块,我们先去配置一下,那这块输入,我刚刚说了,输入是什么?输入就好比是什么?对,你去 准备的一些,你要做一些你要去准备的一些材料。原材料,比如说你是一个蛋糕师,你要去准备一些你做蛋糕的一些原材料,比如说奶油、水果、面粉等等。哈,那我们在这里我们输入的就是原材料啊,那我们这里的原材料是什么啊? 我们要去处理的这些数据。首先就是我们的什么来,我们去输入的链接,我们这个抖音的链接我们需要拿到。好,那他就是我们的 url。 好, 我们要。那第二个,对, 我们要去拿到原文的内容在哪?是不是我们的一号员工把这个文案提出来了,在这个 content 这里。好,我们给他改个名字,那他就是我们的什么对,文案啊,而且是原文案的内容。 好,我们用汉语拼音来进一个题的原文案的内容。好,第三个是什么?第三个自然就是我们我们的二号员工改写完之后,把我们生成的一个新的标题。 好,我们直接点击我们的鼠标左键,把它进一个配置好,再去添加一个原材料是什么?我们二号员工改写之后的一个文案的内容在哪?在这里。 好,那这样我们就拿到了四个这样的一个数据作为输入的数据或什么,包括这个抖音的链接,就是你提取文案用好,这个是提取 你提取之后的一个原文案内容,这是二创改写之后的一个标题,这是二创改写之后的一个什么内容。好,我们拿到这四个数据之后,好,接下来我们就要去处理整理出,对,我们就要去 给他把这个四个数据,要把它整理成什么?对,按照他的这样一个格式来进行一个整理。来,大家注意看在哪,在这里我们把它拿过来复制一下。 对,有些小伙伴说我怎么拿到这,在这里点击复制,我们就按照他的一个格式来去写这个提示词,好,这里我们就拿到了,看到没有 我们就拿到。好,那在这个之前我们要去写一句话,告诉他,告诉大模型干嘛?对,你要反按返回以下的数据格式。好, 格式如下,再呢就在这我们一个去写一下,按照他的这个要求去写。各位,好,我们把它稍微编排一下,好,稍微编排一下。 好,这是我们给,这是我们自己来的一个例子。好,超过来的一个例子,我们我们去写一下这个是什么呢?我们来看一下我们的飞出度为表格,在哪?在这你看一下我们的飞出度为表格。分这几列,第一列就是原文的 ui, 在 这 ui, 第二列原文内容,第三列是标题,第四列就是改写的内容。 好,第五列就是状态,第六列是日期。好,那我们第一列是标题 ui, 所以 我们在这里这个就是原文。 u i l, 答案一定要保持一致,我们在这里后面对应的就是它的一个什么数据,在哪?在这 u i l, 我 们摁住 shift 键打出大括号,把这个 u i l 添加进来。好,这样我们就拿到了第一个,我们就配置好了。好,第二个是什么? 我们注意看第二个就是我们这个原文内容提取出来的这个内容,我们在这里在这写一下原文内容啊,同样我们把这个值赋予它在这原文内容。好,我们还是按住键盘的 shift 键打出大框,把第二个 给他配置进来。好,这样就可以了。好,以此类推,我们接下来还要配置第三个标题内容啊,标题在哪?在这,我们把这个改成,改错了,改错了。这个,好,这个是标题。好,我们把这个多复制两份出来,这个就改成标题。 好,标题是什么?标题在这个,第三个我们给他改掉。好,那我们再看一下第四个就是内容了, 好,内容改写后的内容在哪?这个内容好,配置给他。好,那接下来还有个状态,我们要去写一下,状态就是什么,我们在这里写死未发布的一个状态。好,未 发布。好,那这样我们整个的我们系统提示词这个格式就配好了。好,那这样还有个非常重要一句话,告诉大模型,你不要增加或者删除 上面的任何内容,保持对以上这个数据格式的。对,保持以上这个格式的数据。好,只添加相应的字段信息 就可以了。好,这句话的作用,这个什么限制?就是我们的限制啊,非常重要,要不然大模型他可能给你少增加一点。少,那这样会导致一个什么?导致,如果不是完全按照这样的一个 格式输出,会导致我们四号员工写入非书的时候,对,会有问题啊,会报错,所以我们在这里啊强调一下。好,最后的一个输出是什么?来输出我们的输出,我们这里是一个 数组的对象,他是一个数组的对象啊,不要问为什么,是因为人家非书的要求就是要输出这么一个数组的对象。在这我们就返回到四号员工看一下。啊 数据的格式,对,在这看到没有?它是一个 array object, 它需要的这个数据是一个数值的对象,所以我们三号员工输出的时候,它一定是一个数值的对象。 好,那到此我们的三号员工,我们就配置完了,到此我们的三号员工配置完,我们的数据整理完了。好,来,那现在来到我们的四号员工,我们就是要去写入飞出了,写入飞出,这是它整个的配置的一个页面。来,我们来给大家去看一下。好,那首先我们来去配置第一个 app token 是 什么? app token 就是 你这个多维表格的维标识。好,支持输入文档的 url。 好, 那这个 url 就是 什么?大家看到没有?我刚刚打开了这个非输多维表格,对,链接,就这个这个浏览器上面这个链接,你直接把它 ctrl c 一下复制,复制粘贴到这里。 好,对,就这么一个链接就可以了,你打开非输多维表格的这个链接,这个链接 ok。 好, records 是 什么?对, 就是什么飞出的那个链接,你要往哪去写?配置?好,我是要往这个飞出多余表格里去写,你是不是要把这个地址告诉他,就这个 u i y。 好, 那第二个是什么?第二个就是 pos, 就是 这个你要新增的数据插入的这个数据,对, 你所需要插入数据写什么数据。好,那我们去配置一下,点开这个小齿轮,我们去找到我们的三号员工,处理数据的这个员工好,看到没有,他输出的就是这么一个 数组的对象,我们点击鼠标左键,按照他的格式,按照这样的一个格式输出的一个对象。好,那到这我们的四号员工算是配置完了,其他这几个我们暂时不需要, 因为我们是往它的默认的数据表去写的。如果你想指定数据表,那你这里就一定要去干嘛?指定一个 table id, 或者指定一个 table name 指一个表的名字啊?那我这里没有指定意味着什么?意味着我是往默认的那张数据表里头去写的。 好,那到此我们的四号员工也就配置完了,那我们整个的这么一个工作流算是搭建完了,我们最后完善一下,把我们的最后的结束节点, 我们就输出我们的四号员工的 date, 当然这里输出哪些内容是由你来决定的,你可以一个不输出,你也可以输出多个,大家能理解,比如说有些小伙伴说我想输出一号 提取的这个文案,可以吗?当然可以,或者我想输出二号员工所改写的文案,可以,当然可以,到最后我想输出保存非出的一个数据看一下。好,可以,都可以,这个是由你来决定的,那我们整个工作流算是给大家搭完了。 好吧,那我们今天搭建的一个什么工作流,就是根据用户输入了一个抖音的视频链接,我们来提取这个视频链接的一个文案,我们拿到这个文案之后,我们又进行了一个改写,生成了一个新的文案的标题和内容。好,我们拿到这个内容之后,我们想去写入飞书啊,在写入飞书之前,我们处理了一下数据, 通过什么处理?对,通过大模型去处理了,把这些数据,把我们需要去保存,保存到飞书的这些数据进行了处理。 u i l。 把原文的内容标题还有新文案的内容。好,我们处理成飞书所要求的一个格式, 接下来我们去把这个数据写入到飞书,是我们四号员工写入到飞书。好,这是我们一个完整的工作流。好,我们点击试一下,给大家跑一下,看一下最终的一个效果。我们运行点击下方试运行按钮,输入一个 抖音的这个列表,我随便去找一个,就这好不好?就这个我们刚刚随便找,我们点一个复制链接,在这里直接输入给他。 好,我们点击试运。行。好,我们稍微等一等,大家可以看到虚线执行的地方执行到哪一个模块。现在是一号员工提取文案了。好,我们来看一下是不是把文案提取出来了啊?是不是提取出来了哈。 二号员工,是我们去改写文案的啊,也已经完事了啊,我们点开看一下,这里帮我输出了一个重写了一个标题,还有重写了一个文案的内容在这里, 当然我这里是教大家的搭建的一个方法,你们要去改写这个文案,你要去根据你的需求去改,要这个提示词,要去 要去完善的,要去优化的,我这里只是教大家一些基本的搭建的一些方法。第三个模块就是处理数据了,我们来看一下处理数据的一个效果输出,你看输入是这些东西,标题内容,这个链接,这个是原文案的内容。好 输出,你看输出是不是以这样的一个格式输出的,你们发现没有? fills 什么呢?按照我们的飞出的格式的要求输出的 三号员工,我们再看一下四号员工有没有插入飞书成功,我们来看一下,我们点击这个点开它,它告诉我们好输入的是一个飞书的 url 链接,你要往哪往哪个飞书堆表格里头去写,这是那个地址,这是那个数据,写哪些数据好在这里输出是什么输出,它有一个成功的一个标志 success, 这是成功插入的数据,在这里还不够,那我们整个工作流算是跑成功了。接下来我给大家打开我的分数多为表格,让大家看一下是不是真正已经插入成功了。我们往下滑,滑到最后我们来看一下,这有一个一百一十九条,你们看一下这有一个最新的一个时间,在这里 是二月九号晚上十点二十八分,也就在一分多钟之前刚刚插入的,因为我这里给大家去拆解去讲了,其实他之前已经插入成功了,在这里就是什么是视频的那个链接,这个是什么?这个是原文案的内容,这个就是 改写之后的标题,这个改写之后的一个文案,这个是发布的一个状态,刚刚插入成功的一个时间,我再给大家看一下画册,这样看的更清楚,在这里这个最后一条是不是在这看的很清楚了?就这个啊, 你看我可以打开这个链接,就是我们刚刚提取出来的,就这个碗,要吃饭就说随便,哪有那么多,是这个没问题。对啊,刚刚插入的原文内容提取出来了,标题在这里。好吧, 大家觉得怎么样?学会了,我们今天就到这,大家有没有问题?一个完整的从提取文案到改写文案,再到 写入非书多位表格,一个完整的工作流带大家实操。完了,我们花了将近一个小时的时间,对于就算你不懂技术,我觉得你们去按照我教你的一步一步去答题,我觉得都没有问题。各位完全没有问题。好吧,大家有需要学习的,想找大兴老师学习的,可以看一下我的主页。

大家好,今天给大家介绍一款新的软件,这个软件呢是关于 ai 改写这个文章的,那么首先呢,我们看到这个软件进来以后的界面就是这样的, 那么它分为了有几个功能,首先是我们的采集改写,比方说我们在这里填写一个这个公众号这个文章,那么我们随便找一个文章啊, 随便找一个文章,然后把他这个链接给复制过来以后,输入到这个链接这个地方,然后我们直接点击抓取就可以了,抓取以后呢,他经过几秒这个文章他就抓过来了,那么抓过来以后呢,我们可以把这个相关的这些呃 文字给他删除,删除以后呢,我们就可以进行根据哪一个模板进行改写了,那我们现在呢是用了 单 agent 的 这种方式进行改写,然后点击改写,那么这样的情况呢,他就会根据我们的内容进行改写了,并且是呢我们有一个选择的这个模板, 那么他改写出来的这个文章呢,就会显示在我们的这个中间的 markdown 的 呃,界面当中, 这个 markdown 的 文档呢,我们是要经过进行排版的,那么第二个第三个框这个地方呢,他就是一个呃经过把 markdown 的 这个文档处理的这么一种方式,比如我们看一下他这边的这个 嗯,格式啊,然后在右边的这个格式呢,他就会给你改写出来。那么还有呢,就是如果说我们不喜欢这种格式的话呢,那么我们点击随机,那么他也会出现不同的这种格式啊, 但是他这个呢,一般情况下呢,就是比方说他这个有三个井号,那我们给他改成两个井号的话呢,他就会出现有的变化,因为这就是在 markdown 里面关于文档的这个拍卖方式是不一样的, 那么我们在改写的这个提示词里面呢,我们可以去选择提示词,目前呢是我们内置的有三种提示词, 提示词怎么去获取呢?我们从我们的这个顶部我们有两种方式,一种呢是我们新建提示词,就是我们直接去写我们的提示词啊,这样点击确定就可以了。那么另一种方式呢,就是我们一键生成提示词,比如我们复制一个公众号的链接, 然后呢也可以再去复制呃,其他的这种链接啊,那我们随便再找一个啊,好,我们找了两个链接,然后我们写一下我们的提示词, 然后赛道呢?我们嗯可以随便去写啊,我们写情感,这样的话呢,他就会根据我们复制的这两个链接去抓取文章,然后呢去生成一个对应的提示词,那么我们点击开始生成。 好,这样呢就是根据基于情感赛道生成的一个提示词呢,就完成了,我们点一下编辑看一下啊, 那么他首先给了我们一个角色的设定,还有任务的描述啊,结构啊,然后语言风格啊,目标 具体的要求啊,输出格式对不对?有好几种方式。那么对于这个生成的提示词呢,如果我们有呃不同的建议或者是想修改的话,我们直接可以在这个地方进行修改啊,然后我们生成了自定义的提示词呢,我们可以把这个点成默认, 然后在采集的时候呢,我们直接选择这个提示词啊,就可以了,那么他就会根据这个提示词把这个文章去改写出另一篇文章来,那么这就是提示词的作用。这个主体样式呢,我刚才给大家讲了,并且下面呢他也有相关的进行设置啊, 啊,比方说我们改成了这个黄色的文字啊,字体的大小,嗯,还有行间距,还有嗯断间距,左右间距啊, 图片的原角啊,这都是进行可以设置的。文字改写好以后呢,我们直接点击复制,然后在我们的公众号里面可以黏贴一下我们的这个文字,去看一下它这个格式是怎么样的啊,然后我们直接黏贴,那么这样的话呢,我们这个排版已经做好了, 那么当然说呢, ai 改写的文章比我们去个人去改写的文章还是有一定的差距的,但是有的人他也是通过 ai 可以 写出比较高水准的这种文章来,那么填过来以后,我们大体的呢,用三五分钟的时间去读一下 嗯,前后的这个逻辑啊,然后文字通不通顺,然后做一下修改,那么我们可以去进行发表,不管是发表到公众号也好,头条也好,或者是其他的文章平台也好, 我们都可以自由去发挥。但我提醒一下一句就是 ai, 毕竟改的文字它毕竟还是 ai 的, 那么我们也要融入我们自己的想法在里面,这才是最正规的,只不过是我们的这个工具呢,可以提高一下我们在写作方面的一些效率。 那么主要的核心思想呢,还在于你的个人的思维里面还有一个功能呢,就叫文章创作,那么这个文章创作呢,我们可以在这里写一个标题啊,那我就随便复制一个标题啊, 然后我就复制这个标题,然后选择提示词啊,然后我们选择这个提示词啊, 如果我们选择 ai 精准配图的话呢,它有可能会在我们的这个里面直接给我们配好图。那我们选择原文图片的话呢,我们这里需要去呃给它复制上一个链接,比如说我们刚才 打开的这个链接以后呢,它里面是有图片的,那么它就会在改写的这个过程中,随便给我们在里面去配置几个图片在里面,我们点击改写呢,首先它就是 要根据我们起的这个标题以及我们的提示词进行充分的创作了。你看我们改写出来的这个文章, 那么首先是我们这个标题啊,然后下面的这个分段啊,那么我们复制一下,然后到我们的这个地方去看一下,然后这个文章跟我们第一次文章改写的有哪些不一样啊? 他肯定是不一样的,毕竟来说我们这个呢是指针对于说我们直接给了他一个标题, 然后让他根据这个文章去进行仿写的,但是呢他只是说根据这个标题以及我们设定的这几个提示词,去充分的去发挥出一篇新的文章出来。那么这个文章呢,他是根据我们最重要的主题的里面去进行发挥的, 但是我们这里也可以有我们自己的一些想法,然后做一个标题,让他围绕我们的标题去进行发挥,发挥出来的文字呢,我们要进行充分的进行修改的啊。 还有一个第三个功能就是我们的短文创作,那么这个短文创作呢,我们在里面也是同样呃预设了三个提示词,比如我们在复制的一段文字,我们随便复制一段文字进来, 那么我们黏贴到这个地方,那么他呢就会根据这个文字,然后根据我们的同意改写,去改写出一篇新的文字来, 那么这样呢,我们就进行改写,那么你身边是不是也有这样的人?我们改写的是这样,那他原文呢?是你身边有没有这样的人啊?是不是也有这样的人?他就进行改写了, 那张嘴就是还不是靠关系,那张口就说肯定是靠关系,那么他意思都是一样的,但是表达的这种方式是不一样的啊,这也是作为我们的一个短文改写,毕竟来说他改写的这个内容比较的短啊。 然后呢后面还有一个功能,就是我们的实时热搜,这个实时热搜呢,可以让你去随时去观看这八个平台最热门的热点,比如说我们随便找一个这个热点, 小红书里面用万能旅拍姿势美美出片,我们点击以后呢,他就会转到小红书这边去, 因为这个我没登,我没登录啊,我们看一下这个啊,你看他就会把这个呃内容给搜出来了啊, 然后我们再看一下知乎话题的这个,然后呢他也会把这个话题给出来啊,看被浏览了有四百多万,这肯定是一个热门的话题,这样呢,我们去找热门话题,去写我们的文章的话呢,也是非常好的一个方法啊, 那么关于我们这个改写呢,肯定是需要这个呃用 api 的, 所以说呢,在我们的设置中有关于 api 的 设置,如果不知道怎么去获取 api 的 话呢?我们这里有一个获取 api 的 秘钥, 直接去网站进行获取就可以了,他这个改写的费用非常低,我可以给你看一下我的后台,刚才我们操作的这些呢,就是有大约每一篇文章改写一下呢。是, 嗯,不到一分钱啊,零点零零八,零点零零八,零点零零一, 这个甚至是一厘钱啊,所以说呢,用我们这种方法呢,去提高我们的这个写作的这个效率, 然后呢用我们自己的思维逻辑去优化我们的文章啊,祝大家能够写出呃最爆的款来,谢谢大家。

一聊 r a g, 你 上来就只说向量解锁,面试官大概率会直接打断你。因为真正决定 r a g 效果的不是你有没有接大模型,而是你的解锁策略有没有设计好。 如果面试官问你 r a g 的 解锁策略怎么设计,你千万别一上来就堆技术名词。先讲目标,一句话总结 r a g 解锁,最核心的目标就是两个字,准和权。 准是什么意思?召回的内容必须和问题相关,不能用户问订单,你给他找库存权是什么意思?关键信息不能漏,尤其是那种需要多角度、多证据支撑的问题。 但问题来了,准和权天然是矛盾的,你召回多了,噪音就多,你召回少了,又容易漏掉关键证据。所以真正能落地的 r a g, 绝对不是一个向量检测就完事,而是要做分层设计。一般可以分成三层,召回层、融合层、金牌层。 第一层叫召回层,这层的核心不是追求特别准,而是先把可能相关的内容捞上来。这里一定要记住一句话,不要迷信单一路解锁, 最基础的一路肯定是向量解锁,他的优势是语义理解能力强。比如用户问怎么退款,文档里写的是售后退费,流程词不一样,但意思接近向量解锁就能召回。但向量解锁也有硬伤,比如专有名词、型号、品牌、订单号、接口名这些特别精确的东西。向量解锁不一定靠谱, 所以还要加关键词解锁。必要的时候还可以加结构化过滤,比如按业务线、时间、类目、权限范围,先过滤再复杂一点的场景,甚至可以加图解锁,用来处理实体关系、多跳关系的问题。所以照回层的核心逻辑是从不同视角把后选文档先尽量捞全。 第二层叫融合层,多路召回之后,新的问题就来了。向量检索有自己的分数,关键词检索也有自己的分数,这两个分数不是一个体系,不能直接拿来比。最简单的做法就是加权融合,比如向量检索权重零点七,关键词检索权重零点三,算一个综合分,再排一轮。 但你要注意,这里千万别说死,因为权重没有银担。不同业务、不同数据、不同问题类型,最优权重一定不一样。更成熟的方案是根据历史点击人工标注问答效果,去训练一个学习排序模型或者融合排序模型。 也就是说,融合层的重点不是简单把结果拼在一起,而是解决多路检测结果怎么统一排序的问题。第三层叫精排层,这一层基本决定了 r a g 的 上限。 前面的多路召回可能会捞回来五十篇甚至一百篇文档,但你不可能全丢给大模型,第一太贵,第二太慢,第三噪音太多,反而会干扰模型回答。 所以这里需要一个金牌模型,也就是 re rank, 它会更深入的理解用户问题和文档内容之间的相关性,然后只保留最相关的前五条或者前十条。召回层追求的是够准,这一步做好了, r a g 的 回答质量会明显提升一个档次。 讲完三层结构以后,你还可以补几个加分点。第一个,动态召回数量,不是所有问题都需要 top 五十,简单事实问题,比如退款多久到账?可能 top 五 top 十就够了,但如果是多跳推理方案分析对比总结,那就需要更多后选文档。所以前面最好先做意图识别和问题复杂度判断。 第二个, query 改写和扩展用户的问题往往不专业不完整,比如用户问这个钱怎么退,系统最好能改写成退款流程、退款条件、退款到账时间,这样可以直接提高召回质量。第三个,先缩小解锁空间,再做精准解锁。 如果文档量特别大,不要一上来就在全库里搜,可以先按业务域、类目、章节、权限、时间范围做粗筛,再在小范围里做向量解锁和关键词解锁,这样效率更高,效果也更稳定。 所以面试官问你, r a g 解锁策略怎么设计?你可以这样总结, r a g 的 核心不是简单接一个大模型,也不是只做向量解锁。真正落地的 r a g 一定是围绕准和权做平衡。 召回层负责多路召回,尽量别漏信息。融合层负责统一排序,解决不同解锁结果怎么合并。金牌层负责深度相关性判断, 把最有价值的内容交给大模型,再结合动态召回、 quay 改写解锁空间压缩,才能把 r a g 的 效果真正做出来。你能这么讲,面试官基本就知道你不是在背概念,而是真的理解过 r a g 的 工程落地。

好,那你说一下瑞克是怎么进行快而改写的?先说一下为什么做快而改写,因为用户的提问方式和知识库往往不太匹配,就比如用户问的非常口语化,很模糊,或者问题里面夹杂了很多笼语信息, 那这样直接去解锁的话,效果肯定不好。快而改写的核心目的就是把用户的原始问题翻译成更加适合解锁的一种形式,让我们的解锁结果更加精准。 具体我就会用到几种常见的方案。第一种就是最直接的查询重写,这个思路就是用大模型把用户的问题改写的更加清晰,更加专业。比如用户问某个产品的最新版本怎么样, 那这个问题就太口语化了,可以让大模型直接把它改写成请介绍某个产品最新版本功能特点,还有性能提升。改写之后问题就更加规范,关键词也更准确的时候,更容易匹配到相关的文档。第二个就是多查询生成, 这个方法就是把一个问题展开成多个相似但角度不同的问题,然后同时去解锁,最后把结果合并。比如用户提问如何提高 ig 系统的性能,那我们就可以把它变成三到五个变体, 比如 iig 性能优化方法,提高 iig 解锁精准率的技巧, iig 系统的性能瓶颈。还有解决方案,把每个遍体都去解锁一遍,然后把结果汇总,这样覆盖面就更广,不容易漏掉关键信息。这个方法就特别适用于用户提问比较笼统的场景。第三个就是只查询分解, 这个就是针对复杂问题的,有些用户的问题特别复杂,一下子包含了好几层意思,比如对比 gpt 和 cloud 在 代码生成和长文本理解上的差异。这个问题其实包含了两个维度,代码生成和长文本理解 还要做对比,我们可以把它拆成不同的子问题,每个子问题单独去解锁,再把答案整合在一起,这样逻辑就会更清晰一点。第四种就是假设文档嵌入,他不是直接改写问题,而是先让大模型根据问题生成一个假设性的答案或者文本片段, 然后用这个假设性的文档去做剪辑。那为什么要这么做?就是因为有时候问题跟答案的语义表达方式差别很大,直接用问题去剪辑可能匹配不上,但如果用假设的答案去剪辑,因为语义就更接近实际的文档,匹配度就会更高。 第五种就是后退提示,这个思路刚好相反,他不是让问题更具体,而是让问题更宏观、更通用。比如用户问某个产品的价格是多少,那这就是一个很具体的问题,但知识库里面如果没有这个具体的信息,解锁就会失败。 后退提示的做法就是先退一步问一个更宏观的问题,比如这个公式的定价策略是什么,或者同系列相似产品的价格体系, 先解锁这些背景信息,再基于这些背景信息回答原始的具体问题,这样即便没有直接的答案,也可以给出一个合理的回复。在实际的项目里面,我们一般就把几种方法结合起来用, 比如先做查询重写,把问题规范化,再生成多个块去解锁,最后用重排序模型对结果重排序,这样效果就会更好一点。 关键还是要根据具体的业务需求来选择和组合,经过不断的测试和优化,找到最合适的方案。我这里也整理了一份十一万字大模型高频的面试题,感兴趣的小伙伴可以带回家学习。

居然还有同学不知道怎么降低论文的 ai 率的,前面发了知网和维普的降 ai 实测,全网有近一百万人看过,今天来给大家讲讲降 ai 的 底层逻辑,看明白了,你自己也能将 ai 率降下来。 先来看看这两段内容,这是我让 ai 生成的一段综述,这是原文,下面这个是进行降 ai 处理修改后的内容。我们先来看看原文的 ai 率, 直接是百分之一百,再来看看修改后的 ai 率,直接清零了。我们把这两段内容拿出来对比一下,看看有什么区别。 首先是用词, ai 生成的内容都是用词都非常书面化的,像成为什么的重要手段,围绕某某展开,被广泛视为备受关注等词语,并且用的大多是指出、强调、提出这类动词。而处理后的内容加入了一些语气词,动词也带了一些时态标记。 再就是段落结构, ai 生成的内容分解明显,先用首先,其次在层面。值得注意的是,综上所述,做路标,每段一个主题段内用分句并列观点,句子长度也非常相近,结构很规整。 这样 ai 后的内容就没有主题句自然过渡,句子有长有短,不追求对齐。对比下来,有 ai 律的内容通常格式高度统一,用词标准规范,结构对称工整,读起来像教科书,模板化严重,缺乏语气和节奏变化。 没有 ai 律的内容,则格式相对松散,用词灵活自然,结构随内容起伏,表达也更自然。那具体要如何操作呢?非常简单,不需要你一个一个去手动修改,一个提示词就能搞定。 把指令发送给 ai, 等它理解修改要求后,再把原文发送给它改写,这样就能得到一段 ai 律合格的内容了。不过这个方法只能一小段一小段处理,同时发送的段落内容太多会影响效果, 并且也不是很稳定,需要多试几次。如果是想要一次性解决,确保能达标的,可以把文档上传到这里过一遍,它可以在不改变原意的前提下,将你的 ai 率降低到合格范围内,非常省心。

公元二零二六年的春天,人工智能的竞争领域里没有硝烟,但传统技术路线的衰退已经在此刻轰然降临。当绝大多数从业者还像追随者一样盯着那几个冰冷且不断膨胀的模型参数,还在为某一次常规的榜单提升而庆祝时, 一场悄无声息但足以彻底改写行业规则的范式巨变,已经完成了它的关键突破。这场史诗级技术浪潮的起点, 不是任何一个刷新记录的闭源基座大模型,也不是某一次重大的技术创新,而是一个曾经被无数技术精英轻视的开源智能体框架。它的出现,就像在平庸的算法领域中带来了颠覆性改变, 逼迫着全球最顶尖的大模型团队集体调整过去三年坚持的算力分配逻辑和技术路线规划,甚至推动旧有的组织架构完成历史迭代。 这绝不是一次常规的代码迭代,而是一场深刻的行业变更。今天,我们将彻底剥开所有的技术伪装,透过小米大模型团队负责人罗弗利在内场震撼业界的首次深度访谈中泄露的底层逻辑,把这场 ai 竞争第二阶段的核心内幕, 从微观的技术细节,到宏大的行业格局,再到决定发展的未来关键,完完整整的拆解给每一个即将被时代发展影响或重塑的个体。 这一切的引爆点,发生在二零二六年三月,也就是罗弗利带领团队发布 mymo a 二 pro 系列模型之后的关键节点。在那个被定义为行业分水岭的时刻,他抛出了一个让传统大模型从业者高度关注的定论 人工智能的核心发展方向已经发生不可逆的转移,整个行业已经从预训练主导的对话时代正式转向了由后训练主导的智能体时代。 而那个亲手推开新世界大门,触发这场行业变更的关键节点叫做 open cloud。 在 它刚刚诞生的时候,包括罗浮丽在内的绝大多数人对它的认知都极其浅薄。在他们眼中,这不过是在 cloud opens 四点六的基础之上,优化整合了一个更实用的交互界面, 增加了一些本地化和定时任务的功能,再配上一个偏向实用化的技能中心。在这些认为自己掌握核心技术的从业者眼中,他本质上依然是一个基础的应用产品,甚至因为其浓重的运营风格,遭到了大量技术从业者的理性排斥。但轻视往往会导致认知滞后。 认知的转变是在那个春节的深夜完成的。罗弗利花费了两个小时将 openclaw 部署完毕。从凌晨两点到清晨六点的四个小时里,他经历了一场跨越探测与归机的深度思考。 他过往的坚固认知被彻底更新,第一个直观感受是,这个冰冷的框架竟然展现出了贴近人类的交互能力。 他会在深夜的幽暗中精准而克制的提醒用户应当休息。这种极具温度的交互表象之下,隐藏着一套精细到极致的上下文编排逻辑。他 会在每一人机对话的上下文之前,悄无声息的拼接上当前的时间坐标,用无数个常人难以察觉的细节,将机器的交互强行扭转至贴近人类行为模式的轨道上,但这仅仅是前奏, 真正的亮点在接下来的七十二小时里逐层展现。第二天,他尝试将团队管理、组织架构搭建这类充满模糊性的非代码日常工作移交过去, 结果发现,他不仅能完美洞察需求背后的深意,还能输出高度体系化的落地方案,甚至将其沉淀为专属的技能,演化成了一个高效的数字助手。到了第三天,他果断将构建用于后训练的用户智能体这一核心研究任务抛给他。 这个在人类评估体系中至少需要一到两周才能完成的科研工作,在与 opencloud 沟通了一两个小时后,竟顺利完成。仅仅三天,这个曾经被轻视的工具完成了一场从用户界面、产品到效率工具,再到直达核心研究底层的生产力伙伴的能力升级。 当我们深入分析 opencloud 那 层极具迷惑性的外衣,会发现这个框架最核心的优势,从来都不是因为它依附于某个顶尖的闭源基座模型,而是它用一套完善的智能体架构设计,有效弥补了底层模型本身的功能不足。 他就像一位专业的资源调度大师,构建了分层分级的持久化记忆体系,彻底解决了在超长线任务中极其致命的上下文丢失问题。他无视了底层能力的物理壁垒,能够自动识别并调度不同专长的模型。面对视频理解的需求,他自动切入视觉中框。 面对代码生成的场景,他无缝切换至逻辑引擎,用户被完全隔绝。在底层的繁杂适配之外,最令人惊叹的是,他甚至能将一个仅仅拥有三十亿参数的端侧微型模型,通过架构的优化,去执行过去日内认为只有千亿大模型才能完成的复杂任务。 这是一次对过去几年为参数论的理性反思,他带来了第一个颠覆性的行业认知,一套优质的智能体框架,正在以前所未有的杠杆率充分激发并提升中层模型的能力上。现在旧有的行业体系中,只有顶尖的基座模型才能处理复杂现实任务, 但现在,一个普通的模型,只要套上这套完善的架构,就能在绝大多数的生活与提效场景中展现出接近顶尖水准的能力。这种效率的提升效应,正在以几何级数改变旧有的研发节奏和工作效率。在罗弗利的团队全面拥抱这套全新的范式之后,研发效率被彻底改变了。 他们仅仅用了三四周的时间,就高效完成了过去需要三四十周才能推进的庞大研究工作。而引发这种高效成果的关键,并不是单个技术人员的突破,而是群体智慧被充分激活后的协调效应。春节过后,罗弗利向团队下达了一道严格的要求, 第二天, open club 对 话次数达不到一百轮的人需要加强学习适应。这当然是一次引导性的团队测试,但 他真正的目的是用积极的方式将团队带入这个新世界。结果是惊人的,整个百人进入团队全力投入,无数人在群聊中积极探索这个框架的能力边界信息流快速更新,有人在重构底层框架,有人在优化新的技能接口, 有人在开拓前所未见的应用场景。在开源的开放环境下,一群顶尖人才的想象力形成了强大的合力,几个小时就能迭代出一个全新的框架版本, 这是任何封闭的闭源商业团队难以实现的效率成果。因为 opencloud 是 开源的,它将底层的设计逻辑完全公开,允许所有人对其进行优化、修改和针对性升级。这种无国界的开放性让它不再依附于单一的商业主体,而是成为整个开发者社区共同完善的优质工具, 这也是他能在短短数月之内完成从粗糙难用到极致易用跨越的核心原因。当我们站在更高的维度去俯瞰这场巨变,你必须清醒的认识到,真正发生改变的,从来不是某一个产品的市场份额,而是整个大模型行业的底层发展逻辑和结构规律。 算力分配的旧有模式被全面革新,在那个资本关注的对话时代,算力的分配比例呈现出不合理的状态。 用于研究预训练和后训练的资源比例大概维持在三比五比一,超过一半的算力资源被投入到预训练中,而后训练仅仅能分到较少的资源。 因为在那个发展阶段,所有人都在聚焦机座模型的基础能力,预训练的效果直接决定了产品的核心竞争力。但当二零二六年到来,智能体时代开启,这个曾经的比例被快速调整, 一个符合新时代发展的算力分配比例已经被重塑为三比一比一,研究的算力占比保持稳定,预训练与后训练的资源消耗达到了平衡。更有甚者,那些嗅觉敏睿的团队已经拉平了这两者的算力投入。这绝不是简单的资源调整, 他宣告着单纯堆砌算力研发大模型的路径已经走到尽头,竞争的核心已经从谁能造出更大的模型转向了谁能将模型能力在智能体实际应用中充分发挥。预训练依然是重要基础,决定了你是否有参与竞争的资格, 但后训练才是决定你能否在激烈竞争中持续发展的核心。伴随着算力分配模式的革新,技术路线的底层逻辑也发生了重大转变,智能体范式对强化学习的规模化应用提出了更高要求。 在旧时代的推理场景中,系统核心仅为模型推演,所有设计都为保障模型完成逻辑推理以获得标准结果。但在智能体应用场景中,系统核心变成了庞大复杂的智能体,本身它不仅要完成模型推理,还要处理模型与框架的协同适配,在不同算力资源中进行多模型动态调度, 更要在复杂外部环境中稳定交互。这种系统复杂度的大幅提升,对团队基础设施能力提出了全新重构要求,必须具备高效响应能力,快速开发适配新范式的强化学习基础设施。 更不同于传统工程思路的是,必须学会接受过程中的不确定性。预训练时代,基础设施对稳定性要求极高,训练中出现微小异常,团队就要停摆排查,否则可能导致大量训练成果受损。 但智能体场景基础设施必须在动态变化中持续推进,任务中途出现问题原因可能多样,框架超时限制、外部环境验证问题、集群调度、指令差异等,无法像过去那样彻底排查所有问题推进。这种从追求绝对确定性到在动态中快速推进的转变, 不仅是代码逻辑调整,更是工程团队思维模式的全面更新。在这场算力与架构的竞争中,曾经被推崇的模型架构标准正在被逐步更新。 回望过去两年,业内构建基座模型主流采用多头潜在注意力机制,无论是 deepsea 全系模型还是国内跟进团队,都认可其缓存优势。在对话时代,它是平衡算力与内存瓶颈的有效方式,将现有芯片推理效率提升至较高水平。但 罗夫利研发 mimo v 二系列模型时,对这种旧技术方案进行了优化,选择混合注意力机制叠加多词源预测架构的创新路径。 当时这一思路遭部分同行不理解,可智能体时代到来后,该选择展现出显著优势。多头潜在注意力机制设计时将计算与仿存平衡做到极致,无多余算力空间, 添加多词源预测,提升速度时会预计算平静效果不佳。而混合注意力架构灵活性更强,通过滑动窗口优化缓存使用,节省大量算力。可通过多词源预测充分利用算力。该技术方案实现了高效、长上下文处理与极快推理速度。 mimo v 二 flash 版模型每秒吞吐一百至一百五十个词源, pro 版稳定在六十至一百区间,这种速度优势在智能体实际应用中事关重要。 效率优先的时代,体验过同智能水平但更快的模型后,很难接受低效旧产品。更深远的是创新架构保留充足优化空间,可灵活适配智能体时代,多变场景不会被固定设计限制,后续升级 行业趋势依然清晰。这场技术迭代竞争中,真正的入场券与核心竞争力是什么?罗弗利的判断十分明确, 万亿参数基座模型、接近 cloud opus 四点六水准的模型仅是参与竞争的基础,这只是入场资格,并非绝对优势。如今,国内市场多个优秀团队已研发出万亿规模模型,预训练赛道差距大幅缩小。 行业先进技术成为公开方向后,全员快速跟进后续竞争,不再比拼参数规模,而是三场关键竞争。第一场是技术响应速度竞争。 未来两到三个月关键期内,谁能快速拥抱智能体新范式,搭建适配强化学习基础设施,完成后训练、技术路线升级,谁就能抢占优势。上一时代成功经验未必适配新时代全员重回同一起跑线。第二场是长期发展规划抉择, 行业不会停留在万亿参数规模,想要持续发展,决策者需立刻判断算力应投向参数提升,上下文优化还是多模态发展,更关键的是选择何种芯片架构推进规模化发展, 决策对错直接决定后续行业地位。第三场最关键且易被忽视的竞争在于团队组织架构,能研发万亿参数模型的百人技术团队采用创新管理模式, 无森严层级,无固定业务小组,无浆化截止日期,百余名覆盖数据预训练、后训练、多模态、全链路的专业人才,在扁平化、开放协助环境中充分交流。预训练与后训练无严格区分,预训练人员可因需求快速参与后训练工作。这种灵活协助给后训练注入多元视角。 罗弗利的管理理念中,平等协助是激发团队创造力的关键,能最大化释放每个人的智慧。 技术快速迭代期江化层级规范会束缚创造力,刻板要求与固定边界会让团队错失机遇。该创新团队为保障模型效果,敢于随时调整工程进度, 遇核心问题宁可暂停工作,承担算力成本,也要彻底解决,决不迎合发布节点妥协。而这种灵活开放模式,让团队面对 openclaw 范式改革时快速转型,三四周完成过去大半年的工作量。这场改革带来重要启示, 技术路线升级需要团队组织与人才能力同步升级。后训练时代需要能在动态中快速试错、自由探索、携手创新的人才,而非僵化执行指令的人员。拨开技术迷雾,我们必须直面核心问题,这场智能体引发的范式改革终将带我们走向何方。 俄福利预测,两年内通用人工智能关键发展节点必将到来。二零二六年是人类生产力快速提升的重要年份,多数人现在职场感受工作模式变更,随后变更将渗透生活,方方面面 支撑该判断的核心逻辑是,人工智能自学习与自迭代能力已突破关键节点。过去,人类凭借创造了优势,认为 ai 无法涉足深度科研与模型自研。 如今,罗弗利见证专业研究被转化为标准化流程与技能,算法不仅是辅助工具,更能自主设计课题,搭建验证逻辑,完成闭环迭代。人工智能吸收人类知识成果,实现智慧升级。自我迭代后,通用人工智能的实现仅于时间等待 不可逆发展进程中,开源生态是重要推动。力。通智能发展趋势是算力分散,芯片普及节点广泛,唯有开源能整合多元产业链,释放技术生产力价值。 这场技术改革向所有参与者抛出深思问题,人类千年知识智慧转化为数据模型参数,人工智能自主迭代并产出创新成果时,人类该如何定义自身价值 习惯、稳固发展的社会体系?是否做好迎接技术改革的准备?该问题当下无标准答案,但可以确定的是,二零二六年 ai 范式改革绝非技术发展终点,而是全新时代的起点。 未来两三个月,行业将迎来更快速技术发展与更显著格局变化。你我都身处这场无退路的技术浪潮,要么被时代改变,要么成为时代推动者。我是 ai 启示录,感谢点赞与关注,我们下期再见!

做视频呢就两个方法,一个是原创,一个就是抄,那有个人呢,就是从零到一抄到了六百万的粉丝,我把他抄的方法论融合成了智能体,给大家来看一下。 首先的话呢,我们先去找到一个我们同行业的爆款视频,然后复制一下,然后给到第一个智能体,他就能帮你把这个爆款视频的文案提取出来,直接帮你锁定流量密码。第二个智能体呢,来帮你去改写文案,就算是新手也能够用它写出逻辑通顺的优质内容。 第三个呢,就是来克隆声音,他还可以完成,情绪高兴啊,正常啊,愤怒啊,激动都可以。第四个呢,就是用这个声音来克隆你的形象,形成合成视频。 小白呢,也能够通过他做出专业级的爆款视频。第五个智能体呢,就是剪辑了,他来加字幕,来加音乐,来加上话中话,所以就算你是小白也能够剪辑大片了。第六个呢,就是帮我们来去生成封面 标题描述和话题,精准踩中我们平台的流量点。第七个智能体就厉害了,他直接帮我们完成多平台的一个发布, 一个公司啊,在内容赛道能不能接到更多单子,能不能持续出爆款,关键在于员工的平均水平对不对?那么这款智能体是不是直接让我们降本增效了,而且把我们的下线能力直接拉低,任何一个小白都可以用它来去创作出来我们的爆款视频。

大家好,我是 ai 启示录。这期内容我们要聊的是一场足以定义未来十年 ai 走向的深度对话。就在二零二六年四月二十九日红杉资本 ai ascent 峰会上, google deepmind 联合创始人兼 ceo、 二零二四年诺贝尔化学奖得主德米斯哈萨比斯 用一场近两个小时的专访,完整揭开了他从国际象棋神童到 ai 领域领军人物的毕生主线,给出了关于 agi 实现时间、 ai 终极价值甚至宇宙本质的核心思考。 他为什么笃定我们会在二零三零年实现通用人工智能?为什么说信息才是宇宙最底层的本质,而非物质或能量? ai 到底会如何彻底重塑科学,甚至催生出人类历史上从未有过的全新学科? 今天,我们就把这场专访里最核心、最颠覆认知的内容完整拆解给大家。这场专访的主持人是红山资本合伙人康斯坦丁部落。对话的核心是哈萨比斯完整梳理了自己贯穿一生的内在逻辑, 从少年时代的国际象棋神童,到游戏行业开发者,再到神经科学家、两次创业者,最终打造出 deepmind 这家改变 ai 行业格局的公司,同时也完整呈现了他对 agi、 ai for science 科学哲学的完整思考。 这场对话之所以值得我们认真拆解,不是因为他有多少耸动的行业爆料,而是因为他让我们看到了这位当代 ai 领域最顶尖的思想家,他的底层逻辑到底是什么?他眼中的 ai 未来到底是什么样子?很多人看哈萨比斯的履历,会觉得他的人生跨度极大, 从国际象棋神童到游戏制作人到神经科学家,再到 ai 公司 ceo, 这些身份看起来毫无关联。 但哈萨比斯自己说,这所有的选择背后有一条贯穿始终的主线,那就是从十五六岁开始,他就认定人工智能是他毕生能从事的最重要也最有趣的事业。 他之后走的每一步,都是在为有朝一日打造 deepmind 这样的公司做准备。这条主线的第一站就是游戏行业。哈萨比斯说,在九十年代,他选择用曲线救国的方式进入游戏行业,因为当时最前沿的技术,不管是 ai 图形渲染还是硬件,都在游戏行业孕育。 我们今天所有人都在用的 gpu, 最初就是为游戏的图形引擎设计的,而他在九十年代末就已经用上了最早期的 gpu。 他 参与开发的所有游戏,不管是在牛蛙工作室,还是后来自己创办的 alexer studios, 都把 ai 作为了核心的玩法机制。 他最知名的早期作品是十七岁时开发的模拟游戏主题公园。这款游戏里,成千上万的小人涌入游乐园体验游乐设施,决定在商店购买什么。而在游戏的表象之下,运行着一套完整的经济 ai 模型。 这款游戏和模拟城市一样,是同类模拟游戏的开山之作,最终卖出了超过一千万份。当哈萨比斯亲眼看到玩家和游戏里的 ai 交互时的快乐,他更加坚定了要把毕生精力投入 ai 领域的决心。 在游戏行业的历练之后,哈萨比斯大学一毕业就创办了自己的第一家公司 alexio studios, 这段创业经历给他上了最深刻的一课, 也坚定了他之后创办 deepmind 的 核心创业理念,那就是你要领先时代五年,而不是五十年。当时在 alexia studios, 他 们试图开发一款名叫共和国的游戏,目标是模拟一个完整的国家, 玩家可以通过各种方式推动相关进程。游戏里要完整模拟一个个鲜活的城市,甚至要在九十年代末的奔腾处理器上跑通一百万人的图形渲染和 ai 逻辑。现在回头看,这个想法的野心太大了,甚至可以说是超出当时条件,最终也引发了一系列的问题。 哈萨比斯说,这个教训他记了一辈子,你必须走在时代前面,但如果超前了五十年,大概率会难以推进。可当一个想法对所有人都显而易见的时候,入局又太晚了。相关事业推进的关键就是找到那个微妙的平衡点。 第一次创业之后,哈萨比斯转向了神经科学领域,攻读了相关的博士和博士后学位。他的目标很明确,就是要从人类大脑的工作机制中汲取灵感,推导出全新的算法思路,为之后打造真正的通用人工智能积累最核心的理论基础。 时间来到二零零九年,哈萨比斯终于等来了创办 deepmind 的 最佳时机。当时在整个行业里,几乎没人相信 agi 能实现。当他提出要研发通用人工智能,也就是当时常说的强人工智能时,很多学术界的人都会持保留态度, 觉得这是一条九十年代就已经被验证过的难以推进的方向。但哈萨比斯和他的团队敏捷的捕捉到了几个关键的线索。第一个线索是深度学习,刚刚由杰弗里辛顿和他的同事们研发出来,但几乎没人意识到他的真正分量。而哈萨比斯的团队在强化学习领域有极深的积累, 把深度学习和强化学习这两个当时完全割裂的技术结合起来,一定会带来突破性的进展。 在此之前,这两个技术几乎从来没有被结合使用过,就算有,也只限于学术界的简单研究。在整个 ai 领域,它们就是两个各自为战的孤岛。第二个线索是算力的前景, 他们看到了 gpu 未来会在加速计算领域发挥重要作用。虽然现在我们用的更多是 tpu, 但在当时他们就已经预判到算力会成为 ai 发展最核心的推力。第三个线索是来自神经科学的灵感。 哈萨比斯和他集结的一批计算神经科学家,从大脑的工作机制中提取出了足够多有价值的思想和法则,其中最核心的一个信念就是强化学习,最终可以通过规模扩张通向通用人工智能。 哈萨比斯说,当时他们觉得自己集齐了所有核心要素,甚至像是某个重要方向的探索者,因为不管是学术界还是工业界,根本没人相信 ai 能取得什么重大突破。 当时不管是英国剑桥还是麻省理工学院这些传统 ai 研究的大本营,大家还在沿用专家系统、医接逻辑语言系统这些老办法。在哈萨比斯看来,这些方法已经太古板老旧了,这反而让他更加确信他们找对了方向。 他说,就算最后推进过程中遇到阻碍,他们也会以一种全新的姿态探索,而不是重蹈九十年代 a g i 研发欲阻的覆辙。 无论如何,这件事都值得一试。从创立的第一天起, deepmind 的 使命就无比清晰,而且从来没有变过,那就是两步走的规划,第一步,破解智能,构建通用人工智能 agi。 第二步,用 agi 去解决其他所有的复杂难题。阿萨比斯说,就算 ai 至今还是个小众学科, 他也会坚持走这条路,因为这是人类可能研发的最重要也最迷人的技术。他既是科学探索的工具,本身也是一件迷人的造物,更是我们理解人类自身心智, 比如意识、梦境挺壮丽本质的最佳途径之一。作为一名神经科学家,他过去在思考这些问题的时候,常常感到缺失了一种像 ai 这样的分析工具。 而 ai 的 出现给了我们一种对照机制,让我们能像做对照实验一样,对两个不同的智能系统进行深入的研究和比对。很多人知道 deepmind 是 因为 alphago 在 围棋上战胜了李石石,但对哈萨比斯来说, alphago 从来不是终点,而是一个关键的转折点。 他说, deepmind 有 一个专门的 ai 助力科学部门,由普什米特科立领导,到现在已经成立近十年,几乎就是在首尔打完 alfa 比赛归来之后,他们就立刻正式启动了这项工作。 在此之前,他一直在等待,等待算法变得足够强大,理念变得足够通用。而攻克围棋的那一刻,他意识到时机到了,是时候把这些 ai 技术应用到现实世界的重要问题上,从最重大的科学挑战开始着手。 哈萨比斯说, ai 助力科学是 ai 极具价值的发展方向,还有什么比用它来助力疾病诊疗、延长人类的健康寿命、辅助医疗事业更有意义的事呢?而紧随其后的就是材料、科学、环境和能源这些关键领域。他相信 ai 在 未来几年内会在这些领域持续带来突破性的进展。 ai 在 科学领域的第一个里程碑式的成果就是 alpha fold。 哈萨比斯说,很多人问生物学领域什么时候能迎来像语言和编程领域那样的高光时刻, 他认为 alpha 三的诞生就已经让我们迎来了这个时刻。蛋白质折叠的三维结构预测是一个困扰了学界五十年的科学难题,而想要设计药物破译生物学的基础密码,攻克这个难题至关重要。 当然, alpha fold 解决的只是药物发现过程中的一环,但这一环是最核心、最关键的一环。在 alpha fold 之后,哈萨比斯又牵头创办了 isomorpns labs, 专注于在生物化学和化学领域构建核心的 ai 技术。 这些技术能自动设计出和蛋白质特定部位完美嵌合的化合物。既然已经掌握了蛋白质的形状和表面结构,就等于锁定了药物靶点, 接下来要做的就是制造出能和这个靶点强效结合的化合物,同时还要避免任何可能引发不良作用的脱靶反应。 哈萨比斯给出了一个极具前瞻性的目标,现在的药物研发百分之九十九的工作量和时间都花在了前期的探索过程中,而他们要做的就是把这个探索过程全部转移到计算机模拟中完成,只把实体的实验留给最后的验证阶段。 如果能做到这一点,他也坚信未来几年内一定能实现。我们就能把现在平均长达十年的药物发现周期缩短到几个月、几周,未来甚至只需要几天。 一旦跨越了这个临界点,各类疾病的诊疗都将迎来新的可能。像个性化医疗,也就是针对患者个体定制的药物,这类现在看起来还很遥远的概念也会彻底化为现实, 整个医疗和药物研发的领域都会在未来几年内被彻底重塑。这场专访里极具突破性的一个观点就是,哈萨比斯提出的 ai 不 仅会加速现有的科学进展,更会孕育出全新的科学体系。就像工业革命催生了热力学一样, 我们的教育体系里会出现本质上全新的学科。哈萨比斯认为这件事会从两个方向发生,第一个方向是对 ai 系统本身的理解和剖析,会演变成为一门完整的工程科学。 我们现在构建的 ai 系统已经无比复杂,未来它们的复杂度甚至会比肩人类的心智和大脑,我们必须对它们进行深入的研究,彻底弄清这些系统的工作原理,而这远不是我们今天的认知水平所能企及的。现在大家常说的机制可解释性只是这个领域的冰山一角, 未来在解析 ai 系统这件事上还有无比广阔的探索空间,这本身就会成为一个全新的、完整的科学学科。第二个方向是 ai 本身会开启全新的科学大门。其中最让哈萨比斯兴奋的就是 ai 助力模拟, 他说自己痴迷于模拟,他写过的所有游戏本质上都是模拟器,而他认为模拟器是我们破解经济学等社会科学、人文学科难题的重要路径。这些学科的棘手之处在于,他们和生物学一样,都是涌现系统, 极难进行可重复的受控实验。比如你要调整利率相关参数,你只能在真实世界里操作,然后观察后果。 你可以有无数套理论,但没办法把这个实验重复成千上万次。但如果我们能通过 ai 精准的模拟这些复杂系统,就能基于高度精准的模拟器进行严谨的超量推演,这或许就能确立一门全新的科学, 这会让我们在那些目前充满高度不确定性的领域里拥有做出更优决策的能力。哈萨比斯说,他们现在已经在大量使用这种学习型模拟器, 用在那些我们要么对数学原理了解不足,要么系统过于复杂的领域。比如他们研发的天气模拟器 weather next 是 目前世界上精度较高的天气模拟器,运行速度远超气象学家目前使用的工具。再比如,在生物学领域,他们正在研究所谓的虚拟细胞,这是一个极其动态的涌现系统。 哈萨比斯提出了一个核心观点,正如数学是物理学的完美描述语言,因为在生物学和很多自然系统里,充斥着大量微弱的信号、弱相关性和含量的数据,这远远超出了人类大脑的分析能力, 但在这些海量数据里,确实存在着内在的联系相关性,甚至是因果关系,而机器学习就是描述这类系统的完美工具。 直到今天,数学都还无法做到这一点。要么是因为系统过于复杂,顶级数学家也难以驾驭。要么是因为数学的表现力不足以理解这些高度涌现的动态系统。更让人兴奋的是,一旦我们掌握了这些精准的模拟器,或许就能从中衍生出全新的基础科学定律。 你可以随心所欲地对模拟器进行无数次采样,或许终有一天能从中发现像麦克斯韦方程组那样基础的科学定律。 哈萨比斯说,他不知道对于这类涌现系统是否真的存在这样的基础定律,但如果他们真的存在,我们有机会通过这种方法发现他们。在这场专访的后半段,哈萨比斯聊到了一个更加底层、更加理论化的问题,宇宙的基本构成单元到底是什么?他给出的答案是,信息。 哈萨比斯说,我们都知道爱因斯坦的智能方程 e 等于 m 乘以 c 的 平方,他告诉我们,能量和物质本质上是等价的,但他认为信息也具有同样的等价性。 你可以把物质和结构的组织方式,特别是像生物这样能够维持有序状态的系统,从本质上视为信息处理系统。因此,物质、能量、信息,这三者是可以相互转化的。但他有一种强烈的感觉,信息才是最基础、最核心的。 这和二十世纪二十年代经典物理学家的观点恰好相反。那时的人们认为能量和物质是首要的,而哈萨比斯认为,把宇宙首先看作是由信息构成的,是理解这个世界的更好方式。 如果这个观点成立,那么人工智能的意义就比我们想象的还要深远。因为 ai 的 核心就是组织信息、理解信息、构建信息课题,本质上就是信息处理。 如果你把信息处理作为理解世界的首要方式,就会发现这些截然不同的领域之间存在着极深的内在联系。顺着这个话题,哈萨比斯还聊到了经典图灵机的计算边界,他说自己常常把自己视为图灵的推崇者, 因为艾伦图灵是他一生中最崇敬的科学英雄之一。图灵机的理论是史上影响深远的科学成果之一,任何可计算的事物都可以被一台描述起来相对简单的机器所计算。 因此,哈萨比斯认为,我们人类的大脑很可能也是一种近似图灵机。很多人认为很多复杂的问题必须用量子计算才能解决, 但哈萨比斯说,通过 alpha go, 特别是 alpha fold 这些系统,它们已经证明,披着现代神经网络外衣的经典图灵机 完全可以对那些此前被认为需要量子力学才能解决的问题进行建模,比如蛋白质折叠,在某种意义上,它就是一个涉及极微小粒子的量子系统。人们原本认为必必须考虑相关量子效应和其他复杂的相互作用才能解决这个问题, 但事实证明,利用经典系统就可以得出一个近似最优的解。因此,我们很可能会发现,很多我们曾以为必须依赖量子系统才能模拟的事物,只要方法得当,实际上在经典系统上也是可以建模的。 在专访的最后,哈萨比斯聊到了 ai 领域最宏大也最具争议的话题,意识。很多人会问,当 ai 变得越来越强大,甚至能模拟万物的时候,它什么时候会超越工具的范畴?拥有意识? 哈萨比斯的态度非常明确,也非常理性。他说,他非常强烈地感觉到,在构建 agi 的 过程中,较好的方式是先构建一个工具,一个极其智能、实用且精准的工具,然后再去探索下一阶段,哪怕只是做到这一步,本身的意义就已经足够深远了。 当然,现在我们正处于智能体时代的浪潮之中, ai 工具会变得越来越自主,越来越具有智能体的特征。 但关于它是否具备能动性,是否拥有意识这些问题,我们应该把它作为后续方向,甚至可以用第一步构建出的 agi 工具来帮助我们探索这些山凹的问题。 理想情况下,通过这个过程,我们也能更好地理解人类自己的大脑和思维。比今天更精确的定义意识这个概念,阿萨比斯说,关于意识的完整定义,至今仍然是一个悬而未决的问题, 但对他来说,有一些要素显然是意识的必要条件,比如自我意识、自我与他者的概念,以及某种时间上的连续性。这些对于任何看起来像是有意识的实体来说,都是必不可少的。 而关于 ai 能否拥有意识的核心差异,帕萨比斯认为在于底层机制的等同性。我们之所以认为彼此是有意识的,一方面是因为我们的行为方式表现的像是有意识的生命体。另一方面是因为我们都在相同的底层机制上运行,也就是人类的大脑, 所以我们会默认彼此的体验是相同的。但在人工系统上,我们无法实现这种机制的等同性,所以要彻底消除这个差异是非常困难的。我们可以从行为层面去审视 ai, 但在体验层面至今没有答案,这个问题或许要等到实现 a g i 之后才有机会去探索。 在专访的快问快答环节,哈萨比斯也给出了几个关键的答案。被问到预测 agi 的 实现年份时,他坚定地给出了二零三零年这个答案,而且他说在这个预测上他一直很坚定。被问到实现 agi 之后推荐的必读之书时,他推荐了戴维多伊奇的真实世界的脉络, 他认为这本书的思想至今依然适用,他也希望能借助 agi 解答这本书里提出的深刻问题。被问到在 deepmind 最有成就感的时刻,他的答案是 alpha fold 的 诞生。而如果要选一位历史上的科学家作为策略相关活动的队友,他选择了冯诺伊曼, 因为这种局势下需要一位博弈论专家,而冯诺伊曼是该领域的顶尖研究者。聊完了这场专访的所有核心内容,我想和大家分享几个基于对话本身的核心判断。第一个判断哈萨比斯的 agi 之路从来不是空中楼阁,而是一步一个脚印验证出来的。 很多人谈 agi 都是基于想象和概念,但哈萨比斯从十七岁开始就在用游戏验证 ai 的 可能性。 从主题公园到 elfgo, 他 始终在一个可控的场景里验证算法的能力,然后再把验证过的技术落地到更复杂的现实问题里。他从第一次创业里学到的领先五年不,是五十年的理念贯穿了他整个职业生涯。 这也是为什么 deepmind 能在别人都不相信 agi 的 时候,默默做出了一个又一个突破性的成果。第二个判断, ai for science 不是 ai 的 一个应用分支,而是 ai 使命的重要落地方向。现在整个 ai 行业,很多人都在盯着大模型的参数、商业化的收入、应用场景的落地。 但哈萨比斯从一开始就想清楚了, agi 的 核心价值不是帮人类写文案、写代码,而是帮人类拓展认知的边界,解决那些靠人类自身的智力永远无法解决的科学难题。 alpha fold 只是一个开始, 当药物研发的周期从十年缩到几天,当我们能模拟整个细胞、整个天气系统,甚至整个社会经济系统的时候,人类文明的进程都会被彻底改变。 第三个判断,哈萨比斯对信息本质的思考给了 ai 一个重要的定位。我们常说 ai 是 新一代的生产力工具,但哈萨比斯告诉我们, ai 的 意义远不止于此。 如果宇宙的本质是信息,那么 ai 就是 人类研发的强大信息处理工具,它不是用来帮我们提高生产效率的,而是用来帮我们读懂宇宙的底层语言,理解现实的本质。这也是为什么他会把康德和斯宾诺莎作为自己最喜欢的哲学家, 因为康德说,心智创造了现实,而 ai 就是 我们拓展心智边界,理解现实本质的重要工具。 第四个判断哈萨比斯对 agi 和意识的区分,是当下 ai 行业理性的态度。现在很多人谈 ai, 要么陷入极端的技术乐观,觉得 ai 马上就会到来,马上就会拥有意识。要么陷入极端的担忧,觉得 ai 会带来风险。但哈萨比斯的态度非常理性, 先把 agi 做成一个强大的工具,用它来解决人类的问题,拓展人类的认知,然后再去探索意识、能动性这些更宏大的哲学问题。 这种稳健不是保守,而是对技术、对科学、对人类文明最基本的敬畏。今天我们拆解的这场专访,没有行业八卦,没有商业爆料,没有夸张的预测,但它给我们展示了当代 ai 领域最顶尖的思想家,它的底层逻辑和核心愿景。 现在的 ai 行业,每天有无数的新模型发布,无数的新公司诞生,无数的商业故事在上演,但我们很少有机会停下来想一想, ai 的 核心意义到底是什么? 哈萨比斯用他的一生给了我们一个答案, ai 的 核心使命不是取代人类,而是拓展人类的边界,让我们能读懂宇宙的语言,解开那些困扰了人类几百年甚至几千年的科学难题, 最终更好地理解我们自己,理解我们身处的这个世界。二零三零年的 a g i 节点,不是技术的终点,而是人类全新科学时代的起点。好了,以上就是本期内容的所有内容,如果你喜欢本期内容,不要忘记关注、点赞、分享,这样就不会错过每一期的精彩内容,感谢收看,我们下期再见!

这是一款超级 ip 智能体,针对做短视频的朋友们,帮你一天就能产出百条短视频。先从某音八爆款文案提取后一键改写,还有 i i 法务帮你审核,审核过的文案可以克隆自己的声音,有八种情绪类型可选,声音克隆好, 还能刻镂你的数字人形象,接着生成数字人视频,之后自动剪辑,还能自动加字幕叫对字幕也能加话中话或者 bgm, 还能自动剪气口,剪完视频 标题和封面自动生成预览没问题就能自动发布到四大平台。这个系统既能手动操作,也能全自动运行,要是你自己有文案,也能拿来改写, 直接输入想要的内容就能完成改写。系统里还有声音克隆、数字人管理、素材库、任务中心、账号设置,这些功能我们每周都会更新一次系统, 现在市面上很多做短视频的小伙伴都在用,用这个系统一天能做上百条视频,高频触达用户,用户记住你了才有合作的可能。如果大家对这个系统感兴趣,可以在评论区留言,我发给大家试用。

朋友们,今天看了个新闻,让我有些激动啊!国内的脑颅科技第二例脑溢接口临床实验,成功帮助一名二十九岁的高位截瘫美术老师实现了自主进食与画画。此前脑颅科技也让一位截瘫八年的患者实现了意念控制。其实在一九七三年,加州大学的亚科维达尔就首次正式提出脑溢接口。 经过五十多年的发展,现在马斯克的 nicoink 是 发展最快的几家公司之一,目前全球已超过十位的重度瘫痪患者植入了 nicoink 的 设备,接受植入的患者已经可以打游戏、上网、操控电脑、光标等。中国虽然脑接口这块发展较晚,但发展很快, 已经有了包括脑科科技、强脑科技、伯瑞康等头部企业。现在脑机接口技术主流方式有三种,一种是最狠的,直接通过手术打开颅骨,把电击直接插入大脑皮层。马斯克的 nicoink 主要采用这种方式。 第二种是半侵入式,不开颅,不刺穿脑组织,电击放置在硬膜下方,坚固、安全与精度。第三种是非侵入式, 患者戴脑电帽或头环,采集头皮脑电波,进行外部设备控制。这一块中国走的很靠前,当然这项技术目前依旧存在着大量瓶颈。 首先,我们的大脑质地像豆腐,非常脆弱,传统硬质电击容易被大脑免疫识别,生成角质膜包裹,电击导致信号衰减,设备失效。其次, 就算是现在最顶尖的 netlink 拥有一千零二十四个信号通道,但对比人脑八百六十四亿神经元已有微不足道,目前也只能控制一下鼠标,上网,玩一下游戏。还有,如果大脑实现网络连接, 后面是否会出现针对大脑的病毒配合攻击?你的脑机接口天天给你发弹幕广告,这你受得了?虽然困难重重,但科技也永远向前。阶段,脑机接口最大的意义是帮助千万瘫痪神经疾病患者重建生活自理能力。当前的技术主要实现了从脑到机的输出, 随着技术的进步,注定会实现从机到脑的输入,包括知识、记忆等等。从长远来看,结合 ai、 人形机器人与网络技术,人类的交互方式甚至生命形态都有可能迎来颠覆性的改革。持续关注,我们一起看前沿科技!

告诉大家一个毛骨悚然却又不得不面对的真相,世界正在以你看不见的速度彻底崩塌。就在这两天,科技圈最不该被捅破的未来倒计时被直接摊在了所有人面前。你一定要认真听完,因为这根本不 是什么遥远的预言,是给旧世界按下的倒计时秒表。二零二六年,就是 ai 全面爆发的元年,不是未来就是今年。全球顶级科技圈层的共识已经无比明确,二零二六年底, agi 通用人工智能就会落地, ai 将进入完全自主的地归式自我迭代。一觉醒来, 技术就已经完成了待机跨越。第二,未来三到七年,一半的岗位会彻底消失。最先被替代的根本不是体力劳动者,而是坐在办公室里的白领。凡是不用动手搬东西的脑力活 i 全都会干。你的办公桌可能就是第一个被时代淘汰的东西。第三,学历正在变得一文不值。现在全球头部科技公司招人,只看一件事,你会不会用 ai 解决问题。以后没人会问你是哪个学校毕业的,所有人只会问你用 ai 做出了什么结果。听完这些,我真的惊出了一身冷汗。你 死守的存款,你拼尽全力拿到的学历,甚至你背了三十年的房贷,在这场时代巨浪面前,可能真的会变得一文不值。那普通人该怎么办?在家躺平买基金理财吗?绝对不行! 这场席卷全球的技术革命里,只给普通人留了一条活路,从被 ai 替代的人,变成驾驭 ai 的 人。未来的核心竞争力,从来不是体力,也不是单纯的脑力, 而是你的 ai 力。当土地红利和流量红利彻底消失,别再去死磕那些注定会被淘汰的技能了。 但最扎心的现实是,当你的竞争对手用 ai 把人效放大十倍的时候,你还在用人力死磕,这早就不是输赢的问题,是生存的问题。别再抱着侥幸心理觉得 ai 离你很远。二零二六年的今天, ai 的 浪潮已经冲到了你的脚边,你要么学会造船,乘风破浪,要么只能被浪潮彻底淹没。

二零三零年,中国将彻底改写你的生活!十大颠覆性改革正在发生!第八个,连马斯克都惊了!你有没有想过,短短五年后,我们今天习以为常的一切,开车、上班、看病、上学,甚至逛超市,都将被彻底重构?这不是危言耸听,而是正在加速落地的现实。 二零三零年的中国,正以智能文明为引擎,掀起一场史无前例的社会大迁徙。今天,我就带你穿越到二零三零年十一月的中国, 看看这十个即将震撼世界的巨变!第一幕,私家车成了古董收藏品。二零二五年,你还开着油车堵在高架上。到了二零三零年, 百分之九十的城市家庭已经不再买车。为什么?因为 ai 出行及服务全面普及,你只需在手机上点一下去公司,一辆自动驾驶电动车五分钟内就停在你楼下,全程零驾驶、零停车费、零保险,一年出行成本不到三千元, 比养猫还便宜。曾经风光无限的四 s 店,如今纷纷转型成智能座舱体验馆。因为杭州车主苦笑,我那辆三十万的 suv, 现在二手价只剩三万,连电池都不值钱了。第二幕,写字楼正在集体退休。在北京国贸、上海陆家嘴,那些曾经灯火通明的摩天大楼, 如今空置率超过百分之六十。为什么?因为全系远程办公已成标配。戴上轻量级 ar 眼镜, 你不仅能和同事面对面开会,还能在虚拟会议室里实时协助建模、修改代码。更关键的是,地狱壁垒彻底消失。成都的程序员可以为硅谷公司写算法, 兰州的设计师能接巴黎时尚品牌的订单,二三线城市迎来人才回流潮,房价、教育、医疗资源重新洗牌。第三幕,深夜发烧,来一声秒出诊断凌晨二点,孩子突然高烧,别慌,打开健康云 app, 用手机摄像头扫描面部加舌苔 a 爱医生,三十秒内生成诊断报告。病毒性感冒,建议服用什么药?多喝水,无需去医院。这套系统背后,是国家医疗大模型,接入了全国三甲医院十年的病例 数据,准确率高达百分之九十八,费用只要五块钱。社区诊所纷纷转型为 ai 辅助诊辽站医生的决策成了怀旧主题公园儿。 二零三零年,全国百分之九十五的加油站已关闭或改造为综合能源站,充电换电、轻能补给一体化新型固态电池电动车五分钟充满,续航八百千米,每公里电费不到五分钱。更深远的影响是,中国原油 进口量比二零二五年下降百分之六十二。中东产油国紧急召开特别会议,讨论后石油时代的生存战略。而中国的新能源产业链,已占据全球百分之七十市场份额。 第五木商场里再没人排队结账。走进任何一家超市,你只需拿起商品走出门口,自动识别、自动扣款、自动开电子发票,整个过程零接触、零等待。收银员岗位消失百分之九十。 但智能零售运维师、行为数据分析师等新职业爆发式增长。深圳万象城市点无感购物节区日均客流量翻倍,退货率却下降百分之四十。消费者说,买东西像呼吸一样自然。 第六幕,堵车那是什么?二零三零年,红绿灯成为历史名词,所有车辆接入城市交通云脑,由 ai 统一调度路径、速度兼具,早晚高峰通行效率提升百分之三百,交通事故率下降百分之九十二。在上海浦东新区,平均 通行时间从五十二分钟缩短到十八分钟。市民调侃,现在最难的不是开车,是说服爸妈别天天出门兜风。第七 一木书包平板就是整个教室,小学生背着三千克重的书包上下学,那是二零二零年代的苦 情剧。如今,一块教育平板就可以装下从小学到高中的全部教材。实验模拟 ai 辅导系统,更厉害的是个性化学习引擎,他能精准识别孩子哪道数学题总错,哪个英语发音不准。自动生成专属训练计划。北京某重点小学试点后,班级平均分 升二十一分,辍学率归零。第八幕,太空旅行,普通人也能上天二零三零年,中国商业航天迎来爆发期,亚轨道太空旅行票价降至三十八万元,已有超二万名普通游客完成地球边缘之旅。更惊人的是,海南文昌酒泉卫星发射 中心周边已建成太空文旅小镇,配套酒店、培训中心、纪念品商店一应俱全。一位来自河南的中学教师激动的说,我攒了三年工资带女儿上了太空,他回来后立志要当航天工程师。 第九木,家里有个三 d 打印工厂,想换个花瓶打一个,需要儿童玩具打一个,连假牙都能在家打印。二零三零年,家用智能三 d 打印机普及率达百分之四十五,材料成本仅为试售商品的十分之一。义乌小商品市场 紧急转型,从制造、批发转向设计、授权加数字版权交易。一位老板坦言,以前靠量取胜,现在靠创意吃饭。第十木,独居老人比子女还被照顾 张奶奶七十八岁独居杭州。她手腕上的智能手环不仅能监测心率、血压,还能通过步态分析预测跌倒风险,提前十分钟预警,并自动联系社区护士。更暖心的是, a one 陪伴机器人会陪她聊天、 提醒吃药,甚至教她跳广场舞。子女在外地工作,却通过家庭数字孽生系统远程探望。张奶奶说,她比我儿子记得我生日还准。时代的分水岭,谁会被淘汰? 谁将崛起?这时,大变格背后,是一场残酷的职业大洗牌。会计、客服、翻译、基础文员,这些重复性强的工作,百分之九十已被 ai 接管。麦肯锡最新报告预测,到,二零三零年, 中国将有一点二亿岗位消失,同时诞生八千万新职业。但问题来了,我们的孩子还在为那些即将消失的岗位拼命刷题。他们被公式练速算、默写标准答案,却没人教他们如何与 ai 合作,如何提出好问题,如何创造新价值。真正的起跑线不在分数,而在思维。

大家好,我是 ai 启示录。就在过去四十八小时,全球 ai 行业发生了自 chat gpt 诞生以来最剧烈的一次格局震荡,维持了近两年的 ai 四级格局一夜崩塌, 原本并驾齐驱的四肢力量,以所有人都没预料到的方式,直接跳进了双雄对决的终局战。五月七号,埃隆马斯克亲手解散了他一手打造的 xai, 而原本属于 x a i 的 由二十二万张顶级 gpu 组成的算力集群,被权数长期租借给了 ansurfik。 就 在第二天,也就是五月八号, ansurfik 正式宣布成立专属研究院 t a i, 一 次性抛出了五十三个关乎 ai 终极走向的核心问题,同时它们下一代大模型的完整技术路线图也完整曝光在了公众面前。 很多人只看到了马斯克战队 antropica 的 戏剧化场面。但真正值得我们警惕的是,这场变局不是一次简单的算力转移,它直接改写了通往 asi 的 赛道规则。原本我们以为还要打两三年的半决赛在一夜之间就结束了, 现在的硅谷只剩下两座真正能站在终极赛道上的山峰。一边是手握谷歌长期算力支持,又吞下 x a i 二十二万张 gpu 的 antropic, 另一边是依然手握行业先发霸权的 openai。 接下来,我会把这两天发生的所有关键事件背后的技术路线变化,以及这场双雄对决真正的核心矛盾,全部给大家讲清楚。在这次变局之前,全球 ai 行业的顶层格局一直是 antropic、 open ai、 google deepmind、 x ai 这四家形成的四级格局, 这四家是目前全球仅有的同时手握顶级前沿模型、充足算力储备、完整研发体系和规模化商业收入的玩家。其他的厂商要么在模型能力上差了一个量级,要么在商业化上还没跑通,根本无法进入这场通往终极智能的核心竞赛。 但这个维持了近两年的微妙平衡,在五月七号被彻底打破了。马斯克宣布解散 x c i, 这支曾经被日内视为最有可能挑战 open i 的 团队直接退出了顶级赛道的竞争。更关键的是, x a i 手里最核心的资产,二十二万张顶级 gpu 组成的算力集群被权数长期租借给了 antropic。 这不是一次简单的商业合作,这是一次结构性的算力格局重构。要知道,目前全球顶级 ai 竞赛的核心瓶颈之一就是算力。 二十二万张顶级 gpu 是 什么概念?这几乎是目前全球单一主体能调动的最大规模的独立算力群体之一。这笔算力的注入,直接让 entropic 在 算力储备上拥有了和 open i 正面抗衡甚至局部反超的底气。 就在算力尘埃落定的第二天,也就是五月八号, entropic 立刻放出了第二个重磅动作,正式成立 the entropic institute, 也就是我们后面简称的 t a i 研究院, 同时发布了完整的研究议程,一次性抛出了五十三个关乎 ai 未来的核心研究问题。而在这之前,在刚刚结束的 coldwave cloud 开幕演讲上, antropica 的 产品研发主管 d n pen 已经非常直白地批露了下一代 cloud 模型的三大核心技术方向,相当于直接把自己未来一到两年的路线图摊开在了所有人面前。很多人可能会问,为什么 antropica 在 拿到这笔巨额算力之后,不是先藏着掖着闷头研发,反而要把自己的研究历程和技术路线这么大方的公之于众? 这个问题的答案,恰恰就是我们接下来要聊的这次事件里真正重要的变化。真正值得我们关注的,从来不是 antelope 多了多少张显卡,而是他们拿到这些算力之后要去解决的问题和他们要走的路。 先来说刚成立的 t a i 研究院,很多人会觉得这就是大厂常见的装门面的研究院,但事实完全不是这样。首先, t a i 的 研究议程不是空泛的学术探讨, 它的四大研究方向,经济扩散、威胁与任性、 ai 社会影响、 ai 驱动的研发加速。每一个方向都直指当前 ai 发展最核心也最危险的命题。 而这五十三个研究问题里,最刺痛人的是 anselpic 自己提出来的一个正在逼近的现实,如果一个三人的团队现在就能完成以前需要三百人才能做完的工作, 整个产业的组织形态会发生什么?这句话不是凭空的猜测,而是 entropy 在 内部已经观察到的真实变化。我们后面会聊到的 cloud 的 相关模型,已经在软件工程、安全工房这些领域实现了这种数量级的效率提升。三人取代三百人,这背后不是简单的裁员问题, 而是整个人类社会的职业结构、人才培养体系,甚至经济运行规则都要面临彻底的完未的问题, 当 ai 驱动 ai 自身的研发时,会不会出现地归自我改进?如果真的出现了,人类还有没有能力监督这个过程?对于这个问题, anselpik 的 回答非常坦诚,不知道,但他们明确提出,必须现在就开始研究, 甚至要为可能出现的 ai 危机建立类似冷战时期热线一样的基础设施,确保在最糟糕的情况下,至少还有一条能沟通的渠道。他们直言,光靠公司内部的安全团队已经不够了,需要一个独立的机构去问那些公司商业层面不敢问也不能问的终极问题。 这里有一个非常关键的细节,很多人都忽略了。 t a i 不是 一个脱离业务的象牙塔,它的所有研究成果都会直接输入 antropic 的 长期利益信托 l t b t 直接影响公司的核心决策。 而 l t b t 的 唯一使命,就是确保 antropic 的 所有动作始终以人类的长期利益为核心。换句话说, antropic 不是 在为下一个版本的模型做准备,它们是在为 ai 可能出现的超出人类控制的质变提前做布局。 他们成立这个研究院,本质上是给自己建立了一个独立的监督机构,提前预判和应对 ai 发展带来的所有潜在风险。 聊完了长期布局,我们再回到当下,看看 antropics 下一代模型的三大技术方向,这才是他们和 openai 对 决的核心武器。 在 code with cloud 的 演讲里,该样喷把下一代 cloud 的 核心升级清晰地分成了三个方向,更高的判断力和代码品位近乎无限的上下文窗口多智能体协调能力。 乍一听,这好像就是常规的模型升级。但如果你把这三个方向连起来看,就会发现, antropolis 要做的根本不是让 cloud 变得更会聊天,更会写文案。 他们要做的是把 cloud 从一个单次响应的对话框工具,彻底改造成一个能长期自主运行的工程合伙人。这里有一个核心概念叫任务世界。 什么意思?就是衡量 ai 能独立、不间断的工作多长时间,同时产出的质量不仅不下降,反而还能持续提升。 dion 在 演讲里给了一条非常清晰的时间线,让我们能直观感受到这个变化有多恐怖。几年前,科奥的最拿得出手的能力是写一封像样的商务邮件,当时所有人都已经觉得很惊艳了。 一年前 gpt 四发布的时候,一个智能体能独立稳定运行一个小时就已经是行业顶尖水平。六个月前, cloud 的 智能体已经能通宵跑任务 人类,睡一觉醒来,他已经把交代的工作全部做完了。而就在上个月,相关模型直接读完了整个 open bcd 的 源代码库,找到了一个在里面藏了二十七年的安全漏洞。这个漏洞过去三十年里,所有的人类审查者,所有的静态分析器全都没发现。 从几分钟到一小时到通宵,再到能完成人类三十年都没做完的工作,这不是限性的进步,这是数量级的跨越。而 antropics 下一代模型的三个方向,就是要把这个任务世界从小时级、天级直接推到永远在线的级别。 我们一个个来看。第一个方向,更高的判断力和代码品位。这不是说模型会写更多代码,而是它能做出高质量的技术决策。 简单来说,以前的 ai 是 你告诉他要写什么,怎么写,他帮你敲代码。而现在的 cloud 是 你告诉他要实现什么目标,他自己来判断用什么技术方案,怎么规划路径,甚至自己发现逻辑错误,自己回溯修正。 目前已经落地的 oppo 四点七版本就是这个方向的阶段性成果。很多开发者团队把编码智能体切换到这个版本之后,解决的生产工程任务数量直接是之前的三倍。 更重要的是,它能在规划阶段就自己发现逻辑漏洞,自己修正,最终的执行更快更干净,根本不需要人类给他搭复杂的脚手架。 opus 四点七发布的次日, anthropic labs 就 推出了 cloud design, 实现设计加代码双线并行。已经有开发者用这个组合直接构建出了生产级的产品界面。这是什么概念?这意味着 ai 已经从一个执行者变成了一个能独立做决策的规划者, 这是从工具到劳动力的核心质变。第二个方向,近乎无限的上下文窗口。很多人对长上下文的理解就是能一次性塞更多的文档进去。 但 antropopy 要做的根本不是简单的长度叠加,而是通过高质量的记忆机制,让模型在长时间跨任务的运行中,始终能保持上下文的连贯性和理解深度。 举个例子,你让一个 ai 帮你做一个为期三个月的项目,以前的长上下文可能能记住你第一天给的需求文档,但到了第二个月,他可能就忘了中间的决策细节、踩过的坑,调整过的方向。 而 antropica 要做的无限记忆,是让 ai 能像一个真正的项目合伙人一样,全程记住所有的细节, 理解每一次调整的原因,甚至能基于之前的所有信息,主动预判你接下来要做的事。第三个方向, 多智能体协调能力。这个就更值得关注了,它能让多个 cloud 的 实力组成一个智能体团队,分工合作,完成单一模型根本做不到的复杂目标。比如一个智能体负责产品规划,一个负责技术架构,一个负责代码开发,一个负责测试验收, 他们之间能自主沟通、自主协调、自主解决冲突,根本不需要人类在中间传话。把这三个方向合在一起,你就会明白 osrb 的 野心。他们要做的不是一个更好用的 ai 聊天框,而是一套能完全替代人类团队的自主运行的智能系统。 当 ai 的 任务世界从分中级跨越到天级,甚至永久在线,它的本质就从一个提升效率的工具,变成了能完全替代人类劳动的数字劳动力。 聊到这里,很多朋友可能会有一个疑问, antropic 的 这些动作,到底是真的有实质性的突破,还是只是又一场科技圈的营销造势?我们用已经发生的可验证的事实来做判断。 首先是模型能力的质变,已经有了非常扎实的落地案例,最有代表性的就是相关模型在网络安全领域的表现。就在今年四月,穆斯勒的 firefox 团队用相关预览版在一个月里修复了四百二十三个安全漏洞, 这个数字有多夸张?过去十五个月, firefox 团队总共只完成了三十一次漏洞修复,相关模型一个月的工作量是过去一年多的十几倍。更关键的是,它在整个过程中没有出现一次误报,所有找出来的漏洞都是真实有效的。 要知道,网络安全漏洞的挖掘是软件工程里对能力要求最高的领域之一,他不仅要求你能读懂几百万、几千万行的代码,还要能理解代码背后的逻辑链条,找到人类都发现不了的隐藏缺陷。嗯, 相关模型能做到这个程度,而且零误差。这已经不是简单的代码能力强,而是他已经具备了超大规模的深度的逻辑推理和逆向分析能力。 这也是为什么有人说相关模型是第一个具备足够能力、需重视潜在影响的 ai 模型,它的 网络攻防能力完全是训练过程中意外溢出的副产品。 antropic 并没有专门针对这个方向做训练,但模型的通用能力已经让它在这个领域实现了对人类的超越。目前, antropic 已经通过 project glasswing 给微软、苹果、 linux 等企业和机构开放了相关模型的早期访问, 让他们能在恶意利用这些漏洞之前提前完成修复。其次是商业层面的指数级增长,这是最不会骗人的证据。根据公开的数据, antropic 的 营收在二零二五年直接翻了接近十倍,目前的年化营收已经达到了三百亿到四百亿美元。这个数字是什么概念? 它已经超过了麦当劳,超过了万事达,超过了很多我们耳熟能详的世界五百强企业 o s s capital 的 创始人 joseph jackson 甚至预测,如果 anthropic 继续保持目前的涨势,到二零二八年中期,它的营收将超过谷歌母公司 alphabet。 如果说 openai 的 增长速度已经让人难以置信,那 anthtropic 的 增长只能用匪夷所思来形容。要知道, openai 从成立到年化营收三百亿美元用了接近六年的时间,而 anthtropic 只用了三年,而且这个增长还在加速。 根据第三方机构 cme analysis 的 计算,仅仅今年前三个月,他的营收就又翻了三倍。这种指数级的商业增长背后只有一个原因,他的模型能力已经在真实的商业场景里创造了实实在在的价值,企业愿意真金白银的为他付费,而且是大规模、持续性的付费, 这才是对 ai 能力最硬核的验证。第三,我们要聊到一个非常关键的话题,一年前引发整个科技圈震动的 ai 相关报告,正在以比所有人预想都更快的速度变成现实。 这份报告在一年前发布的时候,很多人都觉得是危言耸听,是警示寓言。他提醒说,二零三零年之前,人类可能会面临 ai 带来的重大影响,同时也预测了一系列 ai 发展的关键节点。而现在回头看 oslopec 这两天发生的所有事情,几乎都在验证这份报告的逻辑链。 就在五月七号, google docs 的 联合创始人 steve newman 也专门发布了一篇长文,标题就是相关报告正在成真。报告里预测模型能力会意外溢出到安全攻防领域,现在相关模型已经做到了。 报告里预测 ai 会驱动 ai 自身的研发,加速出现地归自我改进的苗头。现在 osrbic 已经把 ai 驱动的研发当成了核心研究方向,报告里预测三人取代三百人的产业冲机会发生。现在 osrbic 已经在内部观察到了这个现实, 甚至报告里预测的前沿 ai 厂商的营收规模,现在 anflap 也已经提前达到了。当然,这里我们必须客观地说,目前的进展并不是完全和报告一模一样。根据报告作者自己的计算,目前 ai 的 定量进展大概只有报告预测的百分之六十五左右, 尤其是最核心的 ai 驱动, ai 研发的效率提升目前只达到了报告预测的百分之十七。而且即便是最先进的相关模型,依然有非常明显的短板,它还不能完全脱离人类在生产环境里独立运行,经常会把相关性当成因果性,也很难全面的考虑多因素的复杂问题。 换句话说, ai 的 爆炸式发展确实正在发生,但它还没有完全脱离正常技术的范畴,依然受到真实场景落地、企业采用速度、人类规范等多方面的约束,我们既不能无视它正在发生的质变,也没必要陷入过度的担忧。最后,我们来聊聊这场双雄对决到底在争什么? 很多人觉得这就是 antropics 和 open ai 谁的参数更大,谁的模型更聪明的竞赛,但事实根本不是这样, 这场终局战的核心从来不是参数的比拼,而是两条 ai 发展路线的对决,更是对 ai 发展方向定义权的争夺。 open ai 走的路是先把模型能力做到极致,先实现 agi, 再去解决安全、社会影响这些问题。 而 oslopez 走的是完全相反的路,他从成立的第一天起,就把 ai 安全、人类长期利益放在了最核心的位置。他的模型训练从一开始就基于相关安全框架,现在又成立了独立的研究院,去提前研究 ai 可能带来的所有风险。 而现在,随着 x ai 的 算力注入, antropica 终于在模型能力和算力储备上拥有了和 open ai 正面抗衡的实力。这意味着这场 ai 终局战不再是一家独大的单边序势,而是两条路线的正面碰撞。 未来 ai 会往哪个方向走?人类能不能在享受 ai 红利的同时合理管控相关影响,很大程度上就取决于这场对决的走向。 聊到这里,我想很多人都会有一种强烈的不真实感,好像就在一两年前,我们还在为拆 jpt 能写一篇通顺的文案而惊叹。而现在, ai 已经能找到人类三十年都发现不了的漏洞,能替代三百人的团队,甚至已经开始研究自己驱动自己进化的可能。就像相关报告里说的那句话, 当下的变化速度可能已经是我们余生中最慢的了。对于我们每一个人,尤其是开发者和创业者来说,面对这种指数级的变化,最忌讳的就是用现行的思维去判断未来。 entropic 在 演讲里给所有开发者的建议,我觉得非常值得一听,不要为今天的 cloud 去构建, 要为还没到来的更强大的模型能力去构建。过去我们搭脚手架是为了弥补模型的不足,而现在脚手架的作用是放大模型本身的智能 ai 的 指数级进步不会停止, 未来的模型一定会比现在强大的多,真正能抓住下一波机会的人,一定是那些能提前预判趋势,为未来的能力提前布局的人。好了,以上就是本期内容的所有部分, 如果你喜欢本期内容,不要忘记关注、点赞、分享,这样就不会错过每一期的精彩内容。感谢收看,我们下期再见!