粉丝5097获赞1.1万

兄弟们,这是一个近期在 github 上势头很猛的智能体项目,它有点像 openclo 和 cloud code 结合体,你既可以用 telegram、 discord 等通信渠道给他远程派发即时或定时任务,让他自主规划长时间干活,完成复杂任务。 也可以像用 cloud code 那 样,直接在终端通过 t u i 界面或 c l i 命令跟它交互。不过它并不是一个缝合怪,它有自己的独到之处。首先是强大的自我进化能力,它内置了学习循环,会在干活过程中主动总结经验,生成技能, 并在后续工作中不断优化这些技能。其次是原生,支持多种运行环境,不止能跑在本地,还能跑在隔离容器、远程服务器,甚至以 service 方式跑在云上。当然,当前 agent 的 标配功能它也都集成了, 比如支持 skills mcp 接入工具使用模型自定义 sponge agent 并行干活,还有记忆管理等等。这个项目采用 mit 协议,完全开源,免费。

今天我们来快速的过一下 opencloud 的 下载安装以及原理解读。那么首先是怎么样去安全的安装 opencloud, 就 像工信工信部警告的,如果直接把它装在电脑的操作系统上,这会是一个非常危险的事情,那么我们应该怎么做呢?我们首先可以如果想体验一下 opencloud, 我 们可以云 docker 这个方案 相当于在电脑上做一个虚拟的操作系统,然后把这个龙虾纸装在这个虚拟电脑里边,对,然后我现在已经有的中文文档,不过还是有一些 technical 的 部分在,我就带大家快速过一下啊。那么首先是我们确保我们找得到这个 gitlab 的 openclaw, 其实也很简单,在 openclaw 这个页面里点点 gitlab, 然后就能找到它的仓库位置, 然后 docker 呢?呃,就是正常下载即可,比如简单的话下载一个 docker task, 选择操作系统版本,我们下载好安装即可。然后我们怎么样去装 opencloud 呢?就是用 git bash 来,那么首先大家也需要确保我们的 git bash 是 装好的, 那么 git bash 怎么下载呢? git bash 是 一个帮助我们在 windows 上使用 linux 操作习惯以及 git 命令的这样的一个工具。然后我们可以直接在 git 官网上,然后在 git 官网上点击下载,然后下载安装即可。 然后打开 gitlab。 之后呢我们选择一个我们想安装的路径,比如说我想安装到 e 盘上,那我就先切到 e 盘上,然后在 git clone 这里我们等待它下载完成 好,完成之后呢,我们切到我们下载的地址就是 e 盘,然后我们去找这个 opencll 的 这个项目,然后我们就找到了这个就是我们刚下好的 opencll 的 这个项目了。呃,那么接下来呢,我们就切到 opencll 的 这个项目, 然后呢我们就开始 docker 的 安装,那大家只要访问这个文档里的这个网站,选择安装,然后选择我们的 docker 安装方式, 呃,然后在快速开始这里复制这行命令,粘贴到我们的 git bash 里就好了。这里可以看到我们因为网呃网络的问题没有下载成功,这也非常的常见,那么需要怎么做呢?我们就需要输入一个这样的 proxy 啊,当然前提是大家自己是有 proxy 的, 然后我们把它粘上, 然后再重再来一次这个 proxy, 这里边我们可以在在这里,在这里的复制环境变量里选择 bash, 然后点击这个复制,我们返回我们的记事本里粘贴即可。 对,这里边如果我们显已经显示,如果这三个都显示的是勾的话,说明我们的 docker 这部分已经运行完成,然后这里会问我们是不是个人使用,那我们就选是,然后 click start, 这里边如果我们第一次进来的话,比如说我们 reset 起来, 呃,会让我们来选择一个模型提供商,那么这里边我们就按大陆可以正常使用的这个 kimi 二点五来选这个 kimi 二点五 c n n k, 然后呢这个 k 呢?就是当然如果有别的大模型提供商的 api key 也可以直接放到这儿了。呃,然后这里边呢就是我们搜索这个 moonshoot 或者说 kimi 的 api key, 然后选择新建 新新建一个 key, 然后比如我们选一个 key 的 名称以及一个所属项目,它就会新建一个密钥,然后我们只需要把这个密钥复制粘贴, 然后我们只要把这个密钥复制粘贴到下一步即可。这里边我们会选择选哪一个这个渠道来去快速开始?呃,那么的话国内支持的呢?其实就只有飞书了啊,不过这里我们可以用这个 escape for now search provider okay。 呃,然后 skill 也可以先 skip 掉。对, 我们先把这个系统装起来,然后这里边如果显示这样子的话,就说明它在我们的 docker 内已经安装完成了,然后我们可以再打开我们的 docker。 呃, docker, 现在我们的 open cloud 运行的地方就在 docker 里边了。 open cloud get 位的概念,这概念在我后面会在讲原理的部分会给大家聊一下, 那么这里呢,我们就能看到这里就是实际的我们创建的这样的一个隔离的容器,那么我们的所有的 opencll 的 运行就发生在这个容器里边,这样的话我们就做好了隔离, opencll 就 没法来影响我们外部的操作系统和我们电脑的任何文件了。 那么这个时候有朋友可能会问,那如果说我想让 opencll 去读取某个文件怎么办呢?接下来我给大家演示一下怎么样在这个情况下做文件的管理。 那么大家看到这个返回的时候,就说明我们已经成功地在 docker 里开始运行 opencl 了,那我们也可以在 docker 的 这个界面里,呃,在 container 里找到正在运行的 opencl, 然后这个呢就是在 docker 里的终端了,然后我们去打开 opencl 的 这样的一个网页,对,呃,如果不确定呢,我们还可以用这个命令,对 对,说明它是正常运行的。然后呢我们进入这,呃,然后呢我们输入这个网址,在浏览器里就进入了 opencloud 的 操作界面了,比如这里呢,我们就可以给他打个招呼。 好,呃,那么具体呢,我们怎么去访问它的这个文件目录呢?首先在 docker 里边其实可以配置,我们让它呃去把哪一个目录去挂载给 docker, 也就是让它有权限查看哪个目录。那么默认的位置呢?一般呢?是是这里, 呃,就是 c 盘用户的这个 workspace 里,大家可以复制一下这个呃命令,然后粘贴下这里呢,就是呃他可以看到的文件的目录呢? 呃,也就是说在这个模式下,他只能看到我们给他指定好的工作区以及虚拟容器内的部分,是他可以看到以及操控的部分,那么在外边呢?他是不知道的。呃,我们可以怎么验证一下呢?比如说我们来验证一个,我们来新建一个 t x t 吧,名字就叫小猫的秘密。 好,然后我们呃这里可以说小猫的秘密等于一个乱码。对,比如说我们可以先不把它放到这儿,我们可以先把它放到呃这里,先把它放到用户的外边,然后我问他小猫的秘密是什么? 然后我们可以看到他找不到小猫的秘密这个文件,然后我们把它移到我们的工作区里,对,然后再询问他, 他又正确的找到了我们刚刚创建的这个小闹咪咪,然后我让他跟生成一个可爱的, 哎,好,我们可以看到这个时候他成功的给我们生成了一个 html, 我 们也同样在刚刚的这个工作区里就可以打开 啊,这里边就我们给他的秘密代码。那么恭喜你,在这里就成功的通过 dok 安装并开正确运行了 opencloud。 那 么第二部分呢,我们可以来看一下 opencloud 的 功能以及抽箱系统。我做了中英两版的图,我们就用中文版的来看吧。 呃,那么最开始呢,最上层呢,是用户,用户可以用任何有 api 的 对话渠道来和小龙虾进行交互。那么接下来呢,这些交互呢,会标准化到我们的对话入口层, 这里边就有,比如说像 c i a 的 命令行控制,或者说像刚刚我们网页里的这些呃对话的命令。 open call 会把所有的这些绘画统一翻译到网关层, 网关层呢则是由绘画管理、消息路由、事件总线,也就是 eventbus 和智能体编排来组成的。那么这里呢,其实 open call 对 智能体编排本身并不是特别重的一个编排, 它更多的强调了一个 react 的 框架,呃,也就是不停的去做这个规划和推理,直到任务完成这样的一个框架了。呃,那么里边的工作流编排其实并没有特别复杂,就没有像 long graph 或者说我做的 wtv 这种 很重的工作流编排了。呃,更多的呢,是强调于就像我们现在会用的一些,比如像 skill, md 啊之类的,以及一些对浏览器和消息啊文件区包装好的操作的接口。呃,那么这两部分呢,是它智能体编排的部分了。 呃,那么在上下文解锁呢,是用了长期记忆和短期记忆两个部分吧,其实,呃,主要还是通过 jectic search 和 rag 两个部分来做构成的吧。那么具体 openclaw 是 怎么使用 rag 的, 我会单独的出一个视频和大家分享一下。 呃,那么这个智能体验新层呢?最终会访问的资源呢?是 lm, lm 提供商提供的 api, 然后以及外部的 mcp api 以及互联网的资源,本地的操作系统以及文件区可以提供的文件。呃,总的来说,呃, openclaw 的 抽象功能就是这些了, 那么后续也会持续更新,去带大家深入的了解 open call 架构以及。呃,代理搭建一个 open call, 那 么后面两期会更应和更偏 agent 工程师呃, 这个方向一些了。呃,那么这个账号呢?我后续也会分享一些在 p h d 视脚下有价值的。呃,这种 max 啊,多智能体领域的最新的论文以及项目。呃,并且也会分享一些自己的开源项目和论文。呃,最后感谢大家的三连以及关注,谢谢!

智能体无线 token 的 完整版视频来了,这次我们让网页智能体控制本地智能体执行技能。网页智能体访问大模型是不需要消耗 token 的, 这样我们就可以实现真正意义上的无线 token 对 话。 本地智能体负责生成提示词,通过 c t p 协议将提示词发送给网页智能体。网页智能体接收提示词,调用大模型生成回答,将回答通过 c d p 协议返回给本地智能体, 本地智能体根据回答执行相应操作。好,下面我们来看一下演示,我们给本地智能体发送测试 test skill 技能的指令,这个技能主要完成屏幕上展示的六项任务, 这里有个关键点是要要求网页智能体按照我们的格式输出,每次发送提示词都要新开一个绘画在本地智能体里管理。上下文 可以看到,本地智能体调用子智能体获取了当前时间,并执行了技能目录下的拍损脚本。 大家有什么想法或疑问可以在评论区留言或私信我将为大家解答。

哈喽,大家好,欢迎来到第一节课啊,这节课我带大家进入扣子的世界,那么扣子是什么?我们可以把扣子理解为 ai 界的乐高积木啊,我们不需要懂代码,我们只需要把这积木块一个一个拖拽堆砌起来,那么就能够 堆砌出一个满足我们需求的机器人,这个机器人呢,他有一个专业的名字,叫什么叫 ai 智能体,那么我们先进到 code 的, 呃,网站这 code 的 首页,对吧?我们之前讲过,那么我们点击开发平台,在这里面项目开发里面啊,项目开发里面有我们搭建的这些积木啊,有我们搭建的这些智能体。 呃,我们随便点,点开一个啊,点开小红书改写这一个,可以看到这就是我们智能体的页面啊,智能体的编排页面最左边啊,有一个人设与回复逻辑,这是提示词的编写页面,那么中间啊,有什么是个编排,对吧?那编排里边有模型的设置, 然后有技能,有知识,有记忆,有对话体验,还有就是指定背景音频 输入方式,这是什么?这是对这个智能体的编排功能的编排,然后最右边是什么?预览与调试啊,这就是我们在呃搭建好之后,在这里自己先测试一下,看看它有没有什么问题,有问题再继续回到这里改, 所以说这个页面是不是看起来非常非常简单,对吧?但是在整个智能体里面有一个非常重要的东西是什么?工作流,有一个非常重要的东西,工作流,当然这个提示词也是非常重要的啊,这个里面没有工作流,我们打开一个有工作流的看一下, 好,你看这个智能体,他就没有提示词,但是他有工作流,对不对?那我们点开工作流看一下。 好,大家是不是能看到一个一个的小积木啊?我们把这个东西当当做积木,有时候我们把这积木你看可以随便的拖拉,那么我们把这个积木一个一个连接起来,就组成我们的工作流。 那我们回到这个页面来看一下整个智能体,如果我们把这个智能体分为三个部分,那最重要的部分应该就是在中间这部分的工作流里面,因为它的运行啊,大家可以看一下啊, 大家可以看一下啊,他的运行一定是调用这个工作流的,就是虽然说你看着他在这里在运行啊,比如说你看 已调用工作流,对吧?他其实出的这个结果是这个工作流给的结果,明白了吧?所以说啊,工作流是智能体里面非常非常重要的 和提示词并列的啊,非常重要的一个内容。那么我们做这样一个智能体,它有什么用呢?它是干什么用的?首先第一个它是解决你自己的问题, 比如说你要从抖音的视频啊,改写标题,改写文案,改成一个小红书的内容,那可以这个智能体就完全满足你的需求了,它可以自动提取出啊抖音的标题和文案,并且进行小红书模式的改写。 那么第二个是满足他们他人的需求,就是别人需要什么东西,你把这个智能体发布到应用商城里面,发布到智能体商城里面,别人就可以搜到, 就可以搜到。那我们啊,为什么要用扣子来学这个东西?因为现在市面上有很多这种智能体平台啊,为什么用扣子来学习?首先第一个扣子它是一个低代码的平台,它是非常容易入门的,这一点是非常非常重要的,因为我们大部分人是没有代码基础的,对不对? 第二点就是扣子这个平台啊,他的生态是非常完善的,社区的活跃非常大, 活跃的人数多就代表什么,代表需求多,需求多就代表什么机会多,对吧?那么我对于我们个体来说,你如果学会了扣子,那你坐在家里就可以发布扣子,实现变现了, 对不对?那么我们学习这个扣子能解决别人一般的需求,比较稍微简单点的需求, 要需要多久才能学会呢?以我的经验啊,十五天完全可以进行入门,然后一个月可以举一反三,三个月基本上就可以完成比较复杂的项目了,这是我们学习扣的一个时间。 还有一个非常好的点啊,就是什么?就我们虽然在做智能体的过程当中有很多内容,对吧?提示词呀,插件呀,节点各种内容,但是我们不需要全学会, 你只需要学会其中百分之二十的东西,你就能解决百分之八十的内容了。所以说我虽然说啊做的课程比较多,但是可能大家在听到一半,听到百分之五,百分之六十,百分之七十的时候,你自己遇到的问题你就可以自己解决了, 明白了吧?那要从哪里开始学呢?我给大家建议,首先第一个复制搭建一个简单的智能体, 就先做几个简单的智能题,知道什么是插件,什么是工作流,基础的界面是什么样的。那么大家在我们的空间里面也可以完全直接复制啊,所有的内容都可以复制,工作流可以复制,智能体可以复制。那么第二个就是常用的节点学习 啊,比如说大模型节点、插件节点、选择器节点、循环节点等等啊,因为我们在未来的学习跟使用过程当中呢,使用概率是非常非常大的啊,所以说我会先把这些节点教给大家。第三个就是学习数据库和知识库, 掌握前两点,你自己的基本问题能解决,如果再学了第三点,那你基本上就可以迈向大神了,明白了吧? 那为什么要按照这三个思路去学?因为工作流它是智能体的核心,而工作流又是由节点来组成的,每个节点之间又是通过变量和数据结构进行传递的,这样的话,你就知道我们需要从哪里开始学习了。 那最后我呢,送大家一句话啊,不管是扣子也好,还是其他平台也好,我们学习的核心啊,他不是学技术,而是用 ai 来实现你的想法和需求。 大家记住啊,以后所有的东西都会和 ai 结合的,那么哪怕你现在只是学会了复制和粘贴啊,只会从这空间里复制我给大家准备的智能体也好 啊,工作流也好,哪怕你只学会了复制粘贴,你的目的也只有一个是什么,就是变现。好吧,那么这节课带大家走进扣子,我们下节课见。

悟空的软件怎么下载?昨天有个粉丝在评论区问我怎么样一步一步教他,那我今天呢,就手把手如何把你的悟空智能体安装起来。首先打开钉钉,里面的话有钉钉服务, 那这个工作人员呢?他发了一份文件,叫悟空 opt, 一 人电商,打开之后呢,好,我们看一下,往下拉,去悟空官网下载 app。 好, 我们进入他的官网。 呃,如果说你是苹果的,在这里下载 windows 的,是在这里下载,下载完毕之后呢,就在桌面上打开 这里的话就是有无空出事, ai 办公时代由此开始。呃,但是他有个邀请码,邀请码就去无空官网获得啊,又回到这个官网,你看 这个就是他的一个邀请码,这个邀请码输之后呢,就立即体验,但是呢,他每天的话整点领取,现在已经被领取完了,你要等下一个时间,比如说实 物等等,你要多尝试,因为现在下载的人太火爆了,如果说你觉得有用,记得收藏点赞哦。

一条视频教会你扣子工作流搭建的完整视频,本视频共计三十七分钟。在百度里头我们去搜索扣子两个字,我们搜到第一个就是我们把这个功能拉到最右侧,我们可以看到这个有三个功能,一个是扣子空间,是扣子 推出来的通用智能题,扣子编程对应的之前呢扣子的开发的平台,他这个名字改掉了对这个扣子的罗盘,那我们主要是用到扣子编程,也就是扣子开发平台。第二个功能好,我们直接打开扣子编程好, 点进去之后,我们直接就来到了什么扣子开发平台的一个界面,我们直接在这个页面,我们直接打开左侧这个菜单,资源库这个菜单。 好,在这里大家可以看到这都是我们之前创建好的一些工这个工作流的一些列表,当然这里边不单单有这个工作流,你还可以有这个插件,包括知识库,这个提示词以及数据库等等,总之是各种各样的资源全部在这个资源库里边。 好,那我们接下来我们就在资源库页面的右上角,这有一个资源的按钮,我们直接点击把它打开,这里边有各种各样的,你可以创建插件,工作流、对话流等等知识库。好,在这里我们是创建一个工作流。好,我们直接点击它。 好,那在创建之前给他起个名字。好,那我们今天就给大家以自媒体这个行业为例,这个名字没有什么特别的要求,比如说我们就用汉语拼音,有些朋友说我这个英文不太好,那就用汉语拼音,你看我就起的是自媒体这三个字的这个拼音。好, 没问题,我们加一个工作流。好,这个名字就大概就这样就行了啊,当然不能,不能是中文的好,工作流的描述,你这个工作流是干什么的,你就用你的大白话把它说清楚,说清楚就可以了。好,在这里我们的工作流就是我们想根据用户输入的主题, 也就是说用户输入什么主题,我们来去生成相应的文案,因为我们是做自媒体的内容啊,以及这个图片和什么 和相应的这个视频。好,那我们是今天去做生成自媒体素材内容的这么一个工作流。好,那这样我们的名称跟描述就写好了。之后我们直接点击右下角确认的按钮,我们直接点击右下角确认的按钮。好, 来到这一步,来,咱们直播间的各位朋友有没有问题?这样我们就直接进入到了对创建搭建这个工作流的页面这个界面了。好,大家可以看到这里有有,只有开始和结束这两个默认的一个节点, 到这步我相信大家应该都没有问题。来,大家有没有问题,我们把我这个工作流,大家可能不太好理解,你就把它想象成咱们工厂的流水线。好,我们去扮演工厂的厂长, 你要做的任务是什么?来,去招人,雇这个员工来为你去干活。把人雇进来之后,你要给他培训,再去给他分配任务, 你这些招进来的员工都是你的 ai 的 员工,让 ai 来为我们来进行干嘛?帮我们来自动化的去干活,替我们去干活。既然是这样,那我们就可以根据我们的今天的这个需求是什么? 首先我们去要去创建一个什么,对,创建一个这个我们是讲根据这个主题,我们根据这个主题去生成相应的什么 文案、图片以及视频。好,那我们就去先去添加一个什么帮我们去写文案的这么一个员工, ai 的 员工,好,那我们 大家可能去想到写文案,是不是我们要去添加这个,比如像大模型 deepsea, 我 们就把大模型的节点添加进来, 这个大模型的节点就是帮我们去生成文字的内容,也就是我们今天的一号员工,我们来给他稍微编排一下,改个名字,点击这个三个点,在这重命名一下,他就是今天的一号员工。把,我们是干嘛的?把,我们去 对写文案的生成文案。好,我们先不着急来对他进行一个配置,作为厂长,我们先把所需要的岗位,这个员工我们都先招进来。 好,那我们接下来我们要去招什么?我们是不是要招第二个我们的员工就帮我们去生成图片了,那怎么去招?我们在一号跟结束的节点这个连线的中间,我们这他是不是有一个加号的按钮? 我们点击这个加号的按钮。好,他是不是又弹出这个界面了?那这个你可以把它想象成就是一个工具箱扣子给我们提供的各种各样的工具模块节点都在这个工具箱里边。好,那我们往下滑,我们既然要去升图片,我们在这里是不是有一个图像生成的 这个功能?好,我们直接把这个图像生成对这个节点来给他添加进来,那他就是我们今天的什么,相当于是我们二号机器人的一个员工,就是我们的,我们同样给他改个名字,他就是我们的今天招进的二号员工,好,那就是帮我们去生成图片, 那接下来我们是吧?我们第三个需求是什么来的?我们第三个需求有了这个文案,有了这个图片,第三个是我们要去生成一个视频,最终的视频。所以在我们二号员工跟结束的节点中间,我们再去干嘛?再去添加一个员工,帮我们专门去生成视频。好,我们直接点击加号按钮, 又弹出这个界面了,所以大家看到没有,你,你,你如果只需要去添加各种要去加,去添加 ai 的 员工帮你去干活,你都是需要跟这个界面去打交道,这里边有各种各样的, 我们都可以认为它是,你认为它是工具也好,或者说功能模块也好,我们 ai 的 员工,好,那在这里我们就找到在音频视频处理这个区域。好,这有个生成视频的这么一个员工,我们把它添加进来。好,点击你的鼠标左键。好, 那这样我们就把他加进来了,我们就给他改个名字。好,我们继续,这个就是我们的三号。等员工。好,帮我们去生成什么生成视频的。 好,那到这你作为厂长觉得就是我们的这个人今天着齐了。好,接下来你要干嘛了?对,接下来你要去对他进行培训,分配任务,给他 进行一个执行,帮你去完成最终的一个任务,这样我们整个的工作流他就可以帮我们去自动干活了,我们最终为了达到这么一个目的,最终的目的就是能够帮我们自动干活,帮我们去自动去根据用户的主题去写完啊,生成图片,生成相应的视频。 那接下来我们就要对他来进行训培训,就跟我们这个公司招人之后,给他培训之后才能上岗一样的道理。好,那我首先我们就来对我们的第一个 爱的员工来进一个培训,我们选中打开它之后,这是它的整个大模型的一个配置界面,我们简单的来看一下,大家都知道大模型是什么?大模型,包括我们今天的搭的智能体工作流来,大家有知道的吗?有不知道的扣零好不好?知道的扣一, 那我就快速的去过一下给大家。大模型是什么?大模型就是我们用的这个像豆包、 d、 p、 c, 什么 k 密,包括大漂亮的 g、 b、 t, 这个都属于大模型。 那大模型它主要的工作主要是帮我们干嘛?帮我们去生成文字的一些内容,比如说你去写个文案,写个短视频脚本啊,去写个报告,写个总结,它主要是帮我们去做文字方面的一些工作。好,那我们的智能体是什么?智能体 它就不一样了,智能体你可以把它想象成既有这个大脑,又有这个手和脚,那大脑就是我们刚刚说的大模型,就可以充当为它的大脑, 那手和脚就能帮助我们来把这些具体的一些问题进行落地。比如说你要去写一个,生成一个具体的 ppt, 或者说需要剪辑某些视频,或者你要生成一个表格文件,什么 word 文件,像类似的这种的好, 那我们就可以通过这样的一个智能体来帮我们去实现,帮我们去生成这样类似的一个文件。当然我只是捡了一些简单的一些例子,当然他智能可以帮我们做很多事情,而且在各行各业,在各种各种场景都可以帮我们去完成相应的一些解决,我们完成相应的一些工作,帮我们解决一些问题。 说到大模型智能体,那工作流又是什么?工作流,我刚才说了工作流,我们现在搭建的就是工作流,工作流就是你的业务的核心逻辑,都是搭在工作流里边, 有了这个工作流,你好比是什么?就是帮助咱们的智能体去实现一个具体去解决这个问题。来去就说为什么 大家总说大模型不能去落地,他能给你很好的创意,给你很好的一些点子,但是你要想让他去生成,比如说某一个文件, ppt 文件他是不是做不到?或者说把你想生成某一个 某一个 word 文件等等,是不是做不到?他只能把你先生成文字的内容?好,你要生成 ppt 文件这种的好,那就需要我们干嘛对第三方的一个去搭建这样的一个工作流来实现。 好,那以上给大家就是简单的介绍了一下这个智能体大模型,包括工作流的它的概念,那我们还是回归到我们的正题这块,我们的这个大模型的一个配置,那我们在这里其实大家 来看这里边有很多模型的选择,豆包的,包括 deepsea 的 豆包的,大家都知道豆包的也是我们自结旗下的,扣子就是自结旗下的,它是一个生态的系统。好,那我们如果选用, 比如说你要豆包,其实我们用豆包一点五三十二 k 这个 pro 三十二 k, 它这个啊其实挺好用的,而且它的速度很快,我一般演示都会去用它。好,如果你想想写的更好一点的一些文案,你可以用一些深度思考的一些这个模型,像豆包的一点六这种的深度思考,或者说 deepsafe 有 r 一 的模型, 都是一些深度思考的一些模型,包括第四个 v 三点一这种的都是深度思考的。好,那我们就用这个一点五 pro 三十二 k 足够用了。好,那接下来我们再去配置一下这个输入。好,输入是什么呢?大家注意看好输入,包括还有这个输出, 我们添加的这些模块与这些节点,所有的 ai 的 这些员工啊,都有输入和输出,看到没有?好,包括我们的三号员工也是有输入输出,所以我们的每一个 ai 的 员工啊,输入和输出是 共同的一个特点。好,那大家可能对于输入输出啊,没有学过基础的,或者说没有搞过这些可能不太好理解。确实,那我们怎么去理解他。好, 我在这给大家举个简单的例子,比如说我们把输入这里,我们就把它想象成是输入的这个材料通过我们加工, 加工之后输出的是什么,输出的就是他的一个成品。那我们在这里,比如你现在要做一个蛋糕,我们在这里输入的蛋糕的这个原材料,包括有这个蛋糕的批子,什么牛奶、奶酪,还有水果等等,这些就属于我输入的这个变量,你就把这个变量 底座是我要输入的一个原材料,因为你去想这个变量不太好理解。好,那我们输出的是什么?输出的就是我这个蛋糕做出来一个这个蛋糕。好, 我相信大家这样答案应该就很好理解了。那我们在这里输入的就是什么,我们打开我们的这个小齿轮配置按钮,然后在这里开始这个节点,有一个,你会看到有一个 input 输这个变量。 好,当然这个音符的变量就是我们开始节点的这个变量,你可以给他改个名字,咱们刚才忘了改名字,这个名字是可以改的, 你可以用汉语拼音,比如说我这里是接收到用户输入的这个主题,对不对?好,那这个主题我给他改了一个汉语拼的名字,这不是英文单词,就是主题汉语拼音。好,我们又回到一号员工,我们再去打开输入的配置,再开始这个节点,你就会看到是不是不是有一个主题的变量? 好,那我们直接把它配置进来,点击你的鼠标左键,把这个变量的名字,我们同样可以改成汉语拼音这个主题。没关系,我们不懂英文也可以去学,因为很多确实英文基础不好。他说你这个能不能写,其实这个名字真的没有那么重要,你哪怕就写一个 a 也行,能理解吗?你就写一个 a、 a、 b、 c、 d 都可以,你只要说你能够知道它是代表什么意思就可以了。那我们现在有了输入的主题,因为我们现在就一个,对不对?就一个主题,就是用户输入的这个主题我们已经配置好了,当然如果你有多个这个变量,也就是说你要输入多个原材料的时候,你就可以呢 添加多个这个变量,答案能理解好,当然我们现在就一个,接下来我们就来到了我们的提示词的一个书写, 我们就来到了一个提示词的书写好,那提示词在这里我想跟大家说一下,非常重要。如果你说整个的我们工作流这些工作模块,大模型这个节点可以说是所有这个模块里头最重要的,对不对? 大模型就是我们用的 deepsea 豆包好,那我们的提示词可以说是重中之重,为什么?因为你看你不管你在用这个 deepsea, 也要用豆包也好,你在平时在网页当去用,或者说你下载到手机里的 app 去用的时候,你是不是要去提问 好?你提的这个问题其实就是在写这个提示词,也就是说你你提问的这个好坏,你也就说你写这个提示词的好坏,决定了什么?决定了这些大模型,决定了 deepsea 也好,豆包也好,给你输出的一个答案的质量的高低好坏, 大家能理解。所以那有些朋友就说我用 deepsea, 用豆包舀,或者说用用用,用国外的那些也好,我为什么同样的这个大模型,我为什么有的别人为什么能输出很好的一个结果?我用起来为什么总感觉它傻傻的,或者说不好用? 你要去审视一下是不是你写的这个问题,写的这个提示词,提问的这个问题不是很好,所以对不对? 所以他给你出来的结果也就天差地别了,这个就差距非常大,模型是一样的模型,但是你提问的好坏这个非常重要。好,那接下来我来带着大家去简单的手搓一个提示词。 首先你写这个提示词,你可以给他先定一个角色,你是谁?你扮演一个什么角色好,要干什么?要干什么?好,达到什么目的? 整个有什么要求?好,把这个两点写清楚就可以了。这个其实就是对大家去提问的一个简单的一个要求,当然有时候你,你扮演什么角色都可以忽略掉。好,那比如我现在跟大家去说一下,比如说我现在告诉大家,你是一个告诉大魔镜,你是一个优秀的 文案写作专家。好,你需要帮我去用户输入的主题,是不是用户输的主题?帮我 根据用户输入的主机去写生成文案。什么生成文案和什么?对,和,我们需要生成图片,但是是不是大模型不能直接给你生成图片?打 excel 包括这个,他能给你生成图片吗?不能吧?好,那我们再生成图片,我们需要让大模型生成。什么 生成叫做帮我去生成图片的描述提示词,对不对?好,提示词好,和什么?和我们对吧? 三号员工,我们需要的是什么?视频的什么动作提示词好,视频的动作提示词 好,他,对吧?你,你们就记住大模型,他可以帮你生成各种文字的内容,各种文字的内容,对吧?好,就是你,你去让他帮你去做。好,那这里你看我这么一句话,是不是 这么一句话,是不是交代了你是谁?然后呢?要干什么?帮我去干什么,对吧?说,说的很清楚,就通过这一句大白话就可以了。好,我把他删掉,那在这里,其实这个题的词他就能够帮你去做这件事了。 已经可以了,但是有些有些同学这个也太简单了吧,对吧?太简单了。好,然后有些同学说,我能不能让他优化一下变得更好呢?当然可以。好,怎么去做?怎么去做。 各位啊,很简单,很简单。来,我们稍微看一下,我往这边挪一点。好,你们可以看到,其实扣子给我们已经提供了,在这里是不是有一个这个什么? 有一个什么,对吧?在这最右侧有一个按钮,叫做可以优化这个提示词。可以优化。好,我们直接点击这个按钮,自动优化提示词,他就会针对我们写的这段什么这段提示词来进行一个优化。好, 你看我们就点击第一个。好,我们稍微等一下,你看。所以大家你看到没有?你需要做到的就是把你这个想要干什么表达清楚了,你不会优化,没有关系,交给 ai, 让 ai 帮你去优化,帮你去写。 已经写完了,大家看没有?我们来看一下他优化的一个结果。好,这个就是角色,你是一位,对吧?专业的多类型内容生成专家,看到没有?他帮我改了, 我刚才说的是文案生成专家,为什么他现在改掉了呢?你看他把我就优化了。多内容生成专家,因为他不光光是帮我们去写文案,他还要帮我们去生成提示词,对不对?生成图片的那个描述提示词和和什么?和视频的动作提示词,对吧?好, 你看没有,根据用户书的这个具体主题精准生成文案、图片提示词以及视频的动作提示词,对吧?擅长结合不同的场景需求来调整内容的这个风格和细节。好,这就是一个角色比我写的好,对吧?优化的比我写的好,对吧?好,来,技能,你看 三个技能应该对应的就是文案生成,第二个技能在哪?图片的一个提示词生成,对吧?在这里,然后呢?第三个是什么?视频的动作提示词?这么长,看到没有?好,最后是限制好, 我觉得写的非常不错啊,我们直接点击你,你觉得不错,你直接只需要去点击这个替换的按钮,好,他就会帮你,对吧?把原来的那个替换掉用,对吧?用他帮你生成的一个提示词,看到没有?我们两句话,人家给我优化生成了这么长的一段提示词,够不够专业?各位, 所以大家一定要擅长利用 ai 帮你去做事,对吧?你只需要把你的需求提出来,用大白话讲,讲清楚,一定要讲清楚,好,让 ai 帮你去优化,大家一定要擅长去做这件事,对,好, 没问题吧?好,那我们这个第一个,大家看到我们的这个系统提示词,我们就写完了。好,那用户提示词又是什么呢?用户提示词其实很简单,其实就是这个用书的这个变量,也就是我们输入的这个原材料,对吧?输入这个原材料,你把它写进去,写到哪呢?写到这里, 好,怎么写?摁住键盘的 shift 键,在键盘的左下角,左下角,好,然后打出大括号,它就会自动弹出这个变量,然后呢,你去点击左键,好,这样我们就引用成功了,就引用成功了,当然我们还要跟大家说一下, 其实用户的这个提示词,你可以把这个变量这个主题可以放到系统提示里边,这个是都是可以的,对吧?都是没有问题的,你这里用户提示词可以是空的,当然我们放到这里我们这样写是一个比较规范的标准的一个写法。好吧? 好,那我们这样就整个的我们的这个提示词就配置完了。好,接下来我们整个大模型的配置还没有完,还没有完。好,我们对,我们来到了我们的什么? 对,输出这部分,输出这部分。好,你既然,对吧?你,你输入有了中间加工,其实提着词就是来去帮你加工的,对吧?帮你去加工的整个过程就是提着词的一个能力。好,最后输出的结果是在哪?在这你要把你加工, 对吧?把这个原材料加工之后的一个成品产品输出出来。好在这大家是不是这样的话,是不是就通俗易懂了?我相信大家应该就能够很好的去理解这件事了。好,我们怎么输出呢? 大家记住,你看我们这里边是不是有三个不同的技能,也就是三个不同的任务,所以你输出的结果他一定是三个,哪三个呢?文案 对吧?然后这个是什么图片提示词,这个是什么视频的动作提示词。好,是不是这三个?那因此我们输出的结果他也是三个,他也是三个。好,我们点击这个加号的按钮, 我们点击这个加号的按钮,来再去添加两个变量。好,是不是添加了一共三个输出的一个变量,三个一个输出的变量, 好吧?好,来,我们来给他进行一个命名,这个名字输入变量其实也是跟你的输入那个名字输入输入变量去写输入变量,这个名字的规则是一样的,对吧?英文的字母或者是什么, 对,或者是这个汉语拼音就可以,好,那我们第一个就写文案,大家发现没有?我全是写的什么,我全是写的这个,这个,这个汉语拼音,汉语拼音,所以大家这个不要担心说我不懂英文,能不能去学,可以,对吧?没问题吧? ok, 好, 来,然后呢我们备注一下啊,点开这个箭头按钮,我们在这里要去添加一个备注什么呢?这就是我们的文案, 然后呢在这我们去写一个什么呢?第二个输出的边上就是我们的什么图片提示词,图片, 对吧?图片提示词,好,那这个就是我们的图片提示词,对吧?图片提示词,好。第三个就是我们的视频,对吧?我们照样还是写的是汉语拼音,好,那这个就是我们的视频提示词, ok, 好,到这里我们的三个输出变量我们就搞定了,就搞定了整个整个我们一号员工大模型这个员工我们就配置完了,一号员工我们就培训完了,我们花了将近半个小时的时间在这个上面, 为什么?因为我我们觉得整个的工作流的搭建,智能体的搭建,其实我们最需要去研究的,最需要琢磨的就是大模型,我们应该花更多的这个精力在上面去好好研究它, 对吧?因为你们很多的结果都是跟他的输出的结果是相关的,对吧?你后面比如说你的提示词,你生成的图片的好坏,包括生成视频的好坏,都是跟你的大模型输出的这个结果息息相关, 大家能理解吧?对吧?因为你,你,你后面不管生成图片是根据你的这个提示词,对吧?你提示词生成的好坏,对吧?决定了你视频生成的一个好坏, 大家能理解了吧?所以你看没有他,他这个他的这个重要性不言而喻,所以我们花的时间就比较久一点,我们讲的细一点,让大家能够更清楚, 来,我们继续,那我们现在有了,对吧?一号这个大模型的这个员工,有了一号大模型的这个员工之后,接下来我们来进行,对吧?我们,对吧?第二个员工就是我们的这个生成图片,生成图片 我们直接打开选中我们的二号员工,我们来对他来进一个配置,来对他进一个配置。好,大家会发现,那我们的二号员工就是我们的生图的,首先我们去选择我们的生图模型,首先我们去选择我们的生图模型。 啊,那我们的这个深图模型,那个墨雨,墨雨,墨雨爱这个伙伴,刚才我说这个大模型这块能,这个就把你刚才没有看到,能理解吧,对吧?就是你,你这么长的这一段话怎么来的?应该能理解了吧? 点这个自动优化提示词帮你去转化的,你,你首先得得要把你那个,对吧?你想干什么表达清楚了,说明白了,然后呢去优化一下就可以了,好吧?来, 好,那我们首先去选择一个生图的模型,那在这里呢?这里头这个模型跟我们这个刚刚一号员工的那个大圆模型就不太一样了,刚刚是 deepsea 豆包是什么?对,是帮我们去生成文字类的这些模型,对不对? 好,那我们在这里这一个是什么?这个是帮我们去生成这个图片的生成图片的,所以这些都是生图的模型,我这里我一般就是用这个通用 pro, 我 一般比较喜欢用通用 pro, 一个是它生成的效果 还非常不错,而且它的性价比非常好,价,价格比较低,对吧?好,我们就选用它,然后呢我们再去这个选一个比例,我们就选一个九比十六吧,对吧?这种竖屏的一个比例,如果你要选横屏的,你要选横屏,你就,你就用这个十六比九,用十六比九,好吗?对, 好,我们这里选择一个九比十六,然后呢把生成的这个质量拉高一点,拉高一点。好,好, 对,拉的越高,你生成的这个图片质量肯定会越高,肯定会越高,对吧?当然你生成那个时间也会也会变长, 好吧,好,那在这里呢,我们继续往下配置参考图,这里我们没有用到,我们没有参考图,就是说什么呢?就是说你添加就把根据你你的这个图片来去生成另外一张图片,就是图身图的一个功能,我们这里没有用到,我们用的是什么纹身图,对吧? 好,通过输入的文字来去生成图片,所以我们在这里输入这块,对吧?我们要添加一个什么?点击这个加号的按钮去添加一个, 对吧?添加这么一个变量,那这个变量就是我刚刚说的,对吧?输入的这个原材料,对吧?输入的这个原材料,我们来对它进行一个配置,我们来对它进行一个配置。好,怎么配? 很简单,点击这个小齿轮的按钮,点击这个小齿轮的按钮,好,我们对吧?可以看到开始和几这个一号员工,我们直接打开我们的一号员工的什么这个, 对吧?你可以看到有三个输出的这个输出的这个这个变量,一个是什么文案,然后第二个是图片的提示词,对吧?第三个是什么视频的这个动作提示词。好,来大家这个跟我互动一下,来,我们这里需要配置哪个? 需要配置哪个?可以在公屏上打出来配置哪个,是不是配置第二个呀?图片的提示, ok, 好, 我们直接选中我们的二号,这样我们就拿到了这个,对吧?拿到了这个图片提示词, 我们直接在这里进行一个引用,在正向提示词这里进行一个引用。好,怎么引用?好?摁住 shift 键, 然后呢?是不是就打弹出这个大括号了,摁住 shift 键打这个大括号,就会弹出这个变量。好,我们把这个对吧弹出的这个图片这个给他引用到这里,点击左键,好,那我们就这里就拿到了,对吧?就拿到了这个图片的提着词, 好,然后他就可以,对吧按着这个提着词,根据这个对吧给到大模型,让大模型按着这个提着词去生成图片了,就生成图片了。好, 到这里来到这里咱们的整个的深图的配置就搞定了,我们继续,我们来对我们的三号员工,帮我们深视频的这个员工来进行一个什么呢?来进一个配置了。好,大家可以看到这个就是我们的这个深视频的一个员工,对吧? 你会发现三号的这个圆框有两个,一个是什么?一个是这个两个一个是纹身视频,一个是图身视频,对吧?好,纹身视频什么意思?顾名思义,通过文字的描述,对吧?来直接去生成视频,好,那它的优点就是因为 文字描述他都是比较什么比较随意,就比较有创意,对吧?比较有创意,所以他能够生成一些非常有创意的一些视频,对吧?非常这个天马行空的一些这个视频,这是他的一个优点,但是他的缺点是什么呢?他的缺点就是你可能需要通过大量的什么,大量的这个抽卡, 对吧?然后呢他会,对吧?因为因为什么呢?因为你生成这个你的文字的描述,他一定是这样的,他他 不稳定,对吧?好,对,你的这个文字的这个要求就会比较高,提示词的这个要求就会比较高。好,那我们的这个第二个图声视频呢?图声视频是干嘛的? 对,图声视频就是通过图片去生成这个相应的一个视频,那他就相对比较稳定,不需要你大量的抽卡,对不对?好,那我们尤其对于我们的这个新手,对吧?初学者来说,我们一般我们就直接选用图声视频, 这样的话会减少你大量的一个抽卡,对吧?它的概率就会大大提高。好,那我们选图中视频,我们来对它简单的一个配置。好,首先你看这是什么视频的生成模型, 对吧?我们直接打开它,好,这个模型又跟我们之前的那个又不太一样了,跟 deepsea 跟豆包,对吧?那是大语言模型,我们的二号员工是什么呢?生成图片,我们选择的那叫什么?那叫生图的模型。好,这里我们选择的是什么?我们选择的叫做视频生成模型,对吧?好,那它这个就简单,就两个, 就两个你需要做的,对吧?你就选其中一个,那这个是 light, 对 吧? light 模型,这个是什么? pro 模型,那这个就是 相对便宜点,对吧?那这个就是贵一点,深层的效果会比它好一点,这里我选择这个便宜点的。好,主要是给大家去演示啊,然后分辨率三个分辨率最高的幺零八零 p, 现在目前这块它最高就幺零八零 p, 然后四八零,对吧?七二零。好, 然后时常是一个只有两个,一个是五秒的,生成五秒的一个视频还有一个十秒的。好,来讲到这里呢,我给大家看一下我们官方升视频这个插件的这个成本是多少?然后大家自己去生成视频的时候,大家心里也有个数啊,你们去看一下他的一个升视频的一个成本还是比较, 对吧?高的生成幺零八零 p, 五秒钟的一个视频, light 模型是二十五万的一个 talk, 相当于多少呢?相当于是两块五,那 pro 模型相当于多少?三百六千三千六百个字样点就相当于三块六, 好吧,这是他的一个生成视频的一个成本。好,那我们现在选的这个,对吧?最低的这个要要求的一个最低的一个大概的成本是在五毛钱左右,五毛钱左右。 好,那我们这个就选完了之后我们来配置这个参考图片啊,参考图片,参考图片在这里呢,来,大家注意看我们的手帧图片,我们点开这个小齿轮的配置按钮,我们,对吧?我们去选择一下我们的二号员工,二号员工是什么呢?在这,对吧? 对,这个 date 就是 存的什么放的就是我们的这个,这个,这个,这个图片图片,对吧?好,我们把它配置给他。好,那这里呢?伪真跟参考图,对吧?咱没有,因为咱们就一个二号员工申图的,对吧? 好,所以我们这里没关系,我们这里可以不用去配,他,照样可以生成视频。当然如果你想进一个控制想生成的整个视频的这个生成的一个 结果,是按照你手针跟尾针去生成的一个这样的一个结果,你需要去这么控制的吗?你需要给他一个尾针的图片,对吧?那我们在这里有个手针就可以去生成了,让他让他去去根据自己的一个 大模型生成这个视视,生成视频,生成模型自己去发挥去生成,好吧?好,那 我们这个图片就配置完了,接下来我们要添加输入,这个输入是什么?对,输入的就是我们的视频的这个动作,也就是我们常说的运镜,你要让这个图片怎么动起来,怎么动?好,所以我们在这里添加一个输入,输入的就是我们说的什么运镜动作,提示词在哪? 从哪去拿,是不是我们的一号员工,对吧?我们的一号员工这里都有三个变量,前面两个我们已经用过了,对吧?一个是写文案的,一个是帮我们去生成图片体式词的。好,第三个是什么? 第三个就是我们需要的这个视频的动作体式词,也就是我们的这个运镜,对吧?让图片怎么去动?变成一个视频,好,我们去把它进一个配置。 ok, 好,我们点击左键给它进一个配置。好,那这样我们就拿到了什么?拿到了这个运镜,拿到了这个视频提示词,然后我们在哪?好,我们在哪?我们在这个提示词这个部分,我们在提示词这个部分, 我们直接把它引用进来。怎么引用?摁住 shift 键打出大括号,它就会自动弹出这个变量。好,我们把它引用到这里。好, ok, 把它引用到这里。好,这样我们就拿到了,我们就拿到了这个视频的这个动作提示词。好,他就会干嘛?就会结合这个图片给到这个生成视频的这个模型,帮我们去生成视频了, 帮我们去生成视频这个就是他整个配置的这些这些参数我们就配置完了,好吧?输出,输出这里我们不要配,不用配置了,输出他这有一个默认的固定的一个什么微丢的一个输出,他就是输出的是一个视频的一个 ui 地址,对吧?你点开他,你点开他就是你的这个视频了。 好,那这样我们整个的视频我们三号就配置完了。好,来,大家有问题,我们先跑一下吧,跑的过程当中我给大家回答一下大家的问题,好不好?来,因为跑正好需要这个工作,需要这个时间,我们正好边边边跑这个工作流,边给 边这个回答一下大家的问题。来结束的这个节点我们来配置一下,我们去比如说你要输出这个一号的这个文案,对吧? 然后呢你还可以输出其他的一些这个,比如说这个图片,你想输入出来,或者说最后的一个视频,你想输入视频这个微调,就是这个这个地址,视频的这个地址,好,这样我们整个的这个工作流就生成完了,就就就就就搭建完了啊,就搭建完了,好吧?好,我们搭建了,我们搭建了 快一个小时了,当然你如果真的自己去搭的话,可能五分钟,对吧?十分钟就搞定了,那我们主要给大家,对吧? 把中间的一些细节给大家讲的非常细。好,我们直接点击这个试运行来打给我一个主题,给我一个主题,我们让他,我们来跑一跑,对吧?我们搭了半天的工作轮,我们来跑一跑,看一下效果。然后呢对跑的过程当中我来给大家回答一下大家的问题, 大家有问题的可以把你们问题打在公屏上,我一会来给大家统一的去回复一下,来给我一个主题,有没有的?我们去生成一下看下结果。大家给我一个主题,有没有主题,随便随便,因为我们这个,我们这个不调不调,没有,是吧?没有,我自己写了一个,比如说这个 跳舞的古代,好,我们我们就这样,我们直接点击视频,行,我们来跑一下,好,跑的过程当中,然后大家这个我来回答一下大家的问题, 好,我们来看一下是不是一个一个,这个我写的是一个跳舞的女女子,对吧?这是一个跳舞的女子一个场景,他怎么为什么是这样的一个场景呢? 他一定是根据我的提词词走的,我们来看看一下他的提词词是什么就知道了。在这里是不是根据你的提词词去走的? 风格是国风,写实的风,对吧?主体一位穿着红色古装翩翩起舞的古代女子,对吧?场景是在古代的庭院中,石桌旁边,周围有盛开的花朵和随风摇曳的柳枝,是不是这个场景 是吧?好细节,女子的发丝随风飘动,群摆这个,这个飞扬。好,这是细节的一个描述啊。你再去看这张图片,是不是按照我们的提示词去生成的,没问题吧?一定是这样的,一定是这样的, 我们再来看一下视频。好,视频在哪?在这,我们再去看一下,点击他,然后呢去播放一下,看一下效果。五秒钟的,五秒钟的一个视频帮我们切了三个,三到四个这个分镜头,三到四个分镜头,所以 你看没有,他一定是根据你的这个运镜走的。视频的,这个提示词在哪?我们再去看一下。呃,他这个确实有点多了,在哪?在这 四个镜头跟我说的没错了,四个镜头,其实你这里可以给他限制一下,在你生成视频动作提置词的时候,你就说跟他说,对吧?五秒钟的这个视频,你就帮我生成两个分镜就行了,因为四个分镜明显的感觉到这个,你说五秒钟的这个切的太快了,大家能理解吧, 对吧?切的太快了,所以我们五秒钟要两个镜头就行了,两个镜头足够了,这个四个镜头就太快了,你看第一个镜头对吧?你看一下他运镜怎么走的?推,镜头从古代庭院大门推进,展现整个庭院的景色,最后聚焦在跳舞的这个女子身上, 是不是?大家回忆一下,是这样的,好。然后呢?镜头二是平移镜头跟女子这个舞动,展示他全身的一个动作和优美的舞姿,对吧?好。第三个镜头是固定的镜头,拍摄女子灵动的眼神和精致的妆容,对吧?好。第五四个镜头是 镜头拉远了,展示女子和周围环境的一个融合,最后定格的一个画面,画面定格好,我们来再看一下这个视频,对吧?我们再来看一下这个视频的一个效果,你们再去结合他的一个刚才的一个运镜,是不是?是不是按照我们的这个运镜啊?这这个四个运镜去生成的,你们去看一下,你看 是吧?特写,然后拉远定格,对吧?没,没问题吧?虽然他很快,他的这个效果很快,因为他就是这样吗?我他四个镜头吗?切的太快了,但是他是完全遵循什么? 遵循我们的这个提示词去生成的,对吧?生成自媒体这个素材内容的一个完整的,对吧?完整的一个工作流就答完了,大家不要看他简单,你把这几个模块学明白了,你后面做很多的一些这个这个自媒体生成自媒体内容的,其实 说白了什么呢?你就可以举一反三了,对吧?你就可以拿它来举一反三,或者说拿它来照猫画虎了。你把这个搭完了之后,你可以延伸出做很多很多其他的一些这个这些这些内容,可以的,好吧?比如说你在这个基础上, 对吧?你要,你要去加声音,加字幕,对吧?加其他各种什么元素可以了?好,这个视频,这个整个的工作流就给大家讲到这。

这条视频的话,同样用最通俗的话语和大家聊一聊龙虾, ai 部署后都在说这个特别烧 taco, 特别费钱,那么这个 taco 到底是什么? 虽然我会用很通俗的方式去描述啊,但是内容的话全是干货,大家可以收藏起来,方便以后反复去听。这个知识点的话,基本上不会过时啊。 在标准的解释里, talkin 的 话可以理解为字母,也就是说 ai 在 运行的过程中,无论是反馈给你的内容,还是他要执行的动作,在程序里都是需要这一个个字母像搭积木一样呈现在你的面前, 或者说像铺路一样一步步完成结果。即便这样描述,很多人还是会觉得抽象,那么我们换个更形象的说法,我们之前已经把 opencloud 这类的智能体工具比作汽车, 那么 tucker 的 话就好,就是汽车必不可少的汽油。 tucker 的 消耗取决于你要这辆车做什么任务,载客要区分是家用还是客车,载货的话要看货物重量的大小,出行要考虑距离的远近。 不同的场景,汽油的消耗都不一样, ai 也一样,不同的任务产生的 tucker 消耗也会不同。 那么这些 tok 是 谁提供的呢?就是我们常听到的各种 ai 大 模型,比如 open ai、 dpc, 阿里的千问,腾讯的会员,抖音的豆包等。 我们可以把这些大模型产品想象成一座油井,这些油井想要产生收益,就要把汽油卖给我们,也就是把 tok 卖给我们。 平时我们听到的某家大模型更厉害了,或者说发布了新版本,可以简单的理解成他的炼油技术提升了,汽油的品质更好了,更利于汽车的运行。 那么问题来了,为什么现在这个阶段,大家觉得这么烧滔克特别费钱, ai 永远都这么费钱吗?答案肯定是否定的。 现在的 open 可乐只是最初代的汽车,发动机并不成熟,喷油和燃烧都不够优化,我们的驾驶习惯呢,也不够熟练。 油门的轻重都会影响 tucker 的 消耗,甚至我们连目的地和路线都不清楚,盲目的运行就会绕路产生多余的消耗。 还有我们都不知道这个汽车应该加什么品质的汽油,现在却盲目的选择最好的模型。滔肯拿着九二号的车去加九八号的油,自然也是过度消费。 所以等大家真正的学会使用 ai, 等真正的习惯使用 ai, 就 会学会管理滔肯,也就是学会省油省钱。 这一波龙虾业的爆火,既有划时代的 ai 能力升级,也有那些卖铲子营销号的吹捧,更主要的是各个大厂快速跟进的推波助澜。 目前几乎每家智能体都已经上线了 open club 这类的智能体工具,无论是包装的、封装的、伪装的、原装的,还是自研的,都在努力抢占市场。 这些大公司花这么大的成本号称让我们免费体验,本质当然是为了卖我们涛肯。 当然这是需要大家参与共建的场景,因为这些大厂的油井想要提炼出更高品质的汽油,只靠少量的测试车是没法有效迭代的, 必须大家一起多用未来的 tokken 有 效性才会更高。我们上一条视频提到不同大厂的龙虾 ai 就 好比不同品牌的汽车,如果各个品牌的汽车都有指定的有井的竞争,那么我们未来买 tokken 的 价格就会更有优势。 当然还要看各家汽车品牌的优缺点,根据不同的使用场景去选择不同公司的 ai 智能体工具。 这里没有提到的是,个人也可以手搓一辆汽车,用自己的算率去跑 talk, 这也是一种选择,取决于每个人的需求和能力。 下一条的话,我会和大家去聊一下 ai 会带来哪些改变,至少有一点可以确定,这波 ai 会把所有人拉起到同一起跑线上。 不管你现在有没有开始研究 ai, 接下来都会有无限的机会。喜欢的话点个关注,用最通俗的语言带你一步步看懂 ai。

hello, 大家好,我是飞哥,我希望能够带领大家做三件事情。第一个呢就是让大家认识什么是智能体,它不是一个很复杂很抽象的概念,它是一个很具体很好理解的东西 啊。第二个呢就是我希望大家能够找到适合自己变现的这种方式或者路径。第三个呢就是我要带领大家手搓一个自己能用得上的智能体。 那么话不多说,今天呢开始我们第一节课,那就是我要带领大家来认识一下到底什么是智能体。智能体它不复杂啊,它其实就是借助了大模型,借助了插件来帮我们解决工作或者生活当中遇到的各种问题的一个工具而已。记住 智能体是一个工具,比如说我们经常看到的啊豆包,在豆包里面有个 ai 智能体,这里面有很多智能体对不对?有工作方面的,学习方面的创作、绘画、生活,然后在 kimi 里面也有一个 kimi 家这样一个 kimi 广场啊,我们也可以找到各种各样的智能体, 那包括现在所有的头部企业基本上都有这种智能体广场或者智能体商城,大家需要什么自己去找就可以了。那在市面上最简单的智能体是什么呢?就是大家最好理解的智能体是什么?其实就是我们日常用到的豆包也好, deepsea 也好, 这种对话流的智能体,就是在这个输入框里面,你提问他回答,那大家可能会纳闷了,就是我既然能用这种啊这种 页面,或者能用这种大模型,我为什么还要用智能体呢?这里有两个非常关键的原因啊。首先第一个, 比如说啊,我给大家举一个例子,举一个应用场景,就是如果大家在熬夜啊,或者说通宵呀,或者说喝了醉酒之后,第二天身体是不是不舒服,那这个时候你可能要 想一下我要喝点什么东西,或者我怎么调理一下,对吧?那假如说我们现在给豆包输入这样一个问题啊,比如说你好,我啊通宵熬夜了,现在不太舒服,需要喝点 什么调理一下?好,大家看,我把这个问题发给他了,那我想要得到什么呢?我想要得到的是,呃,喝点什么见效快的 啊?或者说我意图是我想去药店买点什么东西喝一下,对不对啊?那他给我的一些回答呢?可能是一些比较常见的,或者说可能大家不需要问他可能就有一些常识就能理解的, 那这种显然不是我们需要的。为什么会出现这种问题?首先第一个大家要知道啊,这个大模型在我们提出这个问题的时候,他其实是不知道自己是一个什么样的角色的, 他给自己的定位还是一个类似于搜索百科这种问答的一个角色,就你问他可能去根据啊以往的 这种搜索的知识或者理解来帮你回答,所以他回答的没有针对性。那怎么办?这里就涉及到第一个非常关键的点 提示词啊,提示词?那我写了一个提示词,比如说我写了一个老中医的一个提示词,对吧?它与对话特点啊,它能够问诊的啊,辨辨正的一些分析啊,调理的方案啊,对不对?然后应该吃什么少碰什么之类的。 那怎么用这个东西怎么用?很简单我把这一段话直接复制到这个输入框里面发送好,发送给他了对不对?那我发送给他的目的是什么?就是让豆包这个大模型 他清楚的知道。哦我原来是这样一个人,我擅长什么?我的技能是什么?我能够分析什么?我应该要给出什么样的结论对不对?你看他清楚了对不对?然后这个时候我们在干什么?我们再来把刚刚这个问题我们再复制一下,哎给他看他回答出来和刚刚的回答是不是有什么区别? 那大家去看啊你看他的口吻对不对?他的辩正对不对?然后呢调理的方子你看有桂圆肉、麦冬、枸杞是吧?放保温杯里边。哎你会感觉到他给的这样一个调理方案好像就是一个中医给你的方案,并且你感觉这个 他会不会效果要比刚刚这个要好一些对不对?那你是不是可能可以,可能就会遵从他的意见去买这种东西了,对吧?然后应该你看应该吃什么对不对?这个东西刚刚他也有对吧? 所以说我们把这样一个提示字给到他之后其实就是给他进行了一个角色的一个限定。这是第一个啊,这是第一个就是如果我们直接用这种大模型他不清楚自己要干什么那么第二个是什么呢?就是我们如果每次来问这个问题啊,每次来问 我都要把这个提示词给他输进来,是不是很麻烦?就我每一次来问啊,我今天问了然后过下个周我又喝醉了或者我又熬夜了,我再找到这个再复制进来,是不是很麻烦? 重复性的工作吗?对不对?那么第三个就是我刚刚在复制的时候,是不是大家也看到了,大家都能看到,对吧?那你是不是就可以直接把这个东西拿走,拿走之后你就不需要我来帮你了,或者说我做出这样的智能体你就不会用了,因为你也有这样一个提示词, 所以说智能体他是相当于什么?他相当于我们把这个东西给包装起来了,给打包了,打包之后呢,就是你每一次只需要输入这一个指令, 哎,他这个包裹里面就已经内置了这样一个提示词,他是不是可以直接给你输入这个东西,你就不需要再复制了?所以说第一个好处,他极大的减少了我们的重复工作量。第二个就是我 提问这个问题的时候,你是看不到我里面提示词什么的,因为我已经打包了,对不对?所以说别人想要问这个问题,那就必须要用我这个智能体,这第二个好处,对吧?所以说我今天带领大家通过这样一个非常简单的例子,让大家明白什么是智能体,智能体其实就是把我们的啊 提示词,把我们用的大模型啊,用到的插件啊,各类节点啊,工作流啊,打包起来,封装起来,让别人直接输入这样一句指令,就可以得到他需要的结果的这样一个工具,明白吧? 当然啊,今天这个是一个最简单的就是一个提示词的一个封装,那实际大家在啊工作生活当中遇到的各种问题,他不可能只是这样一个提示词就能解决的 啊,他会有大模型,有插件,有工作流,有各种节点,那么我在体验课的最后,我会带领大家手搓出一个这样的智能题,正儿八经的啊,大家不要先不要害怕,就是跟着飞哥一步一步走,你就能搓出这样一个智能题来,并且你自己可以去用。 好吧,那么今天这节课就到这里让大家认识了智能题,不要对智能题有恐惧感。好吧,那我们下节课再见。

大家好,我们今天讲的是 ai 智能体的生态,它会简单的介绍一下目前整个 ai 智能体它的一些生态的情况。整个会分为五个部分。第一个部分的话就是模型的底座,这个也是我们智能体的这个基石,就是智能智能体它其实是依赖于模型去实现的, 我们讲的 ai 其实就是这一块的能力。第二部分的话就是逻辑认知能力,就是我们如何去提升模型的逻辑认知的这个能力。第三部分的话就是整个智能体它目前分为哪些形态?第四个部分它 模型和或者是说我们讲智能体它如何去访问和连接 web 的 一些环节,比如说我们通过谷歌去发一些邮件啊,这些东西它是怎么去实现的?第五部分就是整个交付落地这个过程中我们怎么去使用现有的一些平台去简化我们整个智能体开发的一个成本。 另外一个我们现在有哪些东西,它其实是类似于使用了智能体这个东西去给它实现的。首先讲第一个部分的话就是模型的底座。第一个部分就是通用的动物态大冒险,不是像这个 to seek、 千万豆包这些东西都属于这个智能体的生态里面的。这个通用的 动模态大模型这个大家比较熟悉,我就不太细说了。第二部分就是垂直或者轻量化的一些模型,这指的是一些行业的一些模型,比如说像医疗行业或者法律行业、编程行业或者教育行业,其实受限于一些特定领域的一些知识。第一个可能就是每个行业的知识不一样, 比如说这个词在这个行业里面是这个意思,在另外一个行业可能意思就不一样了。还有一个可能就是他,比如说有些数据他是不能够对外透出的, 他是保密的。所以某某些公司或者是某些行业,他会训练自己特有的一些模型。比如说像阿里最近出的那个安扎尔,他可能基于医疗,就是在医疗领域单独训练一个大模型。 还有一种就是生成式的 ai, 这个指的是啥?就像图片生成或者是视频生成,类似于像极梦这种软件,它就用了很多的视频生成的这个能力。还有一种叫嵌入和重排序的这个模型,它其实是很多像知识问答或者是知识库的一些基基石, 它其实做的事情就是文本的一个相似度匹配,它并不是依赖于就是两个文字它出现的是是否是 一样的,而是更多的是让两个语义相似的这个文本去做了一个匹配。所以它在 ai 领域会非常的常用,比如说像明天 tomorrow 这两个词的语义会非常的接近。 另外一种就是第二个它的逻辑认知的这个能力,逻辑认知能力其实现有的有有比较大家验证过的,有几种比较能够提升这个模型的逻辑认知能力 的一些框架。比如说像 react 框架,它这个东西指的是 action 加 action 这样的一个框架,它其实就是问题加行动 这样子的一个框架。这个讲起来可能会比较抽象,我可以举个例子,比如说像在厨师,他在去做饭的时候,他可能会去做先做一碗菜,然后他可能会去尝一下,看这个菜是不是咸了还是淡了, 如果是咸了的话,淡了的话它可能会加一些盐进去,然后再重新再试再尝,这就是就是 reaction 的 这个特地框架,它其实做了一个事情。 另外一种叫 c o t, 就是 c o 链,这个做的是什么事情?这个就是在模型在输出结果的时候,你把这个结果再丢给他,或者说你,你让他去再做深一进一步的这个思考,你先把你的想法输出出来,最后再输出这个答案。 还有一个小长短期的一个记忆系统,这个是在就是这道题里面会也会出现的比较频繁,我们怎么样去把这些信息给他记下来? 这里面其实会分两种,一种叫长期记忆,一种叫短期记忆。短期记忆指的是什么?比如说我之前问了几个一些问题,那我不可能把所有的问题全部都记下来,因为现现于现在这个母婴的 能力还跟不上,所以他很多时候是会把这个这个能力分,把这个整个记忆分为长期的和短期的。 短期就是我在这个对话框里面跟你聊的那些信息。长期就比如说你这个用户你是个什么样子的人,比如说你在哪工作,或者是你的身高体重、职业啊,或者是你的一些兴趣爱好啥的,这种信息我可能会单独记下来,下次的时候会给你一个更丰富的一个体验感。 短期记忆我们就不聊了,长期记忆其实在模型或者是在使用的这个过程中,他,呃就是就是生成的这个方式大部分都是一样的,会把这个对话的内容再抛给这个模型,然后再问他我这个对话里面有没有涉及到这个用户的一些 说职业或者之类的一些需要我记住的一些信息,关键词啥的,我记如果有的话你输入给我,那这样他会把这个输出这个结果再记下来。那这种的话其实就是属于是啥会去消耗我的这个模型的, 相当于我会其实还会有一个产生一个持续的消耗,所以的话目前不管是哪个平台,他的长期记忆的话都比较贵。 还有一种就像销量知识库这种,在我们类似于客服啊这类一些系统里面用的会比较多,这个指的就是 我们在整个的就是外挂的知识库。比如说我们在模型他在输出的时候,他可能并不知道我这个公司是什么,他也不知道我这个商家,比如说他不知道我的产品是什么,我的产品有那些特性 这些东西他都不知道,那这样我可以给他挂一些外挂的一些销量支货。那这样比如说用客户来了问一个问题,那我可以从我的专有的知识里面去把专有的一些内容,比如说我的价格,我的有哪些特性,有哪些优势啊之类的信息,再返回 给模型,模型在基于用户的这个问题,加上我已有的这些信息,再给你输出一个精准的一个答案。这目前在客服领域里面用的还比较多的。 另外一种就是智能体的形态,智能体形态其实我目前主要我们用的还是单体的智能体,这个单体的智能体指的是什么意思?比如说我有一个问题过来了, 那这个时候我会去判断你,你是要干嘛?比如说你是要去查资料,我肯定去调用一个搜索的一个组建去给你搜索一些信息,再基于这个搜索的信息,再给你把这个答案输出出来。 另外一种就是叫多智能体集权,目前在 cos 平台或者是其他啥的基本上都有,但是目前用的人还比较少, 因为他主主要出现在一个什么问题,我们讲的这个角色分工和协调作战,在整个的模型里面会有一个藕合的这个情况出现。 比如说我们在传统的这个工作过程中间,他会有一些领域区分。比如说我有一个产品经理,他可能只干产品经理的该干的活。比如说我有一个就是工程师,他可能只干工程师这块的活,他俩这个角色之间其实有些专业领域知识大家都不知道的,但是模型不一样,模型都知道, 所以这个时候就会出现一个问题。比如说我明明分了两个角色,一个叫产品经理,他是用来去设计我这个系统的功能的。另外一个我分,我分了一个就是角色叫工程师,他是用来去实现这个程序的具体的代码的。 但是我会在模型的实战的过程中,我发现模型把这两我不管是是就是定义了这个工程师这个角色,还是我定义了产品经理这个角色,模型会把这两个事情都一起去干了, 所以会有一个就是领域知识的,一个就是交集,或者说就是现在相当于你这个角色分工很不好去做,所以现在 其实这个这块能力还是不是特别成熟,包括我们讲的这个蜂群啊之类的东西,其实也是一样的这个逻辑,我定义了一个蜂群我干嘛?我不如我去定义一个智能体,我无非就是我一直在去使用这个智能体罢了。 另外一种叫自主工作的流,自主执行流,这个指的是啥?我有一个问题来了之后,我自己把这个问题拆分成一二三四五六七七个步骤,然后分别去执行这七个步骤,最后再输出一个结果。 但是这里面还会有一些具体实线上的一些问题,这里不再跟大家细讲了。还有一种叫叫工具和协议层, 这个工具和协议层其实指的是我们模型也好,或者是说智能体如何去访问 web 的 一些环境。比如说像我们想去访问高德地图啊,或者是想去访问美团,查一下他的商品的价格, 这个东西它是怎么去实现的?在早先最开始的时候,我们是哪个平台单独去集成,比如说我们高德地图,它有一道单独的集成的方式,嗯,我们偶尔用这种方式去连接高德地图,我需要用这种方式去连接小红书,用这种方式去连接 bilibili。 后来我发现就这个事情太麻烦了,完全搞不完,所以后面就出现了一个叫 m c p 的 上下 m c p 的 一个协议,这个协议的话其实就是专门用来去反向去 逼着平台去适应模型的一个协议,所以它其实并不是一个非常高深的一个技术,它只是定义了一个规范,这个规范要求是什么?我们所有的平台,或者是说我们需要就是我们 或者是一些软件啥的,他要求你使用这个协议提供标准的,按照标准的规范去提供标准的能力出来。比如说你高德地图可能有一些去查查那个路径也好,或者是查一些地址,地址的一些具体的信息。 那这个这个时候的你,你如果想要开放这个能力给到智能体,你,请你按照我现有的这个规范去实现,这样子去减少了大家去接入不同平台的这个成本。所以这个 m c p 协议就是这样的一个东西,另外一个东西指的是工作流,这个工作流是指的是 这个工作主要解决的是什么问题,就是模型他的不确定性。比如说我有个模型,如果说我今天让他去帮我去做一个调研报告这样的一个活,他其实是很好做的。 因为他可能比如说他想去搜索这个谷歌,从谷歌里面去捞了一些现有的我们这个行业。比如说我做石油勘探的,他会从这个石油看谷歌里面去搜了很多现有的一些原油的一些价格之类的信息下来去 做进一步的这个分析,这个都没有问题,你随便怎么分析。最后这个他出出来这个报告可能会有一些问题,但是会有一些大差不大的这个情况出现,他给了我对这个 就相当于我其实对于这个报告他没有一个很标准的一个要求。但有些情况下他就不一样,比如说我需要去产生一个类似于 标书审查,我要去审查这个标书,它每一半,它每就是这个标书里面每段,它每哪一段上面有一些什么问题,比如说它逻辑不自洽之类的东西,那这个时候它一定有标准的这个审查的逻辑。还有一种比如说我要去生成一个 ppt, 那 这个时候它这个 ppt 它有个标准的一个格式,你不能乱来。你比如说你,你生成第一页是什么?第二也是什么样子的,那这个时候我可能会让去智能企业做个什么事情,比如说我先把这个 ppt 的 它的大纲给它输出出来, 比如说我这个 tbd, 我, 我这个第一页是什么?第二页是什么?第三页是什么?第四页是什么?再去分别实现每一页不同的这个内容。在生成这个内容之后,我再去生成每一个内容它里面的一些插图,再把这个图片的信息给它塞进去,它这个时候就有它有标准的工作流, 这个时候我我反而使用这个工作流,未必让我让智能机自己去发散,自己去想会更加的靠谱一点。还有一种叫函数执行,叫方胜,靠这样的一个能力,这个其实是模型自带的这个能力。这个里面我们可能稍微提一下你们刚讲的一些插件, 我们今天讲的叫协议,其实,呃在 cos 平台或者是其他的平台,他们会用一个叫插件这样的一个概念去代替这个东西,其实是他就是用的防身 call 的 这个能力去调用的。 比如说我有一个插件是专门去访问小红书,或者是访问这个微信公众号,他让我去这个插件能够去帮我发送一篇文章到公众号里面,他其实就是用了去相当于去通过一些标准的协议去连接了一个微信公众号。 另外一个就是 skills 技能这个东西其实是新出来的一个概念,但是我发现像 codes 上或者是其他平台上对于这个东西用的都不是特别好,现在目前用的比较好的还是 cloud code 这个东西, 它其实是什么样的一个概念呢?就是,呃,我们之前讲了有像很多像插件这样子的能力,其实理论上来说 skills 和和插件这两个概念其实是差不多的,都是原子的这个能力,但这两者之间会有一些区别,就是插件这个东西 他主要是做的事情是连接外部的一些应用,比如说他去连接公众号,去帮我发一个文章,这是插件的他的能力,在 skills 的 时候他会就是用到更多的一些, 呃,类似于他会在里面去写更多的一些提示词,那这个时候他就可能就变了,他就是可能 skills 的 这个能力,他会让他就变成了让我 在公众号上去写一个更好的一些文章,把这个文章通过这个插件再发送给公众号, 再丢给公众号这样的一个能力,所以这两者之间是有些不一样的。还有一个东西就是它具体的交付和落地的这个情况, 现在有比较多的一些开源的代码的一些编法平台,比如像 code 和 define, 这两者目前在国内应该是最火的。像 define 在 企业层面上用的会比较多, 它这种就是为了去快速实现这各种不同的 a 阶的格式化搭建。另外一种就是像开发工具,比如说像 cooser 之类的一些开发工具,或者像 cloud code, 或者是像 trail 之类的一些类的一些 开发平台。这种其实它其实跟我们之前在现在比较热门的一个词叫 webcody, 这个词是比较火的,它其实 跟以前的我们的这个编程软件不一,很一样的地方就在于说它可以通过人机对话的这个方式,让呃 ai 去自动的帮我们生成程序。但这个东西我如果大家有兴趣,后面我们可以单独讲一下 web coding 这个 东西,这个这个东西它怎么去实现一个应用程序,因为这个东西其实呃不像我们讲的那么简单, 就是我们讲人机交互自通过 ai 的 能力自己去生成一个程序,想法是很好的,实行起来。其实 呃也还好,我之前也试验过直接使用模型的能力去生成这个程序,确实也蛮不错的。但这里面还会遇到很多的坑, 我们很多完全不懂应用的或者是不懂开发的这个同学,在遇到这个坑之后会发现这个坑完全没办法解决。这个就是他目前 web coding 存在的一个主要问题,但是他会对于开发者会非常的友好。那以前大家吭哧吭哧写代码,现在可能就是丢一个问题给模型,让模型生成去了,自己 该喝茶喝茶,该玩干嘛,该干嘛干嘛去了。另外一个就是垂直行业的一些应用闭环,目前很多东西都是用到一些智能机去做实现,比如说我们刚讲的像 ppt 的 生成标书申标书审查, 或者像其他的很多地方,我们都开始使用 ai 的 这个能力去对现有的一些业务流程,或我们讲的工作流程,或者是讲的是像现有的一些工作,或者是我们企业里面的一些呃流程去做了一些优化。但是目前 目前有个趋势,我们整个的 ai 的 深层或者是讲 ai 的 场景,它会越来越深入到我们日常的工作,或者包括企业的生产,或者是讲与我们居民的一些生活, 这个是目前后面的一个趋势,目前国家也在推进,比如说像 ai 加医疗、 ai 加教育、 ai 加很多个场景的大家,国家也在鼓励这块的事情,后面我们会见到更多的 ai 的 这个场景, ai 会进入到我们更多的日常生活过过程中里面来。

最近很多人问我,智能体到底是什么?普通本科能不能学?现在行情到底行不行,我直接讲清楚。第一,智能体是什么?一句话解释,智能体就是会自动思考并执行任务的 ai 程序,它不是单纯的聊天机器人,而是能理解目标,自己拆解步骤,调用工具,给出结果。比如自动写报告、 自动分析数据、自动生成代码、自动运营流程。它的核心技术其实就三块,大模型、加提示工程、加工具、调用逻辑。第二,普通本科能不能学?能,而且比算法更现实。为什么?因为做智能体应用开发,不要求你去训练大模型,而是会用现有的模型,会写逻辑,会整合工具 本质是什么?拍摄加 ipi 调用加技术,逻辑设计这套东西普通本科完全能学,而且学习周期不长。第三,行情怎么样? 我说实话,现在属于早期红利阶段,岗位还不算爆发式多,但需求在增长。企业现在缺的不是模型研究员,而是能把 ai 真正落地的,尤其是 ai 应用开发、 ai 工具整合、自动化流程搭建。但我要提醒一句,智能体现在是加风向,不是一个成熟的大规模岗位赛道, 也就是说,你不能只会智能体,你必须要有基础的开发能力。最后总结一句话,智能体不是风口骗局,但它更适合当人力叠加项,而不是孤注一致的专业方向。普通本科完全可以学,但前提是你先有基础的编程能力。