a 政的开发方向,很多小伙伴是乱学瞎学,知识零零碎碎,而且你会发现不知道自己该往哪走,那这里面呢,两到三个月的入门计划,你大概需要怎么学?小赵是要强调根据你未来的规划的不一样,这是分两种不同的思路的,一种思路就是你现在对于 a 政开发这块是个空白。 那么这种小伙伴,你想成为 agent 的 开发工程师,建议你全套的去学。什么叫全套的学?先解决 python 和 python 框架,再解决深度学习,解决大模型,解决大模型的架构,解决算法,然后再切换到 agent 的 项目开发。 事实来讲, agent 的 这个东西最值钱的,也是最有效的学习,就是项目驱动。但是呢,这种小伙伴因为需要从底层 打捞自己的根基,一步一步的迈上来,找到一个全职的 offer。 其实来讲,这个过程差不多得需要五个多月。还有一种小伙伴是什么呢?他现在已经有很不 错的编程经验,只不过过去这么多年,做前端的,做 java 的, 做 c r 加的 c sharp 的 无所谓,他已经干了很多年的成学了,只是他现在缺乏结合 ai 的 能力。做 a 整开发 这种工程师转 a 值的,那就更方便。全程差不多两个月,最多三个月。那么这个过程大概需要怎么个流程呢?无非先花一周的时间补一下 python, 你 千万不要跟我杠说 python 也不是一周能搞定的,是这样的二八原则,花百分之二十的时间 学百分之八十的情况下用到的高频的那些 python 语法。 python 里边儿包含的东西太多了,但是很多东西跟你做 a 证开发没有什么直接关系,那么接下来呢,直面两大框架, long chain、 long graph。 先学 long chain, 先用 long chain 跑通一个项,再学 long graph, 再跑一个项,一个框架一个项。基本上来讲,你转型到 a 智能开发没有任何的问题。至于基础框架的那些语法, 依然是一个礼拜解决。就老程序员或者说你有 python 编程经验,千万不要在语法层面上纠结现在是什么时代,是 ai 时代, ai coding 能给你非常强的辅助, 千万不要背那些条条框框,就相当于拉低了自己的生产效率。那么未来呢?项目制驱动我刚才已经说了,都是在项目中一步一步的就把大家带出来了。 对于这个 ai 应用开发或者 ai 的 开发感兴趣的小伙伴,小赵是准备的全流程的一个路线图,非常清晰地展示出来了上线项目大家到底要学习哪些知识,哪些技能?感兴趣的小伙伴呢,可以找我领取。
粉丝1.5万获赞10.6万

全网首发剪映斜修必备技能,它来了也是对新手最友好的功能,剪映助手这个真的可以大大提高创作效率,还可以进行图片生成和视频生成,点击展开进入功能页, 可以在这个窗口和剪映助手进行交流来修改创作,里面的功能还是非常多的,可以在创作中帮助大家提高效率和灵感。其次它还可以进行封面制作,点击封面之后,点击助手图标,再输入你的要求就可以生成了。 今天邢泽成的实战教学带来的是剪映助手,大家打开剪映后,点这个右上角的帮助中心,再点击在线客服,之后连续输入三遍人工,再点击进入,等完排队之后输入,开通一下电脑版的剪映助手功能, 他会回复你,让你提供版本号,按照要求截图发给他就行,之后他会让你提供 id 码,他这个只是比较复杂,你点一下剪映页面,按一下 f 十二就可以跳出窗口了,复制一下发给他,等待开通完成重启就行。

零基础,零失败,五步搞定 ai 开发环境不需要梯子,不需要懂编程,刷到这个视频的朋友先别划走, 我说的五步就是字面意思,下载软件,扫码登录,复制粘贴,就这些,很多人想学 ai, 卡在第一步,环境搭不起来, github 连不上命令行,全是红字教程,默认你有梯子,百分之九十的人就在这一步放弃了,今天这个问题彻底解决, 全程国内工具跟着做就行。第一步,下载 tree 字节跳动的 ai 编程工具,右边自带 ai 助手,国内官网直接下,扫码登录,一分钟搞定。第二步,搞定 github, windows 电脑、微软应用商店, mac 电脑 app store, 下个 what 二 toolkit, 免费开源,帮你加速访问, get up, 配好之后代码随便下。第三步,搞定 cloud code, 这是第二代 ai, 你 下指令,他替你干, 国内有开源镜像,在串终端里复制粘贴命令就行,不用看懂粘贴,回车等他跑完。第四步, 配 cc switch cloud code, 默认用国外模型 cc switch, 一 条命令切到国内模型,再一条命令配好,两条命令搞定。第五步,验证 终端,输个指令,他回复你了,恭喜!环境搭好了,五步十几分钟结束战斗,卡住了怎么办?问翠右边的 ai 报错,复制给他,他告诉你怎么修,你不需要懂任何技术, 会复制粘贴就够了。发现问题了吗?我们在搞 ai 的 时候,用的是另一个 ai 来帮忙, 这就叫用 ai 搞定 ai。 环境搭好之后,你拥有的不只是一个工具,你拥有了一个二十四小时待命的技术助手,能写代码,做网页,分析数据自动化工作流程。以前你只会问 ai 问题,现在你可以让 ai 替你做事, 这不是事半功倍,是降维打击环境。搭好的朋友评论区打个卡,下一课教大家用 cloud code 做一件真正有用的事。我们下期见。拜拜。

大家好,欢迎来到阿新聊 ai。 今天这期我们讲 prompt 模板库建设。这个主题听起来像文档管理,但它真正解决的是工程失控问题。项目刚开始时,几个 prompt 写在代码里好像没什么问题, 可是一旦场景变多,行业分析、报告生成、风险评估,会议既要转换客户访谈, 每个功能都有自己的 prompt, 事情就开始乱了。你改了一个 prompt, 不知道影响哪些功能?想附用一个 prompt, 不知道它在哪个文件里, 同一个场景出现三个版本,也不知道该用哪个。 prompt 模板库的目标就是把 prompt 从散装文本升级成可分类、可命名、可版本化、可测试、可评分的工程资产。 建设模板库的第一步是分类,这里最容易犯的错误是按技术手段分类,比如 jason 输出类、 feel short 类、思维链类。这样分类对开发者看起来熟悉, 但对业务使用者并不好用。真正使用 prompt 的 时候,大家想的是,我要做行业分析,我要深层方案,我要评估风险,而不是我要一个 jason mode prompt。 所以 更推荐按用途分类。分析类,用于行业、公司、岗位流程和竞品分析。 生成类,用于报告方案、邮件文案和提案。评估类,用于机会评分、风险评估、可行性评估和 roi 估算。转换类,用于把会议纪要转代办, 把自由文本转结构化,节省。交互类,用于客户访谈、需求澄清和销售话术分类。一旦清楚,团队找 prompt 的 成本会大幅下降。 分类之后是命名,命名看起来是小事,但它直接决定团队沟通效率。一个好的名字应该让人一眼看出这个 prompt 用来做什么。建议使用前缀加核心功能加变体的结构,比如 analyze industry overview。 前缀 analyze 表示分析类, industry 表示分析对象, overview 表示概览版本。 同类还有 analyze industry deep 和 analyze industry comparison。 反过来不要叫 prompt jason mode, temperature 零三这种名字暴露的是技术细节,不表达业务用途。命名规则必须在模板库建立初期就定下来,因为后期改名会牵动代码引用文档说明和历史记录,成本很高。 prompt 模板和普通 prompt 的 关键区别是参数化,普通 prompt 可能写死维。请分析半导体行业的发展趋势、市场规模和 ai 应用机会。模板则应该写成 请分析 industry name 行业,并通过 analysis 控制分析深度。 这样同一个模板可以分析半导体、制造业、金融业,也可以进入标准测试流程。 参数设计要少而精,通常不要超过五个。每个参数要有类型约束和默认值, 比如 industry name is b 填制服串。 analysis steps 可以 是 overview standard 或 deep, 输出也要有气约。是接受 markdown 还是自由文本,如果是接受就要定义 schema, 如果是 markdown, 就 要定义章节结构,最好同时提供 schema 和输出样例。 机器能叫验人,也能快速理解。 prompt 不是 一次写好就不变,模型升级、业务需求变化、用户反馈、输出格式调整,都会让 prompt 需要迭代。版本管理的核心是追踪变化, 谁在什么时候改了什么,为什么改?改完效果是变好还是变差?建议使用主版本号、加次版本号。输出格式或核心逻辑大变就从 vi 到 vi, 小 范围措辞约束,视力调整就从 vi 零到 vi。 一、 每次变更都要记录变更内容、变更原因,同一批测试数据上的前后对比以及回滚方案,不要只写优化了。 prompt 这种记录没有排查价值,要写清楚,比如新增竞争格局分析维度或增加 risk level。 时段 模板库要想稳定,不能只靠感觉判断 prompt 好 不好。每个核心模板都应该绑定固定测试样例,至少覆盖标准场景、边界场景、异常场景、 安全场景和业务关键场景。比如行业分析模板,不止测半导体这种典型行业,也要测只有一个行业名的极简输入、很长的业务描述、模糊输入、 空输入以及包含月权要求的输入评分体系。可以从五个维度看,格式和规度、内容准确性、信息完整度、可操作性和稳定性。 权重可以是准确性百分之三十,格式完整度和可操作性各百分之二十,稳定性百分之十。综合分低于七分就需要优化,超过九分才适合作为标杆模板。 当 prompt 效果突然变差时,最怕的是不知道原因。普通代码可以看 d f。 prompt 也需要类似的变更意识。除了记录文本差异,还要标注改动类型,比如 role change、 task change、 context change、 example change、 schema change and safety change。 失败归音也要结构化, 常见原因包括指令冲突、上下文不足、视力误导、 skimming 过复杂、字段描述不清、模型能力不足,知识缺失,或者下游较厌过严。这样做的价值不只是排查一次问题, 而是让团队知道哪些改法有效,哪些改法失败过,避免下次换个人又重复踩同一个坑。 最后是治理模板库不是越大越好,越大维护成本越高,重复和过时的概率也越高。建议给模板设置四种状态, draft 是 草稿,可以试用,但不能进正式流程。 stable 是 通过测试的稳定模板。 deprecated 是 即将废弃但仍保留兼容。 arcad 是 历史规章,只用于复现和审计。每个模板都要有 owner 负责反馈、审核、改动、维护、测试级和决定是否废弃。新增模板前要先搜索是否已有相似模板。 如果只是输出格式分析深度或目标受众不同,优先做成同一模板的参数或遍体, 维护节奏也要固定。每周回顾使用情况,每月给核心模板评分,每季度清理过时和重复模板。 ok, 这期就到这里, 欢迎关注阿新聊 ai, 也欢迎在评论区留下你的看法,我们下期继续聊 prompt 工程化。

嘿,欢迎回来!自从出了本地卖电脑安装 open call 的 分享后,后台收到好多 windows 用户的私信,希望能够在 windows 安装部署使用。 今天他来了,本期就 windows 系统下如何安装 open call, 从环境准备到配置上线,一条视频讲清楚,就算你是完全零基础的新手宝宝, 跟着我的步骤走一样能跑起来!全程实录,不含废话,准备好了吗? let's go 很 一安装须知安装之前我们先检查一下电脑环境,看看是否符合。一按安装步骤,这里一共分为六个步骤。 第一步,安装 w s l 加 a b o 图,以管理员的身份进入 windows 终端,将命令贴进来并回车,此时系统开始下载 linux 系统及 u b o 图,等待安装。 第二步,出示画瓢,公主下拉会提示创建账户名和密码,输密码是看不见的,正常敲就行,请注意记录下来后续用的着哈。接着跳出收集使用日制运行数据的授权弹窗,选择默认的 y, 此时 wsl 即泵出,安装工作就完成了。第三步,更新系统及安装必备底层依赖在 wsl 终端中,将复制的命令粘贴并执行。这一步是为了确保系统依赖完整, 防止一键安装脚本报错。接着会提示输入第二步,设置的 open call 密码,输入后回车即可,下来就等待一会会。 第四步,官方一键安装 open call, 继续在终端贴入安装命令并执行, 执行过程中不要关闭终端,耐心等待,脚本会自动完成 open call 的 安装, 全程自动完成,无需手动干预。安装完成后,中框出现绿色的提示, open code and so successfully 到此, open code 安装完成。第五步,出场 open code 本地账号接下来是配置了默认选择 yes, 启动模式选择默认 quick start。 模型提供商,我选择了自定义模型提供商,输入 api pixel 和 api 点 on point compile beauty, 选择 arp nai。 接着输入我配置的模型 minimax m r seven, 它是不支持图片输出的,选择 no。 接下来会让我们配置通信方式、联网搜索技能赫兹等。 之前的教程有分享过,这里就不演示了,选择跳过,再看到网关服务已安装好了启动方式,选择更为友好的 v b y。 第六步,浏览器访问 openclock 控制台,登录电脑浏览器,我们来问他一个问题,你是什么大模型? 看那回复是 mini max m 二 seven, 并且说明了是通过自定义 api 接入的,跟前面配置完全一致。看到这里分享也快到尾声了,我们来回忆一下, windows 电脑需要先安装 ws 二和乌崩兔, 同时更新系统及安装必备底层依赖,并演示了自定义模型厂商的接入方式,后续官方一键脚本自动完成安装 始化 opencall 本地账号和 mac 上是一样的,这里我也准备了学习资料,如果觉得有帮助,请记得一键三连哦。另外你们还有啥想听的也可以告诉我,我们下期见了。

工业界里合格的 a 站的工程师至少要具备这三方面的能力,第一方面的能力,底层关于一些大模型方面的一些知识。很多小伙伴学 a 站的一直在问我说小赵是我能不能完全先跳过 high top, 跳过大模型和 transform 的 那套?我什么都不知道,能不能去直接学 a 站的, 百分之九十的情况下是不能。为什么?给大家举个最简单的例子啊,大家一定听说过所谓的大模型的上下文,大模型的上下文是有限的,我们不能把太多的信息灌到大模型里, 但是只要你没正儿八经的学过 transformer, 你 始终就像背历史课的条文一样,你背住了。大模型的上下文是有限的,但只有你真正的了解过 transformer 的 架构, 你才能够非常深刻的理解为什么大模型是有上下文的。有时候面试的时候,面试官也会经常不经意的把这个问题抛出来,就是试探一下你有没有底层的这种知识。如果没有,面试官心里就知道你是一个纯应用的,你容易被压价。另一方面呢,你在 ai 这块的天花板会很低, 所谓的 ai 对 于你来讲就完全演变成了 a p i, 那 么你觉得对于一个只掉 a p i 的 小伙伴,会给你一个很高的定心吗?不可能的。第二点呢?做 a 阵的开发,呃,我去学一学那种低代码平台,那些东西是做什么的?是产品经理,做原型的? 就是我先搭一个架子,糊弄糊弄领导,有多少公司用这个低代码平台搞 ai? 现在二零二六年,他就在不断地把曾经的低代码平台换成真正专业的平台,因为他知道低代码平台只能掩饰呆萌,没有办法正儿八经的上生产环境。 真正专业的框架, long chain、 long graft。 long chain 和 long graft 这个框架在市面上呢,两条大的路就是你们公司这个业务线,基本上来讲是一个 workflow 业务流,那么在这个明确的业务流之下, r a j 依然非常的有价值。 很多人还什么 r a j 已死,但市场来讲,在工业界该用照样用,为什么呢?因为很多行业它是一个垂直行业,垂直行业就有垂直数据,而这个垂直数据是不公开的,那怎么办?只有搭乘这种 r a j 的 私有数据库,你怎么去提高它的召回率?你怎么进行多路召回? 你怎么把知识图谱引入进来?你怎么进行重排序? reranker, 大家真的以为有一个数据库这件事就全解决了吗?也没有那么简单呀,怎么去搭这个数据库?我们一直在说唱单纯的接唱,可这件事就能解决吗?而且呢,这个项目上线之后,你会发现,现在工业界对于一个实际的这种 a 阵的项目,大家需要语音沟通,那么一旦引入语音,怎么去跟你这个项目进行对接?有的小伙伴说了啊,那不也是掉 a p m 吗?远远没有那么简单,你怎么让它这个延迟特别的低,怎么去进行这方面的优化?你的这个项目既然是一个垂直领域的项目,怎么进行意图识别? 怎么为你的这个模型,或者为你这个系统的安全性进行兜底?怎么进行一些巨大这个策略怎么设计?是引入模型还是引入关键的一些字典?只有你真真正正的做一个工业级的落地的一个项目, 你才能得到全方位的一个锻炼。一个系统项目上线之后,有些小伙伴说我只管跑,跑完了之后,你怎么进行全流程的溯源?一个 query 进来,在你这个系统里流经了哪些模块? 这个模块如果到最终不管是好还是不好,尤其是出问题的那些,对吧?比如说用户点彩了这种情况,你怎么去进行全流程的溯源,来找到你这个系统里边的卡点?你的这个像有经过冒烟测试吗?有经过压力测试吗? 有经过正常的灰度发布吗?都没有怎么去改进它?全流程的延迟是多少?只有真正做上线项目, 你才能够真正地考虑到你公司里边这个业务场景,它是一个 workflow 的 形式,走 long chain, 如果就是走我们所谓的 multi agent 的 多智能体里面的 react, 它不仅能进行单次的解锁和回复,它能够反思,把多个智能体联合到一起, 这又是一种项目模式。小赵叔现在也要专门的带着大家做这种 long graph 的 管家,依然要强调,工业界里边能把这种基于 long graph 或者这种 multi agent 的 这个系统跑在生产环境上的是少之又少,并没有大家想得那么的顺利。 大多数的这种所谓的 multi agent 的 项目依然是在给个人用得多,或者说在一些容错度高的业务场景之下才能用。而具体怎么选业务场景,具体怎么去搭, 小赵,是还是那个原则,做上现象,这些事你都会在一个一个的踩坑中一一的解决。第三点呢,关于大模型的高速推理这一块儿,两大框架,一个呢就是 v l i m, 一个呢 s t long, 其实已经涉及到大模型的底层了,比如说配置的弹性这种原理,但是这种东西为什么对于一个硬开发工程师你也要具备呢?一,面试他很可能会考。第二,但凡你这个公司, 你需要数据合规,你需要审计合规,你有安全性上的要求,你就只能大模型本地部署。那么大模型只要本地部署,就不能基于传统的那种所谓的哈根 face 的 推理, 必须把它换成 vrm 和 sdr 这种高速推理。那么这个技能你是否具备?你别弄来之后,咱们得本地部署大模型,结果你那个模型部署完了之后,原生的哈根 face 的 模式推理速度贼慢啊,那这肯定是不行的。 所以说呢,这三方面的能力呢,你综合的掌握了多少,掌握了有多深,直接决定了你的 offer 能够拿多大。小周老师的这个全项目驱动的 a 站的学习路线图呢,也已经为大家准备好了,具体呢,需要学哪些技术, 学到什么程度,大家看上去呢,也都一目了然,想要的同学可以拿走,还有额外的学习资料一起送给大家。

今天说一下蓝 graph, 先看一个场景,这个是我做的关于口式矫正 app 的 ai 对 话聊天的一个功能, 在这里我可以选择模式。当我选了专家模式以后,这里出现了四个专家,诊断专家、数据分析师、方案专家和心理支持者。那什么时候需要用到这四个专家呢?比如说用户,他发送了一个消息,我一和老板说话就卡壳, 心情很绝望。这个时候如果是普通的 ai, 他 只会给你一段不痛不痒的安慰。 但是在实际的矫正场景中,用户是同时需要诊断专家来分析为什么 好老板说话会卡壳,数据分析师去翻看他上周的打卡发行数据有没有异常。方案专家开出具体的阻断或者慢速朗读的方案。心理知识专家去缓解他对权威的恐惧和沮丧情绪。 这种多专家联合会诊多角色,根据问题复杂度动态增减的场景,就是栏杆 f 的 核心底层逻辑。 既然要用蓝寡妇来编排一个专家团队,他是怎么样做到的呢?我们需要在脑子里建立三个最核心的概念。第一个概念是状态 state, 他 就像是放在会诊室正中央的一本共享大账本,诊断专家写几句,让专家加一条建议, 大家共享同一个账本,后面的专家可以看到前面所有人留下的痕迹。第二个核心的概念是节点 node, 他 就像是传送带两盘的独立工位,一个专家就是一个工位, 他负责拿到账本以后,干完自己的活,再把结果更新到账本里面看下。第三个核心概念是边背着 他,就像是传送带和分流路标,他规定了账本接下来要去哪,尤其是条件边,大模型会化身倒一台,根据问题的类型决定是走 快速绿色通道,还是走全科联合会诊。我们说完了 long graph 的 核心概念以后,来结合代码来看一下他是如何构建流水线的。 我看这里是状态的定义,它里面有定义用户的基础信息,包括用户的提问,用户的画下路由角色。这里也是定义了字典节点,可以根据他字典的值去判断下一个节点该走哪里。 下面这个是各个专家的输出,还有执行的记录和最终的输出。我们所有节点的信息都可以放在 state 里面,然后让所有节点来共享这些信息。 看完状态以后,我们看一下节点,看看这里是添加了几个节点,然后把这个路由专家的节点去作为入口。我们来看一下路由专家他是怎么实现的。 在这里我通过去写提示词,然后结合用户的提问,去让 ai 大 模型去给出我一个特定的回答。 我们看一下这里有严格限制输出的格式,它里面的字段就是刚才我们 state 里面所包含的字段,那么先给他返回了这几个字段以后,他再把这些值 存到 state 里面,然后供其他节点去使用,这个就是路由专家。我们接着看一下在路由专家走完以后和这个 root by type 这个函数,那它作用是什么呢?我们来看一下 它的作用是根据问题的类型和复杂度,路由到不同的节点,我们看在上一个阶段,路由专家里面是通过大模型返回了用户提问的 问题的类型和复杂度,然后这个 root by type 这个函数去根据复杂度和问题的类型去返回下一个节点该走哪里。我们看一下 如果是返回的诊断问题的话,那就去走诊断专家,如果是返回的是心理数据分析问题的话,那么就去走数据分析的节点。我们看这里走到诊断专家以后,再根据这个函数去判断下一步该走哪里, 是走数据分析专家还是走方案制定专家,那这就是诊断分支的路由好,我们看其他的 路由也是一样的,看这个是走了数据分析的以后,再去走方案制定,那这里是走了方案制定节点以后,再根据这个函数去判断应该走这个节点,还是走汇总的这个节点 好,我们看他所有的节点,最后都走到了汇总的这个节点里面。我们来看一下汇总的这个节点它里面的逻辑是什么?它是获取到全区的 seed 里面的所有的结果,然后拼上用户的信息,放到提示词里面, 然后调用到大元模型,最后返回给文本这个汇总专家,他走完以后,他下一个节点就是按的表示这个汇总专家是 最后一个节点。在所有的节点都走完之后,我们在这里添加内存检查点,这一步相当于是创建了一个内存缓存器,它就像是一个临时的笔记本,它的作用是用来记录 ai 和你聊天时候的上下文、历史对话和当前状态, 有了它 ai 才能记住我们上一句说的什么。这一步相当于是把前面创建的 memory 打包进整个工作流,并正式把工作流翻译运行, 这就是蓝寡妇的使用流程,我们来看一下它的效果。在这里我提问了一个问题,这个时候绿油专家他会根据我问题的复杂度去判断我下一个节点应该走哪里。 路由专家他判断出来的问题是简单的,所以他直接走的汇总专家去给了一个通用回复。那我如果写一个复杂点的问题呢? 来看看效果,我们看这个时候路由专家判断出来他的问题是中等难度的,判断出来他是是需要经过诊断专家来诊断,然后 整合完成以后再通过方案专家来制定方案的。所以这里是经过了两个节点,然后最后到汇总专家这里,最后再给用户一个回复,这就是 lan graph 的 使用效果。 最后我们来复盘一下我们这个功能里面,我们通过 lan graph 将复杂的口吃矫正业务结偶成了彼此独立的专家节点。在传统的开发中,如果我们想要在心理安慰中 加入数据支撑,那么我们得写及其永长的 prompter。 而在蓝 graph 的 世界里,每个专家只需要在自己的专业领域里做最好的自己。数据分析只看数据,心理专家只管控勤,会由汇总专家来做信息的对齐和润色。

大家好,欢迎来到阿新聊 ai, 希望看完关注我哦,有企业咨询、企业 ai 转型定制的需求也要找我哦。今天这期我们讲 to call 领深入,它适合正在做 agent、 函数调用、工具编排或者企业 ai 落地的人看。很多人第一次接触这个概念,会以为它就是给模型挂几个工具,让模型需要的时候调用一下。 但真正放进生产系统里,你会发现问题复杂的多。模型可能选错工具参数可能传错,返回结果可能不稳定,权限边界也可能被越过。 所以这期不是讲怎么把放声 callin 打开,而是讲 to callin 这条链路到底该怎么设计。 我们会从 toolscape 开始讲,工具选择参数、传递结果返回、错误处理、权限控制和审计日制,最后收束成一套能上线前检查的设计 checklist。 先讲最底层也最重要的一层 toolscape, 你 可以把它理解成工具的身份证和使用说明, 他告诉模型这个工具叫什么,能做什么,需要什么参数,最后会返回什么格式。一个完整的 skin mark 通常有四块,第一块是 name, 也就是工具名称,最好让模型一眼就知道他大概干什么。 第二块是 description, 也就是工具描述,这是模型选择工具时最主要的依据。 第三块是 parameters, 要把类型是否必填、格式要求和范围约束写清楚。 第四块是 returns, 也就是调用完成后给模型什么结构的数据。如果这四块写得含糊,后面所有环节都会跟着歪。模型不是读心术,它只能读你写在接口里的东西。 to schema 里最容易被低估的是描述。很多团队会写一句很短的搜索信息,查询数据,发送消息,然后就期待模型自己理解边界, 这其实很危险。好的描述应该至少包含三层,第一,这个工具具体做什么。第二,适合在什么场景使用。第三,不适合在什么场景使用。 比如社区 web。 不要只写搜索工具,而要写它根据关键词搜索互联网上的公开信息, 返回标题、摘要和链接。适合获取最新资讯、公开数据和行业动态,不适合查询内部数据库或私有知识库。你会发现不适用场景特别关键, 因为它是在帮模型排除错误选项。描述越清楚,模型做工具选择时的歧义就越少。 接下来讲工具选择模型怎么知道该用哪个工具?本质上,它是在做一次受限条件下的推理,它会看当前任务目标是什么,有哪些工具可用? 每个工具的描述说了什么,然后判断哪个工具最能帮它接近目标。举个例子,如果目标是获取半导体行业的市场规模数据后,选工具有 search web query database 和 calculate matrix, 模型会根据描述判断市场规模属于行业公开信息,可能需要搜索互联网,所以 search web 更像首选 数据库也许有历史数据,但不一定有最新数据。计算工具和当前任务就不直接相关。这里的关键是模型需要足够清楚的工具描述才能做出这样的判断。如果描述都很模糊,他就很容易误选 工具选对以后,下一步就是传参数,而这一层特别容易出事。最常见的问题有四类, 第一,类型错误,比如工具要求 integer, 模型却传了 string。 第二,格式错误, 比如日期要求 y y y m e, d d, 模型却给了二零二四年一月一日。第三,必填参数缺失,因为模型以为上下文理已经够了。第四,参数值不合理,比如 max yos, 明明只允许一到十,模型直接传了一百。 解决思路不是让模型更聪明一点,而是把约束写清楚,自断类型、格式、上下界默认值,甚至一个简短视例,都能显著减少歧义。 参数设计的核心原则是最少必要,不要让模型传他不需要的参数,也不要遗漏真正关键的参数。 很多人把精力都放在选工具和传参数上,却忽略了结果返回。同样,关键 工具调用完成以后,如果返回结构不稳定,模型下一步就很难可靠处理。比如这次返回对象,下次返回宿主,这次字段叫 title, 下次又改成 name, 或者一次性塞给模型一千条,结果看起来信息很多,但模型既吃不下,也分不清重点。好的返回结果有两个关键词,第一,结构稳定,要和 schema 的 returns 定义一致。 第二,数据克制,只返回当前决策真正需要的那一层信息。对 to callin 来说,返回不是给人看的报表,而是给模型继续推理的输入,所以越可预测越好。 再往后看,错误处理也不能糊弄工具。世界不是理想世界,它会超时,会限流、会权限不足、会参数校验失败。如果你只返回一句调用失败, 模型根本不知道下一步该怎么办,它不知道应该马上重试,还是等一会,还是换一个工具,还是直接停止? 更好的做法是结构化错误信息,至少要告诉模型什么错了,为什么错,有没有错误码,以及是否存在 richer after 这样的重置提示。你可以把错误信息理解成模型的决策输入,输入越清楚,失败后的行为就越可控。 如果你要把 to calling 放进真实系统,权限控制就是绕不过去的底线。不是所有 agent 都应该碰所有工具,也不是所有参数都应该让模型自由发挥。 通常至少要有三层控制,第一层是工具白名单,也就是这个 agent 到底能调用哪些工具。 第二层是参数限制,即使某个工具能调,哪些字段能传,目标对象是谁,范围到哪里也要卡住。 第三层是高风险操作审批,比如发邮件、创建任务、写数据库、删除文件,这种动作很多时候就不应该自动放行。你会发现,从 demo 到生产以后, to calling 的 问题不再只是调用对不对?还包括这次调用有没有越权。 除了权限控制,另一个生产级必需品是审计日制。因为当 agent 行为异常时,你第一件要问的不是模型为什么这么想, 而是他什么时候调用了什么工具,传了什么参数,拿到了什么结果。没有这些记录,你几乎没法还原现场。 审计日制至少应该包含调用时间、 a 卷的身份、工具名称、输入参数、执行结果、耗时和错误信息。 它有两个核心用途,一个是调试,帮助你回放调用链路。另一个是合规,尤其涉及外部系统敏感数据或高风险动作时,你必须知道 ai 系统到底做过什么。 当然,日制本身也要注意脱敏、权限控制和保留期限,否则它又会变成新的风险源, 最后做一个收束。如果把前面的内容压成一套 checklist, 主线其实很统一, 名称和描述要清楚,尤其要写清适用和不适用场景。参数要最少,必要把类型、格式、范围和势力交代明白。返回结构要稳定,数据量要克制 错误返回要帮助模型做下一步决策。权限控制要分层,白名单、参数、边界和审批缺一不可。所有调用都要能被追踪和复盘。 你会发现这些看起来像工程细节,但本质上都在做同一件事,让模型以更低歧义、更低风险的方式使用系统能力。真正可用的 two calling 一定同时有两根支柱,一根是能力接口设计,一根是风险治理设计。 只有这两根都在,它才不是一个 demo 功能,而是生产里可靠的一条能力链路。 ok, 这次就聊到这里,欢迎关注阿新聊 ai, 也欢迎在评论区留下你的看法,希望看完关注我哦,有企业咨询、企业 ai 转型定制的需求也要找我哦!

hello, 大家好啊,我是即刻魔导师,欢迎来到 ai agent 零基础入门系列的第四期动手实践篇。如果你还没看上一篇原理篇,强烈建议先回去补个课。因为上一篇我们用生活化的类比, 把 agent 的 四大主键, l l m 大 脑, planning 规划、 memory 记忆还有 tools 工具都盘清楚了。而今天这期就是带着大家把每一个主键都用代码敲一遍,真正实现先懂原理再上手实操的完整闭环。 好,废话不多说,正式开始前,咱们先搞定环境,你需要 python 三点十以上的版本,然后用 p i p 安装这几个包, lanchan, lanchan open ai, lan graph, call m d b 还有 sentence transformers, 一 条命令就能全部搞定。 api key 方面至少得准备一个 deep seek 的 key, 因为今天的视力全是用 deep seek chat 模型跑的。如果你还想跟着做搜索和工具调用的实验,记得再去申请一个 tivley 的 key, 环境配好后跑一下, check 下划线,因为英点 py, 只要看到版本号和 key 状态正常输出,咱们就可以开工了。 第一站实践一 l l m brain 这部分对应原理片里的大脑,我们新建一个 practice, 下划线,以下划线, l l m 点 p y。 里面设计了四个小实验。第一个是基础对话,通俗化 chat, open ai 发一条 system message, 告诉他你是谁,再用 human message 提问,他就能正常交流了。 第二个实验是 chair of thought, 也就是让他学会分布思考。第三个是指定 jason 格式输出。第四个实验特别有意思,是 temperature 参数的对比, 当 temperature 等于零时,输出最稳定,非常适合 agent 等于一时则更有创意。我们让他用比喻来形容 ai agent, 跑三次看看区别。 这里我想特别插一句关于 llm 的 推理边界的看法。 llm 的 推理能力其实是来自训练数据的模式学习,他很擅长模仿、思考过程,举一反三,但他并不擅长真正的严密逻辑推演,也容易产生幻觉。这也正是为什么 agent 需要工具来验证和补充它的原因。 接下来是实践二, planning 规划原理篇里我们说过, react 就 像做菜,边想边做 plan and execute 就 像规划旅行,先做计划再出发。这一节,我们先用 lan graph 的 create react agent 实现一个 react agent。 核心流程很简单,用户提问 agent 进入思考、行动、观察的循环,他先想需要什么信息,然后调搜索工具去查,看到结果后再决定下一步。每一轮循环都是基于上一步的结果来推进的。代码里我特意打印了每一步的 thought, action 和 observation, 你可以清晰地看到 agent 是 怎么一步步推理的。下半部分,我们尝试了规划式 react, 通过提示词引导他先制定计划,再逐步执行。比如告诉他先列步骤再搜索,他就会乖乖照做。不过这里要特别说明一下,这本质上还是 react, 只是用提示词引导了规划行为。 真正的 plan and execute 需要把规划者和执行者拆成两个独立阶段,这个我们留到进阶篇再细讲。 怎么选呢?任务不确定,需要灵活探索的用 react, 流程明确,规模大的用 plan and execute 更省 token 好。 来到实践三, memory 记忆这部分非常有意思。 原理篇里,我们用打电话类比短期记忆,对方刚才说了啥,你得记住,用笔记本类比长期记忆,记下来以后随时翻。短期记忆实现起来很简单,给 agent 加上 memory saver, 再指定一个 thread 下划线 id, 在同一个 thread 下划线 id 下,你告诉他我叫张三,在北京工作,下一轮问我叫什么,他就能准确回答。但如果你换个新的 thread id, 他 就完全不记得了。 长期记忆,我们用的是 chroma 向量数据库,核心思路是把用户片号存成文本,向量查询的时候用羽翼搜索,找出最相关的内容。 比如存了张三偏好川菜,预算五百,你搜帮张三推荐餐厅,他就能把相关偏好解锁出来,传给 l l m。 这里有个很妙的点,向量数据库,做的是语义搜索,不是死板的关键词匹配。你搜加班吃什么,他能关联到经常加班,偏好外卖配送,因为语义是相关的。 实践四、 tools 工具原理篇,我们用超级英雄装备来类比,蜘蛛侠有蛛丝发射器, agent 有 搜索工具, 钢铁侠有战甲 agent 有 计算工具。我们实现了四种工具,第一种是搜索工具,用 tivoli search results 联网搜索。第二种是计算工具,这里有个非常重要的安全点,必须用 simple evo, 千万别用 python 原声的 evo, simple excel 就 像一个只能算数学的限制器,能防止恶意代码执行。第三种是天气 api 工具,展示了怎么处理超时重试、 h t t p 错误等各种边界情况。第四种是数据库工具,核心式参数化查询,用微软 id 等于, 而不是制图串拼接,防止 c 库注入。最后,我们做了个对比实验,好的工具描述能让 agent 正确选择工具。你告诉他这个工具用于数学计算,不适用于搜索,他在搜索任务中就不会乱掉计算器。 实践五,综合项目到了这一步,就是把前面学的四个组建全部组装起来,构建一个完整的 agent 代码。在 my underscore first underscore agent 到 p y 里,把 l l m 大 脑 react 规划搜索计算工具 memory server 记忆全部集成。 运行后,你可以在命令行里跟他对话,而且同一个 spread 下划线 id 下,他能记住上下文。这里可以用原理篇的餐厅类比来理解, check openai 初步化就像选店长, create react agent 就 像请前厅经理安排上菜顺序, tools 就 像厨师做菜, memory saver 就 像老顾客档案。 实践六,进阶,给 agent 加上长期记忆在实践五的基础上,我们加入 chroma 向量数据库,用户可以输入记住我喜欢川菜 agent, 就 把片号存进长期记忆,下次对话它会自动解锁相关记忆,结合上下文一起处理。 我们还做了一个详细的对比,短期记忆用 memory saver 加 thread 下划线, id 容量受上下文窗口限制,但自动注入。长期记忆用 chroma 跨对话持久保存,需要羽翼搜索。 最后,安全清单这里我特别想强调四点,第一,计算永远用 simple, excel 不要用 excel。 第二,代码执行要用白名单限制。第三,数据库查询必须用参数化。第四, api key 放环境变量,不要硬编码。这四点看着简单,但实际开发中踩坑的人真的太多了,大家一定要记在小本本上。 最后的 faq 环节,挑几个最常见的说一下。安装报错 module lost error 那 是没装,依赖 pip install 一下就好。 apikey 报错 authentication error, 检查一下环境变量有没有设对 agent 执行慢,换更快的模型或者减少工具数量。回答不准确,换更强的模型,或者加一句请基于搜索结果回答。 好,今天的实践篇就到这里。学完这四个主键,你对 ai agent 的 理解就不再只是停留在概念层面了,你是真的动手写出了每一行代码。 下一篇我们会进入更高级的主题,多 agent 协助自定义工作流,生产环境部署。想看的话别忘了点赞关注我们,下期代码见!拜拜!

如果你想拥有一个熟人的团队,但是又觉得搭建 ide 很 难,那么有没有想过让 ide 帮助你搭建 ide? 第一步,新建一个智能体,点击 ios 里面的新建智能体,然后创建一个空白的智能体,点击下一步给它起一个名字,比如说 a i 智能体,搭建助手,然后就点击下一步就可以了,这些都不用管他技能的话,也不用给他装 就可以。第二步也是最重要的一步,就是点开你新建的智能体的聊天框,然后把这一个提示词给还有这七份协议,这七个协议是数字人团队的灵魂,但这不是我写的,是我一个阿里的朋友分享给我的, 我可以免费的给大家私信我就好。如果不感兴趣的情况下啊,这两个协议呢,给整个团队的角色进行了一个定位,后面呢还有一些各种各样,我也不懂这个东西,其实说 后面这五个协议就是每一个角色的身份定位。比如总经理,你是一个外贸总经理,负责群居操盘,采用捷克威尔骑士的管理,我后面的每一个角色,他的设定都在这里面。 当你把这些发给 ai 之后, ai 就 可以经过一系列的处理,然后搭建出你的外贸团队。 点击右上角的智能体,可以看到每一个 ai 的 配置和设定。比如说这个总经理希尔,可以看到这是 ai 自己编辑的这个智能体是做什么的,然后 他的这个技能可以看下这个技能,这是 ai 自己添加的,包括他的各种设定。其实我们真正来写一个,这个 ai 会帮他给配置清楚。那么最后一步,点击这里有一个加号,新建一个群聊,在创建团队里面,把你已经搭建好的团队成员配置进去, 那么恭喜你终于拥有了一个负责人团队,但是不要忘记两件事情,第一把你的总经理设置为团队的负责人,第二把你的这套话术发给就这个提示词发给 ai, 然后你的 ai 的 智能体的助手就会实时的更新其他智能体的技能。然后这边呢,其实这个文件这个区域呢,就会产出他们做的所有的内容,你可以去看一下这个 ai 的 进度啊,还有他们做的流程。 然后在最后想和把这个视频看到结尾的各位聊一下,因为我也是第一次做自媒体,第一次想把自己在创业路上找到的东西分享给大家。我的第二条视频就是我用 ai 在 国际站上发品的那个视频,没想到会有几百人点赞,有很多创业者联系我,和我聊了很多,这也算是给了我很大的信心。所以在这里呢,我就厚着脸皮给各位 要一个关注和点赞,但是关注我肯定不亏,因为我肯定会继续在这个账号上分享我的 内容。然后我目前的想法是两块,第一呢是互联网的运营,第二呢是 ai 的 使用,如果,如果说你和这两个点切入的话,那我们可以聊上很多,然后 关于我这个账号后面的发展方向,各位也可以帮我支支招。然后最后呢,我想到了一个结尾,叫越分享越成长,我是春秋,想和各位共同成长。

给大家普及一下计算机专业如何快速转 ai agent 的 开发工程师,只要你不是三分钟热度,这三个阶段足够让你从小白变大神。接下来告诉你一条最快的学习路线,建议收藏,避免以后走弯路。第一阶段,死磕基础,把 python 基础和简单的 api 调用吃透,千万别小看这些基础, 这是和模型打交道的关键。两大框架是 r n c 和 lma index, 一个用于构建 agent 逻辑框架,另一个用于构建外部数据缩影。三大技能是指 r a g agent, 模型微调,这三项技能直接对应了当前 ai 岗位的合 核心需求。最后阶段,实战项目选择常见的大模型应用场景,结合前面所学知识,做二到三个项目,如 r a g 医疗问答 agent, 智能客服,股票分析,掌握这些足够让你胜任百分之九十以上的 ai 岗位。 如果你还不知道从何开始,我这里整理了大模型学习路线以及配套视频教程,实战项目留下学习双手奉上啊!哈喽,同志们大家好,那今天的话呢,我们来跟大家分享一个关于大模型在我们的这个 do agent 这一块的落地的一些实践哈, 那我们讲的话呢,大模型的核心价值的话呢,其实在于我们的商业落地,那我们在我们的商业落地的过程当中的话呢,其实是 agent 啊,其实是在我们的实际的应用场景当中,其实是非常非常多的啊,那今天的话呢,其实我们呃会给大家讲一讲啊,就是这个 agent 的 一些具体落地,一些实践啊,然后 agent 的 一些组成啊,然后呢包括 agent 的 一些协商,一些范式啊,跟大家一起来 呃,聊一聊,那我们来看一下首先的话呢,这个今天我们要讲的几个几个核心内容啊。首先第一个呢,我们会向大家的简单介绍一下这个 agent, 那 有小伙伴大家可能对 agent 不是 很了解,对吧?它到底是个啥啊?那我们要如果说我们想要去完成一个 agent, 我 们应该要去具备哪些东西,对吧?它的核心架构啊,它的组建呀 啊,我们包括大家未来比如说我要去做一个 a 阶的项目,我应该要补充哪些内容啊?这是一个,那么我们这样讲的 a 阶呢,我们还会涉及到在商业当中我们有个叫做多 a 阶的一个协助方式啊,就是这个多个智能体之间怎么去配合 啊?那么讲完这些以后的话呢,我会带大家呢做一个就是关于客户的一个数据分析和营销方案的一个多 a 阶的一个实践啊,就是我们整一个具体的一些案例啊,给大家看一看成果。然后最后的话呢,我们还是要看一看 在行业当中的话呢,有哪些这个落地的一些 a 景呢,比较好玩的,比较有趣的啊,是吧?然后呢方便大家呢去做一些这个了解,好吧, 呃,那有些小伙伴的话呢,可能今天啊也是这个第一次啊,来看到我的这个视频啊,所以的话呢,先简单介绍一下啊, 那呃其实我自己的话呢,这个在 ai 这个方向其实做的时间也蛮久了啊,大概有十多年的这个时间了。然后我们团队的话呢,其实, 呃早些的时候其实是做那个 ai 的 一些平台的啊,目前的话呢,也合作过很多的 啊,这个产品,其实我自己最近的话也在跟很多的这个客户的话呢,在做一些这个对接哈。那我们从这个,呃,就是传统的人工智能平台,然后到人工智能的这个这个传统的这种项目啊,再到我们今天讲这个大模型平台和大模型那些这个项目 啊,其实都是有些接触的啊这是,呃,这是因为接触的其实比较多,所以我们能够看到包括我们一些客户啊,大家呢,其实还是比较热衷的,对吧?所以呢,今天也趁着这个机会吧,来一起呢跟大家呢一起分享一下,好吧, 希望能够帮助大家呢能够少走一些弯路啊。呃,那首先的话呢,这个第一个啊,我们要跟大家呢去分享的就关于我们所说的这个大模型的一些交互方式哈, 其实我们跟大模型之间的这个交互的话呢,其实也非常简单啊,就大家用过很多的这些大模型的产品,不管是 deepsafe 也好,还是说这个 openai 的 chat 的 gpt 也好, 那很多时候呢,就是说,哎,我们给大模型发送一个 prompt 是 吧?然后呢模型给我们响应一个结果,那所谓的 prompt 其实就是我们就是讲的自然语言啊,我们就直接发给模型,模型响应一个这样一个结果。那很多时候其实你会发现一个点,就是我们有的时候 啊,就是说一句话可能不够,对吧?就模型给一个结果,噼里啪啦讲了一大堆啊,但是我可能对其中的一些不满意啊,我希望他再次的话呢进行一些这样的一个修正啊,然后我可能会再输入一些要求模型,再会给我一个这样一个结果啊。 所以呢,呃,很多时候就是我们讲的这个跟模型这个交互的方式啊,你会发现有一个很大的一个局限性,就是什么呢?就是 你啊,对,没错啊,就是你这个,这个,你看由于我们个人的这个这个这个时效性,对吧?然后呢包括我们要去看他的回复,然后再给出一些指导性的这种意见啊,或者一些什么之类的啊?你其实是整个过程当中一个非常大的一个卡点哈,那我们就在想说那,呃,如果说 我们人的这个看那个内容,然后分析这个内容好不好的这个过程,对吧?有大模型来辅助我们去分析,来辅助我们去看,那这样的话呢,我们达到好的效果的这个效率是不是会更高一点? 所以也就是说那这个东西其实我们就可以就是你如果能够构建出来有大冒险进行参与,进行角色去分析,然后去辅助纠篇。哎,它其实就是一个我们今天讲的一个 agent 啊,它其实就是一个 agent, ok, 好, 如果这样讲的话呢,有点抽象啊,我们通过一个具体的一个实力来看看呢? agent 它到底应该 具体具备一些什么样的一些特征啊?同志们,那这里面的话,我们是通过一个这个飞猪啊,这样的一个产品啊,来给大家看一看,那这个产品的话呢,其实也是一个 agent 啊,那我们在讲飞猪企业,大家来想一想,就今天同志们如果说你去旅游,对吧?比如说你要去一个地方去旅游啊,那你首先会去做什么呢? 是不是有的哥们可能会想,是吧?我说走就走,扛起我的双肩背包啊,我就撤啊。那这当然也是一种,但很多时候呢,比如说如果我们拖家带口的,咱们肯定还是要做一点攻略,是吧?那我们可能会想说, 我准备了多少钱啊?然后呢?我要我有几个人,是吧?我要看坐火车,坐高铁还是坐飞机啊?哪个便宜,哪个方便,哪个高校,对吧?我还要考虑一下我家里的这个有没有老人小孩,是吧?那这个可能我们要去考虑,我们要去查交通, 还有呢,我去那个地方以后我玩几天啊?我的路线应该怎么去定制啊?对吧?先去什么地方再去什么地方呀?啊?对吧?有一有一个这样的一个路线的规划,那我还需要考虑什么东西?我还要考虑说,嗯,那我我要去这个,这个我可能还考虑说,哎,我什么时候出发呀?啊?对吧?然后呢?这个包括住什么样的酒店呀?那这些可能都是要去考虑的, 所以也就是说当我们产生一个旅游的这样一个想法的时候,首先我们需要什么?首先我们需要去,呃,有很多维度的这样的一个规划,对吧?所以也就是说我们可以看得到的是,你看,当我在这里面我给飞猪提出一个需求的时候, 然后呢,他其实就会拿着我的这个需求干嘛?他像人一样的,对不对?首先我们要干什么?要去进行理解,第一他要将我的什么,将我的需求拆分成可以去执行的 这个一二三四啊,这样的一个可以执行的这样的一个任务,或者说这样的一个流程。好,那么拆分出来这个流程以后怎么办?那大家想想,你大脑当中说,哎,我要去做规划,对吧?我要去,我要去规划行程,我要去,我要去定制这个旅游路线。那这个时候作为人来讲, 我是不是说,哎,我要查交通,我可能说用一些这个,比如说非猪啊,或者说携程啊,我要查攻略,对吧?我可能上网搜一下,或者说用小红书啊,啊,我还要看一下天气,我打开天气的 app 啊,看它适不适合出行啊? 对不对?那么这个时候呢?其实我们就会去干嘛?我们是不是就会去调用不同的工具来去获取不同的这个信息。 哎,那么也就是说我们的一个 agent, 哎,他至少说他应该是要有什么,第一他要理解我们的需求啊,拆分任务。第二他根据拆分的任务,他要能够去调用不同的工具来去获得到对应的一些这个信息, 是不是?所以这也是我们今天讲为什么说像飞猪啊?像这种,像这种产品,包括一些传统行业的一些这个应用啊,传统行业的一些,这个同志们,其实大家呢用大模型做结合,其实有个非常大的优势,就是你拥有别人所 没有的这个数据,是吧?那你像飞猪他本身就节省了很多的,呃,这个比如说基酒的这种信息, 对吧?那他这里面其实做旅游攻略对他来讲就是一个非常好的一个切入场景啊? ok, 好, 所以他首先要规划,然后呢要去调用工具,那调用工具以后要干什么?哎?是不是获得到了很多的信息?我们在非洲这块你可以看到,你看他用了不同的工具,比如说查询相关的行程路线啊, 就看吧。然后呢包括非洲上有一些攻略,包括他有很多这种基酒的这种信息,那他记着这些信息干什么? 基于这些信息他是不是,哎?第一步先干什么?第二步干什么啊?然后干什么?综合这些信息给我们输出一个这样的一个结果,再结合你的需求 啊,对不对?所以也就是说他跟我们的一个传统的一个大模型的单轮的对话不太一样的,就是什么呢?就是他是我们做了一个 agent 以后,设定一个总的目标,总的目标被拆分出来,每一步去执行, 那眉部去执行以后得到一个总的一个结果,然后,哎再次进行汇总输出,直到达到我们的目标想要的这样的一个结果啊。这就是我们今天讲的 啊,这个 agent 他 们翻译过来叫代理,对吧?他到底代理什么东西?代理了你这个人,或者说代理了某一个流程 啊?你可以这样去理解,整个过程相对来说比较灵活,你可以把它想象成你一个员工,或者说这样一个助理啊,是吧?所以我们今天讲那一个 ai agent, 它到底应该要具备什?呃,到底要,呃如果完成这样的需求,它到底应该要具备哪些东西呢?那我们再通过这一张图啊,这张图的话,其实, 呃,我最早时候是在那个退折上面啊,就就比较早期了啊,就是那个 open ai 的 一个那个安全游员啊,叫温丽莲,是吧?然后他当时发了一个博克啊,然后这张图我就从那里面搞过来的。那这张图的话呢,现在用的非常广泛了哈,那我们可以看到一个 agent, 它应该等于什么呢?那我们前面讲的它需要有这种规划的能力, 那是吧?要有这种拆解的能力,那这种规划和拆解的能力呢?其实就是源自于大模型啊,对吧?也就是说他首先有一个大模型,大模型是他的什么?是他的核心大脑啊,可以这样去理解。好,那么接下来的话呢, 他应该拥有什么样的能力?就是规划能力,但这里面的话呢,他有很多的这个方式啊,对吧?那么这些方式的话呢,其实呢,就是, 呃,我们在后面啊,我们会去学习到的就是关于大模型的,它其实就是不同的题式词啊,同志们,就是我们通过题式词去引导大家到后面会学。那个,比如说什么 c o t 啊,对吧?什么思维链啊,一些方式啊,就是引导模型按照什么样的方式去拆解这样的一个任务啊,去规划能力, 然后它应该还拥有什么呀?记忆能力。那这个所谓的记忆能力呢,就是说你看我们完成了第一步,你得记得你的核心目标是什么,对吧?你不能说执行完的你分支任务,后面就不管 你最终是为了解决那个核心目标,所以他记忆的话呢,同样他也有这种长期记忆啊,和短期记忆啊,这个里面他其实就有不同的这种技术手段,比如说我们说的这个短期记忆什么,哎,就比如说就是你直接发给 这个大模型的,对吧?就在对话框里面直接发的,那长期记忆的话呢?比如说,哎,我们通过对模型进行训练啊,把这个知识压缩到模型本身啊,或者说我们通过这个到后面我们会讲到一个方案叫 r g, 对 吧?就给它外挂一个数据库的这样一些方式, 这也是可以的, ok 啊,就是去增加目前这种记忆能力。那还有就什么呢?就是我们说的这个工具啊,因为你拆解完成了以后啊,对吧?我们已经拆不出来任务,那拆不出来这个任务,我们可能还需要去用一些外界的工具啊,来去比如说搜索工具啊,啊,对吧?或者说一些计算工具啊 啊等等,那这些,那这些工具其实你就可以理解成就是什么?就是我们传统的应用当中的叫做 api 啊,对吧?就是你你的应用程序当中不是有很多的 api, 很多的接口吗?那这些接口,那它都有自己的作用,但我们可以都统称为就是我们的这些工具啊, 所以有了这些东西以后,我们就可以去构建出来这样的一个 agent。 所以 我们很多时候呢,我们看到很多的这一些概念啊和名词啊,大家呢其实也不用想象的那么复杂,就是你在网上可能可以看到很多这种抽象的概念,你就把 agent 想象成是 就是你自己,对吧?你去解决一个任务,你的流程是一个什么样的一个流程?那 agent 它大致也是这么干的,所以我们讲 agent 呢,它是一个什么?能自主感知环境,进行思考,做出决策并执行的这样的一个系统 啊,对吧?他跟我们所谓的这种单轮的这种对话啊,就有很大的这种区别了。 ok, 他 不是说单轮的对话相当于什么 啊?就是我捅你一下,对吧?就是你动一下,我捅你一下,你动一下,那他就不是的啊,他就是说你给一个需求, ok, 哥们,我绝对给你最终一个这样一个结果啊,就是这样的一个东西, ok, 好, 所以回到这一块来讲的话呢,就是 a 型的工作原理,其实就是我们前面讲就几个步骤啊,第一先感知理解用户的需求,第二要思考,是吧?要去分解任务,拆解任务 好,拆解人完了以后进行决策,对吧?决策以后进行行动啊,一二三四五,然后最终完成这样的一个效果啊,其实就非常非常的简单了。所以有了 agent 呢以后呢,大家呢?现在我们可以看到有很多,比如说像这种 ai 的 智能客服, 是吧?然后呢,包括像 ai 的 数据分析师,对吧?包括像 ai 的 编程助手,大家现在用的 cursor 啊,然后 cutabody 啊,那等等这些东西其实呢都是我们非常典型的一个 ai agent 的 这样的一个应用啊,这个我们到后面的话呢,通过一些像实战的话呢,我们会来跟大家呢一起来讲一讲, 那么大家再来想一想啊,我前面讲过一个点,我说我说,呃,那么 agent, 如果说我把 agent 看作是一个代理,你可以理解成就是你的吧,就是你这个人哈,你能够拥你能够干的事啊,那 agent 也能干啊,但当然他不能生孩子啊,是吧? 那么在我们的整个的社会的群体的过程当中,我们就完成一些任务的时候,是不是只要一个人就可以完成所有的任务?大家发现是不是?不是的?

给大家普及一下计算机专业如何快速转 ai agent 的 开发工程师,只要你不是三分钟热度,这三个阶段足够让你从小白变大神。接下来告诉你一条最快的学习路线,建议收藏,避免以后走弯路。第一阶段,死磕基础,把 python 基础和简单的 api 调用吃透,千万别小看这些基础, 这是和模型打交道的关键。两大框架是 r n c 和 lma index, 一个用于构建 agent 逻辑框架,另一个用于构建外部数据缩影。三大技能是指 r a g agent, 模型微调,这三项技能直接对应了当前 ai 岗位的合 核心需求。最后阶段,实战项目选择常见的大模型应用场景,结合前面所学知识,做二到三个项目,如 r a g 医疗问答 agent, 智能客服,股票分析,掌握这些足够让你胜任百分之九十以上的 ai 岗位。 如果你还不知道从何开始,我这里整理了大模型学习路线以及配套视频教程,实战项目留下学习双手奉上啊!哈喽,同志们大家好,那今天的话呢,我们来跟大家分享一个关于大模型在我们的这个 do agent 这一块的落地的一些实践哈, 那我们讲的话呢,大模型的核心价值的话呢,其实在于我们的商业落地,那我们在我们的商业落地的过程当中的话呢,其实是 agent 啊,其实是在我们的实际的应用场景当中,其实是非常非常多的啊,那今天的话呢,其实我们呃会给大家讲一讲啊,就是这个 agent 的 一些具体落地,一些实践啊,然后 agent 的 一些组成啊,然后呢包括 agent 的 一些协商,一些范式啊,跟大家一起来 呃,聊一聊,那我们来看一下首先的话呢,这个今天我们要讲的几个几个核心内容啊。首先第一个呢,我们会向大家的简单介绍一下这个 agent, 那 有小伙伴大家可能对 agent 不是 很了解,对吧?它到底是个啥啊?那我们要如果说我们想要去完成一个 agent, 我 们应该要去具备哪些东西,对吧?它的核心架构啊,它的组建呀 啊,我们包括大家未来比如说我要去做一个 a 阶的项目,我应该要补充哪些内容啊?这是一个,那么我们这样讲的 a 阶呢,我们还会涉及到在商业当中我们有个叫做多 a 阶的一个协助方式啊,就是这个多个智能体之间怎么去配合 啊?那么讲完这些以后的话呢,我会带大家呢做一个就是关于客户的一个数据分析和营销方案的一个多 a 阶的一个实践啊,就是我们整一个具体的一些案例啊,给大家看一看成果。然后最后的话呢,我们还是要看一看 在行业当中的话呢,有哪些这个落地的一些 a 景呢,比较好玩的,比较有趣的啊,是吧?然后呢方便大家呢去做一些这个了解,好吧, 呃,那有些小伙伴的话呢,可能今天啊也是这个第一次啊,来看到我的这个视频啊,所以的话呢,先简单介绍一下啊, 那呃其实我自己的话呢,这个在 ai 这个方向其实做的时间也蛮久了啊,大概有十多年的这个时间了。然后我们团队的话呢,其实, 呃早些的时候其实是做那个 ai 的 一些平台的啊,目前的话呢,也合作过很多的 啊,这个产品,其实我自己最近的话也在跟很多的这个客户的话呢,在做一些这个对接哈。那我们从这个,呃,就是传统的人工智能平台,然后到人工智能的这个这个传统的这种项目啊,再到我们今天讲这个大模型平台和大模型那些这个项目 啊,其实都是有些接触的啊这是,呃,这是因为接触的其实比较多,所以我们能够看到包括我们一些客户啊,大家呢,其实还是比较热衷的,对吧?所以呢,今天也趁着这个机会吧,来一起呢跟大家呢一起分享一下,好吧, 希望能够帮助大家呢能够少走一些弯路啊。呃,那首先的话呢,这个第一个啊,我们要跟大家呢去分享的就关于我们所说的这个大模型的一些交互方式哈, 其实我们跟大模型之间的这个交互的话呢,其实也非常简单啊,就大家用过很多的这些大模型的产品,不管是 deepsafe 也好,还是说这个 openai 的 chat 的 gpt 也好, 那很多时候呢,就是说,哎,我们给大模型发送一个 prompt 是 吧?然后呢模型给我们响应一个结果,那所谓的 prompt 其实就是我们就是讲的自然语言啊,我们就直接发给模型,模型响应一个这样一个结果。那很多时候其实你会发现一个点,就是我们有的时候 啊,就是说一句话可能不够,对吧?就模型给一个结果,噼里啪啦讲了一大堆啊,但是我可能对其中的一些不满意啊,我希望他再次的话呢进行一些这样的一个修正啊,然后我可能会再输入一些要求模型,再会给我一个这样一个结果啊。 所以呢,呃,很多时候就是我们讲的这个跟模型这个交互的方式啊,你会发现有一个很大的一个局限性,就是什么呢?就是 你啊,对,没错啊,就是你这个,这个,你看由于我们个人的这个这个这个时效性,对吧?然后呢包括我们要去看他的回复,然后再给出一些指导性的这种意见啊,或者一些什么之类的啊?你其实是整个过程当中一个非常大的一个卡点哈,那我们就在想说那,呃,如果说 我们人的这个看那个内容,然后分析这个内容好不好的这个过程,对吧?有大模型来辅助我们去分析,来辅助我们去看,那这样的话呢,我们达到好的效果的这个效率是不是会更高一点? 所以也就是说那这个东西其实我们就可以就是你如果能够构建出来有大冒险进行参与,进行角色去分析,然后去辅助纠篇。哎,它其实就是一个我们今天讲的一个 agent 啊,它其实就是一个 agent, ok, 好, 如果这样讲的话呢,有点抽象啊,我们通过一个具体的一个实力来看看呢? agent 它到底应该 具体具备一些什么样的一些特征啊?同志们,那这里面的话,我们是通过一个这个飞猪啊,这样的一个产品啊,来给大家看一看,那这个产品的话呢,其实也是一个 agent 啊,那我们在讲飞猪企业,大家来想一想,就今天同志们如果说你去旅游,对吧?比如说你要去一个地方去旅游啊,那你首先会去做什么呢? 是不是有的哥们可能会想,是吧?我说走就走,扛起我的双肩背包啊,我就撤啊。那这当然也是一种,但很多时候呢,比如说如果我们拖家带口的,咱们肯定还是要做一点攻略,是吧?那我们可能会想说, 我准备了多少钱啊?然后呢?我要我有几个人,是吧?我要看坐火车,坐高铁还是坐飞机啊?哪个便宜,哪个方便,哪个高校,对吧?我还要考虑一下我家里的这个有没有老人小孩,是吧?那这个可能我们要去考虑,我们要去查交通, 还有呢,我去那个地方以后我玩几天啊?我的路线应该怎么去定制啊?对吧?先去什么地方再去什么地方呀?啊?对吧?有一有一个这样的一个路线的规划,那我还需要考虑什么东西?我还要考虑说,嗯,那我我要去这个,这个我可能还考虑说,哎,我什么时候出发呀?啊?对吧?然后呢?这个包括住什么样的酒店呀?那这些可能都是要去考虑的, 所以也就是说当我们产生一个旅游的这样一个想法的时候,首先我们需要什么?首先我们需要去,呃,有很多维度的这样的一个规划,对吧?所以也就是说我们可以看得到的是,你看,当我在这里面我给飞猪提出一个需求的时候, 然后呢,他其实就会拿着我的这个需求干嘛?他像人一样的,对不对?首先我们要干什么?要去进行理解,第一他要将我的什么,将我的需求拆分成可以去执行的 这个一二三四啊,这样的一个可以执行的这样的一个任务,或者说这样的一个流程。好,那么拆分出来这个流程以后怎么办?那大家想想,你大脑当中说,哎,我要去做规划,对吧?我要去,我要去规划行程,我要去,我要去定制这个旅游路线。那这个时候作为人来讲, 我是不是说,哎,我要查交通,我可能说用一些这个,比如说非猪啊,或者说携程啊,我要查攻略,对吧?我可能上网搜一下,或者说用小红书啊,啊,我还要看一下天气,我打开天气的 app 啊,看它适不适合出行啊? 对不对?那么这个时候呢?其实我们就会去干嘛?我们是不是就会去调用不同的工具来去获取不同的这个信息。 哎,那么也就是说我们的一个 agent, 哎,他至少说他应该是要有什么,第一他要理解我们的需求啊,拆分任务。第二他根据拆分的任务,他要能够去调用不同的工具来去获得到对应的一些这个信息, 是不是?所以这也是我们今天讲为什么说像飞猪啊?像这种,像这种产品,包括一些传统行业的一些这个应用啊,传统行业的一些,这个同志们,其实大家呢用大模型做结合,其实有个非常大的优势,就是你拥有别人所 没有的这个数据,是吧?那你像飞猪他本身就节省了很多的,呃,这个比如说基酒的这种信息, 对吧?那他这里面其实做旅游攻略对他来讲就是一个非常好的一个切入场景啊? ok, 好, 所以他首先要规划,然后呢要去调用工具,那调用工具以后要干什么?哎?是不是获得到了很多的信息?我们在非洲这块你可以看到,你看他用了不同的工具,比如说查询相关的行程路线啊, 就看吧。然后呢包括非洲上有一些攻略,包括他有很多这种基酒的这种信息,那他记着这些信息干什么? 基于这些信息它是不是?哎?第一步先干什么?第二步干什么啊?然后干什么?综合这些信息给我们输出一个这样的一个结果,再结合你的需求 啊,对不对?所以也就是说它跟我们的一个传统的一个大模型的单轮的对话不太一样的,就是什么呢?就是它是我们做了一个 agent 以后,设定一个总的目标,总的目标被拆分出来,每一步去执行, 那眉部去执行以后得到一个总的一个结果,然后,哎再次进行汇总输出,直到达到我们的目标想要的这样的一个结果啊。这就是我们今天讲的 啊,这个 agent 他 们翻译过来叫代理,对吧?他到底代理什么东西?代理了你这个人,或者说代理了某一个流程 啊?你可以这样去理解,整个过程相对来说比较灵活,你可以把它想象成你一个员工,或者说这样一个助理啊,是吧?所以我们今天讲那一个 ai agent, 它到底应该要具备什么?呃,到底要,呃如果完成这样的需求,它到底应该要具备哪些东西呢?那我们再通过这一张图啊,这张图的话,其实, 呃,我最早时候是在那个退折上面啊,就就比较早期的啊,就是那个 open ai 的 一个那个安全游员啊,叫温丽莲,是吧?然后他当时发了一个博克啊,然后这张图我就从那里面搞过来的。那这张图的话呢,现在用的非常广泛了哈,那我们可以看到一个 agent, 它应该等于什么呢?那我们前面讲的它需要有这种规划的能力, 那是吧?要有这种拆解的能力,那这种规划和拆解的能力呢?其实就是源自于大模型啊,对吧?也就是说他首先有一个大模型,大模型是他的什么?是他的核心大脑啊?可以这样去理解。好,那么接下来的话呢, 他应该拥有什么样的能力?就是规划能力,但这里面的话呢,他有很多的这个方式啊,对吧?那么这些方式的话呢,其实呢,就是, 呃,我们在后面啊,我们会去学习到的就是关于大模型的,它其实就是不同的题式词啊,同志们,就是我们通过题式词去引导大家到后面会学那个,比如说什么 c o t 啊,对吧?什么思维链啊,一些方式啊,就是引导模型按照什么样的方式去拆解这样的一个任务啊,去规划能力, 然后它应该还拥有什么啊?记忆能力。那这个所谓的记忆能力呢,就是说你看我们完成了第一步,你得记得你的核心目标是什么,对吧?你不能说执行完的你分支任务,后面就不管 你最终是为了解决那个核心目标,所以他记忆的话呢,同样他也有这种长期记忆啊,和短期记忆啊,这个里面他其实就有不同的这种技术手段,比如说我们说的这个短期记忆什么,哎,就比如说就是你直接发给 这个大模型的,对吧?就在对话框里面直接发的,那长期记忆的话呢?比如说,哎,我们通过对模型进行训练啊,把这个知识压缩到模型本身啊,或者说我们通过这个到后面我们会讲到一个方案叫 r g, 对 吧?就给它外挂一个数据库的这样一些方式, 这也是可以的, ok 啊,就是去增加目前这种记忆能力。那还有就什么呢?就是我们说的这个工具啊,因为你拆解完成了以后啊,对吧?我们已经拆不出来任务,那拆不出来这个任务,我们可能还需要去用一些外界的工具啊,来去,比如说搜索工具啊,啊,对吧?或者说一些计算工具啊 等等,那这些,那这些工具其实你就可以理解成就是什么?就是我们传统的应用当中的叫做 api 啊,对吧?就是你你的应用程序当中不是有很多的 api, 很多的接口吗?那这些接口,那它都有自己的作用,对吧?但我们可以都统称为就是我们的这些工具啊, 所以有了这些东西以后,我们就可以去构建出来这样的一个 agent。 所以 我们很多时候呢,我们看到很多的这一些概念啊和名词啊,大家呢其实也不用想象的那么复杂,就是你在网上可能可以看到很多这种抽象的概念,你就把 agent 想象成是 就是你自己,对吧?你去解决一个任务,你的流程是一个什么样的一个流程?那 agent 它大致也是这么干的,所以我们讲 agent 呢,它是一个什么?能自主感知环境,进行思考、做出决策并执行的这样的一个系统 啊,对吧?他跟我们所谓的这种单轮的这种对话啊,就有很大的这种区别了。 ok, 他 不是说单轮的对话相当于什么 啊?就是我捅你一下,对吧?就是你动一下,我捅你一下,你动一下,那他就不是的啊,他就是说你给一个需求, ok, 哥们,我绝对给你最终一个这样一个结果啊,就是这样的一个东西。 ok, 好, 所以回到这一块来讲的话呢,就是 a 型的工作原理,其实就是我们前面讲就几个步骤啊,第一先感知理解用户的需求,第二要思考,是吧?要去分解任务,拆解任务 好,拆解人完了以后进行决策,对吧?决策以后进行行动啊,一二三四五,然后最终完成这样的一个效果啊,其实就非常非常的简单了。所以有了 agent 呢,以后呢,大家呢?现在我们可以看到有很多,比如说像这种 ai 的 智能客服, 是吧?然后呢,包括像 ai 的 数据分析师,对吧?包括像 ai 的 编程助手,大家现在用的 cursor 啊,然后 cutabody 啊,那等等这些东西其实呢都是我们非常典型的一个 ai agent 的 这样的一个应用啊,这个我们到后面的话呢,通过一些像实战的话呢,我们会来跟大家呢一起来讲一讲, 那么大家再来想一想啊,我前面讲过一个点,我说我说,呃,那么 agent, 如果说我把 agent 看作是一个代理,你可以理解成就是你的吧,就是你这个人哈,你能够拥你能够干的事啊,那 agent 也能干啊,但当然他不能生孩子啊,是吧? 那么在我们的整个的社会的群体的过程当中,我们就完成一些任务的时候,是不是只要一个人就可以完成所有的任务?大家发现是不是?不是的?

大家好,我是苏菲,前几期视频跟大家介绍了什么是 skill 以及如何来使用 skill, 有 帮我们做 ppt 的 skill, 有 帮我们做信息解锁的 skill。 那 这一期视频跟大家介绍一下什么是 agent, 以及如何来使用,如何来制作一个 agent。 那 agent 我 的理解他是一个会思考,会规划,会用工具帮你干活的一个小助手, 它跟 skill 的 区别呢? skill 是 给 agent 安装的单项技能,一个 agent 它可以去用大模型进行思考,然后去调用自身的很多 skill, 然后它会帮你把活默默地都做掉了。那 我们要如何区别它们两个,以及说什么时候适合去做一个 skill, 而什么时候更适合去做一个 agent? 呃,看一下你这个步骤,它如果是单个步骤,比如说要生一张图,或者做个表格,或者帮你解锁一下信息小文章,这种单个的步骤就适合来做一个 skill 来帮你完成。那如果你要做的它是一个多步骤,有先后规划,要去逐个执行的, 比如说先要去搜索一下热点的信息,然后帮你写爆款的文章标题,然后根据这个文章标题还要再去生成封面,那么做一个 agent 就 会比较适合。 那这一期视频我们就以扣子平台为例来做一个 agent, 同时去加上工作流,加插件,加知识库,来帮大家更好地理解什么是 agent。 来到扣子编程这个界面,在这里选择智能体开发创建一个智能体。我就以母婴的 这样一个智能体为例来举例,我譬如说就叫小柚子妈妈介绍一下这个智能体,在这里可以选择去生成图标,它会根据你智能体的功能介绍,自动的去帮你生成图标, 还挺好的。我们就点确认之后就来到我们这个智能体的制作的界面,我们首先可以在这里输入人设和回复逻辑,那我就把我这段人设发给他,这里点提交到提示词库,提示词名称一点确认,这样提示词就创建成功了。在这里模型 我们就选择豆包,一点八深度思考这个模型就可以了。在下面点开场白,好,输进去之后,在 聊天界面这个开场白文案就会自动显示了。那我们也可以去预设一些开场白的预制问题,譬如宝宝六个月应该吃什么,这边可以选择显示,还可以加一些其他的问题,譬如,哦,湿疹怎么办好, 这样我们的一个智能体初步的智能体就做好了,是不是非常简单?好,这个时候我们在这个聊天框里可以去问一下,比如说宝宝六个月应该吃什么,点一下看看他是否会回复,这个时候他就在进行思考了, 宝宝大概要吃什么,添加辅食的原则怎么怎么样好,这个他生成好了,六个月是宝宝辅食添加的关键期,核心食物是什么,逐步引入其他食物, 有什么注意事项,禁忌的食物都会给你写出来。那这时候大家可能会问我这个问题,我去问豆包,也可以得到相似的答案,为什么我需要做一个智能题呢? 那我们可以看一下豆包跟 agent 的 一个区别,我们是可以问豆包,豆包啥都能聊,但是这个 agent 它是只做明宝妈妈的专属育儿管家的一个 agent, 它更垂直,豆包它是通用的育儿知识,什么都懂,但可能不是很深入,但是你这个 agent, 它通过去添加了你的知识库之后 去绑定了知识库,通过你长期的一个记忆,他会了解你小孩的情况,他会给你非常深入的一些专业的建议。豆包他是一问一答,你问一句答一句,但是 agent 他 会主动去规划,主动去处理,主动去调用工具, 他也可以去进行一个定制开发,他会去装一些专属的 skill 来对接你的一些需求,所以这个就是两者的一个区别。那我们继续回到我们小儿子妈妈的一个 agent, 下面我们介绍一下怎么加工作流, 我们可以在这里选添加工作流,然后创建工作流这里我们创建一个宝宝一周辅食计划的工作流,然后对这个工作流进行描述。当你去输入宝宝的年龄,过敏状况和咀嚼能力之后呢,他会生成详细的一个辅食计划, 点击确认,然后就开始创建工作流。在这里呢,我们选择添加节点,添加一个大模型的节点, 把开始跟大模型以及结束联合起来连起来。我们这里点开始的变量名,这里我们就输入月令,注意这里的变量名要用英文,中文的话,他会显示错误。月令这里我们就选 number 这个变量类型,然后再加一个过敏食材的变量名, 月令这里必填,这里过敏食材不用必填。好,再点到大模型这边,我们在这里变量名这里面去 引用开始的地方的一个变量月龄,然后再添加,这里面输入过敏食材,然后在这里输入系统提示词,在这里 结束,这里我们选择大模型 output 这个变量值,这样就添加好了,我们试运行一下,比如月龄,这里填六,过敏食材就写牛奶,我们试运行。好,我们看到这个试运行是成功的,它输出的变量是, 我们可以预览一下一周的辅食计划,周一到周日有什么购物清单。这里有个问题,因为我输入的是六月龄,但是他生成的是八月龄的宝宝,规划这个就有问题,那我们可以把这个 问题直接截图丢给扣子,让他去帮我们解决,这里他就帮我们找到原因了。提示词里面的写法,月龄必须是要双括号, 我们可以检查一下,在这里我们没有改成月龄,对,我们显示这里他变蓝了,这样应该就可以了,我们再试运行一下。好,我们再预览一下这一次,对了,他是针对该月龄的辅食,要点是符合六月龄宝宝的吞咽的, 这里就对了。好,我们把这个工作流发布,这里就默认就可以了,它会提示是否添加至当前智能体确认,我们看到工作流就添加进来了。好,添加好了之后,我们点发布,这边发布渠道就点扣子瓶,扣子商店 分类,就是生活方式选择发布,我们立即对话测试一下,宝宝夜醒频繁,他就会给出建议,因为我也没有输入月龄,所以他会比较详细的去拆分零到三个月可能是什么情况,四到六个月是什么情况,还有一些睡眠技巧也会指导我们。好,这样一个 agent 就 发布成功了。 好,这一期视频跟大家介绍了什么是 agent 以及怎样做一个 agent 以及添加工作流。下一期视频跟大家介绍一下怎么加知识库以及做加一个插件。如果你喜欢我的视频就点赞、关注、投币,谢谢大家!

这是我两个多期的直播原文件,这是我在这款电脑 ai 助手里剪好的高光直播切片,总共就花了半个多小时,一共五个切片,观点完整,开头和结尾都非常齐整,没有截断,完全可以直接作为切片视频去二次分发了。 大家也都知道我每周会直播,也一直想着把直播的切片剪出来再发出去,但是我日常真的没有时间再去搞直播切片了,一场直播两个多小时,你光是看素材就要花很长时间,更别提你还要去找里面的高光观点,还要剪辑了。 所以这次我直接用 marvis 这款电脑 ai 助手尝试了下,整个过程非常丝滑,基本上半个多小时就直接搞定了。那之前我们也发布过一些用 codex 或者 c c 做剪辑的教程, 大家都很喜欢,但也一直在问国内用不了怎么办?所以这次我们直接用 mars 这款电脑 ai 助手来操作 mars, 它好用的地方不仅是作为一个 agent 干活能力很棒,更重要的是它可以直接操作你的电脑式操作系统层级的 ai 助手可以直接帮你修改编辑电脑里面的文件,从而帮你更高效的搞定工作。 而且它可以直接在手机上去操作,非常的方便,不用总是守在电脑跟前了,操作起来也非常简单。下面就是教程。第一步,下载 mars, 大家直接打开 mars 的 官网,它最近呢还在内测阶段,等它马上公测之后,大家直接去官网上下载就可以了,下载完成之后直接打开就能用,非常方便,不需要搞各种安装部署的工作。 第二步,直接在输入框里给 marvis 布置剪辑任务,直接输入这段提示词,里面有三个要点需要注意,第一,记得一定要让他把原文件转成文字。第二呢是记得一定要让他带上时间戳,方便后面做剪辑。第三,让他一定要使用一下 f f m p e g 这个剪辑工具,非常好用。 另外大家记得一定要先跟 marvis 讨论一下方案,他基本上会给你一个非常详细的技术方案,里面会包括他怎么去转换直播文件,怎么去做时间戳的处理,怎么去做各种映射, 非常的专业。第三步,咱们让 mars 开始直接策划剪辑方案,就是让他找出来到底该剪哪些高光观点,那这一步他自己干活咱们基本不太用管,但如果你自己实在担心,你可以点一下这个对话条,就可以在右边弹出来的界面里看到 mars 消耗的 token, 还有它的工作细节。 比如你看它这里,它是先用了 readtext 这个能力去读了转录的文本,然后再找高光观点,找出来之后会再用 python 去做一些处理。你看它很快就能规划一个剪辑方案,那咱们就直接到第四步,让它直接开始动手剪辑,那它很快就能把高光片段剪辑出来了。 他第一次产出的五个片段我都挨个检查了一下,里面有两段可能首尾稍微有点截断。如果大家也出现这种问题,就可以直接在大白话描述一下你遇到的问题,那么他就能自己非常好的去分析问题,找解决方案, 并且进行修复。最后咱们来检查一下成片一共有五个切片片段,每个切片的首尾都很完整,而且他还贴心的附上了每个切片的简介和推荐的文案,怎么样,是不是很方便?在直播这个业务里面,大家都需要大量的人力来去搞切片这个工作, 但现在这个环节基本就可以用 agent 来帮你去处理和解决了,非常高效。而且除了切片之外, app 也能在自媒体的整块业务里面去分担很多工作,比如说什么热点选择题、文件管理、排版,真的能帮你节省很多做琐碎工作的时间,让你能更加集中精力的去做创意,做内容。 ok, 那 今天就分享到这了,后面还会有更多 a 阵相关的分享,记得一键三连,下次见。

去年年末啊,大家都可能都知道一个新闻,就是 mata 花了二十亿的美金收购中国的一家 ai 公司叫 minas, 这件事情还是扎克伯格亲自去操盘,花了十天的谈判时间把这件事情给敲定下来了。但是在上周呢,中国国家发改委说了,你 mata 禁止收购 minas, 而且我要求当事人叫停这笔交易。这个我们从技术角度上考虑。这家公司啊,就是 minas, 它没有自己的大模型,它用的是阿里的谦问或者是 cloud code 啊,它自这个别人家的大模型,它在我们业内戏称它是一个套壳公司。为什么扎克伯格花了这么大的价钱去收购这家公司呢? 是吧?然后 mata 一 季度的电呃,财报电话会里,扎克伯格说了,这个市面上的 agent 有 很多,但是我没有几个想让我妈用, 他的意思就很明确了,是吧? madam 呢?所以说现在他缺的不是大模型,他缺的是落地,他有点急了,什么意思啊?就是说我现在的这个大元模型,我跟他说你去给我做一下市场调研,那他就会跟我说,你应该先去确定一下目标,目标用户,再去做一下竞品分析,在干嘛干嘛。 但是他这个有很很大的一个问题,就是我想要一个私人助理的话,他没有帮我做。另外呢,还你不知道我当前的一些新闻和当前的一些数据, 还有一个关键点就是他既然要做市场调研,他是不是得先知道我企业内部的一些资料,或者是我个人的一些信息啊?这就衍生出了 一个技术叫 r a g。 这个技术很简单啊,就是我让他做一下市场调研,然后呢他首先去我企业内部的数据库找一些答案, 然后一起发送给大模型。注意啊,这里没有用到大模型啊,没有思考,它只是一个查找和剪索,然后一起喂到喂给大模型,然后综合给出一个输出,在这种情况下,它就知道我的个人资料和企业的一些信息了。不过还有一个问题就是它没有去 调用工具,这就会衍生出下一个技术叫 tall use。 这个显而易见就是让大冒险会调研工具了,比如说我现在让他给我查一下从北京到厦门的机票有哪些啊?航班有哪些,然后他就会利用这个技术,然后 我的出发地是北京,然后一直到目的地厦门,然后航班信息返回来了以后,大冒险再结合整理一下,给出一个输出,在这种情况下呢,他就会有一个落地的雏形了。但是呢, 我们来考虑一下,我我我只有这一个工具吗?啊?只有查航班这一个工具吗?假如说我让他查一下明天的天气,他是不是得现调用下一个工具了 啊?这个工具一多,我五花八门的工具一多,每一个工具每一个人,他的编辑代码的习惯是有一点不同的,在这种情况下,他留给大魔仙的 api 接口他可能就不太一样。 那么为了统一这些规则和保证我数据传输之间的安全,就会出现了一个技术叫 m c p, 然后有了 m c p 以后,就把这些工具都给串联给了大研模型,那么还会还会有问题啊?我们技术还在迭代,就是说我现在让它做一下市场调研,我们正常就刚才说的就是我们呃,大研模型,去 搜一下网页,找一个外部端,然后得到了数据之后,再综合给出用户一个详细的一些信息。但我们正常的工作流程当中 不会一次调度,我会有很多的调用工具的次数。在这种情况下呢,就是我 找了这个外部呢,我发现,哎,数据不够,然后我再去找下一个网页,然后我再找下一个网页,再综合的去给出一个结果,那在这个过程当中我我发现数据不够,是不是我就思考了,哎,我思考了以后,我再找下一个网页,我是不是就执行了 这个技术叫 react, react 呢?就是 reason 加 act, 就是 思考和行动。但是 react 其实也有弊端啊,就是就是我们自己啊,我们个人在做事的时候不是说我想到哪步做哪步,其实在之前我们都会有一个 pie, 就是都会有一个计划,这个其实也是一个技术吧,算是。然后得到问题了以后,我在执行之前先做一个计划,我第一步应该做什么,第二步应该做什么,然后我逐步的去执行。 在这个过程当中啊,我简单的任务还好,比如说我让他做市场调研,我让他做一个这个白板底的市场调研,那么他可能,哎,就是这一步一步下来就好了,但是我要让他做一个新能源汽车的市场调研,是不是就不太行了?因为因为这个流程实在是太多了, 这个情况下就会有一个多 agent 的 编排,就是我现在 apply 啊给出了一个计划,我这第一步呢,我再交给一个大语言的模型啊,再交给一个 agent, 也就是说我这个主 agent 是 一个大脑,它是一个 leader, 然后我分配给下面的一些员工,你这个 员工就做第一步,然后我这个员工呢就做第二步,然后最后我再把这好几个 agent 的 结果综合给这个 leader, 然后再给出一个调研报告, 这个就叫 multi agent 啊,在这种情况下,你看我,你,我们回忆一下,就刚才我们有个 m c p 这个出现是为什么?是因为我工具越来越多,那么我 a 帧它越来越多,在 a 帧和 a 帧之间,它们是不是也会有交流啊?比如说我,我确定目标用户,然后我竞品分析了以后,我发现这个目标用户有点不太现实,那么我这个 a 帧呢,就告诉上一个啊,大圆模型, 你这个应该进行一下调整,也就说 a 帧和 a 帧之间的交流,它也会有一个协议,叫 a two a, 这个技术呢就是为了让我们不同的 agent 之间安全的交互信息,和这个协同啊一起的去工作。 那么整个的这个流程呢,就是我们现在很多市面上的 agent 是 怎么落地的啊?还会有一个问题,就是 我现在的这个代言模型,不是我自己去想啊,有什么第一步干什么第二步干,但是如果说我想固定呢啊,我想给他一个固定的流程,我不,我第一步就先竞品分析行不行啊?我第二步再去确定目标用户,这是不是也是可以的?这个呢? 这个也是一个技术啊,这也是个技术,因为开发就是这样子的,这个技术叫 work flow, 这个 work flow 啊, 我就讲完了,就是就是我人工设置它的流程,然后你执行到某一步的时候,需要我人去确认一下,你别,你别自己执行,执行错了。比如说我们现在写 cloud code 啊,它在那个编辑器里面写完代码了以后,它不是直接运行的,它需要我们人工去写一个 yes or no, 是吧?如果 yes, 然后他再到编辑器里面执行,再往下呢?其实还会有一个小问题,就是说我一步一步执行啊,无论是说我自己想的这个流程,我一步一步执行,我在某一步的时候出现卡死了啊,我这个页面 加载啊,他出现错误,网络出现错误了,他是不是就得从头开始了?这肯定是不行。那么在这个过程当中呢,我就需要记录一下他的一些状态, 这个叫 state, 记录 agent 做到了哪一步,然后他用了什么工具,拿到了什么,结果哪里失败了。 比如说我电脑关机了以后,他还下一次开机的时候还能从这部,然后再往下走,这个就叫 state, 再往后呢,就是 high risk engineer, 我 在执行代码的时候, 你,你们用 gpt 的 时候,我不知道有没有发现啊?就是你现在是可以让它写代码的,然后它直接输出结果,那么它这个它既它没有编辑器,它是在哪里执行的呢?这个就是一个虚拟的环境,这个技术就是 harness engineering, 就是 它,它 有 agent, 一个外部的环境啊,这是 agent 主流的环境,然后它有一个外部的环境,在外部的环境执行完了之后再返回结果,它不影响我当前的这个状态,如果说我现在每一个代码和每一个结果都在我本地的编辑器里面执行的话,那是不是就比较混乱呢?内存储存也不够啊? 然后还有一些细节的问题啊,就比如说我现在虽然说 tow use 有 有很多工具了,我可以调用,但是其实比如说企业的一些软件,它还是以人的交互为主,所以说就会有一个个技术叫 computer use, 就是 我 看屏幕,让 agent 去看屏幕,点按钮传输文字。所以我回到刚才 manasa 的 这个案例啊,就是说 ai agent 其实它是已经很成熟的一个技术了,它已经不能绕开我们国家的监管去境外转移了。