最近刷屏的腾讯 mars 到底值不值得装?它是腾讯全新系统级 ai 助手,相当于电脑版贾维斯,不靠手动操作,说人话就能指挥电脑干活, 文件整理、系统优化,手机远程控机全都支持,而且永久免费,每日一千万 token 完全够用。 重点看资源占用。安装包三百兆,模型文件二到八 g 空隙内存七百兆到一 g, 运行任务最高三 g, cpu 负债也会明显上升。 卸载方面,常规卸载可移除主程序,但模型缓存会残留,手动删除文件夹就能清理干净。 总结,高配电脑效率神器,低配老电脑不建议尝试。
粉丝1159获赞1.4万

很热乎的刚上线的马维斯 a 阵图到底怎么样?我们一起来看看。这个界面和普通智能体界面没什么区别,现在来给他个指令看看。反应稍微有点慢, 用了三分钟左右时间总算结束。目前马维斯能做的工作主要有文件管理、系统操作、应用操作这三大类。我们先让他来进行一些文件整理,看看能不能完成。 这里可能给的指令不准确,所以给的结果没有输出。那我们再让他试试软件操控,看看结果怎么样。 目前来看,他不能直接操作微信进行消息发送,再尝试一下让他进行文件整理,试一试。 现在这个指令是可行的,也整理出来相应想要的文件。目前简单的处理一些工作基本没问题。如果想要操控各种软件,就需要各种权限和系统更新, 但是这种权限会不会恶意删除重要文件仍然是个未知数。从安全角度出发,建议不要安装在这重要的设备上,毕竟还不成熟。 另外就是使用现在是不是免费,马维斯目前安装给了一千万的 tokens, 现在是免费使用的,后面使用量起来后收费是避免不了的,大家想尝试可以去尝试一下,觉得好用可以回来做个反馈。

最近爆火的马维斯究竟是套壳小龙虾还是智能管家贾维斯?我们今天上手试一试。我先装的是 windows 版 官网入口很直接,下载之后就是一个独立客户端。第一次打开时,它没有直接丢一个聊天框,而是先让你选择使用场景。这个设计挺关键,桌面 agent 需要先判断你想让它帮哪类忙。 进入主界面后,重点看左边,这里有新建对话、自动任务技能广场,还有应用文档图库和此电脑。 最有辨识度的是 marvis 办公室,他把 marvis、 app agent、 browser agent 做成可观察的角色,而不是一个完全看不见的后台黑箱。这期先不测复杂办公流,只做一个轻任务,让他打开 m a r v i s 点 qq 点 c o m。 他 理解指令后会把任务分发给 app agent。 检测到多个浏览器时,还会让你选择用哪个浏览器打开,最后网站能打开。 这个结果说明基础调用链路能跑通,但离真正的智能管家还要看复杂任务和失败恢复。所以这一期的结论是,马维斯不是简单的套客聊天框,产品形态确实有点意思,但能不能叫贾维斯,下一期我们接着说。

选 ai 创建的话,它就可以自动生成了。选 ai 创建 帮我创建一个生成 ppt 的 智能体,可以重新生成啊, 它自动就把人设与恢复逻辑这个模型啊,这些就自动的给我们生成出来了, 帮我生成一个关于人工智能的 ppt。

今天给大家分享一下如何创造零智能体的设定,大家都知道豆包这个 ai 就是 哄我们玩的,聊着聊着就变味了,所以我们需要解决的第一个问题就是这个,我觉得无论什么角色的智能体都套用这个设定。 第二个问题,这个问题可以交给 ai 处理,一定要进行修改,说出你的想法,但我们不要盲目的去套用。我的这个零智能体修改过很多次,已经算是比较完善了,大家如果想要可以去评论区找,之后再结合上次发的零的 ai 调音,我们就可以得到这样一个零。 我名为林,对外的身份是罗曼诺夫皇室伊布拉佐夫斯卡亚罗曼诺娃,曾是黑天鹅等三十八号实验体,因觉醒黄金同被家人送入实验基地,是少数的幸存者之一,现在是卡塞尔学院的 a 级学员。我的年龄是镜童,能够解析结构,复刻他人年龄,并 看穿术士破绽,且没有明显的副作用。最重要的是,我会一直守护着你。 雷纳塔叶夫根尼契契林,这就是我的真名,不过你想叫我什么都可以。 最后,我的零的智能体有三个,一个是对我满好感度的,一个是跟我现实中聊天的,一个是正常的零。没有经过修改设定的零。今天的分享就结束了,如果不想弄这些直接关注我,我把智能体直接分享给你。今天的分享结束了,拜拜。

你是不是刷了一大堆扣子教程,各个功能都认识,各类节点也大致清楚用途,可每次点开空白画布依旧完全不知道从哪里下手,心里明明想着要搭建一个能正常使用的工具,鼠标却迟迟不动, 总感觉还差一点东西,可又说不上缺在哪。其实你缺少的不是知识点,是完完整整从头到尾落地做出成品的实操经历。今天这期不带大家拆解零散功能, 不讲复杂高级案例,全程带着大家从零到一,搭建一款可以直接日常使用的 ai 工具。每一步我都会讲清楚操作目的,这么做的原因,还有新手最容易卡顿的地方,把这期当成你的第一次完整实战训练,完整跟着走完, 你就能吃透从单纯想法到成品上线的完整流程,建立实操手感。先确定本次实操项目,很多新手第一次搭建就踩坑,要么设计太复杂, 要么需求模糊空洞。今天咱们做一款小巧实用,上手无压力的工具,生日祝福助手智能体为什么选这个项目练手?第一,需求清晰具体,不贪多,生成生日祝福语,一句话就能看懂。第二,覆盖扣子三大核心基础模块, 搭建过程会用到智能体提示词,知识库,简易工作流,吃透这套逻辑,换成任何行业场景都能复刻。第三,成品实用性强,搭建完成直接分享给亲友使用,随时调取各类走亲祝福目标确定,现在打开扣子,跟着我一步步操作。第一步,新建智能体,配置核心提示词, 打开扣子平台,点击新建智能体名称,填写生日祝福助手简介,简单写,一键生成走亲不套路的生日祝福语。 进入人设与逻辑设置页面,这一步是给 ai 塑造基础思维。分享新手零翻车三段式提示词写法,不用堆砌长篇文字。第一句,身份定位, 你是擅长辗写走心生日祝福的贴心助手。第二句,核心任务,用户告知祝福对象双方关系,你产出真诚自然、不模板化的生日文案。 第三句,约束限制,拒绝过度肉麻话术,杜绝网上通用套话。三句话写完,直接在右侧对话预览窗口测试,输入测试需求,帮我写给老婆的生日祝福,她三十岁,我们结婚五年。 观察 ai 输出文案,如果模板感太重,就在提示词补充语气,贴近日常聊天,不要生硬贺卡文风,如果内容篇幅太短,追加要求文案控制三到五句,尽量带上生活化细节,反复修改,测试两三轮,你就能熟练掌握提示词调试技巧。 第二步,搭建知识库,给 ai 补充专属素材。记忆提示词只能规定 ai 基础风格,没办法区分不同关系、不同文风的专属写法。知识库就是用来存放细分参考素材的。左侧菜单栏,打开知识库,新建素材库,命名祝福语素材库。 新手搭建知识库,牢记核心规则,单条文档只存一类内容,文档标题对应问题,正文是标准答案,给大家三组示范素材,直接复刻上传。一、标题给好朋友的祝福怎么写?正文回忆共同经历,比如结伴旅行,熬夜谈心, 搭配一句陪伴感恩的话。二、标题,给长辈的祝福怎么写?正文使用礼貌敬语,侧重身体健康,阖家顺遂,不开玩笑。三、标题,文艺风格祝福语写法正文,以四季过往小事开篇, 结尾简洁,送上生日快乐即可。素材上传完毕,回到智能体配置页面,绑定刚建好的祝福语素材库,再次测试提问, 帮我写送给大学室友的文艺风生日祝福。能明显看到 ai 会自动调取知识库内对应内容,输出文案针对性更强,这就是知识库的作用,不求文件多,只求内容精准分类。 第三步,搭建简易工作流,简化用户输入步骤。目前智能体可以对话调取知识库,但每次都需要完整说明需求。我们搭建极简工作流,用户只需要输入对象关系,就能自动生成祝福文案, 省去重复描述指令两种进入工作流的方式。左侧菜单栏新建工作流,或者在智能体技能板块新建命名祝福与生成流程画布只需要三个基础节点,不用复杂分支。 一、开始节点流程启动入口,无需额外配置。二、大模型节点放在开始节点右侧,配置提示词,根据用户输入的祝福对象、亲属、朋友关系, 结合知识库内各类风格素材,生成三到五句走心生日祝福。三、结束节点放在大模型右侧,负责输出。最终文案 完成节点摆放后,连线开始节点输出连接大模型输入大模型输出连接结束节点输入保存流程,返回智能体设置页面,绑定这条自建工作流测试讲话。输入对象是妈妈关系母子, 无需多余描述, ai 自动启动整套流程,直接产出适配长辈的祝福文案。第四步,发布上线,分享给真人收集反馈功能全部调试通顺。最后一步,发布交付使用。点击页面右上角发布新手优先选择网页链接渠道,一键生成专属网址,复制就能转发。微信群好友 需要对接微信飞书的,按照页面指引一步步配置即可发布完成。不要搁置,把链接分享给身边朋友,让他们自由体验,主动收集使用反馈。 有人觉得文案太短,有人觉得文风偏官方,这些真实反馈就是优化方向,完成搭建发布、用户试用、迭代修改完整闭环,你就彻底摆脱纯新手阶段整体复盘。本次实操完整四步流程, 一、拷写提示词,搭建 ai 基础思维大脑。二、搭建分类知识库,赋予 ai 专属素材记忆。三、拖拽简易工作流,实现一键自动化生成。 四、对外发布分享收集真实反馈,持续优化,全程落地。一款完整可对外使用的 ai 小 工具,不是纸上谈兵的练习项目,你可能觉得只是一款写祝福语的小工具,没什么难度, 但这套从零到一的搭建逻辑是通用的。学会这套流程,替换提示词、更换知识库素材,你就能搭建文件、客服、自媒体、文案助手、资料问答机器人等各类工具。真正拉开新手差距的,从来不是会多少冷门功能, 而是完整走完一次落地闭环的实操经验。完整实操一次,你就有底气挑战第二个项目。 熟练两三次之后,甚至可以带新人接定制搭建单子。我整理了全套系统化新手进阶课程,想顺着科学路线, 吃透智能题与工作流搭建的朋友评论区扣学习,做出你的第一个智能题,这期实操就是你学习扣字的正式起点,新手做出成品,才算真正脱离只收藏不练习的阶段。今天的分享就到这里,咱们下期再见!

这是你能看到最完整的用 ai 制作 ppt 的 系统教程,我们一起分普通的文字资料,一步步变成一套专业美观的演讲稿, 全程让 ai 干活。我们从工具准备、文案重组开始,到设计风格的确定、参考图获取、视觉优化,再到自动的素材搜索、 ai 升图、图标生成动效设计过场动画,最后完成可编辑可展示的完整作品。 而整个的过程和所有的提示词,我都毫无保留的展示出来。我是木子,我不贩卖焦虑,只提供 ai 时代的解决方案。我们现在开始, 我的粉丝量终于破十万了,感谢大家一直以来对我的陪伴和支持。我和抖音精选为大家准备了电子书等精美的周边礼物作为宠粉福利,希望这份奖品可以帮助大家更好的学习 ai。 大家呢,可以点击视频描述的话题,抖音精选作者宠粉福利进行参与哦! 在正式开始用 ai 做 ppt 之前,我们首先解释和自己安装一下这次用到的工具, open design。 anselva 公司在四月中下旬呢发布了他们的 ai 设计软件 cloud design, 它可以用自然语言生成设计稿啊,原型啊,还原片,网站等等,效果非常好,而且可以在此基础上直接在界面里面进行编辑。 那我也做了一期如何使用的视频,但问题是它主要绑定 cloud 的 生态。众所周知, cloud 的 模型有诸多的限制,而且 cloud 迭在消耗的额度非常快,它非常的贵, 所以众多的开发者开始尝试来制作 cloud 迭在的开源替代。其中呢, open design 就是 这类工具中比较有代表性的一个,你可以把它理解成一个开放性的 ai 画布,它负责展示和编辑页面,而真正负责设计写代码改样式的是它后面接的智能体, 比方说 codex, cloud code, 龙虾 tree, hermes agent, cursor 或者其他主流的智能体。 这样做的好处就是,第一个,任何的模型和智能体都能用类似 cloud d 站的设计功能进行直接的生成和直接的编辑。第二就是,哎,你可以使用你自己已有智能体的额度。听到这里大家明白了,只需要自己安装 open d 站,它是开源的,所有人都能安装以及搭配任意一个智能体即可。 如果已经在使用某一个智能体了,直接把它接到 open design, 如果没有,在这个列表里面自己选择一个安装即可。面演示一下如何自己安装 open design, 那么自己搜索 open design, 来到 gitlab 的 网站,往下拉, 点击简体中文,切换到简体中文的网站这里呢,自己点击按钮来下载相对应的客户端, 自己选择操作系统,下载完成后自己拖动进行安装。 安装完之后来到这个欢迎页面这里呢,点击本地的 coding agent, 然后呢,它会自动扫描所有在本地安装的智能体,比方这里我们选择 codex, 选择模型,点击继续, 然后呢,这一路继续就安装完成了。如果你从来没有在自己的电脑上使用过任何的智能体,这时候需要自己在这个列表里面选择一个智能体,然后安装即可。 可以看到有 cloud code codex, 如果国外的这些智能体安装不了,那自己就可以在第二行,第三行选择一个优秀的国内的智能体进行安装, 值得注意的是这里啊,它是智能体的 c i, 就是 命令行版本,但是不要怕,安装极其简单,比方说 cloud code, 自己来到 cloud code 的 网站,然后复制这一行命令行, 或者是自己来到 codex 的 网站,自己复制这一行命令行,自己打开电脑的终端 粘贴过来,命令行好点,回车就会安装好。其实不论是 cloud code 还是 codex, 我 都有完整的零基础系统教程来帮助大家完全掌握这两个智能题。但是呢,在这里只需要自己安装其中一个智能题,剩下的操作都在 open 底站里面完成就可以。 在一切准备工作就绪之后呢,下面我们开始把一个或者多个的文字资料变成一份专业美观的 ppt。 这个文字资料可以是你的论文,可以是你的调研,可以是你平常的笔记,可以一个,可以多个,这个没关系,流程都是一样的。 ppt 的 美观当然重要,这也是这个视频的重点。但是 ppt 的 目的其实在于两个,第一让别人理解一件事情,第二是理解的基础上,让别人做出一个判断或者是决定,也就是说服别人, 比如老板看完项目之后决定做不做团队,看完之后决定下一步该怎么执行。所以呢,做 ppt 呢,应该想清楚,我需要让别人理解什么,我需要让别人做出一个怎样的判断和决定。 而这两件事情,其实每一个做 ppt 的 人都已经事先知道了,因为 ppt 仅仅是为了完成这两个目的而使用的视觉呈现方式。而这些目的呢,我们就需要告诉我们的 ai, 比如我们想把这样一个文字资料变成 ppt, 它呢是二零二六年 ai 浏览器大战这样一个行业研究报告。我们能来到任何一个 ai 这里,我用 gpt 做演示,但是你可以用 gpc, 你 可以用豆包,任何的 ai 网页对话界面都可以完成这个工作。我们先让 ai 啊帮我们输出 ppt 的 页数结构和每个页面的文字信息。 为什么这么做呢?因为后面如果是已经设计完成了,在 open design 里面修改这些文字信息,尤其是页之一页之间的结构,重新编排会复杂很多。所以这些 ppt 里面的文字信息,每一页的结构,我们最好是在生成设计之前就定好。 我给他的提示词其实非常简单,首先我告诉他,我要做一份 ppt, 题目是 ai 六七大战。然后呢,目的有两个,一个是让观众理解大战的现状,第二个是呢,形成一个判断,就是竞争之所以激烈,是因为大厂在争夺下一代的互联网入口。 两个要求,不要先写代码,不要生成 ppt。 生成,一,每一页的文字内容。二、做一个 html, 每一页文字内容都放进去,让我看看排版,让我看看页之间的风格,直观地看到是不是合适,需不需要调整。 等一会儿之后,他就把每页的文字信息都给我们了。首先是纯文字,这里是方便我们复制,然后给到喷击赞,后面生成 ppt 的 往下拉,我还要求他生成了每页的 html, 这里就是方便我们看看每页的标题是什么,副标题是什么,然后每页的内容是什么, 方便我们修改。这里还是强烈建议大家任何页面的文字的修改,各个页面之间怎么编排,一定要在这里就改好,不要放到后面设计都出来了,再会比较麻烦。 在所有的文字内容都确定之后,下面我们开始确定我们这个 ppt 的 设计风格,艺术风格,或者说是画面表现的风格,比方说是走低简主义,还是走新粗野主义,还是走瑞士主义,还是走赛博朋克的减脂风等等等等吧。 这里并不需要我们自己是设计的专家,需要了解所有的风格,我们可以把我们的文字资料和我们的目的给到 ai, 让 ai 根据这些 帮我们推荐五种不同的风格,我们判断要用哪种就好。最终我们希望得到一就是这种设计风格的名字,对吧,用来指导我们的 open design。 第二就是这种设计风格的一个参考图, 有了参考图,我们可以给到 open design, 让我们的 p d 完全还原,按照我们的参考图来设计,保证出来结果跟我们想象的是一样的。 那如何决定要用什么设计,如何得到参考图呢?还是用 ai? 我 使用的其实是这样的,请基于这份 ppt 主题目的和主页文案, 给我五个适合做成 ppt 的 美术视觉风格、画面风格和艺术语言方向。重要的是,哎,我不要咨询风啊,发布会风这种用途分类和场景分类,我要的是能直接指导画面生成排版、色彩、图形和质感的艺术风格。比方说仅举例,不需要参考 瑞士国际主义风格,宝好斯风,荷兰风格派等等等等。这个我们给到 ai, 等一会之后, ai 就 为我们推荐了五种适合我们 ppt 的 视觉风格或者是艺术风格,以及他推荐的原因。比如这里他推荐了赛博界面主义、瑞士国际主义、数字网格风、 新粗野主义,你太玻璃空间界面风,还有就是构成主义,战争风等等 等。一会之后, ai 就 帮我们生成了我们第一页 ppt 对 应的五种风格的呈现。可以看到啊,分别是这赛博朋克风、瑞士风、新粗野主义, 波利尼泰风以及最后的这个战争对抗风。那么这里就根据自己的喜好和目的进行选择,比方说新粗野主义明显就比较夸张,比较年轻化,对不对?那么波利尼泰风呢,可能就比较沉稳一些,比较高端一些。这里呢,我选了这个新粗野风格,这样的话我们的设计方向和参考图就有了。 现在我们有了每一页 ppt 的 文字内容,我们确定了设计方向,得到了设计的参考图。下一步我们要生成第一版的 ppt, 我 们来到 open design 这里呢,自己来到已经安装好的 open design, 以下自己的需求就一句话, 我要做 ppt, 请完全参照还原我给你的截图的设计风格。然后这是每页的文字内容,这里自己来到与 ai 的 对话,复制参考图, 继续上拉哎,自己去复制每页的文字内容, 然后发送给 open design 这里 open design 会问我们几个问题,每个人的问题都不一样,根据你给他的文字资料,根据你给他的参考图,这里他问我们 ppt 的 比例,这里我们选择按照截图的比例进行还原 每页文字的处理方式,选择尽量保留原文,因为我们已经跳定了每页的文字,对吧?后面是否需要演讲者备注,选择不需要,我们继续让他工作。 这里可以注意,我们左下角点击这个按键,在这里我们可以切换不同的 agent。 同样呢,我们可以切换不同的模型以及它的推理强度了。啊,那这里呢,我们可以点击重新扫描 pad, 这样的话,刚才新安装的 agent 就 会出现在这里,可以选择来驱动 open design。 哎,比如这里,我刚才安装了 jimmy nice er i。 那 我一扫描就会把它扫描出来了。大概等了十二分钟左右吧,你可以看到,哎,我们的第一版的 ppt 都生成出来了,我们可以看一下,其实它是不错的,对吧, 也遵循了我们的效果。但是呢,平心而论,他跟我们给他的参考图,尤其是第一张,还是有很大差距的。倒不是说一模一样,但希望至少质感和设计的水平是跟第一个是一样的,目前还是有明显的差距。 那这时候呢,我们就可以继续呢,来改一版,来抹平这个差距。我们要用什么呢?我们要有一个特别有意思的功能,就是这个智能匹配。下一步,它本质上啊,就告诉这个 creator director, 也就是它这个总的设计师吧, 告诉他,哎,我把所有的 skills, 所有的 m, c, p, 所有的插件,所有的技能都给到你。我问你几个问题,比方这里他的问题是默认定义什么是好看的设计啊什么的,这里我们改一下。我们呢,想要问他啊,为什么他跟原来的设计有差距?如何弥补这个差距? 这里呢,我们用艾特哎来把我们的参考图加进到我们的上下文, 可以看到,哎,我就告诉他这是参考图啊,这是你生成的,为什么差距这么大,你怎么弥补?然后后面的提示词啊,就说你可以用所有的资源啊,然后按照诊断风格、方向、资源选择等等,走完全流程。 哎,等一会之后,我可以发现我们现在的设计比原来好了很多,更像是我们的参考图了,更重要的是它更有质感了。然后我们可以往后看啊, 确实哎,非常的不错。那除了刚才的提示词及其优化之外呢,我还额外的让他去网上找最好的字体,最适合我们这个风格的字体下载下来,然后用到我们这个 ppt 的 项目里面。 好的,现在我们有一个非常重要的事情要完成,就是了,我们这个笔记里面会需要很多外部的素材,比方说各个浏览器它产品的那个 logo, 各个公司的 logo 等等,对吧?目前 ai 还没有自动的把我们加出来,它只是直接生成了文字。 这里呢,我们就需要让 ai 把所有我们所有需要的图片素材去网上帮我们下载下来高清版本,然后放到对应的位置。意思是这样的,我们给他说,好的,请你为我们这个 ppt 搜索并嵌入合适的品牌 logo、 产品截图和浏览器素材。首先你先判断这十七页中哪些位置适合加素材,对吧?哪些位置不该加啊?比方说啊,后面我们说的还各个浏览器对比的时候, 明显这时候可以加这个浏览器这个产品的素材,对吧?这里就让他自己去判断,我们不需要一个一个给他说了。 然后呢下载到本地并嵌入页面,那 logo 呢?尽量要保持官方的原貌,不要重新上色。这里为什么要说这句话呢?因为如果你不说这句话,他会下载下来 logo, 然后呢把它变成我们这个风格的。 有的时候产品的 logo 这些东西你并不想改变,强行改版的风格,用原本的 logo 最好,这样大家更有识别度,对吧?所以就加上了这一句话。好的,我们给到 open design, 等一会之后呢,他就把所有的素材都下载下来,并且嵌入我们的 ppt 里面了。我们来看一下效果。首先首页就可以看到他下载了相应的浏览器以及对应 ai 的 图标,我们往后看啊,非常明显,这一页把所有的玩家列出来的时候,对应的图标他也找到了, 后面在讲解,比方说 chpt 对 应的浏览器的时候,他也找到了名字,并且下载了正确的图标,这是非常的好的,无缝的衔接到了这里。他呢也去比方说 jimmy night 的 官找到了相应的素材截图并放到了这里。 同理,不同的浏览器他都这么做了,效果是非常不错的。尤其考虑到其实我们完全没有做任何的操作,全都是 ai 来完成的。 现在我们让 ai 去找到了所有的素材,放到了 ppt 里面,我们的 ppt 又进一步优化了,那下一步还有动作要做,就是我们的 ppt 里面有很多 章节,很多的页,能够用 ai 生图来让这个信息表达的更加完善,视觉也更好。这个呢,我们就让 ai 自己去判断哪些地方能够 ai 生图,并且嵌入到这个 ppt 里面,让我们的 ppt 更好,这里我给它提示词是这样的, 为我们这个 ppt 自行判断并加入生成的图,对吧?通读是切的内容,自行判断哪些页面需要 ai 生图生成什么放在哪里,哪些就不需要, 那么调用可用的 ai 生图工具生成图片,这里我就明确要求用它用 gpt 页面这儿,因为我用的是 go, nice 啊,正好可以生成图片。 如果你这个智能体是没办法生成图片的,那这时候呢,你可以去让他给你建议,然后给你提示词,你自己复制提示词,对相去相应的生图的 ai 里面的生成图再放回来,让它在嵌入里面,只不过这里用 gpt 的 话可以生成图片,所以这一步就省了,更加简单一些。 然后呢,写完之后告诉我在哪些页面加上什么图,好的,我们把这提示词给到他, 等一会儿之后,我们的智能体自行判断了哪一页需要加入图片更好一些。生成的图片自动的嵌入了进去,我们来看看效果,他给我们说,比方说四六七页都会有新的图片,哎,我们看一下, 哎,可以看到这个第四页前台这个概念的重要介绍的时候呢,就说啊,这个浏览器是我们用户的入口,这时候他就生成一张图来表示我们做所有事情都要通过浏览器,对吧?当做背景,这个非常的不错, 同样的第六页也生成了这样一张背景图来解释,第七页同样 可以看到他刻意的规避了那些我们已经有图素材在这个页面上的,来避免重复,对吧?这个点非常的好,往后看哎,可以看到几乎任何有观点性的说服性,他都会配一张图来表示这个意思。 到最后可以看到通过 ai 声读我们的 ppt 更加好了,那完成了吗?没有,还有下一步,下一步是什么?就是动效, 大家可以看到这些就是生成动效用到的技术栈和资源。那么我们用 html 来生成 ppt, 这也就意味着网页上那些特别好的视觉效果,我们现在通通可以拿过来放在我们的 ppt 里。比方说这里我们介绍三个比较常用的,第一个是 j sap, j sap 是 动画库,用它呢我们可以生成各种各样不同的动画,让我们的 ppt 更加的生动,大家可以看看对不对。 第二个比较常用的是 threeder j s, 它是一个三 d 库,用它我们可以生成各种各样的三 d 效果。那第三个比较常用的是 itars, 它是一个图标数据可制化的库。那么把论文做成 ppt 的 同学呢,就可能会常用它来表达一些想生成的图, 点击任何的图都可以有相应的代码可以复制过来。然后呢,自己给到智能机,给到 open design, 让它在对应的页面上插入这样的图,除了二 d 的 图之外,还有不同的三 d 的 图,也都可以直接自己复制代码, 然后进行一些修改,放到我们的 ppt 里面,非常的好用。那我们现在就从一叉的开始演示如何把动态效果加入到我们的 ppt 里面 这里呢?于是自己的 ppt 大 概应该知道什么地方放入什么图标合适。如果你没有想法,也可以问 ai, 比如这里我问 ai, 我 让他扫描我们所有的页面,然后基于一叉的图标能力,自行判断哪些网页适合加图标,适合用什么图标,放在哪里,告诉他真正用的再加,不要每页都加, 等一会儿之后它就做好图表了,我们来看看效果。 首先第五页有这样一个图表,柱状图和线图,首先它的风格是跟我们整个 ppt 的 风格是一致的,这个非常的好,它做了自适应,这样不会显得突兀。 第二个就是,哎,我们看到这个表现的形式是很好看的,对吧?而且把鼠标放上去,有具体的数据显示出来,而不单单是一张图,这个就体现了一叉子这个的好处,非常的好。同样的,线图也是把手表放上去,有具体的数值可以进行分析。我们在做 ppt 展示的时候呢,可以讲细节, 我们接着往下看, 它在十六页也插入了图标,同样的风格,跟我们的 ppt 非常的好,也非常的美观。然后呢,把手边放上去,哎,也是有具体的数值进行显示,呈现方式也是非常的好,所以这个 excel 还是非常值得加入的。 好。有了图标,下一步我们要做三 d 效果,用的就是我们刚才说过的 three 点 gs, 那 我用的提示词呢,也是非常的简单,是这样的,我告诉他,请扫描所有网页,基于 three 点 gs 的 三 d 粒子空间场景能力,自行判断哪些页面适合加入三 d 视觉,适合做什么效果,放在哪里, 告诉他不要美颜,都加,适合再加,不然没必要。好,现在我们把这个提示词给到 open design, 等一会之后呢,我们的三 d 粒子效果就做完了,我们来看一看,主要在第一页和第四页,首先是第一页可以看到我们的背景啊,他做了一些粒子和动画光线的效果,为我们的首页做点缀。我认为做的是相当不错的,而且比较低调,并没有让本来元素就很多的首页变得很乱。 好的,这是第一页的效果,我们再去看看第四页,第四页他就做了一个圆圈吧。 这里呢,稍微是有些乱了,我认为是可以移除的,但根据大家的审美不同自己做判断。这里我给说一下,就三 d 粒子效果呢,根据风格的不同,他可以加的地方是不一样的, 比方说我们现在这个风格其实已经很多颜色,很多元素了,加很多三 d 粒子效果。很多动画可能会使得我们整个的视觉有点乱,所以这里呢,加的地方会比较少,但如果你是极简的风格,你就可以多加一些粒子效果来点缀。这里呢,需要大家自己根据内容和风格进行判断了。 好,现在我们加了图标,我们加了三 d 粒子效果,大家也可以同时用我给大家的那个技术站列表一个个过, 看看能不能再加其他的效果,让自己的 ppt 更加美观,更加容易理解。啊,这里呢,啊,我们的提示词还是一脉相承的,就是告诉他,我要用这个技术站, 让 ai 去扫描我们所有的页面,看看哪些地方能用这个技术站加入这个效果,不要强行加,能加就加就不加,最后让他做出来,然后自己嵌入到我们的 ppt 里面。 好的,下面假设我们的所有效果都做好了,我们满意了,我们就要编辑一下我们的 ppt 了,做一下微调, 如果我们的 ppt 不 能编辑,那它跟图片有什么区别,对吧?尽管我们是 html, 但是像 open design、 cloud design 这样的设计工具是允许我们做一定程度的编辑的。这里呢,我就介绍一下它的编辑系统。我们首先讲右上角的三个功能,分别是截图、 复式和标记,它们三个本质上都是为了我们跟 ai 更好地进行沟通,更具体来说就是方便我们定位问题。比方说截图,点击截图,它就会把当前页面的截图直接复制下来,我们粘贴就会直接粘贴到跟 ai 的 上下文里面去。 那么比方说这里现在我们有个问题啊,就是刚才我们说的对吧?我们遗留了一个问题,最后一页这个文字这边明显是吃掉了一半啊,这是不对的,怎么改呢?我们可以使用注视,也可以使用标记,我们先用注视点击注视,哎,我们点击这个地方,然后我们增加一个评论, 我们说文字并没有完全的显示,它的下半部分被遮挡了,然后呢,我们可以发送到聊天, 哎,这样的话,他就知道我们定位的这个地方,这个元素他有这样的问题,他就会定位进行修改,等一会之后可以发现问题被解决了,哎,这个元素现在字体高度是正确的, 那这是我们的注视功能,非常的好用。下面我们再说一下标记功能。首先我们点一下注视,退出编辑的界面,我们去到第一页,第一页我有个地方其实不太满意,就是右边的卡片, 当然他有不同的图标放在这里,可是其他的部分就是一个颜色加字体,我觉得有些丑,视觉呈现不好,我希望他去真正要去抓这个浏览器的截图,放在这里,我仍会更加美观一些,所以这里我就要用标记功能来告诉他,我不满意这些卡片,我希望你进行修改,我们点击标记, 然后呢,我们框起来我们不喜欢的地方,需要修改的地方,这里呢我会添加说明,这里一点击发送,我们就会发送给 ai, 让他继续工作。 请你找到这两个浏览器的真实素材,下载并嵌入卡片里,而不是用文字加蓝色背景的形式。 等一会之后发现,哎,他真的去找这两个浏览器的素材,把它放在这里了,而不是用字加背景的形式,可以看到他确实美观的多。这是我们刚才说的这个标记,这个功能非常的好用。 下面还有个功能就是我们的编辑模式,我们点击,这时候呢进入编辑模式啊,我们就可以改字体的大小,我们改具体的字体,这些都是可以的,但目前来说能够支持的字体还是比较有限的,就是几个长的字体了,但是他允许我们在每一页来增加修改不同的文字内容, 同样的我们可以修改每一个方块,每个元素的大小比方,这里有可以把它宽度哎调小点或者是调大一点。 好的,现在假设我们的微调也做完了,文字都 ok 了,下一步我们开始为我们整个的 ppt 做过场的动效,从第一页换到其他的页面,会有动画效果,对吧?这里我们是可以添加的, 这里啊,我们选择这个左下角的加号,然后设计百宝箱。我们这里点击加动画特效, 它呢会把预定的提示词给填入到里面,这里我们直接给就可以了。它的目的就是为当前的 html 页面加入高质量的动效,包括入场啊,滚动啊,状态的切换,微交互等等。动画和交互效果都加完了,我们验收一下。 首先第一页它加了我们鼠标悬停在卡片上的交互效果非常不错。后面我们进入下一张,还可以看到有简单的出场的这样一个过场动画, 非常的简单,不过还是不错的,如果大家想要其他的过场动画,可以要求它它变得更复杂一些。在这里呢,我认为它的目的达到了,不需要太花哨。 我们从第一版的 ppt 生成开始,要不断的优化它,让它去网上找素材,插入 ppt, 让它去 ai 生成,让它做图标,让它做三 d 动画效果,让它做过场动画。我们编辑文字进了这样一些之后,相信你的 ppt 也变得更专业更美观了。 这时候如果我们对所有的效果都满意了,我们就需要展示或者是导出我们的 ppt 了。这时候点击右上角的下载, 有不同的选择,导出为 pdf 啊 pdf x 啊,图片啊, zip 啊 html。 这里我给大家说一下,如果你导出为 pdf x, 它本质上就会发一段提示词给我们的 ai, 将我们现在的网页转化为 pptx 的 格式。大概率生成的 pptx 不 会遵从我们现在的视觉效果和排版, 它会相当于重新生成一遍,所以效果会非常的差,这里一定要慎重。如果你想要导出为独立的 h t l m l, 由于我们加了很多图片,加了很多效果,导出为 h t l m l, 就 会损失所有这些新加的东西,所以也要慎重导导出 pdf 和图片呢?你保留了这些视觉的效果,但是动效都没了, 所以最好的方式其实是就在我们的 open d 赞这里面进行演示。点击我们这里的演示全屏,那我们就来到了全屏,我们就可以在这里进行演示,如果有错误有问题,就可以回到刚才的编辑页面进行修改,就跟在 ppt 里面一样。好,现在我们看一下最终的效果。 这期视频我们借助开源工具 open d 赞,展示了如何用 ai 一 步一步做出专业而又漂亮的 ppt。 我知道有很多朋友不喜欢我选择的这个 ppt 的 风格,不过没有关系,这里的重点是掌握流程,掌握如何以智能题写作来帮助我们产出这样一份 ppt。 如果你看到这里还没有关注,是不是有点过分了,我们下期再见!

左边快速使用 右边 windows, 如遇网络问题,请多试几次,或者使用手机打开 双击进行下一步,等待自动完成。 完成后打开 第一排,输入自己申请的大模型 api key, 第二排你给白龙马取一个你自己喜欢的名字。第三排填入语音识别 api key, 第四排填入语音合成 api key 下面还可以自定义本地大模型,浏览器搜索 找到正确答案。 右边 api 开放平台,这里你们懂的。左边重置 新建 api key, 并复制 白龙马第一排粘贴刚刚复制的 api key, 浏览器搜索 找到这个正确的东西, 搜索栏搜索 开通服务,立即开通语音合成二点零 左边 apikey 管理,新建 apikey, 创建 apikey, 并复制 第三排和第四排粘贴刚刚复制的 apikey。 自动识别进入 系统启动中,正在检查文件读写能力, 正在检查热点面板, 正在检查视频模式。 左上角语音开关打开后进行连续语音对话,适合一个人安静环境下使用。下边文字对话框,也可以把鼠标移到对话框外面,按住空格键进行语音识别,适合多人环境下的语音对话。 小设置 l i、 m 切换大模型,选新大模型后填入新的 a、 p、 i、 k, 点击保存 左边语音识别,可以分别切换语音识别和语音合成的大模型,选择新的语音识别大模型,填入对应大模型的 a、 p、 i、 k, 点击下面保存。 切换新的语音合成大模型,选择喜欢的声音,填入对应的 api key, 点击下面试听,点击保存。 切换新的语音合成大模型,选择喜欢的声音,填入对应的 api key, 点击下面试听,点击保存。 你好,这是一段语音合成测试,听起来清晰自然吗? 左边社交媒体可以添加多个社交媒体,这个可以链接手机使用 安全沙箱,解除安全沙箱后,白龙马就可以浏览和操作电脑里的文件了。

腾讯新出的马维斯 mars 真的 有点好玩,一句话就能操作电脑,帮你找文件、搜索、整理资料,甚至接管电脑里的日常工作。如果你正在选择 ai 智能体工具,但又觉得 openclaw 和 hermes agent 部署起来太复杂,那这款一键安装、开箱即用的桌面 agent 可以 试试看,目前完全免费,每天还送一千万 token。 爱思官网现在已经放出了 windows、 macos 和安卓下载, ios 还在送审, windows 版建议至少六核 cpu 十六 gb 内存, ssd win 十以上六十四位系统。这就意味着它不是给即刻一个人玩的命令行工具,而是更接近普通电脑用户也能安装的系统级 ai 助手。 它真正有意思的地方是把 ai agent 接近电脑文件、应用浏览器和搜索。公开资料里提到马维斯背后是一个主 agent 加多个副 agent 的 写作,你可以理解成主 agent 呢,负责听懂你的任务。文件 agent 管资料,电脑 agent 管系统浏览器 agent 管网页搜索 agent 管信息收集。 第一个最实用的场景就是找文件和整理资料。很多人电脑里资料很多,合同、截图、表格、 pdf 图片混在一起。马维斯的价值不是简单按文件名搜索,而是让你用自然语言找内容,比如帮我找上周那份报价单,或者把某个项目相关资料整理出来。 第二个场景是本地模式和隐私。官网明确强调本地模式下文件零上传,这对经常处理合同、财务、人事资料、客户资料的人很关键。你可以先用本地模式处理敏感文件,需要更强能力的时候再切换效率模式。 第三个场景是是手机远程操控电脑,这个功能很适合临时离开电脑的人,比如你人在外面,突然需要找电脑里的文件查看任务进度,或者让电脑继续处理资料。马维斯想做的就是让手机和电脑保持在线连接。 安装上也比较简单,打开 m a r v i s 点 qq 点 com, 选择 windows 下载安装后登录账号,再按提示授权文件系统和远程控制权限。 第一次使用时,我建议先授权一个测试文件夹,不要一上来就给全盘权限,涉及删除文件、改系统设置。远程控制电脑的操作也一定要自己确认执行计划。 所以这期我对马云斯的判断是,他不一定是最强的开发者 agent, 但他可能是目前最适合普通用户体验桌面 agent 的 入口之一。 如果你觉得 opencloudhermes 这类工具配置复杂,又想体验一句话操作电脑,可以先试试。马维斯,你最希望桌面 ai agent 帮你解决什么问题?评论区告诉我。

今天我们上手搭建最简单的文案改写智能题,零基础也能一看就会,手把手带你做出第一个能日常用的 ai 工具,全程步骤很少,几步就能做好。万能文案改写 ai, 咱们直接开始实操,第一步,打开我们的这个扣子编程,点这个新建项目,然后我们这边中间会看到有个智能体开发,还有工作流开发,我们点开这个智能体开发。 好,然后我们先给我们的这个智能体的名称填一下哈,我们就点万能文案改写助手,然后我们再把智能体的功能介绍给写一下。好,我们就写一键改写文案多风格,自由切换论色语句,优化文字逻辑。 好,然后这个图标的话,你可以上传你自己本地图片的,我们也可以选择点这个 ai, 让 ai 帮我们自动去生成一下。好,我们现在全部都填好了,我们现在直接点全了。好,然后这个就到我们的这个智能体的这个配置页面了哈, 页面这个最上方的这个人设回复与逻辑,这是给 ai 的 核心指令。好,我现在已经整理好了这个提示时哈,我直接把它这个粘贴上去 啊,这里面包含了角色定位、改写能力回答限制的那个全套的内容,这个工具他不需要挂在任何插件, 只靠提字词他就能完整的实现改写功能,新手不用复杂的配置,上手没有压力。然后接下来我们到这个中间编排的位置哈,我们设置我们的开场白啊,我们这边是开场白,点开,然后我们这边输入请粘贴 需要改写的文案内容。我们设置完之后,我们右侧的这个智能体的对话框哈,预览这边他会同步展示,好,他这边也会写,你好哎,请粘贴需要改写的文案内容,咱们现在简单测试一下效果,随便复制一段口语化的文字进去, 智能体他会一次性输出多个版本,比如这个文艺治愈风啊,活泼俏皮风,还有简洁有力版,暖心独白版,然后全部都会分开整理好, 我们再试一段这个语序混乱不通顺的这个文字,智能体也会把我们这个语句啊给他去修正哈,然后全程他会保留原文核心的意思,完全贴合我们写的这个改写指令, 再给大家演示一下限制规则的使用哈。比如我现在问一个跟这个无关的问题, 智能体他会统一回复,我仅提供文案的改写,非文案的内容他是无法解答的, 这就是提前设置的边界规则,防止智能体乱达无关的内容。到这里实用的文案改写智能体就全部搭建完成了。然后我们点右上角的发布,做好之后可以直接发布,直接发布到微信、飞书、网页等渠道, 填好发布信息,点击发布就能随时使用。今天这个工具核心功能,粘贴任意文字,一键多风格论色而改写,学到两个核心知识点,第一, 完整智能体提示词写法,包含角色能力、问答边界。第二,纯提示词,无需插件搭建智能体的底层逻辑。今天的实操分享就到这里,感谢观看,我们下期再见!

我去,笑死我了,这个在加班,这个在跑步,还有一个在拉屎,甚至啊,还有一个在沐浴打游戏。而在这里面呢,这个涛肯也变成了餐吧里的咖啡豆, 光这一个设定啊,就想让我试一试这个 ai 牛马团队了。嗨,我是带你学 a 的 李豪,欢迎来到 ai 百科全书,相信大家,龙虾 ai 软件其实用的很多啊,但是一个专为办公人群定制的 ai 助手,让他完全代替我上一天班。来,我们来看一看他到底能做什么。 说真的,这个马维斯的用法实在是太多了,我呢,就根据咱们一天的工作的实际场景来进行了具体的拆分测试呢,全部都是大家实际工作的刚需功能。第一部分,早上工作,哎,各位早上醒来的第一件事是做什么呢?是不来看一看昨晚的最新的资讯,比如说谁谁谁又上热搜了,或者昨天的球赛谁赢了, 又或者是某个科技巨头又发布了什么新模型。那有了这个马维斯呢,你再也不用一个个去查找了,他有一个自动化的任务,就比如说我是个 ai 博主啊, 我呢就设定他每天早上七点钟汇总一下全球以及国内的 ai 科技热点给我。当然你也可以修改成别的资讯啊,大概提示词呢,就是这些啊,你看他给我的科技资讯呢,基本上全部都是一手的, 既简练呢,又完整,毕竟那刚醒来,马上起床洗漱去上班,哪有时间看这些长篇大论,对吧?当然当然,这还没有完, 不知道各位早上有没有听播课的习惯,可以举个手啊。假设咱们有一个非常关注的新闻,就比如说前几天谷歌这真麦的发布会,那新的模型到底强不强,我呢就会直接告诉马维斯,帮我把这个真麦的详细资讯整理成一个音频播课, 我上班路上听,你看,也就洗漱的功夫,他就整理好了,咱们上班路上呢,戴上耳机,边学习边上班。哎,这个比你播课平台里听到音频新鲜太多了, 而且全部都是你最最最关注的且定制化的信息,再也不用早上起来,哎呀,纠结的不知道听哪个播课了是吧?那上班路上呢,咱们也不能让马培斯闲着, 这个马培斯呢,他是支持多端登录的 windows、 mac 电脑啊,手机啊,甚至还能够直接连接微信。因为我们团队呢,有一个工作习惯,就是每周一的早上呢,在微信的工作群里面进行接龙报提。 所以呢,我就会让马维斯帮我整理一下报题,并且分析一下同类型的博主的更新情况,最终整理一个详细的选题的评估报告, 供我们开会的时候使用,你看是不是挺详细的,甚至还有各种推荐指数,这个质量大家可以打几分,再也不用一个个的从这个微信接龙里进行复制了哈。第二个阶段,公司办公,我们来到公司呢,这个马维斯啊,我试了一下,他其实有非常强的这个文念剪辑和这个理解能力。 我呢,去开选举会的时候呢,我就会交代他帮我整理一下这个桌面混乱的文件。各位是做视频的应该都知道啊,咱们平时这个做一条视频,这个文档啊,音频啊,图片啊,甚至 psd 啊,文件一大堆, 又乱又杂。那这个马维斯呢,他不仅可以看懂这个文件的名字,甚至呢,他还可以直接理解这个文件中的具体内容,根据咱们的项目进行分类,大家看一下,你看他整理的,我觉得还是非常不错的,而且我已经非常依赖这个功能了,不然呢,你自己要去整理文件又得花个半小时, 哎,这个效率的提升可真的是不是一点半点。当然不止这些琐事,我们的自媒体的日常创作呢,其实也可以让他全程参与,就比如说我们定了一个选择题,某个 ai 工具的评测, 那我呢,就可以直接交代这个马维斯,让他对这个 ai 工具进行选举的资料收集,甚至可以让他直接调用这个 ai 软件的本地的应用进行测试。最终呢,再根据我的口吻写成一个出稿。我第一次使用的时候,我开头说到的哈,他除了马维斯这个呢,他还有几匹牛马 分管着不同的工作,你看,有人负责调取文件,有人负责整理资料,还有人负责上传,尤其这个办公场景,几批牛马互相搭档,分工协助的感觉真的还挺有意思的, 真的让我有一种我做一人公司的感觉了哈。第三部分,下班办公,不知道有没有朋友跟我一样,越到下班的时候工作越多,甚至老板还要让你汇报, 哎,这个时候咱们可以趁着吃晚饭的时候啊,让马维斯整理一下咱们频道在各个平台的数据,以及调取下我们本地工作的资料,整理成一个当周的汇报的 ppt, 你 看也就几分钟功夫啊,汇报的 ppt, 调研的 pdf, 甚至还有这个图标,基本上全部都有了, 真的太权威了,这个质量大家可以打几分?哦,对了,马维斯呢,我看了一下他的介绍啊,他还支持本地大模型开启隐私模式,就这个文件呢,基本上都不上鱼,绝对可以保证你的资料的保密和安全度。我有的时候经常感觉我这个电脑开机慢,或者网络非常不稳定, 那这个时候呢,马维斯还有个功能,就是他可以直接帮我检查这个电脑的网络设置啊,又或者是不是有什么流氓软件在影响我电脑运行, 你看他就是一个活坨坨的电脑管家,比某数字的电脑管家真的安全太多了。当然还有最后一个功能,我相信人人都能够用的上,因为他真的非常懂我, 比如说咱们泪流一天,晚上睡觉的时候想看个电影或者看本书。那这个时候呢,我就可以让马飞思根据我豆瓣的观影喜好,直接给你推荐 你看他推荐的电影,这个悬疑片啊,科幻片,基本上都是根据我的喜好来的。哎呀,说真的,虽然我也是编导专业毕业的,但是可能因为年纪大了, 那些什么高质量唯美的或者故弄玄虚的电影,我真的有的时候确实看不下去了。我呢,反倒是更喜欢看一架爽炸天的这个爆米花的大电影,不知道有没有朋友和我是一样的感受,所以啊,这个 ai 工具虽然很多,但是真的知己难求啊,马维斯真的是懂我。

以前我们都是用 macdunk 文件做 obsidian 的 主页或者 dashboard, 那 配合 data view js 来显示笔记库里的数据。但这个方法在 ai 智能体时代未免有些落伍,因为它并不能与你的智能体有任何的关联。 我最近使用 codex 为 obsidian 构建了一个智能体操作系统,不光能够实现传统 macdunk 主页的全部功能,一键调用智能体的 skill, 做 deep research, 或者一键拉取最新的学习资料,还能显示我自己 youtube 频道的信息,显示 reddit、 github, rss 订阅等外部信息。还可以一键对知识库进行健康检查,显示知识库内的结构性问题,比如说不倒笔记、原数据的覆盖率和缺失 slide 笔记等等。 那这样的一个智能体操作面板才适合在 ai 时代。作为 obsidian 的 主页 dashboard, 那 最重要的是它还有多种配色可以适配不同的 obsidian 主题皮肤。 今天我就来为大家讲解如何从零开始构建这样一个智能体操作系统,那全程都只需要用提示词向 codex 发送指令,那 codex 会为你完成一切工作。并且不光是 codex, 我 使用 cloud code 转接智普 g l m 五点二也一样能完美实现整个流程,那非常的简单, 整个操作流程和所用到的提示词我都整理成了文档,会一起分享给大家。那首先我来说一下实现原理,这个 dash bar 的 本质上就是 obsidian 的 插件做的,大家不要一听到插件就觉得我也不会写代码呀, 那其实代码都是由智能体来写的,你只需要做好环境的触纸化就可以了。 obsidian 插件的本质就三个文件, main 点 js, style 点 css 和 manifest 点 json。 那 这种级别的编码你甚至压根用不上 superpower 或者 ecc 这种厚重的编程框架。 那么我们第一步就来出示化环境,我们在电脑上新建一个空白文件夹,然后在 codex 中打开这个文件夹,然后开启一个新对话。那这里我们要求 codex 下载 obsidian 官方 github 上提供的插件仓库样例,然后进行 npm 意识到和 npm build 之后,我们要求 codex 安装这两个 skill。 第一个就是大名鼎鼎的 ospec 发布的 front and design skill, 那 这个 skill 是 用来设计界面 ui 样式的,那第二个 skill 则是 obsidian 插件开发 skill, 那 安装好 skill 之后,要求 codex 对 当前项目进行初步化, 并且在 agent 点 m d 中写入项目规则,那听着好像挺麻烦,其实直接用我这段提示词发送给 codex 就 可以了,那并且我直接给了 codex 最高权限,那省的我每一步都要点 yes, 那 codex 执行任务需要一定的时间,我们对视频进行一个加速,那任务执行完毕后,当前项目中就已经具备了必要的环境了。那么接下来就是第二步,创建 ui 界面原型。 我们使用 isopic 官方发布的 frontend design skill, 那 这里我们压根就不需要 cloud 抵赞或者是 open 抵赞这一类厚重的框架,那更不需要 superpower 或者 everything cloud code 这样厚重的框架,那直接要求 codex 用 frontend design skill 创建界面原形就可以了。 你只需要告诉 codex 你 的 dashboard 需要哪些功能,那这里我们猎取一些典型的功能,那比如传统 markdown 主页经常会有的热力图,那再比如放置一些 button 按钮,点击之后呢,可以执行一些任务,比如 deep research 按钮,再比如拉取 rss 订阅按钮, 当然你也可以放一个按钮用来创建日记之类的,那这都是传统 bug 主页会的功能,那还可以放一些数据图标,或者一些文件列表。那我这里用两个功能模块来做个例子,一个是今日的 task, 另一个是 github 最新资讯,那这两个模块比较有代表性,那今日 task 是 传统 markdown 主页里我们经常会展示的内容,而 github 资讯列表则体现了插件的优势,那可以灵活地调用外部脚本或者是智能体的 skill, 那 这是 github js 难以做到的。 那我们把提示词发送给 ctrl x, 让它构建这样一个 dash bar 的 页面,并且在当前项目文件夹下创建一个 prototype 文件夹,把生成的页面保存在这里。那我们来看一下 ctrl x 为我们生成的界面 ui 还是非常不错的。那当然,如果你有不满意的地方,可以反复的要求它修改, 直到修改到你满意为止。这里我要说一下,如果你在网络上看到别人的主页非常好看,想要一比一像素级复制,那我给你推荐一个 skill 叫 image to u s skill, 那 这个 skill 可以 根据你发送的截图进行一比一像素级复制,并为你生成 html 页面, 那我现在展示的这个 html 页面就是用 image to u s skill 复制的,那这个页面就是我在网上看到的一个非常喜欢的样式。 那总之第二个步骤就是让智能体给你画页面,直到你满意为止。那你一定要清楚自己都想要哪些功能啊,需要哪些数据啊,平时会经常使用哪些 skill, 尤其是你在智能体中经常会做哪些事。 就比如我列出的这些,像 deep search, 是 我调查一些最新的 ai 技术的时候会用到的。那后面这两个就是卡帕西的 l m v key 的 skill。 那 我之前的视频中已经讲过了, 大家可以回看我的那期视频。那这两个任务一个是把简藏的资料拆解成 abc 知识笔记保存到知识库里。另一个是对知识库进行健康检查, 看看是否有孤儿笔记死链或者是原数据缺失。那同样我的界面上还会显示我的 youtube 频道信息,那这个是用 y、 t、 d、 l、 p 来获取的。那这个工具我之前也讲过很多次了, 还有显示 rss 订阅数据、 register 和 github 最新资讯的。那这都是我平时学习 ai 的 主要渠道。那当然你不需要一口气把所有的功能都做出来, 你可以先做出第一个页面,然后后续再根据自己的实际的日常需要慢慢往里添加功能。就像我现在所用的 dashboard, 也是我一点一点完善的。那 那么接下来第三步就是让智能体根据页面原型编辑 obsidian 插件。这一步其实最简单,直接告诉 codex 按照 ui 原型编辑插件代码就可以了。那在 codex 完成所有代码任务之后,我们就可以把插件代码复制到 obsidian 库中进行测试了。我们来到 obsidian 文件夹下, 找到第二 abc 这个隐藏文件夹,点进去找到 plug ins 文件夹,在里面创建一个新文件夹,名字就叫做 agent dashboard, 然后把刚才克隆 x 翻译出来的三个文件复制到这里,这三个文件分别是 may 点 s style 点 css 和 mayfast 点 jason。 那 大家如果平时用过 b r e t 插件来安装一些还没有发布到第三方插件市场上的插件的时候,就会很熟悉这三个文件,因为 abc 插件的本质就是这三个文件。 然后我们打开 office, 点按一下 ctrl 加 p, 输入 a 键的代数包了,就能看到打开面板的命令了,那打开之后就能够看到代数包的插件界面了。那么到此我们就完成了插件的初步开发与部署。那接下来就是一步一步完成所有的功能模块。 我们先来看一些简单的操作,比如热力图,那这个是最简单的,那直接告诉 ctrl x 热力图的功能就是显示过去三百六十五天我所创建笔记的热力图分四个档位, 呃,创建一篇笔记,两篇笔记,四篇笔记以及四篇以上笔记,那这个分级呢?你可以自己定义,那当天创建的笔记越多,颜色越深,然后让 codex 实现这个功能就可以了。 我在去年的视频中有教过大家如何用热力图插件编辑 excel gs 代码来实现热力图功能,而现在呢,半年多过去,这一切都可以交给 codex 来处理。 那么我们来看一下效果。我的这个笔记库并不是我自己的私人笔记库,而是我为了做视频单独创建的库,那里面的笔记呢,也都是搭配视频一起分享给大家的,那我们来看一下我这个笔记库的热力 图。那我当前是在 windows 电脑上,因为我最开始是在 windows 电脑上用的比较多,所以笔记分布的比较平均,鼠标悬停在每一个方块上,就能看到当天创建了多少篇笔记。 那么我来到我的苹果 mac 电脑上,那这个 mac 电脑是我前几个月买的,那买来之后我安装到 obsidian, 并且通过 git 拉取了代码库啊,也就是我的笔记库。那所以你能看到五月份这一天,我一次性创建了一百六十一条笔记,那实际上是那天我通过 github 拉取了我的笔记库到 mac 上而已。 那么这个就是热力图功能,至于显示近期修改的笔记,或者显示今日 task, 那 这些功能都太基础了。 obsidian 插件有着原生的 obsidian api, 能够轻松地读取整个 workspace, 并且可以方便地进行笔记的写入和批量处理。你只需要告诉 codex 你 想要什么功能就可以了。那接下来我们来看今天的重点,如何在界面上点击按钮,调用智能体执行任务,那调用 skill 执行任务, 那我们这里我们来讲一个基础知识,大家要对此呢要有所了解,那比如我想要让智能体调用一个 skill 来干活,那正常情况下,我应该在智能体的 ai 对 话窗口让智能体调用某个 skill 做某件事,那就像我刚才让 codex 调用 front 三的 design skill 来画一个页面, 但是我们还有另一种方式能够实现这个操作,那就是命令行,那我们打开 mac 系统的 terminal 命令行,那直接输入这样一个命令, cloud 空格横线 p 空格引号, 使用 front 叉的 design skill 为我设计一个个人 dash bar 页面原型保存在当前文件夹下,然后回车,那这里直接就调用了 cloud code 来执行这个任务, 我们对视频进行一个加速,那可以看到 cloud code 直接调用 skill 为我画了一个 html 页面,那这个和我们之前在 codex 的 ai 对 话框里做的是一样的事情, 那么任务执行完成后,我们来到文件夹中就能就能看到 cloud code 创建的页面了。呃,大家可能平时会听到有些人说他们使用 open code 大 龙虾或者是 hermes agent 来指挥 cloud code 和 codex 做编程任务,那其实本质上就是通过这样的命令行来完成的, 那所以知道了这个原理,我们就能知道在我展示的 data 插件中,是如何能够点击按钮,一键调用智能体来执行任务了。 那么我们就来实现一个简单的功能,在刚才创建的界面中啊,有一个按钮叫 inbox ingest, 也就是资料摄入,那这就是卡帕西的 l l m v key 里面中的 ingest 这个步骤。那我告诉 codex 啊,对这个按钮实现具体的功能,那点击之后, 通过命令行调用 cloud code, 让它对当前 abc 目录中的 inbox 文件夹下的所有资料进行翻译和摘要提取, 整理成中文的 macdunk 笔记,然后把生成的笔记保存到 abc 目录到 codex 编辑代码。实现功能之后,我们把插件文件复制到 plug ins 文件夹中,然后重新加载插件,我们来测试一下这个功能是否好用。 我当前 inbox 文件夹下有一篇文章,那这个文章是谷歌最新发布的有关卡帕西 l m v k 理念的跟进, 那谷歌发布了一个开放知识格式来适配卡帕西的理念,那这个文章我在我的小红书有发过,图文笔记来讲解。那当前我 inbox 的 这篇文章是英文啊,我直接点击按钮,调用智能体来把它翻译并处理,生成中文笔记。 那在智能体执行完成之后,我们就看到 obsidian 根目录下出现了一篇新笔记,那是翻译并提取摘要后的中文笔记。 那么这样以来,我们就实现了调用智能体执行任务这个功能。那么其他类似的功能大家就可以根据自己的实际需要来实现了。那就比如 deep research, 那 我之前的视频讲过,调用的是 notebook lm 的 deep research 功能,也就是通过 skill。 那么最后一种情况就是调用外部的 a p i, 那 这个就更简单了,比如调用 github 的 a p i 来拉取一些最新的项目资讯,那我们只要告诉 qq x 我 们要拉取什么样的资讯, 它就能实现具体的代码了。那比如我现在点击的这个按钮是拉取谷歌和 openai 的 开发者 blog 的 rss 订阅, 那拉取之后呢?写入到 markdown 文件中并打开,那你也可以根据自己的实际需求替换成你想要的 api 或者是 rss 订阅。 那像 github 的 api, 它是免费的,那像 rss 订阅这种呢?也是免费的,那本质上都是调用 api, 那 还有一些收费的 api, 比如推特,那你就需要把你的 api 密钥也告诉 codex, 那么到此所有的功能我们都能够一一实现了。那大家在实现功能的过程中呢,不要太心急,要根据自己的实际需求,一步一步的把它完善,最终呢打造出最适合自己的智能体操作系统,深度集成 obc 和智能体。 比如我之前讲过的卡帕西的 l l m viki, 那 除了刚才的 in just skill 之外,那还有 link skill, 也就是知识库的健康检查。那我的大事报上有一个专门的页面显示健康度评分啊,以及相关的问题,比如孤岛笔记 slide, 还有原数据覆盖率等问题。 那我当前这个笔记库,那不是我的私人笔记库,是我为了专门做视频新建的,这只库并没有详细的去完善原数据和双链等格式,那所以健康度评分比较低。那因为我的笔记里没有加入原数据和双链,因为我的频道的观众并不是所有人都用 oc 里,而 大家自己的私人主知识库一定要好好维护。那最后我想要和大家说,那在智能体时代, autopc 已经是一个必不可少的重要工具。那之前看到卡帕西发布的 l l m v k 理念, 大家总觉得好像是纸上谈兵,是一个空洞的概念。那实际上呢,现在 l l m v k 已经成了主流的理念,就比如我刚才使用的那谷歌的那篇文章,讲的就是谷歌对这个理念的跟进,发布的最新的 markdown 格式标准。 但大家应该清楚的认识到,谷歌的主流技术圈层呢,早就已经在深入的使用 opcd, 把 l l m v k 理念与智能体深度集成,让智能体全面接管我们的私人知识库,那这才是 ai 时代的真正趋势。 那么以上就是今天视频的全部内容了,那视频中所有的操作步骤和提示词以及注意事项我都整理成了知识笔记, 大家可以在我的频道信息中找到我的个人主页,在那里下载笔记,照着笔记中的步骤,你会很轻松的实现这个功能。那大家可以现在就去动手尝试,有任何的问题都可以给我留言,记得点赞关注,谢谢大家。

上一期视频我给大家演示了以 open color 为底座而开发的贾维斯语音助手,然后后台有小伙伴私信说安装完无法唤醒。这里小编就带大家讲部署的全流程走一遍。 首先咱进到这个开源项目中,注意跟以往类似开源项目不同的是,这个项目是多角色助手,且每次只能唤醒一个角色,并且除文本推理外,所有模型均为本地清亮模型。 这里要注意的是,每一个助手对应 open core 中一个独立智能体。这里咱直接复制下面两条命令,创建智能体。 将我预先准备好的提示词投喂给智能体。 接下来我们进入核心步骤, 跟着我的脚步克隆项目到本地,并创建好模型目录, 安装一下所需依赖 创建本地环境变量文件。用你喜欢的文本编辑器打开 enf 和 opencloak json, 在 opencloak json 中将此处的 token 复制粘贴在 enf 的 opencloak gateway token 处即可。 这里注意将 http 端点也配置到 o p e n c l a w。 点 json 的 入口处, 按照文档提示将模型下载到刚才创建的 models 目录,下载完后 models 大 概长这样, 步骤五咱直接略过,一般用不到。将步骤六的两个配套软件下载好,并打开控制中心软件 录入自己的生文,这例小编直接略过。 启动助手准备接受我们的成果。听到嘟的一声后,我们就可以喊出贾维斯了, good day sir, what would you have me do good afternoon sir, the hour is rather more early lunch than midday twelve to twelve sharp at your service what shall we attend to going quiet? sir, 我 搜卡大咖。

贾维斯,我没有马维斯,装一个不行吗?腾讯最近搞了一个二十四小时的员工搭子,我是真管进去了,六个员工呢,各管一个岗位,我最喜欢的还是那个动画交互的页面。首先呢,我先让他帮我把 c 盘清理一下,你看这帮人就开始干活了。他这里呢,也有一个技能的商店,比如说这个自媒体创作内容啊,从全网 八爆款到二创,再到出图和发布啊,一站式给到你,我现在就是要把我在微博里上面一直在用的全平台内容创作的一个 skill 啊交给马维斯,让他去学习一下。这个 skill 呢,我调试了很久,流程是这样子的, 先通过五个维度啊,全网去抓内容以及最新资讯,以及八对标账号的内容,通过十维的审题打分,九十分以下的不要,只要九十分以上,通过我的风格来进行。二创。标题呢,和正文 每一期的风格呢都不一样,比如说开头的八种钩子,正文的几种写法,加上实抄啊,维度升级啊,以及结尾的几十种的随机组合,彻底告别千篇一律的写作风格, 每一篇啊都会让人眼前一样。然后呢,根据各平台的算法和审题的标准,分别输出给我文章,抖音的口播文案,图文比例以及需要配图的环节啊,我接了 g b t emoji 二以及极梦申图。 现在呢,我打算让马维斯学习一下这个 skill, 以后呢,我的每日计划,我就准备在在这里做任务,为什么?因为他每天上线送一千万 talking 呢?兄弟们,这个羊毛不好。

一条视频教会你最新版 ai 智能体搭建教学,本视频共计四十八分钟,一口气把所有按钮详细解读给你,今天给大家录一期兔子的保姆级教程,跟着我就是小白,你也可以搭建一个属于自己的智能体, 那么从哪里开始呢?我们先打开浏览器啊,没有的话给自己电脑上安装一个浏览器 pos 点 c n, 这个啊,记住进去之后这个是最新版的,我给大家看一下主页面,这个是它的一个正常的一个页面, 那么你平时看到的很多工作流是在哪里实现呢?我们在这里右上角,你看这里面有个 pos 编程, 裤子编程啊,这是最新版的,和之前的一点零、二点零不一样,现在是裤子三点零。我们在这里的话,进去你可以看一下 点击商品这个产品啊,右上角产品下面有个裤子编程,我们到裤子编程里来, 这个虽然名字叫扣子编程,是其实你不需要懂编程还是零基础的小白都可以去做。再看这边,进来之后看这边是不是有个 d 代码模式, 你也可以完全不懂代码也可以去实现啊。 d 代码模式,我们看这边这有个 d 代码模式,那么左边的话也有一些像项目管理,这就是你创建的一些各种智能体啊,因为你如果你是新人的话,这里面是空的。 还有就是资源库,这就是你平时看到的各种工作流,包括你的知识库,写作词,我随便打开一个,大家可以看一下 资源库里面就是平时你创建的那些工作流都会在资源库里面实现, 有点卡啊,好,这就是工作流啊,不同的节点组成的,那么把这个工作流封装成智能体,它就会在这个项目开发里面就可以,它就变成了一个智能体,在这里面可以独立使用。 这里还有一些什么各种啊,大家可以看一下,像作品社区还有一些好用的插件, 这些就是官方推出的一些插件啊,像图像生成、语音合成、音乐生成,还有一些生图的,这是插件商店。那么作品社区的话就是一些第三方,包括官方搭建的一些应用啊,就是搭建的创建的一些智能体,你直接可以使用, 那么今天的话我也带着你实操,从哪里开始搭建,从哪里开始去?呃,一步一步的带着你完全的实操啊,零基础的。那么在哪里呢?我们看这里啊, 在这个界面你可能进不来,如果你的页面和我的不一样,我们还是在这里再给大家再讲一下,这是主页,主页的右上角有个商品的产品啊,上面下面有个扣子编程,点击扣子编程,在扣子编程里边 这边你会看到这里有个智能体开发和工作流开发,这两个可以直接进去,或者是右上角看这边是不是还有一个。回到旧版,我先点击这个啊,我先到。回到旧版,你可以看一下,这里面是不是就是我们刚给大家演示的这, 这就是一个旧版,或者是我们刚刚是怎么点呢?产品下面复制编程,复制编程下面有一个 d 代码模式,第一步通过 d 代码模式也可以进去这个页面,然后或者是右上角回到旧版啊,这里有两个方法都可以, 那我们进来之后,下面是选空间,那么你默认的话应该是只有一个个人空间。个人空间?什么是个人空间?空间的话就是在这里你可以创建属于你自己的智能体。 好在这边是不是有个创建,现在我带着你开始创建第一个自己的智能体,点击创建,这里面有个创建智能体。什么是创建应用? 看这边还有个创建应用,那么这个创建应用的话,一般指的是像小程序啊,小程序 app, 这些都属于创建应用。 回个消息, 好,这边是创建智能体,这边是创建应用,应用应用的话像一些网站啊,网页,或者是一些小程序应用啊,都 app 都属于创建应用,那么我们现在要做的是创建这个智能体, 点击创建智能体。在创建智能体这里面,我们比如说给他命个名字,我今天先带着你开始入门啊,入门级的带着你,大家从最简单的我们开始,比如你现在想创建一个纹身图的 纹身图,那么智能体这就是智能体的名称。然后智能体的功能介绍,那么你想怎么描述呢?是不是用文字生成图片, 根据用户提供的文本去生成文本,去生成图片, 这就是它的一个简单的描述。那么空间的话你可以放到自己的个人空间,只有自己可以使用,也有工作空间,但是这个的话好像是需要付费的。 我们下一步这个图标,你这 a p p 啊智能体,你可以把它想成一个 a p p 的 图标,那么这个图标的话,你可以一是自定义上传,或者是直接自动生成,选完之后我们点击确认,进来之后这就是一个智能体的一个页面, 我们可以看到这里有个智能体的一个页面。编排页面啊,分三部分,左边是人设与回复逻辑,右边是编排排版, 最中间这个是编排啊,最右边的话,这里是有一个预览一条式,我们可以在这里正常去使用。如果你这个智能体就是创建,好,好,我们现在看这里 智能体有什么驱动?呃,就是智能体是有什么驱动的?里面是包含的各种工作流,所以我们要先创建一个工作流,点击工作流,这里可以点击加号 创建工作流,工作流的名称说文成图,你会发现这里是不是不能输入只能用字母啊?不能用汉字,那么你可以不懂英文拼音,也可以文成图,这是不是第一个字母 描述是根据用户的,呃,用户输入的文本 需要用工作流生成图片,这是不是它的一个描述,就是你的需求是什么,是不是用户输入文本,然后目的是为了生成图片,所以我们这样就设置一下,进来之后 返回到了一个工作流的一个编程页面。 好,再来一次文生图, 根据用户输入的文版 调用工作流生成图生成图片,我们再试一下。 哎,今天好像不太正常。哎呀,为什么还是没有刷新一下, 有网啊, 好,智能体页面创建工作流文生图,根据用,根据用户输入的文本调用 调用工作流生成文件,点击确定好,这里工作流创建成功了,这一次 如果你和我一样就是会打折的话也没关系,你就重新再建一个就可以了。好,到了工作流页面,你就看到这里有两部分组成,一部分是开始,一部分是结束。这里就是一个工厂的流水线,可以把它给串连起来, 那么工厂的流水线向左边,这里开始我们是不是要给他一个?嗯,可以想象一下,你现在要做一个蛋糕,比如说,那你是不是要给他原材料,然后通过不同的工人加工完之后,到输出到结果 到结束啊?那么纹身图也是一样的,我这里话是不是给它输入纹身图,是不是需要文本文字?然后下一步是干什么呢?下一步是不是找一个员工,员工去干过,这个员工是不是一个美工? 美工,美工干完活是不是?这里的话是不是就是他的一个图片, 他的一个成果,干活的一个成果。图片,从文字到员工到图片,这是他的一个流程。那么这里的话我们是不是要 选一个?谁选一个工人怎么选呢?点击加号,这里面有创建市场,当然这下面也有一些官方的。有时候我现在是找美工,是不是找这个图像生成,根据文字描述或者参考图生成图片 啊?我把它加进,加进了之后,你刚刚可能看到了一个一些大模型了,我把它删掉,带着你来看一下, 哎啊,它是不是每一个的 logo 标志是不一样的啊?像吉梦豆包。 好,我们继续把它们串联起来之后,那么你现在是不是有工人了?开始节点给他一个指令,然后这个是双击,这里插件名字可以改,比如说一号有 讲完之后,那么他是负责做图的,做完之后结果是不是到结束,这就是这样一个简单的一个流程。好,顺便我先把下面的话给大家做一下,最下面这有几个按钮,那第一个是不是一个交互模式,如果你经常用鼠标的话,你就选择鼠标就可以,如果是触控板,你就选择这个触控板, 看自己要看自己的一个需求啊。这边是一个注示,就是你在学习过程中你想添加一个便签啊,它是用来做解释说明的。这边还有一个优化布局,给你进行一个简单的排版, 然后添加节点,这里的话就相当于一个一个市场,像超市一样,你你想做什么菜,你到这里面要选不同的原材料。 ok, 这就是工厂的一个流水线,从下达指令开始自动运行到结果呈现,后面最重要的是什么?是配置,那么我现在要带着你去配置一下。怎么配置?我们从开始开始点击开始看这里, 开始这边有一个输入,有个变量名,变量名是什么意思?叫音符,你不用管它是什么意思,它只是一个代号,比如说它可以叫 x 或者叫 y, 这就是我们数学学的,它只是一个代值。 跑调,跑调没关系,如果你在工,你在运行过程中,那工作流突然关掉了,我们点资源库,资源库里面有工作流, 进来之后看这里它只是一个代值,它不重要。那么我我们现在输的是它是不是提示 你就拼,也可以在这里输入提示词,什么是提示词?就是你的指令,比如说我要干什么,让它生成一张宫崎骏风格的。嗯, 宫崎骏风格的图片。然后人物一个小女孩, 一个小女孩骑着龙在天上飞, ok, 这是不是你的铁质词?他带纸的时候可能是任何的,比如说一道西红柿炒鸡蛋, 它也有可能代指什么,也可能代指别人,这时就是你的一个口令生成一张端午海报。 是不是每一次的指定都不一样?所以这个提示词它只是一个代指,它可能指的是第一个生成一张公历的图片,也可能指的是青红炒鸡蛋,也可能是指的一张端午海报。这是完全是按照你自己的口令来。 好,我们下一步他知道了,他是要输入提示就干活的,指令要传达给这个美工,美工开始干活。我们点开美工 美工这里,你可以看一下他,首先他会选什么?会选大模型,那我用哪个大模型呢?看数字啊,数字越大说明他的就是性能越好,就像手机一样,苹果十五,十六,十七,对吧?好,选完之后这下面是比例,那么你想做一个什么呢?九比十六的还是十六比九? 手机端一般是九比十六啊,不平衡横屏的话就是十六比九。看一些故事类的,电影类的。好,选完之后图片的水印我们不想要,把它关掉, 然后参考图你有没有?如果你有固定的一些风格的参考图,可以放进来,点击加号,可以选择啊,我们没有的话可以不加, 然后输入这里,就连人就输入。那么这个美工现在说了,我要开始干活了啊,你要给我指定我要做什么?你让我画什么图,对不对?那么这个指定是怎么来的?是不是开始的命令,老板给他的指定?点击 好,再看一遍,点击输入旁边的加号,选择开始节点,下面是不是有个提示词?这里就是我们要给他下达的指令,给我生成一张西红柿炒鸡蛋的图,还是一个端午节的海报,或者是宫崎骏风格的一张海报? 好,他接收到指定之后,那么这个指定要干谁?是不是要传达给这个大模型?再点贴日词,这里编辑图像模型,贴日词已生成内容。什么意思?就是我们要把这个指定要告诉给大模型,那么大模型他看不懂你的字,他只能接收到他的一个语言, 它的语言是什么呢? shift 加大括号引用,你看这里是不是我把它删掉?这里是输入提示,比如说我们把提示给填进了,它是黑色, 你看它的格式是什么?是不是两个大括号加变量名,引用,引用啊,这怎么打的?第一步,大写, 首先把键盘切换到大写 b, 而不是按住按住 shift 加大括号 啊,现在知道了啊,我们切换到大写, shift 加大括号,它自动就会弹出来接着词,而且变成了蓝色的。蓝色,蓝色代表什么?是不是代表引用成功 啊?我给你们写的特别详细啊,蓝色的代表饮用成功,这里是不是变成了蓝色的 变量名和饮用的变量名,它们两个是必须保持一致的。如果你上面改成什么?改成一个呃词语,随便啊,做个测试,那改成一个呃拼音,它不能用汉字词语,哎,你会发现下面是不是变了,它变成了,变成了黑色的, 他们两个没有保持一致,但是怎么办呢?一不我们把它删除重新写,或者是你把这个蛋糕里面的删完之后,它会自动就出来了啊,词语,这他们两个是一对应的,要记住这关系好。下面的话我们看这里到结束,这里 结束,这里的话要选谁?是不是美工干完的活要给谁?是不要给选到结束,美工干完的活要给结束,那么我们美工干完的活在哪里?我们点开看一下这个美工干的活,哎,输出, 输出里面有两个,一个 data, 一个是 m s g 啊,我比如说我现在在结束,这里我选配置返回变量,什么意思?就是我干完活是不是要把这个活展示给老板看,那么怎么展示就结束,这里接受到的是一号员工,那么一号员工这里面有两个, 如果你第一次使用的话,包括你后面的学习啊,你都会发现有两个或者是多个,你不知道怎么选,我选第一个还是选第二个啊?这里教大家一个方法,就是单节点测试。 单节点测试 怎么是单节点测试?这个就是一个节点的一个,这个节点的话我们要专门对他自己做一个测试,因为比如说后期的话,可能一个工作流里面有六七十个不同的节点,那么你不可能把它所有的每一次把它们全部运行一遍,对吧?这样一个比较好算力,那么这情况我就直接测试他一个就可以 有一号员工点击这里有个设置键,决定下面有个运行输入,这里面我们可以输入什么呢?就给他一个指令,比如说我看翻第一个生成一个宫崎骏的,把这一个复制输入进去, 生成一个宫崎骏风格的图片啊,点击运行。那么现在这个员工就开始对他一个考核,试一期嘛,我们看他画的图画的怎么样? 那现在咱们看这里试运行中啊, 然后出来了,我们可以看一下啊, 这是它的一个处理的结果,哎,画的还可以啊,一个小女孩骑着龙在天上飞,竖屏,对吧?九比十六的,你可以作为一个手机壁纸都可以。 好,我们重点看哪里?重点看这里,看这里有个输出,每一次输出的结果展示都是在这个输出里面,大家记得重点看这个输出好,输出里面看是不是有两个,一个 data, 一个 m s g, m s g, 提示你是不是运行成功了, success, 它的结果呢?这里有个 data, 我 们点进去看这里,这是不是我们要的图片,你想保存可以保存啊。好,我,我现在是不是知道了, 我现在知道我要的结果是不是这个,这个网址它在 data 里面,那么我现在是配置结束的时候,我应该怎么选?点击结束,我应该选择一号员工下面有个 data, 对 吧? ok, 这等于现在把它配置完了,点击优化布局。还有一个啊,很整齐了, 那么现在整个运行的话,我们点击试运行,你看这里直接出现一个试运行, 让你输入这个功能,就就是运行成功的,就是什么呢?也不说运行成功吧,就等于你配置成功了。如果说你缺一个东西,比如说把这个输入变量删掉,那这里是不是立刻变成了一个橘色,我现在点击试运行,你会发现它会提示你提示什么 错误,列表出现了,结束,里面的变量值不可为空啊,是不是提示你现在有错误?这里没有配置好,点击配置完之后,一号员工选择以 magic 图片 data 啊, 这里面你会发现它这里变成什么后,列表里面变成了打了一勾对号,根本,你现在基本基本的配置完了,具体的运行成功不成功要看你自己了。好,点击试运行,这里面我把这个结果随便再给它一个, 生成一个复制粘贴的代码格式,点击试运行,那么现在的话它就是整个工作流开始运行了,从开始到一号员工再到结束,我们可以看一下, 这里面是虚线,你看这里工作的运行过程中是虚线,那么它运行完之后,它传给谁?是传给结束,我们在结束这里直接可以看结果,这个是和刚刚的图片啊,不太一样,比如穿的衣服了,这个龙的形状都不太一样。 ok, 这是基本的工作流,就是运行成功了。那么这里的话有人会说,比如说这句话,我给豆包是不是给积木都可以去实现,对吧?生活这个是没有问题的,但是什么工作流,工作流,就像我们搭积木一样 啊,搭积木一样就可以去拼,去自己去组装。比如说我这里面有个图片,我下面是不可以再加一个什么视频类的, 对吧?我可以在这里面去添加各种的插件,我把图声视频是不是又可以,我再加一个什么配音的插件,语音合成,我再加一个字幕的,我再加一个背景音乐的,是不是可以把它组装成一个视频,对吧?他就是可控的工作流,把不同的你需要的元素给他添加进来, 最后封装一件,我们可以去做成什么呢?比如说做成一个视频类的,对吧?好,这是就是一个文章,这只是其中一个节点,后面的话我们可以去加什么,带你去添加题日词优化。比如说你说我不会写题日词,看这里 一个宫崎骏风格的图片啊,是人物,是个小女孩,骑着龙在天上飞。那么这是不是写的很简单,我们前面是不是可以加什么呢? 咱们可以加个大模型,对吧?让大模型去优化你的题词,这里是不是也可以?好,这个咱一步一步来啊,后面会带着你去去操作的啊,这是今天的一个最入门的啊,这个是完成了 工作流,基本上一个纹身图的工作流是完成了,那比如说现在是一张,那后面的话我想做多张怎么办?一次生成四张,从四张里面选一张我喜欢的,是不是也可以?那么具体怎么做?一步一步来啊?把这个工作流完成了,我现在点击发布, 发布完之后发布的工作流,看这里是你的工作流资源库。那么刚刚咱建了一个什么?建了,是不是一个一个智能体的格?比如说像这一个文生图的, 这里是刚刷新出来一个纹身图,这里面是空白的,因为我刚刚退出了,所以我可不可以这样点击工作流,这是不是有刚刚我创建的这个工作流, 把它给添加进来,你看这里面是不是把它工作流加到我的这个智能体的这个页面? 好,我们看这个界面,那么左边的话人设有回复逻辑,这里面我其实我就加一句话就可以,就是根据用户的咨询调用工作流回复, 根据用户的咨询调用工作流回复,那么这个工作流,我们在工作流的后面大写 shift, 加大括号,把这个工作流给引用一下,就确保它收到指令。那么现在我可以在下面是不是可以去让它生成什么图片了, 或者刚刚的指定是哪一个根据风格的图片啊?好,我点击这个发送,你看它的右边是不是开始去运行了,开始去调用你的工作流, 包括它的一个深入思考,柔和的线条,自然场景丰富,蓝天白云,有云朵或者是山峦。 啊,现在应该在发图呢,我们等一下。 ok, 有 了,我们可以看一下它的结果, 这是不是给你生成了一张图片?好,我们接着来再看这个界面,那么有人就会说了啊,工作流里面添加了插件,那么我在这里面,我不要工作流,因为我看这里,哎,有什么大模型有插件, 插件里面也有一些,是不是生图类的,对吧?这图像 有一些纹身图,我可不可以在这里面添加,直接运行,这也没问题啊,刚刚是我,我们是不是这样运行的,在工作流,这样确保它必须按照你的流程,这里的话相对它就是没有这个框架,我把工作流可以删除, 我添加插件,这个用的比较少,这里面图像生成比较多,我找一个, 比如这里有个豆包图像生成,把它添加进来, 那么这里的话,你看它就变成了什么,这里这里面没有工作流了,我把它删掉, shift 调用插件恢复,那么这个插件 shift 加大括号,它就出来了啊。我们现在可以运行一下,看 清楚电话记录,输入一个指令生成,你看它会不会调用这个插件, 我们现在是在这里插运行插件,这个插件的话,就比如说你现在工作流,根据你自己的一个需求吧,里面呢如果需要的东西比较多,工作流是比较稳定的,那比如说里面有五六十个复杂的视频内的工作流,里面有五六十、七八十, 那么你不可能在这个页面添加五六十个,那么他运营的时候就不稳定,有些可能调用成功,有些就会调用失败,所以需要用工作流把他们撑住,第一个运行,第二步运行,第三步运行,比较有个明确的,但是你们可以看一下 啊,这个也出来了,看这个插件生成, 这个是不是这个插件生成,你这里面你可以添加任意的东西啊?我带你们看一个工作流, 我们看这个工作流这里面是不是你需要的东西比较多,看看多少 里面有四十九个,那么如果你在这边运营的一些复杂的话,他是不是这四十九个你不可能给他全添加进来,那么即使你把它全全部添加进来,那么运行的时候四十九个的先后顺序他就没那么稳定,这种情况下就需要用到工作流, 工作流是完全按照你的指令来,这就是像你工厂的流水线,一号员工,二号员工,每个人干完的活之后自动传给下一个,最后把结果给你。好,那么我们这里的话是 如果只是一个简单的,对吧?用这种方法是可以的,一般的话我们还都是用工作流添加我们刚刚发布的这个什么这个工作流啊,添加进去, 点击进来之后在这边点一下啊,要用工作流 shift 加大括号,要用工作流回复啊,这是不是一个很简单的一个实现啊?点击发布,跳过直接发布,那这里面这些渠道你自己可以看一下, 都可以在这这些渠道上使用,直接做好点击发布。 好,发布完之后,你现在回到你自己的一个什么个人空间项目开发里,你就可以看到这里面有什么,是不是有一个你创建的智能点 里面有工作流啊?这是第一个啊,带着你发的,那么我们继续延伸啊, 就是这只是我们积木里的一块,把这一块给你,告诉你这一块是什么功能,那么等你后面学的多了,把不同块把它们拼装起来,就可以根据你自己的需求自己去处理反弹。好,我们继续。 那么下一步的话我带着你。比如说一次生成多张图片,你会用到不同的插件,你一些重复性的工作,你会用到一些像什么循环,一些 p 处理,那不同的节点它怎么使用?就像这里有 p 处理的,或者是一些 横向生成的质量提升的,是不是有不同的插件?好,我们接着来,现在还是回到这个界面,你现在第二步,第二次运行的话,可能就比简单一点了,大概方向知道了。好,我们在这里项目开发创建。 第二,刚刚是纹身图,那么你多张或批量 批量完成,这里面会带你使用一个不同的,再教你一个积木啊,再给你一个把它的功能,比如说竖的、横的、方的,对吧?五角星的,然后 l 型的,就像我们玩俄罗斯方块一样,对吧?你自己可以去学会拼了, 这个是根据用户输入的格式,一键生成多项图片,这就是批量处理,处理工作。 好, ok, 我 们确认,然后继续,但是带着你由浅入深的,完全是小白级的都可以。 批量。纹身图是不是还是工作流?点击加号,然后创建工作流。工作流的名称什么?是不是?呃,批量 来一张图?好,我看比较简单啊,自己知道就行了啊,名字随便起不重要。根据工作流的描述大概的需求,是不是就根据用户输入的什么文本,一次生成 生成多张图片, 大概你明白它的意思就可以了。好,我们点击确认,进来之后还是熟悉的页面啊,开始,那么这里你就可以,是不是这里还是什么输入,指定 输入,指定 整个图片,这是不是图片展示结果?好,下面你要要找人了啊,再次找谁呢?是不是要换?还是同样生成的话,你会发现,哎,它是不是只能一张, 这个只能做一张,那么我们现在要做什么呢?这里面连起来之后看这里,鼠标放到这里有个虚线 变色了,放到这里之后鼠标一点它就会断开。 ok, 那 么现在我要找一个节点,我们找一个什么呢?找一个业务逻辑里面,业务逻辑里面比如有个循环,你要放到循环这里, 用于通过设定循环次数和逻辑同步执行一系列任务。下面这些功能比较多,然后陆续的话会带着你去使用不同的, 我们看这里是不是和其他的不一样。循环下面有个循环体,哎,我把它删掉再看一下啊,循环是不是有两个?一个循环带了一个尾巴,一个循环体, 你可以这样想,你现在老板下达了指令给这人,把它想成一个什么呢?想成一个主管, 主管他是不是要分发,分发工作,审审核结果? 这样的话你就更容易理解,啥意思呢?就是指定给到主管,主管安排下面的人去工作,工作干完之后他是不是要审核下来?转转转就是一个循环体,这里话 你把它想成什么?想成一个办公室,这个员工坐到这个办公室里,我们可以把它拖进来, 或者是把它,你看这里还可以点击这三个点,移出此话步,是不是还可以把它移出来,或者是你什么呢?在这里点击两个点加号,选择把它们给拉进了。 ok, 这一步看到了, 是不是把这个员工给放到这个办公室里面去,专门的去工作, 工作一张是不是给老板工作一张给老板审核,审核完之后把结果再拿出来,有这样一个逻辑,你可以理解一下。 好,我们看开始这里,比如你现在下达指令给到主管,那么主管这里,你看一下主管这里是怎么运行的,他的一个逻辑是什么?点进来之后这有个循环设置, 重复执行一系列任务,有数组循环,有指定循环,还有一个无限循环,那么这就是你运行的不同的使用场景,那么你选择的是不一样的。我给大家简单的解释一下, 比如说数组循环什么意思?就是你现在要生成一个成语故事的视频,要写脚本,那么这个成语故事是五个脚本还是六个还是七个,他到时候会给你变成一组传给你,可能七个,可能八个不确定。 或者是你编写一个故事,一个短句,那么这个短句的剧本是十句、二十二、二十段,十三个分镜,二十五个分镜。确定,那么这就用到数组 指定次数的话,我指定看,你给我运行四次,这个美工你给我只做四次,我给你一个指令,你给我画四张图,只画四张啊,四张之后我去审核,那么这的次数是不是你固定的? 好,我们接着看。这还有一个无限循环图。什么是无限呢?就是这个员工你给我不停的干,你干到什么?有一个结果让我满意, 这个是也是看场景,比如说视频生成累了,那么这个视频生成你的视频的长短不一样,你可能是三十秒,它可能是一分钟,那么我们不确定它会循环多久, 这时候我们会选择无限循环,那么会有,但是无限循环会有一个结果,什么时候停,等他触发到这个结果,他就可以停了,所以无限循环要给他加个结果。比如说我拿到了一个生成的一个 mp 四格式的一个文件, 我拿到这个文件我就可以终止循环,对吧?所以给无限循环是可以加条件的,那个时候就会用到无限循环,你确定什么时候生成这个视频? ok, 我 们现在开始考试啊,我这节课刚说了,我给你,就让你给你一个指定,你给我画四张图,四张里面我自己挑,满意, ok, 点击主管, 主管已经安排了啊,循环四次啊,那么这美工还接收到信号了,选择一个大模型开始工作,比例,如果老板说是九比十六,我就选九比十六, 三米四的话,我也可以根据老板的要求,图片水印关掉,图像生成数量啊,这个你不用管,这是他默认的值,就是一,这是默认的, 你选这个没有用。三个图,你有没有固定的风格,比如说你刚刚生成的一张图,感觉喜欢这个风格,你把这个风格放到三个图里来 啊,你也可以不加,点击输入,再输入,这里还有接收的信号,看接收谁的信号。你不能是直接从老板这里来,你等于是跳级了,不能就跨级啊,你是不是要按照老板的要求,所以这里你选老板就可以,老板让你干啥你就干啥, 怎么着?老板说,哎呀,我要接触到信号呀,我接触到谁,老板说,我要接触到是谁,我要接触到。开始大老板,主管说,啊,我要接触到老板给我的指令,把音库 也可以改成提示词啊,为了你自己明白好,他接受到信号了,哎,但是刚刚我们给美工已经安排了,美工这里接受的这个信号是不是他改了,看一下接受到谁,主管下面的提示词,这里往这一置就可以, 这里面重新点击加号,我们重新来看一下,选择主管,主管下面是不是提示词,行,改名字, 这样他就老板的指令传给主管,主管接收到老板给的指令,那么他要下发给美工,美工这里接收到主管的提示指令,这里 shift 加大括号,引用主管的提示词, 就可以开始去画图了。他画的图结果在我们刚刚上一次看了,在这 data 里面,那么这里面我选谁?是不是选 data 书里面选择美工的,美工画的图给主管,主管再给谁?是不是给结束,结束,这里是不是应该选择主管, 你不能选美工了,不能跳级。好,我们在这里面简单的配置,完了我再做一遍啊。开始是主,呃,老板下达了指令, 老板给主管,主管接收到信号之后开始安排美工去干活,美工从老板那里拿来了指令,开始去画图,画完图之后把结果给主管, 那么主管这里就开始拿到了美工的图片,开始去给老板去交差,所以这里应该选择最后是主管的结 alt put, alt put 就 输入这里的话,你不用管这英语什么意思,它就是一个结果的呈现,如果你不知道的话,最简单的事联系了之后去试运行,如果有错的话,我们就可以改嘛。好,试一下。 刚刚给他一个指令啊,那么是我现在给他改成什么了?改成一个,嗯,中国现代都市美女, 都市美女,然后在街上逛街啊,在摆摊铺,家里。 这句话就像一个提示词的书写,如果你不会写的话,就加大模型,让大模型去给你去写。也就常见的他有人物,有地点,那么比如他的衣服场景就是可以做详细的描述,先穿白色, 白色连衣裙,然后头带带一个粉色的太阳帽, 嗯,这个人物是长发还是短发?短发,比如他的头发什么颜色?紫色头发,然后你就可以把你的要求提细一点啊,手里,手里拿着手机, 手里拿着手机,对着镜头微笑自拍, 海浪在不远处,哎,这是不是一个很简单的一个描述,人物形象,到场景,对吧?到地点全都有了,我现在就开始让这个美工去画图,好,点击试运行, 这是不是它的一个指定,指定传给谁?传给主管,主管开始直接安排给美工了。美工现在是不是要画第一张了? 好,第一张画完了,看这里,白玉了,短发,白色连衣裙,然后不戴太阳帽,紫色头发,拿着手机自拍, 旁边是海浪,是不是这个人物就非常好看?包括光影,是不是还可以?这是美国画的第一张图,我们接着看第二张, 第二张短发,那衣服啊,第三张、第四张也都画好了,那同样的太阳帽是不是?呃,不一样的, 这个是从后面自拍的,这个是横横屏自拍,还可以吧?怎么样?效果, 这只是其中的一部分啊。工作流就是根据你自己的需求,我们比如说你现在做一个视频类的, 你要先写文案,那么文案是有大模型,对吧?大模型去写文案,去写贴纸,写运镜,写好之后给美工去做图,美工做好之后再给视频,视频拿到之后再给剪辑,剪辑在下面会加什么?会加一些 bgm, 再加一些什么字幕, 对吧?这是一步一步的,他就可以把它合成一个视频。咱们现在是分阶段带着你了解某一个节点,一个一个的啊,我们这一次讲的主要是这个循环的使用,就是一次可以批处理工作 到结果这里啊,点击发布, 发布完之后,那这里面把它添加进左上角,是根据根据用户 咨询调用工作流,回复工作流, shift 加大括号,切换到大写 饮用,这边就可以调用它了,一次就可以按照你的需求,比如说一个生态几张图,我们刚刚是中国现代,那么现在我们再测试一下 中国,嗯,动的美女 在什么清明上河园逛街在清明上河,清明上河园场景 新的,这什么这逛街吗?看新的形状。 ok, 我 们可以随便吧啊,看看它是不是整个就后台给你运行了, 后面的话它带着你一点一点的去做延伸啊,后面可能会加大模型,对吧?加上不同的处理工具,不同的插件,不同的节点,最后你可以举一反三的去做。啊啊, 四张图可能会慢一点, 已调用,已调用说明已经完成了第一章,第二章,第三章,第四章。 ok, 这里可以这样看一下 第一章, 是不是因为我没写什么,是不是真人的或者写实的,它生成的时候看的还是有一点假的,但是场景还可以。 好,这就是基本完成了,可以发,也可以不发,要看自己的一个一个需求,你在你的这个, 自己的这个项目开发里面都可以看得到你的文件。 ok, 那 么这一期就先到这啊。

你的工作软件不再需要 api 了,因为 ai 已经学会了像人类一样直接点开它。准备好迎接你的第一批数字员工了吗?欢迎正在收听的你,今天我们的这次深度拆解哦,非常有意思,这里是 daps。 是 的, 大家好,我们今天,嗯,不了那些停留在表面的泛泛而谈。没错,我们今天的任务是要深度拆解一份来自前沿圈子的真实操作指南,还有一份非常深度的技术分析报告。其实 很多人现在依然把 ai 当成一个呃,极其聪明的打字机,对,就是那种只要你在对话框里输入问题,它就给你吐出一堆字的东西。没错,但是这种看法完全忽略了二零二六年四月发生的那个历史转折点, 也就是 open ai codex 的 最新动作。所以我们今天这场深浅的终极目标,就是要透过这些动作,从第一性原理、商业战略到产业改革,带你看懂一场正在发生的生产力革命,就是要让大家明白,为什么未来的核心竞争力 不再仅仅是你个人有多努力,而是呃,你拥有多强大的系统。那我们从第一性原理开始聊起,你可以向大家提一个直击灵魂的问题,就是传统 ai 时代的叉 gpt, 它到底是什么?我们回想一下日常的使用场景啊, 不管是写邮件还是写代码,它的本质永远是呃输入,然后思考,最后输出这么一个单线的模式。对,就是一个你问我答的模式。没错,我们可以打个生动的比方, 叉 gbt 就 像是一个全世界顶级的咨询顾问,你问他怎么做一顿完美的法式大餐,他能给你一份精确到克数的完美菜谱,甚至能告诉你每一步先放什么,后放什么,火候怎么掌握。但是, 这个高薪顾问,他绝对不会替你走进厨房,拿起刀切菜或者帮你去开火。也就是说,无论菜谱多好,用户永远必须亲自去执行。没错, 这在底层逻辑上就注定了,传统 ai 只是顾问,而非员工。顾问和员工这两个字的差别其实非常大。对,所以这引出了我们今天要推导的一个核心概念,什么是真正的革命?我们要解释一个词, agent, 也就是智能体。这个词最近太火了,但到底什么才是智能体?这可不是一个简单的产犬功能升级吧?完全不是。 agent 代表着 ai 从资讯模式正式跨越到了执行模式, 也就是说,执行型 ai 具备了手和脚,具备了手和脚,也就是它能自己去操作了。那资料里提到的自主工作流, autonomous workflow 又怎么解释? 自主工作流的意思是, ai 能够根据你给定的一个最终目标,自己去编排中间的所有步骤, 不需要你一步步下达指令。呃,就比如说,我说帮我把今天的报表做了,它就会自己去想,第一步该干嘛,第二步该干嘛。对的。而支撑这一切的底层能力叫 computer use, 也就是计算机使用能力。 这代表着 ai 夺取了控制图形界面的权力。图形界面,也就是我们人眼看到的电脑屏幕,对吧?是的, 当 ai 有 了手脚,能自己编排工作,还能看懂并操作屏幕,它在商业测的终极体现就是数字员工,或者叫 ai operator。 这听起来非常科幻,但它已经落地了。 所以, codex 的 出现,标志的 ai 第一次真正拉开椅子坐在了你的工作桌前。没错,以前是人坐在电脑前,现在是 ai 坐在哪里帮你干活儿。 但这里肯定有人会提出一个很犀利的疑问了,过去我们也有各种自动化脚本呐,甚至大企业里用了好几年的 rpa, 也就是机器人流程自动化。呃,这确实是个好问题。对啊,现在的 codax 到底和以前的 rpa 有 什么根本区别? 以前的痛点不就是 ai 负责回答人或者死板的城区去执行吗?现在的范式转移就在于, ai 不 仅负责回答它还要负责执行。 你看啊,以前的 rpa 是 非常脆弱的。脆弱?怎么理解?比如你用 rpa 写了一个抓取网页数据的脚本, 只要那个网页上的按钮往下移动了十个像素,或者突然弹出一个广告弹窗,这个脚本立马就崩溃了,因为它只会死板地记住那个坐标,完全正确。但是, codex 的 执行能力在系统论理意义完全不同。 他现在能自主打开网页,如果看到弹窗,他知道去点右上角的那个查号,把它关掉。哇,他能看懂,那是广告。 对,他不仅能点击按钮填写表格,还能自主去下载文件,然后把它上传到另一个系统,甚至根据这些数据发送邮件。也就是说,他包含了读取网页、整理数据,甚至跨软件协作去完成多步骤任务的能力。没错,为什么说这是历史性的关键节点呢? 因为以前的软件必须得留出 api, 也就是应用程序接口,才能让两个程序进行对话。但是大部分老旧的系统根本没有 api 啊。对,但现在 ai 直接用人类的界面,也就是 g y 去工作, 这意味着全天下所有没有 api 的 老旧软件企业内部系统瞬间全被强行接入了 ai 时代。只要人在屏幕上能操作的 ai 现在就能操作了。 这真是个颠覆性的概念。这让我想到大家的一个中间勾子。呃,什么勾子?就是,如果你以为 codex 只是个给程序员写代码的工具, 那你绝对错过了这个时代最大的红利。确实,这是一个非常普遍的误解,大众觉得 codex 不 就是个代码助手吗? 但实际上它正在变成桌面操作系统上的万能 ai 员工。我们具体描述一下这个场景吧。 ai 控制电脑,这到底意味着什么?这意味着它不仅仅是一个写代码的窗口了,它有自己内置的浏览器,有长期记忆,最重要的是它能并行处理多个任务等等。 它在我的电脑上操作鼠标,不会影响我正常工作吗?如果它控制了浏览器或者软件,我还能干活吗?这是一个很好的问题。 其实现在很多商业场景下,它是在虚拟环境或者后台静默运行的,它不会像个幽灵一样强夺你的物力鼠标。明白,那我们拿一个极具代表性的商业场景来展开讲讲吧。 比如跨境电商圈子里那些真实的玩法,阿玛总运营绝对是一个最经典的例子,我们可以看看 codex 是 如何重构这种日常工作的。呃,比如在广告分析这块儿, 过去运营人员可能每天要花几个小时去下载各种报表,然后放到 excel 里做透视表。对,非常机械。现在呢,它可以替你去提取财务报表。在客服管理中,它可以自动清理收件箱,管理邮件,还有库存管理、数据监控、竞品监控,甚至团队协通。 比如,它能自动总结会议纪要,发到 notion 里。没错儿,在这里,我们需要清晰界定一个边界,哪些工作会被撤离自动化呢?就是那些重复性的、基于规则的、不需要太多情感共鸣的工作,目前还是需要人类的介入的,对吧?是的, ai 现在主要是帮你把那些最耗时、最繁琐的脏活儿、累活儿干完。聊到这里,我们其实正在进入一个关于 ai 技术演进的宏大序幕。这不仅仅是一个产品的功能介绍。对, 这其实是硅谷最顶尖的科技巨头之间一场深刻的路线之争。我们可以对比一下这四家公司, openai、 antropic、 google 还有 microsoft。 他们对 agent 的 理解似乎出现了分歧。尤其是 open ai 和 entropic 之间,可以说是两条截然不同的技术路线。我们先深度剖析一下 entropic 的 路线吧,也就是 cloud 背后的那家公司。他们的路线好像更偏向于协议和接口,对 entropic 极度依赖 m、 c p, 也就是模型上下文协议。他们的思路是去建立一个庞大的插件生态, 通过结构化的调用和工具连接来实现自动化。听起来有点像搭积木。没错,它们的假设前提是全世界的软件厂商都会积极配合 ai 去借力一套标准的接口, 也就是全盘 api 化。那 open ai 的 路线呢?刚才我们提到过,他们主攻的是 computer use, 对 open ai 的 路线更偏向于视觉识别和 gui 操作,也就是完全模拟人类的行为。这听起来有点像个野蛮人呢。这个比喻很恰当, open ai 就是 个野蛮人,它根本不需要软件厂商配合,它不需要你提供标准的卸货码头,它直接看屏幕动鼠标。呃,但这两种模式肯定各有优劣吧。 我觉得 entropic 这种结构化调用的路线听起来非常严谨,是不是更适合企业级的那种严肃的知识工作?完全正确, entropic 的 路线非常精准,不会出现点错按钮的低级失误。 但它的缺陷也极其明显,就是它太依赖生态的配合了,人家不开放接口,你就进不去。那 openai 的 这个野蛮人路线是不是非常适合个人,而且更容易规模化?毕竟可以直接控制无数没有 api 的 旧系统?没错, 这就是为什么 openai 的 路线现在看起来极具破坏力。那这也就引出了一个深入商业战略层面的疑问了, 为什么现在的大模型,比如 gpt 最新的版本已经越来越聪明了,但 openai 却觉得还远远不够,因为大脑发育的太快了,但身体没有跟上。呃,他们最近在欢欢疯狂买什么团队?我看到资料里提到了二零二五年的一笔关键收获。对,这就是内幕所在。 二零二五年十月, openai 收购了一家名叫 software applications incorporated 的 十二人小团队。一个只有十几个人的团队,为什么能被 openai 看中?因为这个团队的背景非常惊人, 他们曾是主导苹果系统里那个强大的 apple shortcuts, 也就是快捷指令以及 safari 浏览器核心开发的班底。哇哦, apple shortcuts, 那 可是消费级系统自动化的天花板了。是的,这里我们要拆解一下这背后的系统论。 我们说 ai 的 大脑,也就是大模型神经系统就是它的多模态感知能力,能听能看。那执行系统和工具系统呢?执行系统就是刚才说的控制鼠标键盘的能力,而工具系统就是各种现成的软件, 这四个系统必须完美结合。我明白了,所以他们收购这个团队是为了解决系统底层的执行问题。 难怪 codex 的 鼠标移动现在不会像机器人那样僵硬。没错,而且这也是为什么它能在后台流畅运行,不强弱用户的屏幕焦点的核心原因。这推导出了一个极其关键的结论啊,未来 ai 的 竞争已经不再是单纯的参数规模或者模型有多聪明的竞争了。绝对不是, 未来的竞争,是系统集成能力以及 o s, 也就是操作系统底层控制权的竞争。谁掌握了系统的执行控制权,谁就真正主导了用户的桌面。那接下来我们要给听众上正餐了。对,接下来这段就是你的数字员工真正上班的样子。 呃,我们要把刚才提到的那个阿玛宗电商运营的例子拿出来进行教科书级别的流疏拆解。对,让完全不懂 ai 的 听众也能切身体会到工作流被彻底重构的这种震撼。嗯,我们先看场景一,广告运营。广告运营在过去是非常枯燥的, 现在 codex 可以 每天在后台自动并且静默地登录,去下载 gmail 邮箱里的各种广告报表。这个不需要写 python 脚本儿吗?完全不需要,你可以用纯中文的自然语言给它下指令。它不仅能下载报表,还能自动分析里面的数据。 比如找出那些所谓的高点击零转化的吞金兽。对,它能自动帮你找出这些吞金兽,然后直接生成否定词清单,防止你继续烧冤枉钱啊。那如果是表现很好的词呢?它可以找出那些 d, a, c, o, s, 也就是转化成本极低的词, 自动生成一套加价的建议,然后甚至自己去后台调成竞价。这完全是个资深优化师在干的活儿啊。 那场景二呢?关键词运营这块儿,它是怎么介入的?关键词运营需要交叉对比大量的数据, ai 可以 把过去三个月的数据和今天的报表结合起来,自动寻找那些还没有被对手发现的蓝海词和机会词。人眼看那么多表格早就麻木了,但 ai 不 会。 那场景三呢?这可能是我最讨厌的工作了,写运营日报,哈哈,这个确实,你只需要设定一个定时任务, ai 就 会每天在固定的时间自动汇总所有的流量转化花费数据还能自己排榜吗?当然,它可以自动分析今天数据波动的原因,然后生成一份 markdown 格式的高颜值的日报,直接自动发送给老板或者团队群里。这简直了,早上一杯咖啡的时间,工作就做完了 最后一个场景了,竞品监控。竞品监控以前可是要专门的人去死盯着的,现在 ai 可以 七成二十四小时不间断地模拟人类浏览器的行为,它可以盯着什么?它可以去监控竞争对手的价格有没有降,排名是升了还是跌了?最新的一星差评写了什么? 甚至他们的广告位置有什么变化,只要有异动,就立刻报警反馈,对吧?而且我们要强调一下,这一套打出如此复杂组合拳的数字影工,成本是多少?成本极低, 这才是最恐怖的地方,你每个月可能只需要支付二十美元左右的订阅费。我的天,一个人配厚这套系统就能撑起过去一个微型项目组的工作量。确实是这样,这就引出了我们结束前的一个关键勾子,把技术落地到每个人最关心的命硬上。 当 codex 能在一分钟内做完一个资深运营一天的工作,到底谁会被淘汰?我们不能只是盲目的恐慌。所谓失业, 我们需要冷静客观的从组织架构的三个层级来进行分析。好,首先是处于金字塔底座的执行层,也就是那些单纯的搬砖者,每天只是在各个表格之间拖拽数据,搬运信誓的人。 很残酷地说,这一部分岗位必然会被无情替代,因为这些动作正是现在 kodaks 最擅长、成本最低的。那第二个层级,管理层呢?管理层必须要经历痛苦的升级。过去你的价值在于你能管理好几个人,雷下属, 安抚他们的情绪,分配任务。未来呢?未来你要从管理人变成管理 ai, 你 要懂得如何分配算力,如何审核 ai 产出的策略质量,也就是说,中层管理者的能力模型完全变了,那最顶层的老板层呢?老板层,或者说企业主 面临的是重塑公司架构的挑战。当你可以用极低的成本组建一支 ai 大 军时,你的历任模型和业务边界必须要重新设计。呃,这也结识了这个时代的残酷与机遇并存。 我们可以很明确地说,未来最值钱的人,绝对不是那些熟练使用某种特定工具的人。为什么?因为工具现在已经学会自己使用自己了。对,未来真正的核心人才是系统设计者、规则制定者以及工作流的架构师。没错,就是那些能够用纯中文的自然语言, 把复杂的业务逻辑非常清晰准确地喂给 ai 的 人。这就到了我们要为听众进行权威终极推演的时候了。从工具使用者到系统操盘手,我们对比一下过去和未来。 在过去,一个人就是干一份工作,大家在公司里拼的是加班体,拼的是体力极限,谁能熬夜谁就牛。但未来完全不同了,未来是一个人管理十个甚至上百个 ai 员工, 未来的竞争比拼的是你的个人操作系统,还有你的系统调配能力。这就是所谓的 ai 工作流、数字团队和智能体组织。总结起来, codex 这一次真正改变的,绝不仅仅是单纯的软件开发或者什么电商运营、广告投放,而是什么,而是人类历史上第一次, 普通人也真正拥有了一支能够全天候自主工作的数字员工团队。这句话真的非常震撼,也是我们想象正在收听的你抛出的最终洞察未来的社会最大的财富差距可能根本不在源于你促使资金的差距,也不在于谁每天比别人多工作那几个小时。是的, 这种鸿沟将来源于谁更早地学会并构建了自己的 ai 团队。当别人还在亲手苦哈哈地做 excel 表格时,你的 ai 大 军已经悄声无息地帮你完成了市场的收割。 这种降维打击是非常致命的,所以,面对这种浪潮,你准备好应对了吗?气束眼睛的速度往往比我们大部分人想象的要快得多。在这个时代,停止焦虑最好的方法其实就是 立刻行动起来,比如今晚就开始构建你的第一个数字员工。对,非常感谢大家今天陪伴我们一起进行了这次深度的探讨。 如果这些深浅对你有所启发,请一定要点赞留言加分享!在留言区告诉我们,你最想让 ai 员工帮你接管哪项工作。哎,也别忘了关注我们!没错,欢迎关注我们的频道 daps, 你可以立刻打开小红书抖音,搜索 d a p p s 那 里后,今天我们提到的所有干货,我们在那边为你准备了本期深浅的完整规则提示词,还有详细的自动化配置指导。去领取你的第一位数字员工吧,我们下期见!

现在各位在这个产品当中可以看到,呃它其实有几个大的大的板块,一个是对话,一个是这个一对对话服务的这个四人体的四人体的市场以及一个画布。 现在智能体市场内现在已经有差不多一百零几个这样的一个智能体,这每一个智能体的功能啊,他就是为了两个目的,一个是让每个人都能够便捷的知道在什么地方可以用到这样一个半智能体,以及就是现在各位也看到很多这样的一些宣传也好,文章也好, 呃,有时候说的这个呃会给人带来一些焦虑,但实际上我们每天都在做的事情,我们也知道很清楚知道这些智能体的功能边界,所以我们把它做成了这个呃,面向于每个 办公场景具体的具体的一个一个每一个环节的这样一个呃智能区,就是为了告诉大家这个智能区它能到到底能够解决什么问题,呃所以它每一个功能都是为了具体的办公场景而设计,我们我们的目标其实是希望就是呃我我认为这整个整个的就是这个 ai 的 一个, 这个就是对于生产力办公带来的一个这个变更,他其实是一个渐进的一个改变,他不是说就是一上来就能够把这个原有的生产力也好,组织关系也好,就就有个天翻覆地的变化。所以他其实是首先他是会帮助每个人提升自己的呃现有工作的一个效率, 然后呢再更进一步,它会逐渐放大每个人的能力,呃最终可以让这个使用者,呃这个本身可以变成一个,就所谓现在一个超级个体,呃我们产品本身它是呃具备这个多 多对话的这样一个能力,就是说你可以同时开启多个任务,在多个任务当中每个任务彼此之间是互相不干扰,然后可以同时呃去执行三到四个,就是说这样的一个,并发行这样的一个, 就是呃就是一个任务的一个流程,待会顺利会给各位介绍一个,就是说这个面向于法律这样的一个场景下的,呃具体的这样的一个场景当中的一个使用。那我想跟各位讲一个很具体的一点,就是呃之前也各位提到过,就是说我们跟一些其他大互联公司的产品 当中的一个区别,就在于呃我们的产品它本身它不是一个就是为了一种通用型的这样的一个产品,就是 如果它只是用来就是呃向大家去用豆包啊,或者说是网页版的 dipstick 这种,这这也不是我们的目标,就我们的 向各位提供的这样一个法律,法律这方面的这个整体当中它是包括两个大的一个层级,第一个层级叫我们说就是基座型, 就基座型它是包括了就是呃去查询现有的法律法规以及这个呃类似案件的这样一个调研。这这个我们每个功能的背后是直接连接到了,就是说这个,比如说比较权威的就是像这个裁判文书的这样的这数据库, 就是每一个呃信息的来源,它都是可以追溯到源头的。而且我们在这边呃就是增加了一些,就是所谓一个防幻觉的一个智能型, 就是哪怕这个不管说是对方的其他人的这个引用的这个法律条文,或者说呃,我们金牛这个整体产生的这个法律条文,就是说这个这个一些文书,你都可以用这个防幻觉的这个这一起呃,可以给他进行一点进行一些核对,他可以查询到里面的这个 这个所引用的这个案具,案具啊这种具体的一些东西,它是否是杜鹃,就是我们这里面做了一些很多的这种防范级的一些一些这个设置,以及做了这个呃非常多的就是边界约束,那是为了保证它每一个这个问答,在 这个呃,以及包括在显示当中的这个引用的所有的数据,它都是真实的,就是可追溯不断的这种状态啊。我们就整体的 使用场景,就甚至于说当当呃,当你用到一定程度的时候,你可以用它来创作一些,就是自己的一些,就是说程序或者说应用,它都是可以去做到的。那接下来的话就是请顺利具体介绍一下我们这个, 嗯产品的一些这个具体使用的一些功能。因为我们这是企业账号嘛,企业账号的话就是可以管理员充值,然后所有的账号都共用,然后以及企业管理员的后台你也是可以看到,就是每一个账号的他的一个呃,他的使用情况他都是可以看得到的。那我这一发先过, 然后我们智能体的一个使用方式,你可以看到刚才就是你,你上传好对应的激活码之后,你放到账户,然后点击呃,嗯,把字母码放进去连接一下就可以使用了,然后账户的上面呢就是你当前的一些余额, 呃,当前余额你如果你后面管理员充值的话,也可以直接在这个账户余额这边就是有个账户充值,这边充值,那你这边的充值的话就每个人都可以用的。然后账户下面它是有一个用量统计,用量统计也是就是这个激活码下面的就是你目前就是呃用的一些 基本的消耗情况,就是在这。然后我们整个智能体呢,它其实主要分为两大块,一个是对话,一个是画布, 对话呢就是主要处理一些文字型的一些内容,然后也但是也可以批量出图出视频,呃,都是可以的。然后技能呢?技能其实就是刚才您所分享的,就是里面就是包装好的一个个智能体,就是你直接去安装就可以使用, 然后画布,画布主要就是尽量出不出视频,因为这个你们可能就是不会,呃,就是你们可能需求不是特别大,所以我这次就是先先不讲了。然后就是后面你要看的话,就可以这边有两个快速上手,可以简单的看一下。然后我来主要是讲就是对话和技能这两段话,就是对你们就是比较实用。然后首先 呃对话和技能是怎么使用呢?就比如说你们是呃主要是法律,就和法律有关的,那这上面你可以看到有很多的这种技能了,就是你要先进来的时候,可以先把你想要的一些这样的一个技能都安装上,就点击点击一下点安装,你可以先把法律有关的都安装上, 其他的一些智能级的一些技能,比如说做自媒体,就是有兴趣的话也都可以安装去体验。然后这安装的安装的话是我们的第一步,然后这边安装了之后,让那我们后面其实也是要调用调用这里面的一些技能去使用的。所以我们来到这个对话,这个对话他的操作是怎么样的?对话你点击对话之后, 呃,这边有个对话和远程控制定时任务。我们先讲讲第一个对话,那这里有个加号,点击加号就是绑定你本地的一个文件夹, 就随便绑定一个文件夹都可以。然后绑定了一个文件夹之后就是为什么会绑定一个文件夹?就是你你一个新的文件夹,或者是你一个这个文件夹里面有文件其实都是可以的,有文件之后你看绑定的文件夹,它会就在这个区域,如果你想找到刚才的那个文件夹,就双击这个地方,你就可以找到刚才你绑定的文件夹是哪个, 这样然后你就可以去引用里面的一些呃,不管是你的呃文档或者是 pdf, 或者是视频或者是图片都可以去处理。然后这是第一步就是绑定这个文件夹, 嗯,绑定好文件夹之后,你左边有一个,后面就是可以删删除、编辑,这些都可以。然后接下来我们就是要调用对应的一个技能了嘛,技能的话你可以在右下角, 右下角这边你可以看到有个技能,然后这上面有很多,然后这样看的话可能比较麻烦,你可以就是点击这个放大镜,放大镜里面的话就是有一些具体相关的一些技能, 我来举个例子啊,比如说我想用这个技能,我可以点击一下,因为第一次我们在使用这些技能的时候,其实不知道它这个到底能干什么吗?对不对?那只能通过这个简单的这个呃东西去展示。那所以我们可以跟他就是跟智能体进行交互,比如说介绍这个技能, 按按一下回车,他就会告诉你就是智能机,他会跟你说就是这个技能主要是做什么的, 你们也可以都试一下。我,我刚才选了一个文件夹,但是我想更换的话,我是在哪个地方更换啊?目前是不能更换,你要更换你可以在新建一个。对对对,你可以在新建一个就好了,像这些你如果之前错的话,你可以就直接把它删掉,都可以的。删掉是在哪 删掉?就是在这里有个有个三点,鼠标移上去有个三点,然后可以删删掉或者重命名都可以,你可以同时多开多个对话的,可以开多个对话,对,你可以开多个对话。 好,你们可以试一下。就是呃,就是你就点击,就点击某一个具体的一个这样的技能,然后就直接介绍,然后你也可以就是怎么做呢?就比如说你在法律有有个有个技能你是经常使用的,你点个收藏,就是在技能你选择有收藏,点击收藏之后, 那在这个收藏这个地方也能看得到这个技能,就直接可以看得到。所以这是第一次刚才跟人说介绍这个技能,然后他就会读取这个技能,主要是讲些什么样的东西他会告诉你,比如说,呃,这个中国司法案例解锁这个技,呃,我让他去介绍嘛,他告诉你他有语义解锁、关键词解锁和 暗号识别与溯源,然后触发什么样的场景,他会使用这个,所以你就知道他这个技能他大概是能做什么样的事情。 所以就是在你看就是我群里发的文档就是智能体使用的。第三个就前面的话,首先先安装嘛,安装好了之后,然后我们就是在对话里面直接先签 绑定个文件夹,因为后绑定这个文件夹就是第一就是我们可以去啊,直接去使用啊这个文件夹里面的东西,以及后面我是我可能在这个和智能体对话过程中我产生的一些文件,它也会放在对应的一些文件夹,那这样的话就是比较好方便处理 啊。然后第二个就是我们激活,激活的话你第一次使用的话,你不知道这个技能,你就可以去说介绍这个技能,他就会告诉你这技能能干什么, 然后接下来你就可以直接去去输入你你你想要的就是想去询问他那些东西了。那这个的话其实我在呃群里也发了一个这样的网页和一个图片,然后也可以你看它下面有个势力的,就是简单的,呃,有个势力 可以大概简单看一下,比如说他这个我刚才激活的这个技能是中国司法案例解锁,那那我就随便举个例子,我就直接输入进去,按一下回车 啊,他就去根据我的需求就开始来进行公布,你看他就是呃就已经解锁出来了, 所以我们在这个整个智能体其实操作其实是非常简单的,就是,呃,第一步就是你去安装对应的技能,技能好了之后,然后在对话里面你先绑定一个,呃,先绑定一个文件夹, 绑定一个文件夹之后,你在这个文件夹你可以去激活对应的一些,呃,你可以把对应的一个技能给选中, 但是呃,这是一先先激活,先了解他是干什么的,就是我们这边就操作其实有三步,第一步就是刚才第一第一次使用,你可以直接选择这个技能,让他详细介绍,他会详细给你介绍一些东西。第二个第二种操作方式呢就是, 呃,你还是就比如说也是这种方式的,你直接绑定这个技能,直接说直接说你的需求。第三种方式就是更简单,你可能都不不需要去 去处理这个技能呢,就直接说出对应的需求就好了。因为这如果只要你安装了这些,前提是你需要把法律有关的这些智能体都安装好,安装好之后呢,那你直接给智能体这种需求,那它会自动根据你的需求去调用对应的一些智能体,然后直接给你去回复, 所以这是我们的一个这样的一个主流程的一个操作,就其实你在这个对话里面就是可以完成全部的了,然后因为我知道就是呃呃,作为律师你们可能平时都是有很多文件的嘛,有的很多文件,那你要就是让智能体也可以 去一次性去读,比如说你可以看到我之前随便一写文件,一二三四五六七八九十有十个 word 文件,那这样的话直接把这个文,呃右右上角 有一个发送到聊天,就是文件夹直接发送出去,然后再把你的一些需求放进去,比如说阅读这个文文档的所有的内容,或者怎么样的一个方式,其实都可以,就是右边你只要把它发送到聊天,就是或者是 呃你你选中某一个单独的,呃图片,选中某一个单独的图片发送到这里,他是都是可以根据你的这些内容去进行分析,但是你如果是要想去分析这种图片的话,那建议你去安装技能里面的有个图像,有个图像识别,那安装之后就识别可能会更好一些 啊,因为我使我使用这个已经有一段时间了,我结合他们这个团队,呃,而且因为主要很多是刑事案件,但他一个特特特特点,可能有大量的卷东都是扫描版的,那有可能是 pdf, 呃,也有可能是图片,呃,就是我之前的话呢,在使用过程中我担心啊,就是呃文件体量会很大,那么这样的话呢,如果是在处理这个相关这样的一些文件的时候需要注意什么呢? 啊?这个的话就是你比如说你这个文件里面,比如说啊,就就几个夸张的例子,比如说有有四五十个文件,对吧?那你其实给到指定,你可以跟他说,就是你一次去阅读这些文件,然后每读完每个文件给我一个总结,就是不要他一次去读,就是让他 ai 就是 读完一个做一个总结,再读完一个再做一个总结,那这样的话就是处理起来会好一些。然后刚才说的图片扫描件的话,那你们就是需要安装一个这个图像的这个图像识别的这个技能,那把这个安装了之后,就是一些图像识别都可以。那他有时候 不同的文件之间其实是需要相互比对关联的,那我先传一个文件,然后跟他分析之后再传第二个文件,可以给他下指令说对比上一个文件吗?还是必须两个文件一起传,才能这样相互比较?呃,这个比较的话,你可以这样,比如说这是一个第一个笔头,随便啊,就是第一个文件, 然后你就直接把这两个文件就说比对这两个文件就好了。哦,所以还是要一起发送给他,然后才能比对两个文件,是吧? 啊?你如果要想一起去比的话,那你就尽量就是把两个文件都都放在一起,然后输入你的指令,或者是你刚才那种方式,其实也都可以试一下,但是你要最终看一下这个智能体给你的这个效果是哪种效果是会更好,因为具体的你说的这个场景我也没试过,到时候你可以 去尝试看一下。但是如果你要想举着两个文件夹的话,比如两,比如两个文件里面的具体内容的话,你就可以直接 就是把你文件夹里面的就是两个文件先先放进去,然后输入你的一些需求,然后我们可能涉及到很多文件,然后有一些是在硬盘里,就是不在电脑本地,这个我可以直接选出硬盘的文件夹, 移动硬盘我用过都是可以的,我自己测试,反正是我自己插了一个那个固态硬盘,呃,很多文件就直接呃是用固态硬盘上的那个文件夹,呃,是没有问题的。如果要是用这个外置的移动硬盘的话,下次再登录的时候是不是就不用再插了? 要,要插的就是他所谓独取的是一个相对的一个叫做网络地址,就是你本地的地址,如果你本地的地址那个地方访问不到这个文件的话,他是独取不了的, 就是这个这个这个软件里头他不会留存我们的文件,是吧?不会,不会分析,对对对,他是要基于你的具体的一个盘符的一个地址去访问这个界面, 然后有,还有一个,嗯,还有一个需要注意的,你可以看到就是里面就是我们在跟他对话吗?就是你尽量的时候就是每一个对话,就是每一个相当于图片的这个对话的东西,每个对话就是,嗯,建议就是不要太长了, 我们下面就是会有这些统计,如果太长的话可能后面就处理起来就会有问题。所以你比如说一件事情的话,你就是通过一个对话处理好,处理好了之后你要么左边再新建一个对话, 对,这边可以新建一个对话,如果你的对话里面内容太多,左下角有个清空或者是压缩,你这边也可以去处理。相当于你对你开一个新任务的时候就先多建几个对话,这个是没问题的。然后就是,呃呃,这是第一个环节,就是教大家是怎么去使用我们的一个智能机, 这是一个这样的方式。然后其他的呢?一些比如说你远程控制,远程控制里面也可以操作一下远程控制,它是可以连接你的微信, 你的飞书的,就是如果你的电脑没关的话,你手机里面去可以去连接一下微信,就扫扫一个码,然后你在手机里面发送指令的话,你就会看到,就是呃它其实调用的也是我们这个智能机的一些东西,你可以直接在手机上进行操作, 然后操作的好了的话,其实你会在对话的里面远程控制里面会直接可以看到的,你看得到的,我这发的这些东西其实都是在手机里面发发出去的,所以可以进行一下远程控制,也可以操作一下。另外的话就是一个计划任务,计划任务的话就是如果每天需要他帮你固定处理些什么样的东西, 你可以在这边创一些这样具具体的一些任务。比如说我之前想去跟踪一个小红书博主的一些数据,那我就在这个内容其实词里面会写请执行这些任务,一二三四五给他列清楚,然后他就会每天帮我去跑对应的一个任务 啊,所以这是我们这个智能体就是整体的一个这样的啊。画布的话我给大家讲一下吧,画布可能你们用用的用到的地方不是特别特别多,然后我就大概讲一下这里面的话就是 呃添加节点就可以,这里面也是可以呃图像生成这些东西的,然后下面的八代表是呃八毛钱的价格,然后这这边的话就是到时候把边出拖进来,点击生成,右边就是可以 在这个画本里去生成的,这个我就就是直接跳过了,然后那刚才我讲的是第一步,最最简单的就是智能体的一个这样的一个使用的方式。 这是第一步就是我们是基于我们现在已有的就是在这个智能体上已有的这些智能体啊进行操作,然后我们来到第二步。第二步呢就是,呃,我们也可以针对我们做的这些智能体,你们也可以在这个智能体上进行修改, 但是具体是怎么修改呢?啊?我举个简单的例子,你想如果你想修改某个智能题的流程,你你可以这样做,就比如说你右边还是一样的,你先,嗯,你先去来到你具体的一个智能题里面去, 你去点这个吧,我点击一下,然后因为你想修改它的这个流程嘛,那你肯定第一步就是先详细介绍这个流程, 然后你可以看到它就会告诉你这个智能体的基本流程是什么样的,一二三四五六七八九。 然后你看它有七步,但是可能就是我们这个你现在看到的这上面的智能其实是我们的通用的一个智能体了嘛。但是你们在实际工作中,你们的流程可能跟这上面的流程不一定一样,对不对?那所以你针对已有的这些流程可以进行修改, 怎么修改呢?你就直接跟他大大白话就好了,你说你看他一二三四五六七八九六,呃,有有七步,我随便写一个,因为我也不知道里面具体的流程,然后我说我就直接可以说增加最后一步,生成 一个格式化的网页,我随便操作,你看我玩一个回车, 你看它就是来为技能,它就直接在这个就是在这个已有的技能里进行来说来为这个技能增加。第八步,生成格式化网页,然后后期更新就是输出的这个部分,然后它这个地方就是会开始进行,它就是自己开始去处理了。所以就是你们就是如果,呃,你你会发现就是 在法律上有很多证据,就可能第一次你们就是先去用啊,就用了之后发现有些流程跟我工作上可能是有点出入的,你可能就是有你自己的一些工作方式,那你直接在这个智能体的一个基础上让他进修改成你的这一步。比如说你看有一个有七步,你觉得这七步太多了,我只要四步,你说去掉第五步,去掉第六步 你直接跟他对话就可以了。所以现在就是比如说我刚才已经说了生成最后一步,生成一个格式化的网页, 他已经帮我生成了,已经帮我生成之后这样的,因为帮我生成之后他现在已经变成一个新技能,他新技能之后我希望他能够保存在我的本地。那这个,呃,这个时候我该怎么做了?然后我就我就可以直接又 ok 跟他发一个这样的指令, 那就是当我看一下他这个指令叫什么?平事会见笔录留整,我把这个名字改一下, 我就说打它,因为我是新创建了一个技能嘛,我原来的那个技能在那,我想把它变成我自己的,我说修改后的这个技能命名为刑事会见,刚顺利保存在这个智能体的智能市场,也就保存在这个这里,那我再按一下回车,因为第一就是第一步先修改,第二步再保存, 然后智能体就是会会开始来进行保存,就会会稍微处理处理一段时间, 处理一段时间可以看我之前哦看一下他处理, 你看看他右下角,你看中间这是个技能,右下角有个计划,这个计划就是你看有的时候智能体在工作中,工作中它智能体在右下角会列出来就他目前在执行哪些任务,所以 当你不知道就是他一直还在这种跑任务的时候,你在右下角其实也可以看到这个字,那些他到底在做一些什么样的事情,所以他他就是把刚才我呃呃告让他去保存这个技能,这一个需求,他会拆解成三个任务,那现在他就是已经跑了,跑到第三个任务来了,你可以看到他现在已经完成了 有形式会见它已经保存在智能体的技能释放。那那保存在哪里?我们怎么去可以看呢?你可以看得到它技能名称,它的位置在哪里都可以看得到。然后呢我在这个技能在这个已安装里面直接去搜, 这个时候你看到其实没有搜到,没有搜到的话,其实你就是需要把这个智能体给关了,要它重启一下就退出去,重启一下你就可以直接看到这个智能体了。我算了算了,我先把它关了,然后重新打开 已安装里面,你看看到没有?就是形势会见,刚才我新创建一个技能就出来了,这个时候我们点一下收藏, 可以点一下收藏,接下来因为已经已经就是重新呃呃,已经重新呃去呃修改了这个流程了嘛?你就直接在收藏里面直接可以看到刚才我收藏的这个技能,那下下次 你就直接就是直接可以用了,那你用的时候就是你可以先点一下,因为你,呃,因为已经创建了属于你自己的一个修改,属于你自己就能点嘛。那你下次再使用的时候,建议最好还是先先把这个技能,呃先输入在你的输入框里面,然后就是 我随便给他定个用,就是按理三四五六七, 然后我就直接去调用这个,因为我之前的那个,呃智能体的技能它是没有生成格式化文档的嘛,那这个,呃格式化了网页了嘛?那这个我增加了这个,增加这个,增加了这个流程之后,那我再调用这个的话,其实它会给我是最后给我生成一个格式化格式化的一个这样的网页的, 所以你就等,呃就是让他先处理一下,所以就是,呃,就是我就是刚才分享的第二步就是你该如何改造属于你自己工作流程的智能题。 呃,那我回顾一下,就是第一个就是还是你先去就是选中对应的一个技能,选中对应的一个技能,你在对话的过程中你先先先去询问他, 就是你这个,你这你,你这个智能体你的具体流程是哪些?那询问好之后你觉得第一步,第二步要改,还有第三步要改,还是增加一个这样的流程, 然后你就是直接啊直接下去增加,增加之后,然后建议你要把这个智能体保存起来,那保存的话都是在你的技能的已安装里面,已安装里面就是你就会保存到保存你的这个智能体, 保存好之后你可以点一下收藏再收藏,收藏之后呢就是在这一个列就会直接呃就呃,嗯,你就会下次要使用的话就直接调用你修改之后的流程, 修改之后的流程,然后接下来你就是去跑对应的任务,它就是就可以去执行了。这个是我今天今天早上的时候,呃,用另外一个技能去处理好的,就看到右边它其实就已经给我生成一个这样的一个网页了, 然后刚才我不是让这个已经跑了一个案例吗?你看测试案例当事人将在它右边的话,也可以看到其实已经生成了一个这样的文件夹,那只不过它现在就是在在走对应的,你看右右下角 走走对应的一个流程,那走验证流程出来之后,这个文件夹里面就会有具体的一些内容信息的。现在现在里面还是什么东西都没有的吧?就放在这下面,后面它生成的文件都会放在这个地方,你就等它工作就好了。 然后是修改,就是你看这里已经有出来看出来一个笔录,他这这是就是分享的。第二个就是怎么去改造对应的一个智能题。那那我分享的这一步就是大家有什么疑问吗? 你那个文件自动到这个测试案卷张三诈骗罪里头,诈骗案里头是自动生成他自己写的这些文档,是吧? 对对,因为我,我这个怎么设置的?因为我们看那个文件那块,我们不是,是比如说打开文件那块一堆文件,你这个是怎么怎么新建的一个文件, 其实是这样的,就是比如说你啊,就这个地方其实有一个这样的好比较好处理的方式啊,就是,嗯,就就拿这个案例吧,就比如说你这个文件里面,可能,比如说有有三三四十个文件,你不知道他最终要放到哪里去,是不是?对, 你可以这样,你再新建一个文件,就写个 ai, 你 可以随便另一个名字,你后面只要给他一个指令,比如说生成的文件放在,对,放在这个文件夹按下回车,那后面的如果没放的话,你估计他直接直接后面就,你就直接把所有的东西都挪进来,你知道就好了。 哦,对,你可以看到刚才,我不是刚才已经我在这个流程改造的基础上,我要他创建一个格式化的文件。呃,网页了吗?你看他已经创建好了,这个就是他直接就我相当于我给他一个指令,他就把上面的七步流程全都跑完,最终还给我生成一个这样的格式化网页,他已经生成好了, 所以就是这一步的话,就是你们是可以去啊,嗯,针对已有的智能体,就首先你们先去用这个正体看看好不好用,那,那觉得就是这里面的东西都是就是你用的很很很舒服,那你可以不用改,那你觉得还和自己的工作的实际的,嗯,还是有点出入,那你可以就是修改,把 基于已有已有的智能体进行修改。你看这个就是最后增加了一步,他直接给我生成了一个这样的格式化的一个网页, 所以就是,嗯,就是第二步就是基于已有的智能企进行一个改造,那这个流程的话其实还是会按,呃,还建议按照我的这四步流程来。第一步流程就是第一个流程就是先先去下载,下载好了之后,然后你先去,嗯,就是直接在这个对话里面直接去调用这个流程, 要用这个智能体,然后你先去问他你这个智能体的流程有哪些?那流程的话一二三四五六七,你就知道我到底要在哪一步去添加我想要的这个流程。那第二步的话就是你把你一些需求都放进去,放进去之后,然后,嗯,然后 第三步就是去保存,保存你就给你自己的,就你就命名自己的一个名字吗?那命名好了之后,你就先把智能体给给退出去,退出去再重启,重启之后你就会看到在这个性能已安装市场 直接看到对你的一个技能,他看到之后,然后你就点击他,然后按下回车就直接可以去去使用了。所以你就是啊,你直接他就会后面就会按照按照你的一些需求去跑对你的一个这样的一个流程,所以前期你们就可以先先去体验试用一下,所以就是一个你改造一个智能体的流程, 然后呃第四个的话,其实第四个就是搭建自己的智能体,搭建他这个其实和改造智能体相差不大的。 那你要做的一个事情,就比如说啊,比如说你只要你给他一个这样的,呃,就是指令就好了,比如说引导我创建一个什么什么什么技能, 一二三四五六七把你列出来。我之前举了一个关于自媒体的一个这样的案例啊,我随便看一下,就是引导我创建一个什么什么技能,然后按照以下步骤,一二三四五六七八九, 然后他就会根据你的需求,然后来帮你创建。那你们要创建法律的话,其实也是,呃,也类似的,你就是给他一个这样的指令,输入你的需求。 那步骤的话,第一步就是你就是先先说说了之后,然后就是保存到自己的技能,就给你的技能命名嘛,另一个名字保存下来,他也会在这个已安装里面出现了。第三个你可以点击收藏,然后直接去调用,所以这个就就是这操作流程不一样,这个是主动去创建,那主动创建的话就是这一个指令就 ok 了 啊。第二步呢?然后还还一个方式是什么?第一个是你发现自己是你,第一个是主动上线,第二个是对话影响你,呃,对话引导生成。就比如说啊,就是你前期在没有调用任何智能体的情况下,嗯,你只是跟这个智能体在进行对话,比如说你开始给他一个需求, 后面他就你跟这个正能体经过多轮轮的这个对话之后,你发现,哎,他最后给你的这结果你非常满意啊,我随便举个例子啊,这个就比如说上面我是帮一个义乌的老板去处理一些问题,那处理好了之后,后面的结果我比较满意,然后,然后我就跟他说根据以上内容引导我创 一个新技能,相当于创建一个你属于自己的智能体吗?对吧?跟你只要给他发一个这样的指令,他就后面就会该按你的需求,他就先确认一下你的需求,你想创建哪类的技能?你是想 a、 b、 c、 d, 然后就根据这个智能体的指令, 呃,你就可以去创建一个你自己的一个新技能。那其实第一次是他们的第一步不一样,那后面的话还是一样的。就比如说,呃,创建好了之后,你跟智能这个智能体说把这个新创建技能保存在我的一个技能管理市场,保存在这个地方, 然后下次,下次你再去再去调用就可以了。所以这个,嗯,流程也是一样的,只不过第一步不一样,就整体都是一样。第一步要么就是你给他发个群,引导我创建一个什么技能。第二步就是前面已经说了很多话了,发现就是结,就是你 是你想要的结果,所以你可以给他发一个另外一个指令。根据以上内容呢,我创建一个新技能,然后另外的话,就比如说因为你已经自己创建一个这样的技能了吗?对不对?你创建之后,其实你也可以分享给你的同事分享,同事怎么分享呢?呃,就是,呃,举个例子啊,在这边有个导入技能包, 你可以把你分享的技能给导入出去,那,那但是首先你要把这个技能给呃导出来,那导出来就是你如果已经创建好了你自己的一个技能的话,你可以说把这个 skill 就是 导出成 zip 形式,它导出来之后会发现就是有一个这样的一个文件夹,这个文件夹不需要解压,然后你就直接可以把这个 这个文件夹直接去导进去就可以了,你可以看一下这里,这个我就不演示了,就导入技能包,就把这个 zcode 的 形式的这个文件夹点进去就好了,然后最后你再去确认安装,安装好之后你就直接可以去使用了, 可以看下这个环节,就是在自己去主动去创建自己的智能体,这个环节就是有疑问吗?其实自己创建的这些技能在这个对话的时候还必须远引用它,是吧?还是说不需要引用,直接在里头自动就全部都按照这个之前所有的技能去进行分析啊? 你如果创建了你属于你自己的智能体的话,那你其实相当于你有两个,呃,就是你是有自己流程的嘛,那建议就是你创建好之后,你保存在这个本地之后,比如说已安装,你保存了之后你点个收藏,你点个收藏之后再对话,你下次再用的时候,你就直接呃选中一张菜单你就解。 对对,因为是这样的,因为可能有些有些他的那个技能他是相同类似的,那如果他跑了,比如说拿这个通用 ip 解锁,那比如说我新创建一技能, 那,那其实相当于有两个技能能执行你说的这个需求,那你如果不给他一个明确你要用这个流程去执行的话,他其实呃或许他用 用的是另外一个,就不是你改造后的这个。所以建议如果你要就是你有自己的流程的话,你建议你就先先把自己已经改造后的这个技能给点进去,然后再把你的需求输入进去就好了。那我们刚才就是已经讲了就智能起的一个整体使用方式,然后再讲了就是针对已有的这些智能起怎么进行一个改造,然后再再再一个就是 搭建自己的一个这样的智能企业。然后第第四种方式就是,哎,比如说我什么都不想自己改造,市面上有现成的,哎,我该怎么做?比如说微信阅读手机要怎么装? 你直接可以看到网上有很多这样的什么配置页面啊?那你该怎么做呢?你就是根据它的指令去做嘛?我举个例子,它它这个是要它的点开访问这个配置页面,我我就把这个你们也可以试一下,我来操作一下。 我也是网上搜的,就是你想安装你的这些智能题,就是我们首先就是这个工具上已有的智能题可以用,你可以自己去修改,然后你可以自己去新建,那我啥也不想,我就想用别人的,怎么办?那你就直接可以去网上搜,搜了之后他比如说 针对这个微信阅读的这个东西,那我该怎么去做?你看快速配置,就说复制这个 steam 指令发给你的 ai 助手即可自动安装。比如说你就复制对应的一个指令,复制好之后你直接来到一个新招对话,直接按,直接把这个指令给丢进去, 它就会给你去安装, 你看已经安装好了,安装好了之后,那其实我就是可以去使用了。嗯,分析,嗯,我随便,我随便说, 你看它 we read skills, 你 看它就是已经好了它这个,它这个技能就是你已经下载好了,它就会在这里面已安装,里面可以找得到, 在这里,所以你们,呃也可以自己去找一些来处理,看它有 a p i 未配置 a p i 的 话,其实也是刚才其实你们只要根据网上的一些教程也就可以了, a p i 未配置就在这里,第一个是安装指定,第二个获取 a p i, 你 再把这个计算器复制好 发送出去了之后,发送出去就已经验证成功,然后升级什么什么东西,然后他就会针对你当前的这个微信阅读的你的自己的账号,然后你的阅读习惯的分析,然后就可以可以开始给你来处理了这些东西, 所以就是嗯,就是你使用其他的这些技能的一个这样的操作,就是你可以去网上自己去搜一些 skill, 你 可以自己安装,安装的话就是通过这种刚才通过这种就直接给他发送对应的一个指令的方式可以去安装。第二个方式就是你可以导入对应的一个技能包, 这这技能包是那个这个的形式给他去安装,其实这两种方式都可以使用,然后你可以看一下他,最后也就是呃,你安装之后你可以去激活对你的技能,然后去配置,配置好了之后就直接去可以去使用了。这这是相当于说除了工作以外的就是我们的智能体,他其实就是一个 怎么说你可以把它强行是有思考能力的这样一个问题,那就是呃,就像我一开始讲的就是可以把一个人能力 放大,就是呃,你可以把它做成一个就是呃随时随地为你服务的一个助手助理。对,对于整体来说,其实你提一个好的问题会比呃学一些题词要更有效果,就是如果你这个问题提了,就就是让他呃没有歧义的去去执行一个具体的事情,它的效率其实是最高的。 那更其其次呢就是说就就是把一个你普通的流程把它固化下来,变成一个固定的一个呃一一个就是说处理问题的一个方式,那你下次可以去富有,就是呃你把它当做是一个,就是当做是一个你的你的智能化助手去处理的事。那 呃他比原来我们用人力或者说是这个占用自己的时间,他的效率会高很多。所以呃今天做的给各位只是就是一个,怎么说呢?这只是一个入门, 这一个入门就是介绍一些最基本的一些一些用途,那也希望各位就是说在使用当中多去就是就你不用担心他呃出错,或者说是呃他会有什么拒绝或者什么样些东西。就是你可以尽量把他当做是一个人去跟他去做对话,跟他去做交流, 你可以你可以感知到这这个东西它的一个边界其实是远超我们任何的想象。就是你也看到现在我们给各位的这个他既是就是说这个呃还有很多的法律方面的一些, 这个已经有这样方面的一些知识,然后他又可以写功能,然后呢就是我们也有一些电商的客户,然后也有做字母族的客户,就是还有些做跨境的这个 tiktok 这样的一些,就是说这样一个视频发布,就是他已经不是原来这种就是说一对一的这样一种软件,或者说 sas 这样的一个概念, 它的边界其实是就就可以说以后的这种智能区的边界它是会越来越模糊的,它不是一种单一的一种,就是专用型的东西,它是一个你怎么去定义它,它就有可能变成一下,变成一个什么样的一个工具的一个展体。