粉丝42获赞155

每天学习一个 skill, 今天看 xten absidian visual skills。 它把 cloud code 和 absidian 连起来,生成 extradrill、 mermaid 和 canvas。 一 句话,把文本想法直接变成可编辑的可式化资产。 这个套装解决的是一个很具体的问题,知识整理时,图总是最后才补。现在你可以先描述结构,让 still 直接产出 obsidian 能打开的图。所以它不是画图玩具,而是文档、笔记和演示的生产力入口。 rimi 里最重要的信息是,它包含三类可视化 skill, excculateral 负责手绘感图表, mermaid 负责专业流程和时序, canvas 负责交互式思维整理。三者合起来,覆盖了从草图、技术图到知识地图的常见场景。 第一个是 excalibur 图表生成器,适合流程图、关系图、架构图和思维导图。它支持 obsidian 模式、标准 dot、 excalibur 文件以及动画模式。触发时只要说 excalibur 画图、流程图或者思维导图就很自然。 第二个是 mermaid 可适化器,适合放进文档和工程说明。它支持流程图、循环图、对比图、思维导图、持续图和状态图。更关键的是,它内置了语法错误预防机制,减少 mermaid 常见翻车点。 第三个是 obsidian canvas 创建器,输出的是有效的 dot canvas jason, 它可以做中心发散的思维导图,也可以做自由布局的复杂网络节点大小、颜色关系、连线和分组都会自动帮你铺好。第一版 安装方式,最推荐走 clock coke 的 plug in marketplace, 先添加 external slash xten absidian visual skills, 再安装 absidian visual skills 如果只用 excalibrium, 记得 excalibrium 里也要装好 excalibrium 插件。 使用时记住一个顺序,先选图的载体再说清结构手绘感用 excel, 工程文档用 mermaid, 知识地图用 canvas。 每天学习一个 skill, 我 们下期见。

曾经我对 cloud code 的 终端爱不释手,但现在我只能说一句, codex 真香啊,真香! 大家好,我是布鲁。随着 codex 近期频繁的更新,我自己的工作站也已经全面的切换过来了。今天就来分享一下我自己的完整使用经验,怎么用 codex 打造一套不打断心流的生产力闭环。 本期视频我把它分成了七个章节,每一张都是我自己实际在用的技巧,希望能对你有所帮助。那我们话不多说,直接开始 第一张,先来介绍一下我的工作站是怎么布局的。左上方是 codex 的 对话框,下方是 terminal 终端。 你可能会问,已经有 codex 的, 为什么还要开一个 terminal 跑 c c? 因为我发现对于一些需要探索、需要设计的任务, c c 的 表现要更出色一些。所以我的习惯是用 c c 来做方案设计,配合 planning with files 这个 skill, 把设计思路直接落成文件, 然后再让 codex 读这份计划,接手后续的具体实施。这样一来, cloud code 负责想, codex 负责做,两者可以各司其职。 右上方这个区域我用来做任务完成后的查看和审阅,比如代码的 review, 文件的浏览,还有浏览器都在这里。虽然现在浏览器还不支持多标签页,但对于日常的任务来说完全够用。这边我就分享一个实际的案例, 我让 c c 参考了最近很火的这篇卡巴西提出的知识库的文章,让他借鉴里面的思路,出一份设计稿和完整的实施计划。目的呢是做一套前端的页面,方便我日常的维护文档使用。 接着 c c 就 会调用 planning with file 这个技能啊,将所有的计划落成文档,然后我就会回到 colex 这边,让 colex 去阅读当前项目内的这份计划文件,然后基于这份计划文件让他进行开发。开发完结果之后,我会在这边 内置的浏览器里面去进行结果的 review, 包括代码的一个审查,整个过程从设计到开发再到 review, 全都在这一个工作站里面完成,不需要切换任何的窗口,这就是我前面所说的,心流不会被打破。 第二章,批注功能。这个功能是我觉得 codex 真正强大的原因之一,也是最能体现沉浸式开发的地方。 以前我们改代码的方式是找到文件定位到哪一行,描述问题,让 ai 修改,整个过程中你的注意力是在代码上的,但现在 codex 的 批注功能让这件事情变了,你可以直接在文件上进行批注,告诉他哪里怎么改,需要怎么改。 更厉害的是,现在这个批注功能不止限于代码文件,你可以直接在前端页面上进行批注,看到哪个按钮位置不对,哪块布局不满意,直接在页面上标出来, codex 就 能理解你的意图,并帮你进行调整。这件事的意义在于,正好对应了 webcodd 的 核心理念, 开发者的重心不在于怎么写,而在于写出来的东西对不对。批注功能把这个理念落地了。 第三章,上下文管理 codex 项目里可以同时开多个县城,每个县城对应一个任务,互相独立,不干扰。对比 cloud code 需要开多个对话窗口, codex 把所有县城都收在了一个项目下,管理起来会清晰很多, 然后是项目的记忆核心就是 a 键的点 md, 这个文件你可以类比为 cloud md, 把项目的背景、开发规范都写进去, ai 每次进来都会读取,不用反复的交代。 还有一点, codex 的 上下文管理非常省心,它会自动帮你压缩上下文,它也没有提供像 cloud code 中 compact 的 那样的命令,这种事情让 ai 自己处理就好了,你专注于任务本身就行。 第四张,自动化这块是我觉得 codex 比其他 agent 做得更好的地方,几个原因,第一,用起来非常的方便,直接在 gui 里面新建自动化任务,还内置了很多模板可以选择, 大到项目管理技术、眼镜,小到个人的生活习惯,都可以交给它来定期的处理。第二,自动化可以调用 codex 自身的能力,比如插件、 skill、 mcp、 浏览器操作、电脑操作等全都能用进来,这就是为什么我说 codex 在 逐步形成自己的生态。 第三,我们可以根据不同的场景来灵活的选择模型和推理强度,简单的任务用轻量模型,复杂的任务上强推理,这样的话头肯可以用的更加的合理。第四,稳定性,我实测下来, codex 相较于其他的 agent, 定时任务的准确性已经能达到生产级别,相当的靠谱。 第五张插件和技能, codex 有 相当丰富的官方插件和 skill 生态。先说说两者的区别, skill 就是 纯文档,本质是给一份 ai 的 说明书,告诉他在特定场景下应该怎么做事。比如说我前面提到的 planning with files, 就是 一个 skill 插件的概念会更大一些,你可以把它理解为 codex 打补丁,里面可以包含 skill, 也可以带上 mcp 配置,甚至集成其他的 app。 一个插件装下去, codex 就 多一套能力。 另外, codex 在 插件和 skill 的 管理体验上面要比 cloud code 的 友好太多了。 cloud codex 需要改配置文件,而在 codex 里直接在界面上点击安装,或者自己创建,整个过程非常的直观。 第六章浏览器和电脑操作 codex 可以 直接操控浏览器,你可以让它自动填表,抓取数据,验证 ui 效果。 比如我需要批量收集一些网页上的信息,直接告诉 codex 去哪个页面拿什么数据,它就能自己打开浏览器去完成操作,整个过程中都不需要你的介入。除了浏览器, codex 还能直接操作你的电脑文件的整理,应用的打开都可以交给它来处理,相当于有一个助手在帮你操作桌面。 不过这里要说明一点,随着 ai 自动化越来越普及,现在已经有不少软件开始加强安全控制,对自动化操作做了限制,所以实际能操作的范围会因软件而异,遇到限制情况也很正常,大家用的时候留意一下。 第七章通用功能这些功能不是 codex 独有的,很多 agent 都支持,但作为一个完整的工作站,这些基础能力 codex 当然也不会缺少。先说 play mode, 在 执行一个比较复杂的任务之前,先让 codex 把完整的计划列出来,你过一遍觉得方向对了再让他动手, 这个习惯能帮你省掉很多返工的时间,大任务尤其推荐开 play mode。 再说 m c p, 也就是模型上下文协议,通过 m c p 可以 把各种外部的工具和服务接进来,让 q d x 能力边界大幅扩展,无论是连接数据库,调用第三方的 api, 还是接入自己家的服务,配置好之后, q d x 就 能可以直接调用。 另外还有一点, q d x 相较于 logot code 的, 有一个非常关键但很容易被忽视的小功能,语音识别。目前我的任务几乎都是语音发起的,连打字都很少了。 ok 以上就是我在使用扣袋子过程中总结的一些技巧,如果对你有帮助的话,希望能得到你的点赞和关注。 最后我想说一句, ai 发展太快了,各家 a 键的功能越来越趋同,但工具再多,适合自己的才是最好的。有时候做做加法,找到真正需要的,做做减法,去掉用不上的,慢慢摸索出一套自己的工作范式才是最重要的。我是布鲁,我们就下一期再见。

我用 cloud code 跑通了视频自动剪辑,给大家实操展示一下,现在的 cloud code 太牛了,我深度使用了一个半月了,它能解决电脑上百分之九十的事情,我养过小龙虾一阵子,那 open clock 就是 个智障儿童。 这个剪辑软件已经开源了免费软件,我放在了评论区,给大家看一下。剪辑过程简直是自媒体的福音,从此不用再吭哧吭哧花时间剪视频了,开始实操。 运行了这个免费的开源工具以后,他开始帮我解析视频,看到我的视频有十二秒我的视频一个内容的结构,这是我拍的一个口播的数字人,他分析完我的视频以后,因为我全程没有口气词, 嗯,十秒一进到底,语速偏快但清晰,所以他给出了一个建议,方向,加字幕调色,加动画叠层,想问我往哪个方向走。接下来他就自动开始写脚本,写代码,我全程没有操作。 然后他开始生成三个动画,进行一个渲染,现在到了渲染环节,这是最终的一个产物,这是最终的视频,我们拉到最下面啊,直接直接丢出来了一个这个视频,结果牛不牛?现在 ai 太牛了,卡的酷的,赶紧用起来,点个关注,谢谢!

你在用 cloud code 写代码的时候有没有这种感觉?每次让他读一个新文件,他就要花好几秒头肯哗哗的掉。一个中等体量的项目, 光读上下文就能烧掉你一半的预算。 code graph 就是 来解决这个问题的,他把整个代码库预先建好,锁影变成一张图谱 agent, 需要查什么直接问图谱,不用每次都重新读文件,实测下来 toc 消耗能降一大截,响应速度也快很多。它支持 cloud code, cursor, open code 这些主流工具,最关键的是完全本地运行, 你的代码永远不出自己的电脑数据,完全私密,上手非常简单。去 github star 这个项目,然后本地安装,支持 type, 也支持直接 clone, 装好之后配置到你用的编程工具里, 直接用自然语言问他代码结构模块关系。如果你是开发者,用 curl code 或者 cursor, 强烈建议试试这个工具。

搭一个让 ai 自动生成这样视频的 skill 真的 很容易,咱们先来看一下效果。承认吧,你的二十多岁不过是个拿着身份证的未成年,别再拿三十而立 pua 自己了。社会学专门为这种尴尬期造了个词,奥德赛时期,他借用河马史诗里英雄漂泊归乡的故事,只待从青春期结束到真正扛起社会毒打的这段漫长过渡。 这条视频呢,我没有加背景音乐,只是让它实现了 tds 配音,然后根据我的文案去生成分镜的提示词, 用提示词去生成对应的图片,再用对应的图片去生成视频,它只是经历了这样一个三步的 api 的 调用,就可以批量的产出这样的视频。然后加入了一些基础的功能,比方说关键词的提取,这是它自动识别的, 在关键词动画效果出来的时候,配上一个对应的音效。在这里我先说一下 ai 生成视频目前成本还是比较高的,它主要有两种方式,一种是调用 api, 而电有 a p i 的 话,现在最强的模型,那就是字节旗下的 cds 二点零。如果你的电脑配置足够高,比方说有一个九零系的显卡,那你就可以考虑本地生成,如果是这种风格的话,本地模型也是可以出的。咱们来看一下它的流程。第一步呢,就是来 读取你的文案,你可以把文案放在你电脑里边,用 txt 保存就可以,你可以保存一份文案,或者十份一百份 都可以,他都可以批量的帮你去完成。然后我这里有五个预选的风格,刚才的这种画面,这种卡通风格的画面是一种,你可以去选其他的,你喜欢的,包括现实感的都可以。如果你有对标账号,想参考他的风格,截一张图发给你的 ai, 让 ai 反推风格提示。 然后第二步就是把咱们的文案用 tps 配音,配音的方式模型有很多,有 api, 有 本地,这个就你们自己去选择就行。 第三步就是让 ai 根据你的音频产生的准确的时间轴去把它分分镜,然后生成提示词。生成画面的这里有一个重点, 因为你要和你的画面做时长的匹配,所以这里你要用 tts 返回的准确的时间处,你不能靠文字让 ai 去大概分,这样的话就可能对不上。第四步就是根据你刚才的分镜生成参考图。现在 ai 生成图片和视频的质量已 已经是非常的高了,所以这两步你就是根据你的提示词去调用返回的结果,如果不满意,你再调整风格类型的提示词就可以了。 其中最长的一步就是图声视频,除了耗时最长,也是它的费用最高。前边的所有的这一套流程, 一条视频跑下来可能就是几毛钱或者一块钱,但是徒生视频的这个环节,一个一分钟的视频,如果调用 cds 二点零的话,可能就是十块钱,二十块钱,甚至更高,所以这里一定要注意根据你们自己的需求,你们能承受的一个范围。我这里测试用的是 cds 一 点零, 一点零,我让他帮我估算了一个费用,一分钟的视频大概是十多块钱,这里只是做了一个测试,你也可以选择便宜一些的模型,或者考虑本地去跑,最后一步就比较简单了,就是按咱们的要求,根据一句话,然后匹配对应的画面,导入到剪映的草稿, 然后加一些转场的特效,加一些音效,包括背景音乐都可以让他直接全部加入进来。现在有很多认知类的视频都可以用这种方式去批量生成。 有很多小伙伴关注的 ai 生成短剧的 skill, 其实也是这样的一个流程,只不过你里边会把你的文案划分成剧情,然后让他去拆分分镜的提示词, 最后也是生成图片,图片再去生成视频。最后一个拼接流程都是一样的,只不过中间的步骤需要按你的需求去调整,有时间的话我会出一期专门的教程。最近更新的比较少,因为一直在调试各种视频的,有直播切片带货的, 还有一些帮小伙伴们定制在他们电脑上去远程调试的。大家有想做的视频不知道怎么去搭建的,可以评论区告诉我。

我给 cloud code 配了 blender 技能,还给了它最好的 a p r, 比如三 d 生成图像生成计算机视觉等,并开启了跳过权限模式。让它做一件事,给我创建这个三 d 场景, 我让他尽情发挥。结果出乎你的意料,各位,我很快会揭晓。但首先为什么是 cloud code? cloud 本身在编码上就非常厉害,而 blender 本质上就是派散胶本,而且最近还有了很棒的 blender m c p。 但 cloud code 能让你更进一步,省去所有设置技能和界面的麻烦。 你只需用跳过全线运行 cloud, 让它尽情发挥。这就是本视频要做的。我会展示一些很酷很实用的例子。首先如何安装?屏幕上打开的是 blender, 五点一, 这是我们需要的最新版本,我们需要 blender 和官方 blender mcp。 再次强调,这是新的官方 ncp 最近刚发布,别和社区开发的 mcp 搞混了。所有教程、链接、技能等 都在简介里,各位,完全免费。这里我们需要安装插件,并在 blender 中激活它, 非常简单,甚至可以直接拖拽这个文件到 blender 里。像这样,我的扩展已安装,要验证去编辑偏好设置。在插件里,你会看到这个 m c p, 确保服务器在运行且自动启动设为开启。这样每次启动 blender 时, m c p 会自动启动,非常方便,一次设置永久生效。第二部分是 plotcode, 我 相信各位知道如何安装 plotcode。 这部分可以跳过,但这里是如何连接 blender 和所有技能光标现在在空文件夹里,我去打开终端。在终端里, 我用跳过权限启动他,各位,因为我不想让他问任何问题。我给他一个任务,然后等着完成。免则声明, 我不建议这样做,但我还是会做。如果不确定风险,可以先从 cloud 开始手动批准操作。结果一样,但后者需要你批准操作。 现在我需要安装 blender mcp 符,非常简单,我准备了 md 文件,里面有说明。你可以拖拽到 blob 文件夹里, 它会手动安装所有内容。我们开始吧。这里可以看到说明,其中也包含了完整的 ai 功能可选。但如果你想接入顶级 a p r 如图像生成,三 d 生成、视觉模型分割等全套 ai 功能,就得先充值积分。我来演示,但注意这是可选的。好了,现在我们把这个文件拖进去,点击安装所有组建,然后 等着就行。完成了。这里可以看到输出它键已安装,插件已安装,然后需要完整的 ai 密钥同样可选。进入那个受保护的文件。把密钥放进去,这样 clock court 就 能访问了。这是最佳实践。密要只保留在那个文件里。 m c p r。 创建后需要重启一次 clock 绘画才能让它 揭露 blender。 开始吧,我先关闭之前的终端,重新打开,用继续命令回到之前的绘画。 好了,我们回来了,开始测试。用简单命令检查他能否看到我的场景。是的,连接成功,能看到一些内容。 设置完成,如果添加完整 e i。 密钥,就能访问全部 e i a p i。 现在进行一些严肃测试。第一个测试为角色制作动画。角色会分成多个部分。第一个测试是创建动画,为天使角色制作动画, 这是我的角色,我是在 triple 里创建的,然后在应用里拆分成部件,再在 triple 里贴图,你会看到整个过程。思路很简单,把它放入场景,告诉 claude, 做一下两件事。首先模拟它掉到地上,部件自然散落, 需要运行模拟。第二部分是制作动画,不是简单的组装动画,而是像龙卷风一样的动画。 准备好见证奇迹了吗?我准备好了所有提示词都准备好了。完整提示词在屏幕上可以暂停查看,但我还创建了它。 各位,我之前做过一个视频,展示了如何在 cloud desktop 上操作,还展示了很多酷炫案例,比如键盘动画,但比较简单。我真的很想尝试更复杂的东西。我看了所有评论,决定再试一次,让任务更复杂, 看看能推进到什么程度。这个视频里的例子会比之前的难得多。如果你也用 cloud desktop, 可以 看看那个视频。第一次尝试不成功,因为没有模拟出散落效果。 但龙卷风动画还算可以,所以我提供了反馈,它开始进行下一轮。 但这次动画有点支离破碎,还是不好。我又反馈了一次,看他能否修复。你看他又开始生成了。他思考了很久,但没花太多算力。 他评估了很多东西。然后我得到了非常有趣的结果。但我不满意,因为龙卷风组装很慢,而且只用了两次迭代,一次修复动画一致性,另一次增加速度。在 最后,我们得到了这个漂亮的动画,我觉得效果很好。 assembly 做了模拟,零件散开,他 解体了,这是结果。总共用了五次迭代,初使提示和四次修改,得到了结果。说实话,我手动做不了。这个动画还不完美,但这么快完成真的很神奇。 再给你看个例子,这是我实际工作中的用法。这是关于几何节点的,我觉得这是目前最有用的场景。几何节点就是可以添加任何物体之类的东西。 我之前视频里展示过如何把物体散布在平面上,省了大量定位时间,非常有趣和简单。 而且我只用了一个提示。现在我们来更进一步,我有个场景,里面有个水面,它没动画,只是个平面。这是屏幕上的提示。 想法是让它动起来,做成气泡动画。我还想要几何节点有参数,可以控制气泡大小,频率等。开始吧。这个一开始比较简单, 但第一个版本出来时,气泡太大,像素化严重,这是结果。气泡非常大,没考虑世界比例,但他几乎完美的完成了任务。 除了大小,我反馈说需要更高分辨率,气泡要小三倍。然后他开始调试,看着很有趣。他起用渲染隐藏物体来查看 水面,因为被其他物体挡住了。他没删除任何东西,一切安全没问题。我最近测试了很多次, 什么都没被删除。你看结果,越来越好,越来越好。最后在我的提示下,我得到了相当有趣的结果。 这里最后我简化了着色,以便看得更清楚。因为我的场景最初是为 cycles 渲染设置的。 好了,动画运行了,我们可以控制参数,比如气泡强度、频率和扩散速度,在这个模式下更明显,我觉得很酷,对吧?你看,我没碰任何几何节点,我甚至不知道他是怎么创建的。 两次提示,此后结果超棒。那云烹饪的岛呢?首先,我咋想到这个测试的?其实我试过类似的东西,但最近看到有人做了个叫 image blast 的 工具,它基本是 cloud 的 一个技能,用 world marble 和 full ai 来 创建这个超棒的世界。我觉得很酷,就试了试。设置 其实很像。我稍微改了下,做测试工作原理是这样的,尼克隆那个 image blast 链接在描述里,然后提供两个密钥符, a i a p r 用来创建场景里的 三 d 物体。 world marble 用来创建场景, world labs 能创建高斯坡键。最近还加了新功能,能创建碰撞体和真实网格,这就是 image blast 的 作用。 总之,他工作原理是这样,但很好。积分每次世界生成可能花你五美元,所以你不必测试。我 来测,这是结果真的有效。他用 worldlife 创建世界,还在网页上打开预览,关键是他只能在网页运行,因为 spark gf 渲染颇难得,切掉 整个部分,几分钟后,它生成了世界。我能在 blender 里预览。看起来不错,但最酷的是,当你 用其它物体创建世界时,我又做了个日本风格的测试,可以看到物体与环境互动场景,背后有个打火机,但这只是高斯坡键,看起来 很惊艳,其实只是平面。所以我决定自己做个版本,尝试在 blender 里实现类似效果。这是结果。嗯,不是我预期的。朕的,我试了很多。伙计们,我大概花了两天 给他各种工具,比如三 d 分 割,俯视图之类的。但 cloud vision 似乎很差,他写代码和 操作很棒,但视觉方面不行。我试着让它修改移动物体等等,但不行,我可以把代码放到 gigho, 如果有人能改进 那就太好了。但坏处是每次生成世界都很贵。我用的是 trapo, 花了八美元 来创建所有物体并放置好。我还连了 patna, 能看到水材质。它像个模型,但这是我最好的结果。我还试了另一个地点,类似冰源, 概念相似。结果很失望,它有时甚至放不对物体,有些物体旋转了九十度。我 不知道为什么,我觉得 treple 生成的还行,但嗯,所以最终结果肯定不是我预期的。我试了很多,花了好多积分,烧了多少 token 你 根本不知道。各位,我录完视频后决定在 cortex 上试试。 好处是同样的文件夹和技能在 cortex 上也能用。我让它了解这一切 并制作这些技能。 cortex 就是 那些代理文件,对吧?没什么大不了的,效果不错。所以如果你用 cortex, 基本可以用同样的设置,对吧?你可以用我的文件安装, in, c, p 等等, 基本都能用,只是多花点时间。但 codex 会指导你。结果如何呢?说实话,我觉得它略好,我喜欢它 处理过程的方式。我之所以想这么做,是因为产品有更好的视觉模型,而且这些模态都在核心模型里。可以说 用 patna 生成的冰的缩放有点乱,但它添加了映射,并做了正确的缩放, 很棒。物体位置合理,逻辑清晰。你看,连小碎片都砰砰砰掉在地上。 codex 做的稍耗一些,不过差别不大,你看还是不能用,只是让你看看 codex 的 效果,这是结果。我会把这个项目连同所有技能文件上传到 get, 你 可以自己查看。实验成本挺高,将近八美元。这是一月三日的模型,叫图像生成,不同通道 生成 p、 b, r 材质等部件。如果你有 d, s, f 来改进,也可以看看。但我们还没测完。这里还有一个更复杂的测试,我们要尝试重定向动画。我在 triple 里创建了这个角色。我们去了奎给角色绑定骨骼。 a k ray 是 免费的,它的绑定效果不错,你可以在这里预览。动画看起来其实还不错。我开始用 a k ray 了,但有个缺点,对吧? a k ray 的 动画大多是付费的。所以我在想,如果我写个重定象棋,直接用 maximo 的 动画, 然后应用到我的 aker 角色上,轻松省事,对吧?所以把我的角色导入 blender, 再去 maximo。 我 找到了这个动画。跳舞吗?当然可以,对吧?我们下载为 l b x 格式。这里可以看到 maximo 的 模型和我们的角色。 这其实挺有挑战性的。这些骨架不一样,可以看到骨骼有差异。 character creator 的 骨骼更多, maximo 的 骨骼少,而且旋转方式也不同。这是目前为止最棘手的任务。提示会显示在屏幕上,而且幕后故事是我一开始给的。提示完全错了,我说它们有相同的 t 形姿势。 t 形姿势是原始姿势,但我搞错了,因为 character creator 导出的茶壶是动画帧,所以我花了一个小时。最后 clo 对 我说,等等, t 型姿势不是你说的那样。那太搞笑了。因为我突然意识到他说的对,我只好重写提示,从头开始。这是第二次尝试。他做了很多反复检查,自己 摆了一些姿势,重新定位之类的,手臂之类的地方有问题, 他试图自己修复。我偶尔会提供反馈。主要问题出在 帽子上。有一次 blender 直接崩溃了,但不知怎么地,每当我打开 blender, 它都会自动恢复。同样的情况,我告诉 club, 不 管你做什么都会导致 blender 崩溃。这是提示它停手了,然后它意识到自己搞坏了模型,就恢复到了,可工作状态 好了,这是最终结果。总的来说,他确实完成了百分之九十的工作。除了手臂,肩膀那里骨骼有差异,就像我说的手腕,手腕完全 像是手指镜像了之类的,但其余部分,比如腿,身体和头部,重新定位的非常好,对吧?这里我们可以看到骨架是白色的,不一样,对吧?就连手臂也是。 我试了很多次,想修复,但他做不到。也许我们需要 low, 四点九五或 midast 莫行,他肯定能做到,但我的想法是,如果我能让他工作,下一步就是让 low 给我创建一个 addon, 这样我就能选择两个骨架并重新定位动画,因为我已经看到它有效了。但说到真正有用的插件,我看到令电影上有人展示了它如何为 blender 创建了一个插件,可以追踪它的头部并产生是差效果。 它也用了同样的设置。这里可以看到它创建的效果相当有趣。在评论区留言吧,说说你们创建了什么,怎么测试的? 我对此超级兴奋,现在正在做很多测试,了解更多,会很酷,记得点赞订阅我们下个视频见。

程序员玩卡拉 ok 的 我能理解,但是你一个小白对吧?你瞎折腾什么呀,赶紧把那个卡带子搞定吧。要能升,要升图有升图,要技能有技能,要插件有插件,要浏览器自动化。有浏览器自动化还要什么自行车啊?

大家好,今天我给大家分享我如何用 cloud code 手搓自己的大 a 中长期的投研看板啊。这个看板是从研报到产业的深度解析的完整的体系。开始之前我先说一下,本视频仅为 ai 编程能力展示所有内容,不构成任何投资建议,不涉及具体买卖推荐。市场有风险,投资需谨慎 啊。我用了哪些工具呢?我用了 codecode, 然后还有我开源的这个 assetdata 这个数据的接口啊,然后我抓出的是二零二六年人性机器人的研报,我抓了一百七十篇,就它俩一结合就出了一百七十篇研报。然后我再让 kimi code 的 这个 c o i 进行了这个研报的这个读取跟分析,就出现了一些结论, 然后最后就出来了这个看板,然后这个看板后面我给大家展示啊,非常的丰富。展示之前我再说一下为什么要手搓?就大家都会想,已经有这么多系统,为什么要手搓?其实核心是在于每个人都有自己的一套方法论,现有的工具再好呢,其实也是别人的框架,是很难适配自己的 方法论的。而且你自己搭建自己的系统呢,是他是可以迭代的,因为你是可以随时去变更,去迭代你的系统的。 ok, 下面我来开始展示我搭建的系统,这个就是我搭建的一个体系。首先是一个产业的深度分析,它是一个总览,总览的话是比如说产业,呃,产业的全景啊,目前是 这个一个人型机器人是多少的成本,然后零部件是多少?国产化率是多少?然后这个是很重要的一个,就是这个成本的构成,然后每个模块它需要多少的成本构成? 那最大卡脖子点是什么?然后不可替代的模块是什么?然后我们追赶最快的是什么?就是这些点呢?其实都是呃,抓出来的一个总览,大家肯定会问呢,为什么有这么详细的数据?其实他的源头就是这一百七十篇的研报, ai 分 析了这一百七十篇的研报之后,他自己也会进行一些认证,最终就得出了这些结论。所以说就不用太担心 ai 的 幻觉问题,因为他是有这个圈上的数据的 啊,这个是一个我专门做的成本构成的一个页面,就是这个成本的拆解啊,大概是有这些构成的,每个模块都是多少钱?然后这还有个降本的路径,就目前降本大概会降到多少?每年降幅是多少?这些都是其实是都有数据来源的, 然后各方的目标的这个整机的目标价,你像那个特斯拉那边就是两万美金,然后我们国产的目标就是这个,这是一个比较详细的一个成本构成。然后接下来呢,就对每一个模块就可以建立一个专门的一个分析,你像减速器,减速器就是这个 名称,我就不念了。然后他的目前的一个技术壁垒是多少?然后竞争格局呢?是这个哈莫纳科是全球第一的啊,是标杆。然后绿的斜坡到底到他什么水平啊?这国际的份额,绿的斜坡占了百分之十二,国内是百分之六十,然后剩下这些追赶的小弟们大概是个什么水平? 嗯,所以就是还还可以进行这个行星稳住四杠跟斜坡之间的这个 vs 的 分析,然后这是一个再展开啊,就这也是 coco 自己设计出来的,我跟他说完自己设计的,这不是我要求的,然后他会对比了这个龙头的差距, 嗯,这个也是有一些数据的支撑的,岩爆的数据的支撑的,然后再到这个四杠,四杠就是线路工艺线路之争啊,就是这些标的都是有什么线路啊,什么维度, 然后每个票现在都是什么水平啊?他是他的优势,是才能的壁垒,才能的壁垒啊,然后减速器这个是技术的壁垒,技术壁垒是更难超越的嘛。然后这个电机模块,电机模块也是这这个 两个两种电机,然后这个头部的壁垒都是谁?大概是什么固执,什么水平,就是你做完这个你有研报作为一百七十片研报作为基础之后,你就会很容易对一个产业有非常充分的认知,而且 ai 都给你把要点都给展示出来了。 所以这个其实我觉得是非常非常有用的啊,包括传感器的模块啊,六维传感器,三 d 视觉,这有个替代风险,他会提示有个替代风险。 然后这是一个剑圣,这是一个有技术壁垒的啊,一个一个小的细分赛道,当然 我也研究了一下,那可能他的在这个成本的构成里面占比太低了。然后最后呢,我还让他分析了一个替代风险,赛道的替代风险就是你们其实也可以就是直白的跟你的 qq 的 讲就行了,他会,他会去分析的,就是这个也是一个模块,就是你这个赛道的核心壁垒到底高不高,会不会被替代? 那这个减速器就会暂时不会被替代啊,因为他有五到十年的一个窗口期,然后这些就短一点,像传感器可能就短一点,然后他是啊风险比较高,他的可能会被迭代, 最大的这个替代风险最安全的这个赛道,反正就是有这类的分析,你我说到底还是核心是自己一百七十篇的研报,而不是说 ai 去网上随便去百度啊,去 google 出来的一些数据,而是他自己研报的一些客观分析,自己在佐证。所以那个数据源其实是非常重要的 啊,这是一个估值的全景啊,就是这些标行业分析完之后,你不是得去评估一下估值吗?然后你就可以分析出他的 p b 是 多少,然后这个数据都是叫你可以去接了 api 之后就可以拉取出来的实时的数据,然后 k 的 增速是多少,然后算一下 pe g 应该是多少 啊,就可以,你就可以很全面很直观的算出来,然后消化的时间,这个消化时间我设定的是 pe 到三十年,按照目前的增速需要消化的时间, 然后这就还有风险提示啊,所以总的啊,这个我就不点了,这个这个我也做了一个详细的分析,但这个事太敏感了,我就不讲,反正总的来说,你都可以让 ai 去分析,就是搭建了一个体系之后,你对这个赛道的中长期的一个判断,其实是, 呃,会有比较深入的判断吧,你,你也去好做一个更好的一个方向的决定。 ok, 我 的展示就到这里, 那我这个是怎么搓出来呢?大家肯定会好奇,然后核心呢,其实就是第一步很重要,就是你要有研报,你用那个 excel data 里面的这个研报的接口,就可以去收集到很多很多研报下来之后呢,就用 ai 进行批量的分析。 我是用 kimi 啊,因为能省点头肯,他也比较聪明,但如果你没有的话,你就让让 c c 直接上就可以了,就要提炼,但提炼之前你要想好你的框架,你的方法论是什么,你关注了什么东西,所以你才能给他比较好的方向去提炼, 然后最后再让 cloud code 大家看吧就好了,就我刚才给你展示那些,其实呃, cloud code 只要它有数据,它能很快的这个搭建出来,然后这个就接入实时的数据,你就可以呃那个,因为很多这些行情数据都可以去刷新了嘛, api 接口直接拉的都可以拉的出来的。 那核心的思路呢,其实就是把 ai 当团队用, timi 就 负责读,然后 coco 负责搭,还负责改造,那我呢,就负责想啊,就就这样就把这个系统给搭建出来了,后期我还会搭其他的一些板块,但那个就不一一展示啊,其实逻辑原理是一样的啊, 也非常感谢大家的观看。到这里,然后这就是一个通过一百七十篇研报,还有十个维度分析搭建出来的大 a 的 中长期的一个投研的体系啊,这是第一个模块,后续我还会更新更多的手搓系列啊,大家多多点赞关注。

上期视频我分享了 cloud code 的 安装和常用技巧,但真正用过的小伙伴肯定会遇到一些问题,比如没法联网搜索、没法识别图片、没法阅读网页、没法监控上下文进度和 coding plan 的 使用情况。哈喽大家好,我是专注用动画科普 ai 的 阿 k, 接下来我就为大家一一解决上述困扰。本期依然全程无广走你。 其实想解决联网搜索、图片识别和网页读取这三个问题,只需要用到一个叫 m c p 的 技术。简单来说,以前 ai 的 能力往往局限于自身的知识库,但有了 m c p 以后, ai 就 具备了使用外部软件的能力, 所以从某种意义上来说, m c p 就是 ai 和外部软件之间的一座桥梁。那到底装哪几个 m c p 能够解决上述三个问题呢?这里我给大家推荐目前 github 上最主流而且确实能打的三个免费开源方案。第一种是用来搞定联网搜索的,叫 brief search, 它的强项在于拥有独立的搜索锁影,而且对 ai 的 读取特别友好。第二种是用来解决网页读取的,叫 fetch, 它能过滤掉网页里的杂乱元素,只把最核心的代码和文字扒下来给 ai 看。第三种是搞定图片识别的,强烈推荐 screenshot mcp, 它能自己截取你当前的画面或者指定窗口去分析报错的原因,这种直接让 ai 看图排错的体验妥妥的极品。接下来我就以 brave search 为例,为大家演示一下如何在 cc 里安装 mcp 工具。 首先你需要有一个 brief search 的 api key, 具体获取方法大家可以问问 jimmy, 为了避免被限流,这里实在无法展开了,只有拥有这个 api, 才能安装它的 mcp, 并获得每月两千次的免费搜索次数。放心哈,个人绝对够用了。 然后我们需要打开终端,粘贴这串代码。注意哈,这里要换成你获取的 api key 哈,那敲完回车,等它自动跑完,你的 c c 就 正式通网了。那另外两个工具就没这么复杂,不需要 api, 直接分别执行这两串命令就行。 那这三个外挂都装好了,具体该怎么用呢?简单,比如你直接敲一句,帮我搜一下某某某某,他自己就会去调用 brave search。 又比如直接甩个链接过去,按这个链接里的开源项目说明,帮我搭个环境, 他马上就能又快又准的执行任务。那遇到程序跑不通的情况,也连截图软件都不用打开,直接给他发一句,看一下我现在的屏幕,帮我找找 bug 出在哪,他就会自己咔嚓一下,截取当前的画面去排错。总而言之, m c p 工具的好处就在于清亮和即杀即用,而且 github 里面好用的 m c p 一 抓一大把,大家感兴趣的话可以自行探索哈。 ok, 那 接下来就是解决上下文监控和 callin plan 用量的问题了,大家看这里,这是我安装的一款名叫 cloud hud 的 开源插件,它的优势就是能够挂在在 c c 输入框下方,并且以进度条形式直观显示上下文用量和 callin plan 用量。 那有了刚才安装的 m c p, 我 们只需要把这个项目的仓库地址丢给 c c, 然后让他帮忙安装就行了。但是大家注意,这个插件原本只能监控 cloud 的 订阅套餐的用量,而我用的是国产 callin plan。 所以 接下来我想告诉大家,我是怎么通过使用 c c 来改造这个插件的。 首先我上期视频说过, c c 终端版最大的优势就是自由度高,而且这个插件又是开运项目,这就意味着我们可以用 c c 来修改插件代码。然后我分析 cloud 套餐机制和我使用的国产套餐机制是一样的,都是无小时限制加上周限制, 所以我只要能够获得我的套餐的用量数据,然后把它们替换到插件里就行了。所以我第一步是先让 c c 用 brave search 搜索如何获得我使用的控制 plan 的 数据。第二步就是让 c c 写个脚本,把我的国产套餐的数据替换到插件里面,读取 cloud 套餐数据的代码中,然后设置每五分钟刷新一次,这样我啥也不用干,刷刷手机就完成了。但是这个时候出现了一个问题, 就剩下文监控还是进入一条形式,但套餐监控变成了文本形式了, 按道理来说也能用,但是我有强迫症,我想既然可用的套餐可以用进度条显示,我不过只是换了数据来源样式,应该是不用动的。所以我用自然语言告诉 c c, 我 要插件原本的进度条显示,颜色搭配也必须遵循原来的插件。然后没多久 c c 就 帮我改好了。 当然我说的很简单,它中间其实还有不少细节,受限于篇幅没法展开。但我真正想告诉大家的是,知道原理就自然知道怎么做。比如我不知道什么是前端,什么是后端,就无法修正进度条显示。 所以大家想要玩好 ai, 真的 一定一定一定要多动手多尝试,从而提升自己的知识储备哈。 ok, 那 以上就是本期视频的全部内容了,我是专注动画科普 ai 的 阿 k, 无惊无险又到六点,下了个班。

想用上 ploco, 体会大家说的帮你把活干了的推背感,但是打开教程就看到命令行终端。不要怕同学们, ploco 的 用户分两种人, 第一种就是已经会写代码的程序员们,他们呢?会用终端或者代码编辑器,终端速度快,代码编辑器可以直接看到 ai 一 行一行在改些什么, 但是他们都有一个共同点,是要碰代码而不会写代码的普通人。比如我推荐大家直接上桌面 app 敲黑板卡扣。桌面版不是低配版, 桌面 app 跟终端是用的同一个引擎,它有的功能桌面 app 都有,只是换了一个皮肤, 但是他的上手门槛超级低,你只要点击下载登录,打开这个 code 的 tab, 指定给他一个文件夹,同学们你就可以开始 write coding 了。这面板还可以直接在窗口里面预览结果, 所有的 session 都一览无余。这些都是终端版里面没有的功能,全程不需要你敲一句命令行, 这才是普通人拥有的 ai 屏存。哪天你想试试终端版的皮肤,随时都可以做切换,那装潢卡扣可以用它来干什么呢?下一条告诉你。

很多小伙伴问怎么让 cloud code 接上 deep seek? 这条流程我从头到尾给你讲一遍,照着走就行。 视频稍微有点长,建议先点个收藏,耐心看完,按步骤动手。先说清楚, cloud 是 anforepic 的 网页和 app 聊天助手,你打开浏览器就能用。而 cloud code 是 跑在你电脑终端里的编程搭子, 它能直接读你的项目代码,改文件、跑命令,相当于把 ar 装进了你的工程目录。更狠的是,凭借社区里那一大批开源 skills, 它还能调度你电脑里的一切浏览器表格、邮件、设计稿,几乎想自动化什么都可以。 为什么要接 deep seek? 两个原因,在国内访问稳定,不挂代理,按 token 计费,也比海外接口便宜不少。而 deep seek v 四 pro 的 能力,应付日常写代码、改 bug、 做重构绰绰有余。 开始之前先准备两样东西,第一, node js 十八以上版本提前装好,长期支持版就行。第二, get for windows, windows 用户必装,不装后面依赖会报错。 第一步,安装 cloud code, 在 开始菜单里搜 power shell, 右键以管理员身份运行。打开窗口后复制官方的 m p m 命令,粘上去回车,等它装完。 装完输入 cloud, 加上版本参数,看到版本号就说明装好了。第二步,获取密钥, 进入 api 开放平台,进入控制台后,在左边的侧边栏找到 api keys 这一项,点进去, 页面下方有一个创建 api key 的 按钮,点一下弹出小窗,给这把密钥起个名字,比如就叫 demo, 然后点创建, 创建成功之后会弹出一个密钥字符串,立刻点复制保存到记事本或者密码管理器里。特别提醒,关掉这个窗口之后,密钥就会变成密文,再也看不见。 如果你不小心丢了,只能删掉,重新创建一把。第三步,配置 cloud code, 打开文件资源管理器,进入 c 盘用户目录,再进入点 cloud 这个文件夹。 如果看不到点 cloud, 要先在查看里把隐藏项目和文件扩展名都打开, 然后新建一个文件,名字叫 settings jason 把这段配置直接复制进去,把 api key 行换成你刚才复制的密钥保存即可。第四步,验证打开终端或者 power shell, 输入 cloud, 回车 看到红色边框的欢迎界面,模型型显示 deep seek v 四 pro, 就 说明已经成功接上 deep seek。 最后再送一个加分项。如果你平时在 vs code 里写代码,配好 antropic 官方的 cloud code 插件, 装完进入侧边栏的 cloud code chat, 它会自动识别你刚才配置好的账号,直接就能在编辑器里聊天和改代码。 整个流程下来,你就拥有了一个本地终端加编辑器,双端可用的用 deep seek 驱动的 cloud coat。 你 学会了吗?欢迎评论区聊聊。

hello, 大家好,我是阿亮,这期视频呢,教大家如何把 codex 接入国产模型,比如说接入 deepsea codex 和 cloud code 呢,不一样,它不支持修改配置文件来切换模型。最初呢,我也是想直接用其他的工具来接,比如说 c c x, 但是折腾了很长时间,发现问题比较多,也很复杂,所以呢,就自己动手来搞定的一个专门的工具, codex 杠 switch, 用这个切换 codex 的 模型就方便多了。接下来呢,就照着我整理的这份 codex 文档,一步一步带大家操作。 首先点击文档中的 codex 杠 switch, 跳转到下载页面,根据自己的电脑 选择安装包。下载后呢,双击打开,我们就以 deepsafe 为例,这里选择 deepsafe, 然后点击这里到 deepsafe 官网去申请 k, 这里有每个模型的申请 api k 的 链接好,点进去呢,就是开放平台,点击 api case, 创建 api k, 然后把拿到的 k 复制到这里就行了。然后点击蓝色按钮,这个时候呢,就切换成 deepsafe 模型了,现在呢,需要重启 codex, 记住这里一定要把 codex 关掉,重新启动, 可以看见这里的模型变成了 deepsafe, 输入一条消息试试,如果它有回复说明呢,就接入成功了。 点击红色按钮,也可以一键切回官方的 jpt 模型。注意切换后必须重启。 codex 这个小工具呢,目前支持主流的啊,国产模型也可以自定义模型,每次启动 codex 前呢,把这个工具启动了,就可以顺畅地用国产模型了。 这一期呢,我们主要是想要通过一个案例带大家整体走一遍流程,更熟悉这个扣带子的使用。很多人觉得呢,做一个案例或者做一个东西之前呢,要先想清楚做什么功能啊,有什么样的风格等等吧,就想了好久好久。其实我们根本没必要 给他最简单的提示词,让他呢先做一个东西出来,然后我们再挑毛病。好了,接下来我们直接开始 新建一个项目文件夹,直接命名为汉堡店,然后新开一个对话,添加新项目需求呢,就一句话,帮我做一个汉堡店的网页回车 codex, 自己理解,自己拆任务,自己给方案,它还可以自己的生图,因为它接入了目前最好的模型啊, gpt 杠一, mate 二,这个是最好的生图模型,我也没仔细看啊,先让它跑一半问出来再说。 哎,过了一会呢就出来了,但是我发现他的主页呢只有一张图片,这样感觉真的是太干了,餐厅也没有什么特色,我想每天都有一个的特色汉堡啊,以一周七天来循环,让他来修改 主视图,图片改为五张图片轮播,设置每天的特色套餐,每日的优惠套餐以一周为一个单位啊,一周为一个周期。每天的菜单呢,可以点击观看,并且每个套餐呢都有相应的配图。 顺便再说一下, codex 是 内置了当下最牛的生图模型,一面之杠二点零模型,比香蕉呢强了不少,改好了来看看效果啊, 这是汉堡店店内环境呢,是必须要有的,然后我输入加入醒目的店内环境图片,分别有,后厨的呃,制作区,冷藏区,前台用餐区,卫生区,冰激凌帐。每个区域呢都有至少两张图片,图片看起来是在同一家店。 好的,等会效果还不错。我们新开一个对话,打开计划模式输入,把这个项目改造成 next js 框架。如果你不知道 next js 是 什么意思,可以再新开一个对话,问他什么是 next js, 然后使用 codex 内置浏览器,我们点开批注按钮,这样的话,你想改哪里啊?直接就能在这里改。比如我想让这个汉堡的价格是零,直接点击这里,价格改为零, 想改哪里呢?都可以在这里直接进行修改。但如果你想让别人也可以打开这个网页,只需要打开 codex, 问他怎么让别人也能打开这个网页。这个也算是给大家留一个作业啊。总之一句话,遇到不会的或者不懂的就去问 codex, 把我们的思路一定要转变过来, 大家有兴趣呢,也可以去尝试着做一点自己的东西。 ai 时代,我们用 ai 工具呢,最主要的就是用来创作,然后提升自己的效率,让我们成为一个 maker。 好 了,这期视频呢就到这里,下一期我们再继续讲 codex, 大家点点关注哈,跟着阿亮学 ai。

步,随便打开一个文件夹,进入 ctrl 里面等一下。第二步,在命令行中输入这一这一行命令就行。

我不是程序员出身,连代码都不会看的那种,但是现在我店里面的上新全部都是交给我用 ai 写的一套东西在自动跑, 这是我自己的一个手机壳,淘宝店铺,我给你看看它能做到什么程度。这里有十六条待处理的商品信息,其实自动上架是整个上线流程最后的环节,所有东西准备好了再来咨询。 有人会说会被反爬程序识别,但整个的原理其实和一些 l p a 的 自动化工具是一样的,所有都是通过浏览器来操作。 具体看一下这里的详细对比,我用这个程序还未被触发过,当然你一天干个几百上千条链接还是有可能被监测的。 整个过程是非常丝滑的,就是完全模拟人工的鼠标轨迹在跑,点击提交,打开信息,这就完成了一条链接的上线。 批量处理图片,以前是通过 ps 进行一张一张的导出, 然后现在是通过程序可以把全部的图片一次性导出来,它的图片全部都分门别类存在这里了,每一张图片都有清晰的命名,这是为了方便后续的上架处理。 这些都是程序通过调用 chat gbt 的 image 二点零的模型生成的场景图和效果图, 然后会自动进行处理,处理成一比一的主图,还有三比四的主图,直接自动化生成每一个产品链接的横幅可以放在详情页上面。 我不是技术出身,这是我一点点摸出来的, 这个账号会一直记录我踩过的坑,我试出来的东西我会原原本本的发出来,要是你也在做电商,可以跟着看看。

大家好,今天给大家分享 cloud code 的 操控 kimi ceo i 的 原理啊,我最近用的比较多啊,因为确实太省 token 了,能把我的产出的量极大的提升,所以也给大家再做一期深度的拆解 啊。我们先给结论啊,给操作方法怎么用其实比较简单啊,你就把 kimi code c o i 的 官方文档发给 cloud code, 然后他读文档,读完之后他就能理解怎么去操控了,这个就一步就到位了,其他的什么都不要做, c c 其实是非常聪明的 啊。然后我讲一下原理啊,首先做两边的架构对比啊,其实 kimi 跟 carl code 这边的架构是大差不差的啊,可能 kimi 这边参考的会多多一些。然后基本上就是一个 carl code 的 拍摄的翻版, 包括这些代理搜索, mini 行这些都差不太多啊,这就是一个架构的双栏对比啊,这个我呃简单解说一下,就是告诉大家为什么调用这么丝滑。首先有一个 print, 呃, curlcode 通过这个 print 的 调用呢,就会取代我们平时的打字,就不用去打字,跟这个 kimi c y 沟通了,这个 print 就 解决一个是一个管道,把提示是从这个管道喂进去,然后结果就从这个管道吐出来, 然后就 ok 了。然后这个 yolo 呢,是一个全 pass 的 一个一个命令就是呃, curlcode 的 调用, kimi 就 用这个,这个命令之后就不用点什么,批准了它这个就没有了,它全都是自动批准。 那第三个呢,就是中间的过程,这个 card code 也是不读的,它只要 kimi c y 的 结果,所以给个快的,它就不会输出过程了,只反馈最终的结果,所以这三个开关加在一起呢, kimi c y 就 变成一个把文字输进去,然后文字输出来的一个黑盒, 然后 card code 呢,就直接能通过管道去调用它,所以就很方便,非常的丝滑,这是一个调用的流程。就是首先你的 c c 呢,肯定是需要评估这个任务本身的 啊, c c 比较聪明嘛,所以他当时回关是非常合适的,像他就有点相当于你公司的高管。然后他去分析了之后啊,就需要判断什么活交给 timi 合适,什么活他干合适,然后适合 timi 干的,他就开始写提示词, 然后写出高质量的提示词啊,这个提示词绝对比比我们自己写的那个质量高太多了。然后呢,他就通过这个高质量的提示词发给 kimi, kimi 呢?接到了提示词,通过管道收到之后,他就去开始去干活去了啊,而且这个是能多个 kimi 一 起干活的,可以放出多个 kimi 的 a 卷一起干活, 然后 cloud code 可以, 然后接下来就验收结果不合格,然后再返回 kimi 接着干,然后 kimi 同时还能这个承担这个质检跟审查的功能,还可以呃, cloud code 还能放出多个,启动多个 kimi 进行不同维度的一个质检, 所以全程下来 cloud code 的 指向跟判断,然后这些写跟查都给 kimi 在 干,所以非常省头等省了很多。然后这是一个写文章的举例啊,就比如说我们写啊,小说啊,或者写写那个公众号之类的, 就是 kimi 他 会组装这个提示词啊,设定啊,角色前文这些,然后 kimi 来写,然后再验收,初步验收一下,然后最后最后再派 kimi 进行这个文章的连续性 ai 位跟逻辑的这个三路的质检,质检合格了 就过了,质检不合格,然后让 kimi 再返工再改。所以 cloud code 其实就是一个监工的角色,它 top 肯能省很多,百分之百到十五吧。 然后这个是一个翻译网站,嗯,我自己有做英文的网站,做了一个大战,这两天在翻译成 西班牙语。那西班牙语呢?你让 cloud code 全部翻译,那绝对是一个很大的量,也不是说会干很久了,只是说非常费头肯。 但是呢,翻译这个工作其实给 kimi 干就非常的合适啊,就是每个模块啊, color code 就 指挥他翻译,翻译完然后自己检查一下,没问题再接着翻译,基本上就这个链路一直下去就可以了。而且在这个过程中呢,还能让 kimi 自己进行独立的审查, 翻译完之后再审查一下合不合格,然后最终啊 color code 进行一个验收,然后我在做网站的时候还让他进行测试,就是 color code 可以 去 呃让 kimi 的 a 卷进行整个网站的全功能的测试,就是打开每个页面进行个浏览测试,所以这些重活累活都可以交给 kimi 去看,非常省 tokyo。 然后这个是第三个概念,就是你的数据量,如果你要分析很多数据量的话,那其实,呃, cloud code 来分析确实也是很烧 toky 的。 呃,所以还是要用 kimi 去做一些数据清洗啊,然后统计分析,然后分析报告啊,这些都可以让 kimi 干。 kimi 其实智商挺高的,绝对是够用,当个小当 google 的 小弟是没问题的 啊。这个是市场调研的举例啊,就比如说你们要做一些市场调研,无论是电商啊好,还是大家是金融机构的,要写报告也好啊,这种多路的多线路的调研啊,量非常大的调研,你都可以交给这个这个 kimi 去干, 包括行业的规,行业的分析,竞品的分析,然后用户的画像这些都可以放出多录的 kimi 去去分析,然后结果汇总之后,呃 cloud code 再进行一些验证跟排查,就能出报告了。 最后做一个总结就是,呃,这个操作体系呢? send token, send token 就 代表着你的 cloud code 可以 有更多的产出, 相当于如果是五倍的话,那你可能就多了三四倍的产出,而且 kimi 是 能保证质量的,呃,一个 ai, 所以 大家也可以多用一下这个吧,我觉得是挺好用的。好,今天的分享到这里,谢谢大家。

大家好,今天教大家如何使用 cloud code 进行 e s p 的 自动化配置。首先我们需要按照指导书要求把拓扑图搭建完成,然后保存到文件家,用 c c 去读取到文件夹中的拓扑图以及我们需要让它配置的要求, 然后他就会去把设备的端口给记住,并且开始配置。这里我们可以看到他已经在设备的命令行开始了内容配置,我们快进一下,等他配置完成。在这过程中出现了一点小问题,就是 c c 在 接口上没有很明确,导致配置错了接口还是需要人为纠正一下。 最后我们进行测试,发现 p c e 去聘其他主机均能聘通,表示实现了跨危乱进行通信。最后如果你也需要使用 n s p 的, 可以评论区留言交流,并且后续我会更新 c c 更多的使用方法。

今天想给大家分享一个我用了这么久 skill 总结下来最有用的一个设计原则,就是原子化加编排 啊,我们先不讲概念,直接看它最终的效果会长什么样子。我这里做的一个 agent 的 工作流是我输入一个抖音博主的主页链接, agent 的 就会一步步的帮我把这个作者的信息数据,以及他历史发布的所有作品的内容和数据全部采集下来, 最后还会给每一个作品打好内容标签,然后汇总一份报告给我。我们看一下这个项目的 skill 目录,就能很直观的感受到 原子化和编排到底是什么意思。这里有十来个原子化的 skill, 他 们每个 skill 都只负责一件很小的事情, 比如说这个就是解析抖音博主的作者信息的一个 skill, 然后这个就是采集这个作者历史的每一条作品的数据,还有一些音视频封面文件的一个 skill, 这个就是如果是图文作品的话,那会对图片进行一个 理解,然后提取图片上的文本的 skill。 这个呢就是如果是视频的作品的话,就会去抽取视频的音频,然后把音频转写成文字的一个 skill。 在 这个转写 skill 里面,因为我是通过远程连接我的 windows 电脑,帮我去做 gpu cuda 加速转写的,所以这里会有一个远程 cuda 转写的这样一个 skill。 这个就是转写完之后,再用大语言模型做一遍润色,因为有一些专业术语之类的需要 啊,经过大语言模型做进一步的润色和处理的。最后就是两个给博主和他的作品打内容标签的 skill, 这里面每一步都是一个独立的原子化的 skill, 它们每一个 skill 都只处理一个 很小的原子化的任务,做完他就直接吐,结果他也不管上下游是谁。那说完了原子化编排是什么意思呢?编排 skill 的 唯一作用就是把这些原子化的 skill 串成一个完整的工作流, 我们可以打开这个编排 skill, 看一下它长什么样子。首先就是它会解析我给出的指令,就是抓取哪一个博主的 数据,然后抓取的作品有多少条。然后我们主要看一下它的工作流程。第零步,它会去调用一个 skill 去做健康检查,看一下我远程的那个 windows 电脑是不是可连接的,然后 c u d a 啊,还有一些依赖项是不是可用的。 然后第一步就是去调用解析作者的这个 skill, 拿到博主的一个概括和信息。第二步就是 采集作品的 skill, 把这个博主的所有作品都抓取下来,包括作品的一个基础信息数据,还有音视频和图片的原文件。然后第三步和第四步就是作品拿到之后分成两种 作品类型,如果是图片的话,走 ocr 提取文字的 skill, 如果是视频的话,那么就走视频音视频转写的一个 skill。 第五步就是用认色 skill 优化一下一些专业术语, 因为 whisper 转写对中文还有一些专业术语,它处理的是不够准的,所以这里需要用大圆模型做一个润色处理。第六步就是基于抓取到的所有作品的内容,跟我协商出 几个作者级别的标签,然后第七步就是为每一个作品打上这些标签,最后就是给我输出一份总结报告,那这里我们可以注意到,就是编排 q, 它自己是没有任何新的逻辑的,它 整个 skill 点 m d 里面就只做一件事情,就是声明工作流总共分为哪几步,但是每一步具体要怎么实现,其实是写在被调用的这个原子化的 skill 里面的,它并不在编排的逻辑里面。那么为什么要这样做呢?我觉得这么做是有三个好处的。 第一个就是让我们去设计工作流,还有设计 skill 变得非常简单,如果你要做的一个工作流或者是一条流水线,它的链条是比较长的, 一上来我们就想把它写成一个可以用的 skill, 让它能跑通,会发现是寸步难行的,很多时候边界划不清楚,流程理不顺,调试起来也很痛苦。但你拆成一个一个原子化的 skill 之后,会发现每个 skill 其实它的实现都是比较简单的, 可能几分钟就能跑通一个,这样的话我们一个一个 skill 去搭建起来,去验证起来就会非常简单了。 第二个好处就是这么做它的可叠代性会非常强。如果我们把所有的业务逻辑都放在一个大的 skill 里面,那么跑起来之后我们去想要单独去优化某一个环节, 我们需要在几百行的 skill 点 md, 还有一堆 reference 文件或者是 scripts 脚本文件里面去找到 某一段或者某一行,改完之后你还担心破坏别的步骤,我相信做过大 skill 的 朋友应该都能懂这种感觉,那么原子化之后我哪一步效果不好,需要优化,我只需要去改那一个小的 skill 编排很多时候根本都是不需要动的, 这么优化起来的话,我们的目标和方法都是非常明确的,根本不用担心破坏整个工作流。第三个好处,也是我觉得最重要的一个好处,就是原子化的 skill 是 可以被附用的。你看刚刚那十个 skill 里面,像图文、 ocr、 音频转写、润色、打标 这些其实都是跟抖音这个平台无关的一个通用能力,所以我现在做的是抖音这个平台的工作流,那后面我要再去做小红书,做 b 站 或者做视频号的类似的工作流,那这些 skill 其实一行都不用改,我只需要再去写一个新的编排 skill, 按同样的格式把它们串起来就可以了。 所以原子化的 skill 攒的越多,我们下一个新的工作流的搭建成本就会越低。而如果我们把整个流程都做在一个大的 skill 里面的话,那我们想要再附用到别的平台上,可能就没有那么简单那么清晰了。 最后我们可以看一下这个 skill 实际跑起来的一个表现啊,我只需要在绘画里面调用这个 skill, 然后丢给他一个抖音博主的主页链接,然后跟他说要采集他的所有作品, 我们就可以看到他一步步的去调用我们刚刚在那个工作流编排那个 skill 里面串的那个流程。第一步去检查我的 windows 是 否可连接,依赖是否都已经安装好,第二步就去解析这个作者, 第三步就去拿到这个作者所有的作品,第四步就去把他的视频进行了转写, 会推送到我的 windows 电脑上,然后一个个去做转写,转写完成之后,他会自动去做一个 l l m 的 大圆润色,转写完成之后就自动进入下一步,根据这个博主的历史的所有作品内容去归纳他的一个内容标签,然后跟我协商确认, 我确认完之后,它就自动地去为它抓取到的每一条作品去做达标,最终就给我生成了一个总结汇报。 整个流程除了我在它提取作者标签那一步参与了一下确认,其他全部都是由 agent 自己一步一步调用各种 skill 去完成的,我觉得整个流程真的是非常清晰的。那最后我们也可以看一下最后最终它产出的一个结果。第一个是这个数据库 啊,我们可以看到每一个作品就是一行数据,它有标题,有正文,有标签,然后是什么时间发布的,以及各种点赞、评论、转发收藏的数据,包括说各种原文件、音视频 封面的原文件的这个文件路径也都采集进来了。然后第二个输出的话,就是每一个作品的音视频, 还有封面的原文件,还有转写完之后的这个文字稿,都非常格式化地落在了我的本地的文件夹里面, 那么这期就到这里,如果你也在做页尾整的,需要搭很多可附用的工作流,可以尝试一下用这个思路去做你的 skill 的 设计。如果大家觉得对你有帮助的话,可以帮我点个赞,点个关注,我们下期再见!