粉丝9281获赞2.9万

oppo 四点六到底留在哪里了?为什么 oppo 四点六发布仅十二个小时,摄像头就炸锅了?那么接下来我就结合自己的实测和专业拆解,总结了几条实际有用的分享给大家,大家可以关注收藏。最重要的升级还是上一份能力的待机升级 到这两个重点即可,一是他是首款开启一百万 tock 上下文窗口的模型,一百万 tock 什么概念呢?差不多是一本公式法的所有内容。二是在一个专业的上下文测试,大约六分钟,得分达到了百分之七十六。什么意思呢?作为一个对比啊,之前的旗舰模型三点四点五只有百分之十八点五, 这就意味着大魔星已经彻底告别了鲸鱼记忆,在上海文中查找信息更准确,推理力更强了。紧接着呢,就是逻辑推理了,重点新增了自适应思考的功能,之前的深度思考模式只能手动切换选择, 现在是自适应的,可以自主判断什么时候需要。更恐怖的是,还引入了更高密度的思维念,在回答前会进行多人的自我博弈。 比如说我上面那个例子中,通过理解一堆源码内容,能够精准的发现代码里面的笼络和错误。另一个也是非常关键和重要的, 就是 office 四六六的定位已经不再是瞎聊天了,而是能真正干活的。 agent 的 模型有土匪证啊!咱们不妨看看当 starbucks 放出来的十三项精准成绩,你会发现有十项全都是 agent 的 能力相关的,比如工具的调用,复杂任务中的自主判断, 上一个理解的一致性等等。最后一个重要的更新,也是最具前瞻性的一个就是 agent teams 多 agent 的 协助就是你可以在 cloud cloud 中同时使用多个 agent, 让它们并行工作。比如你要做一次代码库的审查, agent 一 负责审查前端代码, agent 二负责审查后台代码 agent 三负责检查安全问题 agent 四负责检查性能瓶颈。这些 agent 呢,可以自主协调,互不干扰。这和新人事业的团队协助一样, 不是一个人做完所有事情,而是专人专事,并行推进。第一时间了解以上更新,你就可以直接上手使用 office 四点六或者 color code 了,也就拥有了先人一步的超凡生产力。关注我, ai 时代不迷路!

大家好,今天给大家分享 cloudco 创始人在推特上分享的他们的团队是如何使用 cloudco 的, 他总共分享了十三个小技巧,我觉得非常能提升你使用 cloudco 的 效率。那废话不多说,我们直接来看看。 那他给的第一个建议是并行处理多个任务,他一般来说会在终端里面开五个 tab, 然后开启系统通知,当某个任务需要你的输入的时候,你再切换打开。 而且除了本地之外,他还在网页端同时跑五到十个的绘画,然后通过一些操作让多端进行协调,当你在终端运行命令加上 end 之后,就可以把本地的绘画接管到网页端,一整个的效率就拉满了。 第三个是他推荐所有的工作都用 up 四点五,并且开启思考模式。虽然 up 比其他的模型更大更慢,但因为这个模型它需要更少的引导工具的使用能力也更强,最终几乎总是比用小模型更快, 当然最近就是已经有了 up 四点六。呃,我觉得整体的核心逻辑就是我们要用高阶的模型,省去您很多修改 prom 的 时间。 第四个是他们整个团队会共享一个 cloud md 的 文件,每当看到 cloud 做错了什么,就加到 cloud md 里,这样 cloud 下次就知道不要这样做了,这就形成了一个良好的循环。第五个是在 covid review 的 时候,通过 app 机器人的方式,让 cloud 自动把一些信息记录到 cloud md 文件里。这是一种利用 ai 自动维护项目文档的技巧,你不需要离开浏览器回到本地去修改文档, ai 会自动帮你更新规则。 然后第六个是它建议大多数的任务都要从 plan 的 模式开始,这也是我在过往的 ycode 顶的 教程里面推崇的一种方式。我们要先把计划做好,再让 cloud 进行开发,会减少很多来回修改的一个过程,在终端里面按两次 shift 加 time, 就 会进入到 plan mode 的 模式。 第七个技巧是 boris 会对每天重复做很多次的一个内循环的工作流,用斜杠命令放在 cloud commands 目录下,比如 boris 和 cloud 每天都会使用几十次 commit push pr 这个斜杠命令正常,你给 ai 说帮我提个 pr, ai 可能需要思考, 然后再调用工具,然后再去获取结果,然后再思考。那每一次提交一个 pr, 你 都要进行一次这样的循环,会消耗大量的 token 跟时间。 那你提前设置好这个斜杠命令, ai 就 不需要思考。用斜杠调起这个命令之后, ai 就 直接操作,就减少了你输入 prom 以及也减少了 ai 的 思考时间,直接可以快速的执行。 那第八个是用子代理来做流程的自动化,它会专门让 cloud 去调用一些专门的子代理去处理一些单一的任务。它这里展示的是它现在目前最常用的一些子的代理,比如说像这个就是专门负责重构用于代码的一个子代理。 呃,第九个是用 post to use 钩子来格式化 cloud 的 代码,大家写代码最烦的就是格式错误导致 ci 挂掉,那创始人 boris 的 绝招就是使用 post to use 钩子。简单来说就是在 cloud 刚写完代码的瞬间,后台它会自动静默地执行一遍格式化工具, cloud 负责搞定百分之九十的逻辑钩子负责最后百分之十的细节, 这样不仅你的代码会比较整洁,更重要的是它建立了一个自动验证的一个防线,不让低级错误来浪费你的部署时间。这个就是 boris 它在后台配置的一个 post to use 的 一个脚本。 第十个技巧是,当我们在用 cloud 的 时候,它经常会停下来申请去获得一些操作的权限,可能为了快速,或者说也比较懒,然后没有认真的去看,就会无脑地给权限或者跳过,那可能会有一些安全的问题。 boris 就 建议我们可以对一些常用的进行 预先授权,只要输入斜杠 permission 就 能进行操作,而且它大部分的操作都会和团队去共享,这样就可以开通一次权限,全团队都不需要再重复开间距了,效率也保住了安全。 那第十一个技巧是,它会用 cloud 去调用不同的工具,比如它会让 cloud 去抓报错日期,然后直接根据日期去修 bug, 修完顺便发一个 flag 告诉老板,这样 cloud 变得更加强大。 那第十二个技巧是,当你处理长任务的时候, ai 会经常停下来问你接下来去干嘛, 如果你不能及时响应,反而会耽误 ai 生产的时间,那它给的建议就是它会提示 cloud 在 完成之后使用后台代理去验证 ai 的 工作,然后再使用 agent stockhook 进行更确定性的验证,或者去安装一个插件,他推荐这款插件,这个插件会让 cloud 自动 继续,直到任务彻底完成,这个会让你的长任务处理变得更加的自动化。那最后一个技巧是 boris 认为最为重要的一个建议,给 cloud 一个验证工作的方法,如果 cloud 拥有这种反馈避反,它最终结果的质量将会提升两到三倍。 简单来讲就是 ai 写完代码之后,需要运行在线上看一看,让 ai 自己能够看到这个结果,然后去判断这个结果是否合适,然后再做一些正常的调整。那 boris 的 方式是对于提交到 cloud ai 或者 cloud code 的 每一项改动,它都会通过 cloud chrome 扩展程序进行测试,它会自动打开浏览器去测试 ui 界面,并且不带的迭代。只要代码能够正常运行,且用户体验良好,那在不同的领域,其实验证的方式都各不相同,它可能简单到只是运行一条命令, 或者是运行一套测试主键。那像 boris 的 话,它是运行了一个浏览器的主键来自动打开 ai 写的网页,然后让 ai 去看这个网页是否能够正常运行哈,再做正常修正。那这个就是 cloud code 的 创始人在 twitter 上分享的十三个小技巧,我觉得 每一个都非常的实用,希望能够帮助到大家。

万众期待的 smart 五没来, ip 四点六先来了,而且来的很猛。先说硬实力, ai 行业里几个公认的测试写代码, ip 四点六拿到了行业的最高分,那么如果你是做金融法律这类知识密集型的话,赢 g p t 五点二的概率大约是占了百分之七十。一句话,多项的核心指标,新的世界第一, 但跑分值表面真正牛的这两个东西。第一个, one million token 的 上下文窗口,一百万的 token, 用过 ai 的 都知道,对话异常的模型就开始上下文污染以及 memory 会丢失,前面说的东西后面已经记不住了,越往后聊会,越聊越差。那么 up 四点六在 一百万 token 的 大海捞针测试当中,得分是百分之七十六,而 so net 只有百分之十八点五,这不是量变,是质变, 它不只是能装下更多内容,还能真正的用好一些内容,不会读着读着就丢失或者污染。对所有人来讲,直接的影响就是 cloud code 在 自动压缩上下文之前,能干更多活,记性更好了。 第二个呢,是 agent teams, 这是 cloud code 的 新功能,你可以同时启动多个 agent, 让它们自己分工,自己协调并行干活。什么意思呢?以前是一个 agent 从头干到尾,现在可以一个团队同时唱,前端一个,后端一个测试一个各干各的 互相检查。那么 rockton 实测的数据非常夸张, up 四点六在一天内自主关闭了十三个 iso, 然后把十二个分配给正确的团队成员,管着五十个人,六个代码长库,他知道自己该干什么,什么该交给人。然后呢, iso 和 api 这边还加了一个比较特别的功能,叫 adaptive thinking。 什么意思呢?就是自适应思考,以前你只能选择深度推理打开或者关闭,现在模型可以自己判断,简单问题快速回答,复杂问题深度思考。 然后接下来就是定价啊,它的输入五美元,输出二十五美元,每百万套坑。所以 up 四点六意味着什么啊?一百万的上下文,它不会烂也不会旺,满了还能自动压缩,继续跑, agent 可以 主队并行。这三件事凑在一起,让 ai 可以 长时间自主的干活这件事啊,终于也算是从概念变成了现实。好了,可以更新你的可 out。

朋友们,祝大家新春快乐,马年大吉!今天一早起来克拉斯尼的模型又更新了,那这次更新呢,有以下几个亮点是值得我们关注的。第一个就是所有的用户都可以直接免费使用,不管你是订阅用户还是普通用户,现在的 ai 大 厂在争夺用户方面真的是下出了血本。 第二个就是他现在几乎可以像真人一样去操作我们的电脑了,特别是像 excel 表格这样的软件,已经接近真人的使用水平了, 那未来呢,真的是可以一句话就做数据汇总或是 ppt 了。第三个呢,就是他现在有一百万透坑的上下文窗口,那这是什么概念呢?这意味着你可以丢几十篇论文进去,或者是一本书,甚至是你把整个代码库丢进去,他都是可以进行有效推理的。 那在之前的模型当中,这么长的上下文窗口模型是很难做到有效推理这一步的,那把它作为智能体的底层推理模型的话,是个非常好的选择,大家赶紧去试试吧。

现在市面上所有的 a 键的工具都配备了 skill 功能,如果你还没用过 skill, 或者用了以后感觉依然有点懵,那这期视频请一定不要错过。哈喽,大家好,我是专注于动画科普 ai 的 阿 k, 今天我站在新手角度跟大家好好唠唠 skill 到底是什么,怎么用,以及使用过程中要注意哪些坑。 skill 其实就是一个 markdown 格式的文本文件,注意,这里的 skill 必须大写哈,这个文件里存的其实本质上还是提示词,只不过这里的提示词必须按照画面上的这个固定格式书写。 这个部分是配置区,它属于是 skill 的 身份证, name 是 它的名字,一定要用英文哈,因为你的 skill 点 md, 文件必须放在 name 同名的文件夹内,这个文件夹又必须放在 a 键的指定的目录,比如我用的 cloud 就 必须放在它的根目录下的 skills 文件夹中。如果没有这个文件夹,就自己创建一个, 那如果你的 name 是 中文,文件夹也是中文,意味着你的文件路径会包含中文。这样 a 键呢,在调用的时候是有可能报错的,所以 name 必须用英文。那如果不理解文件路径跟目录和文件夹结构的小伙伴,一定要抓紧时间恶补一下哈,这些知识既基础又重要。接下来的 description 是 描述定义它是干嘛的和什么时候调用, 这个部分是指令区,也就是写提示词的地方。它规定的是这个 skill 遵循的规则和采用的流程。之所以一定要用 skill, 是 因为它能实现按需加载。简单说就是没活的时候,它不占用任何 token, 只有匹配到任务了, ai 才会把这个 skill 点 m d 文件加载进来。这不仅能极大的节约 token 消耗,最重要的是能让 ai 随时根据你的需求切换不同的专家身份。总而言之,它就是好,就是棒,棒棒,就是该用。 那这里就又有个问题了,既然它本质还是提示词,那到底该怎么规划逻辑,才能让它按照我的需求老老实实干活呢?放心, cloud 官方早就帮咱准备好了一个专门生成 skill 的 skill, 跟紧我一分钟学会部署和使用。 大家直接把整个仓库下载到电脑理解压,找到 skills 文件夹中的 skill creator 文件夹,把它复制粘贴到 a 键的指定位置。比如我用的 cloud code, 就 直接扔进根目录的 skills 文件夹里。如果你用的是其他 a 键的工具,直接问他你的 skill 文件夹在哪,他会告诉你 配置好以后,我们启动 agent, 直接输入斜杠 skill, 就 能呼出这个顶级专家了。接着我们只需要用大白话描述你想创建一个什么 skill, 注意哈,你对需求描述的越清楚,沟通的越细,它生成的 skill 就 越贴合你的需求。如果你没有思路,也可以跟他一步一步探讨,也能得到非常不错的成果哈。 比如我平时经常要用 a 键的开发一些自用小工具,我就用它创建了一个名为 project manager 的 项目经理 skill。 它能让我这种不懂代码的人也能构建出结构科学、功能清晰且具备可扩展性的工具。这玩意用起来真的很顶那聊到这,估计大家心里都在犯嘀咕,这 skill 到底能帮我解决什么具体的问题呢? 我结合自己的实战经验,给大家盘了三个应用场景,相信总有一个能戳中你的痛点。第一个场景主要应对那些繁琐的杂活。 举个例子,大家平时经常开会吧,开完会总得总结会议纪要。以前咱得录音加笔记,会后还要花大量时间去腾抄归档,特别心累。现在有了 ai, 咱们可以直接做一个叫 meeting 的 skill, 把工作留定死。 第一步, skill 只会转写工具,把原始录音瞬间变成文字。但注意, skill 本身是没办法直接做语音找文字的,但这类工具往上一搜一大把,你随便部署一个到电脑里以后是可以用 skill creator, 它会自动帮你写好调用逻辑。 然后是第二步,剔除文稿中那些语气词。接着是第三步,深度分析会议内容,按需整理成档。最后是第四步,把文件自动保存到你电脑里的指定位置。那有了这个 skill 以后,开完会你只需要把原始录音直接甩给他,他自己就去调兵遣将跑完整个流程。 这种一键扫荡的爽感,你用过一次就再也离不开了。甚至如果你的需求更复杂,比如要经常查找不同会议里的重要节点,或者要合并拆分不同的文件,都可以塞到提示词里。 第二个场景是一个真实案例,我每周日都会发一个 ai 新闻回顾的视频,我专门做了一个 skill 来把这个视频生产的各个环节串起来,让我不用在各种工具和网站中切来切去。具体的大家可以看看我这期视频讲的非常详细。 第三个场景就属于是高级玩法了,它是通过同时加载多个 skill, 构建一个完整的生产流水线,这适用于需要多个专业环节配合的复杂任务。 比如在内容生产场景下,你可以配置三个 skill, 一个负责通过数据检测来分析选题,一个负责按固定风格创作文案,最后一个负责排查违禁词和逻辑漏洞。这种模式的核心优势在于,你不再需要分布输入指令,也不需要手动把上一步的结果复制给下一步。你只需要下载一个初始任务编辑呢,就会自动按顺序调用这三个 skill 来完成。 这种模块化的写作,能极大降低大模型在处理长任务时容易出现的逻辑偏移,也就是我们常说的幻觉。这个场景其实还蛮复杂的,我自己也在慢慢构建,以后有成果了会第一时间跟大家分享。 最后有小伙伴想让我聊聊 skill 和 mcp 的 区别,其实一句话就能说明白, skill 是 提示词、是指令,是流程,而 mcp 是 工具,是接口。 skill 可以 调用 m c p 来扩展自己的能力边界,但 m c p 永远只能在 skill 划定的规则下干活。 ok, 那 以上就是本期视频的全部内容了,我专程用动画科普 ai 的 阿 k, 无惊无险又到六点,下了个班儿。

做一人公司呢,必须要有知识库,尤其是在 ai 发展如此快的大环境下。这条内容呢,就讲讲知识库该怎么搭建,包括理念、方法和工具都有哪些。这条内容呢,比较长,大家可以先收藏啊。我看到了很多有关知识库的这个内容啊,我觉得认知都是有偏差的,哎,或者说至少吧,不适合一人公司这个业务场景, 或者说有可能呢,这部分人就不懂商业,他没赚过钱,所以对这个事的理解呢,也是比较浅的。希望我这条内容呢,第一适合一人公司,得有商业变现的价值。 第二呢,就不敢说是最简单的,至少是性价比最高的方案,因为你简单很多的话,还是会牺牲一些效果的。在讲知乎之前,先讲一个看似比较普通的问题啊,就是为什么大家想去用 ai 就 用不好,比如说我想用 ai 去写内容, 或者帮我去做一些咨询的工作,帮我写方案,帮我写脚本,为什么用不好呢?这里个最基本的原因就是 ai 其实他不了解你,他不知道你是谁,他不知道你懂什么,他不知道你卖什么样的产品。所以如果想要把 ai 用好,必须你要先告诉他,你有什么,你是谁,你想怎么去用。 哎,那这个其实就是知识库最重要的意义在这儿,所以你可以理解为你要把知识库建立起来,把知识库做好,你就可以搭建一个你本人和 ai 的 一个沟通和交流的桥梁。那到底什么是知识库呢?我觉得这个事大家理解一定是不一样的,我都不用做调研,在小红书里面,去年很多人靠卖知识库 这个事还是赚到了钱的,对吧?然后能看到很多这样的案例,那小红书里边卖的知识库到底是不是真的我所讲的知识库呢? 呃,你看很多人这个把呃老外的艺人公司的那个网红 danco, 他的内容,或者是纳瓦尔的这些内容把它整理出来,或者是把所谓艺人公司从零到一百万怎么做起来的这些呃内容整理出来,把它呃编好,放到一个非书文档里,或者是把它更好的去呃用更好形式呈现出来吧, 然后放到小红书里去卖。那这个是不是知识库呢?我是这样看的啊。知识库有两个特点,第一,知识库一定是你自己的,像小红书里边,你可能今天举个例子,花九十九块钱买了艺人公司大神单扣的这些内容,有了这样的获得感, 但是有获得感这个知识是不是你真的理解掌握掌握了,这是完全的两回事啊,所以这还是别人的东西,不是你的。哦,那怎么去衡量这个东西是你的呢?有个非常简单的方法,就是在脱稿的情况下,你能不能把它再复述出来, 尤其是在遇到这样应用场景里边。举个例子,比如说有人向你请教一人公司该怎么做,或者是他有些问题,哎,你因为看了别人的这方面的知识库的文档,你能把它给呈现出来, 这叫你的东西,如果不能啊,如果你复述不出来,说明没有吸收它,所以知识库呢,一定是属于你自己的,不是别人的。知识库的第二个特点就是它是用的, 并不是用来收集和收藏的,如果没有应用,知识库就没有价值。很多人我们喜欢去做知识库的原因,就感觉我好像去拥有它, 比如说我把过去的所有沉淀,呃,或者是方法论,呃,文章公式巴拉巴拉把它收集下来,放到这里就大功告成了,对吧?这个完全是不对的,为什么呢?因为就是你没有 应用它的场景,或者你在做这件事的时候,你你的目的性不够,你背后没有商业模式,或者他无用武之地,那么你做这件事他没有意义,他是纯粹浪费时间。所以知识库一定可以被应用,而不是只是用来收集的。那为什么我们觉得知识库这事这么重要呢?比如说你也在关心这条内容,你会去学习它。 原因就是我们做艺人公司其实很重要一个点,其实就是我们的是靠我们知识啊,经验,靠智力、靠脑力劳动来去服务给你的客户来去变现的。 所以在这过程当中我们的沉淀和整合就变得非常重要。对于自己的这种信息知识的这种沉淀,对于每天接收到新的东西的这种整合就变得异常重要了。所以我们经常有感受说,哎呀,我突然想到了一个新的想法,哎,我突然就是在一个这种, 比如读书啊,和跟别人请教交流啊,或者是在跟客户呃交付的过程当中有些新的认知,你就希望说赶紧把它给记录下来,就好像你旁边有一个呃,这个一个桶, 这桶你可以不断的往里扔东西,然后扔了以后你不用担心它会丢掉,对吧?你既然扔了它,你就会知道它一定会帮你啊,很好的把它管理起来。 所以这个其实就是你对知识库里很重要的一个诉求,就是你每天有很多的信息,这些信息不会被丢掉, 然后你有很多的信息,这些信息可以和你现有东西做更好的整合。所以这是我们对知识库这么关心的核心的原因。他有这么重要的魅力的原因就是第一是沉淀,第二是整合, 你可以细想一下,呃,整合这事还是挺麻烦的啊,比如你今天在这个通勤的过程当中有个新的想法,这个想法完全可以融入到或者是和你现有的这个肢体整合起来。但是如果你呃停下来, 或者是你打开电脑,然后把它放在哪里,或者是该怎么去整合,这工作量还是就是还是很复杂的,就事不大,但是非常非常的麻烦,那一旦你没有去做这事,可能就忘掉了。 所以我们希望的这个知识库呢,就是能帮我们做好沉淀和整合的工作。所以对我们一人公司来说,我们一直强调叫做什么?你要做长期的有复利价值的事情, 那既然长期有复利价值,既然我们要做脑力劳动啊,用自己的经验和知识去交付的这个事情,那么知识库就是我们必须要做的,它非常非常的重要。 搭建知识库其实有很多个工具或者流程和方法,所以我在开头时我讲了我希望我的方法性价比是比较高的,以及最适合因人公司的这个应用场景的。我其实试过很多种工具,我包括我一直在迭代我自己的 这个知识库的这种方法,所以我现在综合应用下来,我觉得 cloud 是 非常适合因人公司的知识库的沉淀的,那它需要有一定搭配,所以就会有三个工具,第一个是 cloud, 第二个是这个 flomo, 第三个是飞书,这三个工具把它整合好了,你就可以更好地把你的账簿打印起来了。比如说 cloud, 它的作用在于说它是一个第一帮你去清洗数据,然 然后整合数据,并且记录的这样的一个呃平台。更重要的是它可以通过对话的方式,然后通过智能体的方式,然后呃帮你去解决具体的问题。比如说你要去写篇文章,你可以直接和他对话,呃来去呈现出来,所以它是一个这种交互的场景。同时呢它也可以帮你去记录和吸收, 然后就一整合吧,然后 flow 的 价值在于说,呃,在日常的你有些新的想法,新的这种感受的时候,它可以快速的帮你记录,就是不用等,然后不用去整理思绪,也不用去措辞,快速的把它记录下来,然后把它导出,这个其实会更方便的。那非书的价值在于说把你的这个知识体系知识库, 然后沉淀在这里,方便你去查看和吸收和修改工具讲完了,可能大家会说是不是可以开始去讲怎么去搭建知识库了?还不可以,为什么呢?我,我先跑个题, 我可以跟大家讲,就是搭建知识库的这种操作的方法,呃相对来说比较好学,它甚至不是最重要的,我认为更重要的是就是对于这个事的理解,以及就是你呃能去建知识库的一些前提, 这些前提我认为是能帮助你或者是能让你保证知识库能更好的被应用的一个先决条件。所以我现在跟大家分享一下,就是你要去应用和建立知识库的前提到底应该有什么?第一呢就是建立知识库他必须要有意义,就你做这件事你是为了解决谁的什么问题?你的商业模式是什么? 就这个它是一个工具,它是一个呃,它,你可以理解为它是一个知识体系,那这个知识体系肯定是拿来去做应用的,所以你必须要思考的是,或者是你已经有了这样的一个答案,就是为了谁,然后解决什么的问题,你背后的商业模式吗?商业模式就是你用来去做价值交换, 你可以把你的经验时间付出出去,你你变现对吧?你换来钱,并且这件事能长期持续运转,这个叫做商业模式。其实谈钱不丢人,你会发现在商业这个世界里边,如果说他不能变现或者是长期,至少长期来看他都不能有商业价值的话,你这件事是不值得做的,或者说你要去做也是 怎么说也做不下去,你坚持不了多长时间。第二个前提就是你的知识体系,你知识库啊必须先有个框架,这框架可以是一个呃基本的一个操作流程,或者有几个关键点,呃再简陋一点都没问题。 首先你得有一个最基础的一个框框,这样的话你再去喂给他内容的时候,呃,你才能保证他给出来的东西跟你想要的是一样的,你,你不能说完全塞给他所有的信息,他其实不知道你的主线是什么, 他不知道就是你是怎么去看待这个事的,所以他只能靠他自己的理解。如果你给他很多信息,他靠他自己去理解,呈现出来的话,未必跟你想的是一样的。 我举个非常简单的例子吧,比如说我们在理解一人公司这件事上,我有一个非常简单的一个系统,就首先你要认知到自己的优势什么,然后其次选对赛道,然后设计好你的产品,然后用呃简单的方式做好个人 ip, 然后做好成交,然后成交带来更多客户,然后又会反哺你,更好的去理解你自己的优势。他这五个要素是一个圈, 所以你可以理解我啊,在我的知识体系里面,我至少就分成这五点,那么其他所有的这些信息都可以被安排在这五点里任何的方方面面。那比如说,哎,那这个高客单非标品的这个产品该怎么去设计呢?好,你放到产品里面, 哎,那这个个人 ip 该在拍什么选择题呢?放到个人 ip 里面,对吧?很多人说我不知道我要做什么,我能做什么,擅长做什么,放到个人优势里面,这五个要素就是我的一个最基本的框架。所以对于你来讲的话,你一定要对你做的这个事有一个最基础的认知和理解。如果你完全是一个纯粹是个零的状态下,呃,我觉得他给你的东西, 说实话,呃,你可能很难理解和接受的时候,呃,你就没办法应用,那就违背了知识库的意义了。所以你看 这两个前提,就意味着说我们在做这件事之前还是要能想清楚个大概的。 ai 没有办法在你啥都不懂、啥都不知道、啥都没有积累的时候,帮助你趟出一条路来,对吧?那也不现实,而是说你已经有了个眉目,它能 帮助你做延展,提高你的效率,对吧?然后甚至替代很多的人力的工作,这是 ok 的。 所以你看这两个前提就变得格外重要了。所以可能很多的朋友在看我这条内容的时候, 呃,有有一些想法,但是不够体系,但没关系,你试着把它先做一个非常简单的沉淀,哪怕就刚刚我说的,举个例子,比如说你对一人公司这事你完全不了解,那你能不能总结出三个要点来, 比如说做好产品,然后呃,写好内容,做好成交这三点,哎,这也是一个小框框呀,那你有这小框框以后,你就可以去做延展和推进了, 这个就是我们做知识库里边。呃,在做这件事之前,哈,两个非常重要的前提你必须要具备。好了,接下来就到了搭建这个环节了,其实很简单,你可以跟 cloud 去讲,你要去搭建你自己的知识库,让他去教你一步一步该怎么去操作。你发现这个问题只有 至少在当下啊,只有 cloud 能帮你去解决。基本上问了一圈,呃, cloud 是 最好用或者最清晰的,或者他在过程当中出问题吧,出最少的。 我觉得 glass 很 像一个就是理科,理科直男,他在梳理问题的严谨程度上明显会更好于其他的模型,这是我推荐他的最核心的原因哈,你在这个过程当中出问题的,呃次数是比较少的。比如说我在这个知识库的环节里面,我们已经对话了几十个回合了,没有出现任何的幻觉。可是在其他的模型里面,有的时候他 因为上下文嘛,这是 ai。 目前来说就会遇到一个常见的问题,就是当你的上下文呃次数回合变得很多的时候,他有可能会出现幻觉,他忘了他聊的到哪里了,对吧?他可能忘了之前的这些内容都非常非常正常,但是 cloud 在 这个环节表现的还是 比较好的。所以你就跟他讲你要去搭建你的知识库,他会告诉你要做哪些事情,那我跟他交流的话,他告诉我哈要做五件事。第一呢就是你要告诉他你是谁。 第二个呢,就是你要告诉他你的方法论的库到底是什么?第三就是你要告诉他你有哪些成功的案例,就案例库。第四呢就是你要输入给他你的过去的一些语料,叫做语料库。第五呢就是每日更新的内容,叫做,呃,每日更新的信息库。所以这五点再说一遍, 我是谁?方法论库、案例库、语料库和每日更新这五五个内容。其实这个应该是比较简单的啊,你根据他的要求 呃去回答他的问题就好了,我就不做详细的介绍了。呃,你会发现跟 i 交流就很简单,如果你不知道你接下来要做什么,或者你不知道你的内容全不全,或者是是是不是,呃,是正确的,或者是可不可以优化,你完全可以问他, 你告诉他,呃,你说哪里还需要补充,比如说我再去做提供我是谁这个内容的时候,其实我过去整理了个文档,我就直接给到他了,我就问他,你看还有哪些需要补充,他就告诉我说,呃。你还要告诉我你过去的这二十多年,嗯,都做了,都去哪加工哪些家? 他就告诉我说,嗯,他就说你要告诉我过去的这二十多年里边,然后你去了哪些家,公司是在哪一年,然后做了哪些成绩?这个确实我没有提供,所以他要我去补充这些东西,包括他要让我补充产品的这些信息,我就把他提供给他了。所以当你不知道该怎么做的时候,你就可以去问 ai, 这非常简单的一个事情。 所以这五点里边,我觉得,呃相对来说比较简单。但是我说一下,呃我提供了什么东西吧,我觉得这个是比较重要的,因为发现 他让你去提供这些信息的时候,如果你没有,你发现这知识库照样建立不起来。我们就以方法论库这个事来去讲,就是你的方法论到底是什么,这个还是非常非常重要的。 方法论库其实是一个最呃硬核、最干货的东西,呃,他是代表了你过去的一些经验的沉淀,你可以理解为一些流程啊、方法呃要点,甚至些公式啊等等,或你从实操的这些经验。 呃,这里边有个误区,就是有些朋友把 ai 生成东西过去呃,自己让 ai 生成一些文章,然后把它拿出来喂给 ai, 希望让让 cloud 帮你提炼出这里边的方法论。我觉得这个是有点扯的,为什么呢?就是你拿 ai 生成的东西,然后再喂回给 ai, 让它再去从中去提炼东西,这就是完全浪费时间。 在这个时候方法论库要的是非常干的东西。如果你过去有一些沉淀的呃,比如说工作当中文档,然后 ppt, 然后课件呃,或者是你讲课的这视频音频都可以,那我是怎么做的?跟大家分享一下。我有一个臭毛病,就是会有日常会写文档的毛病,就是当你有一个 呃,研究一个小课题的时候,我会把它写下来,把它沉淀下来。所以当一些很具体的一些场景的问题的时候,我有些比较呃这个深入的思考, 我就会把它给沉沉淀成文字。那么过去的这几年里面,我们沉淀了很多这样的文字,然后甚至我其实已经把它写成了一个十几万字的书稿,那对于我来讲的话,我就把我的书稿 然后拿出来喂给,告诉他这个就是我自己的这个这个知识体系方法论,然后他一下子就把它识别出来了。这时候我发现一个很有意思点,就是你看我喂给他,我就至少有二十万字的东西吧,因为除了书稿以外,还有其他东西,他最终给就是清洗吧,梳理提炼出来的东西非常短 啊,我觉得可能也就几百字吧啊,但是他非常有条理,他把核心的关键环节把他提炼出来,然后就足够了,因为他不需要赘述,也不需要去讲什么前因后果,他只需要把这个要点拿出来就可以了。所以这就我刚才讲的就是当,就是当你如果没有方法论的时候,你把 ai 生成东西再喂给他,这是没有意义和没有价值的, 所以在这一步很重要的点就是你要找到你自己硬核的干货到底是什么?如果这个都没有的话,我说实话咱也不配有这个知识库,对吧? 好,再再给大家举个例子,就是这里边有个叫语料库的,呃,顾名思义,大家知道是什么东西是吧?呃,但是我不知道大家会不会有足够的语料可以提供给他去学习和沉淀,那我是怎么做的?首先就是他也会提示你说如果你有过去你写的这些文章, 然后你这这些文章的这些观点,包括你的表达风格,其实是他需要知道的,所以我就把我过去写的这些公众号的文章呃,打了报给了他。这是第一就是我的公众号内容给他,让他去学习我的这是语料嘛,很重要一点就文字的。然后第二呢,就是我做过很多场直播, 然后我的直播呢,基本上最近的我觉得十几场、二十几场吧,都是和艺人公司相关的,而且都是单口的,而且都是在分享一个很具体的点。然后我卖货的这个环节比例也比较小,所以他都是很具体,余料都是我一晚上可能两三个小时,不拉不拉说这些这些具体的这些话,是吧?所以我就把它直播回放, 然后把它下载下来,转成文字给到他,所以这又是一种语料。那我写的文章的语料和我直播的语料其实又是不一样的,就书面的和口头的表达又是不同的,这是第二种。 然后第三种就是我在呃开会或者是给到客户咨询的时候,其实我会有,有的时候会有录音的这个环节,然后在录音的环节,这个时候他和直播的时候不一样,就他有一个对话 啊的场景,它有这种交流的场景,它有这种,呃案例的背景的场景,那这些东西有的时候,呃,有些客户是允许我们把它沉淀下来的时候,我也把它拿下来, 把它转成了呃这个文字,然后有上下文喂给这 cloud, 这又是另外一种这个语料啊,它它是有对话的,所以它可能有更多的价值, 然后这些其实都是能更加丰富。呃,这个 ai 对 于你的理解,然后 ai 能获取更多的信息, ai 知道你的表达风格、表达思路。我举个例子,你看我,我们做艺人公司,或者我没有会员,然后很多会找我来咨询,然后找我来咨询的时候,呃,我其实最初我理解就是我自己的专业能力,我能帮到他们, 然后我没有所谓使用些什么套路,或者是用什么方法论的东西,我觉得交流其实没有必要,但是我过去这一年里边,我真的数不清我做了多少个咨询。后来你把这些咨询的这些跟用户沟通的方式沉淀下来以后,发现我其实有套路的,这个套路在我脑子里,只不过我没有把它沉淀下来。 但是你把你跟这些学员沟通的这记录喂给 ai 的 时候,其实 ai 就 能帮你整理出来一个你解决你客户问题的一个思路, 对吧?你会怎么去找这个问题的关键点?然后你怎么去这个把这个问题能讲清楚,然后你在应用了哪个模型,你应用了哪个知识体系的方法,其实都在这个里面, 因为人的认知相对来说就是确定的,而且我做的业务呢也比较集中,大家问题呢,说实话也相对来说有一定的类似,所以说我应用的方法,当这个数据积累到足够多的情况下,你会发现它是有规律的。 哎,这个雨料给到呃这个 ai 的 时候,它就能帮你去提炼出来,我觉得这也非常有价值。对于这个雨料收集啊,现在有些硬件呃会让你更方便, 比如说有这个像一个扣一样啊,圆形像小硬币一样,你可以放在身上的,然后也有像手机充电宝一样,可以贴在手机背后的,像你们刷短视频可能都能看到过,它可以帮助你快速去收集这些雨料啊,大家可以 如果你感兴趣的话也可以了解一下,我在这里就不推荐了。再说一下案例库,这个我才可能对大家来说相对是最难的,因为大 大家的案例应该都不会特别多吧,说实话,因为如果案例很多的话,就说明你已经就是已经不是新手了,可能看这个视频或听这个视频的人应该是新手会多一些。所以,呃案例库这个事呢,我觉得是这样的,就是它分成两类,一类呢就是叫做自有案例,一种呢叫做公有案例。什么意思呢?自有案例就是你自己做的 啊,就是比如你自己呃接的客户,交付的客户,然后你完全了解这个背后的很多信息,然后公有案例是指他是这个公开的, 他是别人的,就是你通过在听别人的讲述或者网上的公开信息,你经过收集,然后理解、消化,然后对这个事有一个自己的看待,这个其实就是不是你的客户,然后你对他做了分析和理解,然后面你可能应用他,这叫做工友的案例。如果你自有案例比较少怎么办?第一呢就是把你的注意力放在工友案例上, 这个也是个解决问题方法。第二还有个方法,就是你可以把自己当成案例,那你可能虽然没有服呃,服务过,或者服务好很多的这个客户,但是你自己可能就是一个比较不错的案例, 这个也可以把它看成一个自有的案例,因为你对这里边的细节呢足够了解,能讲的比较细致。呃,所以这里边当然是讲自有案例是最好的,因为你会发现公有案例你讲的时候,你会就像讲别人的事一样,就感觉很多都是书面用于很多就是很粗的东西, 别人听你讲嘛也听不进去,为什么呢?因为细节不够呀,也不够吸引人啊,因为你你自己也没有进去。然后再说一下这个日常更新啊,日常更新是其实这知识库的一个开源的 一个环节,就是它不能是死水一潭呀,那你怎么去收集你的日常的想法呢?就是通过这个日常更新这个库,然后来去完成的。在这个环节我们推荐的产品就是 flomo 嘛,因为它可以快速的让你拿起手机对 他用语音讲,就可以帮助你去记录和整理这信息,做的是非常好的,非常的轻便。然后记记得在这个时候一定要打好标签,比如说这是一个很好的选择题,打个选择题的标签,这个是你的观点,打个观点标签,这个是一个客户的案例思考, 他这个是一个叫做呃这个课程的迭代的一个思维,把它打好标签以后,为什么呢?每过一个星期或者两个星期的时候,你可以通过 flomo 把它导出来,你不需要呃一条条复制, 你把导出来以后,然后把它一下再导入到 cloud 里面,或者导入到你的飞出文档里面去,把它记录和沉淀就 ok 了,所以它还是相对来说非常方便的,因为你有了标签以后,你会更好的去管理它。 我觉得在这个环节大家要注意到一点,就是你在呃用 flomo 或者做日常记录的时候,千万不要去思考,或千万不要去这个去做措辞,或者是去想这事该怎么表达的更严谨。为什么呢?因为我们在日常的呃有想法的时候,它往往就是灵光一现 啊,灵光一现的特点就是可能过了几秒钟你就忘掉他了,所以要抓住这种稍纵即逝的这种感受,而且这种感受往往不会是在你所谓很方便记录的情况下。比如说你坐在办公桌前,你对着一个文档去思考的时候,他其实人的思维是不够发散的, 他其实没有在一个很松弛状态下,他没有办法呃让自己就是把自己过去的这些方方面面的这些案例啊,知识体系啊,或者一些思考能连接起来,他没有办法就他不够发散,他非常的聚焦,越聚焦其实越没有灵感, 就什么时候会比较发散,在你比较放松的时候,比如说刚才我说通勤的状态下,比如上厕所的时候,比如说这个在喝咖啡,然后在那里发呆的时候,比如说你在看一本呃,相对来说没用的一种,一个一本闲书的时候,他会 让你的这个思维啊到处啪啪去连接,这些连接呢会给你带来一些新的思考想法,所以这个时候一个快速能记录的工具就变得啊异常重要了,所以日常 你的信息,然后要通过这种方式把它收集下来,这样你的知识库才不会变成死水一潭。那这个时候大家会说了,哎呀,我我我没有那么多的这个感受,或者一个新鲜东西补充,该怎么办呢?哎,这个就是很重要的点,就是你必须要让自己把自己哈扔进一个叫做信息源更多的环境里 啊,不管是你主动的还是被动的,你只要是想每天有更多的这种启发,或者是更多学习到新的东西的话,你一定要在一个信息源里。我举个例子,如果说你每天呃两点一线,然后的环境呢都非常的封闭, 然后没有信息,然后你每天见的人呢,都是那三四个人,比如你的家人,然后可能公司里就一两个固定的同事,你在如此封闭的情况下,你是很难有更多的去见更多的人, 然后比如说你在你见的客户越多,或者是你接触的这种咨询的学员越多,或者你有更多的合作伙伴交流的时候,他这时候给你的碰撞,你会发现远比你在办公室,你在家里蹲一天两天甚至一周啊收获大的多,这个是非常的关键的,所以这个信息源呢,就是我们要主动去拥抱。 可能你会说,哎呀,韩老师,你说的清楚,我自己现在没有那么多客户,我就是因为没有客户,我才自己在家里或者在公司里边,这个也有办法的,给大家举一个非常小的诀窍,就是你靠你的产品, 靠你的内容去做拓展,就是你可以设计一个产品或者一个内容的栏目,这个产品内容栏目呢,并不是用来变现的,而就是来去拓展你的信息源的,也是 ok 的。 比如说我举个非常简单例子,比如说,呃, 你可能真的需要很多的这种呃这种学员或者咨询,然后来刺激你,可能这个时候你的时间说实话可能没有那么的值钱的时候,你就可以卖非常便宜的一对一咨询,比如九块九, 然后让自己收获更多的信息,对吧?如果说你忙不过来,或者你觉得这个阶段过去,你把这个产品下掉就 ok 了吗?但是你一旦有这个产品,有了九块九的产品,你就会有新的体验, 哪怕说你的体验是,哦,原来低价的确实就换不来好的客户啊,低价的确实这个客户层次不齐啊,这是一种体验和感受啊,他远比你就坐在那里发呆会更好吗?是不是那么像内容也是一样的?比如说你做的个栏目是,哎,我要举办一个播客,这播客我要跟我身边人对谈, 然后我要做到每每周更新一期。那你有了这个目标以后,你就会发现到处去找你微信里边的人,然后你要跟他去约,跟他去交流,你要去, 你要去翻他朋友圈,看他感兴趣什么东西,你要去写这个大纲,写这个主题,然后去做这期内容,然后这一期期内容其实逼着你去跟外界去做交流。所以你看内容和产品其实也可以成为你构建一个信息源的一个杠杆, 或者是推动你去做这件事的工具。不管你是没有信息源,还是说你自己可能是一个不太擅长社交的人,你都可以通过这工具然后来更好去实现,所以这是呃,用好信息源很重要的方法。另外 啊,你也可以去通过读书,然后来去获取。我觉得这个是大家嗯,经常被呃,怎么说呢?经常被忽略的这点,大家都花太多时间在短视频上了,可能大家会说要看长视频行不行?就我不得不说,现在这个视频里有的时候它看似很长的一条视频,它也未必有营养, 就是在这个环节里,呃,如果你不是有针对性的去学习啊, cloud code 该怎么去配置,该怎么去做? 呃,你如果你不是有很明确的目的的话,其实读书真的是一个你必不可少的构建信息的方式,你会发现虽然现在环境日新月异,对吧?这个整个的 ai, 呃,这个发展速度很快,但是很多商业的东西,很多学科类的东西,呃。在过去 五年、十年、二十年、三十年,这些书籍仍然是适用的。比如现在很多人看纳瓦尔宝典就觉得这本书很好,但实际上这本书就是纳瓦尔的一个这个类似推特的一个内容的一个集合, 它里面没有特别的本质的东西,就你看完以后可能觉得有些启发,或者你缓解了一些你的焦虑,但是你去看营销管理这样的这种大步头,虽然很难读,虽然你看里面案例好像都过时了, 过时你可以把跳过吗?你看它这里边的一些核心的一些观点,你会发现到今天仍然没有过时。比如说你看段永平的大道那本书,就他在访谈,他讲的东西,翻来覆去就那些,就把事情做对啊,然后要关心用户的价值啊,其实这么厚一本书,核心观点反复了,就是就是就就就这么几句话, 你看他也推荐的书,他推荐的书也是这个,这个比较老的书,比如说基业长青啊,从优秀到卓越啊,这都是很多年前的书了。所以你会发现读书这件事啊,他可以让你进入到一种状态,这种状态就是,呃,还是修身养性 啊,然后能让你在这个时间段里更聚焦,或者更放松吧,都 ok。 进入到一个读书状态里边, 然后去读这些传统的,看似传统的啊,然后看似可能好像都过时了这些书,但这里面有很多的这些观点,他都是经历过时间的考验的,他都是通过去这些企业或者商业价值,或者从学科的视角,经济学、社会学、心理学啊, 从这里面提炼出来的一些观点,他就能解释。比如说你,你看现在短视频平台里面很多明星啊,大 v 翻车,他为什么翻车呢?如果你读了传播学这里相关这些书籍的时候,你就会知道他为什么会翻车,你知道大众舆论是不容被挑战的,你就会知道谁对谁错,在传播里边,在大众舆论里边是不 重要的,所以这都是你能更好去理解这件事,更好的去获取到新的这种信息和知识,很重要的方式就是读书,读书真的非常非常重要。经常有朋友问我说,哎,你这么忙还能持续的输出,原因是啥?我觉得我我没有什么很性感的答案,就是 读书啊,就是跟你的客户交流开会啊,就思考,拿着笔在纸上划拉呀,就是这些很传统东西,但它就是有用,就是有价值,再加上你对于 ai 的 应用,你有你的工作流,对吧?你用好 cloud, 你 用好这个,呃,各种的这个智能题, 然后你就可以把这个效率提升,这事就很简单。当然说来说去,背后就是你对于你的商业模式,你做哪个人区的生意,他们有什么痛点,对吧?你提供的产品是什么,所有问题都想清楚了以后,哪怕就是阶段性想清楚吧, 你会发现你能做的事,或者是你需要做的事是不多的啊,是不多的。一家公司不应该把自己忙死啊,累死,呃,那是会让你没有感觉,没有创造力,这肯定是不对的。 所以当所有的事情啊,都对了,或者都找到了一个比较好的这种姿势的时候,你没有太多的事需要去做的。我们被自己累死,很多的时候就是因为我们做了我们不该做的事情,没有必要的做的事情,就是我们为了 就是找自己的安全感,然后,呃,每天忙碌的在做这做那,实际上你思考一下你的目标到底是什么?你为了这个目标去做这个事是对的吗?我举个例子,我们有一个学员,他其实是要做弊端的,他是做品牌营销,他是要去服务这些企业的老板。但是在他的日常项目里面,其中有个点叫要成立一个品牌营销的一个社群。 然后我就问他,我说你做这个社群对于你的目标有什么意义吗?因为你的社群进来这些人,他对于你服务的这个你的客户,他完全是两个群体。而且你本身你要做社群这件事,你又是一个人,你要花你比较 不少的时间啊。比如说一天,一周你工作五天的时间,我觉得你要周末组织活动,至少你要花你一天的时间在这个事里面,那五分之一时间在这里面其实也不少了, 他又不能给你带来呃,这个比较多的收入。呃,所以你做这件事完全就是因为这个。我我觉得啊,就是因为没有思考清楚,或者是就是为了自己啊,找到一个所谓的安全感吧。 所以这些事你把它砍掉不做,你会发现你轻松了很多呀。好了,在你把知识库,刚才我们讲这几个模块都建立完成以后,接下来才是最关键的,你就要反复不断的去用它, 你要把你知识库放到实战里面去,比如你要用它去建立一个一个的项目,比如有的项目是帮助你写公众号的,有的项目是帮助你完成你的这个短视频选题和竹子稿的,有的是给你直播大纲的, 有的是给你的客户咨询的一些思路的等等,建立 n 多个这样项目,然后不断去应用它,在应用的过程当中去优化,因为你在你没用的时候,其实你不知道这个知识库它是不是有价值的,这知识库哪里是需要去调优的? 我们之前讲过,知识库建立起来最重要的是应用验证,这个知识库最实际的方法就是看你发布的内容有没有流量,看你跟客户交流的时候,他能不能帮助你,去节省你更多的时间,这个才是知识库的真实价值所在。 说了这么多,我还是想在最后给大家强调一下,知识库呢,只不过是我们的工具,是我们和 ai 交流的时候很重要的一个 桥梁。但是我们在做一人公司的时候,最重要的仍然是你要想清楚你的目标用户是谁,他们有什么需求,你要通过什么方式去满足他们的需求,你会发现只要这些问题想清楚了以后, 你才能去构建你的知识库。这些这些问题如果说你不能很好的回答,其实你不知道要拿什么东西去填到你的知识库里,你不知道该怎么去积累, 对吧?那可能是一个零散的状态,那零散状态你自己都没有想法, ai 没有办法帮你把零散的想法给你找到一个所谓你创业的方向,或者是你破局的方向, 这个事他是做不到的。好了,以上就是我对于用 cloud 该怎么去建立自己知识库的一个思考和方法的描述吧,希望对大家是有帮助的。

cloud 四点六杀疯啦!高强度用了不到三天,我已经把所有界面的三的工作切到了四点六。这个更新有多大?打个比方, cloud 四点五像是你手机里导航软件,可以告诉你怎么走, 而四点六就是你请的专业司机,只要一句话,目的地到了,老板请下车。这次更新只围绕两个字,效率 来用数据说话。上下文窗口从二十万 token 暴涨到一百万五倍,推理能力二和 agi 二从三十七点六跳到百分之六十八点八,几乎翻倍。 百万 token 下的长文本解锁准确率达到了百分之七十六,是四点五 solo 的 四倍,这在以前是不可想象的。可能你对数字没有什么概念,那么在实际工作中,四点六到底强在哪里? 第一点,一百万上下文窗口它真能用了。四点五虽然编程很强,但是一次生成的应用程序或者网站,它的二十万 token 上下文窗口存在一个上下文衰减的问题,写着写着就忘了前面的, 导致最近很多程序用一种叫做奇怪的叫爸爸的方法来验证 cloud 是 不是丢失了上下文。通俗的来讲, 以前的四点五像是端着一个小碟子去吃自助餐,加了二十样就放不下了,想吃新的就得把前面旧的倒掉。而现在的四点六是推着购物车进场的,一百道菜全部打包带走,你问他第三排第二个菜是什么,他可以给你报出菜名来。第二点, cloud 从思考者变成了一个执行者。四点五是一个思考者,而四点六是一个会把事情做完的思考者,他不再停留在思考阶段,而是会自主行动,跨多个任务自主完成。以前需要多轮对话才能搞定的事情,现在一次就搞定了。 而且四点六引入了一个叫做自适应思考模型,会自己判断这个任务的难度,来决定他思考的深度。作为你的 ai 同事,他已经从事事都要请示你的实习生,变成了自己会做决策的项目经理。 更狠的是,以前一个 cloud 只能干一件事儿,现在你可以让它自己拆成一个小团队,缤纷多路同时干。而且每一个 ai 单独享用独立的一百万 token 的 上下文,干完了再自己把任务合在一起交给你。 第三点, cloud 不 再是程序员的专属,它可以是任何人的同事。 asp 同步推出了 cloud in excel, 支持条件、格式、数据验证等原声的操作。以前是 ai 帮你做 ppt, 做出来的东西像是在路边打印店做的,那么现在他会直接去看你公司的 ppt 模板长啥样,做出来直接丢给老板用, 到了这个时候一定是有转折的。对,我们来谈一谈价格,四点六的 api 价格和四点五完全一样,但是我要说但是了,四点六推出了一个 fast 模式,输出的速度是普通情况下的二点五倍, 以前要写十分钟的东西,现在只要三到四分钟,但是价格直接飙升到普通模式的六倍。你没有听错,输入三十美金,百万投资,输出一百五十美金,百万投资。价格涨了这么多,他变强了吗?没有, 完全一模一样,而且如果你用了超过二十万头寸的长上下纹,价格还要额外再涨一点五倍到两倍,这让有人调侃说 cloud 四点六造成亏损和破产,从未如此之快。六倍的价格换来二点五倍的速度,从数学上来说,这完全不合理, 但在商业的世界里,从来就不是纯数学。这就好比你的飞机要起飞了,你是狂踩共享单车,还是立马叫辆专车,以最快的速度去机场?路还是那条路,人还是那个你,但你愿意付这个费用,因为那个场景下,快就是一切。 这大概也是 ai 行业第一次这么明确的告诉你,你的时间值多少钱,你就付多少钱。所以回到最开始, 为什么我三天就从界面的三切过来了?因为四点六不是一个更聪明的聊天机器人,他是一个真能帮你落地干活的同事。而且 ospec 这次用定价告诉了所有人, ai 这个同事你的时间值多少钱,他就收多少钱。

今天这个视频教你无痛安装 cloud code, 在 国内的网络环境下,用上 cloud gpt 等国外的顶尖模型,有些人可能还不了解 cloud code 是 什么,先简单介绍一下。 cloud code 可以 说是现在最强的 ai 编程工具, 再加上最近爆火的 skill 加持,很多人也用它写作、学习、做数据分析、办公等等。 cloud code 可以 说是现在最火热的 ai 助手之一,网上有很多的安装教程, 但是实际上你去安装就会发现不是那么回事,网络限制、安装配置中出现的各种问题能把你搞得焦头烂额。我也是看了很多的教程,结合自身安装过程中遇到的一些坑, 整理了一份 cloud code 在 国内网络环境下的安装使用指南,这份指南能帮你省下几个小时的折腾时间。接下来我会将原理和操作方法用通俗的语言给大家讲明白。好了,我们开始。 首先在安装 cloud code 之前,我们需要做好前置准备。 windows 电脑需要先下载 git, mac 系统自带 git, 无需下载, 不去这个网站选择 windows 叉六十四 setup 这个版本下载。安装完成以后呢,在 powershell cmd 中输入 git vision, 如果能输出正确的版本号,就代表 git 安装成功了。接下来要安装的是 node js 跟 npm, 我 们去这个网站选择适配自己的安装包下载即可。安装完成以后呢,如果你是 mac 用户,在启动台搜索终端, windows 用户在开始菜单里找到 git bash。 为了讲解方便,后面我们统一把终端和 get bash 统称为命令行。接下来我们在命令行输入这两条指令,如果都能显示版本号,就代表 node js 和 npm 安装成功了, and code 安装的所有的前置条件就已经完成了。 接下来我会手把手教你安装和使用 cloud code。 具体从哪里下载呢?我们有两个选择,一个是 npm 的 官方源,一个是国内的镜像源,你可以把它们类比成一个软件仓库, cloud code 也发布在这个仓库里面。那所谓的镜像源呢,其实就是官方的软件仓库同步复制了一份,那因为默认的 npm 源在国外 我们访问不是很方便,所以我们选择国内的镜像员下载 cloud code。 接下来是实际的操作步骤。首先我们打开命令行,输入下面的命令回车执行,然后再输入这条指令, 如果显示我们刚刚配置的镜像员地址,就代表我们已经成功的切换到国内的镜像员了。接下来你只需要在命令行中输入这条指令,回车执行即可安装。那这里要注意一个常见的问题啊, 系统可能会提示权限不足,这个时候你就只需要重新执行这条命令,输入管理员的密码。这指令的意思呢,就是我要用管理员权限强制覆盖安装 cloud code 的 最新版本。当安装完成以后呢,你在命令行输入这条指令,如果输出版本号,就代表 cloud code 安装成功了。 第三步是给 cloud code 配置模型。我们首先要去模型供应商平台开通账户,获取 api key, api key 相当于你在模型平台开户的凭证, 可以自己去创建获取。另外呢,要有可用的 token 额度,你可以在平台充值或者购买套餐。对模型供应商呢,大家可以根据自己的需要去选择, 你像国内的智普 glm 五、 mini max 的 m 二点五都是不错的编程模型。如果你想用 cloud opera、 四点六、 gemini、 三点一 pro 等国外的顶尖模型啊,因为国内的网络环境问题,你可以通过一些合规的中转站去订阅。 接下来我们就要把 api k 请求地址给到 cloud code, 在 这里我们用到一个叫做 c c switch 的 工具,下面是具体的操作步骤。首先我们去这个地址下载 c c switch, mac os 系统下载这个版本, windows 系统下载这个版本安装完成以后呢,打开 c c switch, 选择第一个标签 cloud, 点击右上角的加号。 第二步呢,选择要接入的模型供应商,如果没有我们需要的供应商,可以选择自定义配置。这里有三个最重要的信息需要注意一下。首先是 api key 和请求地址, 这两个是我们必填的,也就是前面我们在模型供应商中获取的信息。请求地址呢,在 cc switch 中,根据选择的供应商已经预填好了,一般在模型供应商平台的 api 文档中也能看到 行信息是选填的,但是也建议你指定一个模型,因为有些供应商会支持多个模型,换人情况下,你不知道他选择哪一个模型。接入 cloud code, 这里要注意的是,填写的模型必须是供应商支持的模型,否则 cloud code 会无法识别。那其他的配置信息呢?保持默认即可。 配置完成以后呢,我们选择一个供应商起用,后面你也可以切换至其他供应商,这样 cloud code 就 能够接入不同的模型。 不过要注意的是,每次切换供应商以后,都需要在 cloud code 里面切换模型,这样配置才能生效。那把 cloud code 装好了,模型也配置好了,接下来我们终于要使用 cloud code 了,我们在命令行中输入 cloud, 然后回车直行,这样 cloud code 就 被起用了。 当我们在 cloud code 里输入这个指令,回车直行,就会弹出模型选择的列表,我们用键盘的上下箭头选择第一个默认的模型,也就是 c c switch 里起用的那个供应商。接下来你就可以指挥 cloud code 帮你干活了。 在选择和切换模型后,啊, cloud code 可能会出现找不到模型的情况,这个时候你可以进行下面这几步排查。 首先你可以退出克拉的 code, 重启后再试一下,如果还是不行,你就要去核实一下 c c switch 中的 api key 请求地址,模型的名称是否填写错误,微商平台是否有充足的余额和套餐。 另外,我还整理了 cloud code 的 三类常用的指令,放在了指哪里。第一类是启动类的指令,在中单命令中执行,包括 cloud code 的 重启,继续上次对话,查看历史对话记录。第二类是对话类的指令,在 cloud code 里输入斜盖,你就能查看所有的绘画指令。 第三类是安装卸载类指令,前面我们安装的时候也已经用到过一部分。最后再给大家分享一个小技巧,如果你在安装和使用过程中遇到了任何你解决不了的问题,你可以连同问题和截图一同给到 ai, 你甚至可以直接给豆包共享屏幕,让他现场指导你。一般情况下,大部分问题都能够解决。这份 cloud code 的 安装指南除了有详细的安装步骤和注意事项,我还对用到的一些技术概念和工具做了小科普,如果你想要这份安装指南,我可以分享给你,而今天的视频就到这里,别忘了点个关注,我们下期见!

ok, 上上一期教大家安装了这个 cloud, 这一期教大家怎么去配置国内的大模型啊?配置国内的大模型的话就很简单,只需要设置一下这个对应的对应的一些参数就可以了。 首先我们要了解到国内的大模型它基本上都是支持这个 open ai 协议的,然后有一些模型它已经是支持 ostopic 这个协议的。然后然后的话,我这里以智普 ai 为例啊,它是支持这个 osrbic 这个协议的, 然后它新用户的话会赠送这个两千万的 talking, 你 正好可以来进行这个练手,现在已经出到了 g m l 五。好,我们打开它的官网 这个智普 ai 开放平台,可以看到它这里有很多模型可以用,然后我们使用的话,它关这个 cloud, 它是 默认是使用这个 osnoop 这个协议,然后我们获取令牌。首先打开这个智普 ai 平台,然后我们需要登录一下这里,我已经登录好了,然后创建一个新的 api key, 比如这里啊,我这里就不新创创建了吧,这里我因为我之前创建了很多。 然后我们再打开这个文件夹,点 close 这个文件夹,这个文件夹在哪个位置啊?比如我们打开,然后点到我们的 c 盘,然后选择用户,然后你对应的你的用户名叫什么,你系统的用户名叫什么?就点开这个文件夹,下面有一个点 close, 前面的这个路径不一定像一样,但是后面这个点 close 下面的是一样的,因为我们这里没有启动它,这里还没有那一个命令,所以我们先把这个 close 启动一次 啊,没有那个文啊,没有那个文件哈,就这个 setting 点接受这个文件,需要首次启动过后,它会自动生成,你输入 close 进行启动一下, 那我们回测一下,然后选择信任这个文件夹啊,比如我输入一个,你好,这里显示 显示它这个模,它这个模型不可用,然后我们在这里来啊,这里它没有促死化,正常来说它这里会自动生成一个 setting 剪节省文件,如果没有的话,我们新建一个也是一样的啊, setting 把后缀改成 jsen, setting 剪节省,然后再编辑一下, 我们直接打开这个,然后把这个参数直接复制进来,然后这里填你的 api key, 这个 api key 的 话,我们就是比如我们在字谱上面,然后就可以拿到这个 api key, 然后我这里以这个 code 这个 api key 为例,这个 api key 的 话大家最好是不要泄露出来, 然后这个模型的话,你可以自动的自己去配置,这个模型的话,我们可以打开这个官网,可以看到它这里有一个大模型,然后可以看到有很多模型啊,比如新出的 g m 五, g m 四点六 v, 这些都是可以用的,我们这里以 g m 五为例吧,然后把这个模型名称改成 glm 五, 然后地址的话就不用变了,然后 这个模型的话我们就设置的御姐参数,可以看我们我们后面的讲解,这里就跟着配置就行了。然后这一个是啊,就是给它开启最高的权限,它每次执行这种任务,它就不需要让我们再进行确认了,然后 ctrl s 保存一下, 然后关闭,然后我们再重新启动一下这个 code 关闭,然后再右键输入 cmd, 然后再输入 code 测试一下。 对,等待它启动, 然后再按任意键,然后选择 yes 啊,这里我们可以看到它这里模型它是并没有改变,这说明我们没有配置成功,可以测试一下。你好,它这里应该是没有配置成功的,因为它这里模型没有变, 你再看一下是不是路径配置错了。 q d 点 close, 点 setting, 点节省,是不是文件名称输入输入错误了,最好去 settings, 少了,少了一个 s, 我 们这里可以看到这里我们少了一个 s, 所以 导致了没有配置成功。我们来把这个文件名称修改一下,换成正确的,然后我们再重新启动一下,依旧是 win 加 r, 输入 cmd, file a, u d, e, 再重新启动一下,好,再回车,选择确认这个文件夹, 然后选择我接受,然后这里我们看到我们这个模型已经变成了我们刚配置的 glm 五,所以这里算是配置成功了。然后我们再输入个你好, 然后它如果正常回复,那应该是没有问题的啊,这当前套餐未开放 glm 五的权限,所以我们这个模型给它换一下,我们可以在手这里手动更换一下 model, 也可以直接修改这个配置文件,比如这里改成改成四点七吧,四点七, gm, 四点七。 好,我们这里重新启动一下,我们重新启动吧,就不不在这个刚 model, 刚 model 它是用来配置模型的,这一这么一个命令,我们重新启动一下,还是依旧输入 close, 然后继续回车信任这个文件夹,然后输入。你好,测试一下我们配置的这个模型是否成功? ok, 这里是可以了 啊。好,这里配置国内的这个大模型已经成功了,当然你可以选择使用这个 open ai 的 协议。我们以这个摩塔社区为例,我们可以使用 npm 安装一个一个这个插件,然后 它需要在这个 dongle 的 router, 这个路径的话是和那个 dongle 的 这个文件夹的路径是一样的。然后我们在这个里面 config 点接受里面去配置一下这个你获取到的这个 api key 和 这个对应的模型名称就可以了。比如这里是配置的千万三 qd, 这个依旧是一样的,然后启动命令可能不一样了,它需要变成这个 c c r 扣的。这里的话,你如果使用的那个大模型,它不支持这个光学的这个协议的话,你需要去下载一个这个插件,然后它就可以支持 open ai 的 这个协议了。 ok, 其他的的话我们这里也有几个举例,比如阿里的,阿里的你需要去他的官网也去获取一下 k 或者 kimi, kimi, k 二,然后其他的 deepsea 也可以,我这里经常使用的是智普 ai。 好 的,这里这一期视频就到这里了,下期我们来讲一下这个常见的这些命令。

去年十一月, ansorepic 发布了一系列新的测试版功能,只在解决我们在构建 ai 智能体时遇到的一些实际问题。 工具定义在你发送第一条消息之前就已经占用了大量的上下文。当智能体连续执行多个工具调用时,这些工具调用的中间结果会进一步膨胀上下文。 而且随着你在系统中增加工具的数量,智能体在为任务选择合适工具时会变得非常吃力。因此,这些测试版功能帮助解决了这些问题。而且随着两周前 sony 四点六的发布,这些功能已经在云 api 上全面开放。 在他们的原始帖子中,他们展示了这些功能如何帮助实现了八十五百分之的 token 使用量减少。 这也导致一些网友宣称 entropic 已经终结了工具调用,或者至少是传统的工具调用方式。虽然这种说法有些夸张而且确实不准确,但这两个功能编程是工具调用和工具搜索工具 确实是非常巧妙的解决方案,在集成到任何 ai 智能体中时都能发挥极高的效用。而且关键在于这些功能并不是云 api 独有的,也并非最初就是 entropic 的 创意。 这些是智能体构建的核心模式,适用于任何框架或模型。我会解释这两种高级工具调用如何运作,并演示如何集成到你的定制智能体中。 这正是我在这里所做的事情。我已经把它集成进了我的系统,这个系统是我用 python 和 react 定制开发的应用,这是我在本频道过去四期视频中逐步搭建出来的。 我还用全新的困三点五,拥有二百七十亿参数的模型来测试这些高级工具调用方法。所以与其直接跳进理论部分,不如我们在应用里演示一下。 而最简单的切入点大概就是先演示一下工具搜索工具。所以即使只是打个招呼,我们也能收到一个简短的回复。但在底部,你可以看到我们正在追踪本次绘画的上下文窗口。 我们已经用了一万三千个 token, 为了弄清楚发生了什么,如果我们切换到 langfuse, 如果我们看一下这个生成追踪,你会发现已经有六十个不同的工具被加载到上下文中了。 虽然听起来很多,但实际上只有两个 mcp, 就是 playrite mcp 和 github mcp, 再加上一些我在前几期节目中开发的工具。 所以工具搜索工具的关键点在于你不会一开始就加载所有内容。你会延迟加载让代理去搜索他,所以他会多出一个额外的步骤。现在我会把这些 m c p 服务器标记为延迟加载,然后让我重启一下服务器。 如果我再次问同样的问题,比如我们打开一个新的聊天窗口,输入 hello, 然后得到一个回复,你可以看到我们现在只用了六千三百个 tokens。 如果我们看一下这个追踪,你会发现现在只有十二个工具被加载到上下文中。第十二个就是这个工具搜索工具。 这个工具允许代理在工具注册表中搜索,通过名称或关键词来发现并加载工具。为了演示工具搜索的实际效果,我们让他获取这个项目的最新提交。这是一个私有项目,所以他需要使用 m c p。 你 可以看到他现在正在触发工具搜索。他找到了一个工具, 就是 list commits 工具,然后他用仓库的信息触发了这个工具。好了,我们得到了提交 id 以及提交内容的信息。 如果我们查看这次工具搜索的响应,你会发现 listcommits 是 一个延迟加载的 mcp 工具,它会把这个工具的完整模式加载到上下文中。 现在这个工具已经被加载到接下来对话的上下文中了。所以如果我再问任何后续问题,就不需要再去搜索这个工具了。比如说给我最后一个提交,我就可以直接使用 listcommits 工具。 如果我们切换到 langfuse, 在 我发送的第一条消息中,你可以看到只有十二个可用工具。然后在它触发工具注册表搜索后, 在下一次调用中,我们有了十三个工具,包括 list commits, 并且它能够对此作出响应。而在我后续的问题中,我们同样有十三个可用工具。 简而言之,这就是工具搜索实际的工作方式。虽然这已经非常有用,但我认为以编程方式调用工具更加令人印象深刻。如果我们开启一个新的聊天,现在我们在 opodder 上使用的是 cloud hikou, 我 一会会切换到 queen 三点五。但我想先给大家展示一下云端模型和开源模型在这里是如何工作的。为此,我们将使用 anthropic 在 其文章中发布的官方示意。 这里他给出了一个预算合规检查的例子。然后问题是哪些团队成员超出了他们第三季度的差旅预算? 这里有三个可用工具,分别是获取团队成员,获取支出和按级别获取预算。他在这里展示了传统的方法,也就是需要大量的工具调用和许多中间响应,这会导致上下文窗口被迅速填满, 所以我已经写好了云端代码来生成这个场景的虚拟数据。首先我们来看一下传统的做法,我已经关闭了沙河,现在我来提问哪些团队成员超出了他们第三季度的差旅预算。 正如我之前提到的,我们现在用的是嗨酷模型,所以他正在执行工具搜索,获取报销数据,获取团队成员。现在他正按照这种传统方式操作,需要为每一位成员逐一获取报销信息, 让我们看看会得到什么答案。所以第三季度差旅预算分析显示,有三个人超出了他们的差旅预算,这是他给出的结果。 根据测试数据,这个答案是正确的,但实际上应该有四个人,所以他似乎漏掉了一个。 marcus johnson 超出了预算一千七百, 所以这种传统方法实际上消耗了大量的工具调用。实际上有五十六次工具调用。正如你在这里看到的, 它处理了七万六千个 tokens, 但实际上并没有给出一个准确或者说全面的答案。这正是程序化工具调用能够解决的问题,因为所有这些其实都可以通过脚本自动完成。 因为一旦你知道了团队成员和预算水平,你就可以用一个负循环来获取每个用户的开销,并计算实际的超支情况。 那么现在让我们起用沙盒,并尝试用程序化工具调用来实现。好的沙盒已经开启,让我们重启后端,打开一个新的聊天窗口。好的哪些团队成员超出了他们第三季度的差旅预算?现在正在进行工具搜索。他找到了所需的三个工具。 现在他进入了编程模式,并创建了一个即将被执行的脚本。他抛出了一个错误。这其实并不奇怪,因为他并不知道这些工具的输出结构。所以本质上,如果没有所有信息,他就无法一次性完成。 现在他正在不断迭代自己的代码,实际上是在尝试得到一个结果。你可以看到他不断抛出错误,并且正在逐步解决。 与 anthropomorphic 的 论文相比,这可能是更贴近现实的程序化工具调用方式。因为我相信在 anthropomorphic 的 论文中,它是一次性完成的,而实际上并不会这样。经过多次迭代后,我们得到了一个准确的答案, 所以二千二百, sarah, chen, marcus, alex, emily。 所以 我们得到了所有正确的答案。 这很好,但这才是程序化工具调用的现实。它的方法相当迭代,就像 cloud code 或 open code 一 样。出于兴趣,我们再运行一次,看看能不能得到正确的答案。它会不会走一条不同的路径。我们假设是的, 很有趣。这一次它实际上是在预算层面获取团队成员的信息,所以它实际上是先获取所需的数据,然后再生成代码。所以这次它可能一次性就能完成。 但实际上他并没有做到,他仍然在自我迭代。不过我们确实得到了正确的答案,所以结果是对的,每一次都是如此,只是到达结果的路径不同。所以我们来看看这两条追踪记录。在我刚才运行的那一次中,总共进行了六轮调用, 总共调用了十二次工具,总提示词数为五万八千。现在如果我继续这个对话,目前只用了一万三千,但这是在与大语言模型进行了六轮来回交互的情况下。而之前那一次是在十一轮中用了十一万六千个 prof tokens, 都是为了得到正确的答案, 所以我确实没有看到 anthrax 所报告的八十五百分之的 token 节省。但这其实非常依赖具体的用力。 比如说这里我是在和二十个团队成员一起工作的,如果你有两千个团队成员,那情况就完全不同了,因为大圆模型需要运行两千次单独的调用,这根本行不通, 所以在那种情况下,就需要程序化的工具调用。或者你就需要一个真正的端点,让实际的数据处理在服务器端完成,而你只是获取信息并将其展示给用户。所以这其实切中了这个话题的核心。 也就是说,你的大圆模型到底应该像这样临时进行数据处理,还是应该仅仅从一个预先创建的脚本中传递信息? 比如说这个脚本可以放在一个技能文件夹里,因为这是我们在上一个视频中搭建的一个完整的技能部分。你可以有一个 python 文件,一旦创建测试并验证后,它就能真正完成这项工作,或者你也可以把它放在工具调用的 m c p 端,这样它就只是简单地传递接收到的信息。 那么我们把 cloud haiku 换成 queen 三点五二十七亿参数,来看看它的实际表现如何。我现在是在网络上运行这个模型,这里用的是欧拉玛,我有一个十万个上下文窗口长度,这里用的是 rtx 五零九零,显卡有三十二 gb 的 显存。 那么我们保存一下,重启服务器,然后问同样的问题,哪些团队成员超出了他们第三季度的差旅预算?现在加载需要一点时间,因为他需要把模型加载到内存中。好了,他已经触发了工具搜索,然后直接开始生成代码。 他实际上在工具调用之间没有输出文本,但你可以看到他正在生成代码本身,而且他正在经历和嗨酷一样的迭代过程,他正在从错误中学习, 并且在不断完善。看看,这就是我们的答案。让我看看二二百十五十七,还有三百,看起来很准确,我觉得这比嗨酷用的 tokens 更少,这很酷,我们来深入看看追踪记录吧。 是的,这次用了四万五千个 tokens 就 得到了准确的回应,这真的很棒,只用了四次工具调用,这已经相当不错了。这是我们 ai builder 系列的第五个视频。在这个系列中,我们正在用云端代码构建一个功能完善的 ai 系统。 本模块的 prd 可以 在我们的公共 github 仓库中获取完整的课程和代码库则在我们的社区中提供 相关链接在下方描述中。那么好吧,这一切到底是如何运作的呢?因为你可以看到我们正在这里的沙箱中触发代码执行,但这实际上意味着什么呢?所以这是一个完全本地化的系统。 我之前用的是嗨酷配合 open router, 但现在用的是 queen 三点五,这里内置了一些文档和 r a g 功能,使用的是 queen 三的嵌入模型。所以你看到的这个代码执行其实是在 docker 中触发了一个沙箱。你可以看到 现在所有这些容器都已经启动了。这里有一些孤立的容器是因为我一直在重启后端。但总体来说,代码执行都是在这里的一个隔离沙箱中进行的。 而这个架构安全性的一个关键部分就是工具桥的概念。所以从头到尾,当用户提出问题时,他会先到 fast api, 然后到 python, 接着再转发到 ai 模型。无论是远程还是本地的, 我们会收到一个工具调用,也就是你需要去执行这段 python 代码,这时后端就会启动一个沙箱容器。 我在上一个视频里已经介绍过这个的设置过程,但本质上我们用的是这个 github 仓库,也就是 llm sandbox。 这是一个非常清亮即可移植的沙箱环境,你可以配合 docker 这样的工具使用。或者如果你不用 docker, 也可以用 portman。 但本质上,这大大简化了启动这些环境的复杂性。 它们支持多种语言,还有许多不同的高级功能。你可以预先启动容器,而不是按需启动。 你也可以使用自定义镜像。这个项目里有很多很棒的功能,所以我会在描述区留下相关链接。我在上一个视频里已经非常详细的讲解过了,所以基本上我们就触发了那个容器的创建, 然后我们会把代码和一个绘画 id 一 起传递进去。所以现在在这个容器里,我们有一个 python 运行器,它会执行那段代码。在我们之前的例子中,有很多不同的工具需要被触发,比如获取预算水平、获取部门、获取团队成员, 而所有这些都可以存在于比如说一个外部系统中,但我们并不希望让沙乡访问外部服务。 相反,我们创建了一个安全的工具桥梁连接回 python 应用程序,然后每当工具或函数在 python 脚本中被触发时,都必须通过这个桥梁。正如你之前看到的,单个脚本中可能会有五十次不同的 api 调用或工具调用, 所以对于每一次工具调用都需要通过这个桥梁,它会使用绘画 id 来进行身份验证, 然后 python 应用程序会将该调用路由到外部系统获取响应后再将其发送回沙乡。因此,除了访问这个 python 应用程序中的 fast api 之外,沙乡没有任何互联网访问权限。从安全角度来看,你可以对这个 fast api 进行严格限制, 这些限制是基于工具本身的精确模式,所以所有这些工具片段、工具定义都是在创建时作为存根发送到沙箱中的。因此,多个工具调用会在 python 代码中,比如说在一个 for 循环内进行, 而且这样做速度非常快,因为此时你完全忽略了 l l m 没有任何中间代码堵塞上下纹。在这里, l l m 完全不参与这个过程,直到 l l m 完成脚本并生成响应。你在之前的演示中已经看到了, 然后这个响应看起来大致是这样的,这就是我们的脚本结果,然后这个结果会被反馈给 l l m。 l l m 接着可以决定下一步该做什么。 如果它已经获得了所有需要的信息,就可以生成综合响应并返回给用户。或者正如你在演示中看到的,它需要对代码本身进行迭代。在很多情况下,它会生成更多的代码,并再次触发沙盒环境。 这就是端到端的流程。我在这里提到了 gviser, 因为 docker 容器并不是你能拥有的最安全的隔离沙盒,因为它们与整个系统共享内核。 所以为了真正保障像 ram, sandbox 这样的安全性,我建议你搭配 gviser 一 起使用。 cloudflair 曾经做过一些有趣的研究,探讨了 ram 在 生成 python 代码或 type script 以及触发工具和 mcp 方面的有效性。他们发现,当工具以 type script api 的 形式呈现,而不是标准的 mcp 时,智能体能够处理更复杂的工具。 我认为这是有道理的,因为他们在训练时接触了大量原生的 python 和 javascript, 所以 在 cloudflared code mode 版本中,也就是我们所做的类似,他们会把 mcp 的 schema 转换成 type script, 因此 l l m 只是生成 type script 代码来触发 m c p。 这和我们正在做的事情非常相似。所以我刚才提到,工具存根被发送到沙盒中。因此,我们在智能体层面定义的 m c p 和工具会被转换成 python 存根 自动生成的 python 函数。这样,当 ai 为沙盒生成代码时,它实际上只是触发 python 函数, 而且因为这是原声 python, 所以 它在这方面会非常擅长。而且重要的是,沙盒永远不会接触到 api 凭证,它永远不会接触到任何机密信息或类似的内容。 我之前提到过需要高效的工具设计,因为在早期,有太多的 mcp 服务器完全塞满了你的上下文窗口,让你根本无法完成任何实际工作。 即使在 anspec 自己的文章中,他们试图解决的挑战也是关于臃肿的 mcp。 在 这里,他们提到 github 的 mcp 有 三十五个工具和两万六千个 tokens。 但即使是在这篇文章发布之后, github 也发布了他们 mcp 的 新版,现在这个数字大约是四千个 tokens。 所以 在 mcp 和工具调用端其实可以做很多工作来确保不会无谓的给你的上下文窗口增加负担。 最后, entropy 在 他们的高级工具调用工具包中还加入了另一个功能,就是关于工具使用视力的这个概念。因为虽然 jason schema 非常擅长定义结构,但它无法表达使用模式。 他们举了一个例子,比如说截止日期,它的数据类型是自复串。日期格式有很多种传递方式, 那么他们到底希望用哪种日期格式呢?除非你真的引导他,否则大圆模型是不会知道的。所以,通过工具使用势力,你可以为每个字段提供一个势力,以便让大圆模型朝着正确的方向前进。比如在这里,日期格式就是年月 日。在他们的测试中,他们发现这能将复杂参数处理的准确率从七十二百分之提升到九十百分之,这很合理,因为本质上这就是多轮提示。你只是给了一个你想要的视力,这绝对会引导模型朝着正确的方向。 实际上,我不确定你是否需要把这个设置成系统中完全独立的功能。我认为,使用技能这个概念意味着你可以在加载技能时提供视力,这样就可以触发你想要实现的任务的执行顺序。 你会发现 cloud 也有点类似,里面有很多功能是重叠的。 antropic 之所以没有取消工具调用,是因为他们认为你应该有策略力对这些功能进行分层。 所以,如果你的上下文因为工具定义工具搜索而变得臃肿,如果你有大量中间结果污染了上下文,那就走沙河路线。或者,如果 ai 总是把错误的值传递给参数,那么使用工具势利就是有意义的。非常感谢你的观看,我们下期再见。

我把可乐扣的变成了黑心老板,专门压大扣单词写代码,结果效率翻了,成本还降了。如果你想彻底解放双手,那么我这一套工作流的方案一定可以帮到你。使用可乐扣的扣单词这类工具久了, 慢慢的就想让他们自己长久运行,但又怕写偏或上下文爆了。针对这个需求,我设计了一道可乐扣的监督扣单词的工作流,今天就把这套工作流以及设计思路分享给大家, 不仅仅是个方案,更是一种思路,大家完全可以拿去改成适合自己的方案。我先讲解一下这个思路,大家如果不想听这部分,可以跳到这个时间点直接抄作业。 我自己的情况是有切尔克 ppt plus 可以 使用扣带子,同时还有质朴的扣领 part 会员可以被摄到可乐扣的中使用。 gmail 我 也有,但是 gmail 的 c u i 我 个人感觉体验不太好,所以这里就使用卡拉扣的以及扣带子。 总结一下就是智普的扣令牌栏额度非常多,我基本上没有碰到过限额的情况。可乐扣的功能非常多,非常齐全,但有时会出现过着完成任务的情况。扣袋子则相对稳定一点,但模型对我来说相对较贵,所以要省着点用。 我这里的策略是让可乐扣的来充当监督者,让扣袋子去干活。关于扣袋子模型,我建议使用切的 gpt 五点二 mini, 但 扣袋子后缀官方说法是专门针对边层和代理任务优化,但我实际拆下来干活效果不太理想。 medium 类似于 auto, 你 也可以选择 high, 但是最好不要选择 x high 我 之前试过,效果是真的很好, 但是一天就跑完了,一周的额度,钱包真的收不住。最近出的五点三扣袋子也可以试试看,速度是真的很快,但多多少少也存的 爱的、偷懒的情况。决策分工是可乐扣的充当监督者。扣代词则是工人,这里使用两个 a 级的进行工作,最大程度上防止某些作弊。一个只负责写,一个只负责验收。整个流程开始于我使用扣代词生成的一份 open spark 偏更题案,这些题案会被转化为 test m d 中的具体代码是将列表。每当需要执行一项新任务时,可拉库尔就会启动一个 sub agent, 使用 codex e x e c 调用 codex, 然后使用自按语言调用 open spark。 open spark 最好是 零点二一点零版本,因为在新的版本, open spark 的 工作流就重构了,也支持自按语言调用,但使用的是 skills。 出发后续我研究一下怎么配合到这个工作流里。 托马斯在写完代码后,他必须制作一个可复现的测试方案作为完工凭证。 c u i 任务他必须提供一个智能化的测试脚本。 g u i 任务则提供一份 m c p 的 操作方案,可劳克勒会亲自运行脚本并进行验收。对于 g u i 任务,他会严格按照流程调用 payload m c p 辅 物,驱动浏览器并抓取截图作为证据,确保代码不仅写了,而且真实可用。只有当可拉库的亲自确认测试方案运行通过,且手中的证据链完整无误时,他才会执行一系列的确凿操作。在 tasks md 中勾选任务,更新 feature list, 点最省的 pass 状态,直接 get 提交存档,将日期写进 progress 点 t s t。 如果遇到技术卡点卡拉扣的,会利用 ctrl 七或浏览器搜索工具自主寻找解决方案,便知道 ctrl 进行重试。 我最在意的就是防止 ai 跑偏以及 ai 假装完成的任务。为了解决这个问题,我设计了一个双保险机制,分别是用 tasks m t 记录过程, 可使用 finisherlist 点击率记录结果。我们先说 tasks m d, 它是给人类以及 ai 件的文件,包含具体的任务以及详细的需求和实施步骤。我们先使用 codex 进行一个完整的体验, 可靠的会在这里记录具体的验证命令、截图路径和报错日期。如果有阻碍, codex 只能在这里写。具体的问题是什么? 是由当可拉扣的执行验证后,由可拉扣的写通过,确保我们知道代码是怎么出来的,而不是凭空变出来的。 有的过程还不够,我们还需要一个绝对理性的验收机制,就是 file list 检测这个解释给 ai 的 使用的。这里不记录任何过程,请关注任务是否通过完成了。它是一个结构化的交付清单,所有任务默认状态全是 false, 只有到某个任务真正被验证无了,它才会变成出。那么这两个文件是怎么配合,以此来防止 ai 作弊的呢?核心就在于标签印刷和单向流程。首先是标签印刷,我们在 tasks m d 里的具体任务后,会打算像简号 r e 这样的标签会对应 for list 点击层里 id 为 r e 的 功能条目。其次是单向的流程,可拉克的必须先在 task 四 m d 里跑通代码,拿到缺少的 pass 证据,然后才会去 for list 里面去更改状态。 首先是安装可拉克的和 code, 这个就不列据了,安装奥巴斯 bug 这里要说一下,最好是零点二一点零的版本 使用这个命令安装 open spark。 然后回到项目目录,使用 open spark 抽象化加项目,然后再把它的这些提示给复制到扩展词里面。 首先是 palette m c p, 可以 让可乐扣的去检验 g o i 界面,选自动化确认浏览器并收集证据,再配一个 control 器,遇到卡点时能查资料,浏览器搜索 m c p。 我 这里使用的是这幅的档案,你也可以换成其他的。大家可以去我的簿客或 知乎 app 上,也可以去云盘上进行下载复制,下载后就是这些内容了。 skills 大家可以配置到它们的根目录或者是项目目录,配置到项目目录的话直接粘贴过来就可以了。 skills 这里一共有三个,两个是给 cosys 用的,第一个是 使用采访式反问,把我们的需求和 ai 界的对齐。第二个是生成 fairlist 点 jason, 最后一个则是给可拉克的一道卡点石使用的。为了让这道流程跑起来,我们需要覆盖和新建几个配置文件。首先是 windows 八 pro pro 点 o d 需要添加的 windows 的 位置在这里, ios 的 就是这个,直接在这个 step 六后面添加内容。下面则就在项目目录里面的 openstack 文件夹下的 project dmd 的 末尾添加这个。它和上一个的目的都是为了让 openstack 生成的 test dmd 符合我们的要求。 这里需要着重说一下更改 open spark 端口, 点 m d, 则需要在输入 open spark int, 也就是说实话命令后再更改,否则会重置掉。下面则是在项目目录下完全覆盖 colocode, 点 m d, 目的则是为了明确 colocode 的 身份以及任务流。最后则需要新建一个自定义命令,位置则是在这个 新建一个昂迪脚本,这是我们自动化的核心,它定义了克拉克的如何自动循环调用 codex, 同时也避免了我们重复输入。下面则是重复流程了,先打开 codex, 使用自然语言作为一个变更体验,例如为我这个项目添加一个支持夜间模式自动切换的 openstack 体验。然后再使用 skills openstack 劝解 interviewer id, 让模型通过采访的方式引起我们的需求对其需求。这里的 id 是项目目录下的 open spark 文件夹劝诫词文件夹下的当前提案的文件夹名称。再用 open spark future list id 这个 skills 让模型创建一个 future list addition。 最后就是打开查找 code, 输入斜杠 monitor open spark codes id 就 可以开始工作了。本期视频到这里就结束了,视频创作不易,还请您点赞、关注、支持。如果您有任何问题,欢迎在评论区交流讨论。