为什么你的 ai 人物没有人味?我喜欢你,我喜欢你,因为你的提示词缺少了情绪。三件套。第一, 面部细节。比如这个女生表白的场景,大多数人只会写紧张、忐忑等抽象的形容词,那么 ai 也只会给你模板化的效果,就是我们常常调侃明星的木头演技。 所以你要把抽象的紧张落实到眼睛、鼻子、面部的细微变化上,比如眼神躲闪、嘴巴微张又敏住、脸颊泛红等。第二,肢体动作。如果只是点动,而身体不动,也会显得很僵硬, 所以要让身体跟随面部的表情一起动作。比如表白前的忐忑可以写,身体紧绷,微微晃动。 表白后的期待可以写,身体微微前倾。第三,台词的呼吸和节奏。真实的情绪都是有节奏的,而台词的表达也是有快也有慢。如果提示词里没有写出这些变化,那么讲台词就像念课文,是无法让人共情。我喜欢你, 你可以做我男朋友吗?正确的方法是用时间线来控制情绪的起伏和节奏,用语气和呼吸来控制台词的情感。比如在写具体的台词前面加上深吸一口气,急促清亮的语调,我喜欢你,你可以做我男朋友吗? 总结下, a 的 活人感来自面部的微表情、肢体的动作以及呼吸和台词的节奏感,而不是抽象的情绪形容词。那么我也根据这期内容,将几十种常见的情绪形容词整理成落地的情绪提示词。三件套,今天就分享到这里,我们下期见。
粉丝1.0万获赞7.6万

我这个 a i 不知道怎么的按空格键他没有抓手,那个抓手不见了,我找了好久都没有找到解决的教程,然后这里有一个人和我比较接近,不过他是 ps 的抓手,他说关掉浏览器就可以了,试一下吧,急死了。 退出退出,全部退出。好,然后我再试一下。哎,还是不行,关机算了,关完机再看吧,重新开机之后又是一条好汉。 好,再开机。嘿,输密码。我现在已经重新打开文件了,成败在此一举。嘿呀,成功的左手右侧。 哎呀咦,好像也没有必要那么兴奋哦,不就是重新启动的问题吗?嘿,又是一条视频,我还不是好心怕你们遇到这个情况的时候不知道怎么处理吗?主要还是为了你们,我没事,我才不紧张呢。

为什么别人的 open klo 像超人,你的却像复读机?这是大神偷偷在用的保姆级管理工具,一天一个强大工具第十八期,今天要讲的是, 他能让你一键管理小龙虾所有的复杂组建。现在一个格式化后台全搞定,不光能实时监控运行状态,出错了点一下就能自动诊断修复。更离谱的是,不管你装了多少个模型,都能一目了然。秒级 切换,连对话记忆也能直接管理。小龙虾,不听话,你手动给他改记忆。最核心的是,不用再忍受官网的频率限制,直连国内镜像库,点点鼠标,想要的 ai 技能瞬间安装。

为什么你的豆包那么笨呢?它生产出来的全都是废话,可能是因为你不会驯化它。是的,就是驯化,就是 ai 呢?这种豆包啊,它就是一个工具,我们想把它变成一个趁手的工具的时候呢,一定要学会去驯化它,让它变成一个 非常强大的素材库,非常适合你的,匹配你的一个超强大脑。那怎么来做呢?首先就是你要把它当成一个人一样去对待,你不要把它当成冷冰冰的一个机器。 嗯,多给他一些鼓励,多给他一些感谢,然后这样你会发现他也变得特别的贴心,每次给完你方案之后,他都会继续的追问你,追问你,追问你,然后给出你更完善的、更详细的、更细化的、更润色的一些方案。所以要把他当成是什么呢?你是一个艺人公司,他是你的合作搭档, 然后让他指挥着你去干活,不要说哎呀,我去指挥着他,好多人都理解错了,就说,哎,我这个我就应该指挥着他,我应该提出一些观点,然后让他去给我把这个方案写出来啊,文案写出来,标题写出来,那样就错了,那样就限制住他了,他就显得笨笨的。 你就想现在豆包他几乎把人类所有的知识全都学完了,咱们才学了多少啊?是吧?咱们想把它用好的话,就是让他当军师,让他给你出主意,出完主意之后你去执行,然后你执行完了再给他反馈,你说我执行出来是这样的, 然后,哎,让他再给你优化,你再去执行,这样是一个对的路径,而且你还可以怎么样呢?就是让他假设是一个什么样的角色,比如说你是一个电商领域里边 有十年经验的一个资深的专家,哎,你来给我出一个什么样的方案,这样他就会变得特别聪明,他不是基于你的设想,而是你给他一个设定。 还有就是我们怎么样让自己的哎,那个那个豆包更听话呢?更贴贴合我们呢?就是你要建立一个自己的专属词条,比如说我会跟他说我是白姐,我是一个讲一个人做小买卖的白姐,他就记住了, 下次我跟他开启新的对话的时候,他都会结合我们之前沟通的一些方案,再给我出一些这个基础之上的,这样他会越来越聪明,越来越默契,他甚至会学会猜我喜欢,就是他知道我的 喜欢和厌恶,不喜欢哪一种方案,哎,觉得哪一种方案是不贴实,贴合实际的,然后他会给出我更多的优化的方案,就会越变越聪明的。还有我们还可以提供一些那种关键词,让他变得更加的聪明。比如说 请你结合我的真实场景来给我一个方案,或者说就是你给我一个具体的可执行的方案,然后这样他给出来的就非常的具体, 或者说我们在刚开始的时候,我说请你再复述一遍我的问题,确保理解无误,这样你就知道你表达的他是不是听懂了,要不然他给出来的你就感觉驴唇不对马嘴的,这样他是没有办法去创作的,对吧? 咱们学习 ai 啊,学习豆包啊这些工具,就是希望它变成一个趁手的工具,然后我们可以用它来创作,用的顺手了之后呢,我们还可以用它来挣钱,那第一步呢,就是要去驯化它,就一定要去多交互,多交流,多提问, 提高自己的一些提问的能力。比如说我提问出来呢,它就是一个明确的指令,具体的问题,一个具体的目标和需求,它这样给你的答案呢,也是非常非常聪明的,不会显得那么傻气。 所以并不是说 ai 它比较笨啊,也不是说哎呀,这种 ai 现在还不是那种高级阶段的啊,还不能我说什么它就完全理解我想的呢。那我们也可以用它来进行一些创作,不是它笨,咱们就好好学学怎么驯化它,多提高一下自己的提问的 方式和能力就 ok 了。主页我有一个粉丝群,大家可以加里边,然后我们去交流一些这些经验,也可以点关注,也可以收藏,我持续给大家更新这一类的内容啊。

多智能体时代,你的工具箱放对了吗?多智能体时代,你的工具箱放对了吗?今天聊一个很多人都会踩的坑,多智能体的工具箱到底怎么放才对?你有没有遇到过这种情况?智能体 a 改了 skill, 智能体 b 完全没反应,明明文件就在那里。 两个智能体都说找不到这个工具,但文件确实存在。一个智能体加载 skill 后,行为突然变得奇怪,像是人格分裂。核心问题是,工具就放在那里,为什么会找不到?因为放错了地方。每个智能体都有两种工具箱, 第一种叫公共工具箱,就像公司的茶水间、打印机,谁都能去一处维护,所有人同步更新。 第二种叫私人工具箱,就像自己的抽屉,只有自己能开,里面放自己的角色设定和私人记忆。那怎么判断该放哪个?你就问自己三个问题,第一,有几个智能体会用,只有一个放私人,多个继续问。第二, 改一处,所有智能体都生效好不好?比如查天气,好放公共,比如角色设定不好放私人。 第三,里面有敏感信息吗?有放私人口诀记好了,谁用谁改敏感吗?三问搞定来,具体举几个例子你就懂了这些放公共工具箱,查天气,所有智能体都能用一处维护 发邮件,多个智能体可能都要发通知,浏览器控制通用工具。这些放私人工具箱记录日记,只有特定智能体需要专业分析,专属逻辑,他人不适用 管理密码,敏感信息绝对不能共享。但这里有个大坑,很多人踩过公共工具箱里千万别放角色设定, 你要是把我是财务机器人,我的职责是管账,写进公共 skill 助理智能体加载了之后,突然就开始只管账了,人格混乱。正确做法是,公共工具箱只放纯工具,比如查天气、发邮件、搜索 角色设定和身份信息只放在私人工具箱。公共工具箱等于工具,不是记忆库,所以记住两句话就够了。公共工具箱等于大家都能用的纯工具。 发邮件,查天气,浏览器谁用都行。私人工具箱等于只有我能用的东西。身份设定,敏感信息专用流程 口诀共享等于纯工具,专属等于含身份。今天内容就到这,如果对你有用,点赞、收藏加关注,感谢观看!

大家好,本期视频给大家分享一款目前非常火的开源的 ai 编程工具啊,叫 open code, 那 么这个 open code 呢,非常大的一个特色,就是对接了市面上基本上主流的所有的模型啊,你只要输入一个 api apikey 就 能直接使用, 而且它有 code 的 基本上所有的功能,所以说在目前在这个编程社区是非常受欢迎的。那本期视频呢,从就带大家来完完全全的去了解一下这款 ai 编程工具。那首先呢,我们可以从官网上看到它的一个安装非常简单,只要执行 这样的命令就行了,它也支持这种 c u r 这种直接下载,它的这种已经写好了脚本,或者说直接用 n p n 的 方式安装, 那 n p n 方式这种安装的话,你的 note g s 的 版本最好是高一些,那我们可以复制这个命令啊,那么安装完之后啊,你后面再启动或者说欧根库了,它再更新的话,它是可以直接啊打在你的打开里面去直接去更新的,它不需要你再重重复去执行这个命令, 我们可以输入 open code, 然后或者说你后面紧跟着你要打开那个目录,那你如果为空的话,那说明就是在当前这个打开,打开之后呢,你首先可以去啊设置自己的这个模型, 那么这个这里面就包含了非常多的模型,随便搜另一个模型都能搜到,比如说四点七,那么他这边有 open code 赠,那就是他官方提供的这个免费的啊,然后呢你也可以去选择这些啊,收费的啊,就是你自己 买的额外的这种套餐去配置配置进去,比如说我们买了这个,这个啊,智普的这个 code plan 就是 有专门的编码套餐,你选择它的话,输入啊 api t 就 可以了,那你也可以选择别的,就是你有你有这种 api 的 支持,这种 openai 的 这种标准格式的, 那么你也可以选择一个输进去就行了,所以说它是支持市面上所有的主角模型全部都支持。那么你选择完之后呢, 那么这里面就要了解两个非常重要的模式,一个叫 build 啊,在这里看到啊,通过 plan plan 的 话,就会根据你输入的东西来去跟你去沟通,去交流, 那最终呢形成一个比较详细的结果,那 build 呢,直接就是根据你的需求直接去生成代码了,所以我们的习惯是一般用 plan 去把你的需求去了解清楚,然后再去执行,可以用一个例子来体验一下整个过程。比如说我现在需要去创建一个企业官网, 你在打开之后呢,你看这边右边这边会有一个这样的,你的上下文的,这个消耗了 tokens, 然后还有就用了多少百分之多少的上下文,如果大到快快到百分之百了,它这边会自动去压缩, 然后等右边这边还会显示一些比如说 to do list 啊,这些它的一些任务的信息啊,这边能够方便的去看到。 ok, 他 这边已经向我们提问了,就是啊,需要了解一些关键的信息,那么你这边去回答就行了。这边他针对 plan 又列了一个更详细的这个 to do list 啊,在右边呢,可以看到啊,他之前正在执行第一个, ok, 他 这边已经把计划都做完了啊,就是把这些步骤包括技术架构啊,这个文件的目录结构啊,还有这个每个模块的设计方案, 整个的这个设计规范全部都已经在这边列出来了,列出来之后我们希望它能保存文档,因为它在目前这个 plan 模式下面是没有权限去创建代码干嘛的,所以我们要让它来去切换到 build 模式,然后让它保存文档, ok, 它这边的 plan 已经保存起来了,保存, 那下面就是我们要继续,就是说有个非常重要的叫 rules 的 就是规则,那么它这个规则跟我们之前的编程工具像 course 啊 啊, curl code 其实是它们是共通的,也就是说它们会用一个啊 md 文档叫 agent md 来保存这样的一个规则,也就是这也其实也就叫记忆。 那么在 curl code 里面是使用 curl dmd, 那 其他的编程工具其实都适配这个 agent dmd 啊,那在这个文件里面你可以去定义你这个项目是做什么的,然后它你的这个开发的规范是什么?技术价格是什么,然后你的约束是什么,一般是按这种方式去定义,那么你如果说 你自己没有写的话,你也可以通过这个命令啊去初步化一下啊,比如说我们现在目前这个项目是没有任何的这个 agent md 的, 那么你就可以使用这个 enix 这个命令啊,让它来去创建或者更新啊,这样的一个,这样的一个啊记忆的文档。 一般情况下你可以在就是项目初主的情况下,你可以写一个 readyme, 也说你可以介绍一下我这个项目是干什么用的,然后打算用什么呢?记住框架,你就说你自己可以不用去 创建这样的 agentmd 啊,你可以让它来去读取你的这个 readyme 里面的内容,然后读取你当前项目里面其他的文件啊,做一个比较标准的这个 agentmd 啊,或者说你自己去写也是完全可以的。 那我们一般从零到一级开发项目的话,是用通过这种 redmail 的 文档,或者其他的一些技术文档啊,产品文档啊,把它放到项目里面去,然后让他来去帮你去生成一个这样一个比较标准的一个这样的一个文档,那么他这边的话执行这个命令之后啊,会去搜索 call, 搜这个目录下面就是他会去引用一些别的工程里面的这个里面,看一下他合并到这个 a 点 cmd 里面去。 那接下来就是啊,一个很重要的功能叫 skills, 那 么这个技能它也是可以像 qq 的 一样使用技能的。如果你们第一次听这个概念,可以把 skills 啊理解成一个有可附用的一套标准的一个流程。那么 举个例子,比如说有个这样的场景啊,比如说你现在出出差,出差回来你要去报销,那么你要去找你的领导签字啊,你找完你的领导签字之后,你要去财务那边,去 财务根据你出差里面的各个事项来计算这样的金额,那最后把金额打到你的卡上,那么这个就是一个很标准的流程,你每一次出差都是这么做的,那么你就可以把它当成一个 skills, 那 么这个 skills 里面就可以通过啊描述,比如说你这个描述,是啊 专门为了出差而定制的这个 scares, 然后你的流程是要去找你的组长,对吧?找你的财务,然后打到你的银行卡这样的一个流程,那么在你的上下文的交流当中啊,交互当中如果出现了这种出差啊,出差的这种流程,你要去触发这样出差的动作,那么它就会调用这个 scares, 还有一个非常大的功,强大的一个功能是什么? skill 里面是可以去引用一些其他的文件来作为他知识的一个补充,比如说你的财务要计算你的出差的金额, 他可能要去翻阅啊,你们公司的一些规章制度,那么规章制度啊就可以成为这个技能的一个补充文件了,那么这个这个补充文件就当他 你的出差的这个,比如说你是三天会触发 a 制度啊,是五天会触发 b 制,那就会去判断啊,当你三天的时候,他会去加载啊,你这个 这个对应的这个制度了,对吧?然后如果说还有就是你要打款,对吧?打款要去触发这个银行的接口,比如说用技术的话说要触发银行的接口,那么他就会调用这样银行的接口把钱打给你,就这么一个流程封装起来, 而且它的最大的功能或者是优势是什么?就是它上下文是非常紧紧,就说 it 呢,在加载这个技能的时候,它是不会把你所有的文件都加载进去的,它只会把你这个 skill md 里面的这种原数据啊,就是这个 name 名称和描述干什么?就像一个相当于一个缩影一样,把这个你的这个事业的一个非常核心的是在什么场景下,是要什么具备什么条件出发来加载到上下文里面去,然后呢他会根据你的这个 情况出发之后,他会去再会去加载这个 skill md 里面的所有的内容,然后通过里面的内容再去加载我刚刚说那些分支情况,所以说它是一个渐进式的批录,渐进式的引入它的最大的优势就是这个,所以这个场景其实就是一个很标准的一个 skill 的 一个解释的一个 get 你 了。那么在 open code 里面使用 skills 呢?它这边有一个非常特殊啊,它就是它不仅会加载自己这个 open code 里面的这个 skill 的 目录,它也会把,它也会把 cloud 啊,把 clone 的 这个技能也会作为它的一个技能,也就说你在 clone, 如果你在 clone code 里面啊,拥有这种全局的这种技能技能的话,它是可以加载过来的,那这边也会有描述,也会加载到我们的系统里面去,那么我们可以打开这样的目录啊,比如说你现在是一个点 config open code, 这个是它的一个目录里面的话就会有啊,比如说你的这个 skill, 那 么你就要去创建,如果你要去 用 skill 的 话,你就要去创建这样 skill 文件,然后把你的这个写好的 skill 放到这里面去,就是一个标准的目录,那么它也会把啊这个目录里面的这个滚 call 的 啊,这个目录里面这个 skills 加载过来啊,比如说我们现在就有这样这样的几个 skills, 他 是可以加载过来的,我们可以让他来读取一下,看一下他有什么样的技能,我们可以让他来把,看一下他会加载多少技能出来。 ok, 他 这边已经把我这四个啊这个 skills 加载出来了,那么这个是一个,这个, 这个 max j s, 这个是一个不标准的,那这四个其实标准的,因为都是有这种通用的结构了,就是我刚刚这边有一个这样的一个介绍的啊,标准的结构, 那么他这边已经识别到了啊这几个,那么我们可以让他用啊这个技能,比如说我用这个东西来设计一下,专门来做 ui 的, 对吧? 那么他这边就会去读取这样的技能的这个啊里面的内容啊,看,我,因为我其实是已经是精确去匹配,让他去使用这个技能,那么他就会去加载这里面技能的这个脚本啊,或者说这个啊 skill md 啊里面的所有的一切啊,他就会去 利用里面的能力啊,把这个 ui 优化得更好。那这是它这个所以说它是可以去兼容 clock code 里面的所有的 skill, 你 也可以去把 skill 复制到它的这个 config 里面的这个目录里面去试。那么接下来就是啊,也是 commands, 就是 命令,那命令,什么是命令呢?就是你跟 skills 不 可能是什么呢? 它是把一个啊非常简单的或者非常重复的这个操作,把它定的到 md 文件里面去,它是只要你用斜杠就可以引用这个文件里面的所有内容, 它不是说不是,像刚刚的说了,这个 scares 静静式,它是你只要斜杠 m command, 然后它就会把整个命令的内容啊加载到这个上下文里面去, 而且它是不能去调用,比如说外部的这种啊,引用的这个文档啊干嘛?所以说它相当于 skills 的 一个静态的一个子集吧,你可以这么认为,那么在 open code 里面,你可以通过 ctrl p 去加载目前 可以打开目前它所有的这个 commands command 的 命令啊,然后它支持这 command 的 命令呢?有几个非常有用的啊,比如说, 那,比如说我现在打开一个上传文,就是之前的对话记录啊,我可以从这里面啊,选择之后我可以回滚, revert 就是 回滚。 那么 fork 呢?就是从这里面重新再来一下,但是它的代码其实已经产生了,也相当于你从这边拉一个分支,但是它结果是目前最新的那个结果, 就相当于你可以从可以从对话的这个角度里面重新再来一遍。虽然说你的代码已经生成了 fork 是 这个效果啊,不,如果你需希希望在这里面重新开始,那么你应该是用 reverse 回到这里面去,那么它就会回撤所有的修改,那从这边重新开始,这跟 fork 是 不不太一样的, 比如说刚刚那么多对话记录就没有了,回滚到这里面去了,这边的话是这边这就是压缩啊,这边就是压缩命令啊,把上下管进行压缩,然后的话还有一些可以自己去,可以可以看一下 啊,比如说这个,你可以把这个这个思考模式啊,就是这个编 think 的 内容要不要展示,你可以把它切换成不展示也可以,它整个内容就看不到了。如果你自己要定义这个 com 这个目录啊, 这边的话, open code, 那 么你在这边去创建这个 command 这个目录,然后在 command 的 目录里面,你可以去创建啊我们的这个这个命令,那么你也可以让它来给你去创建了,让 open code 来给你创建,相当于它这边的话去。呃, ok, 我 们让它创建了一个这样的 git commit 这个目录,这个命令啊,我们可以去这个目录里面看一下。创建完之后啊,你需要重启一下 open code, 那 么你这边就可以看到 git commit, 你 看 git commit, 那 这边就是创建一个命令了, 一样的,它是可你也可以把这个呃 curl code 里面的这个命令啊,你可以复制到它的这个 command 目录里面去,那么接下来就是 open code 的 这个 plan 就 插件, 那么它这个插件跟 curlcode 里面的插件安装方式不太一样,那 curlcode 安装就是通过啊 github 通过命令的方式直接安装到本地,那么它这个安装方式呢?就是啊使用这种 npm 的 方式,比如说你在这个 opencode 点接受里面去引用这个 插件的话,你是需要先先用这个 npm 去安装,除了这里的呢,它会有一个这样的一个叫生态系统的,里面也有很多这种社区比较受欢迎的插件啊,然后可以去看一下有没有你自己需要的。目前插件的数量比较少 啊,目前不知道就这个 color code 的 插件, open code 里面插件怎么去转换,是直接去拷贝文件过去还是怎么样的啊?目前还没去试过, 那么这边也是非常有非常常见的,比如说像这个欧买欧根扣的目前比较火的这个插件,通过给不同的子代理设置不同的模型来达到一个啊,就是模型的特长啊,比如说你是你是非常擅长做设计,那么这一块设计的工作交给你来做,那这边有一个非常好的一个这样的一个工具, 那么除了终端命令行那种方式呢?也知他也有这种 ui 界面软件,那么你在首页点击这个下载就可以下载完成了,那安装起来呢非常方便,他这个界面也是非常的简洁。那么比如说我现在打开这样的一个项目啊,比如说打开这个项目, 那么这边也是一样的,通过这个啊,我们可以去切换 build 和 pran 两种模式,然后你可以选择去选择不同的模型,在这个模型选择是一样的,就是有其实就是把终端命令行界面化了, 你在终端命令行配置的东西在这边是一样去生效的啊,比如说我们举个例子啊,了解阅读这个项目,我们可以看下它整个交互。 那 oppo 扣的呢?终端命令行这个 ui 这一块基本上介绍完了,就是如果你是一个比较喜欢去配置配置文件呀,或者去定义一些自己的东西呢, oppo 扣的比较适合你啊,就它是有一些硬核在里面的。 然后呢社区现在也是在很急速的发展,然后的话也继承了非常多的东西,他目前发展迭代的速度是非常快的, 他的目标就是什么呢?就是希望把这种可可的优势啊,各种编程工具的优势吸到他那里面去。然后呢可以去使用各种各样的模型就不会受限,比如说像 qq x 只能用 g p t 系列的模型,那 cloud code 当然是 cloud 的 模型是最适配的,而且受限于它,就是每个官方的每一个编程工具啊,都受限于自己的模型的这个选择局限性。那么怎么样去把每一个模型结合到一起去干活呢?那这个就是他做这个的意义就在这里面。

ai 把前端写完,很多时候还是停在代码这一步,最后那遍验证还是得你自己来。按钮能不能点,弹窗会不会炸,样式有没有跑偏,他很多时候还是在蒙。 现在有人在补这一步,名字叫 web m c p。 他 想做的事很简单,网页把能做的动作直接交给 ai, 问题就出在这。现在很多 ai 助手还是在读页面找按钮硬点,你让他改个颜色,代码他能改, 真进页面一跑,他常常就蒙了。样式一动,页面结构一改,弹窗一换,前面那套判断很容易当场作废。说白了,他会写,但不会稳稳的验。 web mcp 的 思路不是让 ai 再拿着鼠标瞎试,而是网页先把能力递出来,搜索、填写、提交,这些动作可以直接挂成工具,再复杂一点就走站内接口,这样它不是盯着界面猜,而是顺着你网站原来的路子往下走,少猜页面,多走逻辑,这就是它最值钱的地方。 这次比较像真的,因为它不是凭空变魔术,是直接吃浏览器里现成的东西。登录它权限当前,页面状态本来就都在,谷歌和微软已经把它放进早期预览了, 这至少说明大家不是在讲故事,是真想往浏览器里面做。它也不是万能药。第一波更适合上线前验一遍,后台走流程,这种真得看页面状态的活。 如果这条路真跑通,以后最值钱的可能就不是 ai 会不会写页面,是它写完以后能不能自己进去点一遍验一遍,把坑先踩掉。前端和 ai 的 配合也会更像正常写作。关注我,我继续给你拆这种今天就能用上的新工具。

终于知道携秀面试为什么那么让人讨厌了,给大家看一下正常人现上面试是什么状态,左边开着文档,右边挂个 ai, 中间面试手忙脚乱。面试官,一个问题过来,你在翻笔记。但前两天有个粉丝给我推荐了一个工具,叫接纳侠,是专门针对远程面试设计的实时辅助。 那什么意思呢?就是你面试的时候,他在后台实时捕获面试官说的每一句话,七百毫秒之内直接给你生成回答,建议弹屏幕上。那关键是什么呢? 隐身窗口?屏幕共享和录屏检测都看不到它。面试完那边你的画面干干净净,但你这边每道题的参考答案已经谈出来了。跟传统那种自己偷偷翻文档的物理外挂比,这个只能算是 next level 了。 如果你背了无数道面试题,但临场还是紧张忘词,或者面试完突然甩一个,你完全没有准备过。问题,那这个东西你一定要是。目前官网数据显示超过两千人在用,覆盖字节,腾讯、阿里、谷歌、亚马逊这些大厂和各种外企,不管你是技术岗、运营岗还是产品岗,都能用。 我给你们演示一下,面试完问了一个问题,他自动识别语音,你看,屏幕上已经弹出回答框架了,不是给你一个死板的标准答案,是给你一个结构,先说什么再说什么,最后说什么。哎,你看,照着这个结构用你的话自己说出来也行。 这是所有主流平台,腾讯会议、飞书、 zoom、 google meet, 戴耳机也能用,到时候还不够。如果你担心独傲感太重,眼神一直飘,你可以把窗口调成半透明,或者在屏幕正中间,离屏幕一个手臂的距离,你的眼神看上去就在是直视摄像头,面试官完全看不到你在看提示。 还有招更狠的,直接同步到手机,真正实现了物理隔绝。但习大侠不只是面试的时候用它还有一个 ai 模拟面试的功能,你选一个岗位, ai 面试官直接开始问,您语音或者文字都能答,答完每道题实时评分,告诉你哪道题答的好,哪里需要改。 面试之前先用这个,练三轮,上政治战场的时候心里就有底了。还有一个功能,我觉得挺实用的,智能简历优化,你把简历传上去,它自动从 a t s、 兼容性、 关键词覆盖、内容质量等多维度给你打分,竹条告诉你哪里有改。你还可以把目标岗位的距离填上去,他帮你分析匹配度,告诉你缺什么怎么补,改版在头,通过率完全不一样。题目也有一千多道真题,自己阿里、腾讯、美团、谷歌、爱马逊等公司按岗位分类,每道题配回答框架和常见追问, 不用你到处搜面筋了。这一个工具全部覆盖,价格也不贵,注册就送三天免费试用,不想订阅的可以按次付费,每天还可以领积分,免费版也能白嫖。刷着不禁感叹,以后面试真的要面试官坐在候选人旁边才行了。用完回来可以告诉我好不好用,我下期出一个实战测评。

ai 助手能做的是有限,但如果让多个 ai 同时并行干活呢?今天我们来彻底搞懂多 agent 模式,配置层怎么路由,运行层怎么并发?还有怎么让开发工具也直接借上 agent? 看完这四块,你就真的会用了。 今天要搞懂四件事,第一,什么是多 agent 配置?它是怎么把不同消息分给不同大脑的?第二, bindings 路由规则优先级怎么算?配置怎么写。第三,运行时怎么动态生成字 agent 并发执行任务。 第四, a、 c p 协议是什么?怎么让编辑器直接连上 agent? 先说配置层, 每个 a 证就是一个完全隔离的独立大脑,有自己的工作区,自己的登录态,自己的对话历史,互相之间完全不共享。 你可以理解为同一个系统里跑着好几个独立的助手,工作助手和生活助手之间的记忆完全隔离,不会混在一起。创建新 a 证只需要一行命令,或者在配置文件里加一段 j、 s、 o n 就 行。 有了多个 agent, 怎么决定哪条消息给谁处理?靠的是 bindings 路由规则。简单说,匹配越精确,优先级越高,精确到某个具体用户 id 的 优先级最高,其次是群组角色,再往后是账号级别,最后是整个平台都抵。 举个例子,同一个账号下,你可以让某个特定群走深度思考的大模型 agent, 其他群走快速响应的小模型 agent, 精细路由完全没问题。 还有两个很实用的玩法,一个是多账号支持同一个通讯工具,你有工作账号和个人账号,可以分别绑定到不同的 agent, 工作号走严谨的代码助手,个人号走随意聊天的助手。 另一个是模型分流,日常问答走清量快速的小模型,需要深度分析的走强大但稍慢的大模型,这样既省钱又高效。 配置层讲完了,再来说运行层,核心工具是 session spawn, 它的作用是派生子 agent, 调用之后立即返回,不阻塞主 agent。 子 agent 在 独立 session 里运行,最经典的用法是并发模式,主 agent 同时 spawn 三个字, agent 三个任务同时开跑,各自完成后自动汇报回来,效率直接拉满。 有两个限制,要记住,子 agent 不 能在 spawn 下一级,只有一层嵌套,并发的子任务不能操作同一个文件,不然会冲突。 除了 spawn, 还有三个工具, session send 是 向已有 session 发消息,支持同步等待回复。两个 agent 之间可以来回对话,最多五轮。 session's list 是 列出当前可见的所有 session。 session's history 是 读取某个 session 的 历史记录,这三个组合起来就能实现 agent 之间的任意通信。不过跨 agent 通信默认是关闭的,需要在配置里显示开启白名单才行。 最后聊一下 i g p 协议,全称 agent client protocol, 它让开发编辑器比如 z 或者 v s code 通过标准输入输出直接连接到 agent 的 session。 连上之后,你在编辑器里对话的上下文和在聊天窗口里是同一个 agent 共享同一段记忆,代码修改和对话内容能真正结合起来,配置也不麻烦,在编辑器设置里加几行 j s o n 指定命令和 session 参数就好了。 最后做个总结,需要不同人格隔离,不同模型分配,多平台账号分流的时候用多 agent 路由配置 任务可以拆分并发主 agent 需要保持响应,单个任务预计超过三十秒的时候用 session spawn 需要在已有 agent 之间传递信息或者等待回复的时候用 session send。 记住四个关键约束,此 agent 只有一层嵌套,并发任务不操作同一文件。跨 agent 通信要显示配置工具白名单,控制的是工具权限,而不是 skill。 好 了,今天的内容就到这里,多 agent 模式彻底搞懂了。

如果你做 ai 视频总是有卡点,那么今天分享一个全新的 ai, 大 概率能解决你在创作中遇到的百分之九十以上的问题,这就是一张无线画布,而接下来脚本、分镜图片、视频都会在这一张画布里面全部搞定。 先在画布上双击鼠标的左键,你看,直接就能在这张画布上新建一个初试的项目了,无论你是让 ai 写文本,做图片、做视频、音频,甚至写脚本都可以。咱们先点击脚本好,接下来输入我们想制作的 ai 视频的主题点, 点击确认看到了吧, ai 会根据主题来生成分镜头脚本,他不会上来直接就做视频,因为只有先把分镜定好,后面才不会乱,而且分镜脚本也不是定死的,我们是可以手动修改的,改完之后呢,往下走,点击生成分镜模型, 比例、摄像机控制都可以选。确认之后呢, ai 就 会顺着分镜脚本往下生成分镜图,出来之后我们还可以继续调,直到这一帧对了为止。 好,再往下直接点击批量生成视频,这里不用像以前一样了啊,生完图下载再上传,再切到另一个 ai 工具里面做视频了,因为你直接在这就能用上全球各大顶尖的 ai 模型。选好之后点击确认,稍等一会就完成了,咱们拼接一下看看成片, 嘿嘿嘿。 其实这个工具最舒服的地方不只是它包含了各大 ai 模型,而是主题脚本、分镜画面、视频,终于能顺着一条线完整的坐下来,它不是那种一句话出片的工具, 应该说是一个全新思路的 ai 导演工具台。在这个 ai 工具的主页还有大量的工作流,我们可以一键参考和复制来逐帧学习大神们的制作全过程。好了,教程文档已经备好了,赶快去体验一下这个全新的 ai 创作流吧!

同样用 ctrl, 同样用 close, 为什么有人做出了百万用户的产品?秘密就在于脑子里有一张看不见的蓝图。外部扣定四大能力第二讲,上期聊了审美,今天来聊让你真正进阶的核心能力,系统思维。写个小脚本,做个静态页, ai 完全没问题,但是要做一个真正稳定可扩展的产品,你需要的不只是工具,而是一套驾驭工具的思维框架。 今天教你四招超级实用的方法,帮你从写脚本快速进阶到做产品,学完立刻就能用。用 ai 做产品,大家最常遇到的三个挑战是什么?挑战一,代码越写越多,但缺少清晰的模块划分,维护起来越来越吃力。挑战二, 功能全堆在一个文件夹里, ai 的 上下文装不下,效率直线下降。挑战三,遇问题时不知道从哪下手,只能反复让 ai 尝试,效率不高。这些都是正常的成长过程,每个人都会经历。好消息是,只要掌握一个核心思路,你来当总设计师, ai 来当施工队,效率马上翻倍。 第一招,超级实用,学会刨钉解牛式拆分高手的做法是什么?把大任务拆成小模块,这边一个用户登录,那边一个订单拟情,给 ai 下一个定时,明确限定范围。这次我们专注做核心渲染引擎这一模块,做完验证好再做下一个,每个小模块独立验证,完美了 再组装到一起,这就是高效拆分的核心方法。分享一个快速提升的练习法,去 github 上找十个自达过万的同类项目,不看代码,只看目录结构,看他们怎么把功能拆成一个个文件夹,对比十个优秀项目的结构,你就会很快建立标准模块,感觉这个方法亲测有效。懒人通道, 甩一句给 ai, 假设你是资深架构师,给我输出一个同类产品的标准目录结构,模块清晰,职责单一,命名规范, 秒出一棵目录树当脚手架,效率提升十倍。落地神器,在项目跟目录建一个规则文件,格式叫格式 rules, cloud 叫 cloud 点 md, 写好价格规范和命名要求,相当于给 ai 装了一道永久生效的导航系统,每次开工自动取,不用重复交代。 第二招,你的系统必须盖成三层楼,就算一个人做产品,也建议守好这三层结构。第一层,好看的皮肤按钮页面动画, 用户看到的界面。第二层,聪明的大脑管家,交易密码计算金额处理业务逻辑。第三层,安全的地下金库、数据库,用户信息核心数据存储。有了这三层楼,你给 ai 的 指令就非常精准了。这次只在皮肤层调整样式和动画,逻辑层和数据层完全不动,分层清晰了,改动范围可控, 系统稳定性直接提升好几个档次。练习法,打开一个你天天用的 app, 美团融资、飞书都行。截张图试着分析这块是界面层,这个按钮背后掉了什么接口,数据存在哪里?把一个成品 app 拆成三层楼,拆五个之后, 你看产品的视角就完全不一样了,这就是系统直觉的建立过程。懒人通道,截个 app 页面,给 ai, 帮我拆成三层,界面层、逻辑层、数据层,分别是什么?列表输出,他帮你拆完,你对照验证,进步特别快。 第三招,特别强大的好习惯,动手前,先让 ai 输出设计蓝图和执行计划,先想清楚再动手,效率翻倍。两句命令,记住第一句,我要做这个功能,但先不要写代码。先把所有模块之间数据怎么流转的路线图画出来,用模拟的语法输出 完了之后,扔进模拟的 live 网站渲染,检查一下数据流转有没有遗漏,结构是不是合理。第二句,先告诉我,你打算分几步做,每步改哪些文件,影响哪些模块?那他先教执行计划,你确认合理了再开工。这叫 play execute。 两步法是格奥的官方推荐的最佳实践,花十分钟看蓝图审计划,能帮你省下大量返工时间,亲测超级有用! 第四道,动手之前,先把对接规范定清楚。模块拆好了,层级分清了,怎么让这些模块精准配合?很简单,开工之前,先把对接规范写清楚,明确告诉 ai, 先把模块之间的对接规范写好,谁发什么数据,格式是什么,返回什么结果。比如一个用户对象有哪些字段,姓名 是文字,年龄是数字,这些数据格式现在全部白纸黑字确定下来,规范定好了,后面不管怎么借贷优化,模块之间的配合永远不会出问题,稳如磐石。业界管,这叫规格驱动开发,把编码规范、价值构要求、测试标准全部写成项目规格书,人定规则 a, 按规则高效出货。 遇到报错怎么高效排查?分享,我用了十几年的三步法,很多朋友遇到报错,第一反应是把所有报错一股脑丢给 ai。 其实有更高效的方法。第一步,定位问题出在界面层、逻辑层还是数据层?先锁定范围。第二步, 追踪数据,从用户操作开始,数据经过每一个环节,一路追过去,看看到底在哪个环节出了偏差。第三步,精准修复,只在出问题的这个文件里修复,其他文件全部保持不动,这样排查又快又准,而且不会引入新的问题。效率小技巧, ai 写完代码后,追问一句,检查你刚写的代码 有没有边界情况或潜在问题,列出来,让他先自己做一轮自检,能提前发现不少潜在问题。你再复合一遍,双重保障。 来回顾一下今天这四个方法,每一个马上就能用起来。第一招,拆模块第二招,分层级第三招,先画蓝图再开工。第四招,提前定好对接规范,分享一个特别有效的实战训练。开一个新项目,先不用今天的方法,让 ai 自由发挥,做一个小应用,然后再开一个新项目。这次用今天学的四招来指挥 ai, 两次对比下, 你会非常直观的感受到有架构和没架构的巨大区别。懒人通道十分钟速通版,让 ai 做个带登陆的记事本,不给约束。写完后追加三个需求标签,分类搜索,多人协助,你就能 直观的看到没有架构思维,效果差别有多大。在这个时代,最值钱的不是写代码的能力,而是脑子里那份系统设计的大局蓝图,有了这种架构思维,你和 ai 配合的效率会提升好几倍。锁定这个号,下期分享能力三,产品感做的快不代表做的对,怎么用最小成本验证你的想法。我是九木,下期见。

同样是用 ai, 有 人用它改变了工作方式,有人用它只是问了个今天吃什么。差距不在工具,在提问,你有没有遇到过这种情况,把问题丢给 ai, 得到一段看起来很像回事,实际上毫无用处的废话,你重新问还是废话?你开始怀疑 ai 到底有没有用。 但与此同时,另一些人正在用同一个工具,写出让甲方沉默的方案,推导出让同事哑口无言的逻辑,甚至把三天的工作压缩近三个小时。 同一个工具,天壤之别的结果,原因只有一个,他们掌握了一套问问题的方式,而你没有。今天这期视频,我不讲工具,不讲哪个平台更好用,我只讲十个问题。 这十个问题是全球顶级提示词工程师花了无数时间总结出来的核心框架。掌握它,你跟 ai 之间的关系会发生根本性的转变。但在讲这十个问题之前,我要先告诉你一个大多数人根本没意识到的事实,你现在用 ai 的 方式,其实是在主动限制他的能力上限。 很多人把 ai 当搜索引擎用,想到什么问什么,问完等结果,结果不满意就换个平台。这种用法有一个根本性的问题,他把 ai 当成了一个被动的答题机器,而不是一个可以被激活的思维引擎。 麻省理工学院有一项研究,追踪了两组使用相同 ai 工具的职场人员。六个月后,高效使用组的工作产出质量平均提升了百分之四十, 而低效使用组几乎没有任何改变。研究者最后得出的结论是,高效组平均每次向 ai 输入的信息量是低效组的三点七倍,说明 ai 的 输出质量直接取决于你输入的信息质量。 你未给他的背景越丰富,他给你的答案越精准。你未给他的问题越模糊,他只能用最平庸的方式填补你留下的空白。你问 ai 帮我写一封邮件, 他会给你一封四平八稳、人畜无害的模板邮件。但如果你问,我是一个在外资快销公司做品牌的人,需要向一个拒绝过我们合作申请的本土渠道商写一封邮件, 目标是让他重新打开谈判的窗口,语气要自信,但不强硬,你会得到一封完全不同的邮件。同一个 ai 输出结果的差距不在 ai, 在 你,这不是 ai 的 问题,这是你的问题。 更准确地说,这是你思维的问题。大多数人给 ai 的 指令,说到底是思维懒惰的产物,你自己都没想清楚要什么,凭什么期待 ai 帮你想清楚? ai 其实是一面镜子,你的思维有多清晰,它的回答就有多精准。 你的思维有多模糊,他的回答就有多费用。 ai 的 水平从来不是技术问题,而是思维密度问题。那么,如何提升思维密度,关键就在一套具体的、可以立刻执行的问题结构里,而这套结构,绝大多数人从来没有被人系统教过。 现在进入核心部分,我要给你十个问题。这十个问题不是让你背下来背给 ai 听的,而是在你提问之前先问自己,它们是你跟 ai 之间的一道过滤器,帮你把模糊的需求变成精准的指令。第一个问题,我的目标是什么?用一句话说清楚, 听起来简单,实际上大多数人在这一步就倒了。我想让 ai 帮我提升工作效率,不是目标。我需要在周四下午前完成一份午夜的竞品分析报告才是目标。目标越具体, ai 的 行动空间越小,输出越精准。 第二个问题,我的读者或使用对象是谁? ai 写给投资人看的内容和写给普通用户看的内容,语气、逻辑、测重点完全不同,你必须告诉他谁在看这个东西。第三个问题,我希望对方看完之后产生什么感受或行为? 是被说服?是感到安心?是立刻下单,还是忍不住转发?目标行为不同,内容结构完全不同。第四个问题,有哪些限制条件?我需要告诉 ai, 字数格式、不能提及的竞品必须包含的关键词、风格、禁区这些。边界越清晰, ai 越不会在无效方向浪费输出。 第五个问题,我能给他什么背景材料?过去的案例、参考文章,你自己的笔记、相关数据。你给的背景越厚实, ai 的 输出越贴近你的实际需求,而不是一个通用答案。 第六个问题,我需要他扮演什么角色?你可以让 ai 成为一个资深律师,一个刻薄的编辑,一个你的竞争对手,一个从来不会给你面子的用户。角色不同,思维框架完全不同,输出的盲点和洞见也截然不同。第七个问题,我想要几个版本?还是一个最优解? 有时候你需要的是发散,给你五种可能性。有时候你需要的是收敛,直接给最好的那个。没说清楚, ai 就 自己猜,猜错了是你的损失。 第八个问题,这个答案需要具体到什么程度?要框架还是要执行细节?要方向还是要落地步骤?这个问题决定了你拿到的是地图还是导航。第九个问题,我要不要让 ai 先反问,我再给答案?这是高阶用法, 你可以直接告诉 ai, 在 回答之前,先问我三个你认为需要了解的关键信息。这一步相当于让 ai 帮你检查你自己的问题是不是完整的。 很多时候,你会发现, ai 反问的那三个问题,正好是你自己没想到的盲点。第十个问题,如果 ai 给的答案我不满意,我能说清楚哪里不对吗?这是最容易被忽视的一步。大多数人拿到不好的答案,要么放弃,要么重新问一遍一模一样的问题。 但真正有效的做法是精准反馈。不是这个不好,而是这个逻辑跳跃太快,中间缺了一个过渡。或者这个语气太生硬, 我的受众接受不了。反馈越精准, ai 迭代越快,最终产出越贴近你真正想要的东西。这十个问题,其实就是在逼你在提问之前,先把自己的需求想清楚,而这件事跟 ai 无关,跟你的思维质量有关。 掌握这套框架的人,不只是用 ai 用的更好,他们在思考问题本身这件事上也开始变得更清晰、更锋利。 但这里有一个更深的事实,很多人没有意识到,真正的 ai 大 神,并不只是靠这十个问题变厉害的,他们背后还有一套底层逻辑。这套逻辑决定了他们用 ai 的 方式跟普通人存在着一道根本性的认知鸿沟。 现在我们到了最关键的部分,为什么同样学了提示词技巧,有人用 ai 越用越强,有人用了两周就放弃了。 原因不在技巧,在于他们对 ai 是 什么的根本理解不同。大多数人把 ai 理解成一个效率工具,用来节省时间,用来做重复性的事情。 这个理解没错,但太浅。更准确的理解是, ai 是 一个认知杠杆。什么叫认知杠杆?阿基米德说,给我一个支点,我可以撬动地球。 ai 就是 那个支点,你的思维质量就是那根杠杆的长度。支点再好,杠杆太短,翘不起来。真正的 ai 大 神明白一件事, ai 能放大你的思维,但放大的前提是你得有值得被放大的东西。 这就是为什么那些在某个领域已经有深度积累的人,用 ai 之后产生了指数级的飞跃。而那些本来就没有独立思考习惯的人,用 ai 只是更快的产出了更多平庸的内容。有一个真实的案例,非常能说明问题。 保罗格雷厄姆是硅谷知名创投机构 yc 的 创始人,他长期保持一个习惯,在用 ai 处理任何重要问题之前,他会先自己花二十分钟独立思考, 写下自己的初步判断,然后再把这个判断交给 ai 去挑战、补充和推翻。他在一次访谈里说了一句话,我不需要 ai 帮我想,我需要 ai 帮我想的更彻底。你自己不想, ai 替你想出来的东西永远不是你的, 它只是一段你不理解的文字。但你自己先想,再让 ai 挑战你的想法,你会发现漏洞,你会发现盲区,你会发现那些你原本已经想清楚的地方,往下还能再挖一层, 这才是 ai 真正改变人的方式,不是替你思考,而是逼你思考的更深。所以,真正的 ai 大 神有一个核心习惯,他们不止用 ai 生产内容, 他们用 ai 训练自己的思维,他们会让 ai 扮演反对者,专门攻击自己的逻辑。他们会让 ai 列出他们没考虑到的角度,他们会让 ai 在 他们确定一个结论之前, 穷举所有可能推翻这个结论的证据。这种用法让他们每次和 ai 的 交互,都在升级自己的认知密度,而不只是完成一项任务。而普通用户的用法是,每次和 ai 交互,都在外包自己的思考,久而久之,思维反而在退化。这就是 ai 时代的分化。 一部分人用 ai 越来越聪明,另一部分人用 ai 越来越依赖,越来越空洞。你属于哪一部分,取决于你今天选择怎么用这个工具。 为什么同样是用 ai, 差距越来越大?因为 ai 是 一个放大器,它放大的不是你的时间,而是你的认知质量。 十个问题是一套工具,帮你把模糊变成清晰,把需求变成指令。但工具背后的逻辑是,你思考的深度决定了你提问的质量,你提问的质量决定了 ai 输出的上限, ai 输出的上限决定了你在这个时代的竞争位置。人类历史上,每一次技术革命都是一次认知筛选。印刷术出现。会读书的人和不读书的人之间出现了鸿沟。互联网出现会用信息的人和被信息淹没的人之间出现了鸿沟。 今天, ai 出现了鸿沟的名字叫提问能力。不是谁更懂技术,而是谁的思维更清晰,谁更敢于向一个不会评判你的机器提出真正深刻的问题。 这十个问题从今天开始,在你每次打开 ai 之前先问自己一遍。三个月后你会发现变得不只是你的工作效率,变得是你看待问题的方式本身。 最后留一个问题不是留给 ai 的,是留给你的。你上一次真正想清楚一个问题是什么时候,今天的分享就到这里,我们下期再见。

哈喽,下班了,今天我们来聊聊 openclaw, 我 觉得有必要啊,因为太热了这个话题,我想给它降降温, 为什么呢?因为这是一个在 getop 上引起广泛关注的一个项目,而且目前各家云厂商都上线了相关的云服务器,支持大家去部署这个产品。那么这个产品怎么定位哈?它其实是一个 个人助手,或者叫一个通用型的 ai agent, 它可以接入,比如说一些计时通讯工具,你可以通过这种计时通讯工具给它发消息,然后它呢帮你调度一个云端的电脑,或者是你本地的电脑,它可以完成一系列的任务。 那么我一开始看到这个产品的感觉,就觉得它跟 coldbody 这种产品非常非常的像,为什么呢?因为它们都是通用 agent, 就是它可以通过调用电脑里的各种工具, ai coding 的 工具,或者是电脑里的一些网页浏览的工具,通过 m、 c, p 等等,它可以去完成很多的任务。 当然因为授权范围的不同,它肯定是比 cloud code 或者 code body 编程类的工具,它能做的事情更多,而且它的主动性更强。 举个例子哈,你可以在你的一些即时通讯工具上直接说,你帮我发一个什么样的文档给谁谁谁,他可以直接执行。那你帮我把这次会议机要转成一个非常清晰的文件,帮他变成一个网站,他也可以非常快速的完成。 甚至是你可以跟他说,你调用这个电脑的录屏功能,帮我做一个什么样的 ppt, 它也可以完成。所以就是当你给 ai 配了一个电脑的时候,而且这个电脑它拥有所有的权限,它跟你的权限是一样的,跟人的权限是一样的时候,那它可以解锁很多的能力。 当然这里面有两个核心的概念,或者说核心的机制,让它跟 ai coding 的 产品有本质区别。第一个叫 gateway, 就是 相当于一个调度中台,它可以在这个调度中台上 接收信息,接收完以后分配任务给到不同的电脑中的工具,然后哎完成最后交付。那它是一个调度中台,那这个调度中台就可以实现一个 实时在线,就是二十四小时一直在线,它可以保持着这种这么一种激活的状态。那这也是为什么你说它可以持续不断的收到你的消息,就是因为它是持续在线这么一种状态。第二个非常关键的机制呢,叫做 heartbeat, 叫心跳机制,类似于给了 ai 心跳,让它可以跳动起来了。它什么意思?它每隔一段时间它会去扫描一下这个系统里有没有新的需求进来,比如说你的邮箱 有没有收到新的信息,比如说你之前有没有设过闹钟提醒,比如说每天八点去帮我扫一下整个今天的 ai 行业的资讯,或者是每隔一段时间我要去看一看有没有新的任务给到我。通过各种即时通讯工具,我就可以开始激活 ai 干活。 所以你从这里可以看到他有一个非常主动的一个机制,他会主动去扫描,他会实时待命,主动扫描,所以这个就跟像 coldbody 里你跟他去做交互, 拿到一个任务,完成一项工作就有很大区别,他就是处于一种实时待命的状态,而且会主动接到信息就开始干活,所以这个就是一个本质上的区别哈。 但是我觉得这个东西我为什么前两天没讲呢?就是因为我觉得它跟这种通用型的 agent ai coding 的 工具没有本质上的区别。假设说像 cloud code, 像 code body, 它们如果也想做一个类似的功能的话,实际上是完全可以做到的,只要给 ai 更多的授权就可以实现。 或者说你只要再弄几个移动端的交互的方式,你也可以在移动端指挥你的本地电脑完成这样的工作,其实没有一点难度。那为什么 大家都没做,为什么就只有这个 open cloud 在 做这件事?我觉得是大家对安全和效率中间怎么平衡的一个考虑, 就是你到底给 ai 多大的授权?我们知道它的上限其实是非常高,可以完成很多任务,而且很多任务上是超过我们自己的能力的。那这种情况下安全的问题怎么考虑?比如说现在如果是 这个东西被劫持,因为他有权限很高,那如果一个一个一个不法分子告诉你的电脑,说把这个人的电脑的内容全都删了,或者说把这个人的电脑中关于什么什么的内容发给某某邮箱,那他就可以实现了, 它就可以实现对你电脑的一个操控,对你个人数据和隐私的一个操控。所以其实这种安全问题是非常重要的一个问题。之前大家说中国人可能不在意自己的隐私,愿意拿隐私换便利,那接下来 ai 时代 那生产力是非常高的,这个上限是非常非常高的,那你愿意把你的安全拿出来多少去交换这种生产力的上限?我觉得这是一个摆在我们每一个人的面前的问题。因为 ai 的 能力现在 不是技术来去束缚的,而是你的这个治理的原则束缚的。你到底要给他多大的授权?你相信他到什么样的程度?你愿意给他几千块钱,让他帮你买东西,对吧?这样的一些问题,我觉得可能都是我们接下来要考虑的一些关键的问题。 我之前觉得像 coldbody 这种产品已经非常够用了,在我们的日常工作中哈,当然我也不满足,因为我前两天还在说怎么给 ai 更大的自主性,让它自己去跑这个 a 阵的能力。但是对于这种 openclaw 这种形态, 我自己心里目前还没有完全接受,当然我可以接受一个新的电脑去做一些尝试,但是因为他现在还有很多问题,比如说 token 消耗非常大的问题,比如说这种安全不可控的问题,所以我觉得目前不是一个非常理想的形态。当然最后 可能再往前走一下,很多产品也会去考虑这些问题,会给用户更多的选择,然后给用户。我觉得现在用户已经很很很少有能力去控制自己的这个数据的安全了。但是我们在这个 ai 时代到底要在 ai 面前变得这么透明吗? 也许有一天你会发现你让渡的这个权力本身可能比效率更重要。对,最近我在考虑这个 ai 时代的权力,到底我们要给 ai 多大的权力? 如果他的能力已经非常非常的高了,如果他的加入到人类社会中,真的已经能够给人类带来非常非常多的注意的时候, 我们愿意给他主体性,我们愿意给他授权吗?我们愿意给他权力吗?我觉得这些都是一些要考虑的问题,跟大家分享这么多哈,我觉得这也是一些非常非常前沿的命题,有机会再跟大家探讨,拜拜。

当我们用 ar 编程工具把项目做好以后,要上线部署的时候呢,会遇上很多其实很简单,但我们却束手无策的情况,比如端口的占用,比如查看某个依赖的版本,比如项目启动打包启动生产环境等等。 其实啊,这样的事情呢,只需要一条命令就能解决,所以说在部署的整个过程中呢,我们会用到很多的命令,虽然现在 ar 工具能帮我们执行一些,但有很多 还是需要我们自己去执行的哦,即便我们不执行,那这些命令呢,我们也一定要知道他是干什么的。这份命令清单呢,是我部署项目中使用频次最高的,我今天整理出来给朋友们,有学的朋友直接可以找我拿哦。

哎,很多人现在一上来就让 ai 直接点网页,可问题不在它能不能点, 而在这些动作太难附用,太难验证,也太难沉淀成长期工作流。 open c l i 想补的就是这一层。先讲清楚它是什么。 open c l i 不是 单一网站采集器,也不是只会浏览器自动化的命令行包装。 他想把网站浏览器、绘画、 electron 应用,甚至你本地的 g h docker 这类工具,都统一收成一个 c l i 层,让人和 ai 都从这层接口去调用。 为什么这件事值得讲?因为官方 readme 和架构文档写得很直白。 definitive interfaces c l i have ai native runtime, dual engine architecture。 他想解决的不是这次能不能自动化,而是外部世界能不能被收成稳定工具面我也本地装了一遍, 原版安装能跑 open client 版本是一点六点九, doctor 也已经把 damon 拉起来了。 但它同时告诉你一件更真实的是, browser bridge 扩展没连上,所以浏览器链路还没完全打通。也就是说,这项目不是空壳,但也不是零门槛魔法。 所以 open c i i 最值钱的地方不是命令很多,而是它让你别每次都从点网页开始。 以前是让 ai 一 次次去重复实时动作,现在是先把网页桌面端和本地工具慢慢沉淀成稳定命令,再让 ai 去调用。 再看它给 ai 的 workflow, 你 会发现真正有想象空间的是这条深层流水线, explore synthesize generate cascade, 也就是先看页面和接口,再把结果设成适配器,再把一次性动作变成真正可附用的命令。对长期 a 卷的工作流来说,这比只会点网页重要的多。 哎。一句话总结,如果你只是想今天让 ai 带你点几个网页, open ci 不是 最低门槛答案, 但如果你想让 ai 长期稳定地使用外部工具,先给他一层可验证可附用的 cli 工具面,这个项目值得认真试。 评论区发 open cli, 我 下一条继续拆它的 browser bridge generate 流程。还有这层 cli 底盘到底适不适合你的工作流。

ai 为什么会瞎编?其实就两个原因。第一个,他学的东西本身就是假的, ai 所有的知识都是人喂给他的,那谁在喂,说白了就是 谁花钱多谁说了算。比如你搜北京哪家烤鸭最好吃,出来排第一的很可能不是全聚德,而是某个小馆子花钱买的排名。 ai 哪知道这是广告,他就觉得,哦,大家都说这家好, 然后一本正经的告诉你,所以不是 ai 想骗你,是我们一开始教他的东西就不干净。第二个,人类现有的知识他已经学完了,学完了怎么办呢?他就开始自己编新东西,然后拿自己编出来的再当教材继续学,一遍一遍循环, 越往后越离谱,到最后他自己都分不清哪些是真的,哪些是自己上一轮瞎编的。所以他说出什么奇奇怪怪的话,你都不用觉得奇怪。

今天给大家介绍 openclaw 调试技巧,全部讲透!用 ai 的 时候,最怕的就是不知道它在干什么,开启调试模式,执行过程一目了然。 第一个是 for both on, 展示工具调用的完整过程,方便追踪执行逻辑。第二个是 reasoning on, 展示 ai 的 思考过程,排查问题更轻松。 接下来是流逝回复,强烈推荐开启 ai 回复,像打字一样逐字显示,不是全部生成完才一次性输出。执行这条命令,开启非输渠道的流逝回复。 第一个优势是实时反馈,逐字显示,不用干等。第二个是随时打断,发现 ai 方向说错了,立即停止,节省时间。 第三个是省 token, 避免无效生成,钱花在刀刃上。接下来是两个透明度增强功能,耗时显示和状态展示。 执行这条命令开启耗时显示,每次回复末尾会显示耗时,比如已完成耗时一分五十四秒。 在执行这条命令,开启状态展示,会显示已读、正在思考、正在执行等状态交互更透明。 耗时显示让你清楚知道 a a i 执行了多久,方便计算 t a i 是 在思考钱花在哪,一目了然。状态展示让你明确区分 a a i 是 在思考,不会对着空白干等。 最后是核心执行机制,这个非常重要,理解了能少踩百分之九十的坑。 openco 多条消息进入队列,严格按顺序执行,必须等上一条任务完全结束才会处理下一条。 就算重启 gateway, 也会先把队列里的消息按顺序处理完,再接收新任务。所以阶段任务一次性尽量说清楚,不要连续发送多条消息,执行更稳、更快、更省 token。 好 了, openclout 调试与使用教程就到这里,有问题随时交流,关注我,了解更多信息!

你有没有发现过一个奇怪的现象,同样的 ai 工具呢?有人啊,用它几分钟就能生成一份逻辑严密的商业报告。而你试了几次 ai, 却只会给你一些车轱辘骂,甚至聊着聊着就开始胡言乱语了。 你可能听过很多所谓的提示词、秘籍,也学过各种各样的指令模板,但是啊,如果你不懂今天我们要聊的概念,你对 ai 的 掌控感永远只是在壮大,甚至啊,直接决定了你银行卡余额的概念,就叫做 token。 很多人呢,把 token 简单理解成字母或者单词,这就太肤浅了。在 ai 的 世界里, token 是 唯一的通用货币,是信息的原子,更是啊,大模型赖以生存的物理边界。 为什么你的 ai 会突然断片,忘记前文?为什么中文的 a p i 账单总是比英文贵出一大截?为什么一个能写出精美代码的超级大脑,却数不清一个单词里有几个字母?这些啊,看似离谱的 bug 背后啊,其实都指向了 token 的 底层逻辑。 如果你不理解拓客,你就像是在黑灯瞎火里开车,不仅费油,还随时可能翻车。在这个系列里啊,我会推导那些枯燥的技术围墙,用实际内容把这个 ai 时代的隐形货币彻底给你拆解清楚。从它的分词算法,到它如何影响你的钱包,再到啊,如何利用拓客 国际把 ai 的 效率压榨到极限。看懂了扑克,你才算真正拿到了开启通用人工使用大门的钥匙。我是金博士,关注我,这可能啊,是你今年最值得看的一套 ai 进阶教程,今天,我们正式开始!