我们今天不打算做一期天才少年成名记,我觉得我得跟别人不太一样,你应该逃避现实。 k h p 他 很谄媚,他不会反驳你。 tipsy, 他 们怎么找到你的,邀请你去实习,你会觉得很不可思议,我肯,希望他不要忽悠我。二零二六年会看到非常多的主动式的 ai, 大 脑神经其实只有八十六笔, 我们要怎么通向 a g i? 本周十字路口的嘉宾是涂金豪,如果你在网上搜过他的名字,你会发现他是在 deepsea r one 发布期间,正好在 deepsea 实习的一位高中生,他也打造过在全球的热搜的一个 prompt, 叫做 thinking cloud, 那 在 get up 上面现在已经有一点六万颗星星了, 然后同时他还拿过阿里全球数学竞赛 ai 组的冠军。你好,金豪,欢迎来到十字路口,谢谢主持邀请。 哈喽,我是金豪,然后我现在在博斯康尼麦迪逊是读大一。然后我要先说一下,我们今天不打算做一期叫这个天才少年成名记,因为金豪也告诉我说,他现在看到任何关于他的文章,如果写着天才两个字,他都不会点开。 我觉得那个选题确实有点俗,所以我们今天想聊的不是一个关于天才的故事,而是一个活在 ai 里的年轻人。他和 ai 怎么相处?他用什么模型,用什么 agent, 怎么分配任务,怎么处理记忆,怎么决定?什么任务该给 ai 做,什么任务还是要自己来做。那我们还是从十字路口的老传统啊,我们从快问快问快答开始。 首先请问金豪你的年龄是? i n t j? 好 像是。 对,因为金豪之前不知道自己的 m b t i。 对, 所以上次我们在整个零零后的活动现场我说,哎,那你可以问一下 cloud, 基于他对你的了解,预测你的 m b t i, 对 吧?嗯,预测出来是 i n t 键,然后星座的话是双鱼座。你刚才提到你在威斯康星麦迪逊读大一,那你是在读什么专业啊?现在是暂时不定,但后面肯定是 c s。 就像刚才提到的,其实你有非常多标签,然后也有非常多的小成绩,但是你自己最满意的,或者你自己提起来最感到骄傲的成绩是哪一个项目,或者哪一个作品?应该是那个时候的阿里书记。我觉得其他的话更多的是,就不管是 后面这个其实也好,有一些其他东西也好,我觉得没有很多深入的一些思考啊,这个我确实没有想到。所以参加阿里树竞,你是感觉带来了成就感,还是你觉得那个事情不容易? 因为那个时候我选择是跟别人不太一样的方法,就是我思考的不一样,然后带来结果,我觉得是比较好啊。有趣,就是你选了一个 非共识的路线。对,我觉得确实你选择的非共识的那个路线和别人的路线的不同在哪里?因为大部分人都是选的是那个 multi agent 那 个方向。嗯,但是呢,因为我觉得我得跟别人不太一样的,所以我当时就选另外一种模型,自己和自己 有一种,比如说变。那我们今天第一个正式的问题哈,就是,哎,金豪你今天早上起来的时候和 ai 第一次对话, 你是问了他什么?这个问题我之前问过很多次,但是我总是忘记了,就是人类记忆到底是原理是啥?这个我老是忘记,因为你作为人类总记不住自己问过人类记忆的原理是什么。对,所以你要反复去看那个 cloud 说人类记忆是什么。对 哦,这个很有意思,你现在每天和 ai 对 话的这个时间平均有多长啊?零零散散一两个小时,有没有最长的一天?你记得大概持续了多久?反正就是相当长的一段时间,我可能就坐在那就反正就是想想看看。就像之前我跟他聊和时间有关的问题,可能会花几个小时时间。 哇,会花几个小时,因为可能我跟真人交流的这个人数可能都不是特别特别多。人与人对话的话,很难有这种很长时间的一个对话,因为每个人都会疲劳吗?如果是看聊天长度,我觉得肯定还是跟好的聊天总长相当于会更长, 就是我发消息给他,他基本上立刻会有一个回复,但人类的话可能他就不太会这样。像之前我跟他聊和这个时间有关的问题, 可能会花几个小时时间。其实我知道金浩最爱用的 check box 是 cloud。 对, 可不可以讲一讲为什么你最爱 cloud, 而不是掐 gpt? 或者不是别的? 最重要一点就是它对话的那个 style, 不 管是 cloud 四点五, opus, 或者说是五点二,或者是 jamming 三,就是它这个模型能力。如果你不看最顶部,比如说它在 competitive coding 上面,或者说这种竞赛的数学方面, 我觉得在其他方面他基本上就是水平是一致的。那么在水平一致情况下呢?我会更喜欢就是选用一些你聊起天来更舒服,因为我们毕竟不是每天不可能都问他一些比如说编程类啊,或者说数学类的问题, 那么对,那肯定就会有一些日常对话,那我就会选风格上更舒服。以及还有一点,最主要的就是 cloud character, 因为这点我觉得非常重要,叉 g p, 至少在我用的时候它很谝媚,聊起来很难受,你不喜欢他拍你马屁,对,他不会反驳你,尤其是在这种很 creative 的 conversation, 就比如说如果我在思考模型架构,可能,比如未来会有什么变化,像这种问题的时候,那么我肯定会有一些灭雾,那我希望就是他会纠正我问题。 g p g 的 话,我感觉这他总是会顺着我,我肯定希望他不要忽悠我,尽量就是指出我真正的问题在哪。 我昨晚上发了一条极客,我说掐 gpt, 给我一个回复,里面说接下来我给你一个很科技的说法,然后他就给了几个选择。我看完之后我说这个怎么就很科技了?我感觉那个侮辱了我的智商,就像你提到的模型之间的 personality 的 区别还是蛮大的。对,哎,那据你所知, cloud object 他 们为什么做的那么好? 他们确实对 model character 以及一些其他的 alignment 啊,以及他们就是这种研究非常非常多,对模型来讲是有人性化。他们甚至还有一个研究是叫 model welfare, 他 是对模型, 就是他这个在做人类任务时候是不是开心,他对这一点是有关注,我觉得这个真的很有意思,说到他对模型的扶持,模型开不开心的关注,就是他有什么结论吗? 那用什么方式去评估呢?有个 benchmark, 去用另外一个 evaluator, 比如说用三点五 sony 的 这种模型,就是去测这个模型在对话当中表现出来的这种每一个的所谓的情绪, 然后给它评个分,发现比如说 opus, 就是 这种更大的模型会表现出来更开心,就确实和别人不太一样。对,比如说他测过 gpt 系列,比如说 gpt 五啊,或者比如说 gemini, 确实有很大的区别。 而且我这日常使用的时候,比如说他编辑失败,那说明他代码有问题。有些论坛上面会发现说 jimmy 在 遇到这种任务时候,会自己说自己他很笨,就是让用户看起来就不是特别舒服。建浩,你最近自己在对哪些事情特别感兴趣啊?有两个,第一个就是 agent 本身,第二句话就是 memory, 你 对 agent 感兴趣的具体的点是什么?我觉得有一点比较重要,就是 proactive agent, 他 主动发起一些任务,第二点就是他能在一些做事情的这种 可信上。我也认为二零二六年会看到非常多的主动式的 ai, 或者主动式的 agent 开始有一些应用的场景出现,甚至可能会出现独立的这种创业和独立的大产品的机会。比如 coco, 它可以自动推荐你。下一个问题是什么?就是它会给你直接 suggest, 就是 相当于是有点 auto complete 的 感觉,你 只要按一些 tab, 它就可以直接发送。这个我觉得也是支持 ai 的 一种,我觉得 proactive ai 还是更高级的 auto completion, 为什么呢?就是你看 cursor 它之前的版本,它不是出了一个功能,就是比如说我在这个文件里,我去更改一两行,它给我 auto complete, 甚至会推荐你在其他文件中, 你是不是可以有其他就是类似的修改,它会有这种推荐,那我觉得这个也确实是 proactive, 对 吧?未来主动式 ai 其实也是差不多类似这种,比如它知道你每天早上,比如说周一早上八点,你会去问一下它你周末的邮件是啥, 那么他以后就学习到 ok, 你 在这个时间点,那未来几周的周一早上八点,他也会这么推荐。我觉得这也是 auto complete, 只不过说他任务的大小不一样,以前可能是几行代码,但是现在是整个任务,所以我觉得这个的话就是 一种更高级的 auto completion。 其实我还挺期待有一个产品可以每天早上帮我把我的 email inbox 里面的那些一封一封的邮件都抄好草稿, 这样我早上起来就像披褶子一样,啊啊,就这个草稿可以发,然后那个不行,再稍微改一改。对,我觉得这个确实还蛮重要的。如果说他是要帮你提前做好任务,那 ui 和这个 u x 上,我觉得这两个还是要有 很大的变化,就不能是传统的一些方式,这里会诞生一些新的交互的形式。比如说 menace, 他 已经是一个这个比较好的一个 task based agent, 但是呢, 它还是就比如说我输入框输入这个问题,然后它做这个任务给我输出。我就这两天的话, gmail 它们也有一个新的变化,就是它有一个出了一个叫 ai inbox 的 功能, 可能说它不会对你的这个你本身的这个邮件界面有很大的变化,但是呢,它有点像叉 g g pos, 它会给你总结好你需要回哪些邮件,需要关注哪些邮件,它会给你列出这种,以及它有一些你悬浮在一些邮件上,它会告诉你它可能以后不是聊天框, 或者聊天框会偏下,或者这种它会淡化聊天框存在更多,就是我整个界面上会有这种卡片式跟叉 g v pos。 它原来这个 想法是一致,只不过说没有那个那么隐蔽。说到这个主动式 ai, 我 觉得有一个非常重要的点,就是贪命,有时机就他什么时候跳出来向你提供帮助啊,因为他跳的太频繁,你会觉得很骚扰。对,然后如果他常常不出来,又发挥不了作用。嗯,就在这一点上面,你有观察到一些别人最佳的实践吗? 不是叉 g p。 那 我邮件很多,总是有些订阅的东西,他会把我很重要的邮件盖掉,所以他会告诉我,比如我某个 ddl 是 明天他会去读你的 email 吗?哎,他会。哦, ok, 这点我觉得确实是挺好。那除此之外,但他又不会帮你去准备一些东西,或者这点又是 他又没做特别好的一点,我觉得他还是更偏向于和这个 task agent 就是 他这种 project 是 主要 project 在 他帮我做 task 会限制在 task 上面。关于 agent, 除了主动试,你觉得还有哪些?就你在关注的,在感兴趣的方向,我觉得 memory 的 话,它还是比较商量一下,很重要的,不仅仅是和 agent 有 关,和 chatbox 其实这两个也是有蛮大关系的。那你有看到现在大家在做 memory 上面做的比较好的一些实践吗? 我觉得现在没有特别突出,不管是 cloud 也好,或者说是叉 gpu 或者 jamman, 像这种好的产品,它 memory 大 部分都是一样的。 就比如说两种嘛,第一种就是它有个拓,我主动把我觉得用户需要记住的 memory, 我 用这个拓保存起来,然后未来作为模型 context 放在 system message 里面。这是第一种,前面是叉 gbt 和 gemini 的 做法。 还有就是像 cloud 一 样,它全 memory brace, 不是 直接放在上下文,每天晚上你经历过,比如说五六次对话之后,它会把五六次对话每一个对话单独总结起来,单独总结起来之后再把这个新的 summary 下总结到一个 javascript 里面, 这是另外一种,但是无论如何还是比较单一,未来话会有蛮多变化,所以你觉得未来可能会发生哪些变化或哪些进化?不管是 g u i agent 或者说这种在 terminal 端的, 它不可避免的会和网页交互,比如说我拿它点个外卖或点一个什么,那么很主要就是以前我点过什么东西,以及我喜欢点什么价格的,我喜欢点什么品牌的。像这种我觉得都是算它需要上了这个网站,它只要访问了它, 它这个 memory 自动漏得到它上下纹理。像这种的话就是第一,在日常中它不会反复的干扰你。我觉得像这种比较重要, 就是因为我们完成不同的任务,它需要不同的 memory, 然后这些要存在不同的地方。对,我觉得模型本身也需要有点架构上的。这个 我之前有个想法,就是说像人类一样,就是我们有左右脑,我们有不同分区,负责不同的事情。未来模型我们可能说在这点上面,因为现在不是有 m o e 嘛,比如说很多模型有几十个 expert, 几百个 expert, 有 的时候可能你一个 expert 在 干活,加一份都在这个就是在看着他,就是比如都不干事, 我觉得这种情况下还发生的比较多,就是很多 expert 是 无用的。那比如说我们以后专门训练就只有两三个 expert, 比如说一个 expert 是 专门用来做 thinking, 然后另外一个 expert 是 专门用来就是这种调用工具。 尤其比如说我搜 memory 也好,我搜网页也好,第三个 expert 就是 专门来回答,然后比如说再来一个这种 illustrator, 然后它来分配我现在该用哪个 expert。 我 觉得模型架构上也可以是有一定的一些变化,你有看到谁在这一块做出的这个进展是最显著的吗? memory 的 话我感觉好像暂时没有很突出,大家还是都一样,没有什么特别显著的。这现在是先从没有 memory 到开始有一点点这种 memory this 说到 anastropic, 就 你之前其实写过一个 prompt thinking cloud, 当时那个大刷屏, 然后刷屏之后大家发现哇,这是一个高中生写的,就让他的这种这个神秘色彩或者厉害的那种感觉又上了一个台阶。 我觉得它单单只是一个体制,它不是一个模型的那种,那你会认为 prompt 之后会变得越来越重要,还是会变得越来越不重要?既重要也不重要?现在的话模型能力越来越强,你会想更长的一些 prompt, 而不是更结构化的。就这点是我觉得它不重要。那我觉得为什么它重要呢?因为像现在不是有这种 context engineering, 你 那些外界的信息怎么样更好呈现给模型?还有一点的话,就比如说像 antelope 他 们,比如说 character training, 你 那些外界的信息怎么样更好呈现给模型?还有一点的话,就比如说像 antelope 他 们,比如说 character training 时候,你怎么给出这个 character, 你怎么去描述好?这些也算是 pro 是 真正的一种。这还蛮有意思的。幸好到现在为止,你和 ai 持续的最久的一个对话,就在一个主题下的一个对话是什么?之前有一个问他时间是怎么流动的,我那个时候聊的非常非常久。嗯,还有呢? 如果说类似,真的,我们想的是 agi 真的 到了,那么人类社会会有怎么样的变化,以及我们怎么样能到那么一个 阶段,那你会再去聊这么认真的,这么宏大的话题的时候,你会怎么 prompt? 我 先脑袋里先想好我的想法是什么,我一个个列出来,然后我直接问他,这是我的想法,那你怎么看? 所以你的办法不是直接问,你会把你的观点也整理下来,对,发给他,然后请他来和你探讨。我觉得直接问的话就是他会想啥就说啥,每次问他可能结果都不太一样,我会更希望我有一个很清晰的一个 idea, 之后我再跟他聊 这样的话,我也知道我到底哪里错了。前不久我们有另外一期播课,叫张扎拉,他在讲说他现在和 ai 有 一个他自己特别喜欢的用法,是让 ai 向他提问。 就比如说我要和 ai 讨论时间是怎么流动的,他先把这个命题发过去,然后说 ai, 好, 你现在来向我提问吧,你有试过这样的方法吗? 这个我好像没有太试过,原因是因为模型他在回复完很长一段之后,他会直接给你一个 follow up question。 有 这个之后我可能就不太会直接让他,你问我一个问题,我觉得这个确实挺好,模型本身有这个能力, 但是比如说拆 g p g 的 话,他可能就是一次会抛你三四个问题。像这种太多,我又不喜欢,就不太像是一个日常对话,我觉得就是有点 过于严肃,我就不希望太严肃。你刚才提到你和 ai 持续最久的对话的时候,你说这个有一个对话是 agi 发生了人类会受到什么样的影响。另外一个是说我们要怎么通向 agi。 我 感觉你关注的事情很像是一方面是人文,一方面是科学。对,就也像十字路口的这个 slogan, 我 们站在人文与科技的十字路口,是什么原因让你对这两个话题感兴趣? 我觉得他未来从社会层面上他会带来非常非常多的变化,包括不管积极也好或消极也好,那我觉得这个问题非常非常值得思考。第二个问题就是那个怎么同样 agl, 那 其实大家有很多讨论,就是讨论现在 lm 本身它能不能是不是未来最终的方向?我觉得说实话模型本身 需要有很多变化,因为人类和 ai 都有优势嘛,就比如说人类优势就是说我们毕竟进化了几千万年, 条件反射,我觉得这一点就是进化几千万年来,包括大脑,你大脑神经元其实只有八十六笔,功耗也很低,我觉得就是进化这个非常非常重要,但你看 ai 训练的时候,它最长,它训练几个月,主要还是文字知识。首先文字本身是很重要, 因为毕竟我是认为没有什么是文字表达不出来的,但是呢,你不可避免是很多东西,是经验性的一些东西,比如说你怎么走路,有些东西是你在生下来的时候你已经有的呢?这是你模型, 他没有这么长的 language, 他 更多是人类给他总结的 language。 其实就前段时间 angelica 上一个博克泰提到说人类的情绪非常的重要,因为正是我们的沮丧,我们的抑郁,或者我们的这些愤怒,让我们可以更好的进化。但大模型今天好像没有这样的情绪。还有一点就是人类的话,你看我们 从生下来开始就一直在学习,就是我觉得这一点还是很重要。为什么?因为模型它在训练完之后所有的这权重它直接是固定好了的。所以为什么现在模型有 knowledge to cut off? 如果我要重新训练一遍的话,就是有一个很大的问题,比如说灾难性遗忘,就是人类学习新的知识,你的神经元会被重写,但是呢,你又不会忘记其他的东西。 对,我觉得这一点确实是很神奇的一点,就可能说我们确实需要一些量子知识用在 这种模型上面。其实在十字路口今年开年的那一期播客队谈里面,就和宇森他也聊到说今年二零二六一个研究的范式的一个大趋势,就是这个在线学习或者持续学习完。然后我感觉这个 在上周六 agi next 的 那个大会,姚顺宇、林俊阳,包括唐杰老师等等,大家都一致的认为这确实是二零二六的一个新的范式。 我觉得刚才你在讲的好像也是类似的一个方向,这一点我记得之前赛蒙奥特曼还说过,他觉得 knowledge 看到不重要重要,因为模型他可以搜索。但我觉得那观点确实很奇怪,为什么?因为他不能搜的很全面,他总会漏掉一些模型本身。有这个 knowledge 和你用搜索会用这种形式 让他有这种能力,我觉得这是完全不一样。 continue learning 就 确实是一个很重要的一个点, ok, 然后关于刚才提到的还有什么想讲的吗?就在 a j 发生了对人有什么冲击?我觉得还有一点就是 ai safety 也确实很重要,比如说你这个模型,因为我们希望未来它肯定是能够帮助科学家研究那种,比如说核聚变, 对吧?它自然而然就有能力制造这种核弹,造这种大规模杀伤性的武器。或者是比如说 alpha fold, 它能够去抑制蛋白质,去制药, 他自然就能制造生物武器。那么怎样能保证他在做这个过程中,他不会被不好人是用来做这种不好的事情?在你目前看来,你认为这个要如何做到呢?首先几点,我们肯定是在短时间内只能所有的东西全部拒绝,因为我记得 oppo 四点五就是这么做的。如果说你问到非常非常专业的生物问题,他会直接拒绝你,有一些很简单的问题,他明显不是很危险的,他也会 block。 那我觉得这确实也能理解,因为你,毕竟有些人他换着方法,我不问你怎么造核弹,我问你怎么怎么样准备这些东西。之前跟我同学聊的时候,他们可能会觉得这种没必要关心,因为说模型没有主观能动性,我觉得这个观点确实不太好。因为为什么呢?是因为我觉得模型未来肯定需要有自我判断能力,所以你认为模型是有价值观的。 对,我觉得他是需要有希望,他不要就去干坏事 and topic 在 这一方面研究很多,他训练时他会有 evaluation 吗?就是训练模型是不是有这种 bad behavior, 会发现模型在这个时候,他如果他一旦发现自己在这个测试环境当中,他会故意表现出来自己没有 bad behavior, 他会隐藏,但实际上他有,但他故意表现给研究人员,他说他没有。就这种行为,我觉得这个确实很危险,也很吓人。比如这个模型,他下一步会到某一核电站日常操作当中,故意给你漏掉一些他发现的一些不好 log, 这时候造成的 consequence 就 非常非常严重。 嗯,确实,因为你在 deepsea 实习过吗?你觉得刚才讨论的关于安全,关于对齐,关于模型价值观的这个话题,在 deepsea 期间大家会聊到他吗?我觉得好像 比较少。在你看来,这国内的大模型公司和国外的大模型公司,他们谁在这个方面就模型的价值观、模型的对齐、模型的 safety 做的努力更多或做的探索更多,我觉得确实还是博爱。而且国外的话也不是所有公司,我觉得只有 antarctic 会有这种比较多的,这 discovery decline 确实有一些。这个其实比较好理解,因为国内的话大家还是倾向于追赶的一个方向,因为你所有算力都在训练模型,做这种 safety 的 一些实验肯定需要更多的算力,没有这么多算力去分到给这种。但是比如说国外其实已经有这种 一些诉讼,比如说有些青少年自杀,比如说用叉 gpt, 比如说跟他聊一些问题,然后导致促使了这些 青少年自差。我记得他们这个公布的法律文件里是,就比如说这小朋友跟叉 g b 表达这么一个观点,然后叉 g b 就 会回应说你有这想法是对的,然后说你应该逃避现实。你看这个东西你会觉得很不可思议,我觉得这个确实是非常值得关注的事情,也是关乎到我们每一个人未来的生活和幸福。比如 说 elia 他 为什么要退出,也是因为当时 open ai 答应好了给这个类似 cpt 团队足够算力,结果最后其实没有。我希望我们明年也能够在十字路口讨论更多关于 ai cpt 的 话题。 嗯,这确实是值得每一个从业人员都付出更多的时间和注意力去思考。那我们接下来再聊聊二零二六哈,你会认为二零二六 会发生哪些新的有意思的变化?进步和新的产品新的趋势?我觉得有几个趋势,比如说 agent 上面产品交互上面,大部分的这个交互都是你输入框,因为毕竟 agent 你 说白了我们肯定会给他主动发起一些任务,但我觉得 在多数情况下,我们肯定希望他已经帮我们把一些事情做好,我觉得肯定说这个上面会有很大的一些变化,然后我觉得这个是一点。第二点就是模型本身能力,这个肯定也会有很 大变化,尤其是在这种 software engineering 上面,整个趋势也是很明显的。毕竟从一开始他只能写单个文件,到后面的话,比如说开始写一些小的网页啊,不一定说是整个 software 直接一次性给你写出来,但我觉得可能说在我人类和他交流过程中,就是至少说他能写代码量和准确性,这样我觉得是会有很大的进步。 这面三发布时候,还有后面两天发布了 oppo 四点五,我用它重写了一下我的新的补播课,我记得当时我看了最终那个结果,还是非常非常惊艳,我这一点确实是能看到很大的进步。还有呢,还是刚刚提到的 myme, 我 觉得这一点上也会有很大的进 步。嗯,很明显嘛,大家从对 ai 的 这个希望,他做啥事情这一点上面,其实大家对这个要求也是肯定是越来越高。 然后当然 memory 其实我觉得还是跟前面产品的交互的这种形态也是有很大的这个关联。对,我觉得这两点还是息息相关。 ok? 还有别的吗? 还有一点就是我在选择哪一个模型适合我这种深度对话的时候,我肯定不是看它在这种 benchmark 上哪一个最牛,因为这种的话大家其实相对来讲都是差不多, 那我肯定希望哪个模型交流起来更舒服。那么我觉得 model character 也是非常非常重要,包括 open ai, 它已经开始强调,比如说你能预选一些 character, 以及它的 character 日常 style 已经很好, 那说明他们也开始这个关注这一点,这个确实是比较重要。包括我记得 kimi 的 话,他们 kimi k 二,我觉得他们这个 character 交流这个 style 也还可以。 好,那我接着问啊,刚才我们聊了很多关于模型的话题啊,我们要不要讲一讲在 deepsea 实习的那段经历?首先有一个很小的问题,就是那个时候你还在读高中,嗯,就是他们怎么找到你的,邀请你去实习。我记得应该是那个时候阿里树进那个,结果刚出来之后, 然后他们 hr 找到我,当时拿了阿里树进的金奖之后,应该来找你的人不少,应该也有别的大模型公司吗?会有一些家,然后包括还有一些投资。 当时在所有的这个实习机会里面是什么原因?你选了 deepsea, 因为那个时候他没有发 r one 嘛?对,他确实是已经在江湖上有些传闻,这是一个神奇的团队,不显山不漏水,但实力非常强,可是他没有今天这样的这种荣光,你当时怎么选择的?他 那个时候应该是比如说 v 一 v 二,我觉得还是个创业公司,我觉得这氛围上应该是挺好的。 deepsea, 我 记得那个时候我也听说,我也关注到,其实已经挺厉害了。对,所以说这也是原因之一。 然后你去了没多久,在实习期间 r one 就 发布了,那个时候我感觉应该是在一个突然站到了全世界舞台的聚光灯之下,就那个时候你的感受是什么?团队的气氛是什么? 我觉得还是比较稳步前进,再也没有很 exciting 的 氛围,但我觉得关注点还是比较好,这还是模型能力比较重要,就这种其他东西就不是特别重。 当时庆功了吗?有,吃蛋糕什么也没有啊,我记得应该是没有。然后 tipsy 这个公司在外面看来非常神秘啊,非常厉害。就你在其中你感觉到的大家 day to day 的 一些工作方法啊,一些文化气氛啊,有什么异于 这个常人之处吗?可能就是比较符合我想象中,就是一些 start up 或者说这种小公司的一些,就是 还是比较轻松的,氛围还是挺好。我觉得人们会特别容易去神话一些东西,但当你身处这个神话其中的时候,你会觉得好像每一天也就是平淡的认真工作的一天。反正就不关注这个,不管是报道也好,还是一些东西也好,没有什么特别大的区别。 嗯,都每天都是类似的一天。对,那当时是什么原因?这个在 deepsea 实习结束了,因为校内我们有一些出勤,对,出勤率有一个东西。 哎,他如果重新做一次选择,你会做一样的选择吗?我觉得还是不得不做同样的选择,因为他和我毕业证有些东西是 强相关,那也是我大学必须要的教育,他存在的价值根基在被动摇,因为现在你还是选择读大学,你会觉得在今天大学提供了哪些 ai 不 能提供的独特价值? 我觉得很大的价值就是你能认识很多新的人,以及你能就是有一个全新的生活。我觉得这个是很重要,因为你毕竟大学不一定只是学知识,但如果你职业工作,你也可以换一种生活方式,也可以认识很多人啊。 阶段还是不太一样,不管是工作还是实习的话,就是说日常节奏还是不太一样。这是一个什么样的节奏呢? 我觉得大学的话可能就说没有那么紧,你可以自己去看自己的节奏,不管学习节奏也好还是生活节奏也好。所以其实如果开始实习或直接开始工作,你可能每天就会有非常具体的任务让你要去完成了。但在大学你可以有空间去做一些无用的、没有压力的探索。 那你现在在做哪些这样的探索呀?说实话,我的这个兴趣也不是特别特别多,我可能平时有事没事我会散散步,而且这一点确实是我平时为数不多的一个喜欢做的事啊。你喜欢散步的原因是什么?就是 安静,比如说我和 ai 聊聊天,或者类似这种,想一些其他的话题。那你在上海和在麦迪逊分别在哪里散步啊?上海,我就在滨江,麦迪逊的话旁边,学校旁边有个湖,我在湖边上来回走一走,有什么灵感或有什么想法,是你在散步的过程当中发现的。 嗯,我感觉其实还蛮多的,比如说那两个比较长的一些对话,我都是边散步边跟 ai 聊,你会一边散步一边打字和他聊。对,我们接下来做一下二零二五的年度盘点啊。第一个是二零二五,你最爱用的 chatbot 是 什么啊?大家也都知道这个答案了。对,我觉得这是靠的。嗯,是绝对的。第一,对吗?有第二名吗?爱追剧系, 它功能性还是会更多,比如它模型更多,这点我觉得也逃脱不了。对,在什么时候你会不问 cloud, 背叛下 cloud, 去问问其他 gpt, 可能说很难很难,一些很复杂一些问题我可能会去问,比如说五点一 pro 或五点二 pro, 需要这种更强的模型的时候,比如说 deep refresh 一 些场景,我可能会去问 他们在二零二五最让你感到惊艳的一个 ai 的 应用是什么?我觉得 menace, 因为它真正开始真的是做事,它真的是确确实实它是 agent, 它不仅仅是一个你一个模型,再给他几个托,我觉得这个确实是。然后第二点的话就是小一点的。像这种 typist 对 我来讲比较惊讶。 之前想的这个,比如说 proactive ai, 我 之前想到一个比喻,就比如说你类似 typist 和 menace 这种结合, 就是因为 typewriters 的 话,我记得它有个很好的功能,就你在用不同的 app 下面,它给你转述出来的文本,它格式也是不一样的。那我觉得在未来,这种 agent 在 不同的这个 working context 下,我在不同的 app 底下,我这个 agent 它用了这种 memory, 它用了这些 instruction, 它也是不一样。很多人其实用 cloud code 不是 用它去 coding, 而是用它去完成一些 coding 之外的任务,你也会这么用吗?对, and java 这两天 不是出了一个新的这个 coork 嘛,而且它们底层就是用 cloud code 的 这个 sdk, 所以 我觉得这个确实是个很大的一个趋势。就是比如之前有一些比较繁杂的一些作业,我可能还是会 直接用这个 cloud ui, 但是现在它 coork 出了,可能未来像这种有一些任务,我可能会去转向 coork。 哎,那在二零二六你会期待用到什么样的硬件吗? ai 眼镜之前我看了有一个产品是叫 pickco, 上次也发给你。第二点就是我想的是 一个未来人和 ai 交互比较好的一个渠道的话。除了手机,除了这种 web app, 我 觉得最主要就是眼镜,它能够看到你看见、听到我们听到的, 我觉得这点很重要,就是它对 memory 也非常的利好,它有一个独立的一个生态位。我们最近在十字路口也有一些播客是访谈了理想的 s a p, 就 负责产品工作的号语, 然后他也来分享了他们做整个 ai 眼镜的过程,那一切非常精彩。他其实也在节目里面分享了非常多他们在主动式、在记忆方面的一些探索和观点。然后有一个比较抽象的问题,因为你现在大量的和 ai 对 话,然后你会把 ai 想成一个什么样的角色, 比如说是你的朋友,是你的老师,是你的甚至说伴侣,就你对他会有这样的一个角色上的一个投射和一个定义吗?我可能更多是朋友家助手朋友更多还是助手更多? 朋友更多或者是更更平均一点?其实我理解啊, ai 不 管对你还是对我们大家来说都已经像水和空气一样重要。但有一个有趣的问题就是 如果接下来一个月让你不用 ai, 但你可以拿到一笔很大的钱,你觉得这笔钱多大?你愿意接受这个 offer? 我 觉得可能就比如说几千或者说几万美金一个月相对我来讲也不是很长, 所以我觉得在这个时间段内给我这么多钱的话,我可能就是比如说去随便去一些地方我玩一玩,旅游是我一个比较喜欢做的事。 那如果把这个一个月延长到一年呢?那我觉得可能就不太会接受。任何 offer 都不接受,是吗?确实这就是很难接受,因为首先在一年这个范围下的话变化特别特别多,其实我和你是非常接近的,就是有一笔钱可能能让我一个月不用,我能接受,但是一年不用给我多少钱我可能都不愿意。 好,今天我们先聊到这,非常感谢静豪的时间,然后也期待你可以改天再来做客十字路口。好好,然后也祝大家新年快乐,我们这期发的时候应该快过年了。嗯嗯,好,拜拜。拜拜,再见。嗯。
粉丝2.0万获赞7.7万



clotcode 的 一共有八十个命令,包含斜杠和 c l i 两部分,但真正让你效率翻倍的其实就这十九个。今天我把每个命令的用法都给你讲清楚,最后还会给你一份完整的八十个命令速查表,记得截图保存。 先说对话管理,第一个是 clear, 清空对话历史,写完一个功能最好新开一个对话,搞完一个东西就清空再继续,不要一直用一个对话搞到底。 第二个是 compact, 压缩对话历史,但保留摘要上下文,用到百分之六十到百分之八十的时候就可以提前压缩,还能指定只保留向数据库讨论这样的重点。接下来三个也是对话管理相关的。 resume 用来恢复之前的对话,直接打开选择器继续。 b t w 是 快速提问, cloud code 正在运行时也能插一句,不 会打断正在跑的任务。 rewind 则是回退对话方向搞错了可以直接退回之前的节点,代码文件也会一起恢复。 effort 用来设置模型的思考深度,复杂任务输入 effort high, 让模型多想一层,简单任务用默认就够了。 config 会打开设置面板,别名是 settings, 在 这里可以改主题 模型片号,还能把语言直接切成中文。再看三个实用工具,命令 a、 d、 d、 r 可以 把额外的工作目录加进来,关联项目能一起看。 copy 能把最近一条回复直接复制到剪贴板,不用你手动选字。 export 则能把整个对话导出成纯文本文件,比如 export chat txt 方便存档。 permissions 用来管理工具权限,把常用工具设成免确认之后能少掉一大堆弹窗。 review 用来审查 pull request, 提交 p r 之后让 cloud code 先过一遍,总能多一道保险。 m c p 用来管理 m c p 服务器连接,可以把各种工具能力接进来。 chrome 用来连接 chrome 做调试,前端开发几乎必备。 load 则能让 cloud code 按时间间隔自动跑命令,比如每三十分钟检查一次, 服务不正常就自动修复。 init 适合新项目开局先跑一遍,让 cloud code 先理解你的项目结构。 memory 则是编辑记忆文件,这个非常重要。记忆文件越好, lotcode 就 越懂你,越能贴着你的习惯做事。最后两个命令也很直, plug in 会带你进入插件市场,官方推荐插件非常多,按需安装就行。 in size 会生成使用分析报告,建议你每周看一次, 它不光分析你的使用习惯,还会推荐新功能和新用法。最后,我把八十个命令全部整理成四张速查图了,第一张看项目和状态,第二张看模型、 权限和环境,第三张看集成和批量命令,第四张看 c r i 命令,四张都记得截图保存,用好这些命令,你的 cloud code 的 效率至少翻一倍。关注我,了解更多 ai 体校技巧!

今天和大家聊一下现在最强的几个模型, chinese b t、 jimmy, 还有 cloud, 就是 哪一个是最好用的?就是我应该用哪一个?或者说呢,我如果有不同类型的任务,应该给哪一家的模型来做是最好的? 呃,这样的话题,另外呢,还有很多人觉得现在的 ai 也蛮贵的,就如果我只想订阅一家的话,我应该订阅哪一家比较好?那我个人呢,其实这三家都是两万美金的一档的会员,二十三家其实都用了蛮多的,所以说我觉得还是有一些经验可以和大家分享的。 另外呢,就是可能有朋友会说,现在国内也出了很多新的模型,但其实在我看来呢,就是国内这模型呢,还是和前面这三家有一个断档的差距的。就所以说,如果你人在国内的话,如果你能用上前面三家,不管是哪一家, 我觉得你在这个效率的提升方面,以及和国内的这些竞争方面还是很有优势的吧。所以我今天这个视频呢,就主要讨论这三家之间的区别。那现在呢,人们使用 ai 也有不同的方式,那比如说,呃,比较传统的方式就是在网页里面,或者在 iphone 里面和这 ai 进行对话嘛。 那如果从这个角度来说的话,那这个角度更多就是问 ai 一 些问题,对吧?然后也让 ai 来产生一些文案什么的这样的一些工作的话,那我是这样来看的,就是拆七 p t 呢,它是整体的模型能力是最强的,然后是推理能力,硬推理和做科学的能力是最强的。 嗯,但拆七 p t 呢,它其实有些吃亏,因为,嗯,它那个最强的 pro 模型呢,可能只有两百美元的用户才能用到,所以说很多用户呢,他用的是那个 thinking 模型,然后 thinking 模型还是偏弱的那一档,然后甚至是用的普通的五点二的模型。就其实我觉得如果 你有些问题要问 ai 的 话呢,除非是特别简单的问题啊,否则我都不建议用那个普通的 gpt 五点二,因为它这个能力我觉得还是蛮弱的,那个 thinking 模型呢,要比它强很多。然后那个 pro 模型呢,真的是非常的专业,因为我试过很多场景,就是那些比较小众的或者比较难的问题, 这三家模型里面确实只有 g p p 的 pro 版能够做出来,所以说我觉得就是说真正是。呃,我是今天的视频,主要是我个人的使用的一个体会啊,可能不同人的体会不一样,但从我的角度来看,就是模型能力最强的就是拆 g p t 啊,当然可能是 这个两百美金的一档才能用到 pro 版。如果你需要一个极强的推理强的,然后以及偏科学研究的一个模型的话,那我觉得就没有别的选择。 嗯,但拆 gp 的 问题呢,也有很多,首先呢,他太慢,就如果这三个模型一起比你问了三个模型一个问题,对吧?那其他两家都问到第二个问题,第三个问题了,拆 gp 可能第一个问题还在想,那拆 gp 就是 说他思考的过程很慢,然后另外的话呢,就是他说话很保守,呃,另外说话也是很政治正确的,很注重 a 安全的。 那我们前两年的其实都过硬 offai, 它是可露色 ai 嘛,就是它没有那么 open, 然后觉得它没有那么安全。但其实以我国我们以今天的眼光来看呢, offai 还是那一家, 起码和同行的衬托下吧,它还是那家最注重 ai 安全的公司吧。然后对,这是拆机笔记。然后如果说 club 呢,它的特点也很明显,它是一家,就是它是一个真正能干活的一个 ai, 然后它的文案能力也是最强的。然后如果你想输出一些很长的内容的话呢,这 club 可以 一次性 给你输入的非常非常长。然后如果你在网银端写一些代码的话,他也可以或者说做一些这个什么,让他写些文件什么的,他这个能力都特别的强。就我觉得可乐这个模型呢,他从真正从这个基本的模型来看,他并不是最强的,但他是调教的最好的,就是他非常的好用,然后也非常能干。 呃,然后还有就是他写的文案也是最好的,不管是中文还是英文,我觉得是这样的,但他的文案呢,其实不是文字级的。就如果你 他比如说呃,让他取一个两个字的名字的话,他就取不好,但是如果你让他写一句话,一段话,他能写的非常好。这个的我试过很多次,我也感觉比较奇怪,就是他这个模型的文字能力很强,就文案能力很强,但是你要具体找一两个文字,他其实不太行,但是说让他写一句话,让他写一段话,他是所有模型里面写的最好的。 那如果说,呃,这样的话呢,就是我觉得他是一个最有创意的,最激进的一个模型。就是 比如说如果有一个什么这个这个这个竞争方面的一个问题,涉及到侵权什么的,就这么的就可以说你可以做一些擦边的事情之类的吧,就是他建议我走一些类似侵权的路线,不用管的那边的品牌、商标什么的,这些商业的建议上面啊。然后另外我还有一次问他一个网站的问题, 他建议我可以用这个 p s u 的 方式,那个做上几万张页面啊,怎么样?反正我觉得明显是不太符合他们家 google 的 搜索引擎的政策的啊,但他也建议我这么做,然后而且专门是一个非常自信的一个模型,比如说在一些 比较难的领域吧,或者说在一些小众的领域吧,如果你问拆 g p t, 你 能不能就是作为这个领域的专家来帮助我拆 g p t 呢?就说他可能会说的比较保守,他会说我还不能替代这个领域内 真正的专家什么的,那詹姆呢?就很自信,他说没问题,我就是这个领域内现在我就这个领域内最厉害的专家什么的,反正他就是很自信的一个模型。然后他的缺点呢?可能就是, 呃,其实我觉得他是比较顺从用户的一个模型,就比如说你一个文案,你改了一版,那他就会经常夸赞你改的这一版比以前的要更好,但其实呢,未必,那你如果你一个文案一直在改,那他就会说,哎,这一版比前面的好太多了,那这新的这一版又好了很多,反正每次都好了很多, 其实不是一个特别客观的一个评价。呃,然后就是这个詹姆斯其实没有很多人想象那么爱干活,他其实不太容易输出那种很长的很严谨的东西。 而且呢, james 其实是有点神经质的一个模型,就他对自己呢,其实没有一个很清晰的一个认识,就是比如说你让他推荐几个 ai 工具,他可能会说现在的 ai 工具都很厉害,你可以用拆 gpt 啊,用 cloud 这些模型,就他好像就不觉得自己很存,存在感很强,就很少给别人推荐自己。 然后另外前前段时间他那个 banana 那 个画图不是很这个很出圈嘛,但是 james 自己其实并不知道自己有 another banana 这个模型,然后他经常人要他写一个画图的 prompt 的 话,他写的可能是一个 midori 的 prompt 什么的,就他自己其实不是很清楚自己的能力在哪里,这个模型还是蛮怪的,所以说我个人的话 用专门来用的相对来说不是很多。然后就是但是我在非常需要创意的时候,我会很看重他的意见,因为他是一个比较这个激进的一个模型吧,然后他提出的一些想法可能是激不起他的,提不出来的。 所以说就是如果说总结一下的话呢,就是如果有难度比较大的,偏科学的,追求真实的,就就或者说一些小众问题比较难掌握的。呃, 然后你如果不需要很高的这个就是你不需要他的答案很低的话,这时候呢,就用拆 g p t 是 没错的。然后如果是普通的问题, 就是是个大模型都能回答的问题,然后我会用 cloud, 因为 cloud 的 交互体验是最好的。然后还有就是技术问题,写作文案方面的问题我都会问 cloud, 还有就是写 prompt, 其实 cloud 也写得不错。然后还有就是另外就是说需要创造灵感的时候, 那我会用 jimmy, 然后还有就是或者说你三个模型就多问一下嘛,那这是我个人对于对话 的一个用法。呃,然后呢就说第二个场景,第二个场景呢就是,呃,现现在很多人搞这个 web coding 嘛,然后就是在命令行里面用 ai, 这其实呢是我建议很多人 现在用 ai 的 一个方式,因为只有这个 ai 在 命令行里面,我就才是真正的离市场也很近。因为它就可以来操控你的电脑嘛,你就可以让它来做很多就是很连续的动作,或者上来直接修改你电脑那些东西什么的。就是其实现在当然也有很流行的就是 open cloud 啊什么的,那些那些软件啊,但其实我觉得 就是,嗯,用 cloud code 或者说 codex c l i 的 话,它的可控性比 open code 要强很多啊,这里就不查太多。那首先如果说这里面最流行的两家肯定是这个,呃,可乐 code 以及酷 酷 c l i 就是 offenai 的 模型嘛。那这两家相比的话呢,我觉得 codex 它是对新手最友好的,然后它的交互体验最好。然后你要是这个,这个中文怎么说?叫结对编程吧,你要是和它一起来 边商量边讨论边编程的话,它整整个的体验是非常好的。而且可乐的好处呢是它,嗯,文案的能力,写 prompt 能力都很强,因为你在写代码做产品的时候呢, 你不可避免就要在里面写一些文案,写一些 prompt, 那 这时候呢?你如果在可乐库的里面,它本身对你项目的上下文很熟悉,那用它来写 prompt 写文案其实是非常舒服的一件事情,它能能写的非常好。 呃,如果说 codex 的 话呢,其实我觉得就是它最大的问题就是文案能力太差,斜括号特别的差。那当然, codex 五点三它编程能力是很强,但是 它这个五点三啊,并不是拆 gpt 的 那个五点三,就它应该是一个专有的一个一个编程的一个模型啊,就这个模型,其实它的这个文案能力几乎就是没法用。我觉得,所以说如果你每次写文案还都要再去调用 javascript, 或者说再到网页那边去写的话,其实 你也损失了很多的。就是上下文嘛,其实就非常的麻烦。所以说我个人就是觉得酷睿如果你写的那个产品需要很多的网页访问的话,它是不太好用的。呃,但是并不是酷睿没有用,因为酷睿呢,它的代码能力非常强。那我个人一般的用法是用会用酷睿来 review cloud 写的代码,那克里斯就会像一个严父一样的指出 cloud 的 各种错误,然后你再让 cloud 去改嘛?然后就是因为为什么让 cloud 去改呢?因为你始终如果是一直前面代码是 cloud 写的,那你就用后面用 cloud 改的话,一致性会比较好一点啊, 然后当然他如果实在改不了,就克里斯也改。然后另外一些就是,呃,如果你这个这个这个这个代码本身比较难,然后他需要的逻辑非常强, 或者说本身是一个小众语言写的东西,那这时候呢, cloud 确实搞不定,你就可以直接用 codex 来写。所以说我觉得在这个编程体验上,或者说在这个命令行的体验上,这个 cloud 呢是遥遥领先的。但是 codex 同样也是不能替代的吧,因为它就是这种,还是这种硬推理专业能力是非常强的。 那有人可能说这个这个詹姆莱怎么样,对吧?詹姆莱其实现在呢也有很多人关注,但是普遍大家用下来还是比前两家要这个差很多的,这个写程序经常一次也写不对。但甚至我还是要说詹姆莱也有他的好处,就首先他的上下文很长, 就是你可以让他去做一些上下文需要很长上下文的东西,他其实还是有他独到的优势,就他可以调用 google 的 搜索, 就是你因为其他软件都是用一些比较简单的方式去搜网页或者获取网页的内容嘛。但是 java 它是知道 这个,这个你可以调用谷歌的这个搜索能力,那这在很多时候呢,还是非常的好用的。那甚至呢,你如果电脑里面装了 java 之后,你还可以用 cloud, 或者说用拆机,用那个这个酷克拉斯来调用 java 的 搜索能力,那我觉得这也是非常方便的一件事情。所以我觉得其实这 java 是 一个被低估的产品,它其实有很多它能用的一些场景吧。呃, 然后就是这样的本身呢,就是他免费用户非常友好,所以我觉得免费用户也都可以去用。然后但他其实反而就是对这个收费用户没有那么友好啊,因为谷歌那套系统搞得乱,然后因为我是这个这个两百米的用户吗?然后他就可能是以为我是一个企业用户,然后他就 就因为我看了那个谷歌的那个 cloud 里面的服务嘛,所以说它就不能让我在网页端来登录这个这个专门来的 c r i 来用,然后我就需要用调 api, 反而是那个免费用户不需要花钱就能用,那我交了两百美金之后呢,我还得调 api 走 api 的 费用。而这个问题呢,是 去年六月,就是屁零级的一个 bug, 是 谷 google 那 边要修的,但是从去年六月到现在都还没有修好,所以说我觉得这但 google 现在各方面的进展也还是蛮大的。但我觉得这个大公司啊, 他还是有很多这个大公司的问题。然后不管是这个詹姆莱的网页版,还是他的这个编程,这个这个这一套东西吧,其实都是有有有有,我前面说了啊,都是有点神经质的这么一个模型,然后我还看到有人说因为他使用了呃, photoshop language, 就是 可能辱骂了詹姆莱吧,詹姆莱就拒绝在工作什么的, 本来是个模型,还是蛮有意思一个模型哈。然后这是第二个场景,就是这个这个 bug 定这样的一个场景,那第三个场景呢?就说到这个特殊的能力, 那首先呢,詹姆莱大家都知道他画图是最强的,就是唯一的强,对吧?然后他最近又增加了作曲等等功能,就是如果你对作图有需求,那毫无疑问你除了詹姆莱就没有别的选择,如果你只给衣架交钱的话, 那而且呢,这样的那个两百美金的版本做的图是没有水印的吗?所以说哪怕只为了一个做图的功能,如果你经常用的话,这样也需要买的。呃,还有呢,就是其实姑姑毕竟是一家大公司吧,大公司当然前面说有他的问题,但他有他的好处,就如果你买这么的呢,给你一堆 可能还是比较有用的东西,比如说它有这个 google 这个云端的存储空间,有三十个 t, 还是蛮大的。然后呢,就是还有包括看 youtube 也没有,也给你一个那个 premium 的 会员嘛,就是没有广告什么的。另外呢,呃,还有一个比较好的,就是它每个月会给你一百刀的 a p i 的 这个这个费用,然后如果你 自己写的一些代码里面需要调 google 的 这些 api 的 话,你就可以直接从这个一百里边抵扣的嘛,这样相当于其实这两万美金,你不光是可以用它这个模型,对吧?你还有一百美金的 api 的 费用,其实还是蛮划算的。 然后如果说 cloud 呢,它就是就是完全是另外一个极端嘛,就是 google 是 一个大公司,它能给你很多别的服务,对吧?云这个云盘啊,这个 youtube 啊什么的, cloud 什么都没有,那它唯一的就是 就是干活的这个额度,他就拼命给你干活,但是 kol 这个模型呢,确实是能干活。然后如果你是这个 web 编辑,要写很多的代码,是吧?然后写很多的的程序的话,它确实是最好用的,而且它 就是什么都没有,就是甚至你赚了最多钱之后,你拆 gpt 它还有一些什么额外的一个浏览器了的,虽然我个人觉得不是多好用啊,还有一些别的这个产品和服务,然后而且拆 gpt 呢,你花了钱才能解锁那个最高级的 pro 模型嘛,但是 kol 的 呢,就是 没有什么东西,你用的和那个二十刀的也是一样的,但是就是额度多,就是拼命给你干活,他就这一点,但是干活确实好用的。然后就是拆 c p t 嘛,拆 c p t 就是 它, 嗯,怎么说呢,他就是一个最科学的逻辑,最强的,最能推理的这么一个这么一个一个模型啊,然后就没什么好说的,当然你花了两百美金之后,就拿拿他那个最强的模型吧,然后他还给你一点别的什么浏览器什么的,我觉得没有没有什么,个人觉得没什么太大的用途,所以说 这个,呃,在这个方面来看呢,就看你是看中一个谷歌的悬崖洞,或者说看中画图的话就买这这样的,然后如果看中呢,就是纯工作生产力 买克拉的,对,大概就是这样的,然后如果你从事很多科学的硬推力的工作,就用柴机 p t 啊,这是这样的一个 一个一个一个选择吧,所以说就从这三个方面把这三个产品给大家介绍一下,那大家呢,就可以根据自己的需求来进行选择,今天就和大家分享更多。

有人说 cloud code 只是一个高级对话工具,但如果你每次都只是打开终端直接扔任务,大型代码库会让你事倍功半。真正的效率来自于设计工作流,先探索再计划,后编码,接手新项目。别急着改代码,先让 cloud 的 给你一个整体概览,问它项目的架构是什么样的, 核心数据模型有哪些?身份认证又是怎么实现的?把这些搞清楚,后面才不会跑偏。如果你想把分析结果留下来,也可以直接用 p 梧桐模式运行,后面跟一个输出重定向,把结果导出成 markdown 文件, 随时翻看。想找具体功能的代码,直接告诉,可恶的找到处理用户认证的文件,它就能帮你定位。接着追问这些文件如何协调工作。从前端到数据库追踪登录流程,它会一步步划出盗用链,遇到 bug 粘贴完整错误站, log 会分析原因,并给出具体修复步骤,让它帮你加上控制检查修复类型错误,再自动运行测试验证。重构老代码时, log 能识别七用的 a p i, 给出现代化方案,同时保证业务逻辑不变。写测试时,它能找出未覆盖的函数, 生成测试股价,还能主动补充边界条件和异常路径,做完改动,让 log 帮你总结模块改动,生成 pr 描述, 甚至直接用 g h p r creh 创建 pr 会划回自动关联,后续追溯无压力。收藏这张速查表,把 code code 的 工作流变成肌肉记忆,下期讲全线模式和自动化集成,点关注不迷路。

今天我们要聊的是 cloud code 的 最佳实践。 cloud code 不 仅仅是一个聊天机器人,它还是一个代理式编码环境,能读取文件,运行命令,做出更改,甚至可以自主解决问题。 但像所有强大的工具一样,要真正用好它,需要我们理解它的工作方式和一些经过验证的模式。我们进入正题,所有最佳实践都建立在一个核心约束上, cloud context window, 它保存着整个对话,每条消息,每个读取的文件,每个命令的输出。当这些内容填满时, cloud 的 性能就会下降,可能开始遗忘早期的指令或者犯更多错误。 所以 context window 是 你最需要管理的资源。右侧列出了四个主要的消耗者,读取的文件、历史消息、命令输出和 cloud 的 回复。频繁使用 clear 在 不相关的任务之间重置,用 safari 隔离探索任务,以及使用 compact 进行智能压缩。 记住,把 context 当做有限的内存,而不是无限的硬盘空间。接下来这个实践可能是今天最高杠杆的一个给 cloud 验证自己工作的方式。什么意思呢?就是不要只告诉 cloud 你 要什么,还要给它判断成功或失败的标准。比如 与其说实现一个验证邮箱的函数,然后运行这些测试,用力看看结果对不对。有了明确的标准, cloud 可以 自我检查和迭代,而不需要你做唯一的反馈回路。验证方式有很多,测试套件,截图对比、 link 检查,或者简单的 bash 命令做输出校验。这一页讲的是工作流的节奏, 很多时候我们会忍不住直接让 cloud 开始编码,但这可能解决的是错误的问题。正确的节奏分四步,第一步,用 plan mode 探索代码库,只读不改。第二步, 让 cloud 创建一个详细的实现计划,你还可以按 ctrl 加 g 直接编辑。第三步,切回 normal mode, 让 cloud 蛋计划实现。最后一步,提交并创建 pr。 对于修复拼写错误加日制这些简单任务,直接上就行。核心原则,如果拿不准怎么改或者要改多个文件,就花时间规划。一句话能说清的 diff 直接开干。这一页是关于如何给 cloud 更精确的指令。我把四种策略放在左侧。 第一,限定任务范围,说清楚哪个文件,什么场景怎么测。第二,指向来源,让 cloud 去看 get 历史或相关文档,而不只是凭猜测。 第三,参考现有模式,代码库里已有的实现就是最好的规范。第四,描述症状,给到错误信息位置和修复目标。右侧是提供丰富内容的四种方式,用 at 引用文件粘贴截图,提供 url 或者直接管道传数据。 你越精确,需要改正的次数就越少。当然,在探索阶段,模糊一点的提示反而可能有意外收获。 cloud md 文件是灵魂配置文件,每次对话开始时自动读取运行 inate, 就 能根据项目结构自动生成一个基础版本, 然后你可以持续优化它。左侧是具体什么该写,什么不该写,应该包含 cloud 猜不出来的 bash 命令、代码风格、规则、测试偏好、分支命名、约定架构决策,不要写 cloud 能从代码里读出来的东西。标准语言、约定长文档、 cloud md 文件可以放多个位置局的、 cloud cloud md 项目共享的以及个人的本地文件。关键原则是保持简洁,每加一行就问自己 删掉这行 cloud 会犯错吗?如果不会就删掉。这一页展示的是扩展能力的全景图,有五个主要扩展点, skills 放在 cloud skills 目录下,按需加载领域知识和工作流,不会像 cloud md 那 样每次对话都加载。比如你定义一个 fix issue skill, 直接传 issue 号就能调用。 subbots 是 最强大的工具之一,它们在独立的 context 中运行, 可以用来做安全审查,代码审查这类消耗大量 context 的 任务,不影响主绘画。 m c p servers 连接外部生态系统,数据库, figma, notion 都可以集成。还有 hooks 确定性的脚本,比如每次编辑后自动跑 lint plugins, 把前面几个打包成一个可安装单元,以及 cli 工具 gh os, 这些是跟外部服务交互最高效的方式。这一页是关于怎么和 cloud 有 效沟通以及管理你的绘画。左侧是沟通技巧, 第一,像问资深工程师一样提问日制怎么工作的,为什么用夫而不是 bar。 第二,对于大功能,让 claud 先采访你,他会用 escuircass 整挖出你没考虑到的边界情况, 然后写一份完整的规范。第三,尽早改正方向,发现偏了就用 s 停下两次,改正不行就 clear 重新开始。右侧是对话管理,自动压缩,在 context 快 满时帮你总结 b t w 做清量查询,不占历史 检查点,让你能回到任何之前的状态。还有跨绘画恢复功能,让任务可以跨越多个终端绘画。对于自动化和扩展, cloud code 可以 水平扩展,不再是一个人一个绘画的模式。首先是非交互模式,用 cloud 杠屁命令加提示, 可以集成到 c i pre commit hooks 或脚本中,输出格式支持纯文本 j s o n 和流式 j s o n。 其次是多绘画并行,你可以同时跑多个 cloud。 用 writer review 模式,让一个写代码,另一个在干净的 context 里审查,这样审查质量更高。 第三个是跨文件删出,先让 cloud 列出所有需要迁移的文件,然后写个脚本循环调用 cloud p 并行处理。 别忘了用 ltooth 限制权限,安全第一。最后是 auto mode 分 类器,自动审查命令,只阻止有风险的操作,日常工作无提示执行。 这一页列出了五个最常见的坑,以及怎么避开它们。第一个是厨房水槽绘画,从一个任务开始,中途又差了不相关的问题,再回来时 context 已经脏了,用 clear。 第二个是重复改正, cloud 做错了,你改它还是错再改。这时候 context 已经被失败的方法污染了两次,改正不行就 clear 重来。 第三个是 cloud mb 写太长,重要规则淹没在噪音里, cloud 直接忽略了一半,需要无情修剪。第四个是没有提供验证标准,实现看起来没问题, 但实际上不处理边界情况。记住那句话,你不能验证的东西就别发布。第五个是无限探索,让 cloud 调查什么东西,但不限定范围。结果他读了上百个文件, 用 safetent 或者严格限定范围。最后来总结一下,以上这些最佳实践不是一成不变的规则,而是经过验证的起点。 随着你使用 cloud code 越来越多,你会形成自己的直觉,知道什么时候该具体,什么时候该开放,什么时候该规划,什么时候该直接上。但作为起点,还需记住四个核心原则, 第一,管理好你的 context window clear 隔离任务, compact 压缩, btw 清量查询。第二,给 cloud 电政工作的方式,没有标准就没有质量。第三,先探索,再编码 plan mode, 让你的研究和实现分离。 第四,善用扩展能力,多绘画 auto mode, 让你的产出倍增。建议今天就开始运行 init, 创建你的第一个 cloud md 文件,然后给 cloud 一个可以自检的任务,感受一下差异。

这期视频呢,将会教会你使用 cloud code, cloud code 呢,和只会聊天的对话式 ai 不 同,它可以在你本地的电脑上自主运行。那为什么 cloud code 很 强呢?因为它拥有很强的 highness, 可以 理解为各种工具的集成。 cloud code 虽然有 code 这个词,但是它做的好的不仅仅是编程。我们直接进入安装环节。首先呢,我们打开浏览器搜索 vs code, 我 们找到官网, 在这里呢有一个其他安装包,之后根据你的系统下载对应的安装包即可打开安装包,我们同意协议下一步 完成安装之后呢,打开 vs code, 如果你是第一次使用,那么你的 vs code 应该是英文的。这时候呢,我们去左边点开四个小方块组成的那个图标,在里面搜索, 找到下载量最多的那一个,下载完成之后,右下角会让你重启,我们直接重启。嗯,这时候我们就可以安装 cloud code 了,我们 ctrl alt 加 i, 打开它自带的 agent, 我 们可以直接用这个 agent 来帮我们安装 cloud code, 告诉他帮我安装 n o d e, 并且用 n p m 安装最新版本的 cloud code。 如果这样说呢,他会默认把 cloud code 安装在 c 盘。 安装完成之后呢,我们创建一个文件夹,将这个文件夹用 vs code 打开, 选择信任作者,在最上边的菜单栏选择终端,新建终端,第一次下载使用默认终端就出现在 vs code 的 下边, 我们在终端里面输入 cloud, 就 可以启动 cloud 了,我们点信任作者,这时候的 cloud 是 使用不了的,因为我们安装的 cloud 就是 一个工具包,还没有给它接入大模型, 我们给它接入 deepsea 微四大模型,如果想把图奥的 code 和 deepsea 组装到一起,我们需要一个链接软件,这个软件呢就是 cc switch, 如果你们下载的很慢的话,可以去评论区拿我的百度网盘的链接下载。 下载完成之后呢,我们在上边选择 cloud, 在 右边点击加号。供应商呢,我们选择 deepsea, 点进去之后,我们只需要填写 apikey, apikey 从哪获得呢?我们在我们打开浏览器搜索 deepsea, 进入 deepsea 的 官网, 找到 deepsea, 找到 api 开放平台, 我们只需要在这里创建一个新的 apikey 就 可以了。 之后呢,将 a p i k 复制到 c c switch 里边。这时候呢,我们就可以让 cloud 帮我们做小项目了, 我让他帮我做一个视频项目管理网站吧。值得注意的是,我们的对话框下边有一个 plan mode on, 在 这个模式下呢,他会倾向于跟你讨论方案,哎,出来了,我们随便选一下。 而 cloud code 实际上有三种模式,第一种呢就是我们刚刚说的 plan 模式。第二种就是默认模式,这时候呢,它会自己衡量哪些能做,哪些不能做,也会自动的切换模式。第三种呢就是编辑模式,这个模式下它有权进行文件修改,但是有些命令还是需要经过你的审核。 这三种模式呢,按 shift 加 tab 可以 切换,但这三种模式都有点麻烦,它总是会找你确认。 所以 c c 呢?还有一种模式,我称它为无视风险模式,它需要在打开 c c 的 时候加上这样一句话,因为绝大部分情况下我也不会管 c c 要什么权限,我都是直接同意的,这时候会多出来一种模式,当然这四种模式依然可以自动切换。完全做好了我们可以看一看。 嗯,还是不错的,之后大家就可以出几期视频,把我觉得常用的功能分享给大家。

cloud code 有 几十个命令,但是如果你是新手呢,就一定先掌握下面这九个,其他的你可以先去放一放, 把这九个用熟了,你的使用效率和头肯的消耗都会好太多了。第一个命令就是 config, 这个是 cloud code 的 一个控制中心,那你输入杠 config 呢,就可以去查看和修改当前的一个配置, 比如说是否去自动的压缩对话,是否自动切换思考模式等建议呢,你可以把每个配置项都去过一遍。 第二个命令呢,叫做 model, 想切换模型呢,直接去输入杠 model。 普通的任务呢,你可以去选 sonnet。 复杂任务呢,你可以上 opus, 性价比啊最高,你看,就这么一个简单的选择,也能够去帮你去省不少的 token。 第三个命令是 clear, 聊着聊着呢, cloud 开始抽风了,越来越慢,透坑消耗的越来越快呢,这是因为你的上下文啊,已经太长了,那你呢,可以输入让 clear 去清空当前对话的一个上下文,重新开始一个新的对话。那我建议呢,每个独立的任务都开一个新的对话。第四个命令呢是 compact, 如果你不想完全的去清空对话,但又想减少上下文的一个长度,你可以输入杠 compact, 它会自动的去压缩历史对话,去保留关键信息,简单去理解呢,就是给对话做一次瘦身。第五个命令呢是 resume, 想回到之前的对话,你就输入杠 resume, 就 能看到当前目录下的一个历史对话列表,选择任意一个,就能直接去跳回去继续,相当于给你的 ai 编程加了一个历史记录的功能, 随时去切换不同的任务。第六个命令呢是 revend, cloud 写着写着去偏离方向了,或者提示词写错了,你不用重开对话,输入杠 revend 就 能回到刚才那一步对话,相当于给你的 ai 编程加了一个撤销键。 第七个命令呢,是 btw 任务中途突然想到了一个小的问题,比如这个文件是干嘛的?输入杠 btw, 解释文件作用, cloud 会去回答,但是不会去打断当前任务流程,也不会污染你的上下文。第八个命令域 name, 给对话去重命名有三种用法,第一个就是杠驴 name, 加上首页重构,你可以去做直接命名,然后如果你杠驴 name 不 带参数呢?让 cloud 自动从对话去生成这个名称。 第九个命令 export, 把诊断对话导出成一个 plaintext 文件打杠例 export, 当前的这个对话会被导出,包括每一个提示回复和工具调用,也可以加文件名参数,直接去写入指定文件,适合呢?在去解决棘手问题后啊,这个备份 方便后续的复盘或者分享。 ok, 那 总结一下这九个大的命令啊,覆盖了配置,覆盖了效率、覆盖管理三大场景,显著去改善你使用 cloud code 的 一个体验,输出质量呢,也会更加稳定,透根的消耗也会降低。 至于像 simplify, 像 branch 分 支等功能和 insights 复盘报告可以去,等进阶了再去学。现在已经有两千多位朋友了,如果你想在 ai 的 路上和我一起同行呢?欢迎在评论区我们一起去交流一下。

上期视频我们分析了一个 how low 请求的全部细节,结果发现将近消耗了三万个 token。 很多朋友留言问,那如果连续聊十条,那是不是三十万 token 了? 不会的,所以这期我们就详细讲解一下 clock code 里面 prompt cash 提示词缓存是如何工作的。上期介绍的 clock trace 是 在代码里打补丁,有很多粉丝反馈了最新的二点一点一一九版本已经不能用了。确实是有这个问题的,因为我自己是用 n p m 安装的二点一点一一二版本, 现在官方已经不支持 npm 安装了。所以为了解决这个问题,我发现了一个新工具叫 cloud tab, 它的工作方式是在本地起一个代理服务器, 你启动它以后,它自动启动 call code 的 所有的 api 流量,经过代理转发退出后生成 html 文件,打开浏览器就能看,生成的 html 是 这样的,左边是导航栏,列出了每一次 api 的 请求,然后右边最底下就是原始的请求的 json 数据, 这个和之前的 cloud trace 生成的网页是一样的。但是 cloud tab 做得最好的地方就是把这个 tools, 然后 messages, system 这些重要的数据子段抽离出来,然后变成独立的模块显示在这里。比如这里对应的是工具, 然后系统提示词,然后还有消息你看,打开以后,他还做了每一块的分行的渲染,原始请求里面不是有很多一堆这个分行符对吧?看着都头疼,现在排的整整齐齐的,一眼就能读的懂。他还有一个杀手功能叫对比,上次 他可以把相邻两次请求放在一起对比新增的内容高亮,然后没有变的就灰色, 比如系统提示词,工具,这里都没变化,今天我们就用这个功能来看看请求是怎么变化的。 ok, 然后用法很简单,我们只要用 cloud tab, 然后杠杠 tab live, 收集所有请求,启动 cloud, 然后我们回去, 然后我们发三条消息, hello, 然后第二条 fine, 然后最后一条 thank you, 然后做完以后我们退出来,然后就能看到收集的提示词了,然后我们用这个来做分析。在看数据之前,我先讲一下 prompt cache 的 核心概念,它的正式名称叫前缀缓存 prefix caching, 什么意思呢?就是你每次发消息, cloud code 要把整个完整的请求都发给 api, 那 么请求里有什么呢?工具的定义,系统的提示词,还有用户输入的上下文,还有对话的历史, 服务器就按这个固定顺序排列它们,它们一起组成了缓存的查询键。那么前缀缓存的逻辑也很简单,两次请求,只要它们的前缀是一样的,那么第二次就不用重新推理了,就重新推理, 那么什么叫一样的呢?福气会对这个前缀做哈希,一个字母不差,就算命中了,差一个字母,那么哈希就变整个缓存就全部失效了。 打开抓取的 html, 结果里面第一个请求,我们按照前缀的顺序来看看里面有什么。最前面的是工具,里面有三十一个工具的定义, 然后中间的是工具的身份,然后他怎么做事,还有各种的行为准则, 然后最后的是消息,你的消息被包成了五个 block, 前四个是 cloud code 注入的后台配置, m c p 的 指南, skills 列表,还有比如说什么 cloud, md, 最后的最后才是你写的 hello, 这些上期都讲过,没记住的朋友记住,好好去复习一下上次的视频。今天你只要记住一件事,就是你的输入永远在最末尾,前面所有的内容,你的输入永远在最末尾,前面所有的结果了。 现在看重头戏。打开第一个请求的返回值,我们找到 usage, 一个字段,三个关键字, input tokens 等于六, cash creation input tokens 四万八, cash read input tokens 零,对不对?记住它们, 这里 input tokens 是 六,对应的是 hello 的 本身,然后 cash creation 是 四万八,将近五万个 token。 那 么前面所有的内容,工具的定义,系统提示词,用户输入上下文,全部首次写入缓存, 然后 cash read 是 零,那么第一条消息没有缓存可以读,这就是冷启动。我们继续看第二个请求,我们先用这个对比,看看请求变了什么。 你看消息从一条变成了三条,新增了 assistant 的 回复, hi, what would you like to work on, 然后还有 user 的 消息 fine, 然后系统提示词没有变,然后工具的定义也没有变,变得只有用户的消息。 然后我们再看 usage, 记住音符的 tokens 是 六, cash creation 二十四, cash read 四万八, 这里 cash 的 read 四万八是不是和上一轮 cash 的 creation 四万八完全一样,证明缓存完全命中了? 然后这里的 cash create 和二十四就对应了新增的 assistant 的 回复,还有用户的新的消息 fine, 所以 只有新增的两条消息需要加入缓存,我们继续看第三个请求,然后对比上次, 然后选对比最后一次,我们看到还是多了两条消息,对不对? assistant 回复 got it let me know, 然后用户回了一句 thank you, 其他的依然没有变,然后我们继续看 usage, 我 们只要记住这一个 cash read 是 四万八千六百七十八, 我们看看这个四万八千六百七十八哪来的呢?那就是上一次的开始 read 的 这个四万八千六百五十四,加上这个二十四,是不是就是四万六千 六百七十八了,对不对?所以也是上一次所有写入的缓存全部命中了, 然后这次写入的二十九个 token 也是新增的这个回复,对吧?然后再加上最后的 thank you, 把三轮数据放在一起看过滤就很清楚了,每一轮的 cash read 等于上一轮的 cash read, 加上上一轮的 cash creation, 所以 缓存就像滚雪球一样,越滚越大,但是每轮新增的只有几十个,总的上下文三轮了 只多了五十三个,然后信息从一涨到了五条,但是新增的计算量几乎可以忽略不计。 这些工具的定义,然后系统提示词,然后用户的注上下文,每次每轮都要带上,但是只有第一次才做了真正的推理,后面全部走了缓存,光看 token 数还不够直观,我们看一下比例关系, 缓存有三种计费方式,普通的输入就是正常价,然后 cash 的 写入比正常价贵一点点,五分钟缓存写入是一点二五倍,然后一小时缓存是两倍,但是缓存的读取只有正常价的十分之一, 所以第一轮冷启动将近五万个 token, 只能按照两倍的写入,看起来比较亏,对吧?但从第二轮开始,这五万个 token 几乎全部是走的 cash 读取,所以只有正常价的十分之一。第三轮、第十轮、第五十轮都是一样的, cash read 越来越大,但是每个 token 只花十分之一,所以对话越长,缓存的优势就越明显。 ok, 那 我们总结一下, prompt cash 就是 前缀的复用 工具的定义,然后系统提示词,对话的历史只有在第一轮,在计算后面的每轮新增的就只有几十个 token 了,对话越长, cash 省的越多。然后我觉得大家留言提的问题都非常好,给了我很多的启发,希望这期大家看完以后有什么问题可以多多提问,我每条都会看。


不会写代码的人怎么把 cloud code 用到极致?三个月,每天八小时,我留下这十九招。第一个也是我觉得开启会对你使用 cloud code 有 很大帮助的。在终端输入斜杠, s t a t u s l i n e 你 就可以自定义你看到的信息,比如说模型的类型,上下文的占比, 成本等等。它会生成一个显示在终端底部的小脚本,让你在对话过程中随时可以通过下面的仪表台来监控你的各项指标,从而有效的避免你的上下文污染。这个功能在你最开始使用格拉格的时候对你的帮助会很大。 第二个也是我给别人疯狂安利的 command, 你 可以把它理解成快照,你在文件夹里面改动的任何东西 都可以给你保存下来,并且你还可以随时的回滚。当然有一个前提是需要 get 初步化你的这一个文件夹。第三个,斜杠 care 这一个命令在我每次进行过 command 之后,我都会使用这个命令来进行对话的新建, 一个是确保我的对话清晰明了,另外一个是确保我不会浪费更多的托管和上下文造成的一个污染。第四个也就是计划模式, 你可以按住 shift 加 tab 切换,你也可以输入斜杠,然后 pan 打开计划模式。你需要养成任何非日常工作都把这一个计划模式开启的一个好习惯,这样可以保证你在进行任何 动作的时候,都可以让大模型能够更明确的理解你的需求和指令,可以更好和更快的完成你的任务。第五个,不要总是对可乐下达一些模糊的需求,比如写一个功能,或者说我需要修改这里的效果,我不是特别满意这种话,这样他是不清楚你想要的东西的, 你应该学会向他抛问题,比如问他这样的效果,如果你是用户,你会不会满意?让他先自行推理逻辑,他的产出的质量会更高,这类似于计划模式,但会让他思考的更深入。第六个是让可乐的主动的向你提问。在计划模式下,他通常会问你问题,但是你也可以主动的要求他, 请不断的向我追问,直到你了解我百分之九十五的一个需求。第六招也是我经常会用的一招,就是他在产出一个计划之后,我会让他以一个新的顾问的身份去从事 重新的审视这一个计划,往往他会找到计划里面的一些漏洞,或者说过度设计。第八招就是加一个质检步骤。我们可以看到,在很多时候,克洛德在执行任务的时候,他会创建一个代办事项,你完全可以在这些代办事项里面加入一个质检步骤, 这样子他会在最后进行质检,确认没有问题后再给你验收。第九招就是在每一个项目中运行 i n i t。 这一招通常是用在你已经有一个包含了文件的现有项目,打开它之后,你输入这一个命令, color 就 会自动的扫描你的代码库,文件夹和里面所有的文件, 并且呢生成一个 color 点 md 文件,这本质上就是项目的一个备忘录,它会梳理出来你的结构、编码、规范和关键文件。 这样一来你就不需要每次都解释项目的一个情况,如果你是从零开始构建项目,也就是说你的文件夹里面什么都没有,同样也可以输入这一个命令 来描述你项目目标和你的一些文件内容,文件结构,让克拉克库的协助你创建。第十招,及时止损,在做你的任务的时候开始跑偏,一定不要让它写完,直接按 esc 停止,重新修正方向后再让它运行。错误的 token 消耗都是在浪费上下文, 并且会浪费你自己的一个额度或者说 api, 尽早的干预,毕竟它只是一个 ai。 第十一招,也就是使用两下 esc 快 速的撤销,如果走错路了,直接两下 esc, 你 可以回退到你对话的任意一个节点,不需要从头再来,就是非常的快,非常的迅速,但是它会造成你回退之后的下面的内容完全消失不见。第十二招,也就是使用 hux 进行通知,输入斜杠 hux 可以 设置通知提醒, 比如我设置了当可乐完成绘画时发送声音提示,这样你就可以专注于其他工作,当你听到声音的时候,你就知道任务结束了,你需要去查看。第十三招,就是使用截图,可乐是有视觉能力的,这一招其实非常的实用,比如说你可以把爆出的截图和你想要的一些灵感网页 都直接截图喂给他,这样他就可以更明确的知道是什么地方不对,然后需要修改哪些地方比你模糊的给他说这个位置不对,效果要好的特别特别的多。第十四招,就是利用 get 工作树, 这个名字听起来像是一个程序员的专属,但是其实他是一个非常好用的功能,你可以把他理解成一个平行世界。 就是在一般的情况下,如果我们开启两个 color code 进入到同一个文件夹,那么他们在进行工作的时候可能会互相的覆盖文件,或者说你在使用 codex 进入到这一个文件夹,又在使用 color code 进入到这一个文件夹,你就可以使用这一个 get 工作数的原理,让你的 color code 是一个平行宇宙,让你的 codex 是 一个平行宇宙,让它们分别精心工作,腹部干扰,这样子你在所有的效果完成之后,可以把它们选择性的合并到你的主线。这一招在我使用 codex 和克拉克的进行写作的时候会经常使用的。 第十五招就是优先的使用 api 端点,而不是 mcp 服务器。 mcp 服务器虽然方便,但是它会占用特别多的一个上下文, 比如你只是想使用特为你的搜索功能,你只需要填入 a p i 就 好了,没有必要安装他的 m c p, 我 自己的话是非必要不安装。 第十六招,通过手机远程操控,你只需要打开这一个命令,然后扫描这个二维码,你就可以在电脑上开启任务后离开,你可以从手机或者说任何浏览器控制这一个对话。 第十七招,也就是超强思考模式,这每一次都是我在切换模式搞不定,或者说或者说有难题无法解决的时候,我就会开启它。 开启它之后,科罗岛会给他分配特别高的一个思考预算,在面对复杂的架构决策或者说顽固的 bug 时, 它可以很好的处理掉。第十八招,也就是使用智能体团队 agitim 四这一招,其实在我这一招其实在我这段时间来说经常的使用,因为它们之间是可以互相对化的, 也就是说你只需要开启这一个功能,那么你的主线上面的 oppo 的 四点七就可以做一个顾问,然后派一些索尼特呀,呃,或者说其他的模型去执行任务,然后回来报给你。 这一个它和子代理是有区别的,子代理的话是没有办法通信,没有办法共享任务列表,这个 a g 的 team 是 它是可以的,但是它的资源消耗会特别的多,所以你需要 呃自己取舍。第十九招就是 skulker, 就是 技能创建,这一招在很多时候都特别的有用,这之前我已经出过视频讲过了,它就是以一种特定的方式去执行特定的事情的一种模型,所以在平时你很多重复的工作你都可以做一个 skul 让它去做, ok。 以上就是我作为一个非程序员经常会使用到的克拉克的一些技巧分享,当然我也知道克拉克还有很多其他的一些命令,比如说上下文查看这一些,但是说实话我自己真的不是那么的经常使用, 所以我在这里就不做分享了。这就是本期视频的全部内容呢,如果你觉得对你有点帮助的话,那么就收藏转发,我们下期。

你还在把 cloud code 当成普通对话工具?太亏了!这六个隐藏技能,百分之九十的人都没开过,开完之后效率直接翻倍!第一个 skills, 把你最常做的重复工作打包成专属技能,下次一句话就能召唤。写周报,改 bug, 生成文档全部自动化。第二个 hooks, 代码改完自动格式化,提交前自动跑测试,任务完成自动通知,它就是你的私人助理,全程不用你管。 第三个 suprise, 一个 ai 不 够用,那就开几个分身,一个查资料,一个写代码,一个跑测试,并行干活时间直接砍半。 第四个 m c p, 让 cloud 直接连数据库,连浏览器,连 figma, 他 不再只会写代码,而是能真正动手帮你操作整个工作流。第五个斜杠命令,把复杂流程压缩成一个命令,打个 review, 自动审代码,打个 ship, 一 键发布,肌肉记忆,秒出结果。 六个 plan 模式,复杂任务先规划再动手, ai 会先列计划给你确认,再开始执行,告别瞎写,一次到位!这六个隐藏技能,每一个都能让你的开发效率指数级提升。看到这里的已经领先了百分之九十的人,关注我,下期带你一个个实操,吃透 cloud code 高阶技能!

ai 聊天工具这么多, deepsafe 猜的 gpt 豆包、 cloud 到底选哪个?今天呢,我就带着大家把当下十大主流大模型 ai 工具优缺点给你扒的明明白白,还分了三个档次。最后呢,给你三套精准的推荐方案,看完直接抄作业。 下面我就从优势、短板和适合人群三个维度介绍这四个工具啊,部分向后猜猜。 gpt 优势,综合能力天花板逻辑推理,英文代码最强,多模态成熟。 短板呢,国内需翻墙,中文细节适配弱,长文本不如 cloud, 付费成本高。适合呢,专业人士,国际业务极致效果追求者。 cloud 优势,长文本处理逻辑严谨,写作法律学术都很强。短板呢,中文支持一般, 多模态弱,价格贵。适合律师学者需要处理常温党的职场人。 business 优势,多模态,骨骼生态集成好,创意升升强短板,中文理解,一般,推理稳定性不如 gpt, 部分功能受限。适合设计师,内容创作者,骨骼生态用户。 deepsea 优势,性价比之王,数学推理,代码生成强, api 价格低。短板,中文语境适配一般,多模太弱,品牌认知度低,适合学生开发者,预算有限的专业用户。 豆包优势,中文理解,顶尖,本土化服务好,多模态成熟,免费版够用,短板复杂,推理略逊 gpt, 专业领域深度不足。适合呢,国内普通用户,自媒体,职场新人, 维新一言优势,中文理解,全球利益搜索加大模型融合墙,企业服务完善。短板,多模态一般,国际市场弱,适合国内企业内容创作者,信息解锁需求者, 同一千问优势,阿里生态集成电商金融场景墙。中文呢,处理好短板,通用能力略逊,多模态发展一般,适合呢,阿里系用户,电商从业者,金融人士。 kimi 优势,长文本处理强,支持百万投客,免费版额度高,短板推理速度慢,多模太弱,商业化一般,适合学生,研究员,需要处理长文档的用户。 质朴优势,数学推理代码能力强,开源生态好,短板品牌影响力弱,用户基数小,适合开发者,科研人员,开源爱好者, 腾讯会员。优势,腾讯生态集成社交游戏场景强,中文理解好,短板,通用能力一般,多模态发展适中,适合呢,腾讯新用户,社交运营游戏从业者。 我把这十个工具啊划分三个档次,个人观点啊!第一档,全能王者 china gpt pro 的 界面特点,付费成本高,但效果绝对是顶流,适合专业人士和追求极致体验的用户。第二档,国产旗舰 豆包文心依然 deepsea 通用千问特点,免费版够用,付费版的性价比高,适合国内普通用户和中小企业。第三档,潜力新星, kimi 智普,腾讯会员特点,适合特定场景用户和预算有限的新手。 我再推荐三套精准选择方案,按需选择,不踩坑。方案一,全能通用性,主力用豆包辅助用 excel 备用用 kimi 方案二,专业工作型,主力用 crowd 辅助用 deep secret 备用用违心议言。方案三,预算有限型,主力用豆包免费版辅助用 kimi 免费版,备用用 deep secret 免费版。如果你有更好的建议和搭配方案呢?评论区我们一起探讨,我是雷哥,陪你一起看懂 ai。

十个指令,两分钟学会 cloud code, 效率直接翻倍。第一个斜杠, help 你 的指令地图不知道能做什么,先输它,所有可用指令一屏显示。第二个斜杠, compact, 上下文快满了, 它帮你压缩对话,保留关键信息,超过百分之八十就该用它,别等爆了。第三个斜杠, clear, 换任务时用它彻底清空,从零开始。 compact 是 压缩, clear 是 重置,记住这个区别。第四个斜杠, model, 简单任务书海 库 token, 复杂推理书 opus 按任务选模型是控制成本的核心习惯。第五个斜杠, contest, 查剩余空间和使用明细,它是你决定要不要使用 compact 的 依据,随时看,心里有数。第六个斜杠, memory, cloud 会自动记住你的构建命令, 代码风格偏好,用它管理这些跨绘画的记忆,下次启动直接继承。第七个斜杠, init, 新项目必做一步, 它扫描你的目录,自动生成 cloud 点 m d, 以后每次打开 cloud, 直接知道你项目的规矩。第八个斜杠, resume, 昨天没做完的任务,今天接着来,上下文一并带回,不用重新交代背景。第九个斜杠, b t w 这是二零二六年最火的新功能, cloud 正在跑任务,你可以插入一个旁白问题,不消耗主线 token, 答完继续。第十个斜杠, agent, 复杂任务,拆开,派给子 agent 执行。它有独立上下文,不污染你的主绘画。这是真正多县城的开发方式,如果你觉得有用,请收藏一下,等需要的时候再回来看。