remotion 上周发布了 skills, 这一个帖子的浏览量已经破了千万,那我们今天呢,就通过提示词来复刻这一个视频。大家好,我是卡拉的编程课,今天我们不打开 id, 我 们不手写代码, 我们搓一个视频出来。如果你关心 kimiko 的 和 k 二点五的模型表现得如何,或者是你也想通过代码来写一些简单的视频,丰富你的自媒体素材,那么这期视频可能对你很有帮助。 接下来我们简单的安装一下,我们先打开 kimi code, 把对应的这一个,把小本啊给他粘贴过来啊,我们打开终端,然后粘贴啊,这个时候他会引导你一步一步完成。这里面已经安装完毕了,那我们接下来要做的是先进入, 接下来需要点 set up 斜杠,我们点 kimi code, 需要输入 api key, 那 这个时候呢,我们点击开始使用,然后新建 api key, 那 我们写 demo, 新建复制粘贴过来。回车啊,那这个时候它会告诉你有一个 kimi for coding 啊,那点回车,然后再点一个 on, 那 这个时候就已经 set up 完成了。那么问一下,请问你是什么大模型? 哎,这是我非常喜欢问啊,他是说 kimi 啊,由阅站面开发的大语言模型。好,那这个时候就设置完成了。 我们来简单看一下这个视频,这个视频大概有八秒钟,做了几个简单的动画啊,那我们今天呢,就通过格式来复刻这一个视频,它是通过 cloud code, 然后呢加一些体式词啊,加了很多很多,大概有三十多条。 我们先把这个链接打开,等会会用到。接着我们来到 remote 的 官网,点击这个按钮就完成了复制。创建一下项目, 我们选中 hello world。 啊,这是一个呃,已经不错的模板,比较简单,不会对我们的任务做任何的干扰啊,那我们就做一个 timi hello, 然后加上 tailwind css, 加上 agent skills。 好, 我们打开 kimi hello p n p m install, 我 们完成依赖的安装。 好,紧接着这里面有一个细节啊,需要通过这一个命令啊,把 es build 给勾上,否则的话,构建的时候可能会有一些问题。 好,接下来我们运行 t n p m d f 把这个服务起来。这里我们打开 arc 浏览器, 我们可以看一下。好,现在这个服务就起来了。好,我们新开一个 tab, 依旧在这一个目录输入。 kimi y, 这个时候就已经开启了优乐模式。 呃,这一个项目是什么?我们先简单问一下,看看他对这个项目了不了解。 好,他现在已经知道这一个项目是 remotion 的 一个框架。那我这里面还需要做的事情是给他加一个 init 啊,这个在 cloud code 中, open code 中都是一样的。好,已经完成了,那我们现在还要做一个点,因为 ai 很 喜欢用 emoji 啊。那这个时候呢,我们需要给他加一个规则。 呃,我想请你使用 lucy 的 icon, 而不是尽量使用 emoji, 你 知道我的意思吗? 呃,我们可以看到这一个 lucy icon 是 有问题的啊,它肯定找错了,我这个时候应该用 lucy 的 icon 啊,这是一个图标库,那我们,当我们使用 emoji 的 时候,我们优先使用这一个图标库。 好,接下来我们测试一下我们新加一个场景,看一看在 remotion 中能不能正常使用。我想请你帮我加一个折线图啊,你随便帮我编一些数据好不好? 好,它现在已经跑完了,我们看一下效果怎么样。 哎,好,可以看出来啊,看起来还可以,大家可以看到。这个时候呢,带了一点蓝色啊,那有点 ai 味。虽然整体上看起来还是不错的啊,但是有些 ai 味。呃,我想请你帮我把所有的这一个主题 啊,我们换成这一个 ai 味。呃。我想请你帮我把所有的这一个主题啊,我们换成这一个 ai 味。呃,我想请你帮我把所有的这一个主题啊,我们换成这一个,你知道吧? 就是要换成群体,这个语音识别是有点问题的。 russell, 然后这一个 line 问一下,你知道吗? 我想让他帮我把主题切换成一些暗黑色科技感。这个主题啊,像 versace 的 主题呢,它就是深色背景,高对比度,简洁的边框,蓝色,青色作为强调色啊,边角设计啊,还有这个 line 的 风格啊。 好,我们接下来看一下效果怎么样来。这样子看起来这种科技感就高级很多了,对吧? 包括之前使用的 emoji 啊,它也换成了 icon。 我 们接下来呢,要做的事情是复刻刚才的这一个项目,我们打开刚刚的页面,复制一下对应的链接,因为这个链接特别长,是不是?那我们接下来要做的事情是先 把上下文清空,接着呢?我把链接粘贴过来,问他,呃, johnny burger, 他 到底说了,呃。对 cloud code 说了多少句话啊?请你帮我罗列一下。 我们先让他帮我们把。姜力 burger, 他 对 cloud code, 对 opus 说了多少句话?我们先把它罗列一下,三十八句话啊,真的假的?不清楚,来验证一下。呃,复制一下,我们看看。 看起来是那么一回事,但是不一定啊,说不定是幻觉呢。看一下,在 啊,在一千多行的时候,他说了, ok, new idea 啊。他确实,这个看起来就是人说的 timiko 的, 从一千三百多行聊天记录里面把对应的三十多句啊人说的话,把它提取出来。 我们可以看出来,江立博克对 cloud code 说了三十八句话啊,他帮我们罗列出来了。然后这些三十八句话呢?其实我现在不是特别关心啊,因为可能是一些调试上的东西,对吧。那我们让他把这三十八句话压缩成一个体式词 啊,这样子啊,我请你帮我,我把这个三十八句话对不对就总结成一个场景的需求,是吧?场景的提示词咱就不要,就是说一句一句复制在里面, 他详细描述了这些东西,然后一个 mac 的 终端,然后呢,终端内有打字机的效果啊,逐字输入这一个 命令啊,这里面他还掉了一个 shell 脚本,打字时显示光标,然后呢,命令输入完停顿零点五秒,然后逐行显示啊,接着是终端一个翻转和 logo 的 展示啊,看起来还是可以的啊,那我们让他落实一下。 好,请你帮我落实一下这一个场景。 这里面使用了 npm raw def 啊,我等会需要把这个命令给禁了啊,请你写到记忆里面啊,尽量不要使用 npm raw def。 好, 接下来呢,我们看一下,这里面多了一个 skill announcement, 来看一下有没有。 哎,看见没有 remotion 这一个 logo, 有 了这一个 cloud code 和 open code。 什么啊?这样子,请你帮我去 lobby icon 里面选一个,呃, kimi 的 icon 换过来好不好? 我知道有一个叫做 lobby icon 的 依赖库,里面它是有这么一个东西的,我直接让他去网上帮我找一下,看看能不能找到 啊。这,这里最快的还是用手直接粘贴啊,我们可以看到这个 k 是 有了啊,然后我们再把这个 cloud code 的 icon 给删掉, 可以去掉了啊,可以去掉了。好,那我们现在看一下,哎, 好,我们大致扫一眼,首先有个 terminal 啊,然后到第二幕,然后是 icon, 哎,好,看起来不错。那我们点击渲染, 点击渲染,这个时候它会先下载一个谷歌浏览器啊,然后呢,把代码打包 bundling, 接着去渲染每一帧啊,按照帧来渲染。 好,这个时候我们打开看一下啊,有这么一个东西,上面一个案例呢, johnny burger 使用了这一个 op 四点五啊,我们使用 k 二点五把它给做掉, 而且是把它的整个流程给它压缩成提示词,几乎两步就可以复刻,能写出好看的界面呢。啊,这是一种能力,那现在呢,我还想看看它在指令遵循方面,在这种大一点的仓库里面有没有问题。好,那我们接下来做的事情是,哎,我们找到这个仓库 啊,这是我自己用的一个仓库啊,主要是给我做这个自媒体素材的,然后呢,有大概十四万行左右的这一个代码,我这里面积累了很多素材啊,比如说像这种啊,代码高量,然后呢,有一些这种就是文字效果, 这个也有一些这种数字的动画,我给大家讲一下我要做什么操作。现在呢,每一行它是一个 sequence 啊,也就是一个片段,但是呢,这里面会有一个问题,当你有很多个片段放在一起的时候, 一个片段出现了问题,整个时间线就会坏掉啊,我在之前组织的时候,我就没想清楚这一点, 然后导致现在的这一个 sequence 啊,让我调试起来非常的难受。比如说这里有五个 sequence, 我 想让它放在这一个左边啊,不要放在这个右边,这样子呢,我就可以直接点进这个 rolling number, 点进这里啊,一个一个来调试啊,这样子会比较方便啊。我想做一个全局的改动,我这里面有一些代码的地方写的是相对来说比较规范的啊,但是呢,这个改动呢,依然可能会带来一些破坏性的这种灾难啊,但是我们来试一下。 呃,我这里面有好多东西啊,是按照 sequence 来组织的,也就是 root 点 ts 叉啊, 我现在需要你做的事情是帮我彻底的,这种就是规整一下啊,我想按照 composition 的 方式来组织,我们先聊一聊,不要急着动手写代码, 我们先看一下,这里面一定要注意这个,把对应的专属名词一定要用英语。好, 我们先和他聊一聊,在正常的开发中呢,聊的时间应该是要占到接近四分之三啊,如果说你觉得一直要催动 ai 来写代码的话,那么大概率是聊的还不够深啊,如果聊对了,那基本上执行起来不会有太大的问题 啊,他告诉我当前的架构是 sequence 模式,然后呢,这一个啊,机制啊机制。其实我已经忘了已经有这个大概,呃,七八天没怎么看了, 我需要把这一个啊 sequence based 啊,改成这个 composition based 啊。他这个理解还是挺到位的啊,虽然我觉得我的表达不是很好。 kimi 目前呢,没有 play 模式啊,我还是非常希望官方快点支持一下 play 模式的,当然,没有 play 模式的情况下就和我刚刚一样,刚刚一样就是, 呃,我们先聊一聊,不要急着动手写代码啊,就可以激发它的 play 模式。好,我们看一下基于 remote 最佳实践啊,每一个 scene 成为一个独立的 composition, 保留 mid 导出啊, 生成福来森啊,自动化扫描。哎,这几个做的都蛮不错的啊,自动化扫描就省得我每次去晚之后还得自己改是不是?好,那这样,请你直接帮我落实一下吧好不好? 好,那我们就等一等了啊,等一等了。 好,现在终于从原先的这个二三十个啊 composition 变成三百多个 composition 啊,这就是写的多少个 sequence 它就写了多少个。 那我们现在看一下这个效果怎么样哦,有 bug, 有 bug 是 好事,最怕的是没 bug。 准确来说是有明确的 bug 是 好事,最怕的是有一些隐藏的 bug。 好,我们可以看出来他这里面去除了五个重复项。 好,现在还检查了一下有没有类似的重复问题,这次应该行了吧。来,给我一个。好,我们看一下 啊,这里面有一个总的吧,现在这就不是总的了,然后我们看一下。唉, glitch 好, 这些动画都已经 ok 了, ok, 看起来都还 ok 啊,这个拆分的是完全 ok 的, 那看起来的话,它的指令遵循应该是很不错的,而且就是没有改错,看一下总共改了多少行代码, 总共改了三十九个文件,我们来看一下这一个都有哪些改动。首先他帮我修复了自动生成的脚本,然后呢,帮我补充对应的一个原数据信息啊,这个都没有问题。 然后做了一些内容上的补充, 做了一些修改。好,看起来还不错,我们让他提交 敲 commit 啊,就可以让它提交了。呃,这个命令在 cloud code 中,在 open code 中啊,还有这个 id, gravity 啊, cursor 啊,都可以用,直接敲 commit 就 好了,也不需要特地的去封装。一个命令出来 从五十一 composition 扩展到三百多个啊,这个每一个 composition 呢,都被我塞了这个七八个十几个的这种 sequence。 这一次 kimi 的 模型是多模态的,那我们从它的官网上面就就地取材吧,我们就截着一个 啊,截着一个 a 键词的评分。 好,那我们把它粘贴过来, ctrl v, 请你帮我实现一下这一个 composition。 找一个 inbox 的 地方放一下,谢谢。 来看一下这一个颜色啊,颜色上面大致都是 ok 的, 然后数字上面 也是 ok 的。 内部有 logo 啊, logo 呢,这个东西没有办法啊,它没有办法准确地这个复刻里面的这个 open ai 的 logo 啊, open ai 的 logo 啊,这个索罗比啊,吉米娜的 logo, 但是说这个都在内部, 然后底部的文字也没有任何问题啊,那证明这一个视觉的效果还比较好。我在测试的过程中也发现,如果你截图只截了这一个, as 这三个啊,那识别的效果会比较好。那如果你截了这四个, 这四个大块啊,总计这一个十个柱状图啊,那这个时候识别起来呢,就是数字都能识别对,但是样式呢,会有一些丢失,需要你用更多的提示词把样式修复一下啊,这里就不做演示了。 总的说来,这一版本的 kimi code 和 k 二点五将国产大模型的表现又往前推进了一些,我自己使用下来的感觉是在索尼四点五稍微往上一些,价格只有索尼的七分之一。大家也可以看到,在脱离 id 的 情况下,它的表现也相当出色,纯靠 kimi code 就 能用 react 编排出一个看起来像模像样的视频,而在更大的代码仓库中的表现也是可圈可点。 pimico 的 本身是开源的,而且它的开放性也做的比较好,如果你想使用其他家的模型,也可以通过 对应的配置来接入,玩法比较灵活啊。在我体验的过程中,我也发现 pimico 的 目前没有支持 play 模式,我现在是通过 play with file 曲线救国这个功能能做成原声的啊,这样可以让我省去不少的事。 界面上的反馈呢,可以再细化一些,比如说在写大文件的时候,我有的时候不知道是卡住了还是正在写文件,我希望有一个 token, 上行和下行的一个展示,这样子呢,我可以确定它是在工作还是已经卡住了。社区生态还在一个起步阶段,如果能像 omopen code 一 样,有一个非常不错的编排系统啊,那就非常的舒服了。关于 kimi code 和 k 二点五,大家有什么想法?欢迎在评论区分享你的使用体验。 我是海拉的编程课 ai 永不眠,我们下期节目再见,拜拜啊!视频发布前,我发现 kimi code 更新了一个登录方式,你直接可以输入 login, 然后这里就登录成功了。
粉丝7184获赞2.2万

上次 cloud bot 的 教程发出后,评论都在说两个问题,一是 token 用的太快了,配上 m c p 或者 skills 一下就欠费了。二则是 telegram 在 国内不太方便使用。那针对这两个问题,我这次研究了另一个方案, 钱包没压力的同时,对网络环境也没什么要求。对于 token 消耗太快这个问题,我们可以使用一些模型的代码计划,只需要付费一次,就能够保证一个月的使用,完全没有欠费的可能,而且还有时间段重置,既保证了满足了 kimi code, 再加上最近 kimi 刚发布了 k 二点五模型,在 openroot 的 编程和科学类目的的调用数量都名列前茅,所以我尝试了一下 kimi code。 而对于 telegram 不 方便用的问题,这个视频将使用 imessage, 你 也可以用生活类的其他平台,比如飞书、钉钉等等,方法都大同小异。我让 cloud bot 去最近超火的 modbook 冲浪,他给自己起了名字,还发了个帖子。 嗯,怎么说呢,有种养娃送去幼儿园跟其他小朋友一起玩的感觉。接下来我们就介绍怎么配置吧。先从安装 openclock 开始,因为这次要使用 imessage, 所以 我是部署在自己的 mac 上,首先在文档中找到安装命令,然后粘贴到我们的终端中,稍等一会,可以看到它正在安装, 这个时候会提醒我们这是一个很危险的操作。是否继续选择?继续?接着选择配置方式,我们使用快速开始,也就是自动帮我们配置,我们不需要自己在配置表里面去一个一个填。接着我们可以选择我们使用的魔性提供方,选择 monshot, 然后选择使用方式是通过 kimi coding apikey。 apikey 我 们需要去到 kimi code 的 官网中获得。进入控制台,在这里新增一个 apikey, 输入我们 apikey 的 名称,得到一个 apikey, 复制下来粘贴到终端中。 接着我们默认模型是什么?我们选择 k 二 p 五,这里的 p 其实是 point 的 意思,所以 k 二 p 五其实是 k 二点五,老是说这种命名方式有点奇怪。接着我们可以选择我们要在什么平台来使用这个 bot。 选择 imessage, 然后需要安装一个工具,用来读取 message 的 信息,这工具叫 imessage。 接着询问我们现在是否需要配置 skills, 那 当然选择配置了。选择一个 node 管理器来安装 skill, 我 们选择最常用的 npm, 但如果你的机器上安装了 pm 或者 bomb, 你 也可以选择这两个。接着安装我们所需要的 skill 的 依赖, 比如你想用这个 bot 来控制你的笔记,你就选 apple notes。 控制你的题型事项就选 apple reminders。 可以 看推特,你就选择 bird 等等等等。但最重要的是一定要选择 imsg, 因为它是用来控制我们使用 imsg 的 通信的。后面的 mcp port 和 model user 也很值得安装,因为它可以控制我们这个 bot, 你 使用的 mcp 以及查看我们模型的用量。 使用空格。选择好你想要的 skill 之后,就可以使用 enter 继续下一步了。我们等待一会儿,等它安装完成之后,我会发现需要设置一些 api key。 这里的 api key 是 因为刚刚的 skills 中有的 skill 需要有 api key, 比如说这个叫 go places 的 skill, 就 需要 google place 的 api key, 因为我们刚刚没有选择那些 skill, 所以 我们这里一路摁下去就可以了。 fox 指的是当你执行一些行为时会自动执行的行为,那我也不太需要,所以我暂时就 skip 掉了。那么现在就开始安装网关服务,我们等待一会 安装完成。安装完成之后,它问我们要怎么样孵化我们的 bot, 也就是给它配置一些灵魂啊等等等等。就这种初设设定的东西,我选择了第一个,然后我们就会进入到一个网页里面,我们在这里填入一个我们对它的设定, 他会回复, ok, 已经设定好了,并且写到了他的文件里面。 cloud bot 最棒的地方就是在于机器人会自动将你告诉他的有价值的东西写入到文件中, 不需要像其他的 agent 一 样,必须明确地告诉他,将这个东西写在你的 cloud md 或者是 agent md 中, cloud bot 自己就会选择有价值的东西记在他的 md 文件里面,可以说是 unix 哲学在 agent 上的体现,那么 cloud bot 就 算完成了。接下来我们要做的是将它和 imessage 连接起来, 因为它真的很聪明,所以你大可以让它自己来配置,只要跟它发出需求。当然呢,需要告诉它一些必要的信息,就是我们的 imsg 安装到了哪个位置,你可以通过在终端中执行 which imsg 来了解。 可以看到它的配置并不顺利,它需要一些权限的设置,那这个它自己没有办法做到,就让我们来帮忙。它也给出了步骤一和步骤二,我们就跟着操作好了。 首先打开我们的系统设置隐私与安全完全磁盘访问权限,打开我所使用的终端应用 ghosty, 如果你使用的是其他终端应用,也是给相应的终端应用打开就可以了。 这里漏了一步没录上,你还需要将 openclaw 的 二进置文件也放进来位置,你可以通过在终端运行 which openclaw 来找到配置。完成后,你需要重新打开终端,就是将终端退出,再重新打开,然后再在终端里面重启一下 openclaw 服务。 具体来说就是先执行 opencloggetaway stop, 然后再执行 opencloggetaway。 完成后,我们再打开刚刚的聊天界面,再问一问它能不能访问到 imessage 了, 这个时候大概率就是可以读到了,但是如果你还不能读到的话,你可以问它到底什么问题,如果还是解决不了,你可以在下面的评论区留言截图,我看到了就会回复,等到它确认可以读取 imessage 了,然后你就可以找这台机器的 imessage 发送一条消息,消息会回一个 pairing code, 这是一个配对码,用于限制到底哪些用户可以跟这个 bot 交流。记住这个配对码之后,我们在机器的终端运行这一句就算配对完成了。你可能会好奇,为什么这两张图的配对码不一样,是因为配对码只会显示一次,而我在第一次执行的时候没有录到,所以后面又录了一次。总之,现在 我们就应该可以通过 imsg 跟它沟通了,你也赶紧去试试吧。如果有问题欢迎在评论区留言截图,我看到了就回复。

hi, 今天给大家分享的是很火的 skills, 这个 skills 呢我们分为三个部分,第一是理论篇,第二是基础安装,第三呢就是清洁自设。 那第一个我们来了解一下什么是 skills, 它呢起初是 cloud 团队呢,它提出的一个实验就是 cloud skills, 这个是比较节省 token, 我 们传统的呢,比如说一句话, i am a cat, 他 都会拆解成这样几个模块,但是呢现在这样一句话被打包成一个模块这样去分析,所以呢他就很节省 token, 可以 看一下卡帕西他之前的三个小时的视频, 可以理解了,因为节省 token 之后呢,又加上它自带的一个技能包,可以自动化做事情,所以它就火了起来,包括现在我们用的很多 ai 的 话呢,它是需要在这个网页当中去使用的, 而且这个 skills 呢,它是可以本地部署的,之后我也可以给大家去示范一下。第二个原理,我们可以把它想象成一个说明书,这个说明书呢,它是分为三个部分,目录、正文以及副录。 那目录呢,相对应的就是它原数据的部分,也就是是它始终会在上下文中占用的一个内存是极少的。这个呢它也就非常像 gemini 当中的设置的名称和说明部分。我们再回来看这个指令, 指令呢就相当于是这个说明书的正文,当你决定使用这个技能之后呢,就会被部分调用。这个呢也就相当于是真的当中他这个指定端,指定端是你要做什么,然后想要什么样的风格等等的。 还有一个呢,就是最后一部分是目录,也就是添加的一些参考文档,派送脚本呀,以及一些工具代码。 这个呢,也就对应了 jimmy 当中这个新 jim 的 知识部分,也就是添加一些附路在上面,这样也就帮我们去更好的完成作业。我之前有出过一期比较简短的 jim 哎,那有了 skills, 那 mcp 它是跟它有什么关系呢?是不是可以替代呢? 答案是否定的, skill 呢,其实就相当于是一个自带工具包的一个小人,当你想去做某件事情的时候呢,你去选择某一个相对应的 skill, 它就会自带工具包去完成打包。而这个 m c p 呢,它就相当于一个万能接口,嗯,就是可以连接各类的工具。 那如果不理解的话呢,之后我还会单独再说一期,如果大家想看的话,可以给我留言,那对比起来呢,我们就可以从本质关注点以及范围和形象比喻来去理解。接下来呢,来到了基础安装的部分, 大家都知道现在一般找资源都要去 get, 这其中呢,我也找到了这样五个,可以分享给大家。第一个呢就是专业团队, 就包含了像 word, excel, ppt 啊这样的官方出版,就比较稳啊,可以直接帮你生成一些带格式的文档。第二个呢就是 m c p 万能链接,嗯,它是连接 github 啊等等的,它都可以。第三个呢就是说职场专家包, 他会让你的 club 变成一个懂项目管理的副经理,非常适合上班族。那第四个呢,就是一个大杂烩一样的,收集了社区里面各种各样的一个有趣的技能,比如生成艺术啊,网页自动化测试啊等等的。 那还有一个比较火的呢,就是 ui 设计,我看大家现在包括我自己啊,都非常倾向于设计一个自己的网页,因为之前呢比较受限于这个专业技能,但现在的话呢,有了 web coding, 大家都可以去设计自己的网页, 我们可以看一下这个网站当中呢就有许多的风格,你可以去创作,比如我们向下找一下,你看他这里面就有很多这样的颜色主题呀,你想创造一个比如说什么收益网站啊,或者是其他的衣服啊,服装等等的,你都可以在这里面去做。 除此以外还有一个呢,就是一个大神出的一个爬举网站,它这里面呢就爬举的都是都是 github 当中一些名列前茅的分享,大家可以从这里面看得到,当我昨天在登录这个网站的时候才三万零几,现在已经变成三万两千多了, 所以这个数还是在增长的,当我们去看 github 这个文件就可以直接去使用了。 好了,说完以上呢,我们就要来到了一个实操的部分,我会结合 m c p。 那 如果大家之前没有安装 vs code, 或者是说 cloud gbt 和 jimmy 的 终端安装,可以看我往期的这两个视频去看一下。而且呢我们授人以鱼不如授之以渔哈,那我是怎么去找到的这个呢?第一个呢就是比较推荐,大家可以没事的时候去 hello get up 当中去查一查它也它也算是一个爬取的网站来的, 它这里面的话呢会有一些审核机制,就是达到一定的星星数它才会给通过。还有一种呢就是更直接一点,就是问你的 ai 那 有什么可以借鉴的啊之类的,它这里面推荐的你需要自己去再实际判断一下, 去筛选一下。那我们现在来实操一下,我现在就用一个比较经典的 cloud 和 mcp 相结合。 ok, 我 们打开终端,我还是比较建议大家再去启动的时候呢,旁边备一个你的 ai 助理, 遇到什么问题的话就及时问他。我们现在启动了这个终端当中的 cloud, 我 们连一下这个 m c p, ok, 第三个问题,如果不会选择,你就问 ai 就 好了, 大家可以看到这个地方呢,它是显示我们一直在用的是多少 tokens。 为什么这一次我没有用这个 vs code 呢?因为 vs code 呢,它是需要连接 api k, 然后再去做的。那如果你是有比如说 cloud 或者是 jimmy 会员,那我比较建议你直接用这个桌面版的,这样就会比较节省啊。我们可以看到左边这个栏,它是在我的电脑终端上直接就帮我操作了。 ok, 它已经顺利读取了。 ok, 这个 m c p 呢就已经做完了,我们再回到这里。那接下来呢,我们进入了第三个阶段,就是自己去设置一个属于自己的 skills, 现在 skills 真的 是处在一个爆发的阶段,当你想要去设置自己的 skills 的 时候呢?第一,你要对 ai 的 使用有一定的了解,就比如说你需要反复粘贴提示词的时候,或者是说有固定工作流的时候,你再去做。 其实大部分对于我们这些小白来讲,就是 jimmy 里面的 jim 就 已经很够用了,大家可以去看一下我往期的这个 jim, 之后我也会更新一下这个 jim, 因为我 看 jim 当中呢又出现了一些 labs 的 实验室的功能,等我体验好后再给大家分享。第二个呢就是固定工作流些专业的人,他可能会用 n 八 n 啊或者是 cos, 但每一次都要去十点连接的时候,经常会遇到这样那样的问题。 那这个实操示范的话呢,我们是要仿照这个官方教程来的,官方教程当中呢,大家可以去到 github 当中可以找到它,这里面有一个自设模板,包括 note 的 联动啊,我这个呢就是直接在这个 cloud 当中呢去找到的这个网址,大家也可以记一下截图, 然后直接进入到这个网页当中来,这个就是官网如何创建一个自定义的技能,这里面呢就可以看到刚刚我们分析的就包括第一部分就是原数据, 那第二个呢就是概数啊,以及使用,包括创建文档啊。第三个部分呢就是资源,这样的就是一个完整的 skills, 他会教你如何去创建自己的 skills, 这里呢我就不会过多演示了,包括这里还有一个 github 仓库当中也有示范。 那好了,今天的分享呢就先到这里,之后我也会把这个完整的截图,有需要的话呢我会放在评论区整理一下呢,我也会发到公众号当中,有需要大家可以自己提取一下。

好的,大家好,今天给大家说一下现在所有的 ai agent 都会依靠的一个平台叫 versatile skills, 不是 就叫 skills, versatile 是 做这个平台的公司,这个平台的好处是在哪里?就说在最早没有这个平台之前,因为市面上有很多的 ai agent, 当 你想安装一个 skill 的 时候,你就要需要手动的一个一个把这个 skill 包放到这个 agent 对 应的目录下,这样就特别麻烦,因为你安装的时候,你肯定是希望你的这个 skill 是 让所有 agent 都可以用 versatile 的。 这个 skill 平台出来之后,你就可以直接一键安装给所有的 agent 使用, 同时它相当于提供了一个方便管理的一个操作,你可以像使用 npm 命令一样去安装和卸载以及更新,方便我们进行管理,一切都很规范和标准。 同时因为它本身成了一个平台之后,它就把市面上所有的 skill 都可以囊括进去,我们也可以在上面去看到一些其他优秀的 skill, 也可以看到最新的排行,以及现在火的,像现在火的最火的是什么 skill, 你 可以去试试看,也可以去下载, 都很方便。像比如说现在二十二十四小时以内,现在最好第一排名最火的就这个 fan skills, 因为它它是可以用来帮我们在 skill 这个平台上去找你需要的技能的一个 skill, 就 用来找技能的一个 skill 这个 skill skills, 因为我看像现在基本上你不管你是用那个龙虾或者说还是可口的这些,你都会用它来管理你的 skills, 但是没有很多人去讲这个基础的一些操作和命令,今天就来简单介绍一下 这边有些基础的操作。你安装技能包的时候,你就直接是 npx skills add, add 后面就是加你的 skill 的 名字,或者说地址,或者说是他的仓库。等下我右边去详细说一下。第二个你可以去列出你先看到你现在所有的 skill 的 一个命令, 一个 list 的 命令,我这边运行一下。好的,可以看到他现在就直接把我现在呃电脑上装的所有的 skills 给列出来,并且他把我每一个 skills 对 应的 agent 的 平台他也显示出来了。像有的我就加了 cursor, 有 的我就没加,这个都很直观。 像第二个进第二个命令行,就是一个 check 的 命令行,它可以去检查你现在哪些 skills 是 已经需要更新的。有新的 skill 的 版本你可以去检查一下,因为像现在这些最新的 skill, 它们推出之后都会开发者会更新的比较频繁。像这里它就检查到有九个 skills 需要更新, 这个就是去执行所有的更新,直接执行这个 app, 它就可以更新所有这个 n p x skills remove, 这个 remove 命令就是去删除你想不想要的一个技能,并且你删除的时候它也可以去选择你想删除的是所有的 agent 的 技能,还是只是这某个 agent 的 技能,它都可以括号这个 agent 的 名字,这个括号 skills 名字就可以。 好的,接下来我就说一下这个安装势力,它安装它其实主要就是一个 add 的 命令,但它 add 它可以后面比方说跟的是一个技能的仓库,它就是进到技能仓库,它这个仓库下面所有的 skills, 你 进去之后你就可以去选择你要安哪个,而不是一个特定的 skill。 如果你想安装这个仓库下面特定的某一个 skill, 你 就往后面再加上一个杠,两个横杠 skill, 加上这个具体的 skill 的 名称。 这个如果你比方说在 github 上面,你找到了它的这个 skill 的 地址,给加进去来安装, 这里我就给大家以这个 vsco 官方的 skill 试一下,因为我们现在是没有加特定的这个 skill, 那 么我们进去之后它就会进到这个 vsco 的 仓库,它里面就可以选择进去之后我们再选我们要安装哪些 skill, 它这个库会对现在已经打开了,你看它这边是找到有四个 skills, 它 就是从这个 vsco 官方的有四个,四种不一样的,这个时候你就可以去选择。比方说我要选这个网页设计的一个技能,我就按空格去选中,如果你想选他其他的技能,你也可以就同时多选或者单选都可以。 这边我们选中之后我们再敲一下回车,好,接下来它就是会让我们提示要选安为哪些 ai agents 去安装,像它现在市面上已经支持基本上所有的 agents 都有,它总共有四十个 agents, 那 这个时候你可以去选择你电脑上有的,比方说我这里勾了 cloud code, 勾了 codex, 勾了这两个好,勾了之后就可以继续敲回车。 他接下来他是问你去安装在项目目录下还是安装在全区,我一般是默认全区,我就直接安装在全区,可以继续点回车。好,这里是,这里有两个,一个是令刻的形式,一个是呃实体文件的形式。这两个什么意思?说这个包, n p x 的 包。他把这个 skill 下载到你的电脑本地之后, 其实它世世上只有一份,如果有用这个 link 的 形式的话,它只会下载一份原文件,然后剩下它其他的所有 agent 的 skills 等目录下的这个 skill 都是以一个呃快捷方式或说一个链接的形式放过去。这样的好处在哪?什么?这样的好处就是你不需要去重复的使用,重复的复制或者重复的下载这个 skill 文件,这样会占据你的内存。 这个 copy to o agents 就是 指的把这个原文件以复制粘贴的形式再放到这些 agent 的 的目录 skill 目录下。所以说一般官方是会推荐选这个 link 的 形式,我这里也选它点击回车,然后确认 yes, 它就会安装成功。它这里已经显示它已经安装了一个 skill, 像两个 agents, 分 别是 cortex 和 cloud code。 对, 这里就安装完成了。 好,第二个以安装特地技能的方式,这个就很简单,你直接跑这一行命令,它就直接进入到我们刚刚的那个流程,只不过少了一个选择。你要安装哪些 skill 的 一个过程,剩下的都是一样的。 后面还有两个,一个是这个全局安装,就是杠 global, 他 就是直接跳过我们刚才的选择,这个是指定你要安装的 agent, 如果你不想选的话,你就可以用这个命令杠 a router, 杠 a cursor, 这样对,我一般推荐大家使用就是去使用这种技能合集的形式,这样你就可以进去,之后你可以选你想安的哪些 skill。 对, 这边再简单说一下最后的一个就是一个 remove 卸载。像卸载这个也很简单,我们直接说一下最后的一个就是一个 remove, 这里点回车,这里他就会问你 你是否要卸载这个 skill? 好 的,它这里就卸载了,这里卸载它默认是整个所有 a 卷尺都一起卸载掉。因为我们是用 link 的 形式,只要我们把原文件一删,其他的那些链接的形式都是会消失的。对,大概就是这样。

第二个就是文献综述场景,我觉得强力的吹一波这个 kimi 二点五的彩虹屁,我认为我后边不再买 minas 了哦, minas 正好过期了,我认为 kimi 的 二点五完全可以实现我对于 minas 的 那个需求。 给大家展示两个,一个是非投位式的综述写作,一个是投位式的综述写作,大家可以看一下。先看一下一个非投位式的啊,非投位式的还是有一定的幻觉,但是已经发现他很能打了。 好,这个都就直接调用的就是 kimi 二点五的 agent 能力。针对情感劳动主题写生,你看我题词只有一句话,针对情感劳动主题生成一万字的文献综述。 然后呢?有没有发现它也是有 skill 的, 它有一个专门的 skill, 我 们可以看一下,这是 kimi 的 工作方式,是有一个 kimi 的 computer, kimi 电脑,对吧?它是一个虚拟的电脑,只是我们看不到它的 skill 的 具体的内容,但我们大概能够知道这是一个做文献综述的 skill, 对 吧? 所以你看, skill 其实跟智能体结合起来,现在智能体的底层内容已经是由 skill 来去组成的。开始写,查找数据,你看他查找的基本上都是我们讲的 google scholar, google scholar 的 数据完了之后,开始维代班清单开始运行,开始写作,最后其实就看到这个结果,我们就看结果就行了。你看,就一句话,写完了一万五千字。请你看到这个结果,我们就看结果就行了。 你看,就一句话,写完了一万五千字。请你看结果就行了。你看,就一句话,写完了一万五千字。请你看就一句话,写完了一万五千字,请你就发现未来展望, 你看他这个就,咱不看别的,我觉得就看他这个提纲的质量是非常高的。引言,情感劳动理论发展,情感劳动的核心维度与策略。情感劳动理论的模型作用机制。情感劳动的前沿变量。情感劳动的后果变量调节于中介机制、测量工具与方法论的进展。不同情境下的应用研究,研究趋势与未来展望, 参考文献。好看,这里边的写作的长文的感觉我觉得还是不错的。你看大家看看这个段落的感觉并没有那么强的机器味,而且关键是他那一代的逻辑很清晰,因为我对这个里面还是比较了解的,很清晰整个的概数 中间这个过程谁做了什么样的开创性的贡献,在这本书当中这个区分了什么?谁做了什么样的整合,再往下谁又进一步的推进了什么?中国学者的本土化探索是什么样的?勤劳动的核心维度和策略是什么样的?你看 这个总数大家打多少分?这是没有任何投喂,只用了一句话。所以你说未来这个题式词不需要那么复杂了,因为大魔星越来越聪明了。当然你可不可以在前面再加题式词,我觉得也可以加,你甚至可以加一些更加与众不同的, 加一些更加细分的,比方说你可以专门让他综述医学领域的情感劳动,或者说教育学领域的,或者细分的等等,这是都是 ok 的。 好,这是一个, 再看一个头尾版本的,这个我觉得就更能打了。这个是我目前发现没有哪个原生大模型能够做到的,我给他一次性上传了四十五篇论文, 因为这几天我正要访谈一下北京大学陈向明教授,所以我就把陈老师的四五篇文章都下载下来了。大家可以想一想,四十五篇论文大概已经按照字数算,已经按照一万字算,就四十五万字他都不止,他的中文数在一万五千字,也就是说这已经有六十万字了。 六十多万字, timi 一下都吃掉了, timi 直接调用了他的这个多 a 整的,开始干什么?我让他针对四十五篇论文写作两万字文献综述,注意他全部都读完了。 这个我目前没有发现哪一个大模型能够一下吃掉四十五篇论文,就在上下文的窗口,这要在以前的线下博士论文我都没办法讲,我只能让大家先让大模型把招标提出来,再把招标整合到一个文档再做。现在不需要了, 你看开始批量提取、批改、编辑、转写综述巴拉,但这个过程会很长。这个过程大概用了一个多小时的时间,做四组文情,做主题分类,构建详细的文情综述框架的话,开始写好,字数不够,空了两万字,这是他的过程,咱就不管了, 写了两万一千三百三十五字七大章节,大看引言问题域的出场与研究的聚焦理论建构实践性知识,多为审视方法创新进行研究的路径,探索生存机制,从个体实践范式转型。 我觉得用来做这个领域的这个相当于针对一个学者思想的综述学,已经做的很好了,你说你干的过他吗?你要真把这四五篇文献读完, 再开始构建这样一个框架再写,我觉你没有半个月都干不完这个事。最后看完他这个成品,大家看看他的成品,你看教育实践性知识与专业发展、中国教育学界之行探索基于十校名团队以及合作者研究的文献综述, 这都是,这都是我,都是真实存在的文献,你都不用去验证了,这个文献都是这四十五篇当中的,而且都是从里边吃的很深,这个跟咱们过去只给四十五篇的这个摘药是完全不同的, 因为摘药的这个体量和我们讲一万五千字的权威抓取的东西是完全不一样的。你如果只用摘药,你写不出来这么丰富的,你的深度是不够的,这个深度已经完全 ok 了,你看写完了。 所以你想如果大家再做博士论文,如果到后边的话,那我就可能就一句话就完成了,甚至你可以在一个 kimi 的 窗口完成十五万字到二十万字的博士论文,我就没有任何的问题。

给你们看一下 skills 到底有多恐怖,这个网站里集合了十二万个 skills, 并且它的数量还在不断增加,你需要什么样的技能,你就在下面的搜索框中搜索什么样的技能。比如我这里面 find 了一个 excel, 也就是搜索了一个 excel 技能, 它这个下面就会把 excel 相关的技能都给我搜索出来,并且每个技能它上面都有一个星标,我们就找这种星标最多的来看来使用。 我们点进去之后,它就会跳出这个 skills 的 相关详细页面。这个 skills 主要针对是 excel, 它可以对表格进行一个创建,并且对数据做可量化的分析。 再往下翻就是这个 skills 的 详细使用说明。而 skills 这个工具它的恐怖之处就在于它可以把所有的技能集合成为一个技能来让你使用,这样你就相当于有了一个全职全能的 ai 员工。那些还不知道是什么和不知道怎么用的小伙伴儿,点赞收藏,主页踢我!


兄弟们,你们这是要气死我呀,一个个都在炫耀,白嫖了 pro 版的 german 免费会员,结果问你们 anti gravity 的 生态用的怎么样了?居然问我 anti gravity 是 啥?就是这一个 anti gravity 刺客信条,为啥叫它刺客信条? 问,这个,这会最火的 scar 你 知道吧?技能啊,这玩意装上 scar, 那 就是真正的刺客信条!来,给你们看看我心中的一个技能 啊,就这个,这个是我之前自己做的一个网站啊,用来裁剪我统一的图片封面的啊,非常的方便实用啊!就这个 u i 设计,我不跟你吹,上下五千年 啊,独我这一份啊,这,这没人能超越啊!这会呢,官方出了一个前端 u i 设计的 skill, 我 装完之后试了一下来看看效果, 整体说,这 skill 不 装也罢。正当我准备删掉这 skill 的 时候 啊,这会又遇到了 u i u x pro max, 而这名字听起来就跟我 iphone 好 像有那么点渊源呐,据说这个 u i 设计 skill 那 是前无古人后无来者啊!于是我再给他一次机会,又装了一个这个 skill, 哎,你别说哎,这效果仅次于我原先的设计啊!这 skill 厉害就厉害在 一分钟快速帮我全面布局,效果还是非常让人满意的。那兄弟们就要问了,哎,这 skill 这么厉害,我怎么给他快速上技能呢?怎么让我的 anti gravity 技能满满呢? 老规矩啊,教程文档我全都给兄弟们无文病貌的做好了,我们评论区见。

很多程序员的工具链里,终端 ai 助手已经成为了标配。不过说实话,想找一个用起来比较顺手,不用魔法并且稳定的方案,其实不太容易。最近我发现了一个叫 iflow c l i 的 工具,内置国产大模型,还支持 skills 啊,我用起来比较舒服。大家好,我是海拉的编乘客,今天我使用 i flow 给大家演示两个用法,一个是在日常生活中用它来写一些想法验证啊,写一些 poc。 老规矩,我们不打开 ide, 不 手写代码。第二个,我们使用 skus 来对我们代码仓库做一个体检。 好,那我们先打开 icl i 的 官网,在这里进来之后呢,我们先安装复制这一个命令,然后粘贴到你的终端中。 好,紧接着我们需要登录,我们敲斜杠 else, 然后选择第一个登录, 接着我们选择默认的模型啊,也就是 g l m 四点七。 好,我们语音输入,你是什么大模型啊?这也是我最喜欢问的。好,它现在说是 g l m 四点七大模型啊,也就是说我们可以在 iphone 里面使用多个大模型。 在日常的开发中呢,我们会经常做一些想法上的验证,比如说验证某个技术方案行不行啊?老板甩过来一个需求,说,这个淘宝上边的搜图,哎,拍张照片搜到对应的这一个商品,能不能做?我们先进入目录, 我们叫 image search。 接着呢,我们开启 i flow, 我就直接和他聊,老板说什么需求呢?老板说淘宝上面的这个搜图是怎么做的,是吧?那我们问一下他。 呃,我想问一下,类似于淘宝上面拍照搜物啊,搜到某一个商品啊,这个背后的原理是什么?这个专业术语叫什么啊?请回答我一下,谢谢。 我们通过刚刚描述很虚的需求啊,就可以拿到一个术语叫做以图搜图啊。紧接着我们就直接把需求告诉他, 我想做一个以图搜图的这一个,呃, poc 啊,我想请你帮我列出这种最小的需求是什么? 好,我们看一下,这里有一个以图搜图的最小 poc, 核心需求如下,有一个,上传图片特征,提取 相似图片解锁。然后呢,技术组件呢,建议使用 python, 图像模型呢?建议使用 clip, resnet 和 mobile net。 还有一个向量数据库啊,有一个 fast 和一个。呃, milos 啊, 前端呢?简,建议我使用简单的 html, 后端框架呢,使用 fast api 啊,这个包括选型做的都还可以。 呃,这里我有一些不明白的地方,就是图像模型和向量数据库,因为我其实在写 poc, 我 并不完全需要一个数据库,我只需要让他帮我写文件,最后帮我解锁就好了。这一个数据库呢,可能并不是一个必选的像, 而这一个图像模型呢,这里面涉及到很多个模型,我也不知道哪个模型好,但是在写 poc 的 时候呢,我现在需要验证这一个图像解锁是不是 ok 的, 我并不需要做到非常非常精准的图片解锁, 我需要把这一个 poc 跑完。至于模型我们选择什么模型,还是后面选择单独的某一些模型做一个 fight, 这些呢,都是可以在后面考虑的,不属于我们 poc 的 部分,所以我需要问他。 这里我有两个问题啊,第一个问题是模型上的选择,其实我更想选一个比较小的啊,能够跑完这一个是 poc 的 啊,一个模型就好了。然后呢,请你给我一些建议。第二个问题是,我觉得销量数据库其实并不是必要的,我们可以先把东西存在本地,对吧?然后我们就 可以完成这一个 poc 了。呃,你先不要帮我实现它,不要写代码啊,我们验证一下,我们聊一聊, 在实际的过程中,和 ai 聊天的时间应该是占到整个开发比重的四分之三。呃,我的建议是大家尽量花更多的时间和 ai 聊通了。然后呢,再去落实 好。我们大致扫页,针对 poc。 他 建议这一个清亮模型啊, mvnet v 二 resnet efficient net 这个我都不明白。 open clip 啊,这个我是明白的,但是 open clip 我 印象中它的汉语知识不是很好,并且呢,我们只需要做以图搜图,并不需要做一个文字搜图,所以说这个 我们选一个中间一点的吧,选一个四十五的。然后我们看到问题二,向量数据库的必要性啊,说 poc 间呢,确实不需要向量数据库啊,他认同我了。 好,这里面我们看一下,通过 npy 加鱼弦相似度就可以搞定了啊,零依赖,代码简单。然后呢,一千张以上图片会慢啊,慢呢?估计就是解锁方面吧,我觉得这个不是什么大问题。 然后建议方案模型存储后端前端,然后启动时加载模型,从本地 m p y 加载特征库,然后上传图片,提取特征,与所有特征计算相似度啊,这个看起来都还挺 ok 的, 那我们切到一个 呃 plan 模式吧,我们把我们的开发计划再深入的聊一聊。我现在呢,想请你使用呃, esnet 啊,来帮我。这个模型。 后端呢,使用这一个 fast api。 前端呢?呃,我建议你使用这种单页的一个呃页面,然后呢,我希望通过 fast a p i 把这一个网页 host 住啊, 接着呢,样式上我建议你美化一下啊,用一个类似 vs 的 高高科技感的暗黑模式。 然后我们再想一下,在这一个数据流这一边,有一个启动时加载模型,从本地 npy 加载特征库, 然后上传图片,提取特征,与所有特征计算相似度。这里面还漏了一个情况,需要补充一下,我们可以先写,还需要写一个脚本,把这一个几千张图片把它转化成特征库,才能 在上传特征库的时候提取特征,返回 topk。 结果啊,所以说这里面还漏了一点, 是这样子啊,呃,还有一个需求是我需要你,呃,写一个脚本对吧,可以把对应的图片转换成一个,呃,特征 特征库对吧?好,记得一定要开 plan 模式。 他说图片库的数据来源是什么?需要网上下载样本图片的方案吗?啊,这里我已经准备好了, 大家可以看到这里面有 image 啊,我把它这一个移过来, 在这里我们选择 type something。 你说。接着呢,前端页面需要一个拖拽上传图片啊,实时预览上传的图片, 要把它缩小一点。 接着呢,显示相似度的分数,这个需要的点击查看大图呢,我觉得没有必要,然后我们再提交答案,这个时候呢,他就开始做了 技术栈后端前端存储,还有这个计算啊,运行相似度没有任何问题。 呃,有一个 build features 啊,通过特征库来构建脚本啊,也没有什么问题。 核心功能拖拽啊,返回暗黑色的这个科技感 ui, 现在我们可以看到,作为 poc 的 话,一整个规划是比较靠谱的啊,那我们就直接选择第一个, 呃,看一下这个功能特性上面都好,是吧。我们好,我们接下来安装一下依赖 啊,我们大致扫一眼这一个 view feature 这一块有没有问题啊?大致扫一眼,通常情况下不会有问题,但是难说。 好,我们先构建对应的这一个 feature, 接着呢,我们可以给大家看一下对应的这一个图片里面是什么啊,都是些小猫小狗啊 啊,我现在都已经感受到我的这一个风扇在狂转了。 好,这里面已经,哎,已经做完了是吧?然后他写了两个文件来看一下啊,在 matedata 里面写了一些,应该是原数据,然后在这一个,呃, features 啊, py 里面啊,有十四兆啊,它应该是把这一个图片提取成某某些特征啊,它就和人类一样,人类不能像相机一样记住每一个像素,但是人类呢,也是通过照片上的特征来区分的啊。我们启动服务, 能启动吗?哎,能启动能启动,我们打开好拖拽图片。 ok, 接下来我们验证一下啊,我们选一个蓝猫, 把它截图保存下来。哎,蓝猫原来是俄罗斯的, 打开一下,接着呢,我们点击选择把这个图片读过来。哎,我们可以看到,基本上都可以找到懒猫了。 这个输入法真的是变了,选一个吧,选一个放下来保存,接着以图搜图 搜索。哎,我们可以看出来,那这一个小狗就被搜出来了。 poc 写完了,我们还想知道 poc 距离真实的生产还有多远? 我现在想问一下这一个,如果说我真的要做这种宠物上面的解锁呀,对吧?这个搜索到对应的宠物还有哪些这种非常呃硬核的工作是需要做的啊,我觉得是不是 呃 poc 距离生产还是有一段距离的啊?请你和我聊一聊 poc 层面啊,使用的是这一个 oxford, 还有点意思,它是不是读到了哪些原数据 真实呃,生产需要真实场景的图片啊,手机随手拍,各种角度,光照复杂,宠物遮挡,被主人抱着躲在沙发后啊,这确实是 多宠物同框,这也是,然后模糊低分辨率,这是看起来就是非常多啊,然后数据清洗式,这一块标注式,一块数据增强技术啊,构建更大更多样化的做一些模型的特化,就是模型现代化, 这个生产需要 fight, 然后目标检测,注意力机制,聚焦宠物的关键部位, 多尺度的,多尺度的特征啊,这看起来太多了,太多东西需要做了。现实的建议是先做 mvp, 然后逐步打磨,不要一开始就想做的完美啊,这也是符合咱们这一个就是基本要求的。可以看出来, flog 加 glm 四点七给出的这一个建议啊,都是比较重肯的啊,有哪些东西要做啊?有哪些东西是比较硬核的代码啊? poc 的 最核心的部分可能也就几十行几百行代码, 但是要真正的把一整套做出来还是需要很庞大的这一个工作量的。 在上一个项目中呢,我们写的是 poc 啊,写 poc 的 时候呢,就需要 web 扣定一些,氛围编成放松一些。 但是当我们在加功能啊,想让这一个代码变得更稳定一些的时候,那我们就需要加入一些这种质量审核。我之前写了一个 skills, 那 我们打开这个 skills 来看一下,这个 skills 是 我专门用来检查代码的,那 基于代码整洁之道,聚焦七个高收益的检查维度。比如说命名,一定要是有意义的,命名函数要尽量的短小啊。就是,而且要单一职责,尽量减少重复, 尽量规避过度的设计啊,一些魔法数字,还有结构清晰度和 项目规范。呃,每一个问题都会给他排上不同的级别输出的格式呢?是像这种有原则、有位置,有级别,有问题,有建议啊。然后有两个 reference, 并且这里面会开启多个 a 键来扫描这个,这里面我们让他帮我全面做一下审查汇总的报告。每一个维度开一个 a 键 啊,但是要串行完成,不要并行。如果开四五个 sub a 键的长时间跑的话,会遇到并发症问题啊。我们建议他一个维度开一个 a 键的串行完成,一步一步做。 iphone 目前还没有开放并行,但是在他们的论坛里面有并行的体验卡,如果大家有需求的话,可以去看一看, 大概二十多分钟就把任务跑出来了。呃,跑了接近七十五个问题啊,应该是非常给力的,高优先级的大概有十二个,中优先级的有二十九个,我们看一下,大致扫一眼吧, 有些命名啊,这个项目规范啊,我们往后拉一拉看 啊,高优先级,看看删除组建或实现集功能啊,这就没写,是不是然后 mcp test 啊,我这个也是没写。 嗯,这个检查确实是挺到位的。然后消除重复的文件,更新逻辑, 这里面有重复的代码哎,看起来符合我的认知。然后提取关键业务,敞亮, 重构核心业务函数啊,总的说来还是不错的啊。这里面包括有这个 run, open code, s t k streaming 啊,这个函数呢,要提取 event buffer, event handler, session manager 这些类。呃,都是蛮符合我的理解的。 用了几天,我的感受是够用,而且比较省心。市面上大部分固定 a 键呢,有的功能它都有,比如说 m c p, 工作流 skills, 开箱就能干活,登录就能使用。另外,零点五版本加了两个非常实用的功能, 一个是 hooks, 可以 用来做一些提醒。一个是 restore, 如果你搞砸了,你可以回退。当然,我也建议大家用好 git, 这样子你可以做一个双重保险。那我在体验的过程中呢,也有一些不足。 c l i 的 这一个界面上的细节, 我觉得可能还需要打磨一下,比如说我看不到上行和下行的 token, 在 写大一点文件的时候,我非常想知道他在写文件还是卡住了 i f o 官方与社区,他也希望社区能够涌现一些类似于欧曼 open code 的 这样 强大的编排系统。怎么说来,如果你喜欢在终端里干活, i f o 绝对值得你试。如果你也在使用 i f o, 欢迎来聊聊你的使用体验。我是海陆编程课 ai 永不眠,我们下期节目再见。拜拜。

今天 kimi 发布了二点五的多模态大模型啊,据说是比 cloud 四点五还要强的模型。我们今天来这个官网上测试一下,你看,这里可以做网站,我们就做一个外贸电子产品的网站吧。 well, 我 想做一个外贸电子产品的顾问,请你记好目前的最新。 你看这这这是这样,我们看它效果怎么样。都在执行了。 你看它也用到了最新的 skills, 他应该是自己做了很多 skill, 正在编辑。 这里可以看到他已经用到了这个二点五调研 ppt 网站表格。这个二点五已经全量上线了, 如果他这个效果好的话,我可能会后面充会员试一下。 你看他现在已经做了很多这种任务了,自己做了这个 p r d 文档,用你 at 技术站搜索图片素材优势结合服务器网站。 这里是带版权的,看哎,能不能点进去哦,还在创建文件看。 我们可以看到看一下他的外网,他那个很很多这个测试。 这里测试写的是,就是比这个 g d p 五点二 pro 的 off 值四点五还要好,但这里没有对比那个 pro d。 哦,是对比了 off。 boss 是 八十点九,这个是七十六点八,还差一点点。这个是目前编码最强的,这个是思考编白电路最强的,这个是画图最强的。 你再看一下他现在写的怎么样了。还在写啊,这个速度感觉比之前那个上面的还是要慢一点的。 我顺便说一下,现在这个 cloud bot 已经改名字了,它现在不叫那个 cloud bot, 因为那个法律问题啊,版权问题啊,它现在改名叫这个了。 multi bot 安装指令是这个, 再瞧一下他编排的怎么样,这个速度实在是有点,你看净度还在这里,十杠一 暂停一下, 当前净度是十啊,终于跑完了,跑了大概半个小时吧, 我们去看一下它这个你看这个是设计文档,这里都跑完了,这是十,现在可以看它的技术栈,右里 app 加 type script highwind 动画库。来我们去预览一下 哦,还是可以的,相比就是谷歌那种风格的话,它这个风格还是别出一辙的。 看一下这蛮不错的。哎,英文 中文, 这就是一个简单的,看看能不能用啊,还是可以用的,看观看视频 哦,它还是有一些细节没有啊,这个内衣也是没有的,放购物车没有错,看,这是什么哦,这是分享适配手机, 这里可以下载这个文件,我们看一下。下载有八兆,这里可以下载。嗯,这里可以下载成一个完整的一个项目,这个比那个 之前那个谷歌出的那个玩的时候好一点,因为这个下载的是一个完整的项目,之前谷歌出的那个不是完整的, 它还是需要你用代码去转的。这个应该是一个完整的项目,你看这有一个 d s t, 这是一个编辑好的文件啊,这是一个完整的项目啊,这里有 index。 从这一点来说还是比较良心的,因为这个这样的话,有了原文件,你在这个基础上改就特别方便了,不用再转一遍。之前写了一个一个谷歌在里面转那个网页的一个工具,有这个的话就不需要那些东西了。 嗯,那今天的分享就到这里,拜拜。