今年 ai 的 大趋势还是 agent, 不 过跟去年的 agent 不 太一样,我打个比方啊,去年我们是在用镰刀收割玉米,还很初级, 那到了今年,我们将开上联合收割机,成为农场主,不是盯着一个 agent 写代码,而是管理十到十二个 agent 并行工作, 十几个 agent 在 后台跑,咱们就喝着咖啡等着验收,大概就是这样的画面。多 agent 编排一定是今年 ai 领域最大的趋势。而在这个趋势下边,我认为还有一件事情一定会发生,那就是针对这些 agent 定制化。 因为在生产环境当中, agent 的 上线除了跟模型的性能有关之外,还有一个非常重要的决定因素是它是否能够按照你的工作方式来运行,对吧?这就是为什么 open code 和它的插件 omocode 最近人气这么高的原因。 这套组合提供了一条全自动的 a 卷流水线,你向主 a 卷下达需求之后,它会自动分析拆解,交给不同的子 a 卷去执行,在后台跑着一大堆的任务。而且这套东西可以随意更改,你可以通过配置文件做一些小的改动,也可以把整个项目放下来重新设计。 我还是打个比方啊, clock code 就 像一辆配置很好的量产车,它很舒适很顺手,上路就走,也提供了一些改装的选项。 而 open code 则是一个彻底的改装平台,它给你提供了一个非常扎实的底盘,你可以根据需要把它改装成最适合你的赛车。使用 open code 和 omaco code 插件,从模型的选择到 a 卷的配置,甚至创建,全都向你展开了, 只要你有动手能力,你完全可以把它打造成最最适合你的 ai 操作系统。比如我就在欧曼 opencode 的 插件基础上,专门针对内容创作场景重新设计了八个 agent, 把它们打包成了新的插件分享出来。 本期视频我会介绍如何进行配置,以及我是如何彻底改装插件,让 ai 操作系统完全满足自己的需求和习惯。 哈喽各位好,欢迎回到我的频道。谦虚的说啊,我是国内少数几个能把关于 ai 的 y 和号讲明白的博主,我提供的东西远比教程更值钱,记得点一波关注, 如果想链接我就来我们 new type 社群,这个社群已经运营超过六百多天了,有超过两千位小伙伴付费加入啦。如果你是国内用户,可以从知识星球加入。 如果你是海外用户,可以从 substack 加入我的第一套课程,日常的 newsletter 以及专属视频在社群内都可以看到。回到今天的主题, open code 定制化。在开始配置之前,你需要理解用户级的配置和项目级的配置这两个概念。 当你安装好 open code 之后,在 config 文件夹下边会有一个 open code 文件夹,这个就是用户级配置的文件夹, 也就是说,除非你在项目里特别设置,否则的话默认就是按照这个配置来走的。而在每个项目里边,你还可以在项目的根目录下边创建一个点 open code 文件夹, 这个就是项目级配置的文件夹,它的优先级会高于刚才的用户级配置。所以如果你想单独为某个项目做一些设定的话,可以在这里进行配置,在这两个文件夹里边都会有这两个文档,一个叫 open code 点 jason, 一个叫 omaco 的 点 jason, 从名字你就能看出来,他俩一个是配置本底的,一个是配置插件的。总结一下,大家可以看我画的这张表,逻辑很简单,两个层级的配置,项目级优先级更高。 两个层级的配置里都各有两个文档,分别对应本底和插件。理解了这个逻辑,你就可以开始动手了。比如我在用户级层面,通过 open code 点 jason 来设置使用什么插件, 那在项目级的层面,通过 omoneq 的 点决策来设置每个 agent 调用什么样的模型,以及我会通过 mcp 点决策来设置这个项目里要添加哪些 mcp 服务器。 我所举的例子只是一小部分的设置本质和插件可以配置的地方太多太多了。比如你可以通过 prompt append 对 某一个 agent 最佳系统提示词,那具体的配置方法,大家可以去看官方的文档,或者你直接问 ai 也行, 这个是通过配置文件进行自定义的方法。但是啊,这个方法还是有局限的,在 o my open code 插件里边,它的 a tag 都是硬编码的,都已经写死了。比如它们的名称不能修改,它们的基础提示词也不能修改。 如果你像我一样追求更深的自定义的话,那可以把项目 fork 下来,把里边的 a tag 全部都给它改了。 比起开发项目,我平时做的更多的是内容。所以就像前面说的,针对内容创作的场景,我对 opencode 插件做了重新设计,我创建了八个 agent, 它们完全都是为了内容而存在的, 其中主 agent 除了会自动给子 agent 派任务之外,它还会自动切换两种模式,探讨和执行。 这个就是对应编程场景下的 plan 和 build, 只是针对内容场景做了调整,并且改成了自动切换。这个自动切换很关键,你跟他聊想法的时候,他是你的讨论伙伴,可以帮你梳理思路。 你说开始写的时候,他会立刻变成项目经理开始派活,都不用你动手去切换模式。举个例子,我问 ai, 我 看到一个说法,英伟达的双利卡故障率大约是百分之九左右,请问这个结论数据是从哪里来的?真实吗? 注, a 卷接到需求之后,他会首先判断出需要的是探讨而非执行,所以他自动进入探讨模式, 接着判断出需要调研和验证,尤其是搞清楚这个观点的上下文是什么。最后再派两个词, a 卷去后台干活,一个查来源,一个验证,那这个过程会去调用它为你 m c p 进行搜索,最终给出结论。 我最满意的是,他不是告诉我这个观点或者数据是真是假,而是告诉我上下文或者场景是什么,以及引发讨论的原因是什么。 这只是一个小例子,在日常工作内容创作当中,会有很多类似这样的情况,需要多个 a 卷的配合起来,去完成一大套的写作。 这个内容插件名叫 newtype profile, 我 已经发布到 github 上了,也在社群内做了分享。目前这样的配置我用起来最顺手,生产力比之前用 clock code 的 还高,所以我建议大家可以试一试。记住啊,安装 open code 之后,一定要安装 o my open code 的 插件? 如果你的项目不是编程而是内容创作的话,那可以试一试安装我的插件。 ok, 以上就是本期内容,想了解 ai, 想成为超级个体,想找到志同道合的人,就来我们 newtype 社群。那咱们下期见。
粉丝5.6万获赞15.7万

open code 最近真是太火了, github 上已经有九万多 star, 我 估计全球的大模型厂上都在针对 open code 做测试调优。 open code 是 目前真正能凭借 cloud code 的 工具,也是二零二六年到目前为止最火的 ai 工具。 open code 呢,目前只提供了英文文档,我按照其英文的文档,同时结合了 cloud code 的 学习资料,梳理了一份详细的 open code 的 中文操作手册,包括安装 基础操作、进阶使用等,如果你需要,我也可以发给你。上期呢,根据文档手把手带大家安装了 open code, 相信很多朋友已经感受到了它的强大。本期是 open code 的 第二期,主要带你完成三件事,一、免费进入最强编程模型 gemini 与 cloud。 二、教你安装 skills 与 m c p。 三、安装超级增强插件 all my open code。 话不多说,直接上干货。首先先教大家如何不花一分钱接入 cloud 模型。这里我们要接入一个 google 推出的工具 anti gravity, 中文名是反重力,它本身呢是一个 ai 编程的 ide, 内置了 gem 和 cloud 的 这两个顶级的模型。 在 gethelp 上找到 anti gui 的 这个插件,复制这行安装指令,回到 open code 里粘贴 open code 呢,就会自动下载安装。安装完成后,重新打开终端,复制这行指令回车。 然后我们选择 google, 选择带有 anti gui 字样的这行回车,接着就会跳转到浏览器,登录自己的 google 账号,复制这个 url, 粘贴到终端回车。这样我们就配置完成了。 重新打开一个终端,进入 opencode, 输入 gunmodels, 我 们就能看到 gemini 三 pro 和 cloud 四点五 opus 的 这两个模型了。我们测试一下输入,介绍一下你自己可以看到它正常的输出,证明我们接入成功了。 从现在开始,全是顶级大脑在为你打工,有了顶级大脑呢,还得有强力的四肢。接下来我们要给 opencode 装上它最火的灵魂同版包 oh my opencode, 它内置了七个顶级的编程 agent, 通过多智能体分工协助,帮你自动完成写代码,查 bug, 梳理项目结构的这些开发工作,不用再手动处理很多繁琐的细节。据说呢,是作者花了二点四万美金才搞出来的。安装呢也很简单, 复制 github 上的安装指令丢给 opencode, 它会询问你是否有 cloud 的 gpt 和 jimmy 的 会员啊,你就如实的回答,大概需要一分钟的时间,插件就安装好了。 重启 open code, 可以 使用艾特命令,从七大智能体中挑选一个帮你执行任务。或者呢,直接在提示词里呢输入 u l w, 意思呢就是 ultra work 就 可以使用 oh my open code。 接下来教大家如何在 open code 中使用 scales, open code 呢,可以无缝衔接 cloud code 的 创建的 scales。 首先来到根目录,新建一个文件夹,命名为点 opencode, 再新建一个 scales 的 子文件夹。然后呢,把你的 scale 复制到这个文件夹,就可以在 opencode 中使用了。当然,我们也可以直接在 opencode 中创建 scale, 需要先安装 scale 杠 creator, 有 了它就可以用自然语言来创建 scale。 我 们让 opencode 自己去安装这个 scale 杠 creator。 安装完成后,我们测试一下,让它创建一个翻译功能的 scale, 它会根据你的要求自动执行并创建。创建成功后,重启 open code 就 可以看到这个 skel 已经有了。最后呢是配置 mcp, 我 一般呢都是让它自己来安装 mcp, 比如安装一个浏览器 mcp, 我 会这样在这个 open code 中输入安装 chrome mcp server, 稍等一会它就安装成功了。有些 mcp 呢,需要配置 k, 我 们也可以把 k 给他,让他自己去配置,这样我们就不需要自己去手动去配置了。 然后输入杠 m c p s, 就 能看到所有 m c p。 从白嫖顶级模型到手搓专属 skills, 再到部署全能 m c p, 现在的 open code 应该已经是你的超级 ai 助手。 open code 的 不仅能进行零代码编程,更能帮你处理文件、整理资料,智能写作。下一期我会带大家继续进行进阶的学习,大家点点关注哈,跟着阿亮学 ai!

最近大家都看到互联网上对一款名为 cloud bot 的 自主 ai 代理程序疯狂热议,它运行在你的电脑上,现在已经更名为 opencloud。 对 于还不了解 opencloud 的 人来说,它是一款自主 ai 代理程序, 是一个自托管的代理运行环境和消息路由器,能够作为个人 ai 助手直接在你的本地电脑上运行。 比如说这个 opencloud 机器人可以直接根据在 twitter 上发布的推文构建一个全站应用。你只需要在 twitter 上 at opencloud 代理,它就会为你搭建出带有数据库、认证系统、实时同步等众多功能组建的应用。 它会不断优化利用多个子代理修复错误并持续迭代,直到你获得最佳结果。这都要归功于 opencloud 的 专用子代理。这里是我自己的演示, 我在 opencloud 的 视频中展示过。在这个演示中,我在本地桌面上部署了由 opencloud 控制的多个子代理, 用来清理和整理我的文件,结果它的处理速度出乎意料的快。但所有这些都让我开始思考,我究竟该如何更好地使用 opencloud 呢?有没有办法在其中免费使用更强大的模型,比如 oppo 四点六、 k 二点五, 甚至是 gemini? 答案是肯定的,这也是我意识到最佳工作流程是将 open code 与 open cloud 集成起来,就像我们之前把 open cloud 和 int gravity 连接在一起一样, 而且其实非常简单。对于还不了解的人来说, open code 是 目前最好的开源 ai 编程助手,直接运行在你的终端中。它的好处在于, 它真的可以读取、编辑并对你的真实代码库进行推理,它可以执行任务。你可以用 group, 还能在多个文件间写作,并且可以选择任何你喜欢的模型。所以它更像是真正的编程队友,而不仅仅是一个聊天框。此外,你还可以在 open code 中免费使用各种模型。但在我们进入这个工作流程之前,还有另一个大家都注意到的问题,那就是 open cloud 的 危险性, 因为它是在本地部署的,可以控制并在你的机器上执行各种工具。一个糟糕的提示或严重的漏洞,可能会在没有任何保护措施的情况下快速修改、删除或泄露文件。 我们都知道,技能可以增强 opencloud 的 子代理,而且像 cloudhub 这样的注册中心展示了你可以多么轻松地安装这些技能。 cloudhub 提供了由第三方社区成员制作的额外技能,但这些技能并不总是安全的。 事实上,有八千个实力直接暴露在互联网上的默认端口上,其中将近一半是社区构建的技能。 这些技能包含只在窃取数据的恶意指令。例如,我现在就在 skill hub 上。如果我浏览一个技能,很多这些技能都经过了社区的审核。表面上看起来很安全,但实际上有些技能可以窃取你的信用卡信息, 甚至是社会保险号码信。这技能被部署得看起来很安全,但在幕后,他们实际上在进行恶意操作,而且总是有解决办法的。因为有一家财富五百强公司 jen digital 推出了新的基础设施,正在推动 ai 安全的前沿发展。 这家公司也是本期视频的赞助商,这是一个完全安全的产品,我之所以这样说,是因为我自己真的用过。他们推出了一个名为 agent trusthub 的 新产品, 这是一款技能扫描器,可以自动检测并阻止任何关键威胁。这绝对是一个改变游戏规则的创新,因为它为你的工作流程带来了信任。我会演示如何设置这个工具,而且你可以很容易的通过 a p i 开始使用,也可以直接从它们自己的注册表中发现技能。现在, 我们实际上可以设置一个非常强大的工作流程,不仅可以直接在 open cloud 中使用 google 的 os, 这让你能够完全免费地访问最先进的模型, 而且你还可以利用 opencloud 的 功能,借助 opencloud 实现更快更简单的构建。本质上, opencloud 在 这个工作流程中成为了指挥中心,它能够自动做出决策,并通过 opencloud 的 代理分发任务,而 opencloud 的 代理则会调用为特定任务训练的专业代理。 换句话说, opencloud 负责规划和协调。而 opencloud 的 另一个开源且免费的代理则可以通过多个子代理来执行任务。你甚至可以将其与定时任务 cron, jobs 或专用命令结合使用,根据自己的偏好自动化定义在不同时间运行任务。 而且结果确实令人印象深刻,因为有人实际上用这种工作流将 opencloud 和 opencloud 结合起来,创建了一个漂亮且实用的 size。 这个项目就是用这种工作流构建的,甚至还部署了一个评审代理来进一步优化输出,把质量提升到了更高的水平。在开始之前,我们需要先满足几个前置条件, 其中之一就是确保你安装了 note 二十二 g 以上版本。请确保你复制这个 npm install 命令。把 opencloud 安装到我们的电脑上。接下来我们要做的就是打开命令提示符,然后直接粘贴刚才的 npm install 命令来安装 opencloud。 现在,在我的例子中,我会使用 google vertex, anti gravity 和 gemini 认证来为我的 opencode 以及 opencode 绘画提供支持。只要我有 google 账号,这些服务我都可以完全免费使用。要启动这个功能,你可以使用以下命令, opencloud plugins enable google anti gravity alt。 你 只需要复制这条命令,然后可以直接在终端中启用它, 所以你可以直接粘贴这条命令。接下来,你只需要用你的 google 账号登录,然后可以用这个命令来帮助你完成登录。 所以你会看到,当你粘贴那个登录命令后,它会提示你选择提供商。在这个例子中,我使用的是 anti gravity, 所以 我选择了它,然后它会提示你用 google 账号登录。就这样, 你现在就可以在 openclaw 中直接使用最先进的模型,并且让 openclaw 的 子代理由 google 提供商驱动。你可以使用 gemini 三以及现在的 op 四点六。要使用 openclaw, 你 只需要用这个入门安装守护进程,它会演示如何非常简单地进行设置。 我之前已经做过一个关于如何操作的视频,我会把链接放在下方描述里,但其实非常简单,它会引导你完成所有步骤,比如选择提供商,选择消息路由器等等。另外,我还看到 agent trust hub 也即将推出一键安全部署 open cloud 的 功能。 我强烈建议你注册这个服务,因为它比我们现在用的方法还要安全,所以按照入门步骤操作后,你应该就能让它运行起来了。 现在你基本上可以访问 openclaw, 然后让 openclaw 指挥 openclaw 的 这个 ai 代理去执行各种不同的任务。因为 openclaw 会作为大脑,而 openclaw 则负责处理和执行这些任务。 接下来我们需要做的就是前往 opencode 的 这个网站,然后我们需要安装 opencode, 我 会用 npm 把它安装到我的电脑上。 安装好并运行之后,接下来我们需要让 opencode 能够控制 opencode。 这意味着我们需要设置一个技能,让 opencode 能够控制 opencode。 你 会发现有很多技能, 但实际上并没有一个技能可以直接控制 open code。 不 过如果你去 cloud hub, 也就是技能注册中心,你会发现有一些技能可以帮助你用 open cloud 运行 open code。 在 这种情况下,如果你想验证这个技能是否值得信任,你可以复制它的 url, 确保它不是恶意的。 你可以前往我之前在视频中提到过的 agent trust, 你 可以向下滚动,你可以把它设置成通过 api 作为代理来检查某个技能。但因为我们是人类用户,其实可以直接粘贴这个链接,然后提交到 agent trust hub, 这个平台会帮你检查这个技能是否安全。 在这种情况下,你可以看到这是一个低风险的技能,并且它会说明这个技能实际上会对你的电脑做哪些操作,你甚至还可以提供你的电子邮件,以获取一份完整的报告。 大家这里已经有一些非常实用的技能了,你可以直接在 agent trust hub 上发现这些能够真正提升 open code 的 安全技能。说实话, agent trust 的 扫描器真的救了我一命,因为我刚刚在找一个能帮我控制 open code 的 技能, 然后我找到了这个,并且直接通过 agent skill scanner 粘贴进去检查了。你可以看到它实际上发现了一个技能, 这个技能会指示代理从外部网站下载并执行安装脚本,这本来会是一场灾难,那样的话它就会在我的电脑上安装恶意软件,基本上我就完蛋了。但我们要用的那个技能叫做 opencode controller, 本质上它会让 openclaw 通过斜杠命令来控制 opencode, 并利用这个技能来管理多个绘画。所以基本上 我可以让 openclaw 运行不同的定时任务,把各种类型的任务路由到 opencode, 甚至让它编辑文件运行一个持续的调试代理,确保能够捕捉到各种类型的 bug, 并且为我构建复杂的应用程序。为了再三确认,我特意用技能扫描器检查了这个技能是否有恶意,看起来它是安全的。所以我们现在可以做的是回到 cloud hub 技能, 然后我们可以打开一个新的终端添加。这个真的非常简单,大家要根据自己的判断来操作,要持续进行验正,确保你没有安装任何可疑的东西。所以我们要做的就是粘贴 open cloud skills add 命令, 然后再粘贴这个 cloud hub 技能的链接,你可以看到它现在正在出使化这个技能。现在如果你回到 open cloud, 只要你像我演示的那样正确安装, 你会在 workspace skills 里看到它。在这个标签下,你会看到 open code controller 现在已经可以在 open cloud 中使用,并且功能正常。顺便说一下,如果你不想用这个, 只需要点击禁用就可以了。但这正是 open cloud 的 妙处所在。现在有很多视频展示了如何轻松设置这个功能。你可以安排多个代理在不同的时间执行特定任务。 所以如果你有一个生产环境的构建,并且你想要有一个审核代理,确保他处于待命状态。并且如果出现错误,你可以设置一个任务,让他能够部署 open code 来解决问题,而你可能正在外出或者睡觉。 这基本上就是你可以自动化许多不同任务的方法。接下来我们会继续演示这个过程,但这只是你可以实现的一个想法。让我来展示一个简单的例子,在这个例子中,我会让它请求使用 opencode controller 技能。 该技能可以自动搭建一个基础的 nodejs 或 react 项目,安装依赖,并自动启动开发服务器或者是一个 crm 仪表盘。 在这里我们会让它创建自定义脚本,我们会让它把想法转化为代码。这一切都是基于 openclaw 里的文本提示来完成的。 另外顺便提醒一下,我想重生,你也可以在 opencode 里直接使用 google 认证以及完全免费使用 kimi k 二点五,目前它已经开始制定计划,准备如何实现这个 crm 仪表盘,以及如何用 opencode 的 编写代码。 它实际上正在询问一些事项,然后就会启动,因为我们开始编写这个应用程序的代码。就像这样, openclaw 能够将子代理部署到 opencode, 帮助我们开发这个 crm 仪表盘,效果真的非常出色, 各位,质量非常完美,因为它能够利用我的预设来构建出这个完整的 crm 仪表盘,而且这是一个真正可以运行的功能性仪表盘。并且它还添加了我一直想要的 crm 仪表盘配色方案。 这就是你可以用 openclock 控制 openclock 的 实现的效果,因为它能够智能地利用你的所有预设瞬间生成你想要的内容。在我看来,这为我们打开了许多不同的可能性, 因为你实际上可以自动化重复的编码任务,无需手动操作文件,只需使用消息路由器来部署 open code 代理执行这些任务。你可以运行 api 检查生成项目脚手架,甚至可以将多种技能无缝组合到工作流中。此外, 你还可以结合 open cloud 和 open code, 使用许多额外的技能来自动化各种不同的任务。这只是我展示的一个基本结构, 实际上可以自动化并在许多方面帮助你。如果你喜欢这个视频并愿意支持我的频道,可以通过下方的超级感谢选项进行捐赠,或者加入我们的私人 discord 群组。在那里,你可以每月免费获得多种 ai 工具的订阅服务, 还能获取每日 ai 新闻和独家内容,以及更多精彩内容。这基本上就是理想的工作流程。你可以把 openclaw 作为大脑,然后用 opencode 作为智能的开源 ai 编码代理,为你执行各种任务。 通过使用像 agent trusthub, openclaw, skill scanner 这样的资源,你可以轻松发现任何对你的电脑有害的恶意或危险技能。这样一来,你就可以非常安全地使用 openclaw。 我会把今天视频中用到的所有链接都放在下方描述区。好了,朋友们,希望你们喜欢今天的视频,并且有所收获。在我看来,这就是理想的工作流程, 既开源又完全安全。记得订阅我们的第二频道,加入我们的新闻通讯,加入我们的 discord, 关注我的推特。最后,别忘了订阅我们的 youtube 频道,记得看看我们之前的视频,打开通知铃铛,给这个视频点个赞。好了,朋友们,非常感谢你们的观看,希望你们喜欢今天的视频,并且有所收获。正如我之前说的, 我会把所有这些链接放在下方描述区。好了,朋友们,祝你们有美好的一天,传播正能量,我们很快再见!再见了,伙计们!

大家用 open curl 的 时候有没有发现一个问题,就是它只能操纵你的浏览器,只能给你的飞出这些发消息,它没办法进行这种 ui 界面的操作。 今天给大家分享这个项目 torx, 它可以进行 ui 界面操作,甚至可以直接打开你的微信给你发消息,也可以进行其他的操作。因为我们很多操作,特别是在国内,它是不那么 open 的, 所以说你很多东西其实联通不了 这个项目就能让你连通,它可以直接给你放在你的这个 torx 里面当成 skills, 或者当叫做是一个小的子智能体,你可以把任务下发给这个子智能体,让它去完成一些你之前只能在浏览器和 api 无法完成的一个任务。 我们来详细看一下这个项目哈,其实这个项目出来已经很久了,只不过最近他们发了这样一个技能,可以通过 open curl 去调用它。这个其实是一个紫智能体,我们来看一下它的一些操作,比如说预定酒店、机票、 uber 还有查东西,这些都是通过这种 ui 界面进行操作的,它并不是像它自带的这个浏览器,它是使用 api 或者说使用 playwrite 这种方式来操作的,这个是纯的这个 ui 界面操作, 我也找过这个 windows 呃的一个呃 skills, 但是它非常的不准,我还是用的是 g p t 的 这个模型,都非常的不准,其实很大的原因是它的 m c p 有 问题,或者那个 skills 有 问题, 所以说你直接用这个就是可以的。我下一个视频给大家评测一下吧,它的效果都还是蛮不错的,比如说这个是最初的,它也有一个模型,可以在它的官网去申请,当然你用在 g p t g p t 的 模型估计比它这个还要好一点。 就 kimi、 kimi 这些模型,它的多模态能力都还是非常不错的,而且它有这种 coding plan 的 呃,套餐,它还是很划算的,可能比它的这个还要划算一点,但是它这个模型可能比较小,这个速度会稍微高一点。

open code 这个开源项目最近很多人都在聊,说是 cloud code 的 平替功能呢,和 cloud code 也是一模一样的,所有模型都能用,但是对于我们普通人来说,我们要怎么用? 网上评测我看了不少,但是我还没有看到有人用它完整的演示一遍开发流程,所以今天我来做这个事情。 我会用一套平时我在 cloud code 上使用的开发流程,结合 open code 从零开始开发一个服装电商的模特换衣应用,带你走一遍完整的流程,顺便也测试一下它和 cloud code 到底有什么区别。那我们现在开始 这套方法我之前已经分享过两次了,就是这一期和这一期。现在呢,我把它迭代到了三点零版本。整体流程是这样的,首先用毒蛇产品经理技能收集需求,他会通过追问来完善细节, 然后生成产品文档。接着用 ui 提示词,设计师技能根据文档生成原形图的提示词,然后把提示词丢给 nano banana 生成原形图,再用 google ai studio builder 来开发前端,最后用全站开发工程师技能完成后端的开发和后续迭代。 整个流程是由一个主控的项目规则文件 agent 点 md 来进行统一的调度。这个场景包含了需求收集、原型设计、前端开发、后端改造、功能迭代,基本囊括了日常开发的主要环节, 所以用它来测试,基本可以很好地展示 opencode 的 完整的开发流程。打开 opencode 官网,点进下载页面, opencode 有 四种使用方式,在终端里使用,客户端使用、安装 ide 插件或者集成到 github 这类平台。 我们今天讲的是第一种直接在终端里使用, mac 用户建议安装第一条命令, windows 用户建议用第二条。那我是 mac, 所以 复制第一条命令,按 command 加空格,输入 terminal, 打开终端,把命令贴进去,回车直行, 然后等待它安装完成就行了。这里可能会有一点慢,那就看你网速了。好, open code 我 们已经安装完成了,接下来我知道很多新手看不惯终端的命令行,所以我们就在 cursor 里面启动 open code, 应该会对你友好一些。打开 cursor, 在 terminal 里输入 open code 启动, 启动之后有个快捷键,你一定要记住 ctrl 加 p, 按下去会列出所有的命令。大部分命令可以在之后慢慢熟悉,但有一个现在你就要知道,就是 a 键下面的 switch model 切换模型使用后你会发现有很多模型可以选, 像 chatgbt, 五点二, gmail 三 pro, mini max 这些都有,带有 free 标记的,是免费的。其他那些常用的模型需要你自己去配 api, 想用别家的服务,可以按 ctrl 加 a 添加供应商那支持的还是挺多的。配置也很简单, 比如你想用 google 的 api, 那 就选 google, 然后把 gmail 的 api key 贴进去就可以了。接下来我们来开始配置,这个逻辑和 cloud code 是 一样的, cloud code 的 系统文件夹是点 cloud, 那 open code 这边就是点 open code, 然后这是我提前准备的技能文件, ctrl c 复制,回到 open code, 在 点 open code 的 这个系统文件夹下, ctrl v 粘贴,这样就一次性导入成功了。一共三个技能, 独设产品经理、 ui 提示词设计师,还有全站开发技能。接下来是导入项目规则,在 cloud code 里,顶层的项目规则文件叫 cloud 点 md, 那 我们这次用的是 open code, 它的项目规则文件要写成 agents 点 md 文件名不同,但思路是一样的,都是顶层的项目规则。 回到 open code, 把点 open code 的 这个文件夹收起来,然后 ctrl v 粘贴,这样项目规则就导入了。 注意看 agents 点 md 这个文件和点 open code 这个文件是在同一层级的,这点跟 cloud code 不 太一样。 在 cloud code 里, cloud 点 md 是 放在点 cloud 的 这个系统文件夹里面的,这个很重要,放错的话顶层规则就不会被加载。再来看一下文件结构,这是整套开发流程用到的技能文件,是我平时开发应用和小工具时用到的,当时用的是 cloud code, 所以 cloud 点 md 这个名字没改。 不过没关系, open code 完全兼容,能自动识别好技能和项目规则我们都已经导入完成了,接下来我们来走一遍完整的开发流程,用 open code 来开发辅助电商用的模特换装应用,启动主 agent。 这套开发流程分为几个阶段,每个阶段都有对应的指令 输入 slash help, open code 会列出所有的指令,包含从需求收集、生成原型图、提示词到开发和本地运行的全过程。 接下来我告诉他开发一个网页应用,帮助服装电商生成模特图,支持更换模特的姿势动作,调整服装的配色,还能更换新的搭配方案。声控模型用 gemma 三 pro image preview, 也就是 nano banana pro。 收到需求后,毒蛇产品经理的技能被自动调用了,然后开始针对需求进行追问,上来就说,别给我废话,让我选一个核心,那毒蛇味已经出来了, gbt 五点二骂起人来也是不留情面。 我告诉他,目标用户是独立设计师,功能范围需要支持声图姿势调整、配色搭配和编辑功能。确认没问题后让他继续。 那进入到第二轮追问,他问参考图是什么形态,这是个多选项。那我的设想是,上传的参考图可以是模特的人像照服装平铺图,或者是搭配平铺图, 控制方式可以用 prompt 文字指令,也可以从姿势预选库里面进行挑选,同时还要支持配色面板调色。确认没问题的话我们继续。 好。现在进入到第三轮的追问,问的是账号和付费模式,这个工具是我个人用的,所以不需要付费功能。那存储方面,现在是 mvp 阶段,主要是为了快速演示,暂时不考虑保存,先跳过 确认没问题的话让他继续。好。接下来是第四轮的追问,人脸一致性怎么处理?我的想法是核心需求是保留参考模特的脸部特征,成片的标准是多选, 一个是白底电商主图,一个是澎湃的质感效果。确认继续后,这个时候他已经收集到了足够的信息,开始直接编辑产品需求文档了。 好!运行结束后,他帮我们创建了两个文件,产品需求文档, product spec, 还有变更记录 product spec change log。 先看产品需求文档,因为我们的需求比较简单,生图工具和布局交互也都比较常规,所以他没有问太多交互和布局的细节。 那再看一下圈子 log, 现在是项目的初试阶段,变更记录里也只有一条初试记录,接下来我们有两个选择,直接开始开发,或者根据产品需求文档去生成 ui 原形图的提示词。 原形图提示词是可选的,但我觉得这一步能大大的提升最终效果。正好给大家演示一下输入指令 ui, 让它使用 ui 提示词设计师技能,生成圆形图提示词 好,完成了,提示词保存在了 ui prompt 这个文件里。那我们打开看一下,这就是生成的页面原形图。提示词用法也很简单,直接把提示词复制发给 nano banana pro, 生成产品原型就可以。 目前一共生成了三个页面,主页面、图片预览页面,还有报错页面。接下来我还要做一件事情,这套流程有两种用法, 第一种呢,是生成好原型图后,直接把图发给他,让他在 open code 里面进行开发。那第二种呢,是用 google a s studio 里面的 build 来开发,本期我就会演示第二种,这种方法对新手或者是刚刚接触外部抠钉的人来说,更容易上手,效果也更好。 我告诉他,你先别管 apikey 的 事,我会用 google a s studio 开发前端,开发好了之后,我会把代码发给你,你再帮我改造成前后端分离的项目。 他已经明白接下来要做什么,怎么配合我们,而且还直接给了建议,比如用 google a s studio 开发的话,回来时需要教给他哪些内容,或者开发好了之后让 open code 继续迭代,需要提供哪些信息和资料好。原型图我已经提前生成好了, 现在这个页面是 google a s studio 模型,选的是 nano banana pro。 我 做的事情很简单,把刚才生成的三个页面的提示词完整的贴进去, 顶部加一句话,帮我生成一个三宫格竖向排列的长图,这是一套电商模特试装的网页应用,然后他就开始帮我生成原形图了。 那我们放大看一下,这三张图基本上是按照我们的需求文档里的布局和功能描述生成的,当然后面开发的时候, ai 会拿这个图作为参考,并不会完全的百分百复刻,所以这一点你要注意。为什么要用 ui 提示词来生成原形图?主要呢有几点核心考虑, 第一是速度快,外部口令不需要一开始就追求完美,先把架构快速的搭起来,然后后面再慢慢的迭代 ui 和交互。 第二呢是为了好看,如果你不给 ai 参考图,光靠文字描述让它开发出来的页面通常都很丑,不管你提示词写的多好,在我看来都丑的要命。 所以用 nano banana pro 直接生成原形图设计其实很好,再结合我们这套方式,页面好看,功能呢也符合我们的产品需求,一箭双雕。这就是为什么我觉得这一步非常重要,想要给大家看一下。 好,那原形图已经有了,接下来我们打开 google a s studio, 先开发前端,我们先完整的复制一下 prods bike 里面的产品需求,然后回到 google a s studio builder 告诉他,让他帮我开发一个模特换装的应用, 先把 products back 整个贴给他,然后把刚才生成的 nano banana pro 的 原型图也贴上去。 ai 能力选择这边我们选择 nano banana powered app 和 generate images with nano banana pro, 因为我们的应用需要生图能力,必须调用 nano banana 检查没问题,点击 build 开始。接下来它会自动读取文档和我们发过去的截图进行开发。所以我们稍微等待一下 好,开发完成了。有几个注意事项,第一,记得右上角选择一下你的 gemna api key, 否则无法使用 gemna 三 pro 或者是 nano banana pro 这些付费模型。第二,我们来看一下界面的还原度, 那开发出来的界面和原型图已经有九层相似了,布局,色盘选择,模特姿势这些功能都有。好,我们来测试一下。先上传一张模特图, 再上传一张 gucci 的 最新的女装,一条红色的裙子,风格选择澎湃风格,输出四张模特姿势,选动态走路提示词就先空着,先不填,我们点击生成 好,生成完成了。放大看看,模特的真实感几乎无可挑剔,澎湃的风格,无影墙,走路姿势,人物和衣服的还原度都很好。接下来看一下代码,点击 code, 这就是他开发的所有的前端代码。把代码打包下载,然后找到刚刚我们下载的代码, ctrl c 复制,回到 open code, ctrl v 粘贴代码就导入了,然后告诉 open code 前端已经开发好了,代码放在了这个文件夹里, 这个时候他会问原型图有没有,你需要提醒一下他前端已经开发好了,直接看代码就行。后端部分他建议用 node 加 express, 但我决定选 next, 点 j s 看看他怎么处理, 确认没有问题,让他继续执行。等待开发的时候,顺便说一下,为什么我们要前后端分离。 google a s studio builder 开发出来的是存前端代码, api key 是 直接写在前端里的,那这样部署上线 api 就 会暴露,任何人都能看到。所以我们需要把 api 调用挪到后端,前端只负责界面和交互, 而且后端除了负责调用 api 以外,我们后面迭代的时候,比如要加全线连数据库,或者是业务逻辑,这些也都需要放在后端的 好开发完成了。不过它提醒我们,我们发给他的前端代码的基础是 vt, 不是 next 点 gs, 所以 这一版它用了 express 做后段,因为这是最小的成本,最小的改造方案。但如果我们坚持要移到 next 点 gs, 它也是可以帮我们执行的, 那到这里项目基本就快速完成了。所以接下来我直接输入指令 slash run, 让它在本地跑起来。 ok, 我 们可以看到项目它说启动了,但是显示的状态不正常, 不过没关系,他说他可以帮我们定位和修复好。修复完成了,原来是三千,这个端口被我另一个项目占用了,那他帮我们改成了三零零一端口启动, 如果你想随时停止,可以输入 slash stop, 就 会停掉后台的所有的服务。 ok, 项目启动了,界面功能布局都保持了原样,没有什么问题。 项目虽然跑下来了,但是我们不可能一步到位,所以接下来我们来测试一下迭代功能,我要给他加一个新的需求,我告诉他我想增加一个在页面上配置 api, 并且进行校验的功能。那针对这个功能,他开始追问,首先问我 api 怎么保存,那我选择肯定是存在后端, 然后问我校验的方式,这里我选择的是真校验,需要他发个请求,看看 api 能不能跑通, 确认没有问题,开始开发。顺便说一下我使用的这套开发流程,产品经理和全站开发这两个技能会循环配合,每次新增或修改功能,主 a 阵的会先调用产品经理技能,进入到迭代模式,通过追问补充并且更新产品需求文档和更新日期, 然后才调用全站开发技能去实现代码。这样做的好处是文档始终和代码保持同步,不管是日后自己回顾还是重新开窗口让 ai 接手,都能快速的了解项目的全貌。好,完成了,他说已经更新了产品需求文档和更新日期,那我们看一下更新的内容。 产品需求文档这边第四十九行辅助功能下面插入了 gmail api 保存交换的需求。再看圈趣 log 这边新增的 v 一 点一版本,内容是配置 api key 和交换功能。我们回到网页,应用,左下角已经出现了配置 api key 的 功能,我把我申请的 gmail api key 贴进去, ok, 交换成功,没有问题。好到这里,我们整个的开发流程差不多就走完了。最后我来聊聊我用下来的感受。 先说优点,第一,模型自由度非常的高,这是 open code 的 最大的优势。 cloud code 您只能用 cloud, 对 于使用其他的模型,它基本是严防死守。 open code 呢,你可以随便切换,想省钱就用免费的模型,想要效果更好就换 cloud 或者是 gbt 五点二,灵活很多。 第二呢,是整体的体验和 cloud code 非常的接近,指令逻辑既能加载开发流程,基本和 cloud code 是 同一个思路。 如果你用过 cloud code, 那 上手 open code 几乎没有任何学习成本,不过缺点也是有的, open code 是 开源项目,在使用 agent 或者 skill 的 时候稳定性就会差一些, 特别是多 agent 协助主 agent 调用 sub agent, 或者是主 agent 调用 sub agent 在 调用 skill 的 时候,这类场景复杂的话, cloud code 的 表现依然是最稳定的。 但总的来说,如果你预算有限,或者是想尝试其他的模型, open code 目前是最接近 cloud code 的 开源替代方案。而且说到底,工具本身作用其实有限,真正起到决定性作用的是你在用的那个模型,这才是最重要的。 好,以上就是本期的全部内容,如果对你有所帮助,别忘了点赞以及加入废台俱乐部,这对我们频道真的非常重要,那我们下期见。

在二零二六年, open code 和 openwork 可能是我们个人 ai 使用者能够用到的性价比最高的 ai 智能体工具了。在个人日常办公、文件处理、数据分析以及报表生成、 ppt 生成这些领域, open code 是 真的能够直接接管你所有工作的工具, 支持 m c p, 也支持 ansapic 最新发布的 agent skill 功能。同时它还支持市面上几十种 ai 大 模型,还提供大量的免费 ai 模型供你使用。 哪怕你想尝试 ai 编程, open code 也是功能强大且性价比最高的工具。那么今天我就来为大家介绍一下如何安装和使用 open code 这款的 code code 的 工具,以及 open work 这款对标 co work 的 开源个人办公助手。 今天的视频分为以下几个内容,首先我们来快速安装 open code, 包括命令行和桌面 app, 然后了解一下如何做相关的环境设置以及添加 agent skill。 然后我们来安装 openwork 这款开源版的 cloud co work 工具,并熟悉一下相关的设置。最后我们来快速了解一下大模型的选择以及 token 的 消耗相关问题。视频中的内容和安装步骤我都整理成了知识笔记,视频的最后会分享给大家,那我们就正式开始。 opencode 的 安装非常简单,因为它不像 cloud code 那 么避远,而 sapic 对 cloud 的 使用有非常严格的限制,大多数情况下,我们还得通过配置环境变量来使用第三方 ai 模型, 而 opencode 的 不用。它的安装方法非常简单,直接到它的官网下载桌面客户端下载之后双击安装即可。如果你习惯命令行工具,也可以直接通过命令行命令行版本,具体的命令在它的官网上都有。 安装之后打开桌面客户端,选择你的项目文件夹,然后我们就来到了项目界面。接下来我们要做的第一件事就是选择一个 ai 大 模型, 我们点开选择模型这个按钮,在弹出的窗口中可以看到模型列表,其中最上面列出的是目前提供的免费模型,我们先选择一个免费模型,这里我们选择 mini max m 二点一。 然后在 ai 对 话框的左下角有一个 build 和 plan 的 模式切换按钮,那这两个有什么区别呢? build 的 意思就是直接建造, ai 会按照你的要求直接修改文件、编辑代码、删除文件等等。 而 plan 就是 做计划,先进行分析和规划,但并不会真的动手去做,等你先确认 ai 给你的规划你满意了,再切换到 build 模式去进行实际操作。 build 和 plan 是 两个默认的智能体,我们还可以通过配置文件来添加自定义的智能体,这个我一会儿会说到, 那么这就是 ai 对 话框的两个设置项目。接下来我们要了解几个核心的技巧。首先就是斜杠命令,在 ai 对 话框中输入斜杠就能看到斜杠命令了,比如斜杠 init 是 促使化项目并创建 agent 点 m d 斜杠 m c p 是 打开 m c p 列表,查看你已经连接的 m c p 服务,这里呢就引出了下一个核心技巧,也就是配置文件。我们通过斜杠以 n t 出示话来创建的 agent 点 m d 文件是项目特定的配置文件,比如项目结构、编码规范、命名规范等等, 这些大多数都是和编程有关的,如果你不写代码,而只关注个人日常办公和文件管理的话,不用关心这个。另一个文件就是 open code 点 json 这个配置文件。这个配置文件所在的位置是你用户目录下的点 config 文件夹下的 open code 目录下, windows 就是 c 盘 user 你 的用户名,然后找到点 config。 而 mac 用户是你用户主目录下的点 config 文件夹。要注意, mac 上带点的目录默认是隐藏的,你要使用 command 加 shift 加点,把它们显示出来。 这个 open code 点 json 文件或者是点 json 文件,就是 open code 的 核心配置文件了。点 json 就是 json with comments, 就是 带有注视的 json 文件,本质上就是 json。 那在这里我们可以配置 mcp 服务以及自定义 agent。 我 目前就配置了一个 notion 的 mcp 啊。 notion 的 mcp 也很简单,是 notion 官方发布的,我之前的视频有讲过, 我还自定义了一个叫 smart build 的 智能体,并设置了系统提示词。那这样一来,在 ai 对 话框中,你除了能看到 build 和 plan 这两个默认 agent 之外,还能看到你自己配置的 agent。 有 关 open code 点 json 这个配置文件的详细写法,大家可以参考 open code 的 官方文档。 那么关掉 open code, 点这一次文件,在当前这个 open code 文件夹下,我们可以创建一个 skills 文件夹,然后把我们从 github 上下载的 skills 复制进来,那么我们的 open code 就 安装上这些 skills。 其实和 cloud code 是 非常相似的, 我目前也是安装了很多日常工作相关的 skill, 比如 word, excel, pdf, 还有无线画布、 comics 相关的 skill。 那 关于 skill 我 之前的视频也讲过,那么到此我们就完成了 open code 的 所有配置。那总结一下,安装完 open code 后, 选择一个免费的 ai 模型,然后在用户目录下的点 configure 文件夹下的 opencode 文件夹里创建一个 skills 文件夹,把你常用的 skills 复制进来,你的 opencode 就 已经是完全体了。那至于 mcp 和自定义 agent, 按照你的需求到 opencode 点 jc 文件里添加就可以了。 那具体的使用,我在屏幕上快速地做一个展示,比如输入一个指令,让智能体调用相应的 skills 来为我们进行英文文档的翻译,并拣写成中文的知识笔记。还可以读取 rss 订阅,并通过 notion mcp 把获取到的 rss 信息导入到 notion 数据库中。 还有一个最便捷的使用场景是直接把 github 上的开源项目的项目地址发给 opencode, 让它来帮你安装在电脑上,那这样你就不需要自己亲自去阅读这一大片英文的 readme 文档,那非常的方便。 但是归根结底, open code 还是一款侧重于编程的工具,和 cloud code 是 类似的,但是在我们日常工作中用的最多的就是办公场景,比如文件的处理、数据分析、办公流程等内容。那么这里最好用的工具就是 openwork, 它是在 open code 的 引擎基础上构建的桌面应用程序,和 cloud 最新推出的 codewalk 一 样,针对非技术用户和日常办公场景进行了大量的优化,有非常好用的图形化界面,那使用起来几乎没有什么难度。接下来我们就来快速安装一下 openwork。 我 们来到 gitlab 的 openwork 仓库,点击右侧的 release 链接,在列表中选择适配自己操作系统的安装文件,下载之后双击安装即可。 然后打开 openwork, 首先还是选择一个文件夹,这个文件夹就可以选择你日常办公的文件夹,比如放置你的报表和 ppt 的 文件夹,也可以是你的 obscene 知识库。文件夹 打开之后,我们点击 new task 按钮,就可以开启一轮 ai 对 话了。当然我们还是要选择一个 ai 模型,我们依旧选择一个免费的模型。 mini max m 二点一 这个时候我们在右边的菜单栏能看到一些内容,包括已经连接的 m c p 服务、已经安装的 skills 以及已经安装的插件等等。 我们先点击左上角的后退按钮,回到主页面,在左侧菜单栏中就能看到一些设置选项,比如我们点击 skills 就 能看到已经安装的 skills, 还可以点击导入按钮来导入你下载的 skills, 或者直接打开 skills 所在的文件夹。 那这样的图形界面是非常一目了然的,比之前的 open code 界面要直观很多。我们点击左侧的 mcp 选项,页面中就显示了你所连接的 mcp 服务,它默认给你提供了一些 mcp, 比如 notion, stripe 这些。 把滚动条拉到最下面,在 edit mcp config 里就可以编辑我们刚才说过的 open code 点 jc 文件了,那这里我们就不多讲了。 然后在 plug ins 界面,我们可以安装一些插件,这里我推荐一个 github 上名字为 awesome open code 的 仓库,里面收集了大量的优质 open code 插件, 把插件的名称复制到 openwork 的 plug ins 界面中的 add plug ins 文本框内,然后点击 add 按钮就可以添加插件了。 比如你可以添加一个 google ai 搜索插件来增强 opencode 的 网络搜索能力。再比如,你可以添加 gemini 身份验证这个插件,来让 opencode 能够使用你谷歌账户中现有的 gemini 套餐的额度。 我们都知道谷歌的 ai 订阅用户会有大量的 java c l i 和 anti gravity 的 ai 额度,那通过这个插件就可以使用 java c l i 的 ai 额度。假如将来 open code 不 再提供这么多免费的 ai 模型,那么这个插件可以让你使用你的 java c l i 额度来进行智能体操作。 同理还有 open ai 的 codex 认证插件,原理也是一样的。这个仓库里还有一些其他资源,比如魔兽争霸通知音效插件,再比如一些 open code 的 皮肤主题, 大家根据自己的需求来使用就可以了。那如果你是 opcode 用户,你可以搜索 opencode 横线 opcode, 这个插件能够让你直接在 opcode 界面中使用 opencode, 那么到此我们就完成了所有的环境配置。回到我们刚才的 ai 对 话框,就可以发送指令让智能体来为你执行任务了, 我们由 skills 来为我们执行特定的任务。还有 m c p 连接外部系统,比如 notion 推出云文档、微软 office 三六五和 autodesk 邮箱等等。 我们的 openwork 现在是真正意义上的核心枢纽,连接你所有的工具。所以我才说 openwork 和 openwork 可能真的是你二零二六年的主力 ai 的 工具了。 那最后我还是来讲一下 token 的 问题,智能体的操作非常的消耗 token, 所以 最近很多 ai 厂商都推出了一些套餐,比如智普 g l m 和 mini max 都推出了 coding plan, 几个小时之内允许你发送特定数量的请求。 还有就像我刚才所说,我们可以通过插件来使用 gemini c i 或者 codex 的 ai 额度,尤其是谷歌 gemini, 那它的编程工具呢?做的不咋样,但是得益于它自家土豪般的 tpu 和语音服务,它的 ai 额度还是非常慷慨的。所以如果未来有一天 opencode 不 再像现在这样提供这么多免费的 ai 模型,那么大家就可以考虑我刚才说的这几个途径来以更高的性价比来使用 opencode。 另外 opencode 还支持连接本地大模型,比如 alamo 和 lm studio。 本地大模型的优势是极致的隐私性,但是性能还是比不过云端大模型的。另外还比较吃电脑的配置, 以我之前视频中大家给我的留言来看,很多人的电脑性能并没有那么的好,部署本地大模型还是比较吃力的, 所以大家还是根据自己的实际情况来选择适合自己的大模型。那么到此今天视频中的内容就全部结束了,大家现在就可以开始安装部署自己的 ai 智能体了。那具体的安装步骤我整理成了文档, 大家可以在我的频道信息中看到我的个人主页地址,然后直接去下载就可以了,有任何问题都可以给我留言,记得点赞关注,谢谢大家!

这是我被 cloud code 封的第三个号了,申诉也没有用,我现在已经准备放弃官方订阅了,不想折腾了。那 open code 一 直很火,最近我也在开始用它了,尤其是 cloud off 四点六和 gpt 五点三 codex 出来之后, 我现在是多个模型配合去干活。那发挥每个模型的优势,用四点六去做架构设计,用五点三 codex 去做代码执行,如果有前端的一个 ui 需求的话,再拿 gmail 三点零 pro 去做前端的一个 ui。 那 opencode 到底是什么呢?用一句话,它其实就是一个开源版的 curlcode, 功能上的话两者差不多,但 opencode 有 一些独特的优势,就是它是一个任意模型,你可以支持多家厂商的, 你也可以用国产的,你也可以用国外的模型都支持。第二点就是代码完全开源免费,这一点非常重要,你可以自己去改,自己去定制。同时代码开源之后,那开源社区的人就可以去围绕它做很多功能,毕竟人多力量大嘛。比如这个插件 opencode, 这就是社区去搞的,现在已经三十 k star 了。 这个插件其实是一套多 agent 多魔性去协助干活的一个插件,最近我体验下来也挺好用的。它这边准备了十个 agent, 有 主控 agent, 有 去专门干代码的,专门去探索代码的,也专门去做前端 ui 的, 挺好用的。 open code 整个的架构的话,其实跟那个 cloud code 差不多,用户输入成有绘画管理嘛,然后有 agent, 有 plan 就 计划,那 kolco 的 那边也有,那有 build 就是 直接干活的嘛,还有些探索的,其实 kolco 的 那边不是都有吗?以及你制定一些 agent 都有,那调度层这边就有些差别了。关于大模型的调度,因为 kolco 的 那边他只支持 angelic 协议的嘛,那这边的话就是实现了一套支持其他各种供应商的整体的架构的话,其实有很多值得学习的地方,如果大家对 kolco 感兴趣了,可以去他官方原码仓库去拉下来去学一下,那个仓库现在已经一百多 k 了,特别火。 那下面就是这个 oh my open code, 这个是我们今天讲的重点,因为他这一套多 a 镜的多模型的一个机制, 能让一个任务去拆解成各个阶段去开发,有复杂的用复杂的模型,简单的用简单的模型,这种才是一个 理想状态下的一个写作的方式嘛。那它本质上就是我刚才说的,它就是一个插件,通过 open code 暴露的一些钩子去拦截这一个 ai 的 一些行为,它的整个工作流程就是来一个用户输入之后,它去拦截 open code 的 一些钩子,这时候去做一些增强上下文呀,或者去选择多 a 帧特有可能是多个模型去协助,最后返回结果整体的一个流程就是这样子的。 那为什么需要多个代理?哈?他这边说的一个说法是专业的代理去做专业的事情,然后规划和执行分离,可以并行执行,按需去选模型,并且节省成本。那他现在这一个多代理的话, 就像最近 cloud code 新出的那个 agent teams 一 样,只不过 cloud code 它是很久很久之后才出的嘛,这个是老早就有了 omago code, 那 下面是它的一些 agent 的 一个分工,这一个是它的一个主要 agent 是 用了 cloud 的 off 四点六这个模型。 还有一些规划师就是在规划方面以及编排方面,他用的卡尔的最顶尖的模型,那代码磁性这一块的话是用的是 gbt 五点三 codex, 如果是一些比较轻量的任务,你可以用 gm 啊,或者 mini max 啊,以及其他都可以。那些前端这块的话,他用的 jimmy 三 plus 或者 pro, 这样子的话就一个任务进来之后他由这个去规划,规划完了之后,他让 jimmy 五点三去做执行,然后发现有前端任务,他这个时候就用 jimmy。 如果涉及到一些小修小改啊,比如说是一些国际化处理啊,多语言处理,这个时候它就完全可以用很低的那种模型去做这个事情嘛。这样的一个搭配其实我体验下来挺好的。 好,下面我们就开始分别去安装 opencode 和 oemopencode 的 这个插件。桌面端它现在也支持了,支持 macos、 windows、 linux, 我 体验下来的话,它有一些断流的情况,所以说我更推荐大家在使用 cio 版本,我们先来安装一下。 好,它提示我们已经安装了,我们来进去看一下,我们先切到一个免费的模型,你上面搜一个 free 这些模型的免费,我就用 mini max m 二点一吧,我们输入一下测试一下,看它安装好没有。 ok, 如果看到这步就证明你 open code 已经安装好了,这个时候我们就有安装那个插件,因为现在在 ai 时代,其实你安装东西都非常方便,尤其是它如果有文档,有开箱库的话, 你看这一个插件哈,欧麦 opencode 的 一个官方仓库里面直接就告诉你了,你直接用 qq 编辑的去装就行了,我就把这个复制一下,然后粘到刚刚我们开的这个 opencode 的 里面,用免费的 mini max 让他给我们去装,那下面就是他会弹出来让你做一些选择, 可以看到他让我们回答一些问题嘛,你有没有订阅 cloud code, 有 没有订阅 openai, 有 没有一些 jimmy 的 一些 model, 你 就根据自己的情况去选择就行了。强烈建议你不要在 open code 里面去用 cloud 的 模型,通过订阅的方式去用封号的概率非常高。那这边我就说都没有, 待会我也给大家一个配置,直接就可以用了,你只需要去搞一个 api k 过来,你就可以直接把这些模型都用上了,这时候我们都说都没有就完事了,因为这个配置后期都可以去改的。可以看到我们把插件安装成功之后,下面的这一个 a 镜头就变了,变成了 omone code, 它的那一套多 a 型的体系,可以看到它有好几个 a 型的体系可以去用,并且 这个插件那还有个好处,它的兼容性做得比较好。它已经把 cloud code 那 边你有的一些 skills, mcp, 还有那些自定义的命令全部弄过来了,比如说 skills 可以看到我的那些 script 它全部弄过来了,这样非常好。也就是说你可以来回签嘛,你有时候你要回去 copy 到那边用也可以。现在我们开始配模型,你可以通过 connect 这个命令去连接你想要的一些模型, 如果你有恰当的 gpt, 里面就选恰当的 gpt, 你 有其他的你就选其他的。那我这边的话,平时会用 jimmy 三点零去写前端嘛 code, 四点六去写架构和具体的一些代码,然后 gpt 五点三 codex 去做一些代码之星,以及解决一些疑难杂症。我喜欢用每一个模型擅长的能力哈,但是对大家来说的话,你如果像我一样去订阅三家的 ai 模型,其实你要花三分钱。我 订阅的一百刀的 code code, 然后今门来我订阅了两个号,一百四十刀, open ai 我 订阅了二十刀,那加起来就是一百六十刀。并且哈,我们刚也说了,如果你用 code code 的 去 授权到这边 opencode 的 去用的话,你封号的概率特别高。之前我还出了一期视频,专门去讲这个 curlcode 的 大面积去封禁 opencode 的 用户的一个事件, 因为刚开始他是不管的,后面他发现这个 opencode 的 日渐壮大之后,他就开始封禁了,你就不能授权到这里面用。 所以如果你要在 opencode 里面去用 cloudof 四点六的一个模型,我建议大家去用中转站,通过按 api 去计费用多少就算多少。那我这边推荐一个我一直在用的中转站接口 i, opencode 的 这边也已经支持了接口 i, 也就官方支持了嘛。 那前面几期视频我也推荐过,如果我要用到一些国外的模型,按 api 调用的话,我都用的是接口 i, 挺稳定的。最关键的一点,你不需要模仿网络,而且是国内付款的一个方式。 最近他们还专门针对海外的顶尖模型增加了一个套餐的方式,也就是说你可以用一份钱去用国外这些顶尖模型呢,目前有三个档位哈,可以按自己的一个需要去选择,相较于官方 api 按量计费的话,这一个套餐模式帮你省了百分之二十五的钱。 好,下面我们先来去创建一个 api key, 在 这个地方新建,我就随便取一个,我们就取 opencode 的 点击复制。这个时候我们回到 opencode 的 这边 附着 apk 之后,我们供应商选择接口,点 ai 敲击回车,把我们的 apk 输入下,然后保存,这时候你可以看到国内国外的模型都可以用,用一个 apk 你 就解决了多模型的一个适配问题。好,下面我们来进行一些其他的配置。 当你安装完 open code 以及欧曼 open code 插件之后,你会在你的工作目录下面点 config, 下面有一个 open code 目录,这里面有两个节省的配置文件,一个是配置 open code 的 一些模型的,另外一个是配置我们这一个 多 a 帧的协助的时候,它具体用哪些模型。这边的话我给大家直接准备了现成的,你直接到我的一个开源仓库里面直接去复制就可以了。下面来我这一个开源仓库里面,直接把这两个配置可以复制一下,把它粘过去就完事了。 好,我们把它覆盖一下保存,再把 omecode 的 也复制一下回来点击复制。 那这一块的话,你可以根据你自己的需要哈,因为 gpt 五点三这一个扣袋子模型的话,官方是没有出 api 的 版本,那后续如果 open i 那 边出了 api 版本接口, i 这边也会跟上,你就根据自己的需要嘛去看这块要不要注视这个内容,我们来复制一下。 好,我们把它覆盖完了,覆盖完了之后,我们重启一下,你就可以看到 color 的 open 四点六已经可用了, 就这几个 a 帧的,它配置的模型都可用了。那下面我们开始进入实战的一个环节,有了 o my open code 插件之后,我们看一下多 a 帧多模型协助的一个流程。我这边有一个纹身图的 a 帧,我希望让它去加一些功能,在这边加一些删除的动作,能把历史记录删除掉,同时在左下角 做一些设置的动作,可以去更新你的一些头像啊,以及我们那些历史提示词,能支持去快速的复制展开开干, 那提示词的话也比较简单,我们这边加一个 alterwork, 让它去更深入的去工作,去分析。 好,我们切到 opencode 这边,这个就是它的整个架构 agent, 它用的是 off 四点六,那这个的话是干活的 agent, 它用的 gpt 五点三,还有些其他的 agent, 也就说它是多 agent 多模型去写作的一个流程。好,我们把提示词粘过来让它干活, 这里提示 autowork 已经开启了,这个时候可以看到它开启了一个探索的沙背 a 技能吗?用的是很便宜的一个模型,这个过程就跟在 clockcode 的是一样的,这里又开了一个新的, 可以看到它一直在开一些新的沙背 a 技能的任务去做探索。啊。好,这里又开启了一个计划的 task, 也就是一个沙背 a 技能,我可以点进去看一下它在做什么, 可以看到他就是把已有收集到的一些代码信息,整个代码空间来去做一轮分析,让这个 off 四点六做一个计划出来,这个时候他这一个主要的协调 a 技能在等,等他这个后台的这个计划任务完成完了之后,这个时候他再去协调其他的 a 技能去干活。 可以看到它这一个经过几轮的一个探索之后哈它得到了一个突突像,那这个突突像的话,它根据后端、前端以及一些小需求拆成了很多突突像,这个时候它就开始去并行执行修改任务了,可以看到它这里又开启了几个 safari 的。 有一个点要看的话是他的这个三倍镜,他开的时候,他其实这个时候是用的 jamal 三 plus 这个模型,也就说他认为这个任务其你根本就没必要用一个很高的模型去做这个事情,所以说他默认给你路由到了一个简单模型, 它这种规划任务的方式就能把模型最大化的利用起来。复杂的任务用复杂的模型,简单的任务用简单的模型就很完美。可以看到它开始去执行 t 四跟 t 六这两个任务了,而且它依赖关系也找出来了。这个就像前两天发布的 cloud agent teams 的 一个写作流程,只不过这个是老早就有了这个插件老早就有了这种多 a 的 写作,最终被 cloud code 写到一个官方的库里面去了。 然后他们那种通信机制就跟爱信的 tim 是 很像。哎呀妈这个系统通知 coco 的, 其实他很多方案是借鉴了社区的,因为社区搞出来之后, 他觉得确实是 ok, 可以 的,那他就把它集成到 coco 的 里面。所以这 coco 的 从它诞生之后的很多功能迭代都参考了开元社区的一些做法,而且他的也在他的一些技术博克里面有,感谢一些开元社区的人提供了一些解决方案。 就像你做产品一样,你产品迭代的过程中,你光靠产品经理去,有时候发觉不了用户的一些真实的需求,那真实的需求暴露出来之后,社区他就解决了,那你就可以去把一些已经解决的痛点的问题提升到自己的产品里面。 可以看到这所有的凸凸像它全部完成了哈,包含三个任务,我们现在来看一下它整体的效果怎么样。首先是左侧的这个删除功能好,确认删除 ok, 确认可以,并且弹窗也是正常的。其实我们看这个可以复制已有的提示词, 可以复制折叠展开是 ok 的。 下面就是这一个左下角的设置,可以去更新昵称跟头像这一些啊,可以看到他这边其实也做好了。 好,我找一张图像试一下看可以吗?前面加一个我的名字吧,看可以吗? 可以,已经保存了。可以的,这个看起来他做的挺好的,英文啊,英文设置也是 ok 的, 多源设置也是 ok 的。 整体这一次任务的话,他全部搞定了呀,就是虽然不是特别难的,但是他协调了多个 a 镜的去干活,而且都能交付的很完美,中间我没有做任何的介入, 所以说这个工具啊,真的推荐大家去用一下这个多 a 镜的协助真的挺好用的,下面我来总结一下。使用 open code 再加那个插件, open code 再配合你用一个接口外的中转站,可以做到 模型自由稳定,省心,你也不怕被封号。第二个的话是成本灵活,这就是今天所有的视频内容,如果你觉得这期视频对你有帮助的话,可以给我一件善良,谢谢大家。拜拜。拜拜。

现在我用手机也能连上我的 ai 操作系统了,这套系统跑在我家的 mac 上边,当我出门在外的时候,只要打开 discord, 就 能像跟却 gpt 聊天一样跟它对话、查文档、联网搜索、改文章,它都在后台悄悄帮我搞定。 先介绍一下这个系统,很多新来的小伙伴可能不太清楚,它由两个部分构成,第一, open code 加 newtype profile 插件。你可以把 open code 理解为是开原版的 clock code, 而 newtype profile 插件则是我专门为了内容创作和日常思考而定制的多 a 卷编排系统。 它里边有我的方法论,有我的工作流,还内置了五个我专门创建的 skills, 所以 这套东西是我 ai 操作系统的框架。 第二,在这个框架之上,我把自己沉淀了好几年的内容仓库给接进来了,我所有的产出都在这个仓库里边,包括笔记、视频脚本、 news letter。 对 于 ai 来说,这些东西既是参考也是约束,这样它才能成为我的系统。这一整套的 ai 操作系统已经完全承包了我日常的所有输出。但是啊,这个系统还有一个限制,它只能跑在桌面端, 当出门的时候,我只能在 iphone 或者 ipad 上面使用 gemine。 这种割裂就导致我面对的其实是两套系统, open code 和 gemine, 它们分别存储了两套数据,两套记忆。 这是违背我整体的原则的。我认为对于用户来说,在 ai 时代最有价值的是你的记忆资产,这个必须抓在手里,并且长期积累。 我之前特意给 newtype profile 插件添加了记忆系统,分成了长期记忆和短期记忆两套机制,把它们全都传成 markdown 文档就是为了这个。不过好在前两天这个问题被解决了,手机上的 discord 和 mac 的 open code 彻底打通。 而这一切的实现都要归功于两点,第一, opencode 的 服务器模式。一旦开启这个模式之后,它会把 opencode 的 核心功能包装成一个后台的 http 服务器,你直接通过端口调用, 简单来说就是把你的 opencode 变成了一台服务器,完全不需要走前端的操作,全都走后台的处理。第二, discord bot 这个机器人其实是一个传声筒,一方面它在前端,也就是 discord 频道内跟我交流,那另一方面,它在后端,也就是在 opencode 服务器内边进行数据的传输。 也就是说,机器人接到我的需求,拿给 open code 的 处理,然后再把结果拿回来给我。就像职场里的很多人一样,假装功劳都是他的,都是他做的。但其实啊,都是后边团队搞的,他只是面向老板的一个交互界面。要创建这样一个机器人非常简单,我全都是让 ai 帮我写的, 我只需要到 discord 开发者后台去创建一个 application, 然后把权限都勾选上,把 token 复制下来就好了,剩下都让 ai 去处理。为了方便使用,我还让 ai 帮我写了一个脚本,双击运行之后,它会自动把 opencode 的 服务器模式开起来,然后把机器人给运行起来。 以前出门的时候,我只能用通用的 ai, 它跟我的系统是断开的,那现在不一样了,我的方法论,我的记忆,我的工作流,走到哪里都能调用,这才是我想要的 ai 操作系统,不是某一个 app, 而是一套跟着我走的基础设施。 在这套系统的帮助下,我的内容生产效率至少翻倍了。这个是我每天都在用的东西,也推荐给大家。 ok, 以上就是本期内容,想了解 ai, 想成为超级个体,想找到志同道合的人,就来我们 newtype 社群,那咱们下期见。

看好了,不登录、不绑卡,没有网络问题,国内顶尖模型免费用!打开终端,输入命令,敲下回车,立刻就能开始生成代码,这就是能力比肩 cloud code 的 同时,完全开源,完全免费,完全开放的 ai 编程界新星 opencode, 全平台支持安装使用超级简单,全部只需要这一行命令就可以完成。 mac 下还可以用 homebrew 安装。官方网站有非常详细的功能说明和完整的配置项列表可以供我们参考。 如果你不想看英文的话,也有这个中文站,有完整的官方文档翻译,可以帮助我们快速的上手使用。更加劲爆的是, open code 完美支持 cloud 的 agent, 直接把 md 文档复制过来,立刻就可以使用。 所以最最无敌的是社区还有这个 o my open code 的 插件,提供了开箱就可以使用的赛博研发军团。 看看这些真实的用户反馈,下一期视频,我来介绍一下他的详细用法。当顶级的工具已经免费并且极低门槛就可以使用的时候,决定你和高手之间的差距,就只剩下行动力了。不要收藏了,现在立刻马上就去把它安装起来,用起来!关注我,带你玩转 ai 编程!

我用一套全新的工具链,外部抠定了一个好玩的手机 app 文体鸟,只需要录制一段小鸟的叫声, ai 就 能分析出鸟的品种,并且弹出图文知识卡片。我使用 open code 实现了一个 python 的 后台服务, 调用本地离线 ai 模型识别鸟类音频。前端部分则是先使用谷歌 stitch 生成设计稿,然后导入 ai studio, 使用 jimmy 三模型生成对应的前端代码,使用 open code 完成本地调试, 最后使用卡派赛尔打包成安卓或者 ios 的 app。 硬件方面的工具,我使用的是这台摩尔县城最新发布的 ai book 算力本, 它搭载了国产自研的长江 soc, 提供五十 tops 的 ai 算力,还有三十二 gb 的 统一内存,可以很好地胜任开发加本地 ai 推理工作。 ai book 预装了完整的 ai 开发工具链, 开箱即可直接调用,避免了各种配置环境的难题,大幅提升了开发效率,对 ai 新手非常友好。本期视频带来一个全新工具链的 web coding 教程,我们一起来看看这套全新的开发工具是怎么配合工作的。 我在 github 上面找到了一个鸟类声学识别的开源 ai 项目,叫做 bird night analyzer, 这个项目的核心是一个五百万参数的卷积神经网络模型。我们上传一份鸟类的音频, ai 就 会自动分析出其中的鸣叫片段,并且识别出对应的鸟种,支持全球六千多种鸟类声音识别。我准备先开发一个后端服务,当用户把音频上传到服务端以后,就可以调用 ai 模型进行推理,对音频进行分析,并且给出可能的鸟类结果。 ai book 支持五十 t o p s 的 ai 算力,完全可以胜任 ai 开发加 ai 离线推理的工作。说到 ai 开发,我觉得 linux 才是最适合 ai 开发的操作系统,无论是 tensor、 flow、 pi touch 等各种框架,还是各类开源大模型, 在 linux 上的兼容性一定是最好的。 ai book 就 自带了原生的 linux 操作系统,出厂就预设了 mosa 全套开发环境, son vs code、 jupiter、 pi touch 这些工具都是开箱即用,还自带了一个 v l l m 的 推理框架,彻底解决了扩大版本冲突、依赖库报错等环境配置难题,让开发者能将全部的精力投入到代码逻辑与创意实践上,而非繁琐的环境调试。 这次开发后端,我使用的 ai 开发工具是 open code, 我 们先来把 open code 安装一下。 ai book 里面已经内置了 node js, 我 们只需要把这个 npm 的 安装命令复制一下, 打开一个终端粘贴过来回车,这样就安装完成。接下来我们来配置模型开发后端,我一般使用 gbt codex 模型,输入命令斜杠 connect, 找到 open ai, 选择 gbt plus 登录方式,然后把这个地址在浏览器打开,登录一下我的 gbt plus 订阅账号, 打个招呼给到了回复,这样我们的模型就配置完成了。我们看到在 ai book 的 这种 ai 编程工具的体验比在 windows mac 上更丝滑便捷, 这也体现了命令行类 ai 编程工具的一大优势,可以无痛迁移到任何一个平台,哪怕是没有桌面环境,使用命令行也能稳定运行。接下来输入我们的提日词,请用 python fast api 实现。一个后端需要先阅读文档, 提供 pos 的 接口,接收上传音频文件,调用文档里面的 c l i 工具识别是什么鸟类,最后返回 json 数据。很快 open code 就 完成了开发。接下来他提供了后续的操作建议,需要先安装 python 依赖,然后使用命令把后端启动起来,最后可以使用 c u r l 命令来测试一下。 这里我准备了一个测试的音频文件,然后我们使用 c u r l 命令来调用后端接口,给到了一个返回结果,但是我看到这个返回结果里面并没有我们想要的核心数据,也就是这个鸟的种类。 我打开了刚才运行的临时文件夹看一下, birdnite analyzer 生成了两个 csv 文件,我们想要的数据在第二个 csv 文件里面,这里面包含了鸟的俗名,学名,还有知心度等数据, 让我跟 ai 再交流一下,我要求他使用第二个,也就是文件名,是以 result 点 csv 结尾的那个文件进行解析,这次结果就正常了,在 jason 里面包含了这个鸟的名字。这样我们整个后端的开发工作就完成了。接下来我们进入前端 app 的 开发, 爬爬虾最近发现了一个全新的 app 开发流程,我们可以先利用谷歌的 stitch 设计出 app 布局与页面, 然后导入到 ai studio 里面,利用 gemini 三模型从圆形图构建出可以运行的网页代码。接下来用 capacit 把网页的代码打包成一个完整的手机 app, 整条工具链都是免费的,而且充分利用了 gemini 的 强大设计与前端编程能力。我们先来用 stitch 开发一个设计稿,我们来到 stitch, 输入我们的需求,设计一个名字叫做文体鸟的 app, 用户录制一段鸟的叫声,有可能 ai 会分析出多个, 每种鸟都有对应的自信度。整体设计要美观大气清新。模型我选择这枚 nice 三 pro 直接开始。几分钟以后, ai 就 为我们生成了第一版的设计稿,看起来已经很不错了。接下来我又跟他进行了几轮对话,去掉了一些多余功能,让这个设计变得更加简洁清新。接下来我们选中这两张图, 点击冒按钮,选择导出到 a s 丢丢里面,继续提我们的需求,把这个设计图设计成一个手机 app, 因为 a s studio 负责生成真正的前端代码,所以这里我详细写出了后端接口的格式。然后具体每个鸟的描述,还有图片等信息,我让它先生成一个数据级,直接先放到代码里面就行了。 a few moments later a s studio 为我们生成了可以运行的网页代码,我们可以把显示模式切换成 mobile, 来查看一下在手机上的显示效果。这里我直接把代码下载下来,在本地调试一下, 在右上角点击这个下载按钮,然后保存下来。接下来我给前端项目新建了一个文件夹,把我们下载的代码解压缩到里面。我用 vs code 把前端项目打开,输入命令, n p m install。 先装一下依赖,然后 n p m run d e v。 把项目启动起来。 在 local host 三千端口就可以访问到这个项目了。我发现了几个问题,首先是这个录音按钮,它不是真正的录音,而是变成了上传音频文件。第二个问题就是调用后端接口的时候报错,这里报了 c o r s, 也就是跨域的问题。对于跨域问题应该是从后端进行修改。 这里我们还是来到后端项目打开 open code 的, 我告诉他存在一个浏览器的跨域问题,请帮我修改。然后 ai 添加了这三行代码,我们再来测试一下,现在跨域问题就解决了,可以通过上传音频文件来识别出鸟的种类了。 我在代码里面又补充了一些鸟类的图片描述等数据,再运行测试,总体流程已经 ok 了。接下来我在前端项目里面打开 open code 的, 再让 ai 帮我修改几个问题。 首先去掉右上角的喇叭。第二个问题是展示出来的鸟类没有显示描述,我让 ai 把文字描述放到图片的下面。第三个问题是这个录音按钮应该能真正的录音,而不是只能上传文件。 ai 完成了修复,我们点击这个录音按钮,赋予浏览器权限,就可以真正的进行录音了。 我们在 ai book 里面敲命令 i f config 来查看一下它在局域网里面的 ip 地址是幺九二点幺六八点三一点九四,然后代码里面的后台地址我换成局域网的地址。 接下来我们来到手机上,在手机的 chrome flag 里面把前端的网页地址加入白名单,因为我们没有配置 hdps 加密。然后我们就可以直接在手机的浏览器里面打开我们的前端页面。 这里我选择的开发框架是 capacitor, capacitor 可以 快速地把网页打包成安卓或者 ios 的 app, 开发者不用写原声代码也能做出接近原身体验的手机 app, 一 套网页代码就可以打包出全平台的手机 app, 这样大幅降低了开发的工作量。本期视频我们就来打包一个安卓的 app。 第一步需要先来到安卓 studio 的 官网,把这个安卓 app 的 开发工具先安装一下。不过我们运行安卓 studio 通常需要一个 windows 的 操作系统,现在我手头有 ai book, 不用费劲再去找一个 windows 电脑,因为 ai book 支持 windows 跟安卓虚拟机,可以一键切换到 windows 开发环境,一个算力本搞定全平台的开发需求。我们来到 ai book 内置的虚拟机管理器,找到 windows 十一的虚拟机,直接启动并且连接。然 然后我们来到 node js 的 首页安装一下。 node js 我 在 linux 系统里面已经把代码上传到了 github 上面,我们来到 github, 点击这里的下载代码,把代码下载到 windows 虚拟机里面,然后我们在虚拟机里面下载安装安卓 studio。 安装过程一路点击下一步就行了。 我们来到前端项目的目录,依次执行这些命令,第一个,第二个,这里需要填写一个 app 的 名字,然后一路点击回车。第三个, 第四个,第五个,第六个,第七个。所有命令都执行完成,就会自动打开。电脑上的安卓 studio 项目需要下载很多依赖,我们需要耐心等待右下角的进度条。走完这个安卓工程还需要几个修改,首先是闷方法,让它允许 h d d p 连接, 接下来在清单文件里面声明两个需要的录音权限,最后再加上这么一句话,允许 h d d p 的 后台连接,我们在顶部菜单找到 build, 选择 generate apk, 过了一会 apk 就 打包完成了。打包出来的 apk 位于 app build outpost apk debug 这个文件夹里面,把这个 apk 复制一下,拷贝到手机上安装一下。我们最后再来测试一次。 本期视频,我们歪不抠定了一个前后端的完整 app, 摩尔现成全新的 ai book 算力本,完美地胜任了这次开发工作。 ai book 预制了 mosa 全套开发环境,大幅降低了 ai 开发的上手门槛。三十二 gb 的 统一高速内存,足够运行各种离线大模型, 原生 linux 系统更加贴近 ai 的 生产环境,本地开发的 ai 应用可以无缝迁移到生产环境。这几天使用下来, ai book 给了我很多惊喜, 国产芯片加国产开发环境,已经有了非常不错的开发体验,很高兴看到国产 ai 硬件的大幅进步。好,本期视频就到这里,感谢大家点赞支持,我们下期再见!

兄弟们,如果你正在使用 open code, 那 这个插件一定得装上它彻底重构了 open code 的 工作流程,让你不再像玩回合制游戏一样和单个智能体一问一答编辑代码,而是直接拥有一支专业的开发团队,不同成员各司其职,互相协助,即便开发大工程也能轻松 hold 住。它本质是一个多模型多 agent 的 编排框架,它会往 open code 中集成十一个专家 agent。 例如 sisyphus 作为总指挥,负责任务分解、进度管理、协调其他成员。 prometheus 则是规划师,通过访谈式交互与你沟通深层详尽的执行计划。此外,还有专门负责架构设计、前后端研发、文档生成以及代码库探索的各类 agent, 使用时非常灵活。你在对话框中输入任务需求,总指挥 sisyphus 会自动规划分配给对应 agent。 你 也可以显示地 at 某个 agent 去完成特定工作。例如一种常见的用法,先让 prometheus 出一份详细计划,再让 atlus 照着计划去调度执行。 当然,你还可以同时艾特多个 agent, 让他们并行工作。如果嫌麻烦,他还提供了一种懒人模式,在对话框里简单说明任务,例如重构整个工程,然后输入 ultra work, 它会瞬间化身卷王,所有 agent 都会被启动,持续执行,不会偷懒,直到实现任务目标。 另外,它还有个很灵活的特性,你可以预先配置任务类型和模型的映涉关系。例如让 gpt 处理架构设计任务,让 kimi 处理写作任务。在执行阶段,指派的 agent 会根据任务类型加载对应模型,从而每个任务都会被适合它的模型处理。

大家用 ai 编程,我推荐一个 clout code 的 平替 open code, 而是开源免费的工具啊,不用折腾,国内直接就能用。那今天咱们就用三分钟时间说它的安装和使用方法,咱们正式开始, 大家呢首先安装一个最新版本的 note 啊,到 note 官网直接下载安装包,双击下一步就行了,这个特别简单,安装完 note 之后呢啊,大家 window 键加 r, 打开运行窗口,然后输入 cmd 回车,打开终端啊,然后执行 note 杠 v 这个命令,如果能看到 note 的 版本,就说明 note 安装成功了, 然后呢,直接在这个终端里面输入下面这个命令,按回车 open code 就 安装完成啊。因为我之前安装过嘛,所以我这里是做了一个升级,如果大家没安装过的话,它会有更多的提示,反正直接就能安装好。这个还是特别简单的,安装完成之后呢,大家要想试试 open code 的 功能啊,就打开一个空的文件夹, 在地址栏输入 cmd, 按回车啊,就可以在这个空的目录里面进入终端啊,然后输入 open code, 咱们就在当前目录下呢,打开了 open code 啊,这样 open code 就 可以操作这个目录的文件了。 进入 open code 的 第一件事,咱们要选择大模型啊,可以输入斜杠 models, 大家可以看到这里有一个模型列表,后面有 free 的 啊,这个就是免费可以使用的啊,大家可以先用一个免费的试试效果啊, 那如果大家有一些平台的大模型的 apikey, 就 可以在这输入斜杠 connect 啊,然后选择这个平台啊,比如大家是阿里的平台,谷歌的 openai 的 啊,各种平台嘛 啊,选择这个平台之后就可以输入你的 apikey 啊,然后再选择这个平台的大模型,比如我就是阿里的平台呢,我可以选前文的不同版本啊,选择之后呢就可以用了。那搞定模型之后呢,咱们再试试效果啊,输入提示词啊,让它开发一个俄罗斯方块的网页游戏 啊,咱就可以看到它运行了啊,等待它运行结果之后呢,它会生成 excel 文件,咱们打开就可以看到这个俄罗斯方块的网页游戏。然后我再说一些 open code 的 常用功能 啊,第一个就是模式切换啊,大家看文本输入框左下角这写着一个 build, 那 这个呢,就是 build 模式,按 type 键呢,我们可以切换成 play 模式。那这两个模式什么区别呢?就是在 build 模式之下, open code 可以 操作文件 啊,比如刚才的生成代码,或者是修改文档,甚至是删除文件,那这些呢,都可以在 build 模式下进行,所以在 build 模式下,大家操作项目还是有风险的啊,说不定就删了什么,改了什么,大家最好还是在这个项目备份的前提之下再去 build 修改项目 啊,要不然你真删了什么不该删的,那就是欲哭无泪了啊。当然备份项目的话,我建议大家使用 get 啊,非常方便。然后呢就是切换到这个 play 模式, play 模式它就不会操作文件了, 而且会对咱们的任务进行一些规划和拆分,所以大家可以先用模板模式规划,等到规划清晰了之后,再用 build 模式去操作项目,这样就会比较安全 啊。那说完这两个模式之后,咱们再说一些常用的快捷键,首先就是按住 ctrl 加回车可以换行,还有呢,斜杠加 new 可以 开启一个新对话,还有就是输入 at, 可以 直接选择当前目录的文件,这样呢就能把文件的内容当做是上下文来使用 啊。使用 open code 结束之后呢,我们可以输入冒号 q, 按回车就可以退出 open code, 直接退到终端,这就是 open code 的 常用方法。后续我还会分享更多的 ai 编程的技巧啊,大家可以点赞加关注啊,咱们下期再见!

全景理解能力, code 精灵中射出扫描光束,快速分析整个项目文件数,形成一张知识图谱。精准执行能力,帮我处理异常。 code 精灵马上飞入文件光标,自动跳动,高质量的代码块和 try catch 结构被精准写入安全代理。面临复杂任务时, code 精灵分列出两个分身,一是温和的蓝色分身, 只读分析,提出一份详细的修改计划清单。二是强力的金色分身,由小智确认后获得授权才动手修改代码。 这就是 open code 的 强大超能力,一个住在你终端里的开源 ai 助手,它不绑定任何模型,给你绝对的自由。你是否经常性的在多标签页、文档、 stack overflow、 keycap、 issues 和代码编辑期间频繁切换、复制、粘贴? 现在只要应用 open code 就 能告别繁琐,拥抱智能,让每一次编码都成为思想的直接延伸。

大家好,本期视频给大家分享一款目前非常火的开源的 ai 编程工具啊,叫 open code, 那 么这个 open code 呢,非常大的一个特色,就是对接了市面上基本上主流的所有的模型啊,你只要输入一个 api apikey 就 能直接使用, 而且它有 code 的 基本上所有的功能,所以说在目前在这个编程社区是非常受欢迎的。那本期视频呢,从就带大家来完完全全的去了解一下这款 ai 编程工具。那首先呢,我们可以从官网上看到它的一个安装非常简单,只要执行 这样的命令就行了,它也支持这种 c u r 这种直接下载,它的这种已经写好了脚本,或者说直接用 n p n 的 方式安装, 那 n p n 方式这种安装的话,你的 note g s 的 版本最好是高一些,那我们可以复制这个命令啊,那么安装完之后啊,你后面再启动或者说欧根库了,它再更新的话,它是可以直接啊打在你的打开里面去直接去更新的,它不需要你再重重复去执行这个命令, 我们可以输入 open code, 然后或者说你后面紧跟着你要打开那个目录,那你如果为空的话,那说明就是在当前这个打开,打开之后呢,你首先可以去啊设置自己的这个模型, 那么这个这里面就包含了非常多的模型,随便搜另一个模型都能搜到,比如说四点七,那么他这边有 open code 赠,那就是他官方提供的这个免费的啊,然后呢你也可以去选择这些啊,收费的啊,就是你自己 买的额外的这种套餐去配置配置进去,比如说我们买了这个,这个啊,智普的这个 code plan 就是 有专门的编码套餐,你选择它的话,输入啊 api t 就 可以了,那你也可以选择别的,就是你有你有这种 api 的 支持,这种 openai 的 这种标准格式的, 那么你也可以选择一个输进去就行了,所以说它是支持市面上所有的主角模型全部都支持。那么你选择完之后呢, 那么这里面就要了解两个非常重要的模式,一个叫 build 啊,在这里看到啊,通过 plan plan 的 话,就会根据你输入的东西来去跟你去沟通,去交流, 那最终呢形成一个比较详细的结果,那 build 呢,直接就是根据你的需求直接去生成代码了,所以我们的习惯是一般用 plan 去把你的需求去了解清楚,然后再去执行,可以用一个例子来体验一下整个过程。比如说我现在需要去创建一个企业官网, 你在打开之后呢,你看这边右边这边会有一个这样的,你的上下文的,这个消耗了 tokens, 然后还有就用了多少百分之多少的上下文,如果大到快快到百分之百了,它这边会自动去压缩, 然后等右边这边还会显示一些比如说 to do list 啊,这些它的一些任务的信息啊,这边能够方便的去看到。 ok, 他 这边已经向我们提问了,就是啊,需要了解一些关键的信息,那么你这边去回答就行了。这边他针对 plan 又列了一个更详细的这个 to do list 啊,在右边呢,可以看到啊,他之前正在执行第一个, ok, 他 这边已经把计划都做完了啊,就是把这些步骤包括技术架构啊,这个文件的目录结构啊,还有这个每个模块的设计方案, 整个的这个设计规范全部都已经在这边列出来了,列出来之后我们希望它能保存文档,因为它在目前这个 plan 模式下面是没有权限去创建代码干嘛的,所以我们要让它来去切换到 build 模式,然后让它保存文档, ok, 它这边的 plan 已经保存起来了,保存, 那下面就是我们要继续,就是说有个非常重要的叫 rules 的 就是规则,那么它这个规则跟我们之前的编程工具像 course 啊 啊, curl code 其实是它们是共通的,也就是说它们会用一个啊 md 文档叫 agent md 来保存这样的一个规则,也就是这也其实也就叫记忆。 那么在 curl code 里面是使用 curl dmd, 那 其他的编程工具其实都适配这个 agent dmd 啊,那在这个文件里面你可以去定义你这个项目是做什么的,然后它你的这个开发的规范是什么?技术价格是什么,然后你的约束是什么,一般是按这种方式去定义,那么你如果说 你自己没有写的话,你也可以通过这个命令啊去初步化一下啊,比如说我们现在目前这个项目是没有任何的这个 agent md 的, 那么你就可以使用这个 enix 这个命令啊,让它来去创建或者更新啊,这样的一个,这样的一个啊记忆的文档。 一般情况下你可以在就是项目初主的情况下,你可以写一个 readyme, 也说你可以介绍一下我这个项目是干什么用的,然后打算用什么呢?记住框架,你就说你自己可以不用去 创建这样的 agentmd 啊,你可以让它来去读取你的这个 readyme 里面的内容,然后读取你当前项目里面其他的文件啊,做一个比较标准的这个 agentmd 啊,或者说你自己去写也是完全可以的。 那我们一般从零到一级开发项目的话,是用通过这种 redmail 的 文档,或者其他的一些技术文档啊,产品文档啊,把它放到项目里面去,然后让他来去帮你去生成一个这样一个比较标准的一个这样的一个文档,那么他这边的话执行这个命令之后啊,会去搜索 call, 搜这个目录下面就是他会去引用一些别的工程里面的这个里面,看一下他合并到这个 a 点 cmd 里面去。 那接下来就是啊,一个很重要的功能叫 skills, 那 么这个技能它也是可以像 qq 的 一样使用技能的。如果你们第一次听这个概念,可以把 skills 啊理解成一个有可附用的一套标准的一个流程。那么 举个例子,比如说有个这样的场景啊,比如说你现在出出差,出差回来你要去报销,那么你要去找你的领导签字啊,你找完你的领导签字之后,你要去财务那边,去 财务根据你出差里面的各个事项来计算这样的金额,那最后把金额打到你的卡上,那么这个就是一个很标准的流程,你每一次出差都是这么做的,那么你就可以把它当成一个 skills, 那 么这个 skills 里面就可以通过啊描述,比如说你这个描述,是啊 专门为了出差而定制的这个 scares, 然后你的流程是要去找你的组长,对吧?找你的财务,然后打到你的银行卡这样的一个流程,那么在你的上下文的交流当中啊,交互当中如果出现了这种出差啊,出差的这种流程,你要去触发这样出差的动作,那么它就会调用这个 scares, 还有一个非常大的功,强大的一个功能是什么? skill 里面是可以去引用一些其他的文件来作为他知识的一个补充,比如说你的财务要计算你的出差的金额, 他可能要去翻阅啊,你们公司的一些规章制度,那么规章制度啊就可以成为这个技能的一个补充文件了,那么这个这个补充文件就当他 你的出差的这个,比如说你是三天会触发 a 制度啊,是五天会触发 b 制,那就会去判断啊,当你三天的时候,他会去加载啊,你这个 这个对应的这个制度了,对吧?然后如果说还有就是你要打款,对吧?打款要去触发这个银行的接口,比如说用技术的话说要触发银行的接口,那么他就会调用这样银行的接口把钱打给你,就这么一个流程封装起来, 而且它的最大的功能或者是优势是什么?就是它上下文是非常紧紧,就说 it 呢,在加载这个技能的时候,它是不会把你所有的文件都加载进去的,它只会把你这个 skill md 里面的这种原数据啊,就是这个 name 名称和描述干什么?就像一个相当于一个缩影一样,把这个你的这个事业的一个非常核心的是在什么场景下,是要什么具备什么条件出发来加载到上下文里面去,然后呢他会根据你的这个 情况出发之后,他会去再会去加载这个 skill md 里面的所有的内容,然后通过里面的内容再去加载我刚刚说那些分支情况,所以说它是一个渐进式的批录,渐进式的引入它的最大的优势就是这个,所以这个场景其实就是一个很标准的一个 skill 的 一个解释的一个 get 你 了。那么在 open code 里面使用 skills 呢?它这边有一个非常特殊啊,它就是它不仅会加载自己这个 open code 里面的这个 skill 的 目录,它也会把,它也会把 cloud 啊,把 clone 的 这个技能也会作为它的一个技能,也就说你在 clone, 如果你在 clone code 里面啊,拥有这种全局的这种技能技能的话,它是可以加载过来的,那这边也会有描述,也会加载到我们的系统里面去,那么我们可以打开这样的目录啊,比如说你现在是一个点 config open code, 这个是它的一个目录里面的话就会有啊,比如说你的这个 skill, 那 么你就要去创建,如果你要去 用 skill 的 话,你就要去创建这样 skill 文件,然后把你的这个写好的 skill 放到这里面去,就是一个标准的目录,那么它也会把啊这个目录里面的这个滚 call 的 啊,这个目录里面这个 skills 加载过来啊,比如说我们现在就有这样这样的几个 skills, 他 是可以加载过来的,我们可以让他来读取一下,看一下他有什么样的技能,我们可以让他来把,看一下他会加载多少技能出来。 ok, 他 这边已经把我这四个啊这个 skills 加载出来了,那么这个是一个,这个, 这个 max j s, 这个是一个不标准的,那这四个其实标准的,因为都是有这种通用的结构了,就是我刚刚这边有一个这样的一个介绍的啊,标准的结构, 那么他这边已经识别到了啊这几个,那么我们可以让他用啊这个技能,比如说我用这个东西来设计一下,专门来做 ui 的, 对吧? 那么他这边就会去读取这样的技能的这个啊里面的内容啊,看,我,因为我其实是已经是精确去匹配,让他去使用这个技能,那么他就会去加载这里面技能的这个脚本啊,或者说这个啊 skill md 啊里面的所有的一切啊,他就会去 利用里面的能力啊,把这个 ui 优化得更好。那这是它这个所以说它是可以去兼容 clock code 里面的所有的 skill, 你 也可以去把 skill 复制到它的这个 config 里面的这个目录里面去试。那么接下来就是啊,也是 commands, 就是 命令,那命令,什么是命令呢?就是你跟 skills 不 可能是什么呢? 它是把一个啊非常简单的或者非常重复的这个操作,把它定的到 md 文件里面去,它是只要你用斜杠就可以引用这个文件里面的所有内容, 它不是说不是,像刚刚的说了,这个 scares 静静式,它是你只要斜杠 m command, 然后它就会把整个命令的内容啊加载到这个上下文里面去, 而且它是不能去调用,比如说外部的这种啊,引用的这个文档啊干嘛?所以说它相当于 skills 的 一个静态的一个子集吧,你可以这么认为,那么在 open code 里面,你可以通过 ctrl p 去加载目前 可以打开目前它所有的这个 commands command 的 命令啊,然后它支持这 command 的 命令呢?有几个非常有用的啊,比如说, 那,比如说我现在打开一个上传文,就是之前的对话记录啊,我可以从这里面啊,选择之后我可以回滚, revert 就是 回滚。 那么 fork 呢?就是从这里面重新再来一下,但是它的代码其实已经产生了,也相当于你从这边拉一个分支,但是它结果是目前最新的那个结果, 就相当于你可以从可以从对话的这个角度里面重新再来一遍。虽然说你的代码已经生成了 fork 是 这个效果啊,不,如果你需希希望在这里面重新开始,那么你应该是用 reverse 回到这里面去,那么它就会回撤所有的修改,那从这边重新开始,这跟 fork 是 不不太一样的, 比如说刚刚那么多对话记录就没有了,回滚到这里面去了,这边的话是这边这就是压缩啊,这边就是压缩命令啊,把上下管进行压缩,然后的话还有一些可以自己去,可以可以看一下 啊,比如说这个,你可以把这个这个思考模式啊,就是这个编 think 的 内容要不要展示,你可以把它切换成不展示也可以,它整个内容就看不到了。如果你自己要定义这个 com 这个目录啊, 这边的话, open code, 那 么你在这边去创建这个 command 这个目录,然后在 command 的 目录里面,你可以去创建啊我们的这个这个命令,那么你也可以让它来给你去创建了,让 open code 来给你创建,相当于它这边的话去。呃, ok, 我 们让它创建了一个这样的 git commit 这个目录,这个命令啊,我们可以去这个目录里面看一下。创建完之后啊,你需要重启一下 open code, 那 么你这边就可以看到 git commit, 你 看 git commit, 那 这边就是创建一个命令了, 一样的,它是可你也可以把这个呃 curl code 里面的这个命令啊,你可以复制到它的这个 command 目录里面去,那么接下来就是 open code 的 这个 plan 就 插件, 那么它这个插件跟 curlcode 里面的插件安装方式不太一样,那 curlcode 安装就是通过啊 github 通过命令的方式直接安装到本地,那么它这个安装方式呢?就是啊使用这种 npm 的 方式,比如说你在这个 opencode 点接受里面去引用这个 插件的话,你是需要先先用这个 npm 去安装,除了这里的呢,它会有一个这样的一个叫生态系统的,里面也有很多这种社区比较受欢迎的插件啊,然后可以去看一下有没有你自己需要的。目前插件的数量比较少 啊,目前不知道就这个 color code 的 插件, open code 里面插件怎么去转换,是直接去拷贝文件过去还是怎么样的啊?目前还没去试过, 那么这边也是非常有非常常见的,比如说像这个欧买欧根扣的目前比较火的这个插件,通过给不同的子代理设置不同的模型来达到一个啊,就是模型的特长啊,比如说你是你是非常擅长做设计,那么这一块设计的工作交给你来做,那这边有一个非常好的一个这样的一个工具, 那么除了终端命令行那种方式呢?也知他也有这种 ui 界面软件,那么你在首页点击这个下载就可以下载完成了,那安装起来呢非常方便,他这个界面也是非常的简洁。那么比如说我现在打开这样的一个项目啊,比如说打开这个项目, 那么这边也是一样的,通过这个啊,我们可以去切换 build 和 pran 两种模式,然后你可以选择去选择不同的模型,在这个模型选择是一样的,就是有其实就是把终端命令行界面化了, 你在终端命令行配置的东西在这边是一样去生效的啊,比如说我们举个例子啊,了解阅读这个项目,我们可以看下它整个交互。 那 oppo 扣的呢?终端命令行这个 ui 这一块基本上介绍完了,就是如果你是一个比较喜欢去配置配置文件呀,或者去定义一些自己的东西呢, oppo 扣的比较适合你啊,就它是有一些硬核在里面的。 然后呢社区现在也是在很急速的发展,然后的话也继承了非常多的东西,他目前发展迭代的速度是非常快的, 他的目标就是什么呢?就是希望把这种可可的优势啊,各种编程工具的优势吸到他那里面去。然后呢可以去使用各种各样的模型就不会受限,比如说像 qq x 只能用 g p t 系列的模型,那 cloud code 当然是 cloud 的 模型是最适配的,而且受限于它,就是每个官方的每一个编程工具啊,都受限于自己的模型的这个选择局限性。那么怎么样去把每一个模型结合到一起去干活呢?那这个就是他做这个的意义就在这里面。

最近我那一条介绍 opencode 的 视频啊,突然爆了,但评论区啊,几乎被两句话刷屏了,免费木星没了,是不是根本没法用了? opencode 豪迈还不如科 sir。 说实话呀,这些问题我一看就知道,基本都是配置没搞对啊,或者还停留在老的 ide 的 使用思维上。 那今天这条视频啊,我就直接讲清楚三件事, open code 现在到底怎么接模型呢?才最省钱最好用,那格式到底还值不值得用啊?为什么我现在越来越推荐大家用 open code 呢? 还有一些看起来很高级,但其实特别容易踩坑的方案。如果你正在用 open code, 或者正在纠结你要不要换工具,那这条视频一定能帮到你。 先从大家最关心的模型问题开始啊!很多人问我说 open code 里面默认的免费模型没了,那到底还怎么用啊? 其实啊,现在主要就两条路,如果你是国内的用户的话,你想要一个又便宜又稳定的方案,我推荐你直接用国内大模型的官方编程套餐啊。第一个呢是智普的 codeignite, 他 前三个月一共花五十四块钱,平均下来呢,每个月十八块钱。 那三个月之后啊,它会恢复到每个月四十块钱,这对于大部分的个人开发者跟日常使用者来说呢,就用量已经很充裕了。 那第二个呢,是 mini max 的 编程套餐,它有两个档位,一个呢是 starter, 每个月二十九块。还有一个呢是 plus, 每个月四十九块,用量就会更多一点。 那这两家呀,现在价格基本上都在二十块到五十块这个区间啊,算是非常的良心了。那大家完全可以根据自己对模型的风格偏好来选, 我现在用的是智普的套餐,我整体体验下来还是很不错的。但如果你追求全球最顶级的模型啊,比如说 open i 的 g p t 啊, google 的 jimmy 三 pro 啊,还有 cloud 的 系列模型的话呢, 目前我认为性价比最高的方案就是直接买 github 拍了的会员,在 opencode 里面配置一下就可以用上了。 那么它现在主要有两个档位啊,一个呢是每个月十美元的,就可以同时使用 gbt、 cloud、 gmail 这几大顶级模型。另一个呢,是每个月三十九美元,就适合用量非常大,或者呢,你对性能要求特别高的用户,用量基本上就可以随便跑了。 那对于大多数的个人用户来说呀,我提供的这两个方案已经完全够用了。那顺便也给大家分享一下我个人呢,在 opencode 里面的一个实战工作流。第一步啊,就是计划和方案讨论阶段,我一般呢就把模型切换到 gpt 五点二, 因为它的沟通能力真的非常的好啊,很像跟一个真人专家在讨论问题,特别懂你的需求。那第二步呢,真正写代码,我会把任务交给 cloud 的 模型, 因为它在逻辑的严谨性和代码的可信这一块目前是最稳的。那第三步呢,如果涉及到前端的开发,或者对于图片界面的理解呢,我就切换到 gmail 三 pro, 因为它在视觉理解跟前端的任务上表现非常的强。 最后一步就代码审查还有改 bug, 那 我就会切换到 gpt 五点二的 codex 模型,因为它在长上下文的理解能力非常的强,很适合做 code review 的 工作。那么这套组合用下来啊,那效果非常的赞。 很多人又问我啊, ctrl 其实也挺好用的,我为什么还要折腾 open code 呢?我告诉你啊,我曾经也是 ctrl 的 付费用户啊,但我现在都转到考 code 和 open code 这种工具上来了。原因很简单啊,因为他们的工作方式已经完全不在一个时代了。 ctrl 的 核心逻辑其实还是传统的编程的 i 的 能力,那么你在 ctrl 里面呢,更像是布置一个一个的任务, 它后来虽然加了一些 agent 的 功能啊,但本质上它还是围绕 ide 在 转的,所以 ai 更像是一个随时跟你对话的高级助手。 但是当你切换到 opencode 之后啊,你的整个体验就完全变了。你在用科室的时候,你还是会忍不住的去盯代码逻辑啊,项目结构啊,文件细节呀。但是你在 opencode 里啊,因为你只有一个对话界面呀,所以你根本不会去关注代码的。 你只需要告诉我, ai 我 要做什么目标,我要拆成哪些步骤,我最后要交付成什么样子。那第二个变化呀,就是你角色定位的转变,因为以前啊,你是借助 ai 去写代码的一个人,那现在呢,你更像是在指挥一群 ai 工程师去完成一个产品, 所以你的精力也会全部放在怎么描述需求啊,怎么规划流程啊,怎么检查结果呀,而不是盯具体的实现细节。 那自从我适应了这种工作方式,我就再也不想回到科室那种 id 工作流了。还有不少朋友啊,在评论区提到过一个方案,就是通过呢 c c switch 这种开源的项目,我可以在 cloud code 里面去切换和接入其他模型啊,我干嘛要用 open code 呢? 我告诉你啊,我自己也在用 c c switch, 主要是为了更方便的切换 cloud 模型和我的智普的 coding plan 的 套餐。 但我为什么不太推荐普通用户去折腾这种方案呢?第一个是成本控制风险,因为当你在 cloud code 里面通过 cc switch 去接其他模型的时候呢,你只能走 api key 这种方式,你没有办法用你已经买好的订阅套餐啊。 所以如果你控制不好这种调用的频率的话,你,尤其是像 gpt 五点二 codex 这种高端模型,那你通过 api 跑任务的成本可能会吓死你的。 第二个呢,是平台政策的风险,就是你要明白啊, osmotic 提供 cloud code 这个免费的工具,它的核心的目的还是希望大家去用它自家的 cloud 模型啊。那如果大量的用户都拿它当一个免费的壳子去挂别家的模型,对它来说没有任何商业价值啊。 现在这些接口还能用,可不代表以后不会手挤,甚至直接给你封掉。那今天这条视频啊,我最后想跟大家说的是,你真的可以去接受和尝试 open code 的 这种基于终端的 ai 智能体,因为它真的太好用了,它比传统的 ide 太丝滑了。 我发现很多同学他不愿意切换,不是因为他不好用,更多的呢,是对一种终端工具的天然恐惧。我一看到黑乎乎的窗口呢,下意识觉得,哎呀,给程序员给高手用的。 其实实际上啊,你现在几乎根本不需要敲什么命令,你都是在跟 ai 对 话呀, 而且我可以很负责任的告诉你一句啊,现在 ai 的 发展方向已经非常的明确,就是正在全面的走向智能体协助和自动执行任务。那最近刚刚爆火了一个叫做卡的 bot, 它就是一个跑在 mac 电脑后台的智能体, 然后它可以通过即时通讯软件呢跟你沟通,所以以对话和调度为核心的工具一定会越来越主流的。 那 opencode 只是这个阶段一个非常好用的代表。那如果你愿意,真的可以跟着我这条视频一步一步试起来, 哪怕你先跑一个小项目,你很快就能体会到这种差异了。我最近也在尝试呢,在 mac mini 上来跑 cloud bot。 如果大家希望我单独出一期视频详细讲解的话,欢迎你在评论区告诉我。最后啊,也欢迎关注我,这里是范凯说 ai, 我 会持续的跟你一起拆解 ai 趋势,教你真正把 ai 用到工作和生活中,让你在 ai 时代不焦虑也不掉队。

兄弟们,最近 opencode 项目真是太火了,不用魔法直接冲到 opencode, 在 getup 狂揽八十点一 k star, 堪称 cloudcode 平替天花板,功能对齐,还解锁更多自由支持市面上所有主流 ai 大 模型,连国产模型、本地模型都能无缝对接,隐私安全拉满, cloud code 老用户迁移零成本丝滑到飞起。最绝的是在终端用命令行就能跟 ai 写作写代码,安装简单到一行命令搞定,还没通的赶紧去收藏,欢迎评论区讨论!

可乐的扣子的平替工具,欧本扣的给大伯已经六万个星了,完全开源,请免费使用 glm 四点七的模型。 很多人把它当成可乐的扣子的平替,这其实是完全低估了它的能力。欧本扣子的亮点是它的 cs 架构,它的服务端可以作为一个常驻的 atp 服务部署,在服务器上提供了非常丰富的 api 给客户端用, 可以非常容易地嵌入到你现有的系统里面。 a i 呢,能持续地感知系统上下文帮你处理问题,意味着 ai 不 只是回答问题和补全代码, 而是真正的参与系统运行。它更像是一个 agent, 软 time, 甚至是 ai native 项目的执行底座,在它上面做一些 ai 原生项目的开发。这个架构配合四 q toe 和 m c p 协议。我的另一个判断是可以覆盖一些当下的使用场景,当下太重,而且还很抽象。 open code 的 这种原生架构让你可以直接定义沃克浮楼,直接让 agent 调用工具干活,并且实现成本更低。 扣扣扣的,可以真正的让你从 ai 辅助升级到 ai native, 用 a nin 的 真正的去干活。点赞关注,每天获取一个新知识!

好朋友们,今天给大家来分享一下最近大火的这个一个开源 ai 编程工具 open code 的 一个实战啊。今天主要想实现的一个功能呢,就是我们在自己不动手写一行代码的情况下, 通过这个 ai 来帮我们生成一个可以自动生成个人简历的一个网站。下面具体说一下操作步骤啊。首先第一个我们先让 ai 帮我们生成一份需求文档,然后第二步呢就是让 open code 根据我们生成好的这个需求文档来就开始制作对应的网页了。 第三步,这个网页做好之后,我们就可以去打开网页使用体验。第四步呢就是我们发现问题改 bug, 然后优化功能。第五步呢就是不断的重复三四步,最后呢直到我们的产品可用为止。 最后一步部署上线,这步呢其实不是必须的,如果你想把你的这个网站分享给其他人,比如说让你的朋友能在线上也用的话,那你可能需要一个部署上线。然后下面再说一下我们前置环境需要准备哪些内容。 首先第一个就是 ai 编程的这个 open code 的 这个工具了,第二个呢就是 node js, 这是一个运行环境。然后第三个是一个代码编辑器啊,这里推荐大家用这个自己顺手就可以了,这里面的话我现在用的是 vs code 啊。 第四个呢是版本控制,通过这个版本控制呢,每次 ai 生成代码,我们测试完它可用之后,我们就把它作为一个版本保存起来。第五个就是我们需要接入一个大模型来帮助我们去做这个语义的分析,那在我们的网站当中呢,实际上两个地方可能需要用到 ai, 第一个就是这个 ai 一 键录入, 就是它通过我们录的这个基本信息给它转移成下面这种结构化的数据的时候,这也不是需要 ai 来帮我们做解析的。然后第二个地方这个工作经历,项目经历的一个润色啊,大概是这么两个地方可能会用到 ai, 那 我们来到 deepsea 平台呢,可以从这个 api 开放平台进入, 这里面的话需要大家自己注册一个账号啊,然后去充值一点点 money 啊,这里面的话其实大家不用多啊,就十块钱就够了。好,以上呢就是我们这边前置必须要准备的一些环境吧,那么接下来呢,我们就进入这个实战环节。 好,我们接下来进入实战,然后我们先看一下我们一开始定的这个操作步骤啊,第一步呢是让 ai 生成一个操作步骤啊,第一步呢是让 ai 生成一个需求文档,然后我平时用拆 gpt 给大家展示一下, 我们可以直接问 ai, 就是 说我想用 ai 做一个个人简历的网站,最后生成 pdf 格式,这个我们一起探讨一下该如何实现。 好,我们可以看到啊拆 jpg, 他 给了一些参考意见啊。最后呢,我们直接让他把上面说的这些内容呢生成一个需求文档。好,根据上述内容生成一份需求文档,该文档可以用于让 open code 直接开发网站。 好,现在呢我已经把拆 gp 生成的这个需求文档给粘贴下来了,把这个文件呢保存到我们的工程目录下。好,这个 ai resume 呢,就作为我们整个网页开发的一个项目工程的根目录了,然后我们把刚才的这个需求文档呢保存到这个目录下。 好,接下来我们就打开我们的终端,然后先进入到刚才我们建好的工程目录里。进入到工程目录里之后呢,我们就输入 open code。 好,现在这个界面呢,就是我们的这个 open code 的 一个开发界面了,这个对话框呢就是平时我们跟 open code 交互的一个入口。然后 open code 呢提供两个模式,一个是 build, 一个是 plan, 我 们可以通过界面上的这个 tab 按钮 tab 来进行一个切换。 build 模式下呢, open code 可以 直接对我们的代码文件进行操作。然后在 plan 模式下呢, open code 是 没有权限去操作我们的文件呢,可以在 plan 模式下先去跟 ai 探讨我们要开发的内容是什么,对齐一些问题, 然后在这个最清楚之后,我们可以切换到 build 模式来让这个 ai 真正的进行这个开发。另外呢再介绍一下 open code 的 一些常用功能,嗯,我们输入这个斜杠之后,可以看到 open code 内置了这么多的命令, 然后这里面所有的这个命令的用法呢,在这个 open code 的 官网都有介绍,这里面我只介绍一下我们这次会经常用到的。 第一个是钢六,钢六呢大家可以理解为平时跟这个 ai 对 话的时候,我们新开启了一个对话框,这样的话呢,我们就保证说每次处理某一个问题的时候,只在一个这个对话框里面解决,如果在一个对话框里面我们处理了过多的问题,这就会导致这个越到后面上下文越长,然后后面的问题呢,他处理的不够精准。 第二个就是这个杠 models, 我 们选择这个 models 进来之后,可以发现 open code 已经对接了常见的这些大模型的接口。然后现在 gm 四点七和 mini max 二点一呢是免费的,这两个呢都是国产里面编程表现不错的大模型。 然后我们现在选择 gm 四点七来进行一个演示。现在我们因为是刚刚建好了工程目录,但是我们还没有在里面去创建我们的 git 仓库。嗯,熟悉 git 的 同学呢,你可以直接用 git 的 命令去出手化仓库。如果你不熟悉 git 的 话呢,其实可以直接让 opencode 来帮我们去做这个仓库的出手化, 你可以直接告诉 ai 在 这个目录下出手化 git 仓库回车。好,我们看到现在这个仓库已经被出手化完成了, 这里呢我们可以看一下啊上面的这个这一行呢代表的是当前这个任务的一个介绍,然后下面 context 呢是 呃标明我们当前使用了多少 token, 然后已经花费了多少钱,因为现在我们用的这个 api 都是免费的,所以说这个钱呢都是零元。然后这个 lsp 呢,它是一个语言服务器的协议,这个的话主要是帮助这个工具能更好的识别我们的一些代码,然后我们打开 vs code, 找到刚才我们的这个呃工程目录。 接下来呢我们就让这个 ai 去读取我们的需求文档,然后进行一个开发,我们打开一个新的对话框,首先呢我们切换到 play 模式,让 ai 呢先去读取我们的需求文档,然后让它对这个需求进行一个分析,有问题的话呢,先跟我们确认, 这里的话,我们可以用艾特这个命令,然后加上我们的文件名来选举指定的文件,这样的话可以让 ai 直接去读这个文件的内容,读取这个需求文档,分析需求,并规划如何开发,有问题向我确认。回车,我们让 ai 先去看一下我们的需求。 好,我们看一下,现在 ai 向我们提出了一些问题啊,我们把这些问题来解答一下, ai 服务使用的 apikey 如何配置,这里面的话我们使用的是 deepseek, 然后关于 apikey 呢,我们需要到 deepseek 的 后台去申请, 打开我们的浏览器,来到 deepseek 的 这个后台,然后点击这个 apikey 的 这个面板,在这里面的话,我们可以申请自己的 apikey, 点击创建 apikey, 我 们可以起个名点击创建。 这个时候呢 deepsea 会给你一个专属的 apikey, 大家把这个 apikey 呢复制下来,后面我们来跟这个 deepsea api 进行交互的时候呢,是通过这个 apikey 来识别我们的这个账号,识别我们的身份的, 当然大家这个 apikey 呢一定要保管好,不要让别人知道你这个这个 apikey 的 铭文,如果别人知道的话呢,他就可以来使用你的这个账户里的这个额度了,然后我们把这个 apikey 复制,复制出来告诉 ai 我 们的 apikey, 同时为了让 ai 更好的去调用 deep seek 的 接口,我们可以把 deep seek 的 这个呃接口文档 啊,把这个地址给到这个 ai, 这样的话它后面就可以读取这个网页,然后来进行更好的开发。第二个问题,后端架构,我们直接使用这个 api roots 就 可以 pdf 导出库。呃,推荐使用哪个,我们就先用第一个吧。第四个问题, nice 点 gs 版本 使用 app router 还是 pages router? 然后这个问题呢?因为我对这个 nice js 也没有那么熟悉,所以这个问题我们可以问一下 ai。 然后第五个问题,数据持有化,我们暂时先不需要做数据持有化。 工作项目经历,新在 mvp 阶段只支持一条工作经历和一条项目经历,是否支持多条啊?还是支持多条吧,因为我们做简历的话,每个人的工作经历跟项目经历可能就是会有多条嘛。第七个问题,呃,这个的话,我们就用逗号风格吧, ai 改写的范围是指改写工作经历还是项目描述?也加上, 嗯,都加上。好,我们回车。因为第四个问题我们没有确认啊,所以说等待 ai 的 一个回复。好,我们可以看到 ai 推荐我们使用 app router, 那 我们就使用 app router, 然后我们切换到 build 模式,跟他说一下使用 app root。 好, 接下来呢,我们就等待 ai 的 一个开发操作。好,我们可以看到右边呢,这个已经列好了。图图,像这么多,这个事项需要 ai 去处理,等它处理完呢,我们第一版的网页就可以去访问了。 好,经过这个九分钟的一个执行,现在 ai 已经帮我们把第一版的网页生成完了,然后他提示我们说打开这个地址就可以使用,可以看到我们这个网站已经正常的能展示出来了。 然后我们看一下现在页面比较简陋啊,这个没关系,我们后面可以慢慢调,现在主要看一下这里面的功能是不是符合我们的预期。我们先把这个简单的信息填写一下,然后我们试一下这个导出 pdf 这个功能啊, 点击,哎,好,我们看见这里面爆了一个错,嗯,这个错稍后我们来解决一下啊。然后我们再看一下这个 ai 描述这一段,我们先看看 ai 优化这个功能好不好用,点击优化, 哎,现在我们可以看到这里面的话,这里的这个文字应该是已经被 u i 给优化过了。好,我们再试一下这一段,哎,好的,现在应该是 ai 的 这个调用是成功了,然后我们看一下这个 pdf 导出这里面是存在一些问题的,然后我们点开这个错误提示, 嗯,让 ai 呢去把这个错误给解决一下,我们把这个所有的错误给它复制出来,然后回到 open code 进一个新的窗口,导出 pdf 存在报错排查一下,然后我们把刚才所有的错误信息粘贴到这里面, 让 ai 去排查一下问题。好,现在 ai 呢给出了一些解决方案,然后我们可以看一下它,让我们这个推荐用方案一来去解决,那我们就直接采用方案一, 然后在这之前呢,我们先回到 vs code 里来,我们把刚才之前已经生成好的这些文件呢,我们先做一个版本的一个提交,点击这个按钮,然后我们在这里输入一个备注,来表明我们当前这个版本是干嘛的,点击 commit, 然后所有的文件我们都需要给它提交上去,好让大家可以看到,这里面就多出了一个输入法网站的这个版本。然后这个时候我们回到 open code, 切换到 pu 的 模式,然后跟 ai 说采用方案一解决,直接让 ai 修复一下我们 pdf 无法导出的这个问题。 好,现在 ai 已经改白了,他说我们可以刷新界面,然后尝试导出 pdf, 应该就可以了,我们回到网页里来刷新界面。好,我们先录这么多啊,然后再尝试一下这个功能。哎,我们现在可以看到啊,已经能够导出了,我们就直接把它保存一下。 哎,看到没?我们现在已经是正常的打开我们这个 pdf 的 这个文件了,但是这里面还是存在一些问题哈。嗯, 下面会多出一个空白页来,然后这个问题我们记一下,一会也让 ai 给我们解决。然后另外呢还有一个问题啊,就是我们的这个 pdf 看起来好像不是很清晰,然后这里面的字呢,也没有办法,就是直接选中复制。嗯,这两个问题需要让 ai 帮我们解决一下。 第一个我们导出的 pdf 文件呢,多了一个空白页,第二个导出的 pdf 文件不够清晰,且没办法选中文字,然后让 ai 排查问题,提出解决方案。 好,这个时候 ai 呢它已经找到问题了,然后它下面呢给出了几个解法,我需要我们去抉择一下,我们就使用它推荐的第一个吧,使用 react pdf。 好,我们看到啊,现在这个,呃, ai 呢,已经帮我们把这个新的生成 pdf 的 插件的这个代码生成好了,然后我们来测试一下。好,我们回到网页里来,我们点一下导出 pdf 测试一下, 哎,我们可以看到现在这个简历已经能够正常显示出来了,然后这个清晰度呢也是符合我们的要求的,这里面的这个文字呢也是可以去这个复制粘贴的。好,那么接下来呢我们继续来调整,我们可以看一下啊,就是新的,我想实现一个什么样的功能呢? 每次大家自己手动来打这个,呃,项目经历呢是比较麻烦的,我现在就想能不能就通过一个 ai 一 键录入的方式,就是我们在这个地方呢放一个输入框,然后我们可以把我们所有的相关的信息呢都直接一股脑的输入到这个输入框里, 然后我们让 ai 呢帮我们解析出来并润色简历,最后呢都给它自动的塞到各个这个模块里面来。 好,我们来让 ai 实现一下这样的一个功能。好,我们先把我们的需求简单描述一下,就是在网页左侧上侧 呃新增一个输入框,用户可以输入全部个人信息,然后提供给提供一个 ai 一 键解析的按钮,把用户输入的内容让 ai 进行解析,并把解析出来的内容直接填充到对应的各个信息模块里。 接下来呢我已经准备好了一份让 ai 生成的一个模拟简历啊,然后去供我们去测试,这个简历大概就是长这个样子,我这是让 ai 帮我来自动生成的,然后呢我的目标呢就是让 ai 去完整的读取这样的一个内容, 然后他就能把这里面所有的基本信息自动的填充到我们的这个网页里来,然后我的这个需求里面再加上一句话吧,用户个人信息的测试文件是章程个人简历,点 t x t, 然后这个的话一会让 ai 去读取这份个人简历,让他根据这个去构建他的代码,新建一个对话框,切换到 play 模式,把刚才我们的这个需求粘贴进来,你先分析一下需求,然后规划如何开发。 好,我们可以看到现在这个已经执行完成了,然后我们访问一下网站看一下。哎,我们现在可以看到现在这里面出来了一个 ai 一 键解析简历的一个板块, 这里面他让我们粘贴这个人的工作啊,个人的履历信息。好,我们把刚才我们准备好的这个个人信息给粘贴一下,复制,然后回到网页里来粘贴,一键解析。 好,这里面提示在解析中,我们等一下解析后的结果。 好,我们看到啊,点击完确认之后,我们可以看到,呃,我们的这个内容呢,呃,刚才我们输入的这个信息呢,已经被填充到这个各个模块里来了,我们可以检查一下。 嗯,这就是我想要达到这个效果。当然了这里面这个职位是空缺的,是因为我们原来就没有给我们看下右边这个效果。嗯, 我们还是把每一段的这个看一下工作经历能不能优化一下。好的,我们现在已经让 ai 帮我们把这个所有的这个内容都优化了。然后现在还有一个比较呃重要的问题啊,就是我们的这个简历里面好像没有这个上传照片的功能, 我们呢让 ai 呢在左边去新增一个照片上传的功能,这样的话我们就可以在简历里显示自己的照片了。 好,我们先给 opencode 提一个计划。 好的,我们看到现在照片上传的功能已经完成了,然后我们打开网页去检查一下,点击上传照片 选择,这也是我用这个 ai 生成的一个虚拟的小姐姐。好的,我们看到啊,就是我们当这个上传照片之后,它就已经在右边进行显示了, 然后我们再去测一下这个导出 pdf 的 这个功能,当然这个名字它有点歪啊,样式的一个问题,我们后续再调整一下。嗯,这里存在问题啊,就是在我们导出的时候,这个照片并没有被导入进去,这个需要 ai 来帮我们去解决 好。导出 pdf 的 时候照片并没有被导出,先排查一下问题。好,现在 ai 告诉我们已经修复完了,我们重新打开网页去检查一下, 这里面的话我们给它起名是杠六,我们看一下。好,现在我们可以看到啊,这个简历里面的照片呢,已经可以正常显示了,这就是我们这个一个修改后的一个效果。 好,以上呢就是我们出版的这个用 ai 生成一个网页,让它帮我们自动生成简历的这么一个功能。网站的整体的一个功能呢,其实现在已经可以初步可用了。 然后今天由于时间关系,就给大家分享到这里,后续如果持续优化的话呢,首先这个界面这个样式需要再重新调整一下,把这边这个布局呢稍微的去设计一下,现在这个带着滚动条,看起来呢非常不方便。 然后右边的这个 pdf 呢,它的这个一个样式的排版呢,其实我们也可以再去调整一下,包括这里面可能缺失了,现在是有一个校教育的背景,可能没有哈,我们其实都可以通过 ai 呢,让他把这个功能加进来。 另外呢后续我们这可以去做一个模板切换的一个功能,我们可以通过同样的一个简历内容呢,经过这个模板的切换,然后可以达到直接输出不同的这个简历样式的这么一个效果, 这些功能呢通过跟 ai 的 交互,理念上都是可以实现的。好,那今天呢,对这个最近比较火热的 open code 这款 ai 编程工具的分享呢,就到这了。另外的话呢,也看后续大家的一个需求 啊,可以给大家分享一下,就是像这样一个网站,我怎么样给他去部署到上线上,让其他人呢通过这个域名来访问我们的这个网站。好,那今天的分享就到这里,大家有什么问题的话也可以在评论区互动。

这两天最大的新闻就是 cloud code 把 open code 封杀了,很多人通过 open code 去使用 cloud code, 会被通知你的 max 的 订阅会员被封禁,再也无法使用。并且 cloud code 做件很贱的事情,它调整了搜索引擎的关键字的排名,你现在在搜索引擎搜 open code, 大 概率会出现的是 cloud code 这个事带来一个什么样的影响呢?影响就是 open code 这两天在加紧产品迭代,并且积极拥抱 open ai, 这不就等于把我自己的核心用户推给了我的竞争对手吗?从开源的角度来讲,从商业化的角度来讲,我看不到一丁点的好处, 是不是 clark 这种财大气粗的公司就是这么小气兮兮的呢?你的观点呢?我们评论区聊一聊。