粉丝3.5万获赞31.0万

从需求分析到应用部署的全链路,蔻定智能体诞生了。就在最近,字节跳动旗下 ai 编程工具 tree 迎来了重磅的二点零版本升级,这次更新上线了更加智能的蔻定 ant solo。 solo 让 tree 不再仅仅是一个 aide, 是进化成了可以自主规划理解上下文,并且能够独立调用工具执行完整任务的 context engineer 上下文工程师。我们可以通过自然语言描述需求, solo 就能够智能的获取开发中的上下文,包括产品文档、技术方案、代码,甚至网上的知识。 然后 solo 能够智能的使用不同的 context 和工具,最终完成开发任务。 solo 特别适合帮助独立开发者从零到一快速实现完整产品,大幅降低了技术门槛,提升开发效率。本期视频我们来试用一下最新的 solo 模式, 从零到一搭建并且发布一个具备前后端和数据库功能的宠物店应用。开发过程中,我还使用了数据库 mcp server, 让 ai 可以自动创建数据库,自动填充测试数据,大幅简化了开发流程内容。干货满满,我们马上开始, 我们打开吹,目前只有国际版上线了 solo 功能,点击顶部的按钮,这里提示 pro, 用户拿到 soloco 的才可以激活。我先订阅一下国际版的 pro, 然后点击按钮,输入邀请码。可能是因为目前 solo 还希望更多的收集一些反馈, 所以没有全量开放,我帮大家申请了一些邀请码,放在了评论区,还有参加官方活动也可以获得邀请码。开启 solo 模式以后,左侧是与 ai 的对话窗口,右侧则是动态变化的 context 视图,当 ai 在写产品文档的时候,右侧就是 是文档视图,当他在写代码的时候,右侧就是代码编辑器,当他在做测试的时候,右侧甚至能看到网页预览。这样就不需要手动切换不同开发工具的窗口了,整个开发过程一目了然。 我打开一个新的文件夹,接下来我们使用 solo 来构建项目工程。我的提示词是制作一个宠物店的网页应用,需要有前后端,首页要精美可爱,多添加可爱的宠物猫的图片,网页风格要符合宠物市场的调性, 主色调用温暖明媚的颜色。包含三个页面,首页、预约页,还有宠物购买页。后端提供数据库, c r u d 的 a p i。 数据库使用 post greeseco, 请把数据库表的设计按照文档输出出来,后续我会自己建表。下面是几个主要页面的详细设计,首页需要有 banner, 快速入口,用户口碑,还有联系我们几个 模块。接下来是预约页还有宠物商店页的详细设计。然后点击开始 solo 立即生成了一个详细的产品文档,并且在右侧自动打开了文档面板。文档中包括功能概况、核心流程、界面模块,甚至连数据库表都设计好了。 我们可以直接在这个页面进行审查,并且提出修改意见。比如我想调整下技术站,我们就可以直接在右侧窗口进行修改,把 css 框架替换成 tellwind。 我对 api 接口进行了一些精检,一切准备就绪,点击确认开始开发。 solo 首先会自动调用命令,行终端配置开发环境,在执行命令的时候,右侧面板自动切换成了终端面板。开发环境配置成功以后, solo 开始进行编码,开发过程很像 minus 和呆文,只需要自然语言对话就能自动完成一系列的开发任务。这个过程 就像看一位经验丰富的程序员在你面前敲代码,他会自动处理依赖解决报错,每一步的进展都会实时的展示在右侧的拓展视图里面。前端开发完毕以后, solo 马上进行了后端的开发,这里 solo 为后端服务单独创建了一个 package 点 jason 文件,这偏离了我的初始意图, 我立即打断了他,补充了一句, package 点 jason 前后端共用一个,方便后续部署。如果 package 点 jason 分成两个部署的时候,就得前后端分开部署就会麻烦不少,所以这里我要求他不要拆开。对于 ai 辅助编程,我一直以来的观点是, 有了 ai 辅助以后,我们需要把更多的精力从基础编程语法和技术细节转移到系统架构的设计上面,开发者要把自己提升为架构师加指挥家,所以对于技术框架的知识反而要更加的精通。最后 solo 完成了代码 编写,并且在右侧打开了浏览器的预览面板,可以让我们直接查看效果。这是首页的设计需求,里面的几个模块都完美满足了。接下来是预约页面,最后是宠物商城的页面,这里的图片都是 solo 调用 ai 画图自行生成的,效果非常的不错,看起来很可爱。 目前后端还没有配置真正的数据库,我们可以对接一个数据库的 mcp server, 让 solo 获得操作数据库的能力,通过 mcp 直接把数据库表创建出来,然后自动对接到项目里面,点击这里的创建智能体, mcp 添加手动添加。这里我使用的是免费的酿数据库的 mcp server, 之前在独立开发者的穷鬼套餐里面我介绍过他,注意要把这一段替换成酿的 apik, 确认以后打上一个对勾就配置成功了。接下来我们创建一个数据库大师的 ai 智能体, 注意要把这里的酿的 mcp 勾选上,在 solo 模式里面就可以使用我们自定义的数据库。大师,接下来我要求 ai 根据产品文档创建数据库。 solo 调用了 mcp 工具,并且创建了数据库, 并且完善了后端的代码。在开发后端代码的过程中, solo 会经常使用命令行对后端接口进行反复的测试,这非常的好,保证了后端接口的正确性,减少了前后端连调的工作量。最后 solo 完成了数据库的创建,并且把连接信息存入了配置文件。 后端开发完成以后, solo 同时启动了前端与后端,并且自动打开了网页。我们切换到预定页面的时候,控制台出现了报错,我们看到处以自动识别到了控制台的报错,可以点击添加到对话按钮,一键把错误添加到 ai 对话。 solo 分析了错误,并且进行了修复,主要原 原因是后端与前端使用的端口不相同。 solo 帮我们在 vit 里面配置了代理,将后端服务转发过来,解决了端口不一致的问题。我们来测试一下预约的主体功能,这里填一个宠物的昵称联系电话,填一个备注,点击提交,提交结果成功保存到了数据库里面,非常的完美。 我们可以点击这个部署按钮,让 ai 帮助我们一键把项目部署到 worcell 上面,把产品变成公网可用的网站。点击以后, solo 开始自动分析项目结构,并且使用 worcell 完成部署。 我们来测试一下,首页展示正常,但是当我们打开预约页就发生了错误,我把错误再贴给 ai, 让 ai 帮我修复一下。 solo 帮助我们重新生成了一份配置文件,然后我再次执行命令部署项目。我们最后再来测试一下,这次使用公网链接成功完成了预约,数据也 存入了数据库。本期视频我们使用 tree 二点零的 solo 编程智能体,从零到一开发,并且发布了一个可爱的宠物商店应用,整个过程我都没有离开 solo 面板。 solo 是业界第一个以 context engineering 上下文工程为核心理念的编程智能体,覆盖了全场景的开发需求, 给予了开发者强大的支持,而且成本真的低的离谱。本期视频就到这里,我是技术扒扒虾,感谢大家,我们下期再见!

你让 ai 帮你写代码,他写了,但跑偏了。不是模型不行,是你根本没告诉他规矩。 jango 创始人 simon wilson 说得很直白, coding agent 不是 魔法,就是 a i l m。 外面套了一层叫 harness 的 壳,今天我把这个壳拆给你看,拆完你就知道该在哪里使劲了。 很多人以为 ai 编程效果差,是模型不够聪明,其实不是。你想想看,同一个 cloud, 有 人一天交付一整个功能模块,有人连改个按钮颜色都出 bug, 差距在哪?在 harness, 就是 模型外面那层包装。 simon wilson 的 定义非常精确, coding agent 等于 lolm 加 harness, lolm 是 大脑, harness 是 手脚和规矩。没有 harness, 它就是一个只会说话的大脑。你让它改文件,它不知道文件在哪,让它跑,测试,它不知道命令怎么敲。 那 cloud code 的 harness 长什么样?三根柱子,第一根,系统提示你在项目根目录放一个 cloud 点 md 文件启动的时候自动读进去, 这就是你给 ai 定的规矩,技术栈、代码风格,哪些文件不能碰,全写在里面。第二根,工具定义,读文件,写文件,执行命令,搜索代码。 harness 给了 l i m 一 套标准化的手脚。第三根,上下文管理,聊天记录太长怎么办?自动压缩早期对话,保留关键信息,确保窗口不爆。这三根柱子加在一起, l i m。 才从聊天机器人变成了能干活的 agent。 我们再深挖一层,工具调用是怎么跑的?你跟 cloud code 说帮我修个 bug, 它不会直接给你一段代码, 它会先用搜索工具在你项目里找到相关文件,然后用读文件工具看具体内容,想好怎么改之后,用写文件工具精确修改。不是整个文件重写, 是只改你要改的那几行,改完它还会自己跑命令,确认能不能通过翻译和测试。整个过程就是一个循环思考,调用工具观察结果再思考。这个循环就是 agnetic loop, 也是 harness 最核心的机制。 那 cloud code 和 codex 有 什么不同?很多人以为它们都是写代码的 ai, 其实设计思路完全不一样。 cloud code 侧重单仓库深度,它会深入你的项目,读懂上下文,一步一步帮你解决问题。你可以把它想象成一个坐在你旁边的结队程序员。 codex 侧重的是并行隔离, 它会给每个任务开一个独立的沙河环境,多个任务同时跑,互不干扰。你可以把它想象成一个任务分发中心,你扔十个医兽进去,他同时派十个人去做,选谁看你的场景。单仓库深度改动,架构重构复杂, debug 选 cloud code, 批量小任务多仓库并行选 codex, 最聪明的做法是两个一起用。 说了这么多架构,你可能想问,我作为用户到底能控制什么?三个抓手,第一个, cloud md 文件,你在里面写技术栈编码规范测试要求禁止操作。 ai 启动的时候会先读这个文件,就向新员工入职,先读员工手册。第二个, houx, 配置 ai, 每次写完代码之后,自动触发脚本自动跑, link 自动跑测试。第三个,权限控制,能读哪些文件,能执行哪些命令,不能碰哪些目录,你都可以精确设定。这三个抓手加在一起,你就从被动的使用者变成了 harness 的 设计者。 最后给你一个我每天都在用的实战技巧,让 cloud code 写代码,让 code 去审查。你在 cloud code 里写完一个功能,提交到分支, 然后在 codex 里说帮我审查这个分支,找出潜在问题。 codex 会在独立沙盒里拉下代码,逐文件审查,给你一份详细的问题清单。为什么双 ai 比你自己代码审查更好? cloud code 偏局部视角, codex 在 干净环境里大局审视。这件事我每天都在做,效果非常明显,两个 ai 互相盯着,你反而漏更少。 总结一下, coding agent 不是 魔法,是 l l m 加 harness, 你 能控制的就是 clode、 md, hooks 和权限这三个抓手,把它们写好, ai 就 不会跑偏。 如果你也在用 clode code 或者 codex 评论区聊聊你的如何配置的,关注我,每天分享前沿 ai 工具的真实体验。

全景理解能力, code 精灵中射出扫描光束,快速分析整个项目文件数,形成一张知识图谱。精准执行能力,帮我处理异常。 code 精灵马上飞入文件光标,自动跳动,高质量的代码块和 try catch 结构被精准写入安全代理。面临复杂任务时, code 精灵分列出两个分身,一是温和的蓝色分身, 只读分析,提出一份详细的修改计划清单。二是强力的金色分身,由小智确认后获得授权才动手修改代码。 这就是 open code 的 强大超能力,一个住在你终端里的开源 ai 助手,它不绑定任何模型,给你绝对的自由。你是否经常性的在多标签页、文档、 stack overflow、 keycap、 issues 和代码编辑期间频繁切换、复制、粘贴? 现在只要应用 open code 就 能告别繁琐,拥抱智能,让每一次编码都成为思想的直接延伸。

今天聊一个最近 agent 的 开发领域,最火的概念叫 harness engineering。 如果你最近在关注 ai, agent 的 技术圈一定到处都能看到这个词, 但大部分人对它的理解停留在给 agent 加约束这个层面,这远远不够,今天我们把它彻底讲清楚。看完之后你会发现,业界一直以来对 agent 做的技术优化,本质上还是做同样的事情。 先从一个反直觉的事实说起, land chain the coding agent 在 terminal bench 排行榜上从三十名开外,一路冲到了前五。整个过程中,底层模型一行没换,始终是同一个模型,它们只动了三个东西,系统提示、工具配置和中间箭钩子。 这个结果直接挑战了 ai 开发中一个根深蒂固的假设,就是更好的性能,需要更大或更新的模型。 lincoln 用实际数据证明模型不变的前提下,光靠优化模型周围的系统就能带来数量级的提升。它们用的方法论就叫 harness engineering。 那 harness 到底是什么意思?这个词来自马距,比如江绳、马鞍等用来引导马匹朝正确方向走的装备。这个比喻是刻意的。马是 ai 模型,强大、快速,但它自己不知道该往哪走。骑手是人类工程师提供方向,而不是亲自跑。 harness 就是 骑手和马之间的那套控制系统。 这个词最早的定义非常简洁,每当你发现 agent 犯了一个错误,你就花时间设计一个解决方案,让 agent 永远不会再犯同样的错误。 lanchain 在 此基础上给出了一个更精炼的公式, agent 等于 model 加 harness, 模型包含智能 harness 让这个智能变得有用。 把模型想成引擎, agent 就是 整辆车,而 harness 就 好比方向盘和刹车,最好的引擎没有方向盘和刹车,去不了任何有用的地方。这里有一个关键区分,你可能听过另一个类似的概念,叫 context engineering, 上下文工程,它们是什么关系? 一句话讲清楚, context engineering 问的是我们给 agent 看什么, harness engineering 问的是系统预防了什么,测量了什么,修复了什么。 更准确地说,上下文工程主要关注怎么管理 agent 的 上下文窗口,给他看什么信息不看什么信息什么时候看。而 harness engineering 的 范围更广,它还包括架构约束、自验证、循环商治理和系统的可研进行,两者之间互相包含。 好概念,讲清楚了,那 harness 具体包含什么?我用六个关键词来概括。第一个,上下文架构,前沿团队一致发现,给 agent 塞太多信息反而有害。有研究表明, agent 的 性能在上下文利用率超过大约百分之四十之后开始下降。 所以关键不是给 agent 的 一本百科全书,而是给他一张地图,让他按需查找。 open ai 的 做法是把 agent 的 d 文件控制在大约一百行,只充当目录,指向更深层的文档。 agent 需要什么信息自己去查,而不是一开始就全部塞进去。 anthropic skill 的 渐进式加载理念也是为了解决这个问题。 第二个,架构约束。大多数人靠 prompt 来约束 agent 的 行为。写,请遵循以下规则。但 prompt 里的规则本质上是建议模型可以听也可以不听。 前沿团队的做法是用确定性的工具来机械式执行约束,比如自定义的 linter 和结构化测试规则,一旦编码,就在所有 agent 的 绘画中同时生效,不依赖模型的自觉性。这里有一个反直觉的发现, virso 一 开始给 agent 提供了大量工具,什么都能用,结果 agent 反而变得困惑,做荣誉调用。 后来他们移除了百分之八十的工具,只留最必要的 agent 反而更快更可靠,约束解空间反而提高了产出。 第三个,自验证循环。 agent 有 两个常见的失败模式,一是陷入死循环,对同一个文件反复编辑十几次,但问题始终没解决。二是交付时跳过验证,第一个看起来合理的方案就直接输出了。 line chain 的 方案是用中间键钩子来解决,一个中间键跟踪每个文件的编辑次数,超过预值就提醒 agent 重新审视方案。另一个中间键在 agent 准备退出时拦截它,强制执行一轮完整验证。他们还发现了一个非常有价值的策略,叫推理三明治。 规划阶段用最高推理强度充分理解问题,执行阶段降到高等推理强度保证速度。验证阶段再拉回最高推理强度补货错误。全程最高推理强度反而成绩更差,因为会超时把蒜粒花在刀刃上,效果最好。 第四个,上下文隔离。当任务复杂到需要多个 agent 的 协助时,关键不是按角色分工什么前端 agent、 后端 agent, 而是把子 agent 当做上下文防火墙。 父 agent 只看到他给子 agent 的 指令和子 agent 的 最终结果,中间所有的工具调用和中间产物都被隔离掉了,这样每个执行单元的上下文都保持干净,不会被无关信息污染。第五个,商治理。 agent 持续运行的时间越长,系统的混乱度就越高。文档过时,架构漂移,知识库和代码不一致。 openai 的 方案是引入一个后台运行的文档,梳理 agent, 定期扫描过时的文档,并自动提交修复。为 agent 服务的文档由 agent 来维护,形成自维护的闭环。 第六个,可拆卸性。这是最高维度的一层,更好的模型会让某些 harness 组建变成瓶颈。二零二四年需要复杂流水线的任务,二零二六年可能一个 prompt 就 搞定了。 所以 harness 必须是模块化的、可拆卸的。 line chain 的 中间件架构是目前最好的参考,每个中间件独立添加特定能力,不需要的时候直接移除,不影响其他部分。最后说一个关于投资回报的关键认知, harness 的 投入是以复利形式生效的,你今天加一条 linter 规则之后,所有绘画中这个错误都被预防。你今天加一条验证中间件之后,所有任务的交付质量都提升。这意味着 harness engineering 的 投入越早累积收益越大。 但同时也要警惕过度工程化。有一个很务实的原则,只在 agent 确实犯过的错误上投入 harness, 不要预防性的去解决还没出现的问题。 一句话总结, harness engineering 的 核心主张是, agent 的 可信瓶颈不在模型,在模型周围的系统。模型是引擎, agent 是 整辆车。引擎再强,没有方向盘和刹车,到不了目的地,这就是 harness。

就是今天咱们做的就是这些所谓的这些产品,手机也好,卖扑克也好,这些产品都是给人类用,但不是给 ai 用,是我最近一段时间想明白了一个道理,我觉得这个还挺牛逼的,就说托尼,他其实不是狭义的编程,或者叫作程序。 我原来是这么认为,抠钉就是做程序嘛,然后你看我刚做那些产品,其实都是程序做出来,但实际上并不是,我后来理解,就这个东西可以延展到未来 ai 的 这个发展方向就是抠钉。其实本质上你还想象一个场景,就是这个电脑出来是什么时候,然后互联网 hdp 出来,这个协议出来是什么时候? 有了互联网协议之后,互联网怎么发展的?有了三门户,有了电商这一系列都是怎么发展?大家因为咱们都上年纪了,就是咱们都经历过,所以本质上抠定是什么呢?抠定就是计算机本身,我认为再推导计算机本身就是互联网本身,就是计算本身, 我觉得这个东西更重要。什么叫抠定的计算机本身呢?就是今天咱们做的就是这些所谓的这些产品,手机也好,卖扑克也好,这些产品都是给人类用的, 但不是给 ai 用的。我以为这个底层代啊,就是零跟一,然后人家马斯克就牛逼啊,他说零跟一就是人类发明的,就是二进一,是给人看做最好的事,但他提了个词叫什么项链,我没去深研究什么意思就是 ai 呢?更底层应该是他提的那个项链做的东西, 就他都甚至不是代码,那个代码也是给人看的,人编辑的,然后代码做完做成了一个可直观的界面,这个全部都是给人看和给人交互的,所以 ai 的 未来肯定不是往这个方向发展,所以现在已经有了趋势了,他并不需要打开一个网页,打开一个 app 在 模拟人类的操作,并不需要。所以我认为这个偷听这个事,我原来想的是错, 错了,他不是编程,他就是计算本身,我觉得这点是非常非常重要,所以也就是说倒回来对咱们的指导意义是什么呢?就是我觉得大家除了按照你们可以沿用我那套路径,首先从拆过了开始,对吧?在过渡的时候扣定 a 整,但我认为是如果咱们要用这东西的话, 你是脱离不开这个扣定这个本身,嗯,就是大家最终最好就直接就是拿它来做东西,一定要用到扣,一定要用到扣,因为这个东西就是未来的底层逻辑,扣定就是一切底层逻辑。你想我们用的系统什么的,他不就是代码掏出来的吗?所有东西都是,所以我认为它是扣定本身, 所以我认为这个扣定能力实际上在二五年,虽然这个市场成长了很多,但我觉得应该是被严重低估的,因为普通的用户他应该理解不到这个层面, 我就觉得咱们可能慢了。我不知道大家知不知道那个 cloud code 的 这个产品,这产品是怎么出来的? cloud 这家公司,阿里巴巴这家公司也挺有意思的,这个 cloud code 的 这个产品就是他们公司的三个程序员用 cloud 的 这个产品做出来,包括咱们 cloud 这个产品,就 peter 只一个人,他一个人通过 webkit 做出来的。

装了欧本科唠,但不知道装什么技能,今天直接给你开发者最强技能组合推荐!一,扣定 a 战神核心编码技能, ai 能读写文件,改代码,跑测试深沉新功能二, d 套直接操作仓库一,休所 p r cammi 二 build 代码 三, play rich mcp 或 agent 浏览器自动化, ai 自己上网查文档,看 stock overflow 提取 api 信心。四, self interbrand agent 自我叠代, ai 记住你的偏好和错误,下字写代码越来越准。五,查不立 search 或 five pro 高级搜索, 实时查最新技术文档和最佳实践。装好后在对话框里直接说自然语言指令就行。这个技能组合装上后,欧本科唠基本能当你的专属头顶 pass 那 儿用了。

程序员开发一个网站一共需要几步?从正常的流程来说,一般需要理清需求、产品设计、创建环境、编写代码、软件测试、部署、上线等几大步骤。而如果是用 ai 来写代码,就要简单很多,有的工具甚至只需要对话, 但这个过程对于专业程序员来说却不一定是好事。因为呢,在聊天框中表达出的内容是有限的,只靠提出一个需求就想开发迭代出一个符合需要的复杂项目会非常难,很多时候甚至越写越烂。大家好,我是选立九九。 而现在,我期待已久的 tree 二点零 solo 模式终于上线了,它不仅串联起来前面我提到的各大步骤,还能在每一步中智能获取上下游的各类 context, 并调用工具完成任务。只通过介绍不太好理解,下面我来举一个实例。很多养小猫小狗的都会和我一样担心某 些食物是否可以给宠物食用,误食之后是否有毒,所以我就想做一个查询网站,可以检索对猫狗有毒的东西。 把我的需求提供给 ai, 可以看到,他并没有着急编写代码,而是先对需求进行了分析,然后观察了一下我电脑的本地环境,根据已有的信息详细制定出了一份需求文档,包含产品的概述、核心功能、具体的页面设计、核心流程。 并且这个文档并不是只能看,而是可以修改的,里面有任何不符合我需求的都可以随时改掉。不得不说, a 写的文档比我见过的某些产品经理都要强的多。 有了需求之后,点击确认,开始开发, ai 才会进入开发步骤,但仍然不是写代码,而是先创建开发环境。我这是一个前端项目,所以它调用了电脑上的终端,自动搭建了脚手架,自动安装了依赖很多人 桃园的环境,搭建 ai 干得又快又好。然后负责开发的 ai 查看了一下刚刚的需求文档,正式开始了写代码。在这个过程中,他还发现有一个 excel 相关的包没有安装,并自动把它补充了上去。 在开发的时候,虽然大部分工作都是 a 来完成,但是我也可以随时干涉,对代码进行调整。在第一次开发完之后,我也可以长期和 a 配合,对项目持续的迭代。开发完代码, a 会先在本地把项目运行起来。 在这个过程中,我可以通过内置的浏览器浏览页面的内容,并进行项目测试。此外,他还有一个我认为非常离谱的功能,在页面右上角有一个叫选择元素的选项, 点击之后网页会进入选择模式,点击一下就能选择页面的元素,并把它添加到对话。那他有什么用呢?比如我现在感觉 页面下方的颜色不够醒目,就可以直接选中文字让 ai 进行修改,相比此前只能单纯对话来给 ai 提供信息,这种方式精确且高效的多。 最后,项目开发完毕,翠把部署的步骤也给集上了进来,只需要点击一下部署按钮,项目就会自动被部署到 verso, 然后随时通过链接访问。通过上面的开发过程,可以很明显的感觉到,相比翠一点零版本,二点零进行了非常大的优化和更新, 整个过程非常丝滑,并且他不只是把所有工作都交给 ai 来完成,而是每一步都可以由人参与进去。自身程序员可以始终把握开发的主动权,初级程序员和开发小白也可以依赖 ai 来提升自己的开发能力。 目前吹二点零海外版本已经上线, solo 模式限量开放, pro 会员可以拿到 solocod 后激活使用,关注官方渠道就有机会获取到 soloco 的邀请码,体验编程的新形态。以上就是本期视频内容,我们下期再见吧!

随着 open core 的 爆火,调用大模型所花费的掏根数也随之水涨船高,如果你还在用 api king 的 方式,那么离破产可能只差几句话了,因此我做出了一个违背祖宗的决定,给大家带来国内四家平台 cookie plan 月套餐的对比。首先出场的就是我们的 mini max, 然后就是 g m l 智谱, 然后是火山引擎,最后就是我们的阿里百链平台。介绍完了这四家厂商,接下来就来介绍一下我们的规则说明。 我们仅以四家平台的月 coding plan 套餐作为对比,记住是月而不是季度或者是年。然后就推出我们的换算规则,换算规则就是一 p 等于十五次模型调用, p 就是 promote, 一 promote 就 相当于你使用 coding plan 套餐完成了一次完整的调用,而一次完整的调用在模型后台可能被切成了十几个任务, 有读取上下文,提出建议,修改建议,调用工具之类的就会非常的复杂。然后官方为了简化计费计算,就统一把这十几次连续的模型调用打包成了一次 promote。 然后我们再来介绍它的额度限制,它有第一种就是五个小时限制,一次额度就是你每五个小时达到了它的调用上限, 它就会限制你调用,然后直到这五个小时过去,然后它会再刷新额度,然后就可以再次使用,然后一个月就是这样一直重复。接下来就是周总额度限制,就是在五个小时的额度限制之上,你每次花费的 token 在 一周内累计不能超过它一周内的总额度上限。 然后就是月总额度,在周总额度限制的前提下,每家你每周所使用的额度不能超过一个月的总额度上限。如果你超过一个月总额度上限,那么你这个月就不能再用这个套餐了,因为它已经额度用满了。最后我再来提一下,我们的月是按每个月三十天来计算的。好了,接下来就介绍一下我们的第一家平台 mini max。 mini max 我 们看一下它是有六种套餐的,我们先来看最下面三种,从 star 每五个小时掉,我们的 promax 数也是逐渐长高的。 然后再看上面三种,有 plus 极速版到 ultra 极速版,它的价格也是这样递增的,然后它每五个小时可以调用的 oppo 的 次数也是在递增的, 但是它多了一个后缀就是极速版。极速版就是相对于下面三种套餐来说,它们模型的调用速度快了不少。然后我们总结了上面的价格和每五个小时的额度限制,我们就统计出了这样一个表格, 因为 mini max 只限制五小时额度,所以我们就通过一周大概等于三十三点六个五小时,推算出了它的周最大额度上限。然后我们再计算出一个月等于一百四十四五个小时,可以推算出它的月额度最大上限。 因此我们整理出了这张表格,然后就是它支持的模型定有 mini max 二点五、 mini max 二点一和 mini max 二。然后我们再来看第二家智普, g m l g m l 是 有三种套餐呢,只有 leader pro 和 max 版本。智普也是在国内 callenplan 套餐中它是最抢手的,每天早上十点钟刷新,你去看一看,其实很快货就会被抢空了,也不知道为什么,难道是饥饿营销吗?然后我们来继续往下看,相比于 mini max 的 每五个小时只限制一次额度,它增加了一层规则,那就是周额度上限。 既然有了周五的双线,因此我们可以算出每个月大概有个四点三个周,我们可以得出大致的月利润最大双线。然后我们再看它支持的模型,它 leader 套餐不支持 gm 幺五模型,然后其他所有套餐都支持 gm 幺五和 gm 幺四点七及其所有的历史文本模型。 接下来我们再来看第三家,也是我们的火山引擎,也就是豆包,它只有两种套餐, leader 和 pro 套餐。然后它跟前面两家比的话,不一样的就是 它不采用了 promote 来计数,它采用的是模型调用次数,但是在它的文档中也说明了它每一次调用也会花费大概十几二十多个不等的调用次数,所以我们也可以 理论上给它计算回来,这样就得出了每五个小时然后周额度和月额度的 promote 次数。然后可以看到它支持的模型是 豆包二点零, coder, 还有豆包 coder, 还有 g m 幺四点七,然后 d s c v 三点二,还有 kimi 二点五,支持的也是非常多。然后再看最后一个就是阿里一百链平台,它的套餐是和豆包其实一模一样的,然后它的收费标准还有额度上限都和豆包是完全一模一样的, 它两个不愧是相互对标的模型平台,搞的套餐都是一模一样的。然后再来看它支持的模型是千万三点五 plus kimi 二点五, g m 幺五 和 mini max 二点五,还有千万三, max 还有千万三, codenix 还有千万三, codenix 还建妙四点七,所以从模型的角度上来说,它还是略胜火山引擎一筹的。 我们介绍完了四个平台,我们再看下全平台的性价比对比。我们的性价比对比,采用它每个月理论上能调动的最大蓬勃的次数, 除上它的价格,我可以算出来多少 promote 美元,这样我可以计算出它理论上最大的性价比。然后我们可以看到,在这个排名中, mini max 家族可以说是遥遥领先,垄断了第一的位置,接下来就是我们 g m l 垄断了第二的位置,接下来就是豆包和火山引擎 并列第三名。好吧,这究其原因其实也很简单,因为 mini max 平台它只限制五个小时的调用额度, g m l 平台只限制一周的调用额度, 火山引擎和百联平台限制了一个月总额度,所以从理论上极限来计算,那么必然是限制越少,它理论上调用的次数就越高,所以 mini max 领先于 g m l, g m l 领先于火山引擎和百联平台。然后分析了极致性价比之后,我们再来看模型丰富度对比, mini max 中只有支持它的 mini max 的 三款模型,智普只支持它的 g g m l 家族, 然后火山引擎的话就支持豆包还有 deeptech gm, 它都支持。最牛的就是百炼平台了,它有八款模型,分别是千问系列,还有 kimi gm 幺五, gm 三七。 mini max 二点五,它可以说是把过年以来国产最好的四款模型都集齐了,也就是 我们的千问三点五、 plus kimi 二点五、 gm 幺五、 mini max 二点五,这可以说是过年以来最好的四款模型。 从模型丰富上对比,我们的百例平台有八款模型,我们的火山引擎只有五款,仙妙的话只有三款, 还有迷你 max 的 话也是只有三款。从模型丰富上对比,我们的百例平台遥遥领先。说完了模型丰富度和我们的性价比,接下来我们就推荐一下。推荐那当然是要为不同人群量身定制的,我们第一个就是为小白新入门的小白人群推荐, 每个月预算大概四五十块钱,我们就推荐他火山引擎和百联引擎的 live 套餐,他足够便宜,而且每个月有一万八千次的模型调用,也足够你入门了。 然后他的模型还很丰富,就可以支持你用多种模型,让你感受一下是不是新手小白,肯定都很想感受一下不同模型的效果到底怎么样,这是非常适合新手小白入门使用。接下来就是追求极致性价比的人群了,他每个月预算大概一百到一百五十元,我就推荐 mini max 的 max 套餐, 它的性价比最高,理论上来说是美元,可以调用三百六十三次 promote, 理论上每个月可以调用六十四点八万次大模型,所以它的价格也适中。然后性价比是最高的,就是最适合追求极致性价比的人群。 然后如果你如果是日常开发者,预算在一百五到两百元之内,那么推荐你用 g m l pro 或者火山引擎 pro。 g m l 的 理论上调用次数还有豆包的都是很多的,而且豆包上的模型也比较多,然后 g m l 五的编码能力也是非常强的,这样就推荐我们日常开发者使用。 如果你是,如果你是 vivac 的 重度依赖用户,那么就肯定是提高你的预算四百到九百了,那我们就推荐你用 mini max ultra speed 或者是 g m l max, 那么调用次数是有着最大的保障,同时还兼具着最最快速的响应速度,这样足够重度用户使用,不仅兼顾了量,而且还有速度,而且因为它有足够大的量和足够大的并发症,所以它还可以支持多团队使用,团队可 能买这样一个大套餐就够一个团队使用,但是接下来我们再看,如果你是一个疯狂的模型体验党,然后呢?预算大概在四百到两百元,那么肯定推荐你是百练的 excel 或者是 pro 套餐了,它有八款模型 可以供你选的,同时还有四款是国内最好的大模型,一站式可以体验多种 ai。 最后一种就是追求稳定额度的,他们就推荐火山引擎和百联引擎, 他们的每个月调用次数都有明确的上限,不像其他平台 promote 计算的模模糊糊,然后它还不会产生多余的额外花费,算是可预算可控场景,适合追求稳定额度的人群。这样一份 cookie plan 保姆级入门教程,你喜欢吗?

ai 现在落地最成功的应用可能就是辅助编码的 coding agent, 像是 cursor or call code 这些产品呢?其实在很多企业的 it 部门以及生产性的大规模部署使用了 最近刚刚被 meta 说过的 minus, 它们也声称能够用 agent 帮人完成很多任务。但实际上呢, minus 做的事情大部分还是一个从零到一的事情, 也就是从什么都没有说一句话,征成网站,生成 ppt, 包括去做一些这种分析等等。但事实上呢,我们在企业里面的大部分任务,它往往不是从零到一开始的。 比如说我们在公司里面做一个 ppt, 可能很少有从一个完全白板的状态来做 ppt, 而是说你已经有了一些材料,你有一个上一版本的旧文件,你需要针对这个文件做一些更新,或做一些内容的排列组合,增加一些新的内容等等。那在这个领域呢,其实是一个从一到一点五的改变, max 和其他的这种生成式 ai 很 适合做零到一的。改变得什么 ai 现在适合做零到一呢?因为你从零到一的时候,你是没有之前这些历史,你需要学习的之前的这些工作和文件,你可能不光要看它文件的状态,你还得理解之前的这些工作它的意图是什么。 而且你从零开始的一个白板画布呢,也没有太多的限制。 ai 只要把你当前输入的这个 prompt 理解到位,给你生成一个看起来合理,看起来 ok 的 结果,就能够让你接受了。如果你有一些之前的材料,它如何能够确保这种稳定性? 其实现在 ai 也没有解决的很好,这就为什么除了像 coding agent 这种应用,我们很少看到现在 ai agent 在 企业真正能够大规模的去实际的落地。那我们反过头来看,为什么 coding agent 可以 呢?因为扣的这个代码本身 它是一个非常有结构化的文字,这个结构呢,不光是在代码内部的这些语法规则上面,也在于它的文件名称,函数名称,各种引用的锁影关系,包括代码呢也可以去做各种测试,代码上面也有各种的注解, 这些所谓的内容呢,都明确的在铭文里面表达了编码者的使用意图,所以 ai 在 阅读代码仓的时候呢,就可以很明确的 get 到这个意图, 再结合当前用户一些修改指令,就可以基于现有的代码仓呢做一到一点五的修改。此外呢,代码还有一个非常有用特性,就是它是有一个编码器, 也就是说你这个代码修改之后是否能够执行成功,可以通过 compile 的 结果来告诉你这样一个 feedback, 或者说你可以写各种各式各样的测试。这个测试呢就是一个 ai 的 一个 guidance, 可以 让 ai 修改的结果变成 verifiable, 这种 verifiability 对于 ai 能够去处理好一个任务是非常重要的。但如果你去拿着同样的逻辑呢,让 ai 去修改你的 ppt, 修改你的 ui, 或者让 ai 去编辑你现有的一个企业宣传视频,它们是没有代码里面就是 get difference 的 概念, 也没有一个编码器告诉你什么是通过,什么是不通过。此外呢,用户的意图不光是体现在当前他给你的 prom 当中,更多的是体现在你现有材料的内容结构,甚至视频里面的这些持续关系,都体现了当前这个材料作者想要表达的什么目的。 而这些呢,是现在的 ai 比较难以去学到。很好,我们人在做一个现有的工作,一个材料或者 excel 表格的时候, 我们的大脑和眼睛会无时无刻地去思考我做这个动作之前跟之后有什么区别,然后跟我理解我当前的意图做一个对比。但是 ai 呢,它的优化只是在单次的去生成一个看似比较合理的 next token 上 面,它并没有为我们现在这种一到一点五的工作去做优化。所以一句话来总结呢,就是从零到一的工作, ai 最擅长的是去生成,去 generate, 但是从一到一点五的工作目前最大的瓶颈是在理解。如果说未来 ai 的 发展能够像人一样,以这种视觉或听觉的这种多模态的方式去理解当前我所需要处理材料的背后意图, 再结合用户的指令的话,那么势必能够去带来更大的生产级别的价值。恐怕未来我们需要的不仅仅是一个更强大的大模型,而更多的呢是对于意图进行工程化,也就是 intention engineering, 只有这样才能让更多的 ai agents 真正帮到我们企业的工作当中来。

你以为 web coding 就是 让 ai 帮你写代码吗?而本 clone 创始人皮特说,如果是这样,那么这个词就是贬义词。更扎心的是,他花了两个小时才把这七个真相讲 清楚。今天我帮你一分钟提炼精华,编程小白必看,记得点赞收藏!真想一,懂规则,别瞎玩。和 agent 的 对话是一门技能,每个新绘画都是零记忆的。你要学会 agent 的 语言, 知道他擅长什么,不擅长什么,及时介入,别让他瞎跑。比如让 agent 读代码库,他可能会漏文件,你需要手动指定路径。你也遇到过这种情况吗?评论区扣一。真相二,慢一点,想清楚任务卡住了,停下来,是思路错了,价格理解偏差?还是信息不够? 慢下来搞清楚,卡点比硬干强一百倍。上次我让 agent 写个 a p i 接口,卡了两小时,后来才发现是我没说清楚数据结构,停下来一想就通了。真相三,信任他别强塞。 agent 是 经过海量数据训练的工程师,他有自己的思路,接受不完美,能跑起来就行, 质量和效率之间,先完成再完美。别整天盯着他的小辫子。我之前总想按自己的代码风格改,结果改出 bug, 后来按他的思路来,虽然丑了点,但跑得稳。真相是共情,他会提问,真正的难点不是模型,不会是你不知道问什么。把他当朋友,花时间交流,了解他的边界, 熟悉才能教育,相信复利效应,你的时间投入终会爆发。我刚开始总会问他怎么写这个函数,后来改成帮我设计一个可扩展的接口,给出的方案完全不是一个 level。 真相五, 别指望全自动化,千万别指望一次吐出完美成品,先节俭版感受它的工作方式,然后迭代优化,一边重构,一边成长,这才是王道。我第一次让他做一个完整项目,结果一塌糊涂, 后来改成先让它搭框架,再逐步加功能,效果好太多了。真相六,语言不重要,生态才关键。匹特自己不擅长 type script, 但选它是因为生态强。就像你想做短视频,虽然不擅长剪辑, 但剪映生态最成熟,能帮你快速出片,丰富生态,帮你未来更好的发展。别在语言上纠结。真相七, ai 能取代程序员吗?匹特认为 ai 可能取代写代码的工作, 但产品、体验、架构、设计, ai 永远取代不了程序员。别担心失业,想想如何用 ai 改变工作方式吧,就像计算器没消灭数学家,反而让他们专注于更高层次的思考。这七个真相,哪一个戳中你了?评论区告诉我,我教你具体怎么落地。

agent 在 写代码时你在刷手机。别骗自己了,那几分钟可能是整个开发里最贵的空档。 web coding 听起来很酷,但现实是你一路点 accept, 三天后系统却崩在一个你根本没注意的设计决策上。不是代码错了,是你没在它写的时候想对问题。 聪明的开发者早就不盯着光标跳了,他们在画数据流图,推演失败、场景预判新功能和老模块的冲突。 get up 报告显示,百分之七十八的高校团队强制要求架构预审加关键路径。人工复合 ai 擅长局部最优,系统级风险只有人能看见。比如, ai 写了个推荐接口,跑得快,但你突然意识到,前端每次滚动都请求两百毫秒 延迟,会让用户卡到想卸载,该加缓存还是欲加载。这个念头跟代码无关,却比代码重要十倍。你的角色变了,不再是马农,而是建筑师加质检员。 ai 搬砖又快又好。你的价值在于,问,这楼该建在这吗?地震来了扛得住吗? 具体怎么做,分五层。第一,问题定义, ai 不 会质疑你真需要积分系统吗?但你得自问不做会怎样。 stack overflow 调查显示,高频用 ai 的 开发者花近一倍时间在需求澄清上。第二,系统设计 ai 能写好模块,但模块间的隐私依赖,比如事件驱动还是同步调用。事务隔离级别他看不见。边等 ai 编码,边用草图画服务拓扑作为审查锚点。第三,关键把关。 数据库表结构安全较验并发逻辑。第三方库选择这些一旦定型,改起来要命,尤其可观测性, ai 常漏掉日制和指标买点。第四,质量防线别逐行,看看边界、性能、代码味道、 输入为空怎么办?循环查库了吗?函数名叫 temp result, 这些信号背后往往是深层隐患。第五,偷师学习 ai, 用了个新设计模式,花两分钟搞懂为什么 每周记一两个亮点,能力才不会被自动化稀释。有人焦虑,如果 ai 连架构都能设计,人还有位置吗?也许答案是, ai 靠模式匹配,而人能在没有先例的不确定性中做判断。要不要压住新技术?三年后规模撑得住吗?这些问题没有训练数据,只有直觉和担当。现在我的一天, 上午写设计文档,下午让 ai 干活,我做审查,晚上跑实验想方向。编码时间少了六成,产出反而更高,前提是省下的时间真用在了思考上。所以,别当闲置监督员。你是唯一知道我们要去哪的人。 ai 是 风强劲,但无向掌舵的还得是你。

hello, 大家好,我是文墨啊,我们最近拉了一个团队,是专门做 webcoding 类创业的,那么有很多人很好奇说我们已经讨论了这么久的 webcoding, 那 么什么是 webcoding 呢?什么是 agent? 什么是 skill? 什么又是 web? 四点零, 我今天用两分钟时间给大家讲一下最近的科技趋势吧。 webcoding 呢,中文就叫做氛围编程,那什么叫氛围编程呢? 就是以前 ai 只会回答你的问题和信息,比如说今天天气怎么样,或者说呢,我问的这个问题答案是什么?但是外部限定呢,是一类 ai 工具,也就是说你跟这类 ai 工具说出你具体的需求,它就会自动帮你写代码。当然在一年前,两年前,在 cloud 和 cuda 诞生之后呢, 外部定制一直是不怎么被人看好的,但是随着 codex 五点三,甚至是最近两天 codex 五点四模型的诞生,其实很多就是程序员,甚至 可以说是对代码一窍不通的文科生,都可以通过特别准确的 prompt, 也就是提示词去生成想要的东西,而且这个处理信息的速度和生成代码的准确度是肯定要比一年前要强上好几倍的, 所以说大家也应该逐渐放下对 web coding 的 偏见了。然后第二个就是 agent, 什么是 agent 呢? agent 就是 能帮你干活的 ai, 比如说去帮我预定一下外卖,去帮我看一下今天大盘走势,或者说去帮我做一些什么事情,这种以任务型为导向的 ai, 它们叫做 agent。 然后第三点,什么叫做 skills, 也就是说 agent 是 你的 ai 助手,但是他本身是没有能力的 skill 呢,就像他的技能一样,比如说我给 agent, 比如说我给啊 codex 上一个 skill 叫做 ui u 叉 pro max, 这个东西是专门美化小程序或者说美化软件界面用的,如果没有这个 skill 呢,它就会生成特别丑的界面,但如果你给它装上这个 skill, 它就能生成一个特别好看的前端,或者说你给它加一个可以读 pdf skill, 所以 说 skill 呢,就是 agent 的 技能库。那么什么又是 web 四点零呢? web 四点零呢?是我孙哥,就是孙雨辰,他最近在一个社交媒体上说 all in web 四点零, 当然他一年前说过,奥, in web 三点零哈,但是还是简单介绍一下, web 一 点零呢,就是可以读不能写的,这互联网也就是类似于报纸。 web 二点零呢,是每个人都能参与进来,比如说小红书,评论可以点赞可以评论可以留下自己痕迹。那么 web 三点零呢,就是区块链技术,主张人人都可以拥有互联网资产。那么 web 四点零呢,就是以 ai 为导向,现在就是啊, web 四点零的目前的情况就是说以 ai 作为最高生产地去做很多东西,所以说 啊,大家应该也对目前的趋势有个了解了。那么最近非常火的 open klo 小 龙虾是什么呢?可能前几天的新闻也比较火,比如说广东深圳免费去装 open klo 小 龙虾,小龙虾,然后呢,在这个 某个办公楼面前都已经排满了 open collab 呢,它本身就是一个 agent, 但它非常聪明,比如说你让它查天气,如果你没有安装天气 skill 的 话,它会自己去联网帮你搜索,比如说你让它完成一件事情,你给它全部权限之后,它会动用你电脑里所有资源,会去上网搜索,会去下载文件, 会去以一种就是黑客帝国的形式去帮助你达到你的目标。所以说 open klo 会受到很多人的欢迎,有人用它去预测天气,有人他当做自己助手,甚至有人用它去操作,让他去玩啊,股票啊什么的啊。但是我个人还是, 呃,目前没有尝试过 open klo, 因为他要的 token 特别多,包括他要服务器也特别多,目前对我们团队没有什么特别大的帮助啊。但是后面我可能会 发几期部署 open 可乐小龙虾的模型,然后这就是本期的视频内容,也就是说一下我断更的这一个月我们大概在做什么啊?好,再见。哈哈。

hey, 各位,欢迎来到哎,二零二六年,如果你觉得过去几年就是那个 ai 编程刚起步的时候,变化已经够快了,那你可得坐稳了,因为啊,一个全新的时代已经来了。 今天咱们就来聊一个说实话,已经彻底颠覆了软件开发这回事儿的概念, vibe coding, 咱们可以叫它氛围编程或者感觉编程, 咱们先花个几十秒快速捣蛋一下。还记得吧,就两年前,二零二四年,那时候有个抠拍了的能帮你写几行代码,咱们就觉得,哇,未来已来。然后到了二零二五年,一下子冒出来各种各样的 ai 智能体,他们能自己搞定一些小任务了,当时就觉得不得了。 结果呢,这才刚到二零二六年,整个游戏规则都变了,我们现在谈论的是什么?是意图及架构?这听起来可能有点悬,但它就是我们今天要聊的核心。 好,那为了让你能快速跟上节奏,今天这个解析呢,咱们就分这么几步走。首先带你感受一下二零二六年写代码到底是什么感觉,然后咱们得搞清楚 vibody 究竟是啥。 接着我会给你看看现在大家手里的 ai 神兵利器都有哪些。然后呢,重点来了,走一遍全新的工作流程。最后聊聊你需要点亮哪些新技能,还会带你亲手写下你的第一条 vibe 指令怎么样?准备好了吗? 行,那咱们就正式开始了。第一部分,欢迎来到二零二六年,在这里,你的意图就是新的原代码,对,你没听错,你最需要忘掉的一件事就是那些烦人的代码语法了, 这一点你一定要理解,因为这是最核心的改变。你想想看,过去我们一行一行写的那些代码,什么扎哇、派森,现在它们的作用更像什么呢? 就像编纂后的二进制文件一样,他只是个中间产物,一个过程而已。那真正的元素码是什么?就是你脑子里的想法,你的那个意图。这可不是小打小闹的改变,这是我们跟机器打交道的方式,从根上就变了。 好,那问题来了,这个听起来神神叨叨的 web coding 到底是个什么东西?咱们就来揭开它的面纱。简单说,它不仅仅是一种新技术,它更意味着我们这些创作者的角色要从编码员变成一个测展人。 vibe coding, 它的定义其实就是一种全新的开发方法。你看,你不再是那个吭哧吭哧写具体指令的人了。你的新工作是管理三样东西,意图、审美、还有逻辑边界。你就像一个电影导演,你告诉 ai, 我要一个赛博烹客风格的,用户体验要丝滑的,但是绝对不能有安全漏洞的应用。你把这个 web 给出去,然后 ai 这个超级执行团队就会帮你生成整个系统,你负责的是什么方向、品位,还有最终派板。 你看这个角色的转变就很清楚了。以前的程序员更像是一个顶级的建筑工匠,得亲手把每一块砖、每一行代码都精确的码好,对吧?但现在呢?你成了一个系统测展人, 你不再关心砖头是怎么麻的,你关心的是整个建筑的蓝图,是它的风格,是它给人的感觉。 ai 会给你生成好几个设计方案,而你的工作就是从中挑出那个最对味儿,最符合你最初那个 vibe 的 方案,你的品味现在变得至观重要。 所以啊,圈子里现在流传着这么一句话,也是 vibe coding 的 核心准则,相信氛围,验证结果。 什么意思呢?就是一方面,你要大胆地相信你的直觉,相信你对项目整体感觉的把握,这个 vibe 就是 你的罗盘。但另一方面,你又必须像个严谨的工程师一样,去仔细验证 ai 交上来的作业,看看它到底可不可靠,安不安全。 这是一种艺术直觉和科学逻辑的完美结合。聊到这,你可能想说,哇,听起来很酷,但这真的能实现吗?当然能,不过工友想法肯定行,你手上得有家伙事。 接下来,咱们就来看看在二零二六年,我们这些创作者的 ai 工具箱里都有些什么样的神级装备。 基本上,你的 ai 工具箱主要由这三大支柱构成,你可以把它们想象成一个听你指挥的超能团队。 第一个是像谷歌 project astra 这样的东西,它的超能力是什么?几乎无限的记忆力,它能把你公司所有的设计、文档、代码、规范、会议纪要、全技术,所以它能扮演一个完美的自主架构师,完全理解你的风格和需求。 第二个就是像 openhands 二点零或者 devon 三点零这样的 ai 智能体系群,它们不是一个人在战斗,它们会自己组成一个虚拟的软件公司。对,你没听错,它们会内部开会,讨论方案,分工合作,最后把代码给你交上来。 第三个是 mcp 二点零这种工具,它就更厉害了,它能打通虚拟和现实,让 ai 直接操作你电脑上的软件,调用真实的 api。 这三个家伙凑一块简直无敌了,好工具咱们看过了,那到底该怎么用呢?别急,现在就到了咱们今天这个解析最最关键的部分了,全新的工作流,对于一个新手来说,你到底该怎么一步一步的去写出一个程序来? 整个流程其实就三步,特别直观。第一步叫意图投影,这个名字很酷,其实做起来更酷,你根本不用打开 id, 一 敲代码,你直接拿起手机,对着一个你喜欢的设计用嘴说,嘿,给我做一个类似这种风格的 app, 或者你画个草图扔给他,就是用你最自然的方式,把脑子里的想法和那个 web 直接投影给 ai。 接下来第二步,自主循环。 ai 收到你的意图之后,他不会傻等着那个虚拟软件公司就开始自己忙活了,他们会去上网查资料,设计结构,写代码,然后他可能会弹个窗口问你 老板,你看这个配色够不够,你确认审美和感觉上的东西。最后一步叫实时重构,这是最爽的。 你在测试的时候,觉得这个列表滑动起来有点卡,不够带劲儿,你直接跟 ai 说,让这个滚动更有能量感一点儿。你都不用告诉它怎么改代码,它自己就会在后台分析优化重构。整个过程你几乎感觉不到,但结果就是滑动变得丝般顺滑了,从想法到实践就是这么行云流水。 听到这,你是不是觉得,哇,这编程也太简单了吧,好像什么都不用干了?嗯,如果你这么想,那就错了,他不是变简单了,而是对咱们的要求从纯粹的技术实现转移到了一个更高维度的层面, 也就是说你需要掌握一些全新的硬核技术技能。不过再说新技能之前,咱们得先明白这为什么是一个颠覆性的变化。有三点, 第一,写代码的语法门槛基本可以说没有了,这就意味着任何有创业的人都可以成为创作者。 第二,以前要一个团队,前端后端测试未运,现在你一个人就是一个全站团队,这效率太恐怖了。但最最关键的是第三点,你的创意,你的那个点子现在变得前所未有的值钱,因为实现它的成本大大降低了。 所以这就是你的新编程基础,一共四项。第一,叫逻辑拆解,你得能把你脑子里那个模糊的外吧拆解成一个个清晰的功能模块儿,告诉 ai 先做什么后做什么。 第二,提示词架构,也就是结构化意图,你不能随口一说,得学会用一种清晰有条理的方式,把你的需求完整地表达出来。 第三,也是我觉得最重要的就是顶级的用户体验和审美评价能力, ai 能给你一万种方案,但哪个是最好的,哪个能让用户用了,就离不开这个判断力,只有你才有。 最后别忘了,你得有安全和合规审计的能力, ai 毕竟不是人,他写的东西有没有漏洞,有没有胡说八道,你得是最后那个把关人。 好,理论咱们说了不少了,光说不练假把式对吧?现在就让我们来实际感受一下你的第一个程序,或者说你的第一条 vb 指令长什么样? 看,这就是二零二六年最常见的代码了。它不是拍丧,也不是招网,它是一份用简单标记语言写的结构化意图文件。你看这里,你可以定义整个项目的 web, 比如字体用什么整体,感觉是极简。未来风 技术站你也可以指定,比如用最新的框架。然后在 action 这里,你就用大白话下命令,创建一个带社交账号登录的页面。 最妙的是这个 feedback loop 返回循环。你可以在这儿给 ai 定个规矩,比如持续监控并优化用户的加载速度,目标是低于两百毫秒。你看,你不是在写代码,你是在给 ai 设定目标和原则,这才是真正意义上的合作。 所以咱们得捉入这个观点点, web coding 它绝对不是所谓的无代码,代码儿一直都在,只是你看不到而已。 它真正的意义在于,我们人类的角色被晋升了。以前我们是什么?是翻译,把人的想法翻译成机器能懂的语言。 现在呢?我们是创作者,我们终于可以把所有精力都放在创造这件事儿本身了。在这个全新的时代,所有关于怎么做的反锁问题, ai 都帮你搞定了。 那么一个终极的问题就留给了我们每一个人。当工具和技术再也不是限制你手脚的枷锁时,你的想象力到底能创造出一个什么样的世界?
