今天我们来聊一个特别火的东西,叫 bolt dot new, 它号称能把你的浏览器直接变成一个 ai 软件工厂。这到底是怎么回事?它真能改变咱们开发软件的游戏规则吗?咱们来一探究竟。 不过啊,在咱们一头扎进去之前,得先思考一个挺核心的问题,就是当 ai 来帮我们写代码的时候,我们到底是成了更优秀的开发者呢?还是说我们只是单纯的变得更快了?这其实是我们这次要讨论的关键,一个关于速度和质量的权衡。 想搞明白 bot new 到底牛在哪,关键就得看这个对比。你看,这已经不是一个简单的升级了,而是一个根本性的转变。 过去那些 ai 工具顶多算个代码片段,助手给你点零散的代码,但 bot new 呢?它是个全站应用工厂,你给他的不再是零碎的指令,而是一张完整的生产订单。 好了,那我们就来看看第一部分浏览器里的工厂。嗯,这听起来是有点科幻小说那了,但它确实能做到,就凭你一个简单的想法,一个提示词,就能直接给你变出一个能跑起来的应用程序。 那么这个所谓的工厂,它的核心部件都是些啥呢?首先啊,它直接在你的浏览器里塞进了一个完整的 node js 环境,这就意味着它能一键给你生成一个全站应用, 从 react 前端到 node js 后端,甚至连数据库都给你弄好了。所以说,你其实得到的是一个三合一的大礼包,一个 ai 代理,一个集成开发环境,外加一个实时死福气。 你看啊,这个工厂对审美这块儿简直是秒懂,咱们来看几个例子啊,一个简单的设计词汇能带来多大的改变? 比方说,你扔给他一个词 new morphology, 也就是心理物化,你看整个应用立刻就有了那种从背景里挤出来的特别柔和的质感。 还没完,再换个词试试 cyberpunk 赛博朋克,哇,界面风格立马打变,充满了那种霓虹灯和黑客帝国的味道。就这么一个词,视觉反差就能做到这么大,真的很厉害。 咱们甚至还能玩的更细,比如说,你可以给他一个非常具体的指令,像带有三 d 阴影的粘土钛按钮,这就说明什么呢?说明开发者对最终设计的控制力已经可以达到非常精细的程度了。 哇,听起来是不是很神奇?但别急,任何强大的工具背后都可能藏着代价。咱们的故事到这里要转个弯了,现在就来看看 ai 带来的那些看不见的隐性成本。一份最新的学术研究,算是给我们敲响了警钟。 来,你看这个数字,根据一份叫 s t r u d e e l 的 研究报告,当一个开发者头一次在项目里用上 ai 代理的时候,你猜怎么着,代码行数会暴增?七十六点五九趴?对,你没听错,就是这么夸张, 这可不是个小事啊,它意味着你的代码库正在飞速的膨胀。所以啊,这个快的代价到底是什么?这张图就说的很明白了,你看,代码提交次数是多了百分之三十六,表面上看生产力好像是提高了,但真正的代价在这 静态分析警告多了百分之十八。而代码的认知复杂度,说白了就是这代码有多难懂多难维护,直接飙升了百分之三十九。 所以这就给了我们一个特别重要的启示,你必须得清醒地认识到这种工具到底适合用在哪儿。对于快速搭个圆形,做个最小可行产品,也就是核武器。 但是如果你的项目是要长期维护下去的,那你就必须得加上严格的代码审查和定期的重构,不然以后麻烦就大了。 那问题来了,我们怎么才能驾驭这头既强大又危险的猛兽呢?别担心,接下来咱们就进入实操环节,聊聊一些专业级的策略,看看怎么才能控制住复杂性,真正做出靠谱的应用。 第一招也是最关键的一招,一定要根据你干的活选对模型,比如说那个 standard 模型,就只适合做做快速的样式微调。 而 sonata 四点六呢,算是主力了,八成的日常开发工作都能搞定。但如果你要做的是复杂的架构设计,那对不起,你必须得上顶级的 opus 四点七,因为它最牛的地方是能在开发过程中自己发现问题,自己修正 好。接下来这个坑我估计不少新手都踩过,就是所谓的本地存储陷阱。 bot 默认情况下是把应用的所有数据都存在 blogger 里的, 这意味着什么?意味着你只要一刷新页面,所有数据就都没了。你想想,对于一个真正的应用来说,这简直是致命的。那高手们是怎么玩的呢?这里有一个堪称未来的高级工作流程,分享给大家。第一步,原型先行。 你可以先用像 bolini 这样的专业 ui 设计工具,把界面画好,再导入 bot, 这样能省下大量来回调整样式的时间。第二,维护上下文, 专门建一个 cloud 点 md 文件,把项目的目标要求都写进去,这样就能防止 ai 干活干到一半失忆了。 第三,完全定制。如果你想要终极的自由度,可以用 bot 点 diy 功能,把你自己的模型给集成。正来, 聊到这啊,咱们就要进入最后一部分了。其实啊,所有这些工具和技巧都指向了一个更深层次的变化,那就是你做一名开发者,你的角色正在发生根本性的转变。 所以咱们今天聊了这么多,最核心的一点是什么呢?就是你的工作不再是像以前那样一行一行的去敲代码,当一个打字员了。 你的新角色是一个系统架构师,你的责任是给出高层次的指导,去把控最终的质量,确保 ai 不 会给你造出来一个谁也看不懂的逻辑迷宫。 好了,理论和风险都聊明白了,你是不是有点手痒,想亲自上手试试了? 为了解决前面提到的那个数据丢失的问题,我们准备了一份分布指南,手把手教你怎么用 superbase 给你的 bolting 应用,实现真正的数据持续化。你准备好了吗?
粉丝820获赞1775

中国又搞了个大新闻,这次是人形机器人,直接打破了世界纪录,速度快到惊人!这款名为波特的机器人跑出了二十二点四英里每小时的速度,这可不是闹着玩的,他凭什么这么快? 要知道普通人冲刺的速度大概是十二英里每小时,这机器人几乎是人类的两倍快了。当然,跟博尔特比还是差了点,人家能跑到二十七英里每小时,但机器人还有巨大的进步空间。 要知道之前的人形机器人速度记录才多少,而 bot 直接把记录提高了近三倍,这技术飞跃太惊人了。 更牛的是这家公司才成立两年,两年时间就能做出这种成绩,简直是开了火箭。这家公司之前是做四足机器人的,叫黑豹,同样也是专注于速度和敏捷性,技术积累非常深厚。 他的四足机器人同样也达到了每秒十米的惊人速度。这家公司在运动机器人方面确实有一手,轻量化、高扭矩减震设计,这些都是他们成功的关键,没有这些,机器人根本跑不起来。他们把四足机器人的技术用到了人形机器人上,这才有了 bot 的 诞生。 他们还和 mister beast 合作过,让四足机器人在赛道上和人类赛跑,这创意真有意思。怎么样,是不是觉得中国的 ai 技术发展得太快了? 向这位 ceo 致敬,亲自下场和机器人比赛,这魄力可不是谁都有的。怎么样,是不是对未来的机器人充满了期待?点赞关注,带你了解更多 ai 黑科技!

最近 o p c 一 人公司这个词真是火出圈了。瑞因前高管阿斯伯特最近在推特上感叹,他发现中国正出现一种手搓经济现象,而主角之一就是 ai 助手灵光。 比如这几个网友用灵光随手搓出来的个人打卡工具,本来只是自由关了店不理,竟然拿下了累计两千多笔订单,零成本开发,却实打实的赚了近两万块。 这种爆发力正在颠覆我们对 ai 创业的认知。比如前段时间全网爆火的死了吗 app, 他的创始人也仅仅用了一千多块的成本,就搓出了一个千万级流量的爆款。以前如果想开发一个针对特定小众需求的 app, 得顾团队携带码维护服务器。但在手搓经济时代,只要你有洞察力,灵光就能把你灵光一现的想法变成能赚钱的成品。我自己也测试一下来复刻小红书最近很火的颜色转盘工具, 学生只给林光发了一句话,从热爱审美到交互逻辑,他直接一分钟帮我搞定了。而且他最恐怖的地方在于知识动态编辑,即使你是小白,也可以像真实的开发者一样,通过对话持续优化成品,迅速验证你的创意想法。其实作为已经跑通了一人公司模式的 ai 博主, 我感触最深的就是这个时代,技术已经不再是围墙了,创造力才是唯一的入场券。在二零二六年,你的大脑就是公司总部,而林光就是你的整治研发团队。


腾讯这个 maasai 工具真的非常强大,不要说什么 open core 了,现在豆包的地位都会被它所影响。 我刚用 macbook 安装了一个 maas 工具,结果就有一个推荐的命令,然后让我整理一下常用的一些快捷键。其实我最近几天老是在搜索到底 maasai 哪些快捷键怎么使用,然后让它整理完,直接出了个图片, 图片生成模型,不需要你配置,直接做了一个图片出来,你觉得爽不爽?另外我现在需要去搜索一些热点,直接告诉他,你去帮我搜索热点,不需要你去安装什么 skr, 不 需要再配备什么 api, 不 需要再设定什么 a 卷的,你只要告诉他就行了。而且接下来还有很多功能, 这里有一个济宁广场,斯科,我相信这些斯科,济宁广场都不需要,很复杂,而且还能做一个本地知识库。他的功能还有很多我还没去探索, 但就我刚刚体验的这几分钟,我都可以确定马维斯将是一个王炸鸡的产品,他将影响我们这些国内 ai 工具使用的场景,非常大的一个很好的工具。

部署到底做了什么?你用 ai 写了一个网页啊,那在自己电脑里面打开呢,非常的好用,完美。然后你把你的这个链接啊发给你的朋友,朋友说呢打不开,原因很简单,就是那个网页只存在你的电脑里面,可 能是一二七点、零点、零点一这样的一个网址,然后呢,别人的电脑根本就不知道它的存在,也无法访问它,所以把代码从只有我能用变成任何人都能用呢,这个过程就是今天我们要讲的叫做部署, 英文叫 deploy, ok, 那 部署到底做了什么?本质上呢,部署解决的是一个物理问题,你的代码要跑在一台二十四小时开机连接公网有固定地址的机器上,那别人才能通过浏览器去访问得到它。这台机器呢,我们叫做的就是服务器,它可以是你租来的一个,比如说阿里云的虚拟机, 或者呢是一个专门的一个托管平台,比如说 vs, 或者呢是一个容器化的平台,比如说 docker。 那 部署的核心动作就是把你前面写好的这个代码啊,给他搬到这台服务器里面,启动他,让他开始去响应来自全世界的需求。 然后呢,这我画了一个比较简单图啊,去展示从一个请求从用户的浏览器出发,到服务器返回响应的一个完整旅程。 看用户呢,在浏览器里面输入可能呃三 w w 点某某某的这个网站,那它背后发生事情是什么样的呢?首先 d n s 把这个域名转成一个 ip 地址, 然后 c d n 呢,在离用户最近的节点尝试去返回缓存内容,那如果没有缓存呢,才去参透到真正的这个服务器里面。好,那服务器呢?去运行代码,去查询数据库,然后数据库返回之后呢,把结果再原路返回给浏览器,再去展示, 这整条链路都需要用到我们这边的部署来去做搭建,做维护,所以部署它不是一个动作,而是一整套体系。那从简单到复杂呢?我给大家大致可以分成三个层次去理解。第一个层呢,你可以叫做静态部署, 如果你做的只是一个纯前端的网页,比如说 html、 css、 javascript, 没有后端逻辑啊,没有数据库,那部署就非常简单,把文件上传到一个静态托管平台,它能够去帮你分发到全球用户。像 webselify, github, pages 都是这类的一个平台。你把代码部署到 github, 它自动构建,自动部署,几十秒内全球就可以去访问,这是今天个人开发者最常用的一个起点。 好,做完静态部署以后,第二个呢就是应用部署,应用部署呢,就需要有后台逻辑了,比如说用户登录啊,数据读写、 api 接口,那你就需要一台持续运行的服务器来执行你的代码。这个时候你有两种选择,第一种就是租一台云服务器,比如说阿里云 ecsaws, 然后自己配置环境,去安装依赖,去启动这个服务, 或者用平台记服务的一些平台啊,一些工具,比如说路由,比如说 random, 然后把复杂的服务器管理交给平台,你只管去提交代码。 第三层呢就是容器化部署,当你的应用变得复杂,团队变大的时候,需要在多台服务器上去运行的时候,你就需要有 docker 了和 dockerness 了,那 docker 呢?解决的就是在我机器上好用,换台机器就挂的问题。你的容器可以复制化到各个的啊,服务器 a 啊,服务器 b, 可能服务器 n 这些服务器里面,然后呢去做一个打包, 那在任何机上都可以一致性的运行。而 commerce 呢,就负责去管理大量容器的编排工具,负责像自动扩容啊,像故障恢复啊,像载均衡。好,那接下来呢,再讲一讲一次完整的部署流程是什么样? 比如说从写好代码到用户能够使用,那中间经历了什么?那现在大致部署的流程大致是叫做 ci 或者 cd, 中文呢叫持续集成或者持续部署。 具体呢就是每次你给库取代码的时候,流水线呢会自动的去启动,比如说先去跑测试,然后测试,如果失败呢他就返回,如果测试是成功呢? 哎,那就自动的去构建一个包,然后打包以后呢,部署到预发布的一个环境,然后做最后的验正确认没有问题以后,再去推上生产环境。 整个过程呢,其实都可以去做到几乎零人工的干预。那上一个视频我提到 getup actions 就是 驱动这条流水线的工具之一。那在部署里面呢,还有几个你需要去清楚的概念啊?首先叫做环境, e、 n、 v ok, 那 代码在不同阶段呢,跑的会区分成几个环境, 开发环境就是你自己电脑上随便改,随便试,设置环境呢?哎,就是去模拟生产的沙盒,用来去验证新功能。还有呢就是生产环境,生产环境呢是最关键的,是真实用户访问的那一个改动需要谨慎,三个环境相互隔离,是为了防止开发的时候去改了某个东西,直接去把线上给他搞挂掉 好。第二个叫做 build, 叫构建,构建呢就是把开发时用的源代码去转换成浏览器或者服务器能够直接运行的格式,构建完成以后,他的产物才是你真正需要部署的东西。 接下来呢就是回滚, lowback 部署如果出问题怎么办呢?你需要回滚,那把生产环境恢复到上一个正常版本,这个就是为什么 get 版本记录为什么如此重要,每次 commit 都是一个可以去回去的点好的部署平台呢,通常会支持一键回滚,那几十秒就能够让出问题的版本下线。那旧版本呢?重新的上线, 还有一个呢,叫做零停机部署啊,叫自由当碳。你看我们以前普通的部署方式,就是先停到旧版本再部署新版本再启动,这中间的用户会看到报错或者无法访问,所以以前部署都是在半夜的时候。那零停机部署呢?通过叫拿六部署或者滚动更新的方式,让新旧的版本短暂共存,用户呢无感知的去做切换, ok, 那 最后呢,今天的个人开发者应该怎么部署呢?其实现在的整个部署成本啊,已经低到非常低的一个地步啊, 前段项目的标准部署路径可以是 excel or netfile, 具体呢就是你把 github 上的仓库连接上去,每次部署以后,这种部署有全球的 cdn 免费额度,其实对个人项目啊,已经够用了,域名买好之后再配置一下 dns 就 完成了。好,那后端和全站项目呢? 你可以用路由或者 random 去做这样类似的体验啊,包括连接仓库,选择运行命令平台,负责服务器环境变量,日制扩容,不需要自己再去配置 excel 服务器,也不需要自己再去等 ajax。 如果是 ai 生成的拍摄后端或者需要更多控制权呢?你也可以去搞一个这样的一个阿里云的服务器或者腾讯服务器,价格呢,也就几十块钱一个月。自己装拍摄配环境变量,用 noop 或者 system 让进程呢保持后台运行。 所以呢,部署就是让你的代码从只有在我的电脑上能跑变成全世界都能访问的一个流程,它涉及到了服务器网络构建、流水线环境管理这一整套体系。那对于今天的个人开发者和 ai 变成学习者来说, 实入门路径啊,其实也很短了,想为 sell 部署,前段略微部署,后段 get action 自动触发。那掌握这三件事情,你就已经能够去完成百分之九十的个人项目的部署了。

二零二五年二月, karpati 创造了 web coding 这个词,二零二六年初,他又亲手杀死了它,取而代之的是 agentic engineering。 两者到底有什么区别? 更重要的是,你现在到底该用哪种?看完这六十秒,你会有一个清晰的答案。 web coding, 凭感觉编程,你对 ai 描述想法, ai 生成代码,你得全部接受,不读地府,不看逻辑,代码爆了就复制错误贴回去, ai 自己修,快 一个下午上线一个 mvp, 但也危险,代码长到你无法理解,改一个 bug, 炸出三个新 bug。 工具, cursor bot level 微零,适合验证想法,周末项目学到编程,不适合任何需要长期维护的东西。 agent engineering, 代理化工程,你不再是一个打字员,你是一个指挥官。写 spec, 拆任务, ai 代理执行,你审查每一行的 多个代理,并行工作,研究代理编码代理测试代理审查代理就像管理一支 ai 工程师团队,慢在前面。 工具, cloud code codex c l i gemini c l i 适合生产系统团队合作,长期项目, 六维对比,一目了然。起点模糊。提示, vs 写 spec 设计文档速度,几分钟出原形 vs 几小时出可交付物。代码审查基本不读 vs 每行必审,测试 出 bug 再说 vs 测试先行自动验证,维护越来越慢 vs 越跑越快,风险不可控 vs 有 护栏可回滚。一句话总结, web coding 造玩具, agintic engineering 造产品, 给你三个立刻能用的实操建议。第一,用 web coding 验证想法,打开 bot 或 lovable, 半小时出一个可以给用户看的东西, 快就是一切。第二,确定方向后切到 agentic engineering, 用 cloud code 建项目, 写一个 agents, 点 m d 描述架构 spec, 先行代理执行,逐行审查。第三,建立你的项目记忆系统, 每次运行系统变得更聪明。代理记住你的技术栈,你的代码,规范你的偏好,这才是复利。 两种方式不是对立的,是同一个产品生命周期的不同阶段。用 web coding 找到方向,用 egotic engineering 做到极致关注独自说 ai 分享, ai 跨境电商品牌出海,海外社媒获客和内容营销的实操方法。一个人也能用 ai 搭起增长系统。

欢迎回到深度探索。今天我们要聊的可能是速度最快的当下软件开发领域最具影响力的趋势。毫无疑问,它带来了巨大的加速效应。在 ai 开发者工具领域,我们不止于简单的自动补全,革命性的产品理念 正是驱动这次突破性成功的关键所在,也是现代智能体工作流的具体样貌。而它的速度确实令人惊叹,我们必须设定风险,即刻显现。毫不夸张的说,我们正目睹一些最迅猛的在计算史上新工具的采用我们想探讨的核心问题。嗯, 这问题有点哲学意味,但又非常实际。真正的自主性意味着什么?这些智能体在你开发环境里是不是会改变你正在用的产品呢?说到自主性,我们得先明确智能体工作流具体指什么。对,所谓智能体化,就是指 ai 能完全自主地达成高层级目标。是的, 比如构建一个数据项目,或者开发一个新的 api 接口,它会将这个目标拆解成一个个可的小步骤。最关键的是,它会去这些步骤。它负责管理来自编辑器或运行时的反馈循环,并且能够自我修正,无需你逐条批准指令或代码。 所以,这就像是一个人工智能坐在键盘前,不只是建议下一个词,而是掌控整个任务。没错,这确实定下了基调,而该领域的资金流动速度简直。嗯,这确实令人目眩。他再次证明,这些工具绝非仅仅是新奇玩意儿。不,它们正变成必需品。 我是说,你看看我们原料采购的数据就知道了。库尔茨的母公司 any sphere 最近估值高达九十九亿美元,而这种速度并非只为那些最大的已经站稳脚跟的玩家所独有。专注于这一智能体流程的新公司 bolnue, 其年度经常性收入已达四千万美元, 只用了五个月就实现营收五个月,这速度可不一般,增长曲线简直,这在以往的软件周期里基本不可能实现。它证明了开发者愿意付费这种新模式及时支付。 而雷普利的故事或许是最令人震惊的例子。这股 ai 驱动的势头,他们的 ceo 提到,光是达到这个目标就花了他们三百多天。 a 二,突破百万美元,典型的初创企业成长之路对吧?但现在有了 ai 的 加持,他们每五六天就能增加一百万美元, 仅今年收入就增长了十九倍。这完全是一个纯粹的指数级加速循环,而且不光是收入,更是信任和使用度的全面增长。我这款专为新世界打造的终端,其用户启动次数已近三百万次,特工们每天每天三百万, 而最让我震惊的数字是来源代理商推荐的礼物采纳率高达九十七。哇!看来开发者们不只是尝试这些工具, 他们是在信任,他们几乎是毫无保留的。他们采纳了 ai 的 建议,直接投入生产分支。这些公司行动确实快,但问题是他们到底怎么做到的?他们做对了吗?否则怎会这么快就赢得如此信任和普及?这就是关键所在。 我们得深挖其底层设计理念。市场成功,他遵循一套全新的规则。我们总结出七条产品原则,似乎能定义这一切。 现代 ai 助听工具。没错,我们可以把这七项原则大致归为三类。我认为这将是未来五年产品开发的关键方向。可用性、可控性和速度。 好,我们先从主题 a 可用性说起。这个降低操作门槛的理念,摩擦与启动。这很熟悉。首要原则是什么?从开发者已知的领域入手,这一点直观重要。界面必须能无缝衔接。他们原有的工作流程 已经掌握了,所以无需陡峭的学习曲线完全没有。是诅咒还是沿用熟悉的 ide 界面。 warp 的 成功就建立在终端这个大多数开发者的主阵地上。否采用聊天模式?你得能轻松及时地在写代码和纯聊天间切换,和智能体自然语言对话。 第二项原则,人机工程学。这听起来像是关于微流程优化,没错,专注开发者的使用体验。如果你能一次性搞定按键即可触发, 通常通过智能键盘、快捷键或预设动作实现零上手门槛。我们的目标是五分钟实现全球网络化。这个手法很棒,我们都下载过看似不错的工具,翻了翻文档,结果不到十分钟就放弃了。有罪。 这些新工具则反其道而行之,他们要你运行一个完全好的,在你还没注册完账号时,就已经有实质性的任务等着你了。这种及时、价值直观重要。好的,我们进入第二个主题,控制。这关乎代码的哲学, 一切真的开始改变了,对吧?确实如此,开发者的角色将在这里彻底转变。原则三是它的基础。 聊天功能必须作为核心模块来打造。要认识到,代码其实是一种对人类意图的人为表达,它是一层翻译。确实,随着这些工具的引进,我们不再只关注复杂的语法结构,而是传达意图本身。 你是在指导智能体,而不是在编辑代码。但如果智能体运行的这么快,我想资深用户确实需要严格的安全护栏, 还有很大的灵活性。这就引出了我们的第四个原则,配置的灵活性。这直观重要,对普通用户来说,必须零设置就能立刻看到价值。但对于资深用户,比如架构师来说,就需要极高的可配置性。实际操作起来是怎样的呢? 简单说,就是对提示词精细调整,制定项目专属规则,并能在期间无缝切换不同的模型。比如有些任务可以用更便宜、更快的模型对用来快速重构代码。但当你切换到像 gpt 五或 cloud 四、 opus 这样的重型推理模型时, 在复杂的架构决策上,工具必须瞬间完成切换。而控制这一主题正好关联到第五项原则,整合原则。具体来说呢,有个术语叫 makep, 对 听众来说,这听起来确实像行话。那么 mcp 到底是什么?它又为何成了 ai 开发工具的通用标准呢?所以 maxp, 也就是多上下文协议 能成为标准,主要是因为它解决了代理问题,而大元模型本身只是文本补全,说白了,它就是个罐子里的大脑,刚中之脑,完美。但要成为真正的智能体,它还需要现实世界的眼睛和双手。没屁!就好比大元模型的中路由器, 它是一个可扩展的工具,生态系统规范了智能体查询文件、系统命令以及访问数据库的方式,或者调用外部 api, 这赋予了大型语言模型行动的能力,所以这就是大语言模型与环境交互的指令级,否则就只是在猜测如何指令。 没错,这位智能体提供了可靠的一套始终如一的工具,他懂得如何运作项目。 好,这说的通。最后我们来看第三个主题,速度与流动。第六项原则,核心就是快速迭代开发周期与建立信任,快速反馈循环。开发者需要不断迭代、修改并观察,更新几乎是及时的, 这不再是可选项,而是新体验的核心魅力所在,这占了很大一部分,很大一部分整个行业都有专门的项目在做这个就是为了缩短构建时间,毕竟速度才是当下开发者最看重的事,但速度会带来焦虑,所以 可解释性必须成为首要考量。如果 ai 修改了上百行代码,我必须立刻知道原因,在你考虑提交差异之前,就要立刻想到这一点。 而第七条原则,感觉它就能决定未来智能体工作流这正脉象完全自主的转变实质性任务。 这种让智能体主导的做法正变得越来越普遍,但关键在于这个工具必须支持不同程度的人机协助啊。原来并非非此即彼,完全不是。有时智能体需要停下来询问,提出澄清性问题, 这是生产代码的必要检查。有时开发者可能只管先快速推进,边做边摸索,可 可以依靠所谓的黄框法来做圆形设计。速度与准确性之间的张力是所有软件开发的核心矛盾,而现在人工智能工具正迫使我们把管理方式明确的规范下来。确实如此, 而这也就带来了带我们进入实际应用。这些资料让我们得以一窥取速引擎内部非常迷人,在一个以驱动智能体为核心的环境里, 你依然可以运行其他任务,对吧?哦,对,你当然还是可以运行常规终端命令的,不过默认模式是对话界面,而这一切的真正意义在于, 智能体需要针对不同场景建立不同的行为模式。消息员给了我们一个绝佳的案例研究,用的正是同一个提示,开发一个 nfl 比赛预测应用, 但要用两种完全不同的智能体配置来运行它。战略智能体对阵黄色智能体。没错,这个项目需要抓取长达十年的数据处理信息,并预测未来的胜算。 好,那么我们先从战略型智能体的特征说起。这就是那种追求绝对正确与安全的方案,需要极高的执行度 输出。那个是怎么配置的?所有设置都围绕推理和安全展开,它们将以缜密逻辑著称的 gpt 五与 claude opus 配对。它非常擅长生成这些详尽的分布计划, 而防护栏的作用很紧,我猜非常紧,制定计划总是被允许的,但 shell 命令就据说它总是会先征得用户同意,这样代理就能实际触及操作系统。 当时的工作流程是怎样的呢?整个过程有条不稳,透明度极高。首先就是询问用户需要明确几个问题,我是先抓取赛程呢?还是先处理球员数据?原始数据要不要本地存储或者存入数据库?好的, 一旦他获得了这些答案,就生成了这份详尽的包含十四个步骤的计划。这包括了搭建项目框架并引入范型来确保类型安全、构建完整的验证层。方方面面都包含到。这听起来非常适合生产代码,但问题出在哪里呢?代价就是需要人持续投入。 关键就在于他中途停了一下,因为得专门给 nfl 塞成表。配置网址,用户得手动设置环境变量。系统给出了三个选项,用户选了一个,但那些由智能体生成的网址 总是返回四零四,错误啊!原来,现实世界情况变得复杂了,现实世界的数据变得一团糟, nfl 的 数据仓库结构也发生了变动。 所以特工的计划天衣无缝,但却因现实数据源过于脆弱而失败。好,那我们换个角度,黄牌性格、速度至上,谨慎全无。这个模型的限制要少得多,它能编辑代码,读取文件,关键还能指令,所有指令都预设为始终允许。 那么规划呢?制定详细计划被设定为永不该。智能体基本上获得了自由裁量权,可以跳过步骤、激进的迭代等等。 黄色代理跳过了详细的验证和测试框架。对于注重制作的观众来说,这听起来不就是一条捷径吗?技术债与灾难, 这问题提得好,直指核心所在。这么做的理由并非出于工程上的纯粹性,而是基于商业目标。目标决定工具。没错,如果你只是为技术站做一个功能原型,在判断数据集是否可用时,速度就是一切。 当你推送安全补丁时,对于生产环节来说,正确性是唯一重要的衡量标准。那么,黄色代理究竟是如何成功的呢?那个战略失败的地方?嗯,他的定位决定了战略,别被日程表困住手脚。 他恰恰是流程中最脆弱的一环。他直接就转向了,直接调用了球员统计数据,而那里正好有稳定的数据,可靠的网址。他第一次尝试就完全避开了问题区域。这真有意思,他正是利用这种无拘无束的特性, 做出了一个人类难以企及的高层战略决策,可能得调试好几个小时才能搞定。没错,他最终生成了一个可用的玩家数据集,性能表现以及最后这张总结表。 战略智能体主打的就是一个精准无误,每一步都清晰可追溯。黄色代理按来源方的说法是用于分为编码的 氛围式编程。这说法我喜欢,见效快,但你也承认牺牲了结构性,而且你知道之后还得收拾残局。这种复杂性恰恰凸显了。接下来的一个重大挑战, 就是情境问题。如何让自主智能体始终专注于宏大目标?一个成熟的项目如何能避免它不断产生幻觉或偏离正轨?这正是我们要解决的。根据项目规则,特别是通过一份名为 warped 的 原文件, 该文件实质上这个项目的大脑就是 ai 入门指南,这样我就不用每次都重新介绍我的配置了。单词提示,你只需记录一次大语言模型,就会始终将这一上下文预置在指令中。这是项目专属的 l m 长期记忆。那么具体该如何着手呢?你在项目根目录里运行一条指令, 它就会生成一个初设的 warpedemd 文件。它采用标准 markdown 标题来组织内容,所以人类阅读起来很方便。而大约模型要能解析那里面该放什么信息才能让它有效吗?比如 mpm run dev 或 mpm run build 这类常用命令你都设置了清晰的标题, 那么这个智能题已经掌握了如何运行和构建你的项目。接下来,你需要提供一个详尽的项目架构。总的来说,架构概览具体指什么?消息人士举例说,比如包含流程图、组建图以及具体技术细节。前端用的是 astro 框架,后端嘛,无服务器 api。 路由 数据库是 firebase, 部署在 versale 上。这就像给你的新智能体在启动首日就拥有完整的知识库和工程规范。这信息量可太大了,感觉那个文件很容易就会膨胀, 变成个庞大又没法用的东西,这会拖慢一切节奏。而你刚刚触及了最关键的最佳实践。保持精简,务必保持意图明确。你 warped 文件中的所有内容都会被前置到提示中。吃掉你的令牌预算。 吃掉你的令牌预算,让每一次请求都消耗预算,计算成本更高,因此也更慢,只纳入真正关键的部分眼下的任务。那团队管理的第二条建议呢?把它当做一个动态的。这份文件只是个起点, 真正的价值在于不断迭代完善。你得为你的团队设定专属的工作流偏好,比如始终从主分支创建并使用描述性命名规则合并式覆盖。 最终目标是让智能体完全像资深程序员那样编辑代码,开发者们也是如此。而对于许多大型机构所采用的大型单体代码库来说,针对特定目录的规则,这很关键。你不能把所有东西都塞在一起。你可以进入特定子目录, 再次运行编制命令,生成 warp 点 md 文件,专门为那个子系统定制的文件,这样就能避免用过多的上下文信息压垮大元模型项目的各个部分,完全不相干。没错,最后,如何保持这些文件始终优化?你的规则文件得优化一下, 要是 warped 文件变得太大,比方说超过五百行的话,你应该先用提示词优化工具过一遍,这能帮你找出重复内容,并删掉重叠指令,以提升效率。所以,当你退一步纵观大局时,这意味着什么?范式转变远不止是更快的,写代码远不止如此。 这其实是从写代码转向管理智能体意图,关键在于设定正确的上下文,这就是互栏的全部意义。 如果我们把它放到更大的背景里来看,这些信息来源,其实提出了一些关于未来生态,其实还有很多非常有意思的开放性问题。 这种转变很可能会导致大规模的行业整合。我们以后会看到这些零零散散的代码审查工具吗?应用开发、监控这些功能, 未来会不会都整合进一个全能型 ai 平台里呢?那么交互界面本身呢?它会如何演变如今我们拥有的 ai 身份成为 ai 终端?甚至可能更简单,比如 ai 浏览器 riplis, 在 那里,你的整个开发环境其实就是个带工具的大聊天框,可能很快就面目全非了, 很快标准化也是个问题。我们正处在一个规则文件各自为政的碎片化世界里,对吧?源头就在这儿, 像点光标规则或 clue dmd 这类东西,这看起来完全不可持续,绝对是,这对于任何大型企业应用来说都不可持续。 我们需要一个通用标准、个性化这些智能体,而不必绑定单一供应商,或许可以称之为智能体 md, 这是迈向统一行业体系的关键第一步。所以 考虑到我们刚分析的战略智能体与黄色智能体之间的权衡,最后有个值得深思的想法,开发团队向来能搞定速度与准确性之间的这种矛盾。 但现在 ai 提供了两种全自动方案,开发者领导层将如何定义适合自身情况的默认代理配置文件呢?生产环境呢?他们实际上会如何将公司的风险承受能力直接编码进去?

vape coding 已经进入生产级了吗?今天我就带领大家来测评一下市面上常用的四个 vape coding 工具, atoms、 bolt、 replica 和 base。 四十四, 我输入同样的口令,帮 backflip 重建一个官网。四个系统的操作界面几乎一直没有什么可评测的,接到指令以后都开始了自动化工作。 我发现四个平台都没有再次提问,而是跟着自己的理解往下走了。 items 更加阳性一些,会给我列出任务。 to do 被四十四提示无法访问网络,所以只能通过大模型中了解有关 backlog 的 信息。 replat 中途出错了一次,貌似是代码卡住了,我们直接看生产后的结果。 replat 生成的中规中矩结构都有,但大部分内容是杜鹃的。整体设计稿不够强烈,也添加了 tab 切换 step by step 的 流程设计,这算是一个及格线的产品,整体需要继续打磨。我给打六点零分儿。 bot 给我生成一个英文版本,而且是唯一一个按英文版本生成的 bot 的 网站,结构更加专业化,可以达到一个企业级 sas 软件的标准,有 type 切换时间轴,流程图,客户评价等板块。我很喜欢它比较紧凑的排版布局, 内容填充也比较丰满。我给打八点零分。被四十四几乎完全理解了 backflip 的 产品理念,我发现 hero 完全照抄的 backflip 官网设计,包括滚动的 logo 墙 type。 产品特性部分做的很细腻,每个视域图都花了功夫的,但是整个页面没有添加图片,可能是节约 token 的 原因。 主题颜色搭配还是很不错的,用到了三原色,我给打七点零分。 adams 恰恰相反,采用了非常多的配图 部分,就是背景大图,渐变,字体数据统计,很理解行业调性。接下来的几个板块也是细节比较到位,内容的表达也比较切合。 backflip 定位,产品特性,行业案例、客户评价都还不错,我给你打九点零分了。还有哪些你认为优秀的 web 扣定工具,一起评论区讨论讨论。

别再浪费钱买一堆不好用的键盘了!裸机这款 k 九八 m 堪称全能王,按键稳定流畅,嗨派式子音乐耳动听办公有 ai 灵动键,写文档做表格,行云流水 游戏靠热插拔轴体加低延迟,无限连招,丝滑不卡顿。九十八配列加半透外观,桌面颜值与实用双在线必入!

腾讯干了一件大事,但几乎没人注意到,五月中旬,腾讯悄悄上线了一款叫吐司的产品, tiffany rex。 定位是什么?一句话,让不会写代码的人也能做 app 和小程序,说白了就是 web coding 的 产品化。你 可能听说过 web coding 这个词,今年的硅谷热词,核心思路是,你不需要学编程语言,只要用自然语言描述你想要什么, ai 就 能直接帮你写代码、做界面,甚至部署上线。 这个概念在国外已经被 cursor、 bot、 微零这些工具炒的滚烫。但腾讯这次的打法不一样,吐司直接绑定了微信生态,你用它做的应用,可以一键发布到微信小程序。这意味着什么?意味着腾讯把十亿微信用户变成了你的潜在用户。你不需要懂前后端, 不需要学数据库,不需要知道什么是 api, 你 说我要做一个记账小程序,他就给你搭出来,你说加个图标统计,他就给你加上。这对于非技术背景的创业者来说,是一个真正的拐点。以前做一个小程序, 找开发团队,至少几万块起步,开发周期一个月起步,现在一个人一个下午可能就搞定了。但别急着兴奋, web coding 现在的上线依然很明确,简单应用没问题,复杂业务逻辑还差得远。真正有价值的产品, 需要的是你对用户需求的深度理解,而不只是把想法翻译成代码。技术门槛在降低,但商业洞察的门槛一点都没变,工具会越来越傻瓜,但能做出好产品的人永远是少数。

今天 antigravity 宣布上线了 skills 功能, skills 已经出现了一段时间,这个一个开源 skills 的 网站,甚至数量高达三万以上,在上面可以搜索你想要的功能, 不仅仅是使用,更多的是学习他人。怎么构建 skills 的 思路都是开源呢,所以也很适合大家去尝试发现提升效率的工具。 现在看到的就是主文档写着最基本的任务需求、流程,或者可以理解为功能页面简单,资源丰富,确实值得好好探索。 在最下方还有学习文档帮助你入门,你也可以直接通过 ai 来学习。明天我会分享怎么让 ai 帮你创建优化 skills, 关注我不迷路哦!可以看到文档解答了什么是 skills, 什么时候该用 skills, 我 觉得这里解释得很好,当你有固定流程重复任务时,用 skills 就 能帮你在每一次任务中快速启动,让你有更多的精力解决核心问题。

宝子们,昨天发那个自动投简历的 ai 工具看了没?今天修复完了,加了三个昨天没有的东西。 c l i 命令行接入 hermes agent, ai 自动分析岗位匹配度,一个一个讲。第一个 c l i, 这个就不配置画面了, 之前只有 web 页面操作,现在装好项目直接敲雷克 job。 十四条命令覆盖搜索、投递、聊天 分析后选区管理全部流程,不用打开浏览器终端,你一条命令搜岗位,一条命令批量,头一条命令拉聊天记录。 关键是所有命令输出都是结构化 jason, 这意味着什么?你能把它喂给任何 ai agent? 第二个接入 hermes agent, 然后你一句话的事,帮我搜深圳的 java 港,匹配度高于百分之八十的拳头了, agent 自己掉,命令自己看,结果一条龙跑完。第 三个 ai 分 析岗位之前只能投,只能聊,现在 a 键投之前会先分析这个岗位到底适不适合你, 清清楚楚,你自己决定投不投。当然,这个还没开发完。总的来说,昨天是手动开车,今天是 ai 自动驾驶。 c r i, 让所有操作脚本化, a 键可接入,让一句话替代二十次手动点击 ai 分 析,让你投之前就知道值不值得投下班。