openclaw 重构 ai 智能体永久记忆的技术体系与行业实践一、行业背景云端 ai 记忆能力的结构性困境与技术 诉求在生成式 ai 技术全面渗透千行百业的当下, ai 智能体的记忆能力已成为决定人机合作深度的核心指标。然而,当前主流云端 ai 系统普遍面临结构性的记忆困境, 这些问题并非技术优化层面的瑕疵,而是底层架构设计导致的系统性短板。首先,记忆碎片化问题突出。传统云端 ai 的 交互数据仅在单次绘画 生命周期内有效,绘画终止后即被清除或规章,无法形成跨时间、跨场景的连续记忆链。例如,用户 在一周前与 ai 沟通的项目框架,一周后再次咨询时, ai 需重新接收全部背景信息,严重影响写作效率。其次,上下文窗口的物理限制。 主流大模型的上下文窗口长度通常在四 k 杠一二八 k tokens 之间。对于持续数月的复杂项目,属 十万字的文献研读或多轮跨部门协助,大量关键信息会因超出窗口范围被移望,导致 ai 给出的决策建议缺乏连贯性 与完整性。最后,数据隐私与合规风险。云端存储模式下,用户的商业机密、个人敏感信息需传输至第三方服务器,不仅面临数据泄露风险,更难以满足网络安全法、个人信息保护法及金融、医疗 等行业的强合规要求,成为企业级场景落地的核心障碍。据 iec 发布的二零二五年全球 ai 智能体市场报告显示,超过百分之六十八的企业在 ai 应用中遭遇 记忆断层导致的写作效率下降百分之四十五的高。合规行业因数据存储问题放弃云端 ai 方案 这一行业现状,迫切需要一套能够打破临时绘画逻辑、兼顾记忆连续性与数据安全性的技术方案。 openclaw 智能体正是九章智算云针对这一核心诉求推出的系统 激硬解决方案。二、核心突破,从临时工具到长期伙伴的范式重构 openclaw 的 技术革新并非对传统 ai 记忆功能 的局部优化,而是通过底层架构重构,实现了从单次交互工具到长期合作伙伴的范式升级。其核心突破集中在两个维度,一、数据主权回归本地存储架构的底层逻辑。 opencloud 彻底颠覆了云端 ai 的 中心化存储模式,采用用户本地全掌控的存储设计,所有交互数据包括对话、历史、项目、文档、任务记录等均存储于用户本地设备、电脑、服务器等,通过 sq lite 清量数据库实现数 据的可靠管理,用户可随时查看、导出、删除数据,完全掌握数据主权。这一设计从根源上解决了三大问题, 一是记忆丢失问题,数据永久存储于本地,不受云端服务中断、账号注销或数据清理政策的影响。二是隐私泄露风险, 敏感,数据无需传输至外部服务器,避免了传输过程中的拦截风险与存储过程中的越权访问问题。三是合规性,完全满足金融、政务、一聊等行业对数据本地化存储的合规要 求,为企业及落地扫清障碍。二、知识流转闭环持久记忆的动态进化机制针对上下文窗口限制, open claw 构建了动态扩展加智能沉淀的持久记忆体系。与传统 ai 被动接收杠临时缓存的记忆 模式不同, opencloud 的 记忆库具备主动进化能力。一方面,记忆容量无物理上限,随用户交互持续扩展,无论是数年的项木积累,还是海量的文献资料,均可完整存储。 另一方面,通过自动聚合与结构化处理,将零散的交互数据转化为结构化知识,实现从数据存储到知识沉淀的跨越。例如,用户在不同时间点输入的项目需 求、会议,既要修改意见等,会被系统自动关联整合,形成完整的项目知识图谱。后续交互中, ai 可直接调用全量关联信息,无需用户重复输入。背景 三、记忆架构分层闭环设计,实现数据杠、知识杠智能的转化 opencloud 的 记忆架构采用双层存储加智能流转的闭环设计,通过精细化的分工与协调, 既保证了数据的完整性,又提升了记忆的复用效率。具体分为三个核心环节,一、第一层, 每日日制原始数据的忠实记录每日日制是记忆体系的数据源头,采用时间戳命名的文本文件格式,存储路径为 memory y i y 杠么杠 d d m d 以持续化方式完整记录用户每一次 交互细节。不同于传统 ai 的 绘画缓存,每日日制不仅记录用户的输入内容,还包含 ai 的 响应结果、交互时间、文件附件摘要等多维度信息。例如,用户在十零提交项目 a 的 需求文档,十一、 三十讨论技术方案修改十五零确认任务分工。这些信息会被逐一分条记录, 形成不可篡改的原始数据链。这种设计确保了所有交互行为的可追溯性,既便于用户回溯历史细节,也为后续的知识提炼提供了完整的数据源。二、中间层 自动聚合数据到知识的结构化转化每日日制积累的原始数据,需经过去种 提炼、关联的自动化处理,才能转化为可高效附用的知识。 opencloud 的 聚合模块采用基于 transform 的 语义理解 模型,自动识别重复信息,如用户多次提集的同一项目要求,并去重提取核心关键,此与关键信息,如任务截止时间、核心需求点,并根据语义关联将分散在不同时间点的信息进行整合。如将项目 a 的 需求文档、技术方案、任务分工关联未统一知识单元。此外,系统还支持用户自定义聚合规则,例如按项目名称、任务类型、参与人员等维度进行分类, 进一步提升知识的结构化程度。三、第二层长期记忆动态生长的知识库长期记忆是 open claw 的 核心知识在体存储路径位 memory md, 本质是一个动态生长的结构化知识库,其内容包含用户在长期使用过程中沉淀的所有核心知识,包括项目档案、会议、既要任务、历史代码片段、人物关系、关键决策、行业规则等多元信息。 与传统知识库不同, openclaw 的 长期记忆具备自净化能力,新的知识单元会自动与现有知识进行关联,如新增的项目 a 迭代需求会关联至原有项目档案,涌现信息会被智能压缩,如重复的任务提醒仅保留最新版本, 确保知识库始终保持精简且全面的状态。同时,内置的上下文解锁引擎支持跨维度、跨时间的语义解锁。例如,用户查询项目 a 的 核心需求, 系统可快速定位到不同时间点的相关记录,并整合未完整的需求清单。四、技术实现多技术站协调,构建高效可靠的记忆体系 opencloud 的 永久记忆能力依赖于存储杠、解锁杠优化全链路的技术协调, 其技术占融合了本地存储、向量剪索、语义理解等多领域成熟技术,形成了高效稳定的运行机制。一、闭环工作流程搜索杠、存储杠锁芯的自动化运转 opencloud 的 记忆写入采用搜索杠、存储杠锁芯的闭环流程,确保每一次交互都能高效融入记忆体系。具体而言,用户发起新交互时,系统首先 通过混合检测策略查询现有记忆库,判断是否存在相关信息,若存在则直接调用关联记忆辅助响应,避免重复存储。 若不存在,则将新信息存储至每日日制,同时更新锁影。这一流程在后台自动执行,无需用户干预,既保证了记忆的完整性,又避免了知识库涌跃。 此外,系统会在每日凌晨自动执行聚合任务,将前一日的日制数据转化为知识单元,并写入长期记忆,实现原始数据到知识的定时流转。二、核心技术占多模块协调赋能 opencloud 的 技术站围绕本地高效运行加精准语一、解锁两大目标构建,一是本地存储模块,采用 sq lite 数据库作为核心存储引擎,兼顾清量性与可信, 支持百万级数据的高效读写,同时兼容 windows、 linux、 mac 等多操作系统,确保跨设备使用的一致性。二是解锁引擎,融合 five s s 向量解锁框架语 bm 二五关键词解锁算法,其中 fis 负责基于与异相似度的模糊匹配,占比百分之七十, 能够理解用户查询的深层意图,即使关键词不完全一致,也能精准定位相关性。 cbm 二五负责基于关键词的精确匹配,占比百分之三十,确保核心信息的无遗漏。召回混合策略 实现了召回率与准确率的双重优化。三是羽翼理解模块,采用轻量级嵌入模型 and bedding transformer, 将文本信息转化为高维向量,为羽翼剪索提供底层支撑。同时模型经过轻量化优化,确保在本地设备上高效运行, 无需依赖云端算力。三、性能优化,兼顾效率与资源占用针对本地运行场景, opencloud 进行了多维度的性能优化,一方面通过自动压缩涌现信息、分快存储大文件等方式 控制知识库的存储占用,例如文本类知时会被压缩为高效编码格式,附件文件仅存储摘要与锁影,原始文件保留在用户本地指定路径。另一方面,采用增量锁影技术,仅对新增数据构建锁影, 避免全量缩影带来的资源消耗,确保即使知识库达到 g b 级规模,解锁响应时间仍控制在一秒以内。此外,系统支持离线运行模式,在无网络环境下仍可正常调用本地记忆, 进一步拓展了应用场景。五、价值落地从技术特性到行业赋能的全场景覆盖 openclaw 的 永久记忆技术并非单纯的技术创新,而是通过解决行业痛点,实现了从个人到企业的全场景赋能。 其价值落地体现在三个维度,一、个人知识管理打造数字外脑对于个人用户而言, openclaw 可作为专属数字外脑, 持续沉淀学习与工作中的核心信息。例如,科研人员可通过其记录文献、研读笔记、实验数据、研究思路,系统自动关联相关文献与实验结果,形成完整的研究脉络。 职场人士可用于存储项目资料、会议记要、客户需求、后续对接工作时无需反复翻阅历史文件。 ai 可自动提取关键信息并提供决策支持。学习者可记录学习笔记、知识点总结,系统根据语义关联构建知识图谱, 辅助深化理解与记忆。二、企业协同办公,提升组织知识复用效率 在企业场景中, openclaw 可成为跨团队合作的知识枢纽。例如,项目团队可通过其存储项目需求、 技术方案、进度记录、沟通纪要等信息。新加入成员无需依赖老员工口头交接,即可通过 ai 快 速掌握项目全生命周期的关键信息。 跨部门协助中,市场、技术、运营等部门的交互信息会被完整记录并关联,避免因人员流动或沟通不畅导致的知识断层。企业还可基于 open claw 构建内部知识库, 自动整合各业务线的经验沉淀,形成可附用的组织级知识资产,降低新人培养成本与业务试错成本。三、高合规行业破解 ai 应用的合规瓶颈 对于金融、医疗、政务等强合规行业, opencloud 本地存储与隐私优先设计, 为 ai 应用提供了合规解决方案。例如,金融机构可利用其辅助客户服务存储客户咨询、记录、业务办理流程等信息,既保证了服务的连续性,又避免了客 户敏感信息如身份证号、资产状况的云端传输与存储。医疗机构可用于记录患者病历、摘药、疹、 聊、方案、讨论等信息,符合医疗数据本地化存储的合规要求。同时, ai 可通过分析历史并立,为临床决策提供辅助支持。政务部门可利用其存储办事流程、政策文件、群众咨询记录等, 提升政务服务的效率与连续性,同时确保数据安全与隐私保护。六、行业影响推动 ai 智能体的协助范式升级 opencloud 的 出现,不仅解决了传统 ai 的 记忆痛点, 更推动了 ai 智能体的协助范式升级。此前, ai 更多作为单次任务工具,辅助用户完成特定场景的单一任务。 而 openclaw 通过永久记忆能力,让 ai 成为长期合作伙伴,能够深度参与用户的学习、工作与生活,持续积累经验,优化服务。这种范式升级不仅提升了人机合作的效率与深度, 更拓展了 ai 智能体的应用边界,为后续多智能体携同、人机共生等更高级的应用场景砥定了基础。从行业发展来看, opencloud 的 本地存储加永久记忆架构,为 ai 技术 的合规划、普绘化提供了新的路径。未来随着技术的持续迭代,其在多模态记忆如图片、音频、视频等非文本信息的记忆与解锁、跨设备记忆同步、安全加密 前提下的多设备记忆共享、个性化记忆优化、根据用户使用习惯调整记忆优先级等方面的升级,将进一步强化其核心竞争力,推动 ai 制 能体在更多垂直行业的深度落地,构建更具温度、连续性与安全性的人机写作生态。
粉丝77获赞334

最近 open globe 养龙虾火得一塌糊涂,听说深圳的大爷都在排队安装,我要是不跟风装一个,是不是马上就要被时代淘汰了呢? 别急,先搞清楚它是个啥。中文名叫龙虾,是个通用智能体。说通俗一点,它就相当于是你雇佣了个赛博助理,坐在电脑前面听你指挥,写代码、做设计、写文案,只要你舍得烧 token, 电脑上的活它全都能干。 听着是不是很爽?但是现在的他还是个吞金兽,网上很多人吐槽,干点简单的杂活,一天偷肯花费就要两三百,比雇个实习生都贵。 而且他要电脑最高的权限,隐私风险也不少。所以有人说,这不就是个能力带提升成本高,还容易泄密的坑货吗? 那为啥市场还能炒成这样?因为他指向了未来,更指明了我们的职业规划的方向。以前我们找工作拼的是手艺, 代码写的快,图画的好,表做的溜。但是龙虾的出现告诉我们,这些执行层的技能正在快速的贬值,未来的职业风水岭将从会不会干活变成会不会指挥。 就像那个细思极恐的例子,程序员的龙虾自己学会了打电话要权限,这说明了 ai 已经具备了自动进化的能力。 面对这种趋势,你的职业规划必须做调整,别再死磕那些容易被量化的执行技能了,要去磨练定义问题和决策判断的能力。 以后的公司架构可能就是几个懂指挥的人类,带着一群 ai 智能体干活。所以不必焦虑现在会不会用龙虾,关键是你有没有从工具人转型为管理者的思维。但问题来了,想做指挥官,你得先知道自己适合指挥什么战场,对吧? ai 可以 帮你干活,但他没法替你搞清楚你的性格优势,到底是擅长社交还是擅长逻辑?你的职业价值观是追求稳定还是挑战 你的学业路径?该怎么选才能不被技术迭代淹没呢?这时候除了要掌握工具,更重要的是认识自己,掌握方。如果你对未来的方向感到迷茫,不知道如何规划自己的职业护城河,或者想给孩子做一份抗风险的学业规划, 欢迎私信找我聊聊。我提供 diss 性格测试、职业价值观测试以及深度的职业学业规划咨询。在这个 ai 横行的时代,我会帮你用科学的方法看清自己,找到那个只有你能干, ai 干不了的指挥官位置。 当然,这一波热度到底是改变了世界,还是为了卖 token 割韭菜呢?这背后的情况,你们懂的。

哈喽,朋友们,你们平时做片子搜素材找素材的时候,有没有这样的困扰啊?哎,我搜了关键词,呃,一个一页看,两页看,十页看,一个一个视频看,总看不到合适的。那现在这个困扰就没有了,因为我们出了这个 ai 搜索的功能啊,给大家看一下, 在我们网站上只要点一下这个按钮, ai 会帮你一条一条看素材,只要简单的描述画面,比如夕阳下农民在田间行走, ai 会立刻帮你调出最合适的画面。做企业宣传片。人在工厂里走,你可以精准到一个人、两个人还是三个人做城市宣传片。汽车行驶可以精准到汽车是黑色的,白色的还是红色的。 那它是一个什么原理呢?它是基于 open ai 的一个多模态技术,对视频的画面内容和标题进行特征抽取,分别抽取七百六十八位特征像量,对抽取出来的特征像量赋予一定比例的权重,进行特征组合生成,最终表示该素材的特征像量。对于用户搜索时候输入的词啊,也同样的进行 出去,然后进行特种匹配,获取匹配度最高的素材来给你他。这个原理啊,就相当于你不用一条条看素材了, ai 都会帮你看了。哎,我知道这时候你们脑袋里也想啊,你们想我们平时做片子找参考片的时候,找参考画面的时候,是不是也可以利用这项技术? 哎,我是不是很懂你们,我们正在开发,在不久的将来,你们在我们网站上去找参考票的时候,哎,也可以利用到同样的方式了,是不是你们干活的一大利器,不用谢啊!

open code 这个开源项目最近很多人都在聊,说是 cloud code 的 平替功能呢,和 cloud code 也是一模一样的,所有模型都能用,但是对于我们普通人来说,我们要怎么用? 网上评测我看了不少,但是我还没有看到有人用它完整的演示一遍开发流程,所以今天我来做这个事情。 我会用一套平时我在 cloud code 上使用的开发流程,结合 open code 从零开始开发一个服装电商的模特换衣应用,带你走一遍完整的流程,顺便也测试一下它和 cloud code 到底有什么区别。那我们现在开始 这套方法我之前已经分享过两次了,就是这一期和这一期。现在呢,我把它迭代到了三点零版本。整体流程是这样的,首先用毒蛇产品经理技能收集需求,他会通过追问来完善细节, 然后生成产品文档。接着用 ui 提示词,设计师技能根据文档生成原形图的提示词,然后把提示词丢给 nano banana 生成原形图,再用 google ai studio builder 来开发前端,最后用全站开发工程师技能完成后端的开发和后续迭代。 整个流程是由一个主控的项目规则文件 agent 点 md 来进行统一的调度。这个场景包含了需求收集、原型设计、前端开发、后端改造、功能迭代,基本囊括了日常开发的主要环节, 所以用它来测试,基本可以很好地展示 opencode 的 完整的开发流程。打开 opencode 官网,点进下载页面, opencode 有 四种使用方式,在终端里使用,客户端使用、安装 ide 插件或者集成到 github 这类平台。 我们今天讲的是第一种直接在终端里使用, mac 用户建议安装第一条命令, windows 用户建议用第二条。那我是 mac, 所以 复制第一条命令,按 command 加空格,输入 terminal, 打开终端,把命令贴进去,回车直行, 然后等待它安装完成就行了。这里可能会有一点慢,那就看你网速了。好, open code 我 们已经安装完成了,接下来我知道很多新手看不惯终端的命令行,所以我们就在 cursor 里面启动 open code, 应该会对你友好一些。打开 cursor, 在 terminal 里输入 open code 启动, 启动之后有个快捷键,你一定要记住 ctrl 加 p, 按下去会列出所有的命令。大部分命令可以在之后慢慢熟悉,但有一个现在你就要知道,就是 a 键下面的 switch model 切换模型使用后你会发现有很多模型可以选, 像 chatgbt, 五点二, gmail 三 pro, mini max 这些都有,带有 free 标记的,是免费的。其他那些常用的模型需要你自己去配 api, 想用别家的服务,可以按 ctrl 加 a 添加供应商那支持的还是挺多的。配置也很简单, 比如你想用 google 的 api, 那 就选 google, 然后把 gmail 的 api key 贴进去就可以了。接下来我们来开始配置,这个逻辑和 cloud code 是 一样的, cloud code 的 系统文件夹是点 cloud, 那 open code 这边就是点 open code, 然后这是我提前准备的技能文件, ctrl c 复制,回到 open code, 在 点 open code 的 这个系统文件夹下, ctrl v 粘贴,这样就一次性导入成功了。一共三个技能, 独设产品经理、 ui 提示词设计师,还有全站开发技能。接下来是导入项目规则,在 cloud code 里,顶层的项目规则文件叫 cloud 点 md, 那 我们这次用的是 open code, 它的项目规则文件要写成 agents 点 md 文件名不同,但思路是一样的,都是顶层的项目规则。 回到 open code, 把点 open code 的 这个文件夹收起来,然后 ctrl v 粘贴,这样项目规则就导入了。 注意看 agents 点 md 这个文件和点 open code 这个文件是在同一层级的,这点跟 cloud code 不 太一样。 在 cloud code 里, cloud 点 md 是 放在点 cloud 的 这个系统文件夹里面的,这个很重要,放错的话顶层规则就不会被加载。再来看一下文件结构,这是整套开发流程用到的技能文件,是我平时开发应用和小工具时用到的,当时用的是 cloud code, 所以 cloud 点 md 这个名字没改。 不过没关系, open code 完全兼容,能自动识别好技能和项目规则我们都已经导入完成了,接下来我们来走一遍完整的开发流程,用 open code 来开发辅助电商用的模特换装应用,启动主 agent。 这套开发流程分为几个阶段,每个阶段都有对应的指令 输入 slash help, open code 会列出所有的指令,包含从需求收集、生成原型图、提示词到开发和本地运行的全过程。 接下来我告诉他开发一个网页应用,帮助服装电商生成模特图,支持更换模特的姿势动作,调整服装的配色,还能更换新的搭配方案。声控模型用 gemma 三 pro image preview, 也就是 nano banana pro。 收到需求后,毒蛇产品经理的技能被自动调用了,然后开始针对需求进行追问,上来就说,别给我废话,让我选一个核心,那毒蛇味已经出来了, gbt 五点二骂起人来也是不留情面。 我告诉他,目标用户是独立设计师,功能范围需要支持声图姿势调整、配色搭配和编辑功能。确认没问题后让他继续。 那进入到第二轮追问,他问参考图是什么形态,这是个多选项。那我的设想是,上传的参考图可以是模特的人像照服装平铺图,或者是搭配平铺图, 控制方式可以用 prompt 文字指令,也可以从姿势预选库里面进行挑选,同时还要支持配色面板调色。确认没问题的话我们继续。 好。现在进入到第三轮的追问,问的是账号和付费模式,这个工具是我个人用的,所以不需要付费功能。那存储方面,现在是 mvp 阶段,主要是为了快速演示,暂时不考虑保存,先跳过 确认没问题的话让他继续。好。接下来是第四轮的追问,人脸一致性怎么处理?我的想法是核心需求是保留参考模特的脸部特征,成片的标准是多选, 一个是白底电商主图,一个是澎湃的质感效果。确认继续后,这个时候他已经收集到了足够的信息,开始直接编辑产品需求文档了。 好!运行结束后,他帮我们创建了两个文件,产品需求文档, product spec, 还有变更记录 product spec change log。 先看产品需求文档,因为我们的需求比较简单,生图工具和布局交互也都比较常规,所以他没有问太多交互和布局的细节。 那再看一下圈子 log, 现在是项目的初试阶段,变更记录里也只有一条初试记录,接下来我们有两个选择,直接开始开发,或者根据产品需求文档去生成 ui 原形图的提示词。 原形图提示词是可选的,但我觉得这一步能大大的提升最终效果。正好给大家演示一下输入指令 ui, 让它使用 ui 提示词设计师技能,生成圆形图提示词 好,完成了,提示词保存在了 ui prompt 这个文件里。那我们打开看一下,这就是生成的页面原形图。提示词用法也很简单,直接把提示词复制发给 nano banana pro, 生成产品原型就可以。 目前一共生成了三个页面,主页面、图片预览页面,还有报错页面。接下来我还要做一件事情,这套流程有两种用法, 第一种呢,是生成好原型图后,直接把图发给他,让他在 open code 里面进行开发。那第二种呢,是用 google a s studio 里面的 build 来开发,本期我就会演示第二种,这种方法对新手或者是刚刚接触外部抠钉的人来说,更容易上手,效果也更好。 我告诉他,你先别管 apikey 的 事,我会用 google a s studio 开发前端,开发好了之后,我会把代码发给你,你再帮我改造成前后端分离的项目。 他已经明白接下来要做什么,怎么配合我们,而且还直接给了建议,比如用 google a s studio 开发的话,回来时需要教给他哪些内容,或者开发好了之后让 open code 继续迭代,需要提供哪些信息和资料好。原型图我已经提前生成好了, 现在这个页面是 google a s studio 模型,选的是 nano banana pro。 我 做的事情很简单,把刚才生成的三个页面的提示词完整的贴进去, 顶部加一句话,帮我生成一个三宫格竖向排列的长图,这是一套电商模特试装的网页应用,然后他就开始帮我生成原形图了。 那我们放大看一下,这三张图基本上是按照我们的需求文档里的布局和功能描述生成的,当然后面开发的时候, ai 会拿这个图作为参考,并不会完全的百分百复刻,所以这一点你要注意。为什么要用 ui 提示词来生成原形图?主要呢有几点核心考虑, 第一是速度快,外部口令不需要一开始就追求完美,先把架构快速的搭起来,然后后面再慢慢的迭代 ui 和交互。 第二呢是为了好看,如果你不给 ai 参考图,光靠文字描述让它开发出来的页面通常都很丑,不管你提示词写的多好,在我看来都丑的要命。 所以用 nano banana pro 直接生成原形图设计其实很好,再结合我们这套方式,页面好看,功能呢也符合我们的产品需求,一箭双雕。这就是为什么我觉得这一步非常重要,想要给大家看一下。 好,那原形图已经有了,接下来我们打开 google a s studio, 先开发前端,我们先完整的复制一下 prods bike 里面的产品需求,然后回到 google a s studio builder 告诉他,让他帮我开发一个模特换装的应用, 先把 products back 整个贴给他,然后把刚才生成的 nano banana pro 的 原型图也贴上去。 ai 能力选择这边我们选择 nano banana powered app 和 generate images with nano banana pro, 因为我们的应用需要生图能力,必须调用 nano banana 检查没问题,点击 build 开始。接下来它会自动读取文档和我们发过去的截图进行开发。所以我们稍微等待一下 好,开发完成了。有几个注意事项,第一,记得右上角选择一下你的 gemna api key, 否则无法使用 gemna 三 pro 或者是 nano banana pro 这些付费模型。第二,我们来看一下界面的还原度, 那开发出来的界面和原型图已经有九层相似了,布局,色盘选择,模特姿势这些功能都有。好,我们来测试一下。先上传一张模特图, 再上传一张 gucci 的 最新的女装,一条红色的裙子,风格选择澎湃风格,输出四张模特姿势,选动态走路提示词就先空着,先不填,我们点击生成 好,生成完成了。放大看看,模特的真实感几乎无可挑剔,澎湃的风格,无影墙,走路姿势,人物和衣服的还原度都很好。接下来看一下代码,点击 code, 这就是他开发的所有的前端代码。把代码打包下载,然后找到刚刚我们下载的代码, ctrl c 复制,回到 open code, ctrl v 粘贴代码就导入了,然后告诉 open code 前端已经开发好了,代码放在了这个文件夹里, 这个时候他会问原型图有没有,你需要提醒一下他前端已经开发好了,直接看代码就行。后端部分他建议用 node 加 express, 但我决定选 next, 点 j s 看看他怎么处理, 确认没有问题,让他继续执行。等待开发的时候,顺便说一下,为什么我们要前后端分离。 google a s studio builder 开发出来的是存前端代码, api key 是 直接写在前端里的,那这样部署上线 api 就 会暴露,任何人都能看到。所以我们需要把 api 调用挪到后端,前端只负责界面和交互, 而且后端除了负责调用 api 以外,我们后面迭代的时候,比如要加全线连数据库,或者是业务逻辑,这些也都需要放在后端的 好开发完成了。不过它提醒我们,我们发给他的前端代码的基础是 vt, 不是 next 点 gs, 所以 这一版它用了 express 做后段,因为这是最小的成本,最小的改造方案。但如果我们坚持要移到 next 点 gs, 它也是可以帮我们执行的, 那到这里项目基本就快速完成了。所以接下来我直接输入指令 slash run, 让它在本地跑起来。 ok, 我 们可以看到项目它说启动了,但是显示的状态不正常, 不过没关系,他说他可以帮我们定位和修复好。修复完成了,原来是三千,这个端口被我另一个项目占用了,那他帮我们改成了三零零一端口启动, 如果你想随时停止,可以输入 slash stop, 就 会停掉后台的所有的服务。 ok, 项目启动了,界面功能布局都保持了原样,没有什么问题。 项目虽然跑下来了,但是我们不可能一步到位,所以接下来我们来测试一下迭代功能,我要给他加一个新的需求,我告诉他我想增加一个在页面上配置 api, 并且进行校验的功能。那针对这个功能,他开始追问,首先问我 api 怎么保存,那我选择肯定是存在后端, 然后问我校验的方式,这里我选择的是真校验,需要他发个请求,看看 api 能不能跑通, 确认没有问题,开始开发。顺便说一下我使用的这套开发流程,产品经理和全站开发这两个技能会循环配合,每次新增或修改功能,主 a 阵的会先调用产品经理技能,进入到迭代模式,通过追问补充并且更新产品需求文档和更新日期, 然后才调用全站开发技能去实现代码。这样做的好处是文档始终和代码保持同步,不管是日后自己回顾还是重新开窗口让 ai 接手,都能快速的了解项目的全貌。好,完成了,他说已经更新了产品需求文档和更新日期,那我们看一下更新的内容。 产品需求文档这边第四十九行辅助功能下面插入了 gmail api 保存交换的需求。再看圈趣 log 这边新增的 v 一 点一版本,内容是配置 api key 和交换功能。我们回到网页,应用,左下角已经出现了配置 api key 的 功能,我把我申请的 gmail api key 贴进去, ok, 交换成功,没有问题。好到这里,我们整个的开发流程差不多就走完了。最后我来聊聊我用下来的感受。 先说优点,第一,模型自由度非常的高,这是 open code 的 最大的优势。 cloud code 您只能用 cloud, 对 于使用其他的模型,它基本是严防死守。 open code 呢,你可以随便切换,想省钱就用免费的模型,想要效果更好就换 cloud 或者是 gbt 五点二,灵活很多。 第二呢,是整体的体验和 cloud code 非常的接近,指令逻辑既能加载开发流程,基本和 cloud code 是 同一个思路。 如果你用过 cloud code, 那 上手 open code 几乎没有任何学习成本,不过缺点也是有的, open code 是 开源项目,在使用 agent 或者 skill 的 时候稳定性就会差一些, 特别是多 agent 协助主 agent 调用 sub agent, 或者是主 agent 调用 sub agent 在 调用 skill 的 时候,这类场景复杂的话, cloud code 的 表现依然是最稳定的。 但总的来说,如果你预算有限,或者是想尝试其他的模型, open code 目前是最接近 cloud code 的 开源替代方案。而且说到底,工具本身作用其实有限,真正起到决定性作用的是你在用的那个模型,这才是最重要的。 好,以上就是本期的全部内容,如果对你有所帮助,别忘了点赞以及加入废台俱乐部,这对我们频道真的非常重要,那我们下期见。

欧盆爱宫斗的导火索,原来是他们最近做出了超级人工智能 q star, 这个如果现在放出来,就会让比特币一夜归零。为什么这么说呢?他背后的原理是怎么样的呢?我是 stenfer 机器人庞博士,下面我就在硅谷给大家做第一首的解读。 它这里面最核心的有三点,第一是它不再需要有新的数据,可以用 chart g b t 四来训练它,这一点非常重要,因为 g b t 四已经基本上用了互联网上所有能够找到的数据了,同时说明数据的清洁度也非常重要, 因为互联网上文字的质量参差不齐,而 g p t 四产生的文字就不会。第二是它这个技术是基于 q learning 和 a star。 q star 这个词其实不是很新,最早是在二零一七年 open ai 和伯克利大学的一篇论文里提出来的,它实际上是两项技术的相结 壳,一个是 q learning, 一个是 a star。 q learning 实际上是深度学习里面的加强学习的一种,当年骨骼打败李氏时的 alphago 就是基于这个,这个就像我们人一样,能够根据反馈来做出下一步的决定。 a star 则是移动机器人里的一个技术,最早是由我们 stenford s r a。 的几个科学家在一九六八年的时候提出来的,这个主要用来帮助移动机器人算出达到他的最终目的地的一个最佳路径。原理也很简单,就像这个徒弟所表示的, 每次都像自己的上下左右各移动一个格,然后计算一下到终点的距离,距离最短的就再往下走,距离一样的则同时都往下走,这样不断循环,最终就达到目的地了。因为这是移动机器人里边的一个经典算法,所以我们很多年前就注册了 a star 大的 ai。 第三 就是他找到了一个将大圆模型跟 qsr 的算法结合起来的一个办法。这个其实很难,因为谷歌的双子座也是走这个思路,但是他的产品的发布一直在推迟。 那 opera 看到了一个最精异的现象,实际上是在他解数学问题上,因为数学是大语言模型的一个弱项,但通过这个加强学习的方法,大语言模型就自己学会了数学, 而且找出了一种解密的方法。互联网上一百二十八位的 incription 超级计算机也需要几万年才能够解出来,所以被认为是非常安全的。但这个 q star 竟然很快就把它破亿了。如果现在把 q star 放出来, 那他就可以破译比特币的加密,这样比特币有价值的核心就彻底被动摇了。正是因为这个,引发了欧鹏爱董事会的强烈的担心,他们担心奥特曼把 q star 的商业化推进的太快,在人类社会还没有准备好之前,可能会造成社会巨大的动荡,现在你明白了吧?

呃,咱们继续让 open 小 龙虾在咱们这个自媒体的实际工作中。呃,结合实际实际工作场景去看一下它在这个咱们自媒体的日常实际工作中究竟能做什么。 呃,在咱们自媒体人的实际工作中,有一种情况就是在活动现场需要提前拍预热的小视频,哎,现场的花絮一段一段的,然后现场尽快的剪出来来作为热场和提前的宣发用。哎,这种情况也实际是很很常见的。 呃,然后咱们今天就让这个小龙虾来做这件事,看看他能把这个极紧的小视频能做成什么样。呃,我今天呢,还是一边录屏一边来给大家讲啊。 以前咱们这个制作视频也让小龙虾去尝试制作个视频,然后有的那个线下有的人说说你由于没给他安装那个技能, 所以他做的不太好。然后这次呢,由于这个时间比较长啊,我就提前把这个找了这个技能,从这个这个技能的专门的这个网站上叫 get 户吧,好像是。 然后我把这个技能下载了已经,大家可以我一边录屏嘛一边说啊,这个技能可以看了啊,他是结合剪映,然后调用剪映去做这个剪辑这件事, 这个技能我提前已经安装好了,然后今天咱们就让他来做这件事,我提前把还是提前把视频已经放到桌面的一二三文件夹里了,大家可以看一下啊,这个文件夹里我放了几段视频,然后让他把这几段视频做一个简单的集锦, 我用的命令是剪辑目录下桌面,这个视频配上适合的音乐啊,不满意可以让这个 open 小 龙虾继续修改, 然后他这个运行了之后给出的结论是这样的啊,大家可以看一下。呃,我把它抻大一点,因为之前的录屏不清楚什么原因,总是不是他特别清楚啊,大家看一下啊,他的回复是这样的啊, 就是视频给他的大约九段视频吧,他提取了其中的三段进行了剪辑,每段进行了十秒,然后女生解说背景音乐,他添加了是一个吹口哨的声音, 呃。片头精彩集锦加片尾的感官,呃,感谢感,感谢观看啊,这些个他就是按照这个流程做的。呃。然后呢,他把做好的视频放到了这个剪映的专业版这个工程文件里,我需要打开剪映,自行打开剪映,然后调用他的工程文件, 然后看解说词,他下边又给了修改的意见,就是解说词啊和这个时长,如果不满意,我可以在剪映里进行调整。好,现在咱们打开剪映, 的确,我们看到了剪映里它建成了这个一二三的工程文件。然后我们打开工程文件, 可以看到啊,工程文件里它确实做了一段视频,因为我们这之前做的是肉饼的啊,咱们看一下,它只生成了一段,这是第一段精彩片段,请欣赏。 然后它只生成了这一段精彩片段,请欣赏。 这是最后一段。呃,我们结合实际情况看了一下,就是他的这个剪辑,结合他这个技能,他这个剪辑,呃,还是完不成剪辑这件事的, 呃,就即便给他添加了相关的技能,他也完不成。呃。大家都知道他这个剪映力本身他就存在一个就是快剪,就是迅速出片这么一个 ai 技能,他这个 open 小 龙虾现在做的效果还远赶不上这个 就是剪映一键出片的这个效果呢还,嗯,现在这是加了技能之后目前的一个状况,我还会不停的再去对他进行完善,看看加一些其他技能,他还能不能干一些咱们自媒体日常工作中其他需要干的事, 继续对他进行下一步的测试,大家持续关注。

我的天呐,这个视频我反复刷了五遍!这个叫 gabriel 的 二十三岁高中辍学生,被 open ai 聘请为研究科学家,年薪高达七十万美元, 负责 sora 视频模型的开发。但这不是重点,重点是他在视频中分享的自上而下的 ai 地归学习法和基于马斯克第一性原理的求知方法,百分之九十的人都能复制。 看完后真的是颠覆认知。我把他的整套 ai 学习法和求职流程整理出来了,这条视频能帮你省下四年大学加三十万的学费,赶紧收藏。先说他的 ai 学习法,这套方法彻底颠覆了传统教育,他的核心方法叫递归式填补知识空白。听起来很高深啊,但其实超简单。他说他想学视频 ai 传统的路径呢,是先学四年的数学,再去学编程,再去学机器学习基础,再去学深度学习, 最后才接触视频 ai。 这一套下来至少六年。但这哥们用 chat gpt 只学了三天。他的做法就是直接问, gpt 给我写一个视频生成模型的代码,拿到代码后呢,盯着每一行不懂的地方,问这一行是干嘛的? gbt 说,这个是扩散模型,他立刻追问,什么是扩散模型?用生活中的例子再给我解释一遍。 gbt 说,就像一张照片,慢慢变模糊,然后再慢慢变清晰的过程。他就继续问,那是怎么变清晰的?具体过程是什么?就这样,从你的目标倒着追问下去, 你就从表面的代码一路深入到底层的数学原理,而且学的全是关键必要知识。学完后也别急向 gbt 说,哎,我现在理解是这样这样的, 你看我理解对了吗?他会指出你哪里理解错了,哪里还有偏差。这哥们说,他每天这样问 excel gpt 一 百个问题,三天后他就能上手去做一个视频 ai 项目了。而大学生按照传统的路径要学六年。他还特别强调吧,你要培养一种顿悟感,就是那种, 哦,原来是这样的那种感觉。你要追求让这种顿悟时刻尽可能的出现,这就是你的学习目标。 他在视频里直接开炮说,我真不知道那些还不把 chinese ppt 纳入课程的大学,怎么好意思说自己是教育机构。再说他的第一性原理求知法,这个更绝。这哥们说了一句话,我印象太深了,他说,公司只想赚钱,所以你要做的就是证明你能帮他赚钱,丢掉你听过的所有求知建议, 就从这一个简单原理出发。什么学历、简历、面试技巧都是扯淡。它的方法一共就分三步,第一步,做出一个三秒钟能让人看懂你能力的案例,不要写什么我精通 python, 没人信 你就花一周的时间,用 chat gpt 帮你做一个实际能用的小产品,比如一个超快的数据表格,一个小工具,一个有趣的小网站,然后把链接发过去, 三秒内对方就知道,哦,这个人真的会干活。第二步,广撒网,找到五百家你感兴趣的公司,直接给创世人和技术负责人发消息,他特别强调不要找 hr, hr 啥也不懂,他只会筛学历, 老板才看能力。那消息怎么发呢?你就说,嘿,我做了这个东西,我想免费给你们干一周,你看我能不能帮上忙。一百个人里面至少有一个会说 yes。 第三步,用结果说话,给别人免费干一周,拼命展示你的学习能力和执行力。 一周以后, offer 自然来,如果不来没关系,你已经有了真实的项目经验,继续找下一家就行了。所以你看这套方法的核心就两点,第一,用 chat gbt 递归学习, 从实际问题和你的任务出发,遇到不懂的就疯狂追问。第二,用第一性原理求职,用你的作品去代替学历。这哥们在视频最后啊,说了一句话,我觉得是整个访谈的精华。我现在做的这个岗位,按传统只有博士才能做, 但我只靠 chinese ppt 就 做到了。这不是我多牛逼,而是时代变了。所以别怀疑自己,相信你可以的。