本周上升速度最快的 ai 项目 openhuman 是 什么? cloud 很 强,但你每次还得重新解释背景。 opencloud 再全能也有个硬伤,记忆和能力都不够强。所以我觉得下一波 a 阵拼的不是谁会聊天,而是谁更懂你。 openhuman 就是 堵这条路。 二十五点七 k star 开源个人 ai, 它能接 gmail, notion, gitop 每二十分钟自动拉上下文塞进本地记忆术和 obsidian。 我 不说它能替代谁,但这个方向值得看。感兴趣去 gitop 翻细节,你更想要全能 agent, 还是懂你的 agent。
粉丝203获赞1345

今天我们要聊的是一个最近在各大技术平台都非常火的一个项目啊,叫 openhuman。 对, 它其实是一个个人的 ai 超级智能体啊,可以理解成是一个真正懂你的全场景的 ai 助手。没错没错,这个项目最近真的很火,那我们就直接开始吧。 我们先来说说这个 openhuman 的 节目定位,以及它到底是解决了一个什么样的痛点,为什么它可以在众多的 ai 项目当中脱颖而出?其实 openhuman 它就是一个可以跑在你各种设备上的个人 ai 超级智能体嘛, 它在 github trending 上是排名第一的,而且它的星标已经超过了十三点七万。它和其他的那些比如 minus 还有 openminus 这些项目最大的不同就在于,它真的是会花时间来了解你,对你进行建模。听起来挺有意思的,那这个 openhuman 它是怎么做到的?能够让用户不用每次都重新介绍自己,就可以直接使用 ai? 就是 它会主动地来了解你, 官方的说法是,在你连接好账户之后,差不多二十分钟左右就可以建立起你的个人上下文,然后你第一天就可以用它来做很多事情了,完全不需要每次都重新讲一遍你自己是谁,你要做什么,这可太省时间了。 那我们接下来要聊的就是这个赛道和产品亮相了,那我特别想知道就是这个 openhuman, 它在 ai agent 的 这个赛道里面到底是一个什么样的定位?它和同类的产品相比最大的区别是什么?它其实是一个全场景的个人助手哦,它不像 darwin 或者 open minus 那 样只专注于编程, 它的目标是要成为你生活和工作中的全能帮手。哦。那这个全场景到底是怎么体现出来的?在它的客户端上面有什么特别的设计吗?它的桌面客户端的设计特别有意思, 就是中间会有一个 mesco 的 虚拟形象,它会根据你的工作状态来变化表情。然后左边是一个记忆术,它会实时的更新,你可以看到所有的历史。右边是对话和工具面板, 所有的一切都是围绕着让你在各种场景下都能够高效地使用,这设计确实很新颖。对,那紧接着我们要聊的就是它的核心机制了,就是这个 open human, 它到底是怎么自动化地帮你整合这么多的服务,然后把你的各种数据都抓到本地来的?它背后的思路其实是借鉴了卡帕西的 obsidian wiki, 用结构化的 markdown 让 ai 能够更好地锁引。但是它厉害的地方就在于它完全不需要你手动地去维护它。支持一百一十八种服务的 o i o h f 像, gmail、 notion、 github、 slack、 谷歌日历,这些你都不需要自己去配。 a p i t。 天呐,这么多服务都能一键同步,确实省了不少事儿。 对,它的核心引擎会每隔二十分钟就去你的账户里面拉一次数据,包括邮件、日程、代码提交,所有的东西都会拉到本地。然后它会自动帮你清洗 切成合适的 markdown 片段,再按照主题和时间线做成层级摘要,你自己也可以随时去浏览和编辑这些所谓的记忆,这样的话效率确实提升了很多。对,那它在处理这些数据的时候有没有什么特别厉害的优化手段?当然有了,它用了一个叫 token juice 的 东西, 它会把 html 转成 markdown, 然后帮你驱虫。官方说它最多可以把你的成本和延迟降低百分之八十。 它的压缩规则是可以通过三层的 json 来配置的,就是内置用户和项目级别的配置。这优化做得真不错。对,那我们下面要聊的是后台与隐私。我想知道这个 openhuman 在 后台是怎么运作的?它在保护你的隐私上面到底有哪些独到的做法? 其实它有一个很有意思的设计,叫做潜意识循环,就是在你没有和它交互的时候,它也会在后台悄悄地帮你加载代办事项,读取你最近的记忆,然后自己去决定接下来要做什么。它的那个 mascot 会有不同的情绪表现,比如思考、闲置或者做梦, 甚至它可以自己去加入 google meet, 然后帮你记要点。哇,这个潜意识循环听起来真的很智能。对,那它的数据到底有多安全? 它采用的是本地优先的原则,它的记忆术是存在本地的 ciktor 里面的,然后 obsidian 的 文件也是在你自己的设备里,它的令牌是会进到系统的密钥链里面的,比如说像 macos 的 keychain, 然后它也支持你去配置 olemma 这种本地的模型,所以你的数据是几乎不会离开你的设备的。这和那些把记忆存在云端,或者说只是针对编程场景的产品有很大的不同, 这安全性确实挺让人放心的。对,那我们最后要聊的就是这个 openhuman 现在有哪些短板,以及它未来可能会往哪些方向去发展。它现在还处于 early beta 阶段,采用的是 gpl 三协议,所以它的衍生版本也必须要开源。 他目前还不支持微信和钉钉,但是他的开发团队更新的非常快。好的,那他未来的发展方向会有哪些比较大的变化?他的目标是要从一个每次都要你去手动喂给他上下文的工具,变成一个可以主动去积累知识,慢慢的变得真正懂你的伙伴, 他的使用门槛也会变得更低,可能你之前要准备几周的时间,到后面你可能只需要二十分钟左右的开箱时间就可以用了。 好的,那今天我们就一起体验了一下这个 openhuman 的 独特魅力,从它的全场景的助手定位,到它的这种本地优先的隐私保护, 再到它的这种不断的学习,变得更懂你的这种能力,真的让人觉得未来的 ai 助手就应该是这个样子。没错没错,那我们这期节目就到这里了,然后感谢大家的收听,咱们下期再见,拜拜!拜拜!

最近又有一大批人的 gpt 账号被封了,又或者是登录不上,反复验证,很有可能你踩了以下四个大坑。第一,登录环境变化太频繁。每天在不同设备、网络上登录相同账号, 账号很容易被判断为异常登录。第二,团队共用同一个账号,一个账号,每个人轮着登。官方明确规则,说明共享账号是不被允许的。第三,使用行为不稳定。短时间内大量提问、重复操作,或者频繁触碰平台不允许的内容,都可能影响账号状态。 第四,订阅和支付信息不一致。比如登录地区、支付方式、续费状态经常变化,也可能触发异常提醒, 如果你的账号已经异常,优先走官方申诉渠道,说明真实用途、订阅情况和遇到的问题,再搭配 maslovin 做好账号环境管理。一个账号一个独立环境,保持登录时账号的设备环境是一致的, 减少因为混灯错灯带来的账号异常问题。你有没有遇到过? ai 工具账号异常?评论区说说你是怎么处理的?

大家好,我是李强,站在亚健康上。呃,这个是最近这十几天在 ai 圈比较火的 open human, 然后我给大家演示一下。啊哦,其实它跟 workbody 的 话其实还是有点差距的,就是腾讯在做产品上面肯定是胜人一筹的,这开源的软件的话,其实还是, 呃,在产品上是欠点火候的,所以我来跟大家演示一下。你好你好,你是谁? 我是你的 ai 助手,叫 chat, 在 openhuman 里帮你处理各种事情,查信息,安排人物,卸代码,关钱包等等,有什么需要直接说就行。 呃,所以,呃, open human, open human 它其实还是一个,就是一个个人提高工作效率,然后做一些 ai 事情的一个工具,大家有兴趣可以去使用一下,谢谢大家。

windows 或者 open 格式,平时用 browse 这个 skill 去抓网页,是不是有个特别麻烦的问题?很多网站是需要登录的,比如小某书啊叉呀,或者是一些后台系统等等。 每次跑任务,它都会重新开一个新的浏览器环境,登录菜没了, cookie 没了,又得重新扫码,真正浪费时间呢。不是抓数据,而是反复登录。其实解决方法非常简单,只要是一句话,你只要在对话里啊。不是抓数据,而是反复登录,其实解决方法非常简单,只要是一句话,你只要杠杠 browse real 模式, 它会调用你本机真实的浏览器,之前登录过的账号,绘画信息,权限信息都会直接附用,不用登录了,体验是不是完全不一样?很多人觉得访问浏览器的 skill 太笨,其实不是它笨,是模式用错了。

还在研究怎么养虾养马吗?现在 ai 圈开始流行养人了,在龙虾、 open claw、 爱马仕、 hermes agent 之后,一个叫 open human 的 开源项目强势登顶,几天内狂揽过万颗星。很多人可能会问,虾和马已经很强了,为什么还会杀出一个新物种? 因为无论是虾还是马,本质上都面临一个巨大的痛点,它们的记忆严重依赖于你们的交互。 你每天都在教 ai 做事,你要给他配 skill, 写复杂的提示词,手动上传会议纪要和代码文档。归根结底,你得先动它们才动,一天不维护它们,就不知道你今天经历了什么。 而 open 兄们的出现,就是为了打破这个冷启动难题,它不需要你教,它能用二十分钟自动了解你的一切,那它到底是怎么做到的? ai 大 神卡帕西之前分享过一个很火的知识管理框架,叫 llm wiki。 简单说就是把所有的笔记项目文档整理成结构化的 markdown 文件,让 ai 随时读取。这思路很完美,但全手工整理太反人类了。 openhuman 干的事,就是把卡帕西这套手工活变成了全自动流水线。它主要分三步,第一步,一键连接。它内置了一百一十八个第三方服务, gmail github, notion 日历,你工作用的核心工具,一键授权就能接进来,不用到处去配。 a p i t。 第二步,二十分钟无感抓取。连接完之后,它的核心引擎每二十分钟会自动轮询一次新邮件日程变更、代码提交,全部静默拉取到本地 agent 自己知道什么时候该刷新你的状态。第三步,生成记忆术, 抓来的数据会被切成不超过三千 token 的 片段,按主题和时间线打分,最终折叠成一棵记忆树。 最硬核的是,这份记忆会同步生成可编辑的本地 markdown 文件。这意味着 ai 脑子里的记忆,你不仅能看懂,还能直接修改。 一次同步跑完,它对你的工作了如指掌,没有磨合期,第一天上班就能干活。你可能会问,这么庞大的数据全塞给大模型 token, 费用不会爆炸吗? openhuman 引入了一个叫 token juice 的 机制, 每次网页抓取或读取邮件前,数据会先过一遍榨汁机 html 转 markdown, 长网址缩短涌于信息去重官方数据说,这套机制能把 token 消耗砍掉百分之八十,可以记住高达十亿 token 的 信息。 此外,他还有一个很超前的设计,叫潜意识循环。即使你不主动发指令,他也会在后台获取近期记忆,自主决定还有什么代办可以干。他甚至能化身一个虚拟形象,作为独立参会者,加入你的线上会议。你开会,他旁听既要点, 这才是真正意义上的赛博助理。那么,现在的三大顶流 a 阵的虾马人到底该怎么选?我给大家总结了一个选型逻辑,第一,如果你需要一个跨平台执行网关,选龙虾,龙虾解决的是工具多的问题, 他适合你在微信飞书里随时发指令,让他在后台帮你写代码、画 ppt。 他 是个听话的外包牛马。 第二,如果你需要一个自我成长型员工,选爱马仕。爱马仕解决的是能自学的问题,它内置了学习循环,适合扔在服务器上跑长期任务遇到报错,它能自己修改生成新技能,它是个不断进化的超级员工。 第三,如果你需要一个懂你的贴身助理,选 open 胸闷。 open 胸闷解决的是懂你的问题。 如果你受够了,每次都要给 ai 为背景资料,想要一个过目不忘把你的工作流全部吃透的数字分身,选它。 这三个痛点拆开看,是功能合起来其实代表了 agent 发展的三个方向,执行力、学习力和记忆力。之前的 agent 心思都花在能干上了,但在懂你这方面始终差了点意思。 openhuman 的 爆火,证明了未来的 ai 竞争不再是比谁的模型参数大,而是比谁能更低成本、更全自动地同步你的专属记忆虾解决工具问题,马解决自学问题,但真正懂你的,或许还得人来。


get up 一 周热点汇总第一百一十五期,本期的内容呢,包括了桌面级的 ai, 超级助理,编程 agent 的 智能图谱,隐身, chrome 把任何软件变成 c l i 工具,以及呢实时的流式三 d 重建模型。那最后呢,还是分享两份资料,如果觉得内容不错啊,别忘了点赞和关注。 open human 呢,是一个开源的智能助手,那这半年呢,涌现了很多啊,现象级的 a 阵的工具,尤其呢是 open claw 和 hammer 最为呢出名。 open human 呢,在功能上啊,和它们是类似的,那它整体来看呢,最有特色的是两点,第一个呢是 open human 啊, 希望让 ai 呢主动来了解我们。那整个项目的核心链路呢,可以拆解为三个部分,就是连接,抓取和记忆。那项目支持啊,超过了一百八十种的第三方集成和自动的拉取。这里呢应该是使用 composio 的 工具。那前几期呢,我也介绍过, 可以去翻一下之前的视频,它可以呢,每二十分钟去便利每一个活跃的链接,并且将新的数据拉取到记忆术当中。第二个呢是 memory tree 和 obsidian 的 双轨机制,这套机制呢,是来自 ai 大 神卡帕西分享过的。 obsidian 工作流 思路呢,还是很精华的安装啊,还是比较简单的 macos 和 linux, 支持一键的 q 命令去安装。 windows 呢,也有 powershell 的 脚本 也支持呢本地的模型。但是目前呢,整体的设计思路啊,还是希望引导去使用它云上的 ai, 所以呢,虽然支持本地的 ai 和自定义啊,但是都比较麻烦。 最后啊,项目还给出了一个 token zui 的 一个压缩层来去降低 token 的 开销,官方的数据啊,说可以把成本和延迟降低百分之八十。项目里呢,也给出了一个很重要的问题是迁移,比如呢,我熟悉了一个工具,就不想要去切换, 所以呢,想要让用户啊进来使用它的新工具,其实应该学习一下 hems, 提供自动化的迁移工具。总之呢,项目的思路我觉得还是很值得去学习和了解的。 如果你用过 cloud code 或者是 cursor 呢,去写大的项目肯定啊,遇到过这个问题,就是 agent, 每次呢都要用 grab 等工具呢,去到处的翻文件,去找代码, 那一顿凶猛的操作背后啊,就是 token 在 燃烧。 code graph 呢,就是来解决这一个痛点的,他给你的代码仓库啊,去预先建设一个支持图谱, 背着的呢,直接去查图谱就可以了,不用呢再去买文件的,去乱找官方给的数据啊,平均可以便宜百分之三十五。 token 呢,可以减少百分之五十九,那速度啊,可以提升百分之四十九,也可以减少百分之七十的。工具调用在 vs code 这种十 k 以上的大文件的仓库上,效果尤为明显。 toc 呢,消耗呢,可以直接降低到原来的四分之一左右。那使用上呢,也比较简单啊,一号命令就可以安装,然后呢,在 code graph init 就 可以触及化。项目支持了 cloud code, cursor, codex, 还有 c r i, open code 等这样主流的编程。 agent 那也支持啊,超过十九种的编程语言,还有框架级的路由识别,比如呢,像 jungle, flex, spring express 这些常见的都可以自动的识别,同时呢,它也保证啊,是在本地去运行数据呢,不上传,也没有外部的 api 调用,对隐私敏感的开发者来说啊,是非常好的一个消息。 clock browser 呢,是一个隐身版的 chromecast 浏览器,它通过了超过三十个的反爬检测网站的测试。呃, recapture v 三评分呢,也是零点九。 cloudfire 的 测试呢,也可以直接通过市面上一些比较常见的方案,比如像 playrite, undetected 都是呢 gs 注入或者是配置层面的 patch。 那 chrome 一 旦更新了就容易失效, 那本项目的做法呢,会更硬核一些,它直接修改了 chrome 的 c 加加的原码,五十八个补丁呢,去覆盖了像 canva, 视频字体, gpu 等内容啊,翻译成真正的二级质的文件。这样的反爬系统啊,就确实识别到的是一个正常的浏览器了。 那对于做自动化和数据采集的还有 ai 浏览器的朋友来说呢,这个项目是值得去关注的。那最近一段时间呢, c l i 的 热度啊,不断的上升,那这周啊,我也出视频介绍了飞出的 c l i。 那 本项目是又一个来自于港大 h k u d s 实验室的, 它的想法呢,就是把所有的 gui 的 软件都变成 ai agent 能够使用的命令行工具。那它的原理呢,其实也不难理解, ai agent 呢,通过 gui 来控制软件,那效率呢,是高于截图加 gui 的 方式的。那 gui anything 呢,就会分析你的软件的源代码或者是 github 的 仓库, 去自动化的生成一个 zenfors 的 命令行接口。然后呢, aia 的 呢,就能够直接的通过终端的命令来去使用这个软件了,那目前社区啊,已经贡献了超过十八个以上的应用, c r i 的 适配,比如呢,像 blender 啊, liboffice 啊,还有 zoom, 甚至呢,包括了 go dot 的 游戏引擎, 那还有一个 c l i hub 的 包管理器,只要安装以后啊,就可以去一键浏览安装所有社区构建的 c l i。 那 本项目支持 cloud code, cursor, codex, opencloud 等主流的工具。 说实话呢,这个项目的野心还是很大的,如果真的能够做到啊,让 ai agent 通过 agent 去直接操控任何的软件,那对于 agent 的 生态来说是一个巨大的推动的。流式三 d 重建基础模型, 它可以从流逝的视频数据当中呢,去实时的重建三 d 的 场景。那蚂蚁凌波呢,在年初的时候一口气开源了四款大模型, 包括了 lingbot dapps, lingbot vla, lingbot va, lingbot word, 覆盖了感知底层环境理解,行动输出,但其中呢,缺少了一个关键的环节,就是如何把连续的感知数据呢,实时的构建成稳定的三维空间模型, 那本项目呢,就是填补了这个空缺。那简单来说呢,就是你拿着一个手机啊,去拍一段视频,它能够一边拍一边实时的重构出三 d 的 场景,速度呢可以达到约二十 fps, 支持啊室内外的场景,并且呢是 r 八七二点零的开源许可协议模型呢,在哈根 face 和 model scope 上呢,也都能够下载。如果你对像三 d 视觉啊,自动驾驶等技术呢感兴趣,可以去了解一下这个项目。 那最后啊,还是分享两份资料,第一份呢是重构与崛起 openclaw 时代的中国 agent 的 产业生态报告主要呢围绕 openclaw 引发的 agent 的 产业的革命去展开,分析了中国 ai agent 的 生态的协议啊,模型啊,平台啊,还有商业模式上的这个发展的过程。 报告重点讨论了包括像 skill 经济啊, a 阵的基础设施,还有一些企业级的治理等内容。那第二份呢,是二零二五年人形机器人市场研究报告,它系统的梳理了全球与中国的人形机器人产业的发展状况, 市场格局,还有未来的一些趋势。那报告也重点分析了像语数啊, u b 选啊,还有 figure, ai 等企业它的发展路径,以及呢在一些重点行业当中的一些商业化的进展。那有需要的呢可以告诉我。那以上啊,就是本周的全部内容,那我们下次再见。


兄弟们, ai 总是记不住你的事,每次聊天都要从零开始。这个十八点六 k 新神器 openhuman 直接给你私人超级智能,它是你的个人 ai 超级智能,完全私有,本地优先,简单又极致强大!亮点一,一百一十八加第三方服务自动拉取,每二十分钟更新一次 gmail, notion go top slack 全打通。亮点二,本地记忆术搭配 obsidian 兼容知识永久保存,再也不忘。亮点三,内置网页搜索,爬虫代码工具,还有原声语音功能。 亮点四,智能 token 压缩成本和延迟最高降低百分之八十,还支持 olama 本地模型,再也不用担心 ai 记不住你了!想拥有真正私人超级智能的马上试试,记得点赞关注哦!

这两天非常火的 openhuman, 别只看它写着一百一十八个数据源,真正值得学的是它的记忆系统 memory tree、 bucketseal、 obsidian wiki。 它是一个本地优先的个人 ai 助理,官方定位是私有,简单、强大,连接 gmail、 slack、 notion、 github 这些服务后,它会持续把新数据拉进记忆。普通 agent 的 记忆大多是平的,要么写进几个 m d 文件,要么丢进数据库,未来靠搜索找回来。 问题是过去的信息很难自动补进来,人也很难直接看,直接改。 open human 的 核心叫 memory tree, 不是 一个薄薄的项链库外壳,它把每天的邮件、聊天文档先转成 markdown, 再切块打分进入三棵树。 第一棵是原树,每个 gmail、 slack 频道文档来源都先保留自己的上下文。第二棵是主题树,同一个人项目话题在多个来源里出现,会被聚合起来。第三棵是全局树,每天形成一次总览,再继续压成周月年的记忆。 最有品位的是巴克次友,新内容,先进入 l 零缓冲区,攒到五万 token 左右,或者足够多条数据后,再风筒压缩,摘要升到上一层,上一层满了,继续压缩,形成一颗能逐层展开的记忆树。所以他不是全量搜索,而是先看高层摘要,再一路钻回原始证据。 一百一十八个数据源的意义也不是炫数量,真正关键是 autofatch, 每二十分钟从活跃连接里同步新数据,让记忆自己生长。另一个关键是 obsidian wiki, 他 把同一份记忆写成你本机上的 markdown 文件,你能打开阅读、修改、迁移。 这句话很重要,你看不见的记忆很难真正信任他。还有一个 subconscious loop 向后台心跳。他会定期读工作区和记忆发现任务风险机会,但涉及写操作仍然需要你确认。对国内用户来说,问题也很明显。目前原声数据源更偏海外工具, 微信、飞书、钉钉、本地 word 和 pdf 这些日常资料还需要额外处理,所以我更看重的是它的架构,而不是线程连接器。 我按这个思路做了一个 skill, 给他一个本地文件夹,他会扫描文档转 markdown, 再按记忆术方式生成 obsidian wiki。 这就是 open human 最值得学的地方,让 ai 的 记忆既能自动生长,又能被人看见和修正。

兄弟们, oppo 可乐炸了,最新发布的二零二六三点二三杠二版本,直接搞了一波无兼容层的激进重构 插件全瘫痪,可乐 boss 也连不上,重绑也没用,这绝对是他诞生以来最严重的事故!最坑的是什么?我本来压根没想升级,我只是让他跑了个刀哥的命理,想修复一下本地配置,结果这 ai 居然自作聪明,反手就把我强制升级了最新版!这哪是看病,这直接把我送进 icu! 听老兵一句劝,第一,没生气的兄弟死守,老兵们千万别动!第二,也是最要命的,近期严禁让他使用刀客的命令修复,他现在不仅修不好配置,还会擅自越权强行更新环境。 ai 的 制作聪明比 bug 更可怕!赶紧把这条视频转给你的群友,救他们一命!

今天我选的 ai 开源项目是 openhuman, 它不是又一个聊天框,而是想把你的邮箱日程、 slack、 github 和浏览器接近。一个本地优先的个人 ai 助手。 项目现在七千一百多星,核心用 rust 和 textscript 的 写,最新版本是 v 零点五十三点四三,昨天刚发版,今天还在持续推送。它最强的卖点是 memory tree, 连接进来的数据会被压缩成 markdown, 存进本机 sq lite, 并同步到 obsidian 风格的知识库。 还有一百一十八个以上集成, gmail, notion、 github、 slack、 stripe、 calendar、 drive, linear、 gera, 靠 os 一 键接入后台,每二十分钟自动抓新上下文。 openhuman 还内置网页搜索、爬取文件系统、 git 测试语音和模型路由,甚至支持通过 alma 跑本地模型。他想做的是一个会记住你工作流的桌面 agent, 但我建议先当 early beta 看,他会接触很多个人数据。先在小号和非敏感账号里试,重点验证隐私边界、同步质量和记忆是否真的有用。

哈喽,朋友,晚上好。现在大部分的 ai agent 呀,都有一个很尴尬的问题,你每次打开它,都需要解释一遍,我是谁?我在做什么项目?这个仓库为什么这么写?我昨天跟谁聊过这个客户之间提过什么要求?所以很多人用 ai agent 的 真实体验,不是他替我干活,而是 我要先给他一份完整的入职培训手册。但最近有一个很火的开源项目叫做 openhuman, 他的思路是刚好反过来,不是每次你来教 ai 认识你,而是 ai 先把你的工作实践吸收进去, 包括 human。 官方给自己的定义是叫做个人的 ai 超级智能。这个说法有那么一丢丢的营销啊。但是它真正值得关注的地方不是超级智能四个字,而是它想解决 agent 的 冷启动问题。它的核心做法就是把你的邮箱、文档、聊天、日历、代码、仓库全都接进去。 官方的 readme 里写了一百一十八种第三方的集成方式,通过 os 来连接以后,每二十分钟自动抓取一次。 然后他不会简单粗暴地把所有东西都塞进 property, 而是把这些邮件、文档、聊天、日历、代码、仓库这些内容整理成一个叫做 memory tree 的 结构。 更有意思的是,他会把这些记忆写成 obsidian 兼容的 markdown, what? 也就是说, ai 的 记忆不是一个你看不见的黑盒销量库, 而是一堆你可以打开、浏览、编辑、删除了 markdown 文件。这个点我觉得就非常关键,因为这意味着未来的个人知识库可能不只是给人看的,而是给 agent 当第二大脑的。过去我们讲 ai agent 经常讲模型、能力、 工具调用、自动执行。但真正用起来以后,你会发现, agent 呢?最大的问题不一定是不会干活,而是不知道该怎么干。他不知道你的偏好,不知道你的项目背景,不知道哪些客户重要,不知道哪个文档是旧的,不知道哪个决策已经被废弃了。所以你越想让他做复杂的任务,就越需要先给他补全上下文。 欧盟赫曼抓住的是另外一个方向, a 政策的能力上限不止取决于模型能力有多强,也取决于他对你有多少了解。如果一个 ai 已经知道了你的日历、邮件代码、文档、会议机要、任务系统,那他给出了建议和执行动作,理论上就会更贴近于你的真实处境。 比如你问他帮我准备明天和某个客户的会议,普通的机器人可能就会给你一个通用的会议模板。那如果他真正读过你的邮件、日历、上次的会议机要和项目文档, 他就可以直接告诉你这个客户上次卡在了什么问题上,你是否答应过什么,还有哪些问题是没有关闭的,以及明天最需要做的事情是那几件。 这才是 agent 真正有用的地方。 openheme 最打动我的地方是,他把记忆曾落到了 obsidian 这种人能读懂的格式里面。这件事看起来很小,在他背后也有很大的分歧。 ai 的 记忆到底是属于平台还是属于用户? 如果记忆只存在于某个云服务里,但其实你只能看到它,很难去修正它。它记错了,你不会知道它。如果过度总结了,你也不会知道它把一个临时想法当成了长期的偏好, 你还是不知道。但如果这些记忆十八个档文件放在你的本地 word 里,那你至少可以打开看一看。你可以删掉错误的记忆,你可以改掉过期的信息,可以把重要的项目 单独整理出来。这让 ai 记忆从一个平台黑盒变成了一种可以被人类共同维护的知识资产。那对于我这种本来就用 open c d n 来写内容做知识管理的人来说,这个方向就会特别自然。以前 open c d n 是 我的第二大脑, 那以后可能就是我 agent 的 第二代了。未来我们选择 ai agent, 可能不止看谁回答的更快,谁的模型能力更强。可能更需要看的是另外三件事,第一,它的记忆是不是可见。第二,它的数据是不是可控。第三,它能不能被迁移、被删除,被你真正的拥有? 所以我对 openhuman 的 判断是,它现在未必是一个普通人应该马上就要重度依赖的成熟产品,但它代表的方向非常重要。 过去一年, ai agent 的 竞争重点是谁更会执行任务,但接下来,竞争可能会变成,谁更能拥有长期记忆,谁更能理解你的世界。从这个角度来看, open call 们真正有意思的地方,不是他接了一百一十八个工具,也不是他最近在开源社区热度很高,而是他提出了一个很清晰的问题, 如果 ai agent 迟早要成为我们的数字助手,那他的记忆应该放在哪里?是放在某个平台的黑盒里, 还是放在你自己能够打开的 obsidian what? 我 个人更倾向于后者,因为一个真正属于你的 ai, 首先应该拥有一份真正属于你的记忆,这也是同学如果喜欢我的视频,记得点赞双关注,我们下期再见!

后排, ai 为什么不能在国内开放?一、最核心的矛盾,监管体系不兼容。中国不是简单限制访问,而是有一整套数据与 ai 监管体系,网络安全法、数据安全法、个人信息保护法,这些法律的核心要求是,一、数据必须本地存储。 二、数据分类分级。三、跨境传输要审批。四、算法和内容要可监管。问题来了, openai 的 模式是全球统一模型,数据跨境流动,不接受单一国家的深度审查。这两套逻辑是直接冲突的, 换句话说,不是进不去,而是进去就要变成另一家公司。二、内容控制。你低估了这个问题的难度,你可能以为加个审核系统就行?不,这里有个致命问题,菜 gpt 是 生成式模型,中国要求的是可控内容系统。这两个是结构性冲突, 要求冲突点实时生成,无法百分之一百预测。多语言多文化训练,包含敏感语料,用户自由提问,不可完全限制。所以不是审查难,而是 这个产品形态本身就不适配中国的监管模式。三、不是单方面封锁,是双向封锁。很多人误以为只是中国限制, 实际上是双向中国策,防火墙屏蔽访问,禁止未备案 ai 服务上线。 oppo ai 策不支持中国地区账号,二零二四年直接切断中国 a p i 访问。这说明什么?不是想进进不来,而是双方都没有动力让他合法进入。 四、地缘政治,这是你最容易忽略但最关键的。什么? open ai 是 美国公司,而且是扮演 ai 技术受到出口管制趋势影响,涉及信息影响力。一些现实, 美国限制高端芯片出口, ai 被纳入战略竞争? open ai 曾处理信息操纵行为相关案例,你要看清楚本质, ai 不 等于普通互联网产品, ai 等于新一代认知基础设施。 商业层面,你忽略了一个很现实的问题,假设政策都放开, openvi 愿意来吗?你得问自己几个问题,一、 是否要布局本地话,接受监管接口内容过滤定制?二、是否允许中国企业中流学习模型 技术外溢?三、盈利空间如何?中国已有大量本土模型。结论很直接,进入中国不等于扩张市场,进入中国等于重构产品加承担风险。六、如果真的引进中国,会发生什么?别幻想直接用现在的 type g p t 现实版本大概率是,一、 中国特供版数据本地部署强,内容过滤功能被裁剪,类似一个更聪明的搜索引擎加办公助手。二、和本土公司深度绑定, 可能形式合资公司与厂商合作,但问题是控制全风险。三、行业会被重塑,影响会很大,对企业 ai 应用爆发,对个人信息获取效率大幅提升,对本土模型短期冲击,长期加速竞争。 七、我反过来问你几个关键问题,你现在的思维有个潜在问题,你再把这个问题当产品能不能用。但真正的问题是, 一、如果你是监管者,你会允许一个不可完全控制输出数据跨境流动影响舆论认知的系统进入吗?二点,如果你收编的 ai, 你 愿不愿意为一个市场修改核心架构,接受强监管甚至数据审查? 三、如果你是中国企业,你是更希望引进 openai, 还是借封锁窗口期做自己的模型?最后给你一个更本质的结论, openai 进不了中国不是技术问题,也不是单一政策问题, 本质是两套系统,技术加监管加价值观加国家利益。另外你觉得中国本土大模型 vs openai 谁?

欢迎回来,今天给大家分享 codex 的 高级用法。首先第一步是安装 codex 应用,然后进到 codex 应用之后,我们选择换种方式登录,输入 openai 的 密钥,我们直接在 api 站内啊复制自己的密钥, 然后填入到 codex 里面,点击继续啊,这个时候会弹出五点五模型,我们点击立即试用就好。那下一步呢,就是需要去完成配置,那之前给大家讲过,在设置界面,然后点击设置进行配置,但很多人进来是英文的界面,它点击设置就只有这个退出登录的一个按钮, 那怎么办呢?我们在啊上面找到这个文件,然后找到 settings, 那 这样的话我们同样进到了这个设置界面,然后选择这一个配置,那你如果是英文的话,就是 configuration, 然后进到啊 config 点 t o m l 文件打开 啊,这个时候呢,我们就会自动地进到一个啊文件里面啊,这就是它的路径嘛,这是它啊具体的文件路径你有两个方法,第一个方法就是把这一个内容给它全删了,然后替换我们在我们的社群里面发的这个 config, 点 toml, 我 们把这一个文件啊 复制一下,当然待会也发到那个啊 b 站的评论区啊,然后大家自己去看啊,我们直接把这个内容给它贴过来。 好,这个时候就完成了这个配置,我们点击保存啊,保存好,那我们先来看一下这个配置内容,第一行就是讲模型的提供者 啊,是 api 分 发站,第二行就是模型的名称,是五点五模型,第三行的意思就是说它的那个审查代码的模型啊,是五点五,那第四行就是它的推理深度啊,可以选择 x high 就是 超高。 然后第五行就是说不把数据传回给 openai, 这样的话能保证你数据的一个隐私性。那下面就是比如联网的功能,比如上下文的这个窗口, 当然大家需要注意最新版的那个 codex, 它的上下文窗口包括官方的以及你通过 api 对 接的,它的上下文窗口只有两百五十八 k 啊,那两百五十八 k, 我 们其实可以通过那个跟 codex 聊天,把这个额度提高到一百零五万啊,这样是更加方便大家去用的。 那下面就是有一些比如一些权限的事情,比如你打开所有的权限,不让它每次进行提问, 那下面就是,呃,模型的提供者是我们的 deep cloud, 就是 我们这一个 api 分 发站深度原创科技的那个 api, 那我们把啊下面的这个地址也已经填好了,然后后面是 open i 的 返回格式,下面有两个配置,一个叫 agent agent, 第一个是六啊,这里给的最大运行任务就是你可以同时开六个对话,然后进行啊交互啊。 那第二个就是深度啊,就是每一次 agent 的 一个深度,如果你是日常办公的话,两个是完全够用的。如果你是说你要做深度的开发的话,你要把这个二可以改成三甚至四,一般简单开发二也是完全足够的啊,只有那些非常复杂的场景,你才需要把这个二改成三四或者说五 啊,这样子。好,那下面我这里就不多赘述啊,下面这一个就是说提高那个管理权限,就把它从普通权限提高到管理员的一个权限。好,那这里的配置完成了之后呢?我们就需要重启这个 codex, 我 们把 codex 退出,然后重新打开 codex, 那所有的配置就会自动的进行一次生效啊,那待会我就给大家分享啊,怎么去啊?让我们的 codex 用到最新的一些功能,比如接入它的那个宠物系统, 然后宠物的作用两有两个,一个是 u i 上可能会觉得更更好看啊。第二个就是说它可以同时显示不同的任务进程,然后它的完成情况, 然后除此之外,还有就是之前给大家讲的就是技能,还有那个插件的功能如何去调用,以及如何去啊?开启百万上下文的一个窗口, 这是我们现在要做的一个事情。好,现在我们进来了,大家可以看到这里就变成了 deep cloud, 然后这里是五点五的模型,然后智能的一个深度啊,都可以进行一个切换。那下面这里要注意把这个默认权限改成这一个完全访问权限 啊,或者说你要把它改成这一个自定义的,这个也可以啊,你把它改成这个自定义应该会更好一些。然后在这个自定义下面啊,我们可以啊,或者说在这个完全访问权限下面是一样的,我们可以在这里 让它去帮我们把这个上下文窗口给它提高一点,比如我在这里输一个。你好,它首先需要完成 api 的 啊,配置和工作空间的设置,所以说第一步会稍微慢一点, 然后等他完成了这个配置之后,我们可以把他,让他把上下文那个窗口从一百二两百五十八 k 提提升到那个一百零五 k 啊,那当然我们可以去找到这一个项目文件是最好的, 就刚才我们改的那个,呃,配置文件,在这个文件,然后设置,然后配置这一块,就是这一个 config 点 t o m l。 好, 我们可以看一下它的路径,在这个位置,我们待会就让它根据这里面的这个百万上下文让它去修啊,就好了, 因为每一个人它都不太一样啊。然后我们进到这一个项目目录下嘛,就是 user alex, 我这边是这样啊,你那边你要根据你自己电脑的一个情况,那我找到这个用户,然后找到 alex, 找到 codex, 然后找到这个文件,对吧?就是 config 点 t o m l。 就是 刚才改的这个文件,我需要把这个文件呢直接给它扔给我们的 codex, 我现在回来啊,回来,然后在这个位置我需要把刚才这个内容给他填入进去啊,如果这里没有回复的话,你重新开一个,思考深度的话,你选一个,选个高也可以, 我们发出去,那先完成这个工作空间的配置。好,那这里已经完成了,完成之后呢,我们就让他对这一个配置文件进行修改啊, 然后请根据配置文件内容确保上下文窗口一百零五 k, 一 百零五万啊啊, 处理完后自行检查确认。 好,我们这里相当于给了它一个任务,然后我们可以同时打开这个开个新对话,然后我们在新对话里面我们可以来试一下,按一下这个反斜杠, 我们可以看到这里有非常多的一个东西啊,比如 m c p 个性代码审查反馈宠物啊,这个宠物我们可以先打开一下啊,我们只要按反斜杠,然后选宠物,它自己会出来一个宠物,那这个时候呢,它就可以看到,比如这里有一个进程,那我们点一下这个进程呢,它就会自动切换到这个下面, 然后他说这里已经配置完成了。然后啊其实是不行的,你可以看一下这里有一个配置,我们可以看到这里的啊,上下文其实他只有两百五十八 k 啊,这个是不够的,那我们可以让他让根据这个配置文件去修啊,你比如我们把这个思考强度给他继续调高一点 点到这个超高啊,根据我的使用,现在还是两百五十八 k, 请将上下文窗口 扩展到一百零五万啊。因为新版的话,它这个好像对上下文的那个限制是有的,所以说它面临这个问题啊,之前的话你直接改配置文件就可以了,那现在它好像加了一个东西,然后限制了它一下, 那我们只需要在那个 context 里面跟它进行一轮的交互,然后让它把这个上下文提高,然后我们重启应用就可以生效。 ok, 那 现在宠物的功能以及啊这个配置文件给大家讲了,那我们重新进到啊,这个我们就先把它关了,直接把它啊删了就行了。那我们点击这个技能啊,大家可以看到我这里就已经有了一些技能了, 那比如这个浏览器的使用,然后 documents 啊,以及图片生成的这些技能啊,都已经有了,当然你要加新技能,你也可以在这里啊,去让他帮你啊,做一个新的技能嘛, 其实就是你按反斜杠啊,然后往下找,下面就会有比如你浏览器的使用,你可以用这个 browser use, 用这个 browser use 我 们就可以去找东西啊,去打开,比如打开 bilibili 啊,搜索 搜深度,云创科技啊,那我们按一下回车啊,这个时候它就会自动地调用我们这一个呃电脑的浏览器,然后打开那个啊 bilibili, 当然它也会问你是否要用那个权限了 啊,这里他会正在调用这个技能,我们可以看到这里就这个宠物,就告诉我们有两个嘛,这里有一个搜索 bilibili, 然后这里有一个回复嘛,就是刚才在处理这个上下文啊,这两个任务在进行,所以说宠物的作用就在这。然后如果我们要把这个东西隐藏起来,我们按一下这一个啊,倒三角就好,好, 现在这一个就给他弄完了哈,那这里还在进行技能的一个加载,然后在 b 站搜相关内容,然后打开, ok, 我 们同样我们先先开对话,然后演示一下其他功能。同样我们按反斜杠,那下面会有一些,比如你切换到这个计划模式啊,这里就会出现啊,这个计划,对吧?那你按反斜杠,这里有一些,比如记忆啊,可以开启一些使用记忆和生成记忆啊,默认式这些是可以自动开启的。 那下面还有一些,比如你要去用啊,下面这个,比如这个 image 啊,生图的一个能力啊,比如生成一个 这个跟那个 image, 跟二不太一样,就是跟我们智能体系统里面的那个不一样,它是通过一个技能然后去绘图的啊,比如绘制风景图, 然后我们发送一下,然后他就会调用这个啊,深图的这个技能,然后帮你去会制一些风景图片啊, 那这大家可以看到他会在使用这个技能帮你去做啊,然后你愿意啊,然后我们他这里直接在这里跟我们用了这个东西啊,我们点击继续啊 啊,然后看一下他能不能啊,调用我们系统的那个浏览器,然后访问一下我搜索的关键词, 那这一个是绘图的技能,然后啊,大家可以看到刚才就调用了这个技能,然后自动打开了我们这个 bilibili, 然后去搜索了这个内容啊,这是 codex 它调用那个浏览器做到的一个事情 啊,就是已使用浏览器,然后搜索了这个内容,也就说它进行浏览器的调用是没有问题的,然后可以啊,有权限。 好,那我们重新啊,进到这里来,如果我想大家可以看到这里的技能是灰色的,是没有办法去使用的,因为只有要登录到 qq 官网才可以使用这些技能。但是有一个什么办法呢? 我们可以在本地让它去写一些技能的。其实啊,比如我想现在想进行文档或者说 excel 数据的处理,让它做一个技能,那我们只需要按反斜杠,然后输入 plugin 啊,输入 plugin 它会直接切换到这个 plugin creator, 它可以帮我们创建任意你想用的技能,然后把它做成技能,然后去进行一个调用啊,所以说啊,你可以通过这个方式把这一部分缺失的内容进行一个补齐好,比如我在这里,请帮我 制作制作一个啊本地文档 分析和 excel, excel 表格,处理了表格处理的技能, 然后确保可以用,确保能正常啊,调用, 然后发送出去啊,这个时候我们这一二三四就属于四个现成啊啊,当然目前运行的就这三个嘛,这宠物在这里会有提示的。 ok, 那 下面就是我们一个一个的内容,然后包括这些啊,他写的这个上下文,他还在这里修啊,他需要把这个内容做到一百零五万, 所以说他这里会自动的帮你修复一些问题,然后啊帮你去联网找一些东西,然后去开发一些功能,都可以使用这个 codex, 然后完成相关的任务。 那除此之外呢,其实还有一些啊非常有意思的一个功能,比如我进到这个技能里面来啊,比如刚才给大家演示了这个 browser use, 就是 使用浏览器的功能,然后在这里写文档的一个能力,就当在本地创建一个文件啊 啊,我们指定项目文件夹就可以了,那 presentation 的 技能就是它可以做 ppt 啊,做换登篇,然后还可以啊处理 excel 的 一个啊, spreadsheet 的 一个功能,它就可以直接出去处理 excel 的 一个表格啊,这都是它已经装好的这个技能。 那还有一个叫自动化,我们就可以让他,比如你你日常工作了,然后这里会存有相关的记忆,我们可以在这里新建一个啊自动化的功能,比如让他每天早上几点钟帮你去找什么东西,帮你 把放在什么地方,大家可以看到这里有每天,然后啊,或者说你设置成每周,然后都可以啊,这样的话他就会自动化的帮你完成某一个功能,比如我这里使用一个模板啊,这里会有,比如总结 某一个功能,随便选一个吧,那比如这一个,那你选择一个时间,然后选择一个项目 啊,就可以点击创建,因为我这里是没有在这里创建项目的,你可以在这里新建一个啊,空白项目啊,在空白项目下面,然后你用这个自动化啊,比如你在这里新建,然后使用随便使用一个模板, 然后选择项目,然后我们就可以点击创建,它就会自动的在这个项目下面,然后写相关的一个内容。比方你要联网搜一些相关的文献啊,或者说找相关的材料啊,都可以通过这个自动化的功能去完成,你不需要每次都问 ai, 它会每次自动的给你相关的啊答案 啊,这是一个用法。那好啊,这个技能啊制作的,它也是需要自己去写相关的技能,然后写相关的插件 啊,当然我这里是搞的是这个技能,其实我这里写的有点问题的,我可以在这编辑把这个技能改成插件,然后点击发送 啊,这是刚才通过这个绘制的一张图啊,这个其实大家会发现它用的那个啊功能就不是啊,一米七杠二的那个模型,而是通过技能去绘图,它的绘图模型其实是 gpt 五点五啊,就是通过这个五点五啊,自动去调用技能去画的一张图。 那好啊,这一次我就给大家分享了一下如何去啊,调优一下我们的这个配置文件,那当然这里大家可以看到还是两百五十六 k 是 因为我们这一个呃,这一个配置还没有完成啊, 然后他说他为本地准备做两处修改,他修改完了之后,我们重启 codex, 然后做一次验证 啊,是我们只需要在一个新的文件夹内啊,开个新的对话进行聊天,就可以来验证它是否啊正常的运行。当然还有一个问题,也是我发现在一些评论区里面,大家留言的,就是 啊,它一开始用的是 open ai 的 那个啊,订阅,然后 plus 会员,然后后面切换到那个 a p i 站,它会发现在原来的这个项目里面提问好像还是会请求那个啊 open ai 的 那个地址是因为一是你的配置文件没有改, 第二个就是你要新开对话啊,你新开对话它就会自动地调用这个 deep cloud 啊里面的 api, 然后进行处理啊,这样的话它就不依赖于 open ai 官网啊,你是不需要有特殊的网络环境的啊, context 也是可以正常进行运行的。 还有一个点就是啊,有一些小伙伴提到的就是它的界面一直是那个呃 英文的,它没有办法切换成中文,怎么搞呢?就是点击这个 setting, 然后在常规这个地方啊,如果你一直是那个啊,英文没有办法切换到中文的话,你可以把这个 auto detect 切换到下面,这有一个中文啊,选择中国啊就可以了。 那啊配置完如果没有生效的话,你可能需要调一下你的网络环境啊,配置一下应该就可以了。那第二个就是这里有一个外观,或者说叫 appearance, 在 appearance 下面我们可以调整我们 ui 的 一个字号,就是一些老年人他看字觉得太小了, 他可以把这个字号调大的,就是你可以在这,比如你调到十六啊,包括代码的大小都可以调大,比如调到十六,大家可以看到这个字体是明显比刚才要大的,然后这里的字号也是会变得更大的,对老年人更加友好嘛。 ok, 那 关于这一次的一个啊,更新内容也给大家讲的比较清楚了啊,就是关于一个是上下文窗口,然后有一些小的一个更新啊,包括这个插件啊, 然后还有技能方面的一个问题。还有就是大家如果要用到一些技能的话,可以自己去啊,开源社区或者说去一些论坛啊,当然我们社群里面也会不停地给大家分享一些好用的技能。 然后之前有一个叫 webislan 的 一个项目,然后就是说它非常适合那个 cloud code 和 codex 去啊,审批它的那个权限嘛, 因为我这里给的是啊允许完全的访问权限,当然有一些人他会啊限制他的权限嘛,那就是一些,比如默认权限啊,那每次都会去问你啊,是否要下一步,下一步啊,大家可以啊,来关注一下, 然后使用那个 wifi, 它其实在 macos 系统上它使用体验还是不错的啊,到时候我们也会做一个开源免费版本啊,然后发到我们这社群给大家去用。 那我们等待最后这一个啊,工作完成,他这里还在啊,写相关的内容,还没有把这个问题彻底修复一下,因为他默认的这一个 model context 还是两百五十八 k 啊,通过绘画日制,然后他要把这个改成一百零五万啊, 它会新增一个叫 model 啊, catalog jason 啊,指向本地自定义的目录,并自动把押取域值从九十万提高到一百万啊,然后下面有一些具体的内容,那我们等它搞完,搞完之后我们测试一下就好了 啊,当然我们待会也可以去看一下它改的这个目录到底是个什么内容,如果你感兴趣啊,其实啊,不用管太多的,我一般就是把一些任务直接啊像这样交一个命令给他,让他自己去完成就好。 整个流程大家可以看到,我只是说了一个配置文件,然后让它把这个内容内容完成一下,然后这里就会自动地进行啊运行。所以说 codex 和 那个 cloud 的 客户端是至少你在 ai 时代或者说 agent 时代你要去用的一个产品了。因为从 open ai 那 个官网他们的那个设计来也来看,也是他把 sora 的 那个产品先砍了,然后面又把呃 open ai 的 ai for science 的 那个项目也砍了,全力在做 codex。 而 cloud 是 比较早就做了 cloud code 嘛,那我把这条啊路给跑通。 gmail 现在在做企业级的 ai agent 平台。所以说其实啊,海外的这三家模型,其实模型厂商都在应用层上持续发力,而目前啊效果比较好的就是比如 codex 啊, cloud code 啊,这是在应用层上做的啊,相当 ok 的, 或者说在生产力端做的比较大的一个突破。 当然 codex 和 cloudcode 还是主要面向于啊 c 端的一个用户,对于 b 端,其实他们目前正在啊发力啊,不停地在做 b 端的一个优化。我们明显可以看到大摩天厂商啊,已经开始有啊盈利的能力了啊,不是说只是像以前那样 啊,不停地去吸引 c 端用户啊,现在已经在逐渐向 b 端用户进行一个拓展,这也是整个产业链大家需要关注到的一个点。 好,我们把这一个啊 codex, 现在它把这个上下文给它拓展了一下,我们只需要把啊这个插件也帮你做好了,然后这里是它生成的这个技能的文件啊,然后 sample 啊做了一个演示啊, 好,那我们不管那么多啊,我们现在重启一下 codex, 看它有没有搞成百万上下文嘛,对吧?我们现在点开 codex, 好,那这里已经搞定了,我们来看一下,我新开一个对话,新的对话,然后比如我在这随便输一个,你,好,然后看一下是不是拓展到了百万级的那个上下文窗口,这也是用它自己来解开它自己的一个限制啊, 那我们可以看一下,这里就会自动的是一零五零 k, 对 吧?然后他的一个上下纹是比较长的,就跟啊原来的这个地方他不一样,原来这个地方是还是原来的这个 啊,两百五十八 k 嘛,对吧?然后我们新开对话,后面你的所有交互都是这个一零五零 k 啊,这样的话你使用起来就更加方便了。 那当然我们也可以回来看一下,就是啊,他改的这个内容到底是个什么东西,我们重新打开啊, config 点 toml, 它其实新增了,就新增了一个这个东西啊, 就是 model catalog 杠 jason 的 一个文件,就就把那个上下文的长度在这一个地方啊做了一个演示啊, 好,我们可以甚至可以打开这个 model catalog custom jason, 来看一下它里面到底是个什么东西啊?呃,我往下找,应该就是这个配置文件,然后点开, 啊,这是他写的内容啊,这是他具体的一些啊东西,这是他自己写的, 比如 model context 啊,上下文,我们把它搞到了啊,一百万啊,好,我们不管那么多了,那这个配置文件感兴趣的可以去看一看啊,其实是没有必要去认真研究这个东西的。 那还有一个就是刚才这里不是做了个插件吗?它已经做好了本地插件,然后做了 excel and analyzer。 ok, 我 们不要管那么多啊,这里它就可以自动地去进行本地文档的一个分析,然后啊 excel 表格的处理,包括表格的运行的转换 啊,甚至一些数据清洗啊,都可以在这里让它自定义一些插件,或者说自定义一些技能,然后去完成。那这是本期我分享给大家的有关于啊 codex 的 一个高级用法,以及 config 点 toml 文件的一个升级,还有就是关于宠物系统的一个优化。好,这是本期视频的全部内容,谢谢大家。

式聊天窗口更像桌面端地个人 ai 操作系统。他把 react tori rust core 放进同一个 mono repo ui 做交互。 tori 接管本地能力, rust core 负责智能体运行。 前端拿到 r p c 地址和 token, 再把业务请求交给 rest。 核心是 agent harness, 对 话工具、子代理和事件都在这里编排,内置角色包括 orchestrator, planner, researcher, code, executive, 所以它不是问答模型,而是能调工具能分工的 agent。 runtime skills 负责扩展能力,一个 skill m d 就 能注入新的规则和资源。 memory tree 把聊天邮件文档规范化成 markdown chunk, chunk 写入 sqlite 和本地文件,再评分,抽实体折叠成摘要素 集成层,连接 gmail lotion github, slack autofresh, 再把数据拉进记忆术。实时能力走 socket 和 mcp 同步工具,调用工具返回结果。 技术站包括 react 十九, vita, tauri, vr, tokyo, oxum, escalite, 还有语音 google meet, mascot、 本地 ai token juice 和 obsidian vault。 一 句话,桌面 app 加 rust core, 加工具运行时加本的技术。

你以为 ai 助手最缺的是更强模型,但真正卡住它的,可能是它根本不认识你。我是老万,老万学 ai, 关注我,一起把 ai 用到产品、创业和真实工作里。觉得有用先点个赞,也欢迎在评论区留下你的问题。 今天拆一个开源项目, open 修门,它表面上是个人 ai 助手,但我觉得更值得看的是它背后的赌注,这个赌注是下一代个人 ai 评的。不是单次回答多聪明,而是谁能更快拿到你的上下文,还要长期记住,而且不能失控。 现在很多 ai 工具有个共同问题,你每次打开它,都想重新认识一个实习生,项目是什么,客户是谁,上周定了什么,他都要你再讲一遍。所以你不是在上 ai 工作,你是在给 ai 补课,补完课他才能开始干活。 open ui 的 路线是把顺序反过来,先把你的邮箱、日历、文档、仓库、聊天借进来,再让 ai 带着这些上下文回答和行动。 他先在强调一百一十八个以上的第三方集成,想执 mail, notion gitubslack、 stripe、 玉立云盘、 linear jera。 连接方式是一键授权,不是让你手填一堆 a p i t, 更关键的是自动拉取。它每二十分钟便利活跃连接,把新的邮件、文档、消息和任务拉进本地记忆,不用你每次手动喂资料,所以这里的产品判到很清楚。如果 ai 要成为个人工作搭子,聊天框只是入口,真正的底座是上下文。系统 上厦门。进来以后,第二个问题来了,你不能把所有东西都一股脑塞进对话框,那样成本高、延迟高,还很难追溯。 openhuman 做了一个记忆术,它把邮件、聊天文档和同步结果先规范成 markdown, 再切成不超过三千 token 的 片段, 然后这些片段会被评分抽取实体写进本地数据库,再折叠成来源数、主题数和全局数,也就是从碎片变成能导航的摘药结构。 这和普通项链库不太一样。项链库擅长回答什么,内容和这个问题相似,但个人记忆还要回答今天发生了什么,某个项目最新进展是什么。 他还把同样的信息落成 obc 点可以打开的 markdown 仓库,默认就在你的本机工作区,你能看、能搜、能编辑,也能知道内容从哪里来,这点很重要。如果一个 ai 说它记住了你,但你完全看不到它记了什么,那不是记忆,那更像黑箱。 有记忆还不够,他还得能干活,否则只是一个会翻笔记的聊天框。 openshuman 内置了一整套原声工具,搜索网页、抓网页、读写文件、跑 get、 跑测试、控制浏览器、做定时任务,这些不是临时装插件才有的能力。 这里还有一个工程点叫 token juice, 它会在工具结果进入模型之前先把噪音压掉。比如构建日制网页、邮件、长线城密、内行输出, r e a d m p 里说最多可以降低八成成本和延迟。你可以不纠结这个数字是不是每次都能达到,但方向是对的,上下文越多,压缩越是基础设施。 模型路由也类似,复杂推理走强模型,快速小任务走快模型,视觉走视觉模型。总结走压缩模型,用户不手动切,任务自己选, 再加上语音会议和桌面端能力,他想做的不是网页里的一个问答框,而是全天候贴在功锅楼旁边的个人 ai。 但这条路也不是没有代价,你接入的越多,他知道的越多,产品责任就越重。 open human 的 隐私序示是把记忆放在本机, calklus 数据库和 markdown 仓库都在你的设备上,原始数据不会因为后台同步就直接长驻它的后端, 第三方授权则由后端代理。 u l f t 肯不以铭文写在你电脑上。敏感评距走系统级安全存储,比如钥匙串和评距管理器。 但是你也要注意,它还是早期测试版。当一个 ai 接入邮箱、日历、代码、仓库和会议,你就不能只问它聪不聪明。你还要问四件事,它同步了什么,记在哪里,谁能删除什么动作,必须经过我确认,这才是个人 ai 的 安全边界。 所以我看 open 休们不是看它今天能不能替代所有工具,而是看它暴露了一个方向, ai 产品正在从更会回答走向更懂你的工作现场。 以后,判断这类产品可以看三个问题,它能不能自动获得上下文记忆,能不能被你检查和迁移行动权限,有没有清楚边界。这就是本期的结论。个人 ai 的 分水岭不是会不会聊天,而是能不能在不失控的前提下长期认识你。 这里是老湾学 ai, 如果这条对你有启发,记得关注点赞,也在评论区聊聊,你最想让我拆哪个 ai 案例。