大家好,我是李强,站在亚健康上。呃,这个是最近这十几天在 ai 圈比较火的 open human, 然后我给大家演示一下。啊哦,其实它跟 workbody 的 话其实还是有点差距的,就是腾讯在做产品上面肯定是胜人一筹的,这开源的软件的话,其实还是, 呃,在产品上是欠点火候的,所以我来跟大家演示一下。你好你好,你是谁? 我是你的 ai 助手,叫 chat, 在 openhuman 里帮你处理各种事情,查信息,安排人物,卸代码,关钱包等等,有什么需要直接说就行。 呃,所以,呃, open human, open human 它其实还是一个,就是一个个人提高工作效率,然后做一些 ai 事情的一个工具,大家有兴趣可以去使用一下,谢谢大家。
粉丝190获赞1100

今天我们要聊的是一个最近在各大技术平台都非常火的一个项目啊,叫 openhuman。 对, 它其实是一个个人的 ai 超级智能体啊,可以理解成是一个真正懂你的全场景的 ai 助手。没错没错,这个项目最近真的很火,那我们就直接开始吧。 我们先来说说这个 openhuman 的 节目定位,以及它到底是解决了一个什么样的痛点,为什么它可以在众多的 ai 项目当中脱颖而出?其实 openhuman 它就是一个可以跑在你各种设备上的个人 ai 超级智能体嘛, 它在 github trending 上是排名第一的,而且它的星标已经超过了十三点七万。它和其他的那些比如 minus 还有 openminus 这些项目最大的不同就在于,它真的是会花时间来了解你,对你进行建模。听起来挺有意思的,那这个 openhuman 它是怎么做到的?能够让用户不用每次都重新介绍自己,就可以直接使用 ai? 就是 它会主动地来了解你, 官方的说法是,在你连接好账户之后,差不多二十分钟左右就可以建立起你的个人上下文,然后你第一天就可以用它来做很多事情了,完全不需要每次都重新讲一遍你自己是谁,你要做什么,这可太省时间了。 那我们接下来要聊的就是这个赛道和产品亮相了,那我特别想知道就是这个 openhuman, 它在 ai agent 的 这个赛道里面到底是一个什么样的定位?它和同类的产品相比最大的区别是什么?它其实是一个全场景的个人助手哦,它不像 darwin 或者 open minus 那 样只专注于编程, 它的目标是要成为你生活和工作中的全能帮手。哦。那这个全场景到底是怎么体现出来的?在它的客户端上面有什么特别的设计吗?它的桌面客户端的设计特别有意思, 就是中间会有一个 mesco 的 虚拟形象,它会根据你的工作状态来变化表情。然后左边是一个记忆术,它会实时的更新,你可以看到所有的历史。右边是对话和工具面板, 所有的一切都是围绕着让你在各种场景下都能够高效地使用,这设计确实很新颖。对,那紧接着我们要聊的就是它的核心机制了,就是这个 open human, 它到底是怎么自动化地帮你整合这么多的服务,然后把你的各种数据都抓到本地来的?它背后的思路其实是借鉴了卡帕西的 obsidian wiki, 用结构化的 markdown 让 ai 能够更好地锁引。但是它厉害的地方就在于它完全不需要你手动地去维护它。支持一百一十八种服务的 o i o h f 像, gmail、 notion、 github、 slack、 谷歌日历,这些你都不需要自己去配。 a p i t。 天呐,这么多服务都能一键同步,确实省了不少事儿。 对,它的核心引擎会每隔二十分钟就去你的账户里面拉一次数据,包括邮件、日程、代码提交,所有的东西都会拉到本地。然后它会自动帮你清洗 切成合适的 markdown 片段,再按照主题和时间线做成层级摘要,你自己也可以随时去浏览和编辑这些所谓的记忆,这样的话效率确实提升了很多。对,那它在处理这些数据的时候有没有什么特别厉害的优化手段?当然有了,它用了一个叫 token juice 的 东西, 它会把 html 转成 markdown, 然后帮你驱虫。官方说它最多可以把你的成本和延迟降低百分之八十。 它的压缩规则是可以通过三层的 json 来配置的,就是内置用户和项目级别的配置。这优化做得真不错。对,那我们下面要聊的是后台与隐私。我想知道这个 openhuman 在 后台是怎么运作的?它在保护你的隐私上面到底有哪些独到的做法? 其实它有一个很有意思的设计,叫做潜意识循环,就是在你没有和它交互的时候,它也会在后台悄悄地帮你加载代办事项,读取你最近的记忆,然后自己去决定接下来要做什么。它的那个 mascot 会有不同的情绪表现,比如思考、闲置或者做梦, 甚至它可以自己去加入 google meet, 然后帮你记要点。哇,这个潜意识循环听起来真的很智能。对,那它的数据到底有多安全? 它采用的是本地优先的原则,它的记忆术是存在本地的 ciktor 里面的,然后 obsidian 的 文件也是在你自己的设备里,它的令牌是会进到系统的密钥链里面的,比如说像 macos 的 keychain, 然后它也支持你去配置 olemma 这种本地的模型,所以你的数据是几乎不会离开你的设备的。这和那些把记忆存在云端,或者说只是针对编程场景的产品有很大的不同, 这安全性确实挺让人放心的。对,那我们最后要聊的就是这个 openhuman 现在有哪些短板,以及它未来可能会往哪些方向去发展。它现在还处于 early beta 阶段,采用的是 gpl 三协议,所以它的衍生版本也必须要开源。 他目前还不支持微信和钉钉,但是他的开发团队更新的非常快。好的,那他未来的发展方向会有哪些比较大的变化?他的目标是要从一个每次都要你去手动喂给他上下文的工具,变成一个可以主动去积累知识,慢慢的变得真正懂你的伙伴, 他的使用门槛也会变得更低,可能你之前要准备几周的时间,到后面你可能只需要二十分钟左右的开箱时间就可以用了。 好的,那今天我们就一起体验了一下这个 openhuman 的 独特魅力,从它的全场景的助手定位,到它的这种本地优先的隐私保护, 再到它的这种不断的学习,变得更懂你的这种能力,真的让人觉得未来的 ai 助手就应该是这个样子。没错没错,那我们这期节目就到这里了,然后感谢大家的收听,咱们下期再见,拜拜!拜拜!

一千零四十六颗星,一百一十八个第三方服务一键连接,每二十分钟自动同步。一个用 rest 打造的桌面 ai, 二十分钟就能了解你的全部工作上下文。用过 ai 代理的人都知道这个痛点,它刚启动,什么都不懂, 你告诉他的事,转头就忘别的 ai 积累足够,上下文要好几周。而 open human 只要二十分钟,核心是 memory tree, 邮件文档、聊天记录全部压缩成三千 tokyo 以内的 markdown 块,分级存储在本地,同时生成 abcde 知识点库,你打开就能搜索、编辑浏览。 灵感来自 carpathy 的 笔记工作流。 gmail notion github slack stripe calendar。 一 百一十八个服务,一键 oof 授权连接,不需要手动配 api key, 每二十分钟自动拉取最新数据到你的 memory tree。 每次工具调用网页抓取邮件内容都吃 token, token juice 压缩,曾把 html 转 markdown, 长链接缩短,清除涌鱼,同等信息量下, token 消耗减少最多百分之八十。和 cloud co work、 open cloud hermes agent 对 比, open human 在 记忆系统集成数量、自动数据获取、模型、路由四个维度全部领先, 别人还在手动配插件,它已经全自动了。它还有个桌面吉祥物,会说话,有嘴型同步,甚至能加入你的 google meeting 当真实参会者。 语音输入加语音输出,不是打字,是真的在跟你对话。一千多颗星, new 开源协议,完全免费,数据全部本地存储加密,隐私有保障。关注我,下期继续带你发现开源宝藏!

get up 一 周热点汇总第一百一十五期,本期的内容呢,包括了桌面级的 ai, 超级助理,编程 agent 的 智能图谱,隐身, chrome 把任何软件变成 c l i 工具,以及呢实时的流式三 d 重建模型。那最后呢,还是分享两份资料,如果觉得内容不错啊,别忘了点赞和关注。 open human 呢,是一个开源的智能助手,那这半年呢,涌现了很多啊,现象级的 a 阵的工具,尤其呢是 open claw 和 hammer 最为呢出名。 open human 呢,在功能上啊,和它们是类似的,那它整体来看呢,最有特色的是两点,第一个呢是 open human 啊, 希望让 ai 呢主动来了解我们。那整个项目的核心链路呢,可以拆解为三个部分,就是连接,抓取和记忆。那项目支持啊,超过了一百八十种的第三方集成和自动的拉取。这里呢应该是使用 composio 的 工具。那前几期呢,我也介绍过, 可以去翻一下之前的视频,它可以呢,每二十分钟去便利每一个活跃的链接,并且将新的数据拉取到记忆术当中。第二个呢是 memory tree 和 obsidian 的 双轨机制,这套机制呢,是来自 ai 大 神卡帕西分享过的。 obsidian 工作流 思路呢,还是很精华的安装啊,还是比较简单的 macos 和 linux, 支持一键的 q 命令去安装。 windows 呢,也有 powershell 的 脚本 也支持呢本地的模型。但是目前呢,整体的设计思路啊,还是希望引导去使用它云上的 ai, 所以呢,虽然支持本地的 ai 和自定义啊,但是都比较麻烦。 最后啊,项目还给出了一个 token zui 的 一个压缩层来去降低 token 的 开销,官方的数据啊,说可以把成本和延迟降低百分之八十。项目里呢,也给出了一个很重要的问题是迁移,比如呢,我熟悉了一个工具,就不想要去切换, 所以呢,想要让用户啊进来使用它的新工具,其实应该学习一下 hems, 提供自动化的迁移工具。总之呢,项目的思路我觉得还是很值得去学习和了解的。 如果你用过 cloud code 或者是 cursor 呢,去写大的项目肯定啊,遇到过这个问题,就是 agent, 每次呢都要用 grab 等工具呢,去到处的翻文件,去找代码, 那一顿凶猛的操作背后啊,就是 token 在 燃烧。 code graph 呢,就是来解决这一个痛点的,他给你的代码仓库啊,去预先建设一个支持图谱, 背着的呢,直接去查图谱就可以了,不用呢再去买文件的,去乱找官方给的数据啊,平均可以便宜百分之三十五。 token 呢,可以减少百分之五十九,那速度啊,可以提升百分之四十九,也可以减少百分之七十的。工具调用在 vs code 这种十 k 以上的大文件的仓库上,效果尤为明显。 toc 呢,消耗呢,可以直接降低到原来的四分之一左右。那使用上呢,也比较简单啊,一号命令就可以安装,然后呢,在 code graph init 就 可以触及化。项目支持了 cloud code, cursor, codex, 还有 c r i, open code 等这样主流的编程。 agent 那也支持啊,超过十九种的编程语言,还有框架级的路由识别,比如呢,像 jungle, flex, spring express 这些常见的都可以自动的识别,同时呢,它也保证啊,是在本地去运行数据呢,不上传,也没有外部的 api 调用,对隐私敏感的开发者来说啊,是非常好的一个消息。 clock browser 呢,是一个隐身版的 chromecast 浏览器,它通过了超过三十个的反爬检测网站的测试。呃, recapture v 三评分呢,也是零点九。 cloudfire 的 测试呢,也可以直接通过市面上一些比较常见的方案,比如像 playrite, undetected 都是呢 gs 注入或者是配置层面的 patch。 那 chrome 一 旦更新了就容易失效, 那本项目的做法呢,会更硬核一些,它直接修改了 chrome 的 c 加加的原码,五十八个补丁呢,去覆盖了像 canva, 视频字体, gpu 等内容啊,翻译成真正的二级质的文件。这样的反爬系统啊,就确实识别到的是一个正常的浏览器了。 那对于做自动化和数据采集的还有 ai 浏览器的朋友来说呢,这个项目是值得去关注的。那最近一段时间呢, c l i 的 热度啊,不断的上升,那这周啊,我也出视频介绍了飞出的 c l i。 那 本项目是又一个来自于港大 h k u d s 实验室的, 它的想法呢,就是把所有的 gui 的 软件都变成 ai agent 能够使用的命令行工具。那它的原理呢,其实也不难理解, ai agent 呢,通过 gui 来控制软件,那效率呢,是高于截图加 gui 的 方式的。那 gui anything 呢,就会分析你的软件的源代码或者是 github 的 仓库, 去自动化的生成一个 zenfors 的 命令行接口。然后呢, aia 的 呢,就能够直接的通过终端的命令来去使用这个软件了,那目前社区啊,已经贡献了超过十八个以上的应用, c r i 的 适配,比如呢,像 blender 啊, liboffice 啊,还有 zoom, 甚至呢,包括了 go dot 的 游戏引擎, 那还有一个 c l i hub 的 包管理器,只要安装以后啊,就可以去一键浏览安装所有社区构建的 c l i。 那 本项目支持 cloud code, cursor, codex, opencloud 等主流的工具。 说实话呢,这个项目的野心还是很大的,如果真的能够做到啊,让 ai agent 通过 agent 去直接操控任何的软件,那对于 agent 的 生态来说是一个巨大的推动的。流式三 d 重建基础模型, 它可以从流逝的视频数据当中呢,去实时的重建三 d 的 场景。那蚂蚁凌波呢,在年初的时候一口气开源了四款大模型, 包括了 lingbot dapps, lingbot vla, lingbot va, lingbot word, 覆盖了感知底层环境理解,行动输出,但其中呢,缺少了一个关键的环节,就是如何把连续的感知数据呢,实时的构建成稳定的三维空间模型, 那本项目呢,就是填补了这个空缺。那简单来说呢,就是你拿着一个手机啊,去拍一段视频,它能够一边拍一边实时的重构出三 d 的 场景,速度呢可以达到约二十 fps, 支持啊室内外的场景,并且呢是 r 八七二点零的开源许可协议模型呢,在哈根 face 和 model scope 上呢,也都能够下载。如果你对像三 d 视觉啊,自动驾驶等技术呢感兴趣,可以去了解一下这个项目。 那最后啊,还是分享两份资料,第一份呢是重构与崛起 openclaw 时代的中国 agent 的 产业生态报告主要呢围绕 openclaw 引发的 agent 的 产业的革命去展开,分析了中国 ai agent 的 生态的协议啊,模型啊,平台啊,还有商业模式上的这个发展的过程。 报告重点讨论了包括像 skill 经济啊, a 阵的基础设施,还有一些企业级的治理等内容。那第二份呢,是二零二五年人形机器人市场研究报告,它系统的梳理了全球与中国的人形机器人产业的发展状况, 市场格局,还有未来的一些趋势。那报告也重点分析了像语数啊, u b 选啊,还有 figure, ai 等企业它的发展路径,以及呢在一些重点行业当中的一些商业化的进展。那有需要的呢可以告诉我。那以上啊,就是本周的全部内容,那我们下次再见。

今天我选的 ai 开源项目是 openhuman, 它不是又一个聊天框,而是想把你的邮箱日程、 slack、 github 和浏览器接近。一个本地优先的个人 ai 助手。 项目现在七千一百多星,核心用 rust 和 textscript 的 写,最新版本是 v 零点五十三点四三,昨天刚发版,今天还在持续推送。它最强的卖点是 memory tree, 连接进来的数据会被压缩成 markdown, 存进本机 sq lite, 并同步到 obsidian 风格的知识库。 还有一百一十八个以上集成, gmail, notion、 github、 slack、 stripe、 calendar、 drive, linear、 gera, 靠 os 一 键接入后台,每二十分钟自动抓新上下文。 openhuman 还内置网页搜索、爬取文件系统、 git 测试语音和模型路由,甚至支持通过 alma 跑本地模型。他想做的是一个会记住你工作流的桌面 agent, 但我建议先当 early beta 看,他会接触很多个人数据。先在小号和非敏感账号里试,重点验证隐私边界、同步质量和记忆是否真的有用。



openhuman, 你 的个人 ai 超级智能体,它是开源的,注重隐私的,而且极其强大。 想象一下,有一个 ai 助手,它真正了解你,记住你的一切,还能连接你所有的工具。 openhuman 的 核心理念很简单,简单易用,以人为本, 干净的桌面界面,几次点击就能从安装到运行一个 ai 代理,不需要配置文件,不需要命令行操作。 它还有一个可爱的桌面吉祥物,会说话、会反应,甚至能作为真实参与者加入你的 google meet 会议。 open human 支持一百一十八个以上的第三方集成, gmail、 nokia、 github、 slack、 stripe、 日历、 google drive、 linear、 zero, 一个都不漏,而且全部通过一键 oout 连接。每个连接都会被转化为 ai 可以 直接使用的工具。 更重要的是自动抓取功能,每二十分钟就会从所有活跃连接中拉取最新数据到你的记忆术中。 openhuman 的 记忆术是一个本地优先的知识库,它从你的数据和活动中自动构建,所有连接的内容都会被规范化为不超过三千。 token 的 markdown 的 片段经过评分后折叠成分层摘要素,存储在你机器上的 s、 k、 l i 数据库中。 同样的内容还会以 markdown 的 文件的形式存入。 obsidian 兼容的知识库,灵感来自 carposy 的 obsidian wiki 工作流。 open human 内置了完整的工具集,网页搜索、网页抓取、完整的编码工具链,包括文件系统、 git、 代码检查、测试和搜索。还有原声语音,支持语音识别输入, eleven labs 语音合成输出吉祥物口型同步,甚至能在 google meet 中作为实时代理参与智能模型路由会自动把每个任务发送到最合适的 ilm token。 juice 是 open human 的 智能令牌压缩技术,每一个工具调用抓取结果、邮件、政文和搜索赋载。在接触到任何 lm 模型之前,都会经过令牌压缩层的处理。 htm l 会被转换为 markdown, 长 url 会被缩短,非 lsa i 字母会被移除。 你得到同样的信息,但只需要一小部分的 token, 成本和延迟,最高降低百分之八十。和其他 ai 代理平台相比, openhuman 的 优势非常明显。 cloud co work 是 闭源的, open cloud 和 hermes 需要自带模型,且以终端为主。而 open human 不 仅开源,还有一键集成,自动数据抓取,内置模型路由、原声、语音和搜索工具,几分钟内就能获得完整上下文,而不是几周 开始使用。 openhuman 非常简单,访问 tiny humans o i, 下载安装包,或者在终端运行一行安装命令。 mac os、 linux 和 windows 全平台支持 连接你的账号,让自动抓取拉取数据。几分钟内,你的 ai 助手就拥有了完整的上下文。 openhuman, 你 的人工智能由你掌控。

ok 啊,兄弟们,现在这个 ai 生成好了,我们看看它生成的什么?嗯,这是写的对标题啊。写的对标题,这可以算是一个文章吗? 有点没太明白它这个逻辑啊。好,我们再打一个继续看看它还能继续干什么。哦,很快啊,它现在开始疯狂思考了,它还在一个一个思考,它还在继续的往下迭代啊,这些都是跟 ai 有 关的话题, 他应该是,呃,再继续上一个主题,再继续生成啊,就是说这个我给他的任务是让他生成一百种 ai 的 用法, 他在继续跟我头脑风暴其他种感觉。目前他这个头脑风暴的内容啊,也没啥问题,只不过呢我是想让他生成这个公众号文章,一篇篇文章给他生成的,他这个生成太简略了,他就是头脑风暴的一个观点。好,我们来看下面这几个。首先这个呢是一个后, 这个后面啊,这个是胸麦叶,胸麦叶它就有一个可以语音对话的这样一个窗口啊,可以看到这个它的吉祥物。这个呢是我们刚才的聊天框 connections 啊,这个是一个连接啊,它可以连接到这些这些三方应用上面啊,它有一个充足的这个三方应用的支持。嗯 嗯,这个呢? intelligence 啊,这是他的这个,呃记忆页面啊,就你跟他聊天之后他生成的一些,呃,一些一些这个 ai 生成的一些东西嘛?根据你的对话总结出来的 dreams 有 他做的梦,还有 ai 可以 做梦。嗯,这个呢是他的这个记忆啊,他的记忆。嗯, 这个是呢,他现在活动的一些任务。 rewards 是 一个奖励啊,你跟他聊天会有一些,会有一套成就系统啊,这个设计还是挺有意思的。一个成就系统解锁更多积分奖励, 这个就没啥了。这个就是设置,设置账号通知。哎,他可以选语言。嗯,我们给他给他选到中文啊,才发现他居然有中文版本的。 嗯?这个是啥呢啊?这个是一个主题颜色,换主题颜色账单开发者。开发者选择都有啥呢?来的选择啊?可以对这些。呃,可以去做配置。什么 v 户口啊?一定的 check 呀,包括一些本地的一些的 bug 呀,这样的东西。

式聊天窗口更像桌面端地个人 ai 操作系统。他把 react tori rust core 放进同一个 mono repo ui 做交互。 tori 接管本地能力, rust core 负责智能体运行。 前端拿到 r p c 地址和 token, 再把业务请求交给 rest。 核心是 agent harness, 对 话工具、子代理和事件都在这里编排,内置角色包括 orchestrator, planner, researcher, code, executive, 所以它不是问答模型,而是能调工具能分工的 agent。 runtime skills 负责扩展能力,一个 skill m d 就 能注入新的规则和资源。 memory tree 把聊天邮件文档规范化成 markdown chunk, chunk 写入 sqlite 和本地文件,再评分,抽实体折叠成摘要素 集成层,连接 gmail lotion github, slack autofresh, 再把数据拉进记忆术。实时能力走 socket 和 mcp 同步工具,调用工具返回结果。 技术站包括 react 十九, vita, tauri, vr, tokyo, oxum, escalite, 还有语音 google meet, mascot、 本地 ai token juice 和 obsidian vault。 一 句话,桌面 app 加 rust core, 加工具运行时加本的技术。

兄弟们, ai 总是记不住你的事,每次聊天都要从零开始。这个十八点六 k 新神器 openhuman 直接给你私人超级智能,它是你的个人 ai 超级智能,完全私有,本地优先,简单又极致强大!亮点一,一百一十八加第三方服务自动拉取,每二十分钟更新一次 gmail, notion go top slack 全打通。亮点二,本地记忆术搭配 obsidian 兼容知识永久保存,再也不忘。亮点三,内置网页搜索,爬虫代码工具,还有原声语音功能。 亮点四,智能 token 压缩成本和延迟最高降低百分之八十,还支持 olama 本地模型,再也不用担心 ai 记不住你了!想拥有真正私人超级智能的马上试试,记得点赞关注哦!

养虾养马已经过时了,现在是虾马人养人了, open human 来了。 open human 什么呢?就是它自动去抓取你的工作行为流程,不需要再去写 skill 了。我们只需要安装好之后,授权我们的常用工具, 它就可以去抓取我们的一些行为数据,形成我们个人的私人助手啊,这个就非常重要了,对不对?那我们以前还要去写 skill, 还去给他去配工具,现在不用了,装上之后 只要你给他监控权限,他全部记录下来,并且分辨到我们的记忆库之后,他能去理解我们平时要干的工作,自动把它变成背着它再给我们服务,并且再去抓取的时候,还去做自动的压缩偷啃,消耗才能减少百分之八十。现在像这种 工具真是越来越多了,未来我相信这种开箱即用的工具会非常多,我们普通人不用说这个工具好难,以后那种懒人式、无脑式的工具绝对有的。

哈喽,朋友,晚上好。现在大部分的 ai agent 呀,都有一个很尴尬的问题,你每次打开它,都需要解释一遍,我是谁?我在做什么项目?这个仓库为什么这么写?我昨天跟谁聊过这个客户之间提过什么要求?所以很多人用 ai agent 的 真实体验,不是他替我干活,而是 我要先给他一份完整的入职培训手册。但最近有一个很火的开源项目叫做 openhuman, 他的思路是刚好反过来,不是每次你来教 ai 认识你,而是 ai 先把你的工作实践吸收进去, 包括 human。 官方给自己的定义是叫做个人的 ai 超级智能。这个说法有那么一丢丢的营销啊。但是它真正值得关注的地方不是超级智能四个字,而是它想解决 agent 的 冷启动问题。它的核心做法就是把你的邮箱、文档、聊天、日历、代码、仓库全都接进去。 官方的 readme 里写了一百一十八种第三方的集成方式,通过 os 来连接以后,每二十分钟自动抓取一次。 然后他不会简单粗暴地把所有东西都塞进 property, 而是把这些邮件、文档、聊天、日历、代码、仓库这些内容整理成一个叫做 memory tree 的 结构。 更有意思的是,他会把这些记忆写成 obsidian 兼容的 markdown, what? 也就是说, ai 的 记忆不是一个你看不见的黑盒销量库, 而是一堆你可以打开、浏览、编辑、删除了 markdown 文件。这个点我觉得就非常关键,因为这意味着未来的个人知识库可能不只是给人看的,而是给 agent 当第二大脑的。过去我们讲 ai agent 经常讲模型、能力、 工具调用、自动执行。但真正用起来以后,你会发现, agent 呢?最大的问题不一定是不会干活,而是不知道该怎么干。他不知道你的偏好,不知道你的项目背景,不知道哪些客户重要,不知道哪个文档是旧的,不知道哪个决策已经被废弃了。所以你越想让他做复杂的任务,就越需要先给他补全上下文。 欧盟赫曼抓住的是另外一个方向, a 政策的能力上限不止取决于模型能力有多强,也取决于他对你有多少了解。如果一个 ai 已经知道了你的日历、邮件代码、文档、会议机要、任务系统,那他给出了建议和执行动作,理论上就会更贴近于你的真实处境。 比如你问他帮我准备明天和某个客户的会议,普通的机器人可能就会给你一个通用的会议模板。那如果他真正读过你的邮件、日历、上次的会议机要和项目文档, 他就可以直接告诉你这个客户上次卡在了什么问题上,你是否答应过什么,还有哪些问题是没有关闭的,以及明天最需要做的事情是那几件。 这才是 agent 真正有用的地方。 openheme 最打动我的地方是,他把记忆曾落到了 obsidian 这种人能读懂的格式里面。这件事看起来很小,在他背后也有很大的分歧。 ai 的 记忆到底是属于平台还是属于用户? 如果记忆只存在于某个云服务里,但其实你只能看到它,很难去修正它。它记错了,你不会知道它。如果过度总结了,你也不会知道它把一个临时想法当成了长期的偏好, 你还是不知道。但如果这些记忆十八个档文件放在你的本地 word 里,那你至少可以打开看一看。你可以删掉错误的记忆,你可以改掉过期的信息,可以把重要的项目 单独整理出来。这让 ai 记忆从一个平台黑盒变成了一种可以被人类共同维护的知识资产。那对于我这种本来就用 open c d n 来写内容做知识管理的人来说,这个方向就会特别自然。以前 open c d n 是 我的第二大脑, 那以后可能就是我 agent 的 第二代了。未来我们选择 ai agent, 可能不止看谁回答的更快,谁的模型能力更强。可能更需要看的是另外三件事,第一,它的记忆是不是可见。第二,它的数据是不是可控。第三,它能不能被迁移、被删除,被你真正的拥有? 所以我对 openhuman 的 判断是,它现在未必是一个普通人应该马上就要重度依赖的成熟产品,但它代表的方向非常重要。 过去一年, ai agent 的 竞争重点是谁更会执行任务,但接下来,竞争可能会变成,谁更能拥有长期记忆,谁更能理解你的世界。从这个角度来看, open call 们真正有意思的地方,不是他接了一百一十八个工具,也不是他最近在开源社区热度很高,而是他提出了一个很清晰的问题, 如果 ai agent 迟早要成为我们的数字助手,那他的记忆应该放在哪里?是放在某个平台的黑盒里, 还是放在你自己能够打开的 obsidian what? 我 个人更倾向于后者,因为一个真正属于你的 ai, 首先应该拥有一份真正属于你的记忆,这也是同学如果喜欢我的视频,记得点赞双关注,我们下期再见!

你以为 ai 助手最缺的是更强模型,但真正卡住它的,可能是它根本不认识你。我是老万,老万学 ai, 关注我,一起把 ai 用到产品、创业和真实工作里。觉得有用先点个赞,也欢迎在评论区留下你的问题。 今天拆一个开源项目, open 修门,它表面上是个人 ai 助手,但我觉得更值得看的是它背后的赌注,这个赌注是下一代个人 ai 评的。不是单次回答多聪明,而是谁能更快拿到你的上下文,还要长期记住,而且不能失控。 现在很多 ai 工具有个共同问题,你每次打开它,都想重新认识一个实习生,项目是什么,客户是谁,上周定了什么,他都要你再讲一遍。所以你不是在上 ai 工作,你是在给 ai 补课,补完课他才能开始干活。 open ui 的 路线是把顺序反过来,先把你的邮箱、日历、文档、仓库、聊天借进来,再让 ai 带着这些上下文回答和行动。 他先在强调一百一十八个以上的第三方集成,想执 mail, notion gitubslack、 stripe、 玉立云盘、 linear jera。 连接方式是一键授权,不是让你手填一堆 a p i t, 更关键的是自动拉取。它每二十分钟便利活跃连接,把新的邮件、文档、消息和任务拉进本地记忆,不用你每次手动喂资料,所以这里的产品判到很清楚。如果 ai 要成为个人工作搭子,聊天框只是入口,真正的底座是上下文。系统 上厦门。进来以后,第二个问题来了,你不能把所有东西都一股脑塞进对话框,那样成本高、延迟高,还很难追溯。 openhuman 做了一个记忆术,它把邮件、聊天文档和同步结果先规范成 markdown, 再切成不超过三千 token 的 片段, 然后这些片段会被评分抽取实体写进本地数据库,再折叠成来源数、主题数和全局数,也就是从碎片变成能导航的摘药结构。 这和普通项链库不太一样。项链库擅长回答什么,内容和这个问题相似,但个人记忆还要回答今天发生了什么,某个项目最新进展是什么。 他还把同样的信息落成 obc 点可以打开的 markdown 仓库,默认就在你的本机工作区,你能看、能搜、能编辑,也能知道内容从哪里来,这点很重要。如果一个 ai 说它记住了你,但你完全看不到它记了什么,那不是记忆,那更像黑箱。 有记忆还不够,他还得能干活,否则只是一个会翻笔记的聊天框。 openshuman 内置了一整套原声工具,搜索网页、抓网页、读写文件、跑 get、 跑测试、控制浏览器、做定时任务,这些不是临时装插件才有的能力。 这里还有一个工程点叫 token juice, 它会在工具结果进入模型之前先把噪音压掉。比如构建日制网页、邮件、长线城密、内行输出, r e a d m p 里说最多可以降低八成成本和延迟。你可以不纠结这个数字是不是每次都能达到,但方向是对的,上下文越多,压缩越是基础设施。 模型路由也类似,复杂推理走强模型,快速小任务走快模型,视觉走视觉模型。总结走压缩模型,用户不手动切,任务自己选, 再加上语音会议和桌面端能力,他想做的不是网页里的一个问答框,而是全天候贴在功锅楼旁边的个人 ai。 但这条路也不是没有代价,你接入的越多,他知道的越多,产品责任就越重。 open human 的 隐私序示是把记忆放在本机, calklus 数据库和 markdown 仓库都在你的设备上,原始数据不会因为后台同步就直接长驻它的后端, 第三方授权则由后端代理。 u l f t 肯不以铭文写在你电脑上。敏感评距走系统级安全存储,比如钥匙串和评距管理器。 但是你也要注意,它还是早期测试版。当一个 ai 接入邮箱、日历、代码、仓库和会议,你就不能只问它聪不聪明。你还要问四件事,它同步了什么,记在哪里,谁能删除什么动作,必须经过我确认,这才是个人 ai 的 安全边界。 所以我看 open 休们不是看它今天能不能替代所有工具,而是看它暴露了一个方向, ai 产品正在从更会回答走向更懂你的工作现场。 以后,判断这类产品可以看三个问题,它能不能自动获得上下文记忆,能不能被你检查和迁移行动权限,有没有清楚边界。这就是本期的结论。个人 ai 的 分水岭不是会不会聊天,而是能不能在不失控的前提下长期认识你。 这里是老湾学 ai, 如果这条对你有启发,记得关注点赞,也在评论区聊聊,你最想让我拆哪个 ai 案例。

二零二六年五月十七日 geek 今日热门来了!今天的 top 八个项目,带你看清开发者风向。 openhuman 是 一个完全本地运行的个人 ai 超级智能平台,强调隐私保护与极致性能。它以 rust 构建,只在让普通用户无需云端依赖即可运行,强大的 ai 能力 近日已接一千七百颗星高居榜首,反映出社区对本地化、私有化 ai 方案的强烈需求。 我的看法是 rust 写的本地个人 ai 平台,主打隐私不上云,今日暴涨近一千七百星,但具体跑什么模型、硬件门槛多高都没说清,先观望。 c l anything 提供了一个统一的 c 号,使任意软件都能被 ai agent 直接调用和集成,无需为每个工具单独适配。 它解决了 ai agent 与现有命令行工具之间的互操作难题,让万物皆 agent 成为可能。 来自香港大学数据智能团队,近日因 agent 生态热度持续走高而受到关注。我的看法是,想法挺好,但还很早把任意 c l i 包成 agent 可调用层,实际能不能稳定跑通看适配质量,目前更像 demo。 kel diy 是 kel 点 com 团队开源的轻量级日程调度基础设施,面向所有人提供自托管的预约日历解决方案。相比完整版 kel 点 com, 它更加精简易用,适合个人开发者快速搭建。调度功能 近日上网,源于其零门槛自建 cliently 替代品的定位,吸引了大量独立开发者关注。我的看法是 kel 点 com 出的轻量自托管版,想替代 cliently 的 可以拉下来跑,配置比正式版简单不少。 b 是 用 zig rust 构建的极速 java script 一 体化工具链,即运行时打包器、测试框架和包管理器于一身,性能大幅领先 node js 和 npm。 它持续作为 js 生态的热门项目,近日再次进入榜单,说明其版本迭代或相关技术讨论持续活跃。对于追求构建速度和开发体验的团队, b 是 目前最值得关注的 node 替代方案之一。 我的看法是,装上直接替 mpn 跑,脚本和测试基本无痛,当到全量替身还得踩 native 模块和边角 api 的 坑。 opengenre tv 啊,是一个自托管的 ai 图像与视频生成平台,整合了二百家开源模型, mit 协议免费使用。 它解决了商业 ai 生成服务价格高昂、数据隐私存疑的问题,为个人和企业提供完全可控的生成式 ai 能力。 今日以七百余颗新星入榜,体现了社区队免费加开源加自托管 ai 工具的持续热情。我的看法是,自托管要自己配 gpu 和模型权重,二百家模型听着多旦,实际能跑起来的没几个,先看文档评估硬件门槛。 shadow broker 是 一个开源情报 ausent 聚合平台,整合了飞机、卫星、地震等公开数据源,并结合 ai 提供智能分析能力。 他面向安全研究人员、记者和地源政治分析师提供低门槛的公开情报追踪工具。近日上网,反映出 ausent 工具领域的持续关注度,尤其在当前全球地源政治敏感时期,吸引力更为突出。 我的看法是, awesome 聚合器加 ai 分 析思路不新,但整合度看着够用,能不能跑起来取决于那堆数据员。 api 题,你愿不愿意一个个去申请? agent skills 是 一个面向专业 ai 编程 agent 的 技能注册中心,提供经过安全验证的标准化技能包,解决 ai agent 能力碎片化和安全性缺失的问题。 他为企业级 ai 编程工具提供可信的技能扩展机制,类似 ai agent 的 应用商店。随着 agent 编程工具快速普及,此类标准化基础设施项目正逐渐受到技术团队重视。 我的看法是,想给 ai agent 装技能包的注册中心概念清晰,但生态美起来,明天能用的现成 skill 太少,先观望。 agent store's production 是 一套系统性的企业级 genie agent 开发教程合集,覆盖从原型验证到生产部署的完整链路,以 jupiter notebook 形式呈现,异于实践。 他填补了当前 ai agent 教程只讲 demo 不 讲落地的空白,对工程师将 agent 能力真正推向生产环境具有直接参考价值。近日上榜,说明开发者社区对生产级 ai agent 的 学习需求持续旺盛。 我的看法是, no book 教程合集讲企业级 agent 从原型到部署照着跑,能少踩坑,但真上生产还得自己搭基建。 以上就是今日 geek hop 热门项目,关注我,每天一分钟看清开发者风向!

还在研究怎么养虾养马吗?现在 ai 圈开始流行养人了,在龙虾、 open claw、 爱马仕、 hermes agent 之后,一个叫 open human 的 开源项目强势登顶,几天内狂揽过万颗星。很多人可能会问,虾和马已经很强了,为什么还会杀出一个新物种? 因为无论是虾还是马,本质上都面临一个巨大的痛点,它们的记忆严重依赖于你们的交互。 你每天都在教 ai 做事,你要给他配 skill, 写复杂的提示词,手动上传会议纪要和代码文档。归根结底,你得先动它们才动,一天不维护它们,就不知道你今天经历了什么。 而 open 兄们的出现,就是为了打破这个冷启动难题,它不需要你教,它能用二十分钟自动了解你的一切,那它到底是怎么做到的? ai 大 神卡帕西之前分享过一个很火的知识管理框架,叫 llm wiki。 简单说就是把所有的笔记项目文档整理成结构化的 markdown 文件,让 ai 随时读取。这思路很完美,但全手工整理太反人类了。 openhuman 干的事,就是把卡帕西这套手工活变成了全自动流水线。它主要分三步,第一步,一键连接。它内置了一百一十八个第三方服务, gmail github, notion 日历,你工作用的核心工具,一键授权就能接进来,不用到处去配。 a p i t。 第二步,二十分钟无感抓取。连接完之后,它的核心引擎每二十分钟会自动轮询一次新邮件日程变更、代码提交,全部静默拉取到本地 agent 自己知道什么时候该刷新你的状态。第三步,生成记忆术, 抓来的数据会被切成不超过三千 token 的 片段,按主题和时间线打分,最终折叠成一棵记忆树。 最硬核的是,这份记忆会同步生成可编辑的本地 markdown 文件。这意味着 ai 脑子里的记忆,你不仅能看懂,还能直接修改。 一次同步跑完,它对你的工作了如指掌,没有磨合期,第一天上班就能干活。你可能会问,这么庞大的数据全塞给大模型 token, 费用不会爆炸吗? openhuman 引入了一个叫 token juice 的 机制, 每次网页抓取或读取邮件前,数据会先过一遍榨汁机 html 转 markdown, 长网址缩短涌于信息去重官方数据说,这套机制能把 token 消耗砍掉百分之八十,可以记住高达十亿 token 的 信息。 此外,他还有一个很超前的设计,叫潜意识循环。即使你不主动发指令,他也会在后台获取近期记忆,自主决定还有什么代办可以干。他甚至能化身一个虚拟形象,作为独立参会者,加入你的线上会议。你开会,他旁听既要点, 这才是真正意义上的赛博助理。那么,现在的三大顶流 a 阵的虾马人到底该怎么选?我给大家总结了一个选型逻辑,第一,如果你需要一个跨平台执行网关,选龙虾,龙虾解决的是工具多的问题, 他适合你在微信飞书里随时发指令,让他在后台帮你写代码、画 ppt。 他 是个听话的外包牛马。 第二,如果你需要一个自我成长型员工,选爱马仕。爱马仕解决的是能自学的问题,它内置了学习循环,适合扔在服务器上跑长期任务遇到报错,它能自己修改生成新技能,它是个不断进化的超级员工。 第三,如果你需要一个懂你的贴身助理,选 open 胸闷。 open 胸闷解决的是懂你的问题。 如果你受够了,每次都要给 ai 为背景资料,想要一个过目不忘把你的工作流全部吃透的数字分身,选它。 这三个痛点拆开看,是功能合起来其实代表了 agent 发展的三个方向,执行力、学习力和记忆力。之前的 agent 心思都花在能干上了,但在懂你这方面始终差了点意思。 openhuman 的 爆火,证明了未来的 ai 竞争不再是比谁的模型参数大,而是比谁能更低成本、更全自动地同步你的专属记忆虾解决工具问题,马解决自学问题,但真正懂你的,或许还得人来。

一天一个开源项目,今天是 openhuman, 它最值得看的不是又一个桌面 ai 助手,而是想把你的邮件、文档、消息和工具组织成一个真的会持续积累上下文的个人 agent harness。 openhuman 不是 等你每次手动未上下文 remy 明写它有一百一十八个以上第三方集成一键 oof, 而且每二十分钟 autofatch 一 次,把 gmail, notion, gighub, slack, calendar 这些连接都变成 tata tools。 真正有意思的是,它的 memory layer 内容会被规范化成不超过三千 token 的 markdown chunks, 再折叠成 hierarchical summary tree, 存在你本机的 escalate 里,同时落到一个 obsidian compatible vault。 再往下看,它已经不是聊天壳 agents, md 直接写 react 加 tauri v。 二、桌面壳里面嵌一个 rust core, 再加上 native voice, web search scraper coder tools, google meet agent model routing, 基本已经是一整套 personal ai run time。 所以 官方虽然会说 personal ai super intelligence, 但这期更值得记住的判断其实是 open human 真正做中的是个人 ai 最难的 harness 层。 现在它主语言 rust gpl 三点零十九点五千星,最新 release 是 v 零点五十四点零,最近提交还在继续改 billing integrations 和 core state。 如果你关心个人 ai 怎么从聊天框走向长期上下文系统,这个项目很值得看。

兄弟们,你们要的 ai 助手它来了!目前已经二十三点二 k 新标了! openhuman 是 你的个人 ai, 超级智能,私密简单且极其强大。一个不用你配置终端,不用写轮询代码的 ai 助手,开箱即用一键 o l d 接入你的全部工作流, 每二十分钟自动刷新记忆术背后的 token g 四技术,能砍掉百分之八十的 token 成本,中日韩文字一个不丢,本地优先,数据归你。这是二零二六年打工人,真正的赛博分身,赶紧点赞收藏去试试吧!

这两天非常火的 openhuman, 别只看它写着一百一十八个数据源,真正值得学的是它的记忆系统 memory tree、 bucketseal、 obsidian wiki。 它是一个本地优先的个人 ai 助理,官方定位是私有,简单、强大,连接 gmail、 slack、 notion、 github 这些服务后,它会持续把新数据拉进记忆。普通 agent 的 记忆大多是平的,要么写进几个 m d 文件,要么丢进数据库,未来靠搜索找回来。 问题是过去的信息很难自动补进来,人也很难直接看,直接改。 open human 的 核心叫 memory tree, 不是 一个薄薄的项链库外壳,它把每天的邮件、聊天文档先转成 markdown, 再切块打分进入三棵树。 第一棵是原树,每个 gmail、 slack 频道文档来源都先保留自己的上下文。第二棵是主题树,同一个人项目话题在多个来源里出现,会被聚合起来。第三棵是全局树,每天形成一次总览,再继续压成周月年的记忆。 最有品位的是巴克次友,新内容,先进入 l 零缓冲区,攒到五万 token 左右,或者足够多条数据后,再风筒压缩,摘要升到上一层,上一层满了,继续压缩,形成一颗能逐层展开的记忆树。所以他不是全量搜索,而是先看高层摘要,再一路钻回原始证据。 一百一十八个数据源的意义也不是炫数量,真正关键是 autofatch, 每二十分钟从活跃连接里同步新数据,让记忆自己生长。另一个关键是 obsidian wiki, 他 把同一份记忆写成你本机上的 markdown 文件,你能打开阅读、修改、迁移。 这句话很重要,你看不见的记忆很难真正信任他。还有一个 subconscious loop 向后台心跳。他会定期读工作区和记忆发现任务风险机会,但涉及写操作仍然需要你确认。对国内用户来说,问题也很明显。目前原声数据源更偏海外工具, 微信、飞书、钉钉、本地 word 和 pdf 这些日常资料还需要额外处理,所以我更看重的是它的架构,而不是线程连接器。 我按这个思路做了一个 skill, 给他一个本地文件夹,他会扫描文档转 markdown, 再按记忆术方式生成 obsidian wiki。 这就是 open human 最值得学的地方,让 ai 的 记忆既能自动生长,又能被人看见和修正。

今天聊一个 github 上的项目,叫 openhuman, 三个月飙到八千六百星,定位挺狂的。私人 ai, 超级智能,说白了就是一个开源的桌面 ai, 可层接上你的所有账号,自动建本地知识库,不是普通的聊天界面。 先说持续记忆,跟 chat、 gpt 和 cloud 那 些聊天助手的本质区别就在这里。每一次打开,他都认识你。不用重新介绍, 你把 gmail、 github, slack、 notion 全接进来,每二十分钟自动同步一次,压缩成本地记忆。下次打开,他已经知道你在干什么。长效记忆不是画饼,是实实在在跑在本地的东西。 再说 memory tree, 它不走向量数据库那条路,它认一个道理,做记忆不能靠模糊搜索,得靠导航。所有数据先转成 markdown, 切成小块打分,然后构建成三层摘要素, 它能回答今天发生了什么。这个人的最新动态,上周二下午那笔 stripe 退款在哪?向量数据库只能回答什么跟这个像,它能告诉你那个东西在哪。 还有一个特别聪明的设计 token juice, ai 的 成本大头不再思考,再看上下文,一个 git status 几百行,一封邮件几千字。 token juice, 在 数据进模型前先做处理, html 转 markdown, 长 url 剪掉重复型,去掉 三层规则叠加内置规则,用户自定义,项目级配置,没有它,每二十分钟叠加内置规则,用户自定义,项目级配置,没有它,每二十分钟全量同步多个数据源, token 成本根本扛不住。 最后说现状,安装很方便,一行命令搞定, all off, 一 键接服务,等二十分钟完成首次同步,就能直接问 记忆文件,可以在 abc 里打开编辑,你的知识库你说了算,但它确实还不够成熟,一百二十一个 issue 开着,有 core panic, 几乎每天发版。技术站也重 rust tori saph 要装一堆东西,核心功能依赖后端,不是完全本地化的。 总结一下, openhuman 最值得关注的地方不是又一个 ai 桌面客户端,而是它真的在认真解决 ai 的 记忆问题。靠工程化的数据流水线,不是向量数据库, 缺点就是太早了,还在快速迭代,但方向是对的, ai 助手不应该每次都是陌生人。