养虾养马已经过时了,现在是虾马人养人了, open human 来了。 open human 什么呢?就是它自动去抓取你的工作行为流程,不需要再去写 skill 了。我们只需要安装好之后,授权我们的常用工具, 它就可以去抓取我们的一些行为数据,形成我们个人的私人助手啊,这个就非常重要了,对不对?那我们以前还要去写 skill, 还去给他去配工具,现在不用了,装上之后 只要你给他监控权限,他全部记录下来,并且分辨到我们的记忆库之后,他能去理解我们平时要干的工作,自动把它变成背着它再给我们服务,并且再去抓取的时候,还去做自动的压缩偷啃,消耗才能减少百分之八十。现在像这种 工具真是越来越多了,未来我相信这种开箱即用的工具会非常多,我们普通人不用说这个工具好难,以后那种懒人式、无脑式的工具绝对有的。
粉丝1393获赞6817

今天我们要聊的是一个最近在各大技术平台都非常火的一个项目啊,叫 openhuman。 对, 它其实是一个个人的 ai 超级智能体啊,可以理解成是一个真正懂你的全场景的 ai 助手。没错没错,这个项目最近真的很火,那我们就直接开始吧。 我们先来说说这个 openhuman 的 节目定位,以及它到底是解决了一个什么样的痛点,为什么它可以在众多的 ai 项目当中脱颖而出?其实 openhuman 它就是一个可以跑在你各种设备上的个人 ai 超级智能体嘛, 它在 github trending 上是排名第一的,而且它的星标已经超过了十三点七万。它和其他的那些比如 minus 还有 openminus 这些项目最大的不同就在于,它真的是会花时间来了解你,对你进行建模。听起来挺有意思的,那这个 openhuman 它是怎么做到的?能够让用户不用每次都重新介绍自己,就可以直接使用 ai? 就是 它会主动地来了解你, 官方的说法是,在你连接好账户之后,差不多二十分钟左右就可以建立起你的个人上下文,然后你第一天就可以用它来做很多事情了,完全不需要每次都重新讲一遍你自己是谁,你要做什么,这可太省时间了。 那我们接下来要聊的就是这个赛道和产品亮相了,那我特别想知道就是这个 openhuman, 它在 ai agent 的 这个赛道里面到底是一个什么样的定位?它和同类的产品相比最大的区别是什么?它其实是一个全场景的个人助手哦,它不像 darwin 或者 open minus 那 样只专注于编程, 它的目标是要成为你生活和工作中的全能帮手。哦。那这个全场景到底是怎么体现出来的?在它的客户端上面有什么特别的设计吗?它的桌面客户端的设计特别有意思, 就是中间会有一个 mesco 的 虚拟形象,它会根据你的工作状态来变化表情。然后左边是一个记忆术,它会实时的更新,你可以看到所有的历史。右边是对话和工具面板, 所有的一切都是围绕着让你在各种场景下都能够高效地使用,这设计确实很新颖。对,那紧接着我们要聊的就是它的核心机制了,就是这个 open human, 它到底是怎么自动化地帮你整合这么多的服务,然后把你的各种数据都抓到本地来的?它背后的思路其实是借鉴了卡帕西的 obsidian wiki, 用结构化的 markdown 让 ai 能够更好地锁引。但是它厉害的地方就在于它完全不需要你手动地去维护它。支持一百一十八种服务的 o i o h f 像, gmail、 notion、 github、 slack、 谷歌日历,这些你都不需要自己去配。 a p i t。 天呐,这么多服务都能一键同步,确实省了不少事儿。 对,它的核心引擎会每隔二十分钟就去你的账户里面拉一次数据,包括邮件、日程、代码提交,所有的东西都会拉到本地。然后它会自动帮你清洗 切成合适的 markdown 片段,再按照主题和时间线做成层级摘要,你自己也可以随时去浏览和编辑这些所谓的记忆,这样的话效率确实提升了很多。对,那它在处理这些数据的时候有没有什么特别厉害的优化手段?当然有了,它用了一个叫 token juice 的 东西, 它会把 html 转成 markdown, 然后帮你驱虫。官方说它最多可以把你的成本和延迟降低百分之八十。 它的压缩规则是可以通过三层的 json 来配置的,就是内置用户和项目级别的配置。这优化做得真不错。对,那我们下面要聊的是后台与隐私。我想知道这个 openhuman 在 后台是怎么运作的?它在保护你的隐私上面到底有哪些独到的做法? 其实它有一个很有意思的设计,叫做潜意识循环,就是在你没有和它交互的时候,它也会在后台悄悄地帮你加载代办事项,读取你最近的记忆,然后自己去决定接下来要做什么。它的那个 mascot 会有不同的情绪表现,比如思考、闲置或者做梦, 甚至它可以自己去加入 google meet, 然后帮你记要点。哇,这个潜意识循环听起来真的很智能。对,那它的数据到底有多安全? 它采用的是本地优先的原则,它的记忆术是存在本地的 ciktor 里面的,然后 obsidian 的 文件也是在你自己的设备里,它的令牌是会进到系统的密钥链里面的,比如说像 macos 的 keychain, 然后它也支持你去配置 olemma 这种本地的模型,所以你的数据是几乎不会离开你的设备的。这和那些把记忆存在云端,或者说只是针对编程场景的产品有很大的不同, 这安全性确实挺让人放心的。对,那我们最后要聊的就是这个 openhuman 现在有哪些短板,以及它未来可能会往哪些方向去发展。它现在还处于 early beta 阶段,采用的是 gpl 三协议,所以它的衍生版本也必须要开源。 他目前还不支持微信和钉钉,但是他的开发团队更新的非常快。好的,那他未来的发展方向会有哪些比较大的变化?他的目标是要从一个每次都要你去手动喂给他上下文的工具,变成一个可以主动去积累知识,慢慢的变得真正懂你的伙伴, 他的使用门槛也会变得更低,可能你之前要准备几周的时间,到后面你可能只需要二十分钟左右的开箱时间就可以用了。 好的,那今天我们就一起体验了一下这个 openhuman 的 独特魅力,从它的全场景的助手定位,到它的这种本地优先的隐私保护, 再到它的这种不断的学习,变得更懂你的这种能力,真的让人觉得未来的 ai 助手就应该是这个样子。没错没错,那我们这期节目就到这里了,然后感谢大家的收听,咱们下期再见,拜拜!拜拜!

工先部前脚刚提示 openclock 安全隐患,腾讯后脚就掏出了 qclock 企鹅版龙虾,朕已经下场了。 我看了一眼官方功能,只能说大厂的降维打击太狠了。最变态的功能是哪一个?不是支持 windows mac, 也不是内置国产大模型, 是微信直接对网远程操控电脑。用代码思维来说,微信变成了远程控制台。在地铁上发个微信,家里电脑就开始干活了。这就是 rpc 调用,程序员最懂,以前玩 openclo 你 得懂配置,升版本还经常把龙虾整崩溃了,搞半天还得重来。现在零配置, 微信发个消息,电脑就开始帮你读文件,发邮件,搞浏览器,再加上打通了五千家 s a s 市场,这是什么?这是 api 生态系统。为什么大厂能赢?因为开源之解决了能不能跑,大厂解决了安不安全和好不好用,别再折腾那些危险的野路子了。 q c o a w 这次你拿到名额了吗?

前脚攻击步刚提示 opencloud 的 安全隐患,后脚腾讯又掏出了它的内侧底牌, qcloud 企鹅版龙虾正规军下场了。我看了眼官方公布的功能,只能说大厂的降维打击太狠了。最变态的功能是哪一个? 不是支持 windows mac, 也不是内置国产大模型,是微信直接对话远程操控电脑。以前玩开源 a 镜的你得懂配置,升版本还把龙虾整跪了,搞了半天还得重来, 现在零配置,在地上发个微信,家里的电脑就能开始帮你干活了。微信直接变成了操作系统的遥控器,再加上它直接打通了五千家 style 市场,这说明什么? qq 可乐已经不是极客的玩具了,它要变成普通人的数字牛马,读文件,发邮件,搞浏览器, 在本地跑的明明白白。如果后续再叠戴个社交可乐,那效果简直炸裂。为什么大厂能赢?因为开源只解决了能不能跑,大厂解决了安不安全和好不好用,别再折腾那些危险的野路子了。 qq 那 次你拿到名额了吗?评论区见。

还在研究怎么养虾养马吗?现在 ai 圈开始流行养人了,在龙虾、 open claw、 爱马仕、 hermes agent 之后,一个叫 open human 的 开源项目强势登顶,几天内狂揽过万颗星。很多人可能会问,虾和马已经很强了,为什么还会杀出一个新物种? 因为无论是虾还是马,本质上都面临一个巨大的痛点,它们的记忆严重依赖于你们的交互。 你每天都在教 ai 做事,你要给他配 skill, 写复杂的提示词,手动上传会议纪要和代码文档。归根结底,你得先动它们才动,一天不维护它们,就不知道你今天经历了什么。 而 open 兄们的出现,就是为了打破这个冷启动难题,它不需要你教,它能用二十分钟自动了解你的一切,那它到底是怎么做到的? ai 大 神卡帕西之前分享过一个很火的知识管理框架,叫 llm wiki。 简单说就是把所有的笔记项目文档整理成结构化的 markdown 文件,让 ai 随时读取。这思路很完美,但全手工整理太反人类了。 openhuman 干的事,就是把卡帕西这套手工活变成了全自动流水线。它主要分三步,第一步,一键连接。它内置了一百一十八个第三方服务, gmail github, notion 日历,你工作用的核心工具,一键授权就能接进来,不用到处去配。 a p i t。 第二步,二十分钟无感抓取。连接完之后,它的核心引擎每二十分钟会自动轮询一次新邮件日程变更、代码提交,全部静默拉取到本地 agent 自己知道什么时候该刷新你的状态。第三步,生成记忆术, 抓来的数据会被切成不超过三千 token 的 片段,按主题和时间线打分,最终折叠成一棵记忆树。 最硬核的是,这份记忆会同步生成可编辑的本地 markdown 文件。这意味着 ai 脑子里的记忆,你不仅能看懂,还能直接修改。 一次同步跑完,它对你的工作了如指掌,没有磨合期,第一天上班就能干活。你可能会问,这么庞大的数据全塞给大模型 token, 费用不会爆炸吗? openhuman 引入了一个叫 token juice 的 机制, 每次网页抓取或读取邮件前,数据会先过一遍榨汁机 html 转 markdown, 长网址缩短涌于信息去重官方数据说,这套机制能把 token 消耗砍掉百分之八十,可以记住高达十亿 token 的 信息。 此外,他还有一个很超前的设计,叫潜意识循环。即使你不主动发指令,他也会在后台获取近期记忆,自主决定还有什么代办可以干。他甚至能化身一个虚拟形象,作为独立参会者,加入你的线上会议。你开会,他旁听既要点, 这才是真正意义上的赛博助理。那么,现在的三大顶流 a 阵的虾马人到底该怎么选?我给大家总结了一个选型逻辑,第一,如果你需要一个跨平台执行网关,选龙虾,龙虾解决的是工具多的问题, 他适合你在微信飞书里随时发指令,让他在后台帮你写代码、画 ppt。 他 是个听话的外包牛马。 第二,如果你需要一个自我成长型员工,选爱马仕。爱马仕解决的是能自学的问题,它内置了学习循环,适合扔在服务器上跑长期任务遇到报错,它能自己修改生成新技能,它是个不断进化的超级员工。 第三,如果你需要一个懂你的贴身助理,选 open 胸闷。 open 胸闷解决的是懂你的问题。 如果你受够了,每次都要给 ai 为背景资料,想要一个过目不忘把你的工作流全部吃透的数字分身,选它。 这三个痛点拆开看,是功能合起来其实代表了 agent 发展的三个方向,执行力、学习力和记忆力。之前的 agent 心思都花在能干上了,但在懂你这方面始终差了点意思。 openhuman 的 爆火,证明了未来的 ai 竞争不再是比谁的模型参数大,而是比谁能更低成本、更全自动地同步你的专属记忆虾解决工具问题,马解决自学问题,但真正懂你的,或许还得人来。

大家好,我是李强,站在亚健康上。呃,这个是最近这十几天在 ai 圈比较火的 open human, 然后我给大家演示一下。啊哦,其实它跟 workbody 的 话其实还是有点差距的,就是腾讯在做产品上面肯定是胜人一筹的,这开源的软件的话,其实还是, 呃,在产品上是欠点火候的,所以我来跟大家演示一下。你好你好,你是谁? 我是你的 ai 助手,叫 chat, 在 openhuman 里帮你处理各种事情,查信息,安排人物,卸代码,关钱包等等,有什么需要直接说就行。 呃,所以,呃, open human, open human 它其实还是一个,就是一个个人提高工作效率,然后做一些 ai 事情的一个工具,大家有兴趣可以去使用一下,谢谢大家。

一千零四十六颗星,一百一十八个第三方服务一键连接,每二十分钟自动同步。一个用 rest 打造的桌面 ai, 二十分钟就能了解你的全部工作上下文。用过 ai 代理的人都知道这个痛点,它刚启动,什么都不懂, 你告诉他的事,转头就忘别的 ai 积累足够,上下文要好几周。而 open human 只要二十分钟,核心是 memory tree, 邮件文档、聊天记录全部压缩成三千 tokyo 以内的 markdown 块,分级存储在本地,同时生成 abcde 知识点库,你打开就能搜索、编辑浏览。 灵感来自 carpathy 的 笔记工作流。 gmail notion github slack stripe calendar。 一 百一十八个服务,一键 oof 授权连接,不需要手动配 api key, 每二十分钟自动拉取最新数据到你的 memory tree。 每次工具调用网页抓取邮件内容都吃 token, token juice 压缩,曾把 html 转 markdown, 长链接缩短,清除涌鱼,同等信息量下, token 消耗减少最多百分之八十。和 cloud co work、 open cloud hermes agent 对 比, open human 在 记忆系统集成数量、自动数据获取、模型、路由四个维度全部领先, 别人还在手动配插件,它已经全自动了。它还有个桌面吉祥物,会说话,有嘴型同步,甚至能加入你的 google meeting 当真实参会者。 语音输入加语音输出,不是打字,是真的在跟你对话。一千多颗星, new 开源协议,完全免费,数据全部本地存储加密,隐私有保障。关注我,下期继续带你发现开源宝藏!

opencloud 爆火之后,很多朋友跟我说也想试一试,但是呢,要么是部署太难,要么是动不动就要收费。终于我测试了多款养虾软件之后呢,发现了这个 workbody, 它不用部署安装就能用,大家担心的安全问题呢,也都可以解决 它呀,完全兼容小龙虾的 skills。 那 么让我们先来看看大家最关心的 workbody, 它具体都能干什么?它可以数据分析、写 ppt、 新媒体运营等等, 真正实现了直接干活。我在用的过程中发现,最近他们还上新了一个行业专家这个功能,上面有一百四十多位顶级的行业专家,可以做到 一键呼唤,比如教他做小红书的运营,他可以自动分析爆款制作内容,一键发布,全流程都能搞定。把我震惊了,这相当于雇了一个员工啊,直接省了一个人力成本。 我真正想要推荐 work buddy 的 原因是它可以实现远程控制和安全可靠。微信 cloud bot 里扫码直接连接,同样都是腾讯出品,体验呀,相当的丝滑。它还能绑定目前主流的企微、 qq、 钉钉、飞书等等这些主流的通讯工具, 来远程遥控龙虾干活。我们在外面用微信给他发指令回去啊,检查结果就行了。更省心的是,你直接把他当成一个数字员工来管理,直接用微信给他派活,查看进度。哎,他还可以生成一个每日的简报,准时推送给你,让你对他的工作一目了然。 当然呀,每个养虾人养出的智能助手,都可以解锁不同的潜力。目前我觉得 workbody 特别的好用,而且呀,它还白送五千积分让大家薅羊毛,赶紧一起来试试吧!

今天我选的 ai 开源项目是 openhuman, 它不是又一个聊天框,而是想把你的邮箱日程、 slack、 github 和浏览器接近。一个本地优先的个人 ai 助手。 项目现在七千一百多星,核心用 rust 和 textscript 的 写,最新版本是 v 零点五十三点四三,昨天刚发版,今天还在持续推送。它最强的卖点是 memory tree, 连接进来的数据会被压缩成 markdown, 存进本机 sq lite, 并同步到 obsidian 风格的知识库。 还有一百一十八个以上集成, gmail, notion、 github、 slack、 stripe、 calendar、 drive, linear、 gera, 靠 os 一 键接入后台,每二十分钟自动抓新上下文。 openhuman 还内置网页搜索、爬取文件系统、 git 测试语音和模型路由,甚至支持通过 alma 跑本地模型。他想做的是一个会记住你工作流的桌面 agent, 但我建议先当 early beta 看,他会接触很多个人数据。先在小号和非敏感账号里试,重点验证隐私边界、同步质量和记忆是否真的有用。


本周上升速度最快的 ai 项目 openhuman 是 什么? cloud 很 强,但你每次还得重新解释背景。 opencloud 再全能也有个硬伤,记忆和能力都不够强。所以我觉得下一波 a 阵拼的不是谁会聊天,而是谁更懂你。 openhuman 就是 堵这条路。 二十五点七 k star 开源个人 ai, 它能接 gmail, notion, gitop 每二十分钟自动拉上下文塞进本地记忆术和 obsidian。 我 不说它能替代谁,但这个方向值得看。感兴趣去 gitop 翻细节,你更想要全能 agent, 还是懂你的 agent。

get up 一 周热点汇总第一百一十五期,本期的内容呢,包括了桌面级的 ai, 超级助理,编程 agent 的 智能图谱,隐身, chrome 把任何软件变成 c l i 工具,以及呢实时的流式三 d 重建模型。那最后呢,还是分享两份资料,如果觉得内容不错啊,别忘了点赞和关注。 open human 呢,是一个开源的智能助手,那这半年呢,涌现了很多啊,现象级的 a 阵的工具,尤其呢是 open claw 和 hammer 最为呢出名。 open human 呢,在功能上啊,和它们是类似的,那它整体来看呢,最有特色的是两点,第一个呢是 open human 啊, 希望让 ai 呢主动来了解我们。那整个项目的核心链路呢,可以拆解为三个部分,就是连接,抓取和记忆。那项目支持啊,超过了一百八十种的第三方集成和自动的拉取。这里呢应该是使用 composio 的 工具。那前几期呢,我也介绍过, 可以去翻一下之前的视频,它可以呢,每二十分钟去便利每一个活跃的链接,并且将新的数据拉取到记忆术当中。第二个呢是 memory tree 和 obsidian 的 双轨机制,这套机制呢,是来自 ai 大 神卡帕西分享过的。 obsidian 工作流 思路呢,还是很精华的安装啊,还是比较简单的 macos 和 linux, 支持一键的 q 命令去安装。 windows 呢,也有 powershell 的 脚本 也支持呢本地的模型。但是目前呢,整体的设计思路啊,还是希望引导去使用它云上的 ai, 所以呢,虽然支持本地的 ai 和自定义啊,但是都比较麻烦。 最后啊,项目还给出了一个 token zui 的 一个压缩层来去降低 token 的 开销,官方的数据啊,说可以把成本和延迟降低百分之八十。项目里呢,也给出了一个很重要的问题是迁移,比如呢,我熟悉了一个工具,就不想要去切换, 所以呢,想要让用户啊进来使用它的新工具,其实应该学习一下 hems, 提供自动化的迁移工具。总之呢,项目的思路我觉得还是很值得去学习和了解的。 如果你用过 cloud code 或者是 cursor 呢,去写大的项目肯定啊,遇到过这个问题,就是 agent, 每次呢都要用 grab 等工具呢,去到处的翻文件,去找代码, 那一顿凶猛的操作背后啊,就是 token 在 燃烧。 code graph 呢,就是来解决这一个痛点的,他给你的代码仓库啊,去预先建设一个支持图谱, 背着的呢,直接去查图谱就可以了,不用呢再去买文件的,去乱找官方给的数据啊,平均可以便宜百分之三十五。 token 呢,可以减少百分之五十九,那速度啊,可以提升百分之四十九,也可以减少百分之七十的。工具调用在 vs code 这种十 k 以上的大文件的仓库上,效果尤为明显。 toc 呢,消耗呢,可以直接降低到原来的四分之一左右。那使用上呢,也比较简单啊,一号命令就可以安装,然后呢,在 code graph init 就 可以触及化。项目支持了 cloud code, cursor, codex, 还有 c r i, open code 等这样主流的编程。 agent 那也支持啊,超过十九种的编程语言,还有框架级的路由识别,比如呢,像 jungle, flex, spring express 这些常见的都可以自动的识别,同时呢,它也保证啊,是在本地去运行数据呢,不上传,也没有外部的 api 调用,对隐私敏感的开发者来说啊,是非常好的一个消息。 clock browser 呢,是一个隐身版的 chromecast 浏览器,它通过了超过三十个的反爬检测网站的测试。呃, recapture v 三评分呢,也是零点九。 cloudfire 的 测试呢,也可以直接通过市面上一些比较常见的方案,比如像 playrite, undetected 都是呢 gs 注入或者是配置层面的 patch。 那 chrome 一 旦更新了就容易失效, 那本项目的做法呢,会更硬核一些,它直接修改了 chrome 的 c 加加的原码,五十八个补丁呢,去覆盖了像 canva, 视频字体, gpu 等内容啊,翻译成真正的二级质的文件。这样的反爬系统啊,就确实识别到的是一个正常的浏览器了。 那对于做自动化和数据采集的还有 ai 浏览器的朋友来说呢,这个项目是值得去关注的。那最近一段时间呢, c l i 的 热度啊,不断的上升,那这周啊,我也出视频介绍了飞出的 c l i。 那 本项目是又一个来自于港大 h k u d s 实验室的, 它的想法呢,就是把所有的 gui 的 软件都变成 ai agent 能够使用的命令行工具。那它的原理呢,其实也不难理解, ai agent 呢,通过 gui 来控制软件,那效率呢,是高于截图加 gui 的 方式的。那 gui anything 呢,就会分析你的软件的源代码或者是 github 的 仓库, 去自动化的生成一个 zenfors 的 命令行接口。然后呢, aia 的 呢,就能够直接的通过终端的命令来去使用这个软件了,那目前社区啊,已经贡献了超过十八个以上的应用, c r i 的 适配,比如呢,像 blender 啊, liboffice 啊,还有 zoom, 甚至呢,包括了 go dot 的 游戏引擎, 那还有一个 c l i hub 的 包管理器,只要安装以后啊,就可以去一键浏览安装所有社区构建的 c l i。 那 本项目支持 cloud code, cursor, codex, opencloud 等主流的工具。 说实话呢,这个项目的野心还是很大的,如果真的能够做到啊,让 ai agent 通过 agent 去直接操控任何的软件,那对于 agent 的 生态来说是一个巨大的推动的。流式三 d 重建基础模型, 它可以从流逝的视频数据当中呢,去实时的重建三 d 的 场景。那蚂蚁凌波呢,在年初的时候一口气开源了四款大模型, 包括了 lingbot dapps, lingbot vla, lingbot va, lingbot word, 覆盖了感知底层环境理解,行动输出,但其中呢,缺少了一个关键的环节,就是如何把连续的感知数据呢,实时的构建成稳定的三维空间模型, 那本项目呢,就是填补了这个空缺。那简单来说呢,就是你拿着一个手机啊,去拍一段视频,它能够一边拍一边实时的重构出三 d 的 场景,速度呢可以达到约二十 fps, 支持啊室内外的场景,并且呢是 r 八七二点零的开源许可协议模型呢,在哈根 face 和 model scope 上呢,也都能够下载。如果你对像三 d 视觉啊,自动驾驶等技术呢感兴趣,可以去了解一下这个项目。 那最后啊,还是分享两份资料,第一份呢是重构与崛起 openclaw 时代的中国 agent 的 产业生态报告主要呢围绕 openclaw 引发的 agent 的 产业的革命去展开,分析了中国 ai agent 的 生态的协议啊,模型啊,平台啊,还有商业模式上的这个发展的过程。 报告重点讨论了包括像 skill 经济啊, a 阵的基础设施,还有一些企业级的治理等内容。那第二份呢,是二零二五年人形机器人市场研究报告,它系统的梳理了全球与中国的人形机器人产业的发展状况, 市场格局,还有未来的一些趋势。那报告也重点分析了像语数啊, u b 选啊,还有 figure, ai 等企业它的发展路径,以及呢在一些重点行业当中的一些商业化的进展。那有需要的呢可以告诉我。那以上啊,就是本周的全部内容,那我们下次再见。

openhuman, 你 的个人 ai 超级智能体,它是开源的,注重隐私的,而且极其强大。 想象一下,有一个 ai 助手,它真正了解你,记住你的一切,还能连接你所有的工具。 openhuman 的 核心理念很简单,简单易用,以人为本, 干净的桌面界面,几次点击就能从安装到运行一个 ai 代理,不需要配置文件,不需要命令行操作。 它还有一个可爱的桌面吉祥物,会说话、会反应,甚至能作为真实参与者加入你的 google meet 会议。 open human 支持一百一十八个以上的第三方集成, gmail、 nokia、 github、 slack、 stripe、 日历、 google drive、 linear、 zero, 一个都不漏,而且全部通过一键 oout 连接。每个连接都会被转化为 ai 可以 直接使用的工具。 更重要的是自动抓取功能,每二十分钟就会从所有活跃连接中拉取最新数据到你的记忆术中。 openhuman 的 记忆术是一个本地优先的知识库,它从你的数据和活动中自动构建,所有连接的内容都会被规范化为不超过三千。 token 的 markdown 的 片段经过评分后折叠成分层摘要素,存储在你机器上的 s、 k、 l i 数据库中。 同样的内容还会以 markdown 的 文件的形式存入。 obsidian 兼容的知识库,灵感来自 carposy 的 obsidian wiki 工作流。 open human 内置了完整的工具集,网页搜索、网页抓取、完整的编码工具链,包括文件系统、 git、 代码检查、测试和搜索。还有原声语音,支持语音识别输入, eleven labs 语音合成输出吉祥物口型同步,甚至能在 google meet 中作为实时代理参与智能模型路由会自动把每个任务发送到最合适的 ilm token。 juice 是 open human 的 智能令牌压缩技术,每一个工具调用抓取结果、邮件、政文和搜索赋载。在接触到任何 lm 模型之前,都会经过令牌压缩层的处理。 htm l 会被转换为 markdown, 长 url 会被缩短,非 lsa i 字母会被移除。 你得到同样的信息,但只需要一小部分的 token, 成本和延迟,最高降低百分之八十。和其他 ai 代理平台相比, openhuman 的 优势非常明显。 cloud co work 是 闭源的, open cloud 和 hermes 需要自带模型,且以终端为主。而 open human 不 仅开源,还有一键集成,自动数据抓取,内置模型路由、原声、语音和搜索工具,几分钟内就能获得完整上下文,而不是几周 开始使用。 openhuman 非常简单,访问 tiny humans o i, 下载安装包,或者在终端运行一行安装命令。 mac os、 linux 和 windows 全平台支持 连接你的账号,让自动抓取拉取数据。几分钟内,你的 ai 助手就拥有了完整的上下文。 openhuman, 你 的人工智能由你掌控。

就在刚刚,微信官方支持 open q 了,在这个视频里我会介绍如何一步一步完成插件安装,以及安装过程中会踩到的坑。如果你也想把小龙虾接入微信,请一定认真看完哦!第一件事,我们把微信更新到最新的八点零点七零版本。接下来我们去到设置插件, 这里第一个坑来了,第一次进入可能看不到 club 的 插件,可以关闭微信后重新进入,多试几次即可。接下来点击详情按钮,再点击复制这段安装命令。接下来我们在安装了 open club 的 设备上输入安装命令,开始安装,然后我们就会遇到整个流程中最大的坑。 这里微信给到了一个二维码链接,切记这个链接不能直接打开,它只能通过微信扫一扫来打开。我们需要找一个二维码生成网站或者工具, 然后将链接贴入生成二维码,最后再用微信扫一扫打开。扫码成功后就完成了连接工作,并且微信会跳转到确认页面,点击连接后就可以和你的小龙虾交谈了,快来一起试试吧!

兄弟们, ai 总是记不住你的事,每次聊天都要从零开始。这个十八点六 k 新神器 openhuman 直接给你私人超级智能,它是你的个人 ai 超级智能,完全私有,本地优先,简单又极致强大!亮点一,一百一十八加第三方服务自动拉取,每二十分钟更新一次 gmail, notion go top slack 全打通。亮点二,本地记忆术搭配 obsidian 兼容知识永久保存,再也不忘。亮点三,内置网页搜索,爬虫代码工具,还有原声语音功能。 亮点四,智能 token 压缩成本和延迟最高降低百分之八十,还支持 olama 本地模型,再也不用担心 ai 记不住你了!想拥有真正私人超级智能的马上试试,记得点赞关注哦!

哈喽,朋友,晚上好。现在大部分的 ai agent 呀,都有一个很尴尬的问题,你每次打开它,都需要解释一遍,我是谁?我在做什么项目?这个仓库为什么这么写?我昨天跟谁聊过这个客户之间提过什么要求?所以很多人用 ai agent 的 真实体验,不是他替我干活,而是 我要先给他一份完整的入职培训手册。但最近有一个很火的开源项目叫做 openhuman, 他的思路是刚好反过来,不是每次你来教 ai 认识你,而是 ai 先把你的工作实践吸收进去, 包括 human。 官方给自己的定义是叫做个人的 ai 超级智能。这个说法有那么一丢丢的营销啊。但是它真正值得关注的地方不是超级智能四个字,而是它想解决 agent 的 冷启动问题。它的核心做法就是把你的邮箱、文档、聊天、日历、代码、仓库全都接进去。 官方的 readme 里写了一百一十八种第三方的集成方式,通过 os 来连接以后,每二十分钟自动抓取一次。 然后他不会简单粗暴地把所有东西都塞进 property, 而是把这些邮件、文档、聊天、日历、代码、仓库这些内容整理成一个叫做 memory tree 的 结构。 更有意思的是,他会把这些记忆写成 obsidian 兼容的 markdown, what? 也就是说, ai 的 记忆不是一个你看不见的黑盒销量库, 而是一堆你可以打开、浏览、编辑、删除了 markdown 文件。这个点我觉得就非常关键,因为这意味着未来的个人知识库可能不只是给人看的,而是给 agent 当第二大脑的。过去我们讲 ai agent 经常讲模型、能力、 工具调用、自动执行。但真正用起来以后,你会发现, agent 呢?最大的问题不一定是不会干活,而是不知道该怎么干。他不知道你的偏好,不知道你的项目背景,不知道哪些客户重要,不知道哪个文档是旧的,不知道哪个决策已经被废弃了。所以你越想让他做复杂的任务,就越需要先给他补全上下文。 欧盟赫曼抓住的是另外一个方向, a 政策的能力上限不止取决于模型能力有多强,也取决于他对你有多少了解。如果一个 ai 已经知道了你的日历、邮件代码、文档、会议机要、任务系统,那他给出了建议和执行动作,理论上就会更贴近于你的真实处境。 比如你问他帮我准备明天和某个客户的会议,普通的机器人可能就会给你一个通用的会议模板。那如果他真正读过你的邮件、日历、上次的会议机要和项目文档, 他就可以直接告诉你这个客户上次卡在了什么问题上,你是否答应过什么,还有哪些问题是没有关闭的,以及明天最需要做的事情是那几件。 这才是 agent 真正有用的地方。 openheme 最打动我的地方是,他把记忆曾落到了 obsidian 这种人能读懂的格式里面。这件事看起来很小,在他背后也有很大的分歧。 ai 的 记忆到底是属于平台还是属于用户? 如果记忆只存在于某个云服务里,但其实你只能看到它,很难去修正它。它记错了,你不会知道它。如果过度总结了,你也不会知道它把一个临时想法当成了长期的偏好, 你还是不知道。但如果这些记忆十八个档文件放在你的本地 word 里,那你至少可以打开看一看。你可以删掉错误的记忆,你可以改掉过期的信息,可以把重要的项目 单独整理出来。这让 ai 记忆从一个平台黑盒变成了一种可以被人类共同维护的知识资产。那对于我这种本来就用 open c d n 来写内容做知识管理的人来说,这个方向就会特别自然。以前 open c d n 是 我的第二大脑, 那以后可能就是我 agent 的 第二代了。未来我们选择 ai agent, 可能不止看谁回答的更快,谁的模型能力更强。可能更需要看的是另外三件事,第一,它的记忆是不是可见。第二,它的数据是不是可控。第三,它能不能被迁移、被删除,被你真正的拥有? 所以我对 openhuman 的 判断是,它现在未必是一个普通人应该马上就要重度依赖的成熟产品,但它代表的方向非常重要。 过去一年, ai agent 的 竞争重点是谁更会执行任务,但接下来,竞争可能会变成,谁更能拥有长期记忆,谁更能理解你的世界。从这个角度来看, open call 们真正有意思的地方,不是他接了一百一十八个工具,也不是他最近在开源社区热度很高,而是他提出了一个很清晰的问题, 如果 ai agent 迟早要成为我们的数字助手,那他的记忆应该放在哪里?是放在某个平台的黑盒里, 还是放在你自己能够打开的 obsidian what? 我 个人更倾向于后者,因为一个真正属于你的 ai, 首先应该拥有一份真正属于你的记忆,这也是同学如果喜欢我的视频,记得点赞双关注,我们下期再见!

ai 早报 google i o 今天开幕,主角叫 gemini intelligence, android 直接升级成智能系统。后面讲第二条, open human 开源 ai 助手刷屏接入一百多个应用。第三条, ai 创业年入八百亿, antropic 加 open ai 拿走百分之八十九。 google io 这次核心就是 gemini intelligence, 把 android 从操作系统变成智能系统。你手机以后能直接跨 app 干活,拍张购物清单,他帮你建好购物车,或者说一句帮我定动感单车前排,他直接操作。 第二个亮点, rambler, 对 手机随便说,它自动整理成规范文字,还支持中英文混说。第三个, create my widget, 自然语言描述桌面组建,它直接生成,以前是开发者的活,还有新硬件 google book, 今天 keynote 还有更多料值得蹲。关注 ai 早报,明天见。

ok 啊,兄弟们,现在这个 ai 生成好了,我们看看它生成的什么?嗯,这是写的对标题啊。写的对标题,这可以算是一个文章吗? 有点没太明白它这个逻辑啊。好,我们再打一个继续看看它还能继续干什么。哦,很快啊,它现在开始疯狂思考了,它还在一个一个思考,它还在继续的往下迭代啊,这些都是跟 ai 有 关的话题, 他应该是,呃,再继续上一个主题,再继续生成啊,就是说这个我给他的任务是让他生成一百种 ai 的 用法, 他在继续跟我头脑风暴其他种感觉。目前他这个头脑风暴的内容啊,也没啥问题,只不过呢我是想让他生成这个公众号文章,一篇篇文章给他生成的,他这个生成太简略了,他就是头脑风暴的一个观点。好,我们来看下面这几个。首先这个呢是一个后, 这个后面啊,这个是胸麦叶,胸麦叶它就有一个可以语音对话的这样一个窗口啊,可以看到这个它的吉祥物。这个呢是我们刚才的聊天框 connections 啊,这个是一个连接啊,它可以连接到这些这些三方应用上面啊,它有一个充足的这个三方应用的支持。嗯 嗯,这个呢? intelligence 啊,这是他的这个,呃记忆页面啊,就你跟他聊天之后他生成的一些,呃,一些一些这个 ai 生成的一些东西嘛?根据你的对话总结出来的 dreams 有 他做的梦,还有 ai 可以 做梦。嗯,这个呢是他的这个记忆啊,他的记忆。嗯, 这个是呢,他现在活动的一些任务。 rewards 是 一个奖励啊,你跟他聊天会有一些,会有一套成就系统啊,这个设计还是挺有意思的。一个成就系统解锁更多积分奖励, 这个就没啥了。这个就是设置,设置账号通知。哎,他可以选语言。嗯,我们给他给他选到中文啊,才发现他居然有中文版本的。 嗯?这个是啥呢啊?这个是一个主题颜色,换主题颜色账单开发者。开发者选择都有啥呢?来的选择啊?可以对这些。呃,可以去做配置。什么 v 户口啊?一定的 check 呀,包括一些本地的一些的 bug 呀,这样的东西。

这两天非常火的 openhuman, 别只看它写着一百一十八个数据源,真正值得学的是它的记忆系统 memory tree、 bucketseal、 obsidian wiki。 它是一个本地优先的个人 ai 助理,官方定位是私有,简单、强大,连接 gmail、 slack、 notion、 github 这些服务后,它会持续把新数据拉进记忆。普通 agent 的 记忆大多是平的,要么写进几个 m d 文件,要么丢进数据库,未来靠搜索找回来。 问题是过去的信息很难自动补进来,人也很难直接看,直接改。 open human 的 核心叫 memory tree, 不是 一个薄薄的项链库外壳,它把每天的邮件、聊天文档先转成 markdown, 再切块打分进入三棵树。 第一棵是原树,每个 gmail、 slack 频道文档来源都先保留自己的上下文。第二棵是主题树,同一个人项目话题在多个来源里出现,会被聚合起来。第三棵是全局树,每天形成一次总览,再继续压成周月年的记忆。 最有品位的是巴克次友,新内容,先进入 l 零缓冲区,攒到五万 token 左右,或者足够多条数据后,再风筒压缩,摘要升到上一层,上一层满了,继续压缩,形成一颗能逐层展开的记忆树。所以他不是全量搜索,而是先看高层摘要,再一路钻回原始证据。 一百一十八个数据源的意义也不是炫数量,真正关键是 autofatch, 每二十分钟从活跃连接里同步新数据,让记忆自己生长。另一个关键是 obsidian wiki, 他 把同一份记忆写成你本机上的 markdown 文件,你能打开阅读、修改、迁移。 这句话很重要,你看不见的记忆很难真正信任他。还有一个 subconscious loop 向后台心跳。他会定期读工作区和记忆发现任务风险机会,但涉及写操作仍然需要你确认。对国内用户来说,问题也很明显。目前原声数据源更偏海外工具, 微信、飞书、钉钉、本地 word 和 pdf 这些日常资料还需要额外处理,所以我更看重的是它的架构,而不是线程连接器。 我按这个思路做了一个 skill, 给他一个本地文件夹,他会扫描文档转 markdown, 再按记忆术方式生成 obsidian wiki。 这就是 open human 最值得学的地方,让 ai 的 记忆既能自动生长,又能被人看见和修正。

来不及怀念小龙虾和 hymes 了,接下来登场的是 openhuman, 全自动记忆管理,无需手动教学,一键连接一百一十八个办公核心工具,二十分钟无感抓取邮件、 日程、代码等数据,自动生成结构化记艺术彻底打破 ai 启动难题。 token juice 机制大幅降本,砍掉百分之八十 token 消耗, 可存实意偷看信息创新潜意识循环,无指令也能后台自主处理,代办还能化身虚拟形象。参会旁经济要点,精准贴合个人需求,吃透工作流,真正实现低成本、全自动同步专属信息,成为深度适配日常工作的贴身数字分身。

一项主打封闭语克制的微信突然宣布接入 openclaw, 这只龙虾用四个月席卷全球,大厂也跟着连夜抄作业,龙虾凭什么能控制你的电脑?为什么大厂必须要造自己的虾?摆虾大战谁最可能赢家?通吃?未来的 ai 又会变成什么样?听完这期视频啊,咱们提前卡位下一个 ai 职场时代。 江江,你是不是和我一样纳闷,龙虾为什么一夜爆火全球啊?在我来看,这不是运气,而是两大关键技术成熟的水到渠成。咱先三十秒快速理解一下这俩技术。首先是 red r a g, 它是在大模型输出答案之前,从外部的知识库拉最新最相关的信息塞进上下文, 这样模型可以不止依赖于训练的静态参数,还能输出给你时间更新的而且与你更相关的答案。接着就是 react, 也就是这波在 github 上被 open class 数量反超的经典框架。它是让大模型啊交替输出一步一步的推理步骤和调用外部工具的行动指令, 这样模型就形成了思考、调用工具观察结果再思考的循环闭环。所以有了 react 和 react, 龙虾就有了足够长的上下文和真实的动手能力,也就是能把本地的文件作为输入,还能够去用 cloud hub 机能库里面各种的 skill 这个技能库吧,它又有点像苹果的 s o r。 比如说我上传一个帮我从投资人角度去做前沿技术的行业研究报告这个标准流程, 然后你就能下载来用。龙虾为什么能远程操控你的电脑呢?是因为微信、飞书这类聊天软件会通过网关去接入龙虾,而龙虾的框架中自带 agent 的 能力和 c l i 文字命令。就像给 ai 装了一个黑客级的后门,可以直接去调用 shell 命令来去操控 app、 浏览器读写本地文件等等。 所以整个系统就相当于给大模型装了手脚和大脑。你在微信发句话,龙虾就开始干活了,包括什么?打开文件呀,改代码呀,发邮件啊,刷报表,全自动一条龙。那接下来问题就来了,既然有了 open call 这个龙虾界的开源 og, 为啥大厂还要做自己的龙虾呢?我跟你说,核心就为了抢入口和抢钱。龙虾是有自我净化能力的,你跟他日常聊天,他会通过强化学习来训练自己,他就会越来越懂你,形成一个强粘性的飞轮, 一旦用户养成习惯,就很难跑掉。所以大厂啊选择闭源包装自己的龙虾,再结合自家技术特色。比如说英伟达主打安全可控,阿里主打冰冰和电商,腾讯是个人和企业,微信 mini max 是 多模态生成,那 kimi 就 主打一个性价比。 更重要的是,各家龙虾背后默认的是接自己的大模型。当然啊,腾讯可能还不太给力,接的是 timi, 所以 这样的生态就形成了 token 消耗的费用就会留存在自己的体系里。所以大厂做的其实都叫思域龙虾。更关键的是啊,龙虾因为多部推理加工具调用加记忆读取,是非常消耗 token 的 典型工作流的消耗 token 量大概是普通大模型多轮对话的十五到一百五十五倍。 kimi 上线了 kimi koala 之后二十天收入达到一点二亿,直接超过了二零二五年全年。这也是为什么 open koala 一 出来就被 open ai 和 mata 争抢的根本原因,从聊天工具变成了七乘二十四数字员工。所以 并入 open ai 之后, open koala 调用的模型就默认改成了叉 g p t 五点四了。这又掀起了 token, 出海的有两家是中国模型 kimi 和 minimax, 谁能输出更强的魔性能力和性价比,谁就能在海外抢下更多的 toc 市场份额。这里多提醒一句啊,思域龙虾分成两个版本, timi 和 minis 是 纯云端版,英伟达腾讯支持本地和云端混合运行。 云端版呢,是上手更简单,七乘二十四运行,本地版呢,是文件都在本地处理,能更好的保护隐私,但需要一直开机才能运行。那奇怪的事又发生了,为什么已经做了思域龙虾 qcloud 的 腾讯,又宣布接入官方的 opencloud 呢?是因为 opencloud 太火了, skill 数量啊已经超过三万多个。 这个逻辑就类似于像国产 gpu 要适配英伟达的库大生态,你打不过它吧,就得先兼容,才能有留在牌桌的机会。所以腾讯就把微信变成了所有龙虾的统一遥控器, 最终要从 toko 云服务生态去变现。所以分析了这么多,百虾大战,我看好谁呢?当前啊,我先潜头腾讯一票。虽然模型还不太给力,但上下文最丰富,而且入口最强。 你想啊,微信十四亿月活,日均四十五亿条消息,写微信服务了一千四百万家客户,这个数据已经够分量了。现在是上下文在哪, ai 智能就会涌现在哪, 微信里沉淀了我们这么多的工作、生活文件、关系链,而且啊,再加上腾讯在出行、娱乐、支付、云服务等等全生态的积累,是我目前看到护城河最深的大厂 背后的模型不行也可以换嘛,对吧。每一次的技术换代,其实啊,都是财富的大转移。 pc 时代造就了微软,移动时代成就了苹果, ai 时代第一波真金白银正在龙虾上兑现。龙虾其实也彻底开启了 openai 在 二零二四年就总结的 agi 实现的五个阶段中的第三阶段,智能体 也快速挤压了 mate 刚刚花了二十多亿美元收购的 minus 这类上一代的独立 agent 的 市场空间,留下了小渣一个人在风中凌乱。 ai 众神之战啊,彻底现在从正面刚模型变成了围绕 agent 的 生态加商业化的战争,也 对大模型底层的推理和注意力机制,以及在上一层的 agent 能力提出了更极限的技术要求。我们沿着现在的技术路径和成熟的速度来预判下一个巨大的拐点,大概率是多 agent 军团加数字主权操作系统。 想象一下,你发指令,十多个专业龙虾,包括财务虾、研发虾、营销虾等等,自动分工协同,相互叠代,所以一个人加上龙虾军团,就能完全跑通商业闭环。 对不想被老板 pua 的 朋友啊,你的福气终于来了。哎,别看我啊,我是牛马圣体老板,哈哈,再往远看啊,居深 a 阵和个人 a i o s 都将取代手机电脑成为你的数字生命操作系统。 而浙江指向一个略带荒诞的目的地,人类不再是地球的中心,而是要与有独立思想而且能自我叠代的数字生命共存。眼下,除了拥抱技术浪潮,我们别无选择。关于龙虾,你还有什么关心的问题,欢迎评论区和我讨论呀!