你加入新团队,克隆仓库,然后打开代码库,它就在那。一个二十万行的代码库,正像受惊了路一样盯着你。 于是你做了每个开发者都会做的事。你 grab, 我 们在文件间跳转,还可能让 cod 解释这个仓库。假如你拿到一张地图,一张能教你代码库的真正交互式地图呢? 流程架构,层级变更影响,这就是 understand anything。 几周内在 github 上就已经获得了超过一点四万个星标,很多开发者都在谈论它。接下来的一分钟里,我会展示它是如何工作的,以及它将如何极大地加快你理解代码库的速度。 understand anything 是 一个开源的云代码插件,它也能融入与 cursor、 co, pilot、 gemini, c l i 等工具的工作流中。 你只需将它指向某个仓库甚至知识库,它就能将该项目转化为可查询的交互式知识图谱。它通过静态分析、加多智能体 l l m 处理来实现这一点。但重要的是,技术占以外的部分。 关键部分在于它真正解决了问题,因为每位开发者都遇到过这个难题。你刚接触某种遗留代码库或遗留应用文档过时了, 那位无所不知的工程师六个月前就离职了,而你的人工智能、编码智能体却一遍又一遍的猜测。这正是该工具真正发挥作用的地方。那我们就运行它吧。如果你喜欢能提升工作流的编码工具,记得订阅。我们一直在发布新视频。 现在这是一个中等规模的项目,它大到足以让人抓狂,却又小到能让我真正向你展示这有多酷。 这只是我从 google microservices 克隆的一个仓库,规模很小,我们完全可以实际测试一下,无需假装什么。 首先,我要安装这个插件,就在这里。 cloud plug in install understand anything。 一 旦生成完成,我们需要重新加载插件。当然,然后只需运行 understand。 现在它将扫描整个仓库, 它提取结构,关系,关键模块以及可能的业务概念。现在我们可以运行 dashboard 的 命令来启动一切了。首先,这运行了很长时间,大概三十分钟,还烧掉了大量的 token。 所以 拥有一个不错的 cloud 计划是必须的。 我有 cloud max, 这消耗了我百分之二十五的额度,所以很烧钱,而且烧的飞快。但一旦完成,我们就能打开这个仪表盘,而这正是真正让人惊艳且直击痛点的地方。我可以缩小试图查看高层架构。我可以放大并访问内部组建。 我可以点击查看代码分解,以及所有代码是如何连接的。我甚至可以直接点击进去查看实际的代码本身。然后可以在这里搜索一些东西,比如支付。现在通常我会穿梭于各种路由,服务模型和处理程序之间,甚至去翻那些早已过时无用的文档。 在这里,这些工具将各个部分整合起来。现在我可以点击引导之旅,它会按顺序 walkthrough, 流程 入口点验证逻辑数据库,外部 api 以及空气处理系统。这已经很有用了。这次导览将一切拆解的清清楚楚,我们可以深入其中,访问各个组建,这就是区别所在。嘿,这是个超酷的图谱,我在触碰生产代码前会先看看这个, 但现在显而易见的问题是,我们难道不已经有这类工具了吗?作为开发者,我们真的不再需要更多漂亮的仪表盘了。我们需要减少浪费的时间,而这款工具瞄准的是软件领域最大的时间黑洞之一, 获取上下文,对吧?这一切都连接在哪里?它有何用处?人们正在大型项目遗留 java 单体应用、微服务仓库以及数百个文件的代码库中测试它,而反应大致就是我这里得到的那样。 这能帮我省下刚入职的前两周,因为他能把一切拆解清楚,串联起来,并展示他们是如何交织在一起的。这是第一个真正重要的用力,即入职培训。所以与其说读这十二页,然后四处问哪里看不懂,那本身就很让人困惑。我们现在可以说打开图谱,走一遍,倒览, 然后再提出更有质量的问题。现在第二个非常棒的用力是人工智能智能体。因为大多数人工智能编码工具的表现只取决于我们提供给他们的上下文。如果智能体看到三个文件,他就只会瞎猜。 如果他能拥有包含领域、流程、依赖关系以及实际说明的系统结构图,那么他在首次就做出正确更改的机会就会更大,当然,还有重构,对吧?在触碰代码之前,我们现在可以问这段代码依赖什么,他属于哪个流程?如果他移动了什么,可能会出问题。 这就是你如何避免让一行代码的改动变成一场重大事故的方法。这才是开发者对这个项目如此兴奋的真正原因,并非因为我们在乎图标。 我喜欢图表,对吧?它们很酷,它们既实用又直观,但我们讨厌迷失方向。现在,这正是我们需要小心的地方,因为开发者之前见过代码可识画工具、 id 图标、原码图、风格导航、 nx 图标树形设置器、可识画工具以及大量其他工具都面临完全相同的问题。 它们做什么?它们展示结构,却不解释实际含义。它们告诉你这个文件导入了那个文件 很棒,但为什么呢?这属于哪个流程?请求从哪里开始?如果我改了这个,什么会出问题?这就是缺失的那一层。 understand anything 正试图补上这一层。它不只是以 type script 的 文件或其他方式展示,而是尝试将其转化为更接近实际工作流程的形式, 这才是重点所在。从文件到含义,从导入到系统行为,从这里是碎片,到这里看机器如何运转。相比许多大圆模型或 r a g 代码工具,它也更直观,更具可教学性。很多人工智能代码工具本质上只是个搜索框,你问一个问题就能得到一个答案。 这让我们全面拆解,帮助我们理解一切走向何处,哪些相互交织,如何连接,从而真正看清代码。 现在,让我们聊聊人们真正喜欢什么。这里显而易见的胜利在于入职流程。如果你加入一个庞大的代码库,这能给你一个良好的起点,还有架构层级,对吧?这些真的已经构建的很完善了,你可以从系统层面开始,然后深入模块和实现。细节 差影响是另一个重点。每位资深开发者都深知对自己尚未完全理解的代码库进行微小改动时的那种恐惧。对于 cloud code 的 用户来说,这个图也能成为更好的上下文。因此,与其向提示词中堆砌随机文件,不如赋予智能体结构化的架构知识。 它还免费采用 mit 许可,支持增量更新,并涉及用于跨多种开发环境工作。现在,从怀疑的角度来看,当一个项目如此迅速地爆火时,我们开始问一个问题,这真的有用吗?还是仅仅赢了 github 的 算法?这是个值得问的好问题。还有 l l m 依赖项, 这意味着令牌成本。这个令牌成本飙升,所以花了一些时间,它消耗了大量令牌。如果你打算用这个,务必先有个好计划。 你仍需要良好的判断力。这能给你提供一个概览,它并不能取代阅读代码,它只是帮你更好的理解一切走向何方。如果你喜欢这类编码工具和技巧,记得订阅 better stack 频道,我们下期视频再见。
粉丝4.2万获赞25.5万

ai 编程能完全免费在本地运行了, codex 和奥莱曼正式打通,开源模型直接接进来。之前想用 ai 写代码,要么掏钱买 api, 要么依赖云服务,每个月动辄几十上百美元,小团队和个人根本扛不住,现在所有成本归零。 olym 这个工具能让用户在自己的电脑里跑开源模型。 codex 是 open ai 的 ai 编程助手,能写代码、改代码、审核代码,两者一组合,本地就能用上 jam 四 qman、 三点六这些模型一分钱不用花,全靠自己的显卡和内存。 具体怎么用,三条路走通。第一,装好 codex 和欧拉玛,两个软件都免费。第二,选一个适合自己电脑的模型, gamer 四的四 b 参数版本就够用,去 camera ai 网站输入显卡型号和内存,网站会推荐能跑的模型。 第三,在命令行里敲一行命令,模型就下载到本地了,大概九点六 g 币,等几分钟就装好,然后启动 codex, 选择这个本地模型。所有 codex 的 功能全都能用,写代码、改页面、调逻辑, 这意味着以后写代码、建网站、调样式都不用靠云服务,自己电脑就能跑数据不出门,速度还快,相当于把 ai 编程的门槛从月费降到了零。打开 codex, 选本地模型开工。 有人用 jma 四四 b 模型生成一个 cs 落地页,复制代码到浏览器打开页面完整布局干净。一个四 b 参数的本地模型就完成了以前需要付费 a p i 才能做的事。

今天 get up 热榜杀疯了,六个 ai 项目同时爆了,而且方向非常一致, ai 工具开始接管工作流了。 第一个, android gc skills, 一个 cloud md 文件就能给 ai 编程助手写工作说明书,不用插件,不用复杂配置,你把规则写清楚, ai 就 知道怎么按你的方式写代码。一天涨了三千三百多,新开发者已经用脚投票了。 第二个, code graph, 它做的是代码知识图谱,说白了就是先把整个项目整理成一张地图, ai 不 用一行行,硬读代码也能快速理解项目结构, 本地运行互联网,还能省 token。 今天涨了两千四百新。第三个, understand anything, 这个更像代码酷导航仪,导入项目就能看到项目地图,哪里调用哪里,哪个模块负责什么,一眼能看懂。还支持 cloud code codex 等二十多个平台,累计已经两万一千新。第四个, presenter, 一句话生成专业 ppt, 可以 理解成伽玛的开源替代品质。重点是它还提供 a p i, 不 只是给人用,还能接近自动化工作流。第五个, nvidia 的 long live, 用 n v f p 四量化做实时长视频生成核心价值不是炫技,而是在压缩并行推理生成质量之间找平衡。最后, cloudy plugins official 连续两天霸榜,又涨了两千新。这说明大家要的不是单个回答,而是能直接嵌进工作流的能力。 你会发现,现在真正火的项目不是单点工具,而是在帮 ai 接管一整段工作流。关注我,继续带你看懂 ai 工具的新机会!

分享一个开源项目, understand anything m i t 协议可以免费商用。一句话说清楚它是干什么的,把任意代码库变成可交互的知识图谱, 装进 cloud code codex 这些 ai 编程工具里用。先说它解决什么问题?你有没有遇到过这种情况,接手一个项目,几十万行代码,不知道从哪里读起,只能靠 grip 和反复打开文件,花好几天才能建立基本认知。 understand anything 就是 解决这个问题的, 它用 ai 自动扫描整个项目,把每个文件函数类依赖关系提炼成一张知识图谱,让你可以点击搜索、搜放地看整个项目结构,而不是盲读代码。它不是独立运行的工具,它是使用在 cloud code 这类平台上的插件, 定位是代码理解层,介于 ai 帮你写代码和你自己读代码之间。为什么需要它?三个判断,第一痛点,真实存在, ai agent 接手大项目时, ftp 又慢。 第二核心,假设成立代码的结构关系比代码内容本身更有助于快速定向架构图确实比竹行阅读高效。第三,技术路线合理,它选择预计算图谱,而不是每次实时分析图谱可以提交进代码库团队共享,不用重复花钱。 记住一句话,它解决的是大代码库人类看不懂的问题,不是 ai 效率问题。底层怎么做的?三层架构,最下面是入口层,你输入的斜杠命令都在这里定义。中间是 ai 层九个 agent 的 prompt 模板,每个 agent 专注一件事。最下面是引擎层,这里才是真正的代码逻辑, 完全不依赖。 l l m 用 cmd 解析语法术支持四十多种语言,关键分工是, cmd 负责读懂代码结构快准 免费, l l m 负责理解代码意图慢花 token, 两件事分开做,互不越界,这是这个项目最聪明的设计。再说九个 agent 怎么协同,减五个是必须跑的,第一个,扫描文件建立清单。第二个是最好 token 的, 让 l l m 给每个文件写白话摘药,最多五批并行。 第三个,判断每个文件属于哪一层,第四个,按依赖顺序生成导览路径。第五个较验图谱完整性。后面还有三个可选的 agent, 用于业务域分析和 wiki 知识库分析。第九个不是执行 agent, 是 格式规范文档,保证所有 agent 输出格式统一, 执行顺序就是追 sit, 静态解析不花钱,然后五个 agent 依次跑,最后合并输出一个 jason。 文件安装只需要六步, 进入项目目录,启动 clockcode, 添加插件,再在斜杠 plug in install 重新加载,然后 understand 加上 language g a 参数,生成中文版本。最后 understand dashboard 打开可示画面板。就这六步,完全不需要自己写代码和提示词。 好,重点来了,我们实际跑了一遍克隆这个项目的开源源码,让他分析,结果是消耗了日额度的百分之八十八, 我们用的是五倍套餐 a p i 调用时长将近五十分钟, token 消耗合计约一千两百八十万。跑完之后,分析了三百八十二个文件,生成了六百五十五个节点,六百九十一条依赖边。还有十三步导览路径, 图谱教学零个问题。图谱建好之后,后续只需要增量更新改动的文件费用会大幅降低,不需要每次都重新跑。全量分析, ai 把整个项目自动分成了十个层,每个层是一类文件的集合。右上角标了 simple, 是 它评估的复杂度。右侧列出了文件类型、编程语言框架,节点类型分布。 ai 不 只是按文件分,连函数级别都识别了。复杂度分布,连接最多的节点节点平均连接数分析时间点进分析引擎核心这一层,它把这层的所有文件平铺出来,每个卡片就是一个文件, 上面有它是干什么的。中文摘药,还可以查看源码。以前接手项目要一个文件,一个文件,打开看它是干什么的,现在直接读摘药,一百三十七个文件扫一遍只需要几分钟。仪表盘 u i 你现在看到的这个网页本身,七十五个文件标了 complex 技能流水线,所有斜杠命令的定义, understand, understand chat, 这些都在这儿。 七十二个文件 agent 定义,九个 agent 的 prompt 文件标了 complex, 是 整个 ai 流水线的大脑主页 understand anything 点 com 官网 est 做的十七个文件测试, vist 和 python 写的测试用力。九个文件, c, i, c, d, get up, actions 自动化流程,六个文件构建与工具独立脚本,比如大型图谱性能生成器,一个文件配置 package 点 json, check and figure 这些配置文件。十七个文件 文档, readme 和各语言翻译四十二个文件。接下来我们跟着 ai 生成的十三步导览走一遍。第一步,它先从 r e, a, d, m, e 开始,你看它右边已经写好了。解说, 一个将 l l m 智能与静态分析相结合的工具,这是 ai 读完 readme 之后自己总结的。左边这些卡片是文档层的所有文件,你看下面 cluster c 那 一组。 这个项目的 readme 有 六七个语言版本, ai 把它们自动聚类在一起了,因为它们互相 related。 第二步, ai 带我们来看技能流水线层,也就是所有斜杠命令的定义在哪里。他自己写的解说是 understand。 技能是将代码库转化为图谱的编排器, 阅读它可以让你在深入各阶段实现代码之前先掌握高层流水线。这就是为什么导览第二部来这里,因为它是整个系统的总指挥。上面一排,你看到 e, m, o, m, d, n, d, m, d, z, i t w d, m d。 这是安德森命令的多语言输出指南,说明这个工具支持生成不同语言的图谱描述。 下一步,技能包入口克拉斯四十九那一组最关键。 c q 点 m, d 是 主命令定义,这些就是真正干活的程序,不是 ai, 是实实在在跑的代码。你看这些连线都标了 documents, 说明 skill d, m d。 引用了这些脚本文件,它们是主命令和具体执行之间的关系。每个方块是一个文件,连线是 import 关系, 箭头方向,告诉你谁依赖谁。重点说连线,你看这些线有多密,说明这些文件互相依赖很深。如果你要修改,顺着连线就能看出会影响哪些文件,改之前心里有数, 这就是它最核心的价值。改代码之前,先看影响范围。下一步,扫描并对项目分批它便利仓库检测语言解析 input, 并将文件切分为可管理的批次。下一步,分析每个文件批次,对每个批次先进行结构化提取,再做语义化。 l l m 分 析, 铲除图谱的节点和边。下一步,核心引擎及其词汇表。第七步,用 cmd 解析源码。第八步, l l m 分 析与斯蒂玛较验第九步,规范化并合并进图谱。第十部,分层与引导式导览第十一步,直角化与搜索图谱变得可交互,最终持续集成。 最后和同类工具比一比。 understand anything 的 核心价值是让人类看懂项目。 code graph 是 让 ai 少走弯路,两者不冲突,可以配合用适合用它的场景接手新项目。写入职文档可去化省代码架构。希望本期视频对您有帮助,我们下期视频再见!

我们在 skywalker 上翻了五十个本地的 ai 开源项目啊,从里面挑了五个真正能跑起来用得上的,推荐给大家。这五个工具呢,覆盖了编程声图和语音啊,全都跑到本地,不联网,不划头啃。我是猪鹿人,我是丁真。 看完这期呢,你就会知道啊,跑 ai 这件事不一定很烧钱。第一个 open code 是 一个本地 ai 编人助手,做同龄制的项目啊,其实有不少,像是 a 字 computer 这些呢,我都试过,但他们呢,大部分要么都配置繁琐啊,要么就是和这个编辑系绑,太死了, 换个环境啊,就要重新折腾。而欧文扣子下的原因呢,也很简单啊,他跑到终端里哪都能通用,而且呢,还能通过欧拉玛基本地模型啊,不走云端不花头,肯你在终端里面打开它,用自然语言描述需求,像是帮我写个爬虫或者是解释下这段报错之类的,他就会调用你本地配好的模型呢,直接给你结果 它还支持多轮对话,能够读整个项目目录。这对于程序员来说呢,相当于是把一个 ai 助手啊,永久钉在了工作楼里面啊,完全不花钱啊。当然呢,它也支持云端模型啊,如果你有 a p i t 的 话呢,就能在两种模式垂直切换。那说到其一句啊,该 top 上还有个叫高智刷的项目啊,可以通过 overclock 的 调用,让多个不同角色的 ai 呢,像开会一样互相去讨论问题。那这个说实话还是相当实用的,那 感兴趣的话呢,可以去看一下。那这里呢,就先不展开了。第二个,这一麦曲本地生图。本地生图的工具其实不少, steamfacefaceui 外部 ui 很多人第一反应是这两个他们确实能用,但对新手来说,装环境配依赖,找模型门槛说实话不低,光跑通就能折腾半天。 这一麦曲留下来,是因为它是同一团队做的,对本地适配做的比较干净,部署流程清晰,文档也完整。而瑞德米一步走下来,装好依赖,下好模型权重本地外部界面就起来了。 输入提示时选参数点生成,和用在线生成服务的体验差不多,完全跑在自己机器上,不联网不收费,生成一张图零云端成本啊。当然呢,虽然说是不说偷坑了,软件不花钱了对吧,但本地算力这件事啊,还是得有一张好的显卡来帮你扛着嘛。就比如我现在用的这张码,就是一张机家的 r g x 五零八零魔音,它采用布莱菲尔架构啊,第五代 ten sir core 原声支持 f p c 精度啊,从底层呢,就是为 ai 推理设计的,推理速度呢,也是比上一代有非常大的提升。它有十六 g 的 g d r 显存,二百五十六比特的位宽,九百六十 g b, 没有了代宽啊,跑本地深途大圆模型呢,都不会成为瓶颈。那做工方面呢,也没有偷工减料啊, p c b 用料很扎实啊,电容电感这些核心部件呢,都是 ultra durbo 超耐久认证的规格, 长时间高富帅跑模型呢,也完全不虚啊。这块板子呢,都是全自动化产业生产的,焊点干净,做工规整啊,背面呢,还有一整块金属背板,直接固定在这个 i o 支架上啊,显卡装上去就很稳,挨就不容易弯,不容易垂下来散热呢,它用的是这个加了风之力系统啊, 尤其是它这个仿生风扇啊,我平时蛮在跑踏模型的时候呢,它也出奇的安静啊,再配上新一代导热垫呢,长时间跑模型温度也完全压得住啊。那还有一个呢,是我比较喜欢的一个设计啊,就是这个双百尔斯, 一个性能模式,一个静音模式,那拨开关呢,就能切换白天静音模式啊,安静携带嘛,晚上要跑高富仔呢,再切过去啊,还是很方便的,而且呢技嘉还给了四年质保,这个在显卡里呢算是挺厚道的了,天天高强度跑呢,也是完全放心的,不过算力这块是有了,还有个地方其实也是很影响我们的模型的性能的,那就是模型的加载, 所以固态硬盘也非常重要。 s s t 这边呢,我用的是闪级的 s n 八幺零零啊, p c i e 五点零接口 and 四点零的缓存技术,顺利读取啊,高达一万四千 m b 每秒,写入呢也是高达一万四千 m b 每秒, 基本可以说是目前消费级 cd 里面最快的那一档了。跑本 dna 嘛,有个很现实的问题啊,就是这个模型文件是真的很大的,每次启动的时候呢,他都要把这个几十个 g 的 文件啊,从硬盘里面把这个权重读进显存里面。在我换上这块 s n 八幺零之后啊,加点大模型呢,基本在十几秒就能搞定,工作流的节奏啊,是完全 不一样。而且呢它耐久度啊,也高达四千八百 t w, 现在高强度跑 ai 的 话呢,也不用担心把硬盘给写坏了,最大的 gdp 容量呢,也可以让我把模型和游戏啊装在一起啊,硬盘空间焦虑啊,基本是消除了, 而且打游戏的时候呢,近速也明显快了一截啊,像是在 ai 和游戏之间来回切换的话呢,完全没有停带感了。而且沈妮最近呢,还赞助了第二届剑网三经济群英赛,还出了一个联名礼盒,感兴趣的朋友们呢,可以去剪辑里面看 下链接了。那第三个 ai 工具呢?是一个本地的 ai 声音克隆工具 lux t t s。 那 本地语音克隆这个方向啊,我们试过的项目其实不算少的。那大部分的项目呢,要么是克隆效果一般啊,要么就是按照流程复杂的劝退啊,要么就是呢是真正的离线啊,不需要连任何外部服务。 你给他一小段参考音频啊,他就能模仿出那个声音的音色语调,还有说话习惯。第四个,康复 ui 语音整合包,这个和 max t t s 解决的不是同一个问题, 所以我们把两个都留下来了。 max t t s 适合快速上手,但如果你想要更清晰的控制,比如把语音合成声音转换后处理,串成一条工作流,一键跑完,康复 ui 才是那个答案。大家可能更熟悉康复 ui 原来的生图, 但它的语音方向同样很强。这个整合包把语音相关的模型和节点都打包好了,开箱即用,不需要自己一个个配环境。 音阶版里有三个表现最好的模型,英特斯 tts 二设置 vc 和 open o 九,英特斯 tts 二合成效果自然,情绪和停顿节奏都到位,适合做配音和有声读物设置, vc 专门做声音转换,能把一段语音的音色换成另一个人的, 同时保留原来的语气和节奏,在视频创作里非常实用。 open o 九是全能型合成,克隆多语言都能覆盖单个,各有侧重,按需选择就好,也可以在节点、工作流里组合使用 五个。这样说实话,这是五十个里面最让我们意外的一个。大部分本地 app 端要么上手难,配置繁琐,要么只支持一两个模型,换 个需求就得换工具,这样不一样。其中的模型库有大量可下载的本地模型,例如拉玛、迦玛、千问密索等,在应用里就能搜索下载并使用。它还支持自定义助手携带码翻译改文案,每个助手配好专属的信用提词词,下次直接切换过去就能用。如果你有 a p i k, 设置里也能接入 openai、 cloud, 这些本地模型和云端模型同一个界面就能切换。它还内置了本地 api 服务器,一键启动,兼容 openai 接口格式,其他工具可以直接调用,而且不用花任何 talk。 如果你刚开始接触本地 ai, 不 确定值不值得投入键是个很好的起点,以后如果你看到有人说跑 ai 太贵了, 可以把这期视频甩给他。那么五个项目的分享呢,今天就到这边了,我们留下来这五个项目呢,不是说他们功能最多或者最出名啊,而是他们在本地这个条件上啊,是真正能够跑起来而且好用的,大家也可以点个收藏啊,这样以后闲用的时候呢,就可以找到我们的视频。 那么以上呢,就是本视频的所有内容了,喜欢的话呢,请不要关注一下了,你们的支持就是我今天最大的动力,那么我是焦宝茶,我是仙之梦成,我们下个视频再见了。再见。拜拜。

十小时 github 狂揽三万星, openai 押注七十万开发者在用的 ai 终端工具 work 一 夜之间开源了。他想做的本质上是把终端从一个黑矿命令行升级成 agent 时代的开发中书。过去开发者写代码要在终端 ida 文档 get 工具之间反复横跳,而现在, work 直接把这一切打包进一个终端里,内置了 ai 编程助手,也支持接入各种外部 agent, 还把整个交互逻辑都重够了。 i d e 级别的输入框 快捷导航,垂直标签页内置文件数和编辑器,甚至还能做交互式代码审查。简单说,它不是在优化 terminal, 而是在重新定义开发者如何和 ai 一 起工作。最关键的是,这次选择开源,直接打消了开发者最担心的安全和可控问题,而且底层还是 rust。

cloud code 终于迎来最强对手,这是目前最火的 deepsea 专属开源终端编程智能体。记住这个项目名字刚刚发布没多久,就在 github 拿下三十二 k 的 star, 被业内称为 deepsea 版 cloud code 项目基于 red two e 终端 ui 框架和异步引擎,专门针对 deepsea v 四的特性做了深度优化,而非简单的 api 套壳。核心采用多智能体调度架构,支持同时运行最多二十个子代理并行执行任务,大幅提升复杂项目的开发效率。 输入一句话,它自己读文件,改代码,跑命令,管, get 搜网页,还能同时调度二十个子弹里并行干活。三种安全模式任你选乱己读。探路 a 键必须确认直行优漏,全自动放手杆,每一步自动打快照,改坏了一键回滚 o s 及刹香隔离,绝对安全就非常好使。

用 ai 编程的朋友注意了,你每个月花在大模型 token 上的钱,至少有八成是白花的。是不是经常遇到用着用着 ai 突然变傻,要么上下文码了要重置绘画,月底一看 token 账单吓一跳。 今天给大家说的这款开源神器,就能直接帮你省下近九成的 token 开销,还能让 ai 的 回复更靠谱。看之前记得点赞关注,咱们马上开始! 咱们今天聊的工具叫 r t k, 它不是什么新的 ai 编程智能体,说白了就是给 ai 编程工具配套的终端降噪器,相当于给 ai 配了个专属信息秘书。它夹在 ai 和命令行中间, 终端输出的内容要进 ai 上下文之前,先把没用的废话、重复的报错、笼鱼格式都过滤压缩整理好再给 ai 看,完全不用修改。你用的大模型本身 还支持一百多种常用的开发命令,给你举个例子就懂了。没有二 t k 的 时候, ai 要查代码状态,直接调用命令返回的原始内容,可能要花两千个 token。 有 了二 t k 之后,同样的命令会先经过处理,把没用的内容滤掉,最后只给 ai 两百个 token 的 核心内容,一下子就省了九成的空间。 有开发者连续用了几周,累计跑了一万五千七百二十个命令, token 节省率直接达到了百分之八十八点九。 官方在中等规模项目里测试过三十分钟的 ai 编程绘画,原来要消耗十一万八千的 token, 用了 r t k 之后就降到了两万三千九,整体省了差不多百分之八十。 现在这个项目在 get up 上的星标已经有四万六千三,是最近 ai 开发圈最火的工具之一。说到这,你可能会问,不就是个省偷看的小工具吗?至于这么火吗?哎,这你可就想抢了,咱们先看看它的核心处理逻辑,你就懂它的价值了。 二 t k 的 降噪逻辑完全是照着 ai 的 信息接收习惯设计的,一共有四个核心步骤。第一是智能过滤,把注视空白行样板画的没用输出都删掉,就像你看文章自动跳过插在中间的广告一样。第二是分组聚合,把相似的文件、相似的错误按目录或者类型归到一起, 不用零散给 ai 看,就像你整理文件,会把同类型的资料放进同一个文件夹。第三是截断机制,只保留关键的上下文,没用的领域部分直接去掉。 第四是去重重复的日制行,折叠起来指标出现多少次就行。其实 ai 根本不需要看完整的流水账日制, 他只要知道有几个测试失败了,在哪一行,哪些文件改了这些核心信息就行。 r t k 做的事就是把原来给人看的流水账改成专门给 ai 用的结构化信息,效率自然就高了。 你觉得这种前置信息清洗的思路,会不会以后变成 ai 开发流程的标配?可以把你的想法打在评论区聊聊。更方便的是,这个工具几乎没有学习成本,不用你改原来的工作流,它有自动改写的功能,能在支持的 ai 工具里自动拦截命令,转换成带二 t k 处理的版本, 你和 ai 平时怎么用,现在还怎么用?不过要注意哦,这个自动改写只针对命令行工具调用 ai 自带的一些内置工具不会被改写,安装起来也特别简单。 苹果电脑用户可以用常用的 homegu 工具直接安装其他系统,也可以用官方提供的安装脚本一键安装, 装完之后你还能直接查看版本号,以及已经帮你省了多少偷看。装完之后,只需要给你用的 ai 编程工具装个对应的适配插件就行。现在主流的各类编程 ai 都支持配置完重启一下你的 ai 工具就能直接用了。 其实二 d k 的 价值远不止是省钱这么简单,它其实是 ai 编程时代非常重要的上下轮优化层。你想啊,一个靠谱的 ai 编程系统, 怎么能把乱七八糟的输出都塞给模型,指望模型自己筛垃圾呢?真正工程化的做法就是在信息进模型之前,先做第一轮清洗,把没用的都去掉,只留最核心的信息给模型。 过去我们优化的是代码跑的速度,测试的耗时,现在 ai 进入开发流程了,我们还要优化 ai 看到的信息质量。上下轮窗口不是垃圾桶, toker 也不是大风刮来的,让 ai 少读废话,多抓重点,本质上就是在提升整个开发的效率,还能省成本,这价值可太大了。 平时经常用 ai 编程的朋友,可以先装个试试,看看自己的项目能省多少。 toker, 企业级的 ai 开发团队也可以把它纳入技术站,长期下来能省不少算力成本。大家也可以关注下这个项目的更新,后续还会支持更多自定义过滤规则, 适配更多场景。下一期咱们再聊聊还有哪些能帮程序员大幅提效的冷门开源 ai 工具?今天的内容就分享到这里了,如果你觉得有收获的话,记得点赞加关注哦!

你觉得 ai 编程跟你没关系?大错特错。想做个官网,写个自动工具,处理几百份数据,但一行代码都不会写。现在有一种东西叫 codex, open ai 出的开源工具。 说白了,你说人话,他帮你写代码,不用学编程,不用请程序员打字,说需求就行。登录系统 一句话,数据报表两句话。做官网做小程序,写自动化脚本,整理 excel, 全能搞定。电脑上装一个,开工就行。每周已经有四百万人在用。关键是开源不挑平台, api 接入就能跑。 你描述需求,他写代码,你审核结果,他继续改。就像有个不睡觉的程序员在帮你干活。先学会用这个的人,效率已经翻了好几倍,别人半天干的活,你十分钟搞定。想知道怎么通过 a p i 用上 codex 评论区交流?

录一个视频讲解一下。呃, codex 如何去接入 deepstack 的 api? 那 网上视频很多啊,然后去讲解,但我认为太麻烦了,就我自己也做了一个。 然后这个比较简单,就是打开我们的这个界面,然后这里就是对应的接口嘛,然后默认的,然后模型就是你用你要用的模型, 比如说你可以打开这个接口,文档有这个 flash p r o 之类的都可以啊,然后你自己去配,我这里是用了 flash, 然后 api 接口就是这里 啊, api 接口就是这里,在这个开放平台这里 api k, 然后你添加了一个 k, 然后添加 k 之后粘到这个界面,粘到这里 啊,然后其他的都不用管了,健康端口就是用默认的这个幺幺四三四就行,你也可以改啊,都可以。然后第一步是什么呢?第一步就是我们在这里,在这里去配置对应的这个模型和 api k, 然后接下来就是启动, 然后我这里已经点点完启动了哈,然后我就可以进入第二步,这里有三步嘛?第一步我们已经启动这个调节了,然后第二步就是打开片号设置,然后我们可以去写入这个文件,那我这里就点击写入文件, ok, 完事。 然后接下来第三步就是健康检查,其实也不用检查。第三步其实就是直接打开 codex 就 可以了, 然后你等那个 codex 现在已经变成了 local breeze 啊,然后问一下 hi, 然后它这边就会,因为因为我没有进入到项目文件啊,然后它就直接是在一个还没有项目文件的情况下,然后去发送, 然后我们看它的一个处理效果是怎么样的?然后你可以看到海尔那个后壳还没有得力啊,然后说明我们已经对接成功了啊?这就是很简单,然后如果你后边不需要的时候,也可以在这个片号设置里,然后去把它给恢复,也都可以啊。

antropic, the cloud design 火了,但它闭园收费,只能跑在云端。 open design 是 它的开园替代品。同样的事儿,本地跑免费支持十三个 ai 编程助手, 不捆绑任何模型,你用什么 ai 都行。 cloud codex gemini quan, 随便切换 十八万 star 的 热度, apache 二点零开源协议,完全免费。 open design 的 设计哲学很清晰,不造轮子,你笔记本上最强的 ai 编程助手就是最好的设计引擎。 它不会自己写代码,而是把你的 cloud code codex、 gemini、 c l i 这些工具接入一套专业的设计工作流。 技能是文件夹,不是插件,设计系统是 markdown, 不是 json。 扔一个目录进去,重启服务直接出现在技能选择器里,内置三十一个设计技能,覆盖你想到的几乎所有场景。想做落地页,有 v prototype, 想做手机 app 界面,有 mobile app, 想做社交媒体轮播图,有 social carousel, 想做杂志海报,有 magazine poster, 还有仪表盘、邮件模板、 ppt 演示、 okr 报表、财务报告, 每个技能都是完整的。 scale 飞起, m d 文件加模板加参考文档,开箱即用七十二套专业品牌设计系统,直接可用 linear、 stripe、 versal、 apple、 tesla、 notion、 figma、 air、 b amp。 b、 spotify 这些顶级产品的设计语言,全部按照统一的九段式 markdown 规范整理好了。 选一个设计系统,切换一个下拉框,下一帧渲染就自动用新的配色和字体, 不用写一行 css, 品牌一致性自动保证。最绝的是它的设计流程,输入一段话, ai 先弹出一个交互式问卷,锁定你的设计目标, 目标用户风格、调性、品牌背景,三十秒搞定。如果你没有品牌规范,它再给你五个精选视觉方向, 编辑风、极简风、科技工具风、粗野风、暖调风,每个方向都是确定性的。配色加字体组合, ai 不 用瞎猜,你一键选定,出图就精准。 不光做设计稿,它还能生成图片和视频。 gpt image 二生成海报、头像信息图。 settings 二点零,生成十五秒电影级短片。还有 hyperframes, 把 html 直接渲染成 mp。 四动效 九十三个现成提示词模板,点一下就能用。设计图片、视频同一个聊天界面全搞定。技术架构也很优雅。本地守护进程自动扫描你电脑上的 ai 编程工具,不需要手动配置, 前端是 next js, 十六可以部署到 versal, 数据全部存在本地 single light 项目,对话文件状态都持久化。 沙河画的 a f m 预览实时显示 ai 的 设计进度,还有 open ai 兼容的 b y ok 代理,任何模型都能接入, 上手极其简单。 get clone 下来, p n p m install 运行 p n p m two steve 浏览器打开就能用 第一次启动,自动检测你装了哪些 ai 工具,自动加载三十一个技能和七十二套设计系统哈。输入一段描述,看问卷,弹出,填完,选择设计方向, ai 开始工作。 几秒钟后,沙河玉兰里就能看到成品。支持导出 html pdf pptx 还能导入 cloud designed。 e p f e t x 还能导入 cloud design 的 e p i。 文件。继续编辑 a party 二点零协议完全免费,给个 star 支持一下。

今天分享三个 cloud code 必装的开源工具,能让 cloud code 替你二十四小时干活。装完之后人不在电脑前, ai 也能改,跑完还会主动喊你,并且能优雅切换不同的大模型。我每天都在用,今天用三分钟全部演示完。第一个工具是 cc connect, 它可以远程操控你的 cloud code, 当你在外面遛狗坐地铁的时候,也可以让 ai 继续干活。 这个开源工具的安装非常简单,直接把这个给他的地址甩给 cloud code, 让他自己装,一两分钟就搞定了。装完之后打开可以选一个平台连接,比如飞书,扫个二维码就自动连上了,非常简单。看你在飞书发一句话,电脑上的 cloud code 就 会替你干活,查资料、改代码、写文档都是 ok 的, 结果会直接发回到手机, 这样我出门在外的时候, ai 也会继续在家替我工作。第二个开源工具叫 cc notify, 我 之前自己写了一个 cloud code 的 hook, 可以 让 cloud code 跑完任务的时候自动告诉我我已干完,报告 boss 我 已完成。 这样我去干别的事情的时候,听到声音就知道他跑完了。 cc notify 就是 把这套思路做成了完整版。装的方法跟刚才一样,把 github 地址给 cloud code, 让他自己装,装完后他会自动接管 root 配置,需要确认时弹通知,跑完时弹通知还会告诉你这个任务跑了多久,我 现在还留着我之前的语音户客长,任务,跑完后,他会喊一声让我知道这个开源工具则告诉我具体哪个项目,跑完用了多久。两个方案我都会一起用,不过有个限制, c c notify 只支持 micro s windows, 需要用其他的开源工具。 我之后也打算开启一个新的开源项目,算是 c c notify 的 升级版了,包含语音的功能,并且支持多平台。第三个开源工具, c c switch。 当你想要给 cloud code 接入智普、 kimi think 这些国产模型的时候,以前需要去手动修改 cloud code 的 配置,对不会写代码的人是个不小的坎,而且要切换也很麻烦。 c c switch 是 一个跨平台的桌面 app, 它有图形化界面,不用敲命令,点开就能切换不同的模型。它最爽的点在于 cloud code 干活干到一半的时候,你可以在 c c switch 切换模型,下一轮对话立刻就是新的模型回应你了, 不用重启终端,也不用关闭对话。它还有个故障转移的功能,在夜里给 ai 派大货,一家供应商如果挂了,他会自动提到下一家,第二天起床后活就已经干完了。 这三个开源工具不适合的是还没有装过可 out 的 的人,我的主页有一条可 out 的 基建安装法的视频,可以先装好它再回来装这三个工具。我是雷克 build, 在 做一人公司,用 ai 把一个人变成一个团队,我们下期见。

零成本实现 ai 全自动视频剪辑,不用付费、不用会员!本期介绍五款超实用的开源 ai 视频剪辑工具,自动混剪、字幕配音,全能搞定 excel video! 这是阿里开源的 ai 全自动视频剪辑工具, 你只需要输入一个创作主题, ai 就 能自动搞定文案、脚本、画面素材、 ai 配音,最后一键合成视频成片。 不管是数字人口播小说、推文解说、知识科普,还是人文记实、历史讲解,它都能轻松拿捏,而且支持多平台比例适配,一次生成抖音、小红书视频号全都能用,目前在 tiktok 已经斩获十八点七 k star。 以前做一条短视频要切换好几个软件,耗时大半天,现在用它全程压缩到分终级,真正实现全流程自动化搭配奥莱姆加本地 com view i 部署,完全免费,零成本运行, 把原本需要文案、剪辑、配音、多人协助的复杂流程整合为一键自动化操作。 vmax vmax 由香港大学黄超教授团队开源, 在 get up 已经获得六点一 k star。 它整合了导演、编剧、制片人和视频生成器的功能,支持多种生成模式,就像是一个数字化的全能团队,从写剧本、调镜头、画面构图到精细剪辑,全流程为爱各司其职, 只需要输入一个想法,就能全自动完成制作,轻松产出优质爆款视频。当前主流纹身视频模型普遍难把控长视频画面连贯性, 而 six max 独创三层地归拆解逻辑,把完整故事分层细化,再结合 red 解锁增强搭建局内容库,确保角色、性格、情节、逻辑不跑偏,让普通人也能轻松驾驭长视频内容创作。 nice short video factory 过去制作一条产品带货视频,需要人工拷写脚本录制口播,不断剪辑,耗时费力。而这款名为 short video factory 的 ai 工具,它支持 ai 批量剪辑,并且完全开源免费。 不管是做产品营销视频还是内容短视频,现在只需一句话描述,并上传分镜素材,完成专业配音与字幕,直接一键导出成片,并且还支持批量剪辑。 nice 该工具兼容性强,支持 windows、 mac os、 linux 三种主流操作系统。该工具大幅简化了短视频制作流程,即使是新手也能实现日更一百条,特别适合产品营销和内容短视频的批量生产。 firedoper story line 这是一款基于大语言模型和多模态大模型构建的 ai 自动化视频创作智能体,目前在 tiktok 已经斩获二点七 k star。 他的核心理念极其简单粗暴,用自然语言对话代替传统的手动剪辑操作,你不再需要拖动时间轴,只需告诉 ai 你 的想法,他就能帮你完成从素材搜索、文案生成、试听匹配的 ai 自动剪辑的全流程,像全能制片一样,帮你高效完成视频创作。 惊喜的是,它还能通过对话式修改视频,只需通过自然语言下达指令,所有修改即时生效,让人人都能轻松实现零门槛智能出片。 copcloud 这个在 dikop 上免费开源的神器,能自动帮你完成视频剪辑, 就是这个由大湾区大学与北郊大联合开源的 copcloud, 它是一款面向长视频加音乐的端到端 ai 自动剪辑工具, 寄托为爱多智能体,支持音乐驱动,指令可控自动踩点,普通人也能一键剪出电影感短片,不用拉时间轴,不用竹篙挑选,零门槛上少。 并且该工具可自动将长素材拆分为镜头和场景元素,生成摄影手法、人物、环境等语义标签,实现毫秒级音画同步,不管是动感混剪还是情感慢境,都精准贴合节奏。 以上五款免费开源 ai 剪辑工具各有所长,既能满足日常短视频、快速触片、批量量产需求,也可攻克长视频、趣事连贯、氛围感剪辑等高阶创作需求。项目地址放评论区了,感兴趣的小伙伴快去试试吧! 欢迎一键三连支持一下哦! ai tikop 中文社区每日更新超多前沿 ai 开源项目资讯,以及免费共享 ai 开源项目知识库链接放评论区了,关注 ai tikop, 让您领跑 ai 时代!

这里有一款 python 版的 cloud 叫做 illusion code。 illusion code 针对 windows 做了专门优化,全量注入了 c c 提示词,采用与 opencloak 相同的 chrome 任务调度架构,并通过 c c switch 反带方案实现了灵活的代理路由。 illusion code 对 表格和代码块有出色的渲染能力,我们发一条消息看看效果。 通过斜杠 language 命令可以切换语言,对中文用户更友好。相比 c c 和 c c switch, illusion code 可以 直接热切换模型和提供商,无需重启终端。 出于个人习惯, illusion code 会在项目目录下自动生成 skills m c p rules patterns 目录,并自动扫描加载, 无需额外配置 j s o n。 与孙希不同也, lucian code 完整呈现模型的思考过程,对 deepseek、 kimi 等国内模型支持出色透明呈现,每一步推理,让 ai 不 再是黑盒。

嗨,大家好,今天给大家介绍一个嗯,软件编程工具啊, pdf 退, 然后这个项目呢?首先它是什么呢?它是一个在终端运行的一个编码代理,然后它可以读取你的文件,然后运行需要脚本,然后搜索网络,然后通过管理 get, 然后也可以协调子子代理。 然后它的特点就是它的底层模型是 deep sky v 四,然后它支持一百万 token 的 上线文窗口, 然后它的性价比就拉满了。然后它的主要特点就是,呃,我左边这些 就是 github 上面展示出来的,然后我们只要记住几个点就好了,就是它支持一百万托管上下文,然后前缀缓存,然后它可以做并行子 agent, 就是 多个子人物并行嘛, 然后他励志了两百多个工具,然后四十多个 skill, 然后他现在在嗯 github 上面得到了二十六点七 k 的 这么一个 seed, 增长速度也是很快的。 然后首先嗯他是什么?嗯,刚才就说啊,他是一个在中端上运行的一个 deep stack agent 的 客户端, 然后他可以回答问题,然后自主规划这个过程,就是说你可以提一个问题,然后他去把你的问题进行一个拆解, 然后拆解成此任务之后他自主的去做工具调用,然后执行完之后再做一个验证,验证不行,然后再嗯修改,修改之后再执行这么一个闭环,直到验证通过, 然后它呃理解,呃功能上就相当于 coser 和克拉蔻的一个平替啊,但模型更强,上下文更大,一句话驱动,然后自动干活,结果可验证,然后它的所有的数据都在你的本地上面, 然后他的一个工作流程就是你给一个任务,然后他自动的把你的任务拆解成一个子任务,就是小的任务, 然后再去读文件执行改代码,跑效 就相当于从任务到执行的这么一个过程,然后最后跑完之后,它会去做一个验证,如果验证不通过,它就会再修改,修改之后再执行,直到验证通过为止,它是一个闭环的流程, 然后此 agent 并行调度,就是一个 agent 它不够,那么它就会开多个 agent 一 起 去执行任务,就相当于你的一个任务,比如说我又需要读,又需要写,又需要去查网站,那么你一个串行的速度肯定是不够的,那么它就会开多个子任务去一起 去操作,然后它每个子 a 检测之间是相互通信的, 然后它的特点就是最主要的特点就是它现在支持一百万 token 上下文, 然后这个一百万托盘就相当于七十五万个英文单词,嗯,他说等效于一次加载一个完整的例子,内核原码其实也很大了,相当于一个中型项目的全部代码加全部的历史对话, 就相当于你现在如果有一个项目你有问题,你可以完全把这个项目直接喂给。呃,这个这个这个工具他会去帮你解析这个代码,然后你有问题,他会通过他的解析去给出一些规划帮你解决问题, 然后它这里前缀缓存,呃,就说重复的上下文会帮你节约百分之九十的托肯消耗,这个也是它一个性价比比较高的一个地方, 然后下一个就是它的一个思考过程是可以看得见的,就是说你的问题从问开始 他如何推理,就像那我们用 deepsea 的 深度思考一样,他是怎么思考的,他会给你展示出来。比如说我之前问了他一个问题,就说我桌面上有一个项目,看,帮我看一下有什么 bug, 然后他开始就在帮我, 不是在帮我,他在读这个文件,读完之后他会告诉我他读了这些文件,然后告诉我有哪些 bug 需要修复, 然后这个时候他不会去动,他会去嗯嗯,咨询你的建阳,问你这些 bug 到底优先级如何?到底要不要修复?最终还最终的开关还是在。嗯,用户自己手里, 后面是他内置了两百多个工具,覆盖完整的开发流程,这就相当于我们之前做开发就是,呃,约定大于配置, 就相当于说你在开发过程中经常会用到的一些脚本啊,工具啊,命令啊,他都给你内置上了,就是他的整个开发流程需要用到的。嗯,大部分他都有, 不需要自己再单独下载。然后它的 skill 技能系统,它内置了大概四十多个技能,然后它的每个 skill 都是一个 micro 文文件,我们可以看一下它的这个 micro 文件是怎样的, 就相当于这里的 review, 呃,它内置的什么允许的工具,然后标记, 然后这个我们就不看了,这大概也是 ai 生成的,就是它会。嗯,呃,通过一个 markdown 去维护你的技能文件,你要新引入技能,也可以用它的模式,用它的格式来。 然后后面一个就是我们为什么要选择 deep 退啊?我们可以和它这些主流的这些工具做下对比啊。 首先 vivo cart 我 觉得这个就不用看了,主主要还是 coser 和 color code, 它就是终端原声嘛,就是不绑定编辑器,然后上下文更大, color code 呢?嗯,对比就是这个威斯的模型更强,然后上下文还是特点,上下文放大了一倍,成本更低,性价比很高。 然后这里就是一百万托管,大概花费在嗯,零点一四元,其实已经很低了。 然后为时,嗯,自己写脚本,这个就不用看了,肯定比自己写脚本要强很多。 然后核心的差异就是 deepseek, 它不,它是 agent, 但它不仅不是 chatbot, 它不回答问题,它帮你完成任务。嗯, 这个大部分工具现在其实也是这么一个原原则。然后最后就是一句话,记住, deepseek 它支持一百万拓痕上下纹,然后它重复的上下纹,几乎基本上是呃零成本,因为它支持前缀缓存, 然后它的思考更加透明,它内置了两百多个工具,然后内置了四十多个 skill, 而且 skill 可扩展。然后一句话就是自动干活,结果可验证。 然后我们再大概来看一下实际的这个过程吧, 这就是呃,我们是呃电脑上看到的效果, 你启动之后它会有个桌面,然后这边百分之八十的空间是用来展示它的思考过程和一个输出。然后这边是一个 plan, 有 计划要做什么,这个是正在做的事,这个是个任务嗯的展示的地方, 然后这个下面是一个交互的框,就是你可以在这里和他交互,嗯,给他下发任务,这样,比如说我们之前给他下发一些任务,我们可以看到他这个过程其实都是打印出来的。 好,今天的分享就到这吧,这个工具大概就是这么个过程,如果大家对我的视频感兴趣,请关注我,然后如果大家对什么新技术感兴趣,也可以在评论区告诉我。

今天我选的 ai 开源项目是 openhuman, 它不是又一个聊天框,而是想把你的邮箱日程、 slack、 github 和浏览器接近。一个本地优先的个人 ai 助手。 项目现在七千一百多星,核心用 rust 和 textscript 的 写,最新版本是 v 零点五十三点四三,昨天刚发版,今天还在持续推送。它最强的卖点是 memory tree, 连接进来的数据会被压缩成 markdown, 存进本机 sq lite, 并同步到 obsidian 风格的知识库。 还有一百一十八个以上集成, gmail, notion、 github、 slack、 stripe、 calendar、 drive, linear、 gera, 靠 os 一 键接入后台,每二十分钟自动抓新上下文。 openhuman 还内置网页搜索、爬取文件系统、 git 测试语音和模型路由,甚至支持通过 alma 跑本地模型。他想做的是一个会记住你工作流的桌面 agent, 但我建议先当 early beta 看,他会接触很多个人数据。先在小号和非敏感账号里试,重点验证隐私边界、同步质量和记忆是否真的有用。

其因是主播在回学校的火车上无聊,突然刷到一个关于闭园 ai 和开园 ai 的 争论,于是主播就心生疑问,开园 ai 和闭园 ai 究竟有什么区别?开园 ai 在 现实中又能有什么作用呢?然后主播就去问了豆包, 接着他就以最通俗最直白的话解释,不绕弯子。然后主播就得出了这样的结论, 所谓的开源 ai 和闭源 ai, 简单说就是开源 ai 可以 下载到电脑本地文件中使用,不管是有没有网络都可以使用,而且聊天数据只会保留在电脑本地,不会上传到云端,隐私性直接拉满了。 而闭源 ai 就 不行,像 check g e g g m i 这样的,就只能在官方给出的 app 或者电脑软件网页中使用,可能也是为了保护国家人民信息安全,所以国内是不允许直接使用这类 ai 的。 但如果仅仅是为了信息安全,主播认为也没有多大意义去研究开源 ai 的 玩法,毕竟国家对于信息保护的法律还是很全面的。 不知道大家发现没有,刚刚说了,本地部署的 ai 需不需要网络运行数据不会象全到云端的,这说明什么?说明本地 ai 是 没有显赫的,你可以和他聊一些平息 ai 细节相成的内容, tender spicy meat hehe boy。 但这里主播也要奉劝大家不要聊得太过火,毕竟本地 ai 在 发出来的时候也是经过了训练的,聊得太极端,他说不定也会闹脾气拒绝生成,还是得节制使用的。 对了,大家得清楚,本地 ai 和云端 ai 的 寄箱是不在一个水平线的,除非你的电脑配置高得离谱,像 deep c v 四本的不朽的话大概要一零零一四零 gb 的 显存才能流畅异形,所以使用项是不推荐本地 ai 的, 娱乐项可以玩玩。 nice, 那 么就让我们开始部署本地 ai 吧。首先就是要下载一个叫欧拉玛的软件,抖音上有很多教程,或者直接问 ai 下载方法,这里主播就不过多赘述了,下载好后就是这样的, 那么这个软件是干什么的呢?按主播的理解来说,欧拉玛就是一个安卓系统, 而本地 ai 大 模型就是澎湃系统、橘子系统,想要下载和启动本地 ai 就 必须要配备这个软件,至于下载和启动都是在命令行窗口中实现的,友友们可以去问问 deepsea, 当然不是因为主播不记得了哈, 不是我的错。 接下来就是本地 ai 的 选择了,本地 ai 分 视图模型、聊天模型、记忆模型,每个模型都有自己擅长的领域,但也要根据自己的电脑配置进行选择。 主播的电脑是四千零六十的显卡,八 gb 的 显存,所以选择的是。以上就是 ai, 友友们可以暂停观看 这个 q v n 三杠 vr 挖鼻吸,不推荐的哈,运行起来虽然比较聪明,也可以运行,但很不流畅,反应比较慢,当然这个系和主播同配置的情况下。接下来展示本地 ai 的 运行效果, 在命令行窗口输入 o lama run, 你 已经下载好 ai 的 名字就可以运行了。当编程就表示可以以 ai 进行对话了。向这里主播和他说你好,你是什么模型,他就会输出思考过程和完整的回复,全程都是不需要网络连接的, 想要退出 ai 对 话也很简单,只需要在命令行窗口输入 by 就 可以退出了。 就当主播以为本次关于开源 ai 的 研究已经完成了的时候,无意中又刷到了一个视频,里面的内容是通过本地 ai 实现微信上的 ai 好 友,这顿时又让主播来了兴趣,然后主播就去问豆包这是怎么实现的, 结果豆包这笨蛋就只在那里瞎说,搞得主播走了很多弯路,气死我了,走到了最后一秒,快起,对得起我们吗?你,你最后还记得请出我们的 deep seek? 从 deepseek 那 里,主播很快得知,其实抖音视频中的微信机器人是利用了 github 里面一个很火的开源项目, wechat botws autos e, 只要将本地或云端的 ai 和这个机器人连接起来,就能实现视频中自动回复的 ai 好 友的效果。 然后在 deepseek 的 不断指导下,这个项目也成功下载到了电脑上。 接下来就是简单的配置步骤,直接向展示下载下来的文件夹里有一个 bat 文件,点一下就可以开始运行程序,但需要电脑里有 python。 三点九到三点一二版本的初次进入会提示设计密码,主播这里已经设计过了,直接输入就好, 然后在 chat 模型配置图片表情包里输入相关信息就好了。注意,本地模型是没有 apikey 的, 所以 apikey 的 填空就随便填就好了, 比如一二三四五六。还有别忘了在用户列表中设计你想要对话的用户的备注, 这边主播推荐第一次设计,可以每一步都截图给 deepsea, 这样可以保证不会配置错,也可以对小问题逐步排错。每天挖一个坑,最好就点一下右下角的保存配置,这样可以防止没有设计成功 运行时,点一下 start bot 就 可以成功运行了。提醒一下,这个项目可能在发出后就没有人员去经常维护,所以会有些小 bug。 话不多说,展示成果。 最后主播想说,开源 ai 的 玩法远远不止以下说的几种,还有很多有趣的功能等着友友们自行去探索。

兄弟们,看,人圈又出猛货了!这个叫 open hardware 项目,上线才四天, get up 上直接冲到到一万二的新标了,火速出圈。他专门对标 cloud code, 但人家走的是极简路线,纯 python 写的代码就一万多行, 体积直接瘦了四十多倍,核心功能却保留了九乘八,一点没缩水。最香的不是配置啊,是一条命令,启动 g o i, 界面直接给你整的明明白白的本地模型 g p t 各种大模型,想接哪个接哪个。四十三个工具,五十四条指令,读文件,搜索写作画图全能搞定。还有安全审批机制兜底放心用,轻量好扩展个人团队都合适。这玩意出来,真正的 ai 训练师才算有了趁手的家伙,效率直接起飞。
