粉丝21.6万获赞300.0万

智普啊,发布了 glm 五点零,为了测试它的能力啊,我用它构建了一套可以无限运行的 ai 开发系统。我用这个系统运行了长达十个小时,从晚上十点到早上八点, ai 做了几十次 getmate 的 提交, 开发了一个 ai 漫剧生成工具,有前后端有数据库,可以用户注册和登录,还接入了大圆模型,图片生成模型,视频生成模型。通过这个视频,你会学到如何构建这样一个无限运行的 ai 开发系统,并了解到 glm 五点零的惊人开发能力。 整个过程我都只是输入简短的 prompt, 没有亲自阅读或修改任何一行代码。我一直在旁边玩着游戏,等他干活, 尤其是我视频最后会讲的,他把整个项目的所有模块联合起来,然后端到端的 bug 修复错误,非常的牛逼。他不只是单纯的写代码,他甚至自行在浏览器中验证每个功能的正确性,找出 bug, 然后自行在浏览器后端数据库第三方的 api 之间联合调试,找出问题,修复错误。 那赶紧进入正题啊,相信对你会有所启发。我使用的工具是 cloud code, 并且把模型切换为 g l m 五点零,具体方法可以看我之前这一条 g l m 四点七的视频。 那我们首先要搭建一套能无限运行的 ai 开发系统,说是系统,其实就是几个文件,做法非常简单,我把一篇来自 astonopy 的 神级文章发给 ai, 让他自己去学习,根据这篇文章做出这套系统 文章叫长时间运行智能体的有效调度编排框架。那过程中 ai 做出了一些操作预期的举动,他通过 m c p 打开浏览器, 通过这篇文章的页面找到一个配套的 get up 仓库,打开仓库的代码文件进行学习。而我事先都不知道这个代码仓库的存在,最终他创建出了这一些文件。 我解释一下最重要的几个,帮你理解一下这套系统的工作方式。 task 点 jc 文件,其实就是一个任务列表,每个任务都有它的描述,并且会标记是否已经完成。和我们人类工程师每天上班一样, ai 每次从这里面领取一个任务, 完成后就做一个标记,这样他的 ai 同事啊,就知道项目进展到哪里。 progress 点 txt 文件,每次 ai 完成任务啊,或者任务失败后,都会在里面留下工作日期,这也是为了给其他 ai 同事提供一些信息。 log 点 m d 文件,这里面全是提示词,用来指导 ai 根据固定的规范流程工作。和我们人类工程师的开发流程类似, 第一步,跑一个脚本,来初识化整个项目的环境。第二步,在 task 里面领一个任务。第三步,就开始开发。第四步,测试和验证。 第五步,更新 progress 和 task 文件。第六步,用 git 提交代码。那如果中间遇到困难,需要人工介入,它就要及时向人求助。那在以前一些长期运行能力不强的模型中啊, 这么长的开发流程,一旦工作上几十分钟,模型就会逐渐混乱,不再按照规定的流程工作,而如今完全没问题啊。视频后面我们会看到, glm 五点零,即使在长达一个小时的工作,提交了几十个 commit 后,仍然很好地遵循开发规范。 然后呢,我让他写一个脚本,用来无限时间的运行。这一套开发流程背后的原理很简单,就是把 cloud code 放到一个 while 循环里面,这样一来,人不在电脑旁边的时候没法手动 prompt, ai 就 可以执行这个脚本,让 ai 无限的工作。它之所以有效,有几个原因啊, 第一,我们这套流程每次只要给 ai 说一句,完成下一个任务,不需要更具体的指示, ai 就 能通过 task 和 progress 文件知道自己现在应该做什么。 第二,每个 task 都很小, g l m 五点零足够的强大,每一次 y l 循环里面,他只是领取一个很小的任务,并且严格的测试,成功率极高。第三,每完成一个任务,模型的上下文都会被清空,所以模型始终保持在最聪明的状态。 第四, g l m 五点零非常可控,严格按照工作规范执行,每次小任务都会进行 commit, 所以 即使出错,我们可以轻易地回滚到旧版本。 好,现在我们这套系统有了,接下来就要开发软件,我们先来设计一下它的功能和架构。这个软件的用途是一句话,生成长视频。我让 ai 把整个项目的开发需求拆成了三十一个任务,放到 task 文件里。 这是 ai 设计的软件,架构不复杂,但五脏俱全。再看一下 ai 画的业务流程图啊,帮助大家理解我们要开发的这个软件具体的功能。 首先,用户会创建一个项目,然后用大圆模型生成每一个分镜的文字描述,然后再用图片模型生成每个分镜的图片,再用视频模型生成。视频开发的流程比较长啊, ai 做了几十次提交,我就选几个精彩的给大家讲。 在 ai 做到第十九个任务的时候,为了测试 glm 五点零的能力呢,我产生了一个大胆的想法,我让他一口气做了一个多小时,完成了十一个任务,干完一个又一个,中间我没有任何干预, 给大家倍速感受一下效果。他一直在写代码,并且每次都遵循我们的开发规范,每个任务都完成,测试一个,一个任务,单独提交代码,拿一个具体的任务作为案例啊。他现在领取了任务三十,任务目标呢是实现响应式的布局,也就是让 u i 在 手机端和桌面端看起来不一样。 他现在正在修改代码,然后验证项目能 build 通过。然后他现在把浏览器的大小变成了手机屏幕大小。打开了我们的应用,他点击了一个按钮, 他对页面做了一次截图,用识图的 m c p 判断是否正确。再打开了一个新的页面,再做了一次截图,并检查是否正确。然后在 progress 里面仔细描述了自己所完成的工作,然后把这个任务标记为完成,他就按这么一套方式疯狂的干完了每一个任务。 要接入数据库的时候呢,他主动提出需要人工帮助,并且一步一步地给我说明,告诉我如何去这个 superbase 平台啊,点哪里创建项目,配置数据库,获取 api key。 尽管我没怎么用过 superbase, 仍然轻松地操作下来了。中间我还犯了错误,给他提供了错误的 key, 也被他及时发现,最后他还让我帮他去注册一个测试账号,然后他自己打开浏览器,输入账号密码,验证登录功能,可以正常使用。那像 superbase 这种外部的系统啊,超出了 ai 的 控制范畴。 g o m 非常明确的给我提供指引,让我协助他完成开发工作,一个不了解后端的人,也能在他的指引下完成数据库的配置。 他开发完后端一系列 c r u d api 后呢,声称对每一个 api 都进行了测试,但所有的 api 都是需要 os 的, 前端也还只有一个空白的页面,所以我就很好奇他哪里来的 os 权限,怎么完成测试,是不是在忽悠我? 于是我问了他一下,他用简短的语言,漂亮的格式向我解释。他说他打开浏览器,登录了刚才创建的测试账号, 然后通过一个叫做 browser evaluate 命令,在浏览器可以执行任意的 javascript 代码。然后他写了一些临时的 js 代码,就在浏览器里运行,调用我们的后端 a p i, 这样就能有 office 了。非常聪明的做法,我还怕他在骗我,我检查了一下录像,确实如他所说,他打开浏览器疯狂测试, 中间还真测试出不少问题,他就自行查看后端的报错日期,自行修复。最终三十一个任务全开发完后,啊,我也懒得去人工验证这个项目是不是已经可以用了。在往常的开发中啊,到最终阶段,因为已经把 前端、后端、数据库、第三方 api 全部连起来了,那第一次的集成测试啊,就会非常头痛,因为任何地方都可能出错,往往需要浪费大量的时间再把错误找出来发给 ai, 让 ai 去修复。但这一次我非常大胆,我只说了一句话, 请你完整测试一遍流程,确保功能可用。大概就是从早上七点十分开始,他自己在浏览器上疯狂测试,花了一个小时提交了这么多改动,用来修复 bug。 我看他在浏览器上像人一样一步步操作我们的产品,通过截图和视觉能力来判断是否符合预期。遇到问题的时候呢,他就自己查询后端的报错,检查各种 api 的 状态,综合分析出问题。最终他总算顺利的生成出了第一个视频,端到端的把整个应用全部打通了。 他修复的每一个 bug, 做的每一个 feature, 其实我都不清楚是什么情况,但我想知道的话,我只要找到他的 commit 记录,看一下他在 progress 文件里写了什么。这也是这套流程的强大之处,一切都是可追踪的。 我们让 glm 五点零一边开发项目,一边在开发过程中发现问题,让 ai 来增强我们这一套自动化的开发系统,左脚踩右脚,螺旋升天,我相信这就是未来开发者的工作方式。总结来说, glm 五点零已经远远超出了单纯抠顶的范畴,而是能对软件工程的每一个环节进行自动化,提升效率。 gm 五点零在超长任务上非常出色,已经达到了能让我放心的交给他连续运行一个小时的程度。横向对比的话,我个人认为 gm 比刚发布的 oppo 四点六弱一点,但在一些方面可以超过 gbt 五点三。 重点是价格便宜非常多,但现在过于热门啊,供不应求,抠钉套餐非常难抢。那我们这个项目呢?虽然现在端到端全部打通了,但最终深层的视频效果还有很大优化空间。点赞到一万,我可以开源出来,让感兴趣的人进一步优化它。

我用了一千万拓展去验证最适合 open globe 小 龙虾的模型搭子来了,亨特阿尔法,它目前在 open road 上是一个免费的,是一个另一门公司测试的模型。呃,据传闻它可能是 deep deepsea v 四版本,或者说是智谱,或者说是小米的新一代模型。然后它的特点就是一万亿参数,然后上下文有一百万, 它是相当于,呃可以处理七十五万字的中文或者一百五十万的英文单词,在一个对话框内,那相当于就说它是我们之前推荐的 g 月星辰三点五,就 sleep sleep 三点五 flash 的 四倍,然后专门为了 opencloud 啊小龙虾这种 app 去做了优化,然后它目前也是在 opencloud 上是免费的。然后魔性 id 我 贴在了我们视频的评论区里面, 呃,我让他去呃做了一些安全的测试,就是我们之前上个视频提到的自防护,呃,就相当于模型 agent 的 自防护能力,然后可以看到就是亨特尔法是百分百通过的,然后 sleep 三点五 flash, 然后通过度只有百分之六十五,那相当于就是说这个模型能力上,亨特尔法是远远强于 sleep 三点五 flash 的。 呃, open road 上呢,就是,呃有很多免费的模型,目前是有二十八个,那在第一梯队的呢?相当于就是我们的亨特尔法,它是接近了 g p d 四或是 cloud 的 这种商用模型的能力。呃,后面还有很多其他的特殊的免费模型,比如说多模态啊,视频啊这种,我下一个视频会给大家介绍。 那比如说就是,呃,我们来看就是亨特阿尔法六大模型的横向对比,那从整个的呃就是编程能力来看,肯定是商用的 cologne 最强,然后推理能力和编程能力都是商用的 cologne 最强。然后 agent 的 控制调用呢?嗯,那就是亨特阿尔法这种免费的专门 agent 的 设计,最强,你可以看到远远超过。 嗯,包括那样,就是,呃那个亨特阿尔法的定位,它其实本质上呢,其实是专用呃 a 技能做设计,那它和最强的付费的 a 技能模型呢?那其实是是也各有胜负。对, 那我们看到我这边的 status 状态呢,其实是呃它的上下文,你看我新的窗口采用了百分之四,非常的充裕。 嗯,和那个呃 sleep 三点五 flash 的 对比呢,相当于可以看到 a 技能的能力,然后呃 超文档处理是远远超过的。然后中文能力呢,它其实是属于待验证。因为呃, steve 三点五阶跃星辰呢,他知道是中国公司模型,亨特尔法也知道是中国公司的,所以说中文能力呢,其实属于一个待验证的状态。 然后推理速度呢,因为它有 a t 的 参数,呃,相当于是呃那个参数更大,然后推理说会更慢。呃,但其实是呢,呃,我们其实是等待时间,没有强,很强要求的话,那其实还是这种 a 级的能力上还是远远超过的。 那我们现在可以看到,就是我这边用了那个接近一千万的脱贫去做了验证和测试。对,呃,九九点六百万。 那亨特尔法啊,他现在在那个小龙虾的登陆排行榜上是,呃排名第八。对,然后我之前推荐的 super 三六 flash, 现在是远远排名第一。那,那我觉得后续的话就是亨特尔法,呃,他不管是更,嗯,就是正式发布他名称之后还是怎么样,那我觉得还是一个很大的竞争空间的。对, 然后这是我之前跑了一个测试,用它去跑的一个呃哆啦 a 梦的图像,因为它是纯文本的模型呢,它只能靠文本里面简介和想象,这是用 svg 来绘制的,相比于它的上半部分,其实是已经绘制的非常接近了。 然后整体上的话呢,其实是在呃 log 里面,比如说,呃,或者说我们看到 a p i k 对, 它其实都是免费的,对,都是一直已经切到了那个呃,对,你可以看到我的小龙虾都已经切到了亨特尔反应在用,对。

朋友们,你敢相信吗?一个 openclock 的 安装居然需要五百块钱,而且即便如此还是排起了长队,这小龙虾现在到底是有多火啊, 不过今天来了一个直接掀桌的,它就是质朴昨天新鲜出炉的 autoclock。 这个 autoclock 的 本质呢,就是帮你把 openclock 的 一系列安装啊,配置的流程全部帮你封装好了,所以你只需要下载安装一下啊,就跟你在电脑上安装其他的软件一样,没有任何区别。 接下来我就想问,还有谁用不上 oppo 卡的吗?今天我们就来好好的看一下,这个智普的 autoplan 使用起来到底是有多么简单方便。首先安装就真的跟你在电脑上安装其他的软件一样,你只需要到这个官方的下载页面点一下下载按钮, 然后呢双击开始安装就好了。像我这边是 mac 的 话,我只需要把这个图标拖到这个文件夹里面, ok, 就 安装好了。好,打开这个 autoplan 啊,这边 有一个登录页面,我们用手机号登录一下,那进来以后呢,就可以看到这样的一个界面啊,这个就是你跟 opencloud 的 对话的界面,而且在这边它还自动的帮你对接好了。智普专门为 opencloud 定制的一个大模型,叫做 pony alpha two, 新用户登录是会赠送一些免费的积分的,所以你立刻就可以开始使用了,完全不需要你在乌漆嘛黑的密令行里面去配置什么模型啊,输入什么 key 啊等等之类的,甚至还不需要做任何的充值啊,免费直接上手。好,我们跟他打声招呼啊,你好, 可以看到它这边有回复。好,当然如果你想用别的模型的话,在这边也是可以配置的。在这个设置页面这里的 models and api, 这里可以配置你想要的任何模型啊,像国内的 deepsea, mini max, kimia 等等,这些都是支持的。然后如果你想要接入 open ai, 这些模型也是可以的,选择这里的 custom, 然后只要符合 open ai 或者是 entropin 协议的模型,你 都可以使用。这一点我觉得还是必须要给字谱点个赞的啊,虽然说这个 autoplay 是 字谱开发的,但是呢,他也没有强制你必须用字谱的模型,哈哈,好,接下来我们来演示一下让他来对接飞书,那方法是只需要点这里的按钮就好了。 ok, 我 们点一下,然后可以看到他自己在走一系列的接入飞书的流程。 大家看,我的手是没有动的啊,是他自己在做这一系列的操作,直到最后的审核环节啊,这个审核环节我们还是得自己来做, 审核完了以后呢,我们就可以立刻开始来使用了。好,我们给他发个消息,好,可以看到他正确的回复了,然后让他给我们创建一个飞速文档,可以看到他也顺利的完成了这个自动对接。飞速的功能,我觉得真的是太小白友好了。 而且更强大的是他这边还自带了一系列的 skills 啊,覆盖了内容创作、办公代码和营销金融等等高频场景。 在这里可以看到啊,将近有一百个 skills, 所有这些 skills 要么是可以直接使用,要么是你只需要点一下这里的添加按钮,就可以自动的帮你安装配置,好像这里的 obsidian skill, 你 添加好了以后呢,就可以用来搜索和管理你的 obsidian 笔记了,你根本不需要做自己去配置啊,安装啊等等这些麻烦的事情。 当然网上几乎所有的其他的 skill, 这个 autoscale 嘛,对吧?像这个公众号文章搜索的 skill, 我们直接扔给他,然后跟他说帮我安装一下这个 skill。 ok, 很 快它就安装好了,然后我们就可以用它来全网搜索公众号文章了。还有一个非常大的亮点是 openclaw, 它自带了一个改进版的 browser agent, 相对于 openclaw 自带的那个浏览器,它能够稳定地完成多步骤跨页面的浏览器执行操作,来实现长链路的自动化任务。 ok, 以上就是我对 openclaw, 它本质上就是 openclaw, 所以 你在网上看到的所有其他的 openclaw 的 玩法 在 autoclave 里面也都是可行的。只不过是说它把 openclaw 的 上手难度彻底降到了零啊,所以特别适合那些没有技术背景的朋友,或者是不想自己折腾各种麻烦的问题的。 所以如果你之前一直听说 openclaw 怎么怎么样,但是呢,自己搞不起来啊,非常推荐去试一下这个 autoclave。 好, 那我们这个视频就到这里,觉得有用可以点赞关注一下,我是川哥,我们下期见,拜拜!

我用 ai 从零搭建了全自动的炒股系统,实盘交易账号公开记录可查全网,你可能都找不到这么公开透明的 ai 炒股分享。几个月前,我就发布过关于 ai 炒股的视频,全网三百万播放, 无数人评论问怎么做。那时候对普通人来说, ai 炒股还是很难。现在不同了,用龙虾配合新的大模型,普通人也能搭建自己的自动交易系统,更重要的是,他能自我迭代,学习升级。 开始我让他管理十美金作为测试,携带后让他管理一百七十美金,然后逐步加码,第一天他就默默产生了一千美金的交易量。放心啊,没你想的那么复杂,全程都是使唤龙虾来完成。 我怕有人还觉得龙虾难用,专门选了一个门槛极低的龙虾。智普的 autoclave 什么配置啊,部署啊,完全不需要下载下来,开箱即用, ui 也比原版龙虾简单很多。打开 autoclave, 可以 配置任意模型。不只有智普的模型啊,它默认是使用智普新出的龙虾专用模型。 pony alpha 二, 我也是第一次用啊,也想评测一下他的水平,听说是能让龙虾的能力再上一个台阶。整个系统包含多个模块。首先核心的是一个交易 agent, 他 会写交易日记,会调用多个技能来完成全自动的交易, 还有两个技能,交易策略技能和交易执行技能。交易策略技能呢,会基于历史数据制定策略,回测、调餐,然后用找到的策略进行交易。交易执行技能呢,用来到券商或者交易所执行买卖操作。那做完买卖操作之后,交易 agent 会发送飞书消息通知我们, 每过一段时间, ai 可以 根据交易日记总结经验,叠带交易策略,形成一个交易叠带左脚踩右脚螺旋升天的闭环。 还是要声明啊,视频仅作为技术研究,不构成任何投资建议,不建议大家投资啊,我们的重点在于啊,如何通过龙虾搭建这一套 ai 全自动的交易系统,不会过度的深究交易策略,大家可以自行搭配任意互联网上能找到的策略。第一步, 首先 ai 要学会使用股票软件来执行买卖操作,我让他专门开发一个技能,为了方便演示,我选了和知名 ai 炒股大赛相同的合约。 那 a 股的话呢?大家可以自行查阅如何开通量化权限,也可以让龙虾通过操作浏览器来执行交易,非常简单。我把官方的 api 文档直接发给 ai, 它就持续向我汇报工作进度, 不是以前那种,它简单写个代码就完事了。它是一边写代码一边测试一边修复,非常的主动。这也是 autoclave 对 比以前那些 agent 的 一个显著区别啊。 十分钟后,他开发完了,并且测试了获取价格,获取 k 线各种功能。我还不放心啊,再试了一下,让他用新开发的这个 skill 获取 google 的 历史股价数据,并放到我的电脑桌面上看。啊,成功了, 但他还只是获取数据啊,没有执行买卖操作,因为他没有钱呐。我让他自己注册了一个账号,然后我往里面存了十三美元,接着他就主动测试了一下,买入黄金再卖出。 成功了啊,在平台上也能查到交易记录,我也是第一次使用这个交易平台啊,对他的 api 一 无所知。在这种情况下,我仅通过和 autoclole 对 话一个小时,就打通了全部的接口。 我的感受是 autoclole 和 pony alpha 二这个组合非常的主动,而且可控。以前我即使使用 cloud code 加 cloud 的 模型,也没有这么主动的去解决问题,往往要写超长的提示词来约束他。 不过呢, pony 二 f 二的强大也是有代价的,消耗的头肯也是真的贵,建议大家多配置一个便宜模型组合使用,现在我还要让它变得更科幻。嗯,在 auto close 上可以一键添加飞书,这个过程跟魔法一样, 点一下,然后就全自动控制浏览器帮我完成一连串无比复杂的配置操作。全是自动的, 配置完后,结合刚开发完的交易技能,就拥有了一个交易助力。无论走到哪里,我就让他查询一下黄金的价格,然后买十美元的黄金。他还给我点了一个表情,表示他看到了。你看啊,交易成功了,在平台上也能看到对应的仓位。 第二步,只会执行买卖还不够啊, ai 还要能够自己决策,找到买点卖点,这样才能全自动执行。我让他去研究一套交易策略,并且也做成一个技能。我没有限制他具体用什么策略啊,因为这个不是视频的重点,大家可以直接发一篇文章或者一本书给他,比如海龟交易法, 还可以让他去互联网上收集宏观的数据或者新闻信息,用来作为策略的一部分。总之想象空间很大, 你看他创建了策略,并且在历史数据上回测,用网格搜索找到最优的参数,回测显示胜率可以达到百分之七十一点四。我还发给他黄金白银、原油、标普指数等更多的标的,让他去研究,最终他列出一个表,清楚的展示每个标的用这个策略的回测结果。 那现在呢,我们已经开发好了两个技能,在 autoplout 的 这个界面啊,可以管理你的所有技能,默认就已经安装了常用的九十六个,覆盖内容创作、飞书、办公、代码开发等各种场景,可以把我们刚刚创建的技能也添加进去。 第三步,注意啊,现在要实现整个系统的核心,非常魔法的 agent 部分,但其实是很简单的,本质上只是一段提示词,完全依赖大模型的强大能力,就是告诉 ai 啊,如何运转这套自动交易系统,大家可以自行暂停阅读。第四步, 最后一步啊,我们创建一个定时任务,让龙虾每过三分钟执行一次交易流程,检查一下 k 线,这样就能实现全自动的运行了。 原版龙虾中啊,可以通过 u i 创建定时任务,但这个表普通人看的也是有点头疼,而 autoclave 呢,没有这个 u i, 只能通过和 ai 对 话,让 ai 帮我们创建。看啊,现在他已经给我发了一条飞书,消息,表示交易机器人已经启动。 不一会功夫啊,他又发来了开仓和止损的通知,给我亏了百分之四点六,幸好测试阶段我只给他了十四美元,然后几十分钟我就看他没反应了,是不是偷了钱跑路了。可以直接问 autoplay, 就 把他当做像人一样使唤,他告诉我一切正常运行,并且列出了每次运行的结果, 到这一步已经是凌晨了,然后我就去睡了一觉,一觉醒来,发现他给我发了很多飞书消息,总共已经亏了百分之九的钱,还只是一晚上啊。看了一下交易日记,有一些总结,比如今晚所有 rsi 大 于七十的交易全部止损, 最后还说一直在亏钱,暂停交易,直到收到明确指示,保护剩余资金。咋说呢,就很灵活,很像真人,亏了钱不能浪费啊。我就让 ai 根据昨晚的交易日记迭代升级一下策略。 一段时间后,他就给我发来一条飞书消息,说交易机器人已经升级到二点零。这个二点零啊,我发现他保守了很多,半天都不开单,给我急坏了,我问他怎么回事,他说这是好事啊,一点零的教训就是条件不满足,强行交易,导致八连亏。 二点零正在发挥作用,宁可空仓等待,也不乱开仓,太他喵的有活人感了。于是我放大胆子,给他存了更多的钱,现在他给我管一百七十二美金,相当于一千二软妹币, 期待他进一步迭代,大家也可以持续关注这个账户的交易情况,都是公开可查的。总结那最后我总结一下。首先,短时间高频次的交易,在黄金白银这种高度有效的散户几乎是不可能赚钱的。 这套全自动开发系统啊,用在更大时间级别的交易会更有效。在视频中啊,我使用一分钟,十分钟级别的 k 线,以及用一些高波动的标的,只是为了让他更多的触发交易,不然很难在视频里演示。所以一觉醒来八连亏。我也不是很意外啊,酒赌必输,多投资少投机。 然后评价一下 autoclole 本地部署的原版龙虾以及云端部署的龙虾,我都用过,对比之下呢, autoclole 毫无疑问门槛极低,非常适合普通人使用,它不会把一堆看不懂的菜单怼到你面前,是真正给普通人用的龙虾。那尽管它 ui 简洁,龙虾的所有底层功能都继承过来了, 没有阉割,当然同时也继承了龙虾的大部分缺点。那从另一面讲呢, ui 的 简化也让它缺少了很多原版 ui 上的复杂配置功能,比如手动创建定时任务啊,查看定时任务运行的历史,在 auto flow 里,全都要靠和 ai 对 话来使用这些功能, 就靠一张嘴来完成全部任务。对小白来说,这也确实是更友好的交互方式。再说 pony alpha 二这个模型,由于龙虾很少偷啃,平时我都是用国产模型来配合龙虾,但总让我觉得这龙虾怎么这么蠢,简单的事情都做不好, 经常要人去提醒他做这做那。而在我开发全自动炒股系统的过程中呢, pony alpha 给了我全新的使用龙虾的体验,没有出现那种弱智的问题,这是 cloud opus 四点五甚至四点六才有的体验。 而且我们的炒股系统不像传统量化系统,以代码为核心驱动,我们是以 agent 为核心来驱动的,极度依赖模型能力。而 pony alpha 二即使频繁的每三分钟执行一次,执行一整晚都没有出问题。 据说它是深度优化了龙虾的使用场景,所以才叫龙虾模型嘛,那质朴。这一次不但端出了强大的模型,还承接了龙虾巨大的流量,带来了更适合普通人使用的龙虾产品。

有些公司的消息写得云里雾里,对很多只想简单了解的朋友确实不太友好。软通动力这两天发的这个 ai factory 全站解决方案,光看名字就够绕的, 今天咱们就用大白话翻译一下它到底想干嘛。先说我理解的一个核心逻辑,这个 ai factory 本质上可以看作是 ai 界的 windows, 什么意思?他自己不造最底层的芯片,也不自己从头训练大模型,他做的是中间那层操作系统适配器、安装器, 目标是让企业不管用的是智普、百度、阿里还是开源模型,都能在一个统一的平台里点点鼠标,一路 next, 把 ai 装起来,跑起来。软通自己在公告里说的那套 ai 飞轮,数据到模型到智能体,到场景, 翻译成人话,就是把你企业里散落的数据整合好,借上各种大模型,生成几个能干活的小助手,投到业务里用起来,用的过程中产生新数据,再回来优化模型, 循环,跑起来,越跑越快。这个思路和另一类公司完全不一样。比如智普 ai 更像 ai 界的 ios, 芯片自己造,系统自己做,应用自己封装,要就用全套封闭,可控稳定,你很难在它的体系里插别的模型,就像 iphone 不 能随便装应用一样。这两种模式没有好坏之分,只是分工不同。 智普这种 ios 做高端大脑,软通这种 windows 做普及落地,两者不是对手,是上下游。那软通的 ai factory 到底能干成什么事?公告里列了几个例子,咱们挑两个看看。 一个是和金盘科技的合作,金盘是做电力设备的,软通帮他们做智能工厂升级一期,搞了个标书智能体 投,标书能自动处理,效率提升一大截,质检效率提升了三倍以上,人工复检成本降了百分之三十。复杂的工艺计算,从小十级压缩到秒级,现在已经进入二期,要搞合同智能审核数字、员工这些。另一个是在东南亚银行的项目, 软通帮当地一家头部银行翻新信贷审批系统,用 ai 做监测,可疑交易识别准确率提升了百分之四十。 用生成式 ai 工具改造老代码,开发效率比传统方式高了百分之两百。还有农牧业今年二月中标了温氏股份的饲料厂项目, 要用 ai 优化饲料交付流程,提高运输效率,降低成本。把这些事串起来,软通的定位就很清楚了,他不和你抢谁家大模型更强的风头,他做的是让这些模型能在具体行业里落地干活。智普、百度们负责造发动机, 软通负责把发动机装进不同型号的车里,调试好让司机能开。所以,这次 ai factory 的 发布,对软通来说是一个战略级的动作。他把公司过去分散的 ai 能力,算力层有淮来制算中心,平台层有天旋, mars, 应用层有各种智能体,整合成一个统一的操作系统,目标客户也很明确。那些想用 ai 但不知道怎么下手的企业,软通帮你把路铺好。当然,这种 windows 模式赚的是适配费、集成费、服务费 走量,薄利多销,靠生态做大。和智普那种 ios 模式赚高毛利、定制费、项目费是完全不同的商业路径,市场最终会验证哪条路更宽,但对我们来说,看懂这个区别,比被各种新名词绕晕要重要得多。


家人们,我觉得我发现了一个非常好用的功能,也就是智普青研上面的学习搭子,这个 agent 在 这里可以导入学习资料, 点进去了之后在本地上传,这里主要是可以上传像 pdf 或者是 e、 p、 u、 d 这些格式的资料,再解析创建项目,解析了之后它导出来是这个样子。就比如说我导入了一个呃 pdf 版本的宏观经济学,然后它会自动去分成这五个 part。 比如我们先点进去第一个 part 了之后, 首先左边的这一块是自动生成的知识图谱,中间这里有知识卡片,下面 ai 讲解就直接根据它的原文去做了一个对应,对应这个知识点的解释,如果点进去 ai 闪卡也可以自动生成 这个知识点对应的一些呃不同划分的一些漫画。右边呢,点进去可以直接看到你这个资料它原本的样子,就比如说我导进去的是 pdf, 然后这里就可以直接看到 pdf 的 原文。 我觉得就是这一块非常适合我们去学习一些从国外引入到国内的一些概念。因为有些时候因为翻译的原因, 或者是我们本身是新手,所以说有些时候看到一些概念的时候觉得比较难懂。遇到这种情况的时候,我一般来说都会直接把它扔给其他的 ai, 然后让其他的 ai 来给我解释这个问题。但是现在如果有了这个功能之后, 你就可以直接输上对应的哪一些知识点,它自动自己给你生成了相应的这些 ai 的 解释,就不需要在一段话一段话的去复制到另外一些平台上面再去理解,往下了之后 ai 讲解这里有一些这些板块, 也是比较便于帮助我们理解。尤其是我觉得他有一个比较好用的功能,是下面有个思考一下,他就会直接的去对应 他给你抛出来的一个问题,结合这个知识点,你可能就会去思考这个知识点会如何的运用到实践过程中,也可以帮助我们再去构建这个知识点相关的突触, 这样他就可以在短时间之内帮助你快速的理解这一个概念,并且能够长期的扎根在我们的大脑中。如果说你对这个知识点还不是特别的理解的话,这右下角还有个可以问问答子,可以提问相关的一些问题。 所以说我觉得尤其是对于我自己来说,这个功能非常适合经管类的学生,或者其他的一些人文社科的学生,因为像我们的一些概念,可能经常都是由国外引入的一些概念嘛, 我觉得这个方法这个功能就非常能够帮助我们的去帮助我们去理解,并且能够快速的攻克考试。

兄弟们,英伟达开放了智普四点七和 mini max 的 m 二 api 可以 免费使用,直接去英伟达注册就行,别说我没有提醒你们赶紧收藏。

好,然后这篇文章是最近很火的一篇文章,就是他号称第一次把一个果蝇的脑子上传上去了。啥意思?在一个物理仿真器里啊?这个穆穆周克,这是一个高级的物理仿真器,然后他直接把这些神经元和他连接,直接在这个仿真器里跑,跑起来以后的结果就是,哎,他发现这个果蝇可以自己跑起来 就直接跑啊,说白了就是你也没有去训练他,哎,这个果蝇就可以自己走来走去,然后溜达啊,对, 就好像是你把一个脑子全 snap 下来以后,在另一个地方瞬间重置了一下,哎,这个脑子就正常能像人一样活着思考这么一个东西,所以这事呢,他就把它吹了一个很大的一个牛,就是我们第一次发人造了一个 果蝇,而且这个果蝇是一个真正有身体的果蝇,他没有训练数据,他就能跑起来这样一个东西。所以这篇文章呢,确实还是比较有科学价值的,但是没有他吹的那么厉害啊。 比如有一个什么呢?就是即使是果蝇这种玩意,他其实在生存的过程中,他也有学习能力,他也能学到新东西,但是就这篇研究里是完全没有没有讲到说他 copy 了一个果蝇脑子,这个果蝇有身体的果蝇能不能自己通过跟环境的互动,能学到一些东西的这样一些,这过程他们下一步是要做个啥呢?是要做 小白鼠,小鼠的神经元差不多是七千万个神经元,而他现在是十几万个神经元,所以又是两个上级的提高,所以如果 它能把小鼠搞定,那我们可以想象一个有一个相对智能能力达人类可以看得上的智能能力的这么一个生物,而我们是真的能 copy 一个东西出来。对,所以大家可以看到这种研究和它所基于的像木质扣这样的一些 这个基础设施吧,其实一个非常庞大的一个学术的一个算法去要去构建,而不是说我单独有一个贼牛贼牛的一个 lab 就 能把这个事搞定。

三月十日,智普 ai 正式推出本地版鳌头科奥,中文名澳龙,一经发布便引爆 ai 圈,上线当天至普股价暴涨百分之十三,开发者接入量单日破十万,更被业内称为打破欧本科奥垄断、推动本地 ai 智能体普惠的关键一步。 不同于市面上简单封装的为本地产品,澳龙的核心突破的是技术底层的重构。它不仅解决了欧本科奥部暑难的行业痛点, 更以四大硬核技术创新,重新定义了本地 ai 智能体的落地标准,背后藏着国产 ai 从跟跑到领跑的技术逻辑。在 聊奥龙的技术突破前,我们必须先明确一个核心前提,当前 ai 智能体的爆发正遭遇云端依赖的致命瓶颈。欧本科二作为现象级开源智能体框架, 虽凭借强大的任务拆解工具调用能力圈粉无数,但它本质上仍未跳出云端算力绑定的事故。普通用户部暑需手动配置环境调试代码对接 api, 全程动辄数小时,报错率超百分之八十,被调侃为只有程序员能养的龙虾。 即便成功部署,也需依赖云端 api 调用,不仅存在数据隐私泄露风险,还受网络波动影响,无法满足低延迟、高安全的本地使用需求。 而智普沃托克勒奥龙的核心价值,就是通过全链路技术优化,打破了大模型性能、端侧资源易用性的不可能三角, 让本地 ai 智能体从工程师专属玩具,变成了全民可上手的生产力工具。这背后是智普在模型优化、部署架构、生态适配三大维度的深度突破,每一项都直击行业痛点,暗藏硬核技术逻辑。 本地 ai 智能体的核心痛点在于大模型的庞大体积与端侧设备有限的矛盾迁移参数及大模型的 f p 十六精度体积可达三百四十 gb, 即便是七 b 参数模型也有十四 gb, 远超普通电脑边缘设备的内存承载能力,直接部署会导致内存溢出、推理延迟飙升至普奥龙之所以能实现个人电脑和本地运行,关键在于一套定制化的模型轻量化优化方案,而非简单的参数裁剪。 首先,澳龙内置了智普专为欧本科二场景深度优化的 pony alpha 二专属模型,采用量化加减脂加蒸馏三位一体的优化策略,通过 ins 八混合精度量化,将模型体积压缩两倍,算力需求降低百分之五十。同时,通过量化感知训练,卡特 将性能损失控制在百分之三到五以内,远优于行业平均的百分之八到十。结合结构化减脂技术, 裁剪掉模型中贡献度低的荣誉参数,在保留核心能力的前提下,进一步压缩模型体积,让普通办公电脑也能轻松加载。再通过知识蒸馏技术,让小模型学习大模型的任务执行能力,实现轻量体积加满血性能的平衡。 更关键的是,这种优化并非阉割式适配,而是针对本地智能体的任务场景做了专项强化。 pos 二模型重点提升了工具调用准确率、长任务持续推进能力和多步骤指令拆解精度, 实测响应速度比通用大模型快百分之三十,长时间运行崩溃率大幅降低,完美适配本地场景下的连续任务执行需求,这种场景化优化比单纯追求参数压缩更具实际价值, 也体现了智普在大模型优化领域的深厚积累。都本卡的高门槛,本质上是部署架构的技术导向,而非用户导向,它需要用户具备扎实的代码基础, 手动配置环境变量,解决依赖冲突,对接各类 api, 这让百分之九十以上的普通用户望而却步。 智普澳龙的第二个核心技术突破,就是重构了部署架构,实现了零代码、零配置、一键安装, 彻底拉低了本地智能体的使用门槛。从技术层面来看,澳龙采用了封装式部署加自适应适配架构,智普将欧本科尔的核心内核依赖包 a p i 接口全部封装在安装包内,用户无需手动配置任何环境, 仅需下载对应系统的安装包,双击运行、扫码登录三步,一分钟即可完成全部部署,安装难度与普通桌面软件完全一致。这种封装并非简单的打包,而是通过自研的环境自适应技术, 让安装包能够自动识别用户的电脑系统、 windows、 mac os 硬件配置,动态调整运行参数,避免出现环境不兼容、依赖冲突等问题。这背后 是智普在 ai 部署工具链领域的长期技术沉淀,也是对技术普惠的精准落地。更值得注意的是,暴龙在降低部署门槛的同时, 完整保留了 open class 的 原生核心能力,并非功能阉割版,用户无需任何代码调试,就能直接调用智能体的任务拆解 工具,调用多步骤闭环执行能力,真正实现了易用性与性能不妥协的技术突破,这种架构设计彻底打破了本地智能体等于高门槛的固有认知, 为后续全明化落地砥定了基础。本期视频就先到这里,下期我将继续为您讲述澳龙的技术突破和技术意义。

最近一直说智普 g i m 五的坏话,其实这样子是不行啊,它在白天,现在白天了,白天的时候它是非常非常聪明的一样的提示词啊, 去 figma 上面把设计弄下来,就这个效果来说啊,就这个还原图,它做出来比 cloud 四点六 solid 还要好,真的还要好。 cloud 四点六做出来还有很多小瑕疵,还要一步一步的去修,但是用白天的 g i m 真的 是非常非常非常好,效果就是一步能到位了,一到晚上他就拉了, 具体几点我不知道,反正一到晚上我孩子睡了,然后继续想卷一下,他就不让我卷了, 真的是谢谢他。然后我就让 g m 五把菲克玛上面的资源也下下来,真心是不错的。这个性价比是挺高的,听说是托肯出海,晚上出海,白天在这里用。那既然大家都睡了,我又是 max 的 账号,最贵那个账号, 你不用把性能压的这么低吧,是否应该是为了我的健康着想?想我早点睡,我谢谢他,谢谢谢谢。

手把手教你安装,最近爆火的是普奥罗 autosu, 可以 快速部署本地 ai 手机、平板电脑都可以使用。话不多说,保子们低调领取。首先点击作品右下角这个图标,复制一次,接着返回桌面,打开这个蓝色小鸡,没有的话去商店抓一只 进去,等一两秒会弹出一个文件,如果没有弹出,直接搜索小好工具,找到这个工具软件包,再找到我们需要的,保存安装就可以了。

没有想到都跑手机的朋友们,恭喜你省了三千五,因为就在昨天的时候,支付把它的 autgrm 开圆了,它可以直接机关你的手机屏幕,替你思考点击输入场景,覆盖了五十多个高频的中文 app, 比如说微信、淘宝、抖音、美团这些核心的场景,它都是可以跑的。 我拿它做了两个小测试,有亮点,当然也有吐槽点。首先第一个点外卖,它是真的可以跑通,比如说你想在美团上去下单,然后到加购,下单路径是很顺畅,你会产生一种错觉, 好像手机里面住了一个非常懂你小助手一样。第二,他的一个跨平台笔架是很实用的,我可以让他对比淘宝和京东同款拖鞋,他能够自己搜,自己去对比,最终给出你的一个结论,这就不是什么聊天机器人了,这相当于一个端侧 a 阵的他真真正正的上桌了。更关键的是什么?他居然很克制, 比如说他碰到了支付或者验证码之类的敏感操作呢?它会自动停止让你接管,很聪明,不会约借。但有一点很值得吐槽,就是现在的形态对普通人是不够友好的,你要用电脑通过 a、 d、 b 去控制手机体验,实际上更像是你在电脑面前远程控制着你自己的手机,就很奇怪。大家如果想要试试,可以找我拿下开源地址 和它的一个部署教程。智普啊, autolm 开源,我想说的是,它的价值不是在完美的体验,而是说它释放了三个信号。第一, ai 手机的异件可能要被打下来了, 以后的 ai 体验不一定要靠很贵的硬件,说不定就是靠的一个开源框架加它的一个端侧的能。第二就是大厂的 for a 阵固城河开始变浅了,开发者和极客们可以直接拆改做出来自己的版 本。第三呢,无障碍和轻量自动化领域绝对是要爆了。对于一些操作是很方便的人群来说,语音加 ai 操作就等于手机自由。欢迎大家评论区留下你的想法。