open ai 抓紧时间完成融资,硅谷现在开始全面防守中国 ai 的 进攻呢?很多人都看到一个消息,就是 open ai 以七千三百亿元的这个估值啊,还获得了最新的一笔融资一千一百亿美元。那么大家很可能第一反应就是,哎呀,真牛啊,太牛了。但是我想说的是, 其实这里的真相呢,更像是硅谷的这个 ai 故事。开始呢,变得更加紧张了,开始要全面加强自己的防守啊,防守谁呢?就是防守中国的这个 ai。 那 为什么这么说呢?大家听听我的看法啊。就是昨天 这个 openai 宣布,他获得了一千一百亿美元的融资,其中三百亿元来自于英伟达,五百亿美元来自于亚马逊,而且他这个头衔的估值呢,直接是干到了七千三百亿美元,这相当于现在腾讯的市值啊。 但其实我们去看这次融资的这个细节方,还是挺有意思的啊,有几个看点,一个呢,就是亚马逊的五百亿资金是分两期到位的,第一期只到账一百五十亿元,剩下的三百五十亿元要么等到 ipo, 或者呢等到实现的这个 agi。 同时呢,这个 openai 必须要在之前采购亚马逊三百亿美元云服务的基础之上,再购买一千亿美元的云服务。 第二个是英伟达呢,三百亿元的美金啊,是分三期到账的,每期到账一百亿元,前提条件是每完成一个计瓦算力的基础设施的部署,然后到账一百亿。软银的三百亿元,是分三期到位,后面两期有两个条件,一个是 oppo 爱必须要转成盈利性的机构,第二个呢,它必须要提交这个 ipo 的 申请, 所以大家自己去品一下,就是这次融资这个背后这些条款。哎,它的背景和生意到底是什么? 那么也就是在这个同一个时间节点,多方的信息显示,来自中国的这个 deepsea 很 可能在一周之内来发布 v 四的模型, 那现在已经有一个内部的版本在这个推理的服务商开始做测试了,这个模型呢,有一百万 tok 的 上下文的窗口, 原生多模态,而且它的实际体验据说要比现在的网页版和这个 app 版本更加这个强大。而且这一次 deepsea 它合作的和 amd, 所以这个就很可能意味着说,一旦这个 deepsea 的 它这个 v 四版本发布啊,它的升级就不再是一个普通的升级了,而是效率的大跃进,而是本土技术突破上的一次巨大飞跃。所以很可能会给这个世界再来扔出一个王炸来。 那如果我们现在把这两件事情放在一起来看的话啊,放在一个维度上来看,那么 open n i 完成新一轮融资的这个时间节点,这个节奏本身就能说明很多问题啊。这一轮融资对外宣称规模达到了一千一百亿美元,但是实际到位的资金并不多。表面上看, 这是美国的 ai 产业依然还比较繁荣的这个象征,但实际上啊,各种条件来看的话,这更像是一次这种强跑, 更像是在这个 deepsea v 四版本发布之前。哎,要为这个硅谷的 ai 的 估值和宏大的故事锁住必要的主动权。为什么呢?因为如果说这个 deepsea v 四版本它先上线了啊,并且的确具有测试所传出的那种效率和成本的优势, 那么 open ai 再去讲它自己的那个推算力,就是未来的故事,难度就会大大的增加的。就大家注意,这不是我在这里心口开河啊,就是我们去回顾一下,就是去年 deepsea 发布 r 一 版本的时候,那美国的 ai 市场就已经经历了一次重大的冲击了, 直接冲击的整个硅谷,直接冲击的美股让伊伟达的股票下跌了百分之十七左右啊。那如果说这一次 deepsea 的 v 四版本再次扔出一个王炸,尤其是是在打通了本土这个芯片集群的技术路径的基础上扔出王炸,那我觉得这种冲击可能就是指数级的,核弹级的, 它不仅会影响所有正在融资的这个美国的 ai 公司,也会对美国的科技巨头的股价继续产生巨大的压力。所以 open ai 现在呢,抓住宝贵的时间窗口来抢跑,否则它的估值和融资的金额都会打折扣,所以英伟达和亚马逊也开始用融资来捆绑销售, 也是在做防守,应对这个 deepsea 可能再一次带来的冲击。其实不仅仅是这个 deepsea 的 v 四会带来潜在的冲击,现在这个中国的大模型对硅谷的冲击已经是全面开花了,就二零二零年的二月份, 在这个 open source 平台上,它的数据显示,本月的排行榜当中啊,前五名的大模型有四名都是来自于中国的,其中 mini max m 二点五版本以四点五万万亿 tok 的 钓用量位居第一。 kimi 二点五呢,以四点二万亿的这个 top 位居第二。那么在二月十六号到二十二号的这个周榜当中啊,中国模型的周掉用量达到了五点一六万亿,三周暴涨了百分之一百二十七。 最新的一周的情况依然如此,仍然是中国的大模型占据主导地位。而美国的大模型呢,周掉用量仅仅为二点七万亿, top 远远落后于中国。 可以说就是在这种编程,包括建立智能体的这种高消耗的应用场景当中,中国的大模型现在是凭借这个 tucker 的 调用成本,哎,这种高的性价比抑军突起, 正在成为全球开发者的首选。这背后是什么?背后其实是中国的开发成本,中国的工程效率以及中国电力成本优势在发挥直接的作用。那么这也就意味着, 中国的大模型现在用实际的这个市场投票的结果,证明了自己这个路线的重要性和先进性。所以 open ai 它现在之所以敢在这个 v 四版本出来之前尽快完成最新一轮的融资,它其实是想强调一下啊,就是我们的能力依然是存在的, ai 的 领跑权依然是在美国硅谷这边。 所以这也就是为什么我说乌克兰 ai 这次的融资啊,它更像是硅谷的这个故事,要开始加强防守的一个重要信号。那么这也就意味着就是中美之间的 ai 的 竞争啊, 已经进入了真正的全面对抗阶段了,美国当然还会继续走自己技术密集型的道路,哎,用巨额的资金去对算力,对数据中心,哎,对这个模型的规模继续追求能力的上限和技术的天花板, 但是中国呢,会选择用成本、电力和工程的效率这几个优势去不断的压缩单位的成本。就客观的来说,这两条路线,哎,中美这两条路线他不会说互相替代的啊,但是不可否认,这两条路线现在已经开始在全球范围之内 面对面的开始碰撞。而从中长期的这个角度来看,就市场最后一定会开始关注单位算你和 tucker 的 实际商业价值,对吧?要算投入产出比,那么在这一点上,中国的技术路线,产品路线一定会凭借成本的优势逐步开始铲屎这个市场。 这其实是让硅谷现在最担心最担心的一个挑战。所以总的来说,中美关于 ai 的 竞争,现在已经不是说比谁的模型大,谁的参数更好的问题了, 而是两种技术路线在应用场景当中的正面对决,路线没有对错,那么最重要的意义在哪呢?首先是中国为全世界打破了就是 ai 的 格局了,有可能被单一垄断,单一霸权的格局,而且中国是在用最短的这个时间周期要开始实现和美国的技术平权呢,两者之间的差距会越来越小的。 就我们承认我们现在一定是有短板的,我们也有挑战,对吧?那我们现在就是在等光刻机和先进制程的继续突破,一旦这个东西突破了啊,那我们就会实现这个世界上最完美的电算结合,那就不得了了, 有人说你天天在哪里都是喊赢麻了,没错啊,你们自己想一想啊,如果说有一天我们实现了电力算力自主芯片的一体化的时候, 全球绝大部分的 ai 基础设施,它都是会由中国来提供的,就中国一定会凭借自己的成本优势、电力优势,源源不断地向全世界出口算力租赁服务和 top 服务,到那个时候我们就会被迫上位啊,我们就会被迫移民啊,没有办法,实在不好意思啊,你不服也不行。
粉丝117.8万获赞1037.9万

opencloud 背后到底在干什么?为什么他这么消耗 token? 今天这期视频就为你揭晓这个答案。不过在此之前,我还是快速说一下我的部署方法,你 大概扫一眼就可以了,反正我看他马上也要过气了。 opencloud 和普通的 agent 没什么本质区别,可以部署在本地,比如说麦克电脑上也可以找台云服务器。最大的不同就是可以接入社交媒体,通过发消息触发 agent 的 执行的任务。 我的组合是腾讯云清亮服务器加 openroot, 大 模型加飞书。为什么不用同一家的产品呢?因为这样就没人怀疑我是广告了, 而且这三个也确实是我最常用的工具,希望甲方看到了主动打个钱过来哦。操作起来也非常容易,只需要先购买一台腾讯云清亮服务器,在应用管理里配置好大模型的 api key, 在 飞书开放平台里新建一个 机器人,小弟在事件有回调中,把长连接定位方式开启,回过头在通道配置里填好飞书机器人的 app id 和 c 块 key, 然后你就可以在飞书里发送消息,进而触发 opencloud 在 后台执行你的指令。 嘻嘻嘻,那我们就先看看这条消息。飞书发出去后, opencloud 服务器上就收到了这条消息,这里最重要的信息就是 role 这个字典,其中 user 就 表示我们说给大模型的话, assistant 就是 大模型,回复的话, tool result 就是 agent 的 调用工具的结果,也是说给大模型的话, 接下来重点看一下他们是如何沟通的。首先是 user, 也就是我提的问题,你有多少内存?然后是 assistant, 即大模型给的答复,他分了几个角度来回答,并且第三点分析出了我想问的是服务器上的系统内存, 然后注意下面有个托靠类型的回复,即告诉 agent 需要帮忙进行工具调用。先不要急着回复用户,格式呢,也很简单,就是方法名和参数。这个 excc 是 opencloud 内置的一个工具,用于执行 shell 命令,具体执行的命令呢,就是 free 杠 h 用于查看系统内存。 然后这一来又回的对话就收尾了。这里呢,也可以看到,这轮总共消耗了一万四千零三十二个输入头肯和二百九十四个输出头肯,并且由于是第一次也没有用到任何 catch。 然后我们可以切到 openroot 的 后台,看到这里的头肯数是对应的上的。这一轮沟通呢,我们就大概花了零点一美元, 不过还没完,此时 agent 执行了刚刚的命令后,再次给大魔行发送消息,即图 result 返回工具的结果,也就是 free 杠 h 的 输出。 然后大魔星收到这个结果后,决定不再继续调用其他工具了,就最终给用户一个结论,这就是我手机上收到的消息了。下面呢,也同样给出了这次对话的投屏消耗,而 openroot 上两轮对话的消耗就是这样的。 不过这有个问题,为啥我就问了个内存多大输入了投屏就上万了呢?因为 opencloud 有 一大堆系统提示词,新绘画的第一轮就会直接注入进去,我们在机器上可以直接找到这些文件,比如说这个 agent 点 md, 里面就有这么一大堆的指令, 翻译一下就是这样的,你可以认真阅读,感受一下。一个 agent 的 功能强大还是靠堆叠大量的提置词来完成的,甚至这里的读取文件和写入文件等操作也是直接用自然语言大白话注入进去的。 接下来我们再看一个稍微复杂一点的,把今日的 ai 新闻整理成 pdf 发给我,然后我们看看他后台是怎么完成这个任务的。这回我用的是 mini max。 二点一,因为可以展示思考过程,可以看到仍然是 user 角色起手问题就是我非书上发的那个问题。然后就是 assistant 和 to call, 一 来一回,一来一回, 即大模型一直在请求 agent 调用工具,一共进行了将近七十多次对话,我们可以看一下所有的 c 型子段,就基本知道发生了什么事了。 首先就是非常粗暴的 web 设置,直接搜索了今日新闻,然后就开始尝试转换为 pdf, 然后转换成 pdf 的 过程中,他发现现在我需要将这个 markdown 文件转换为 pdf, 我 可以使用。喷 费了九牛二虎之力也终于是弄好了,但飞书发送又产生了问题,没事我们就直接去服务器看一下吧, markdown 文件看起来还行。然后我们把这个 pdf 下载下来看 我们再尝试触发一下 open cloud。 另一个独有的功能就是配置定时任务,比如说帮我监控一个人的推特,有消息了立刻就告诉我。实际上在后台其实就是增加了个 crown 的 配置文件,每次呢就是把这里的提示词定时定点的发给 agent 而已,没什么魔法。 那我们再来看看它生成的状态文件,它是用于对比两次推文的变化,随便打开一个,哎,发现时间根本就没找对,那后面的工作也就不用检查了, 我们再看看他后台,日制吧,仍然是像个执着而倔强的实习生一样,死命的完成任务,不惜把整个系统全都弄乱了,也要完成这个任务, 又又是接口各种不通,返回值不符合预期,以及安装命令各种失败等等等等。其实我倒是更希望他在第一步思考的时候就主动告诉我,哎,其实有个更好的办法, 比如说使用 rss 点 app 这样的工具,但是要付费,是不是要付费的话,跟我商量一下,而不是说一有问题就一直不反馈,然后强行干下去。是不是你工作中也特别怕遇到这样的人? 现在的 a 阵呢?怎么形容呢?我举个比较夸张但又很形象的例子,你就懂了。比如说,你的老板有一天问你今天几号了,然后呢,你把他当成一个任务,呃,我要看今天几号,我得找出我的手机,然后看上面的时间,然后这时候发现手机没电了,于是你想,哦,手机没电了,我得找充电器去充电, 然后充电器又没找到,你这时候想,哦,我得去超市买一个充电器,所以你就决定去超市。然后这时候你又发现超市关门了,然后你分析了一下啊,发现可以去另外一个超市,于是你就打车去了另外一家超市, 然后下车的时候发现,哎,我手机没电,没法付款,我零钱又不够。然后你分析了一下,发现你得去银行取钱,然后呢,你就去银行,然后取完钱之后发现这个钱不够, 那怎么办呢?你又下不了车,这个时候,其实这个时候如果是早期的 a 阵的话,可能就陷入一个死循环了,那现在的 a 阵呢?可能稍微聪明一点就想,哦,那我把手机先抵押给司机吧,然后之后的事情再说。 然后这时候你成功下了车,去了那个超市,成功的把充电器买到了,哎,这个时候你发现手机没了,因为手机不是抵押给司机了吗? 然后你发现你得买一个手机,但是你银行钱又不够,然后这时候思考一下,哦,那我只能去贷款了,然后你就去银行贷款,最后呢就是你花了一整天的时间,然后把原来的手机也丢掉了,然后在银行欠了一堆贷款,然后买了个新手机,最终回复老板,哦,今天是二月六号, 然后这个时候老板又问你说,哎,我昨天发了一个文件,然后你帮我翻译一下,但是你的文件在旧手机上,你的手机又没有做这个消息的迁移。 然后这时候你又开始思考了,说,啊,我得找回我的旧手机,于是你就给那个司机打电话,那后面的故事我就不瞎编了,但是你肯定也发现了问题,就是虽然他的每一步思考都非常合理,都是遇到问题然后解决问题, 但是现实生活中如果真有人干这种事,那你多半觉得他是个疯子,而且这个人还要按照自己付出了多少努力而向你收费,那你还敢用这种人吗?

我试用了几天 openai 新推出的这个 codex 整体使用情况,我是,我觉得我是非常满意,然后用户体验非常好, 尤其是针对那些不喜欢迷你行工具,或者是不知道怎么用 ide 的 那些,给你们看一下这个界面哦, 他这个里都是以文件夹形式,一个项目就是一个文件夹,然后这个文件夹下面你可以跑多条任务,我为什么要出来用呢?你在一个窗口下面,你布置了任务, 你可能还会有些其他的问题,你和他进行了探讨,等你这个上下文过长以后啊,整个模型它的召回率就会比较低, 这就是我们说的那个上下文污染。现在按照这样的方式,他其实已经在引导你,告诉你说,呃,你的一条任务就在一个窗口里面跑,在一个对话窗口里面跑就行了, 然后你可以开多个对话窗口去一个分别执行。还有一块我觉得是比较有特色的,是 openai 做了一个,现在看上去我感觉就是一个给我的技能商店, 然后每一个 skill 你 就可以直接一键安装,安装完成了以后去聊天窗口你就直接可以用,刚刚装好了就在这里就能看到,这个实在是太方便了,然后你不想用了,或者是你觉得不好用,你就直接卸载掉, 这个我真心觉得怎么说,我觉得这应该才是一个软件真正该有的样子吧。然后它的编程我做了一个简单的小测试啊, 因为我看网上有很多人已经测试过了,然后都说速度很快,但我不知道为什么,我这里设置的,我就让他帮我创建一个 to do list 演示程序,然后这是一个很基础的软件了,很基础的一个小的需求了, 但是他应聘的时间你看 work worked for 七分十七秒,我对这个数据, 对这个时间我感觉挺震惊的,然后我就赶紧跑去拿 claus, 四点六跑了一下,一分十七秒就跑完了。那反正我觉得我对 codex 的, 我对它的模型的能力其实是认可的,因为原来我也是在 cursor 里面,经常在 cursor 里面去用 codex 五点三,这个用 codex 五点二,那时候没五点三的时候就用五点二去 改一些比较顽固的 bug, 所以 我对 openlight 的 模型能力从来不怀疑,只是说原来 curses 里面有我没用而已,就没有用官方的了。然后简单说一下这个软件的一些小配置, 这边有个开关建议把打开,因为他可能运行的时间比较长,你电脑可能会睡眠,导致程序运行中断,这个打开了他就能保持你电脑一直处于一个唤醒状态。然后这边是这样模式的话,呃,你可以 相当于你下指令以后,你可以补充你的指令,或者是嗯,他朝另一个方向去思考。这两天反正应该有。我没仔细看他的更新的频率,但我前两天用的有的 bug, 这两天就已经没有了。 我之前这里他会弹出选择框的时候,那个选择框选完了,但是那个选择框不消失, 反正我今天用了一天,我也没发现有这个问题,应该是已经修复了。总结一下,我觉得这次这个格式化界面真的给人耳目一新的感觉。我习惯了格式扣的,但是我用这个我还是觉得用的很爽, 用户体验非常好。格式扣的里面看时间长了我觉得也就切来切去,我切的也很头疼, 我还是强烈推荐大家去试用一下。无论你是做 webcoding 也好,还是说你做一些文案类的工作,我觉得这个软件都非常非常适合你。

不知道大家有没有想过这样一个问题,如果我们今天看到的一切,从 check gpt 的 爆发,到 ai 狂潮,再到数万亿美元砸出来的这场技术革命,从根本上就走错了方向,会怎么样? 朋友们在科技界为 check gpt、 sora 等大模型所掀起的浪潮欢呼雀跃时,一位始终站在人工智能研究金字塔顶端的先驱却冷静地拉响了警报。 他认为,这场看似不可阻挡的技术洪流,或许正将我们引向一条充满幻觉的死路,他就是强化学习的电机人。图领奖得主理查德萨顿。这不得不令人深思, 一个人工智能行业的电机人,为什么亲手为自己所在的领域敲响警钟?这背后到底发生了什么?是他老了跟不上时代?还是他看到了我们所有人都没察觉的惨痛教训?大家好,我是 ai 启示录。 今天我们来探讨一个更底层的问题,为什么 open ai 引以为傲的大模型会被强化学习、支付评价为死路一条?智能的本质究竟是什么?要解开这个问题,我们先来看看,如果走了理查德萨顿眼中的正确的道路,到底是怎样的呢? 最经典的立正莫过于 alpha go 到 alpha zero 的 进化。初代 alpha go 也就是战胜了李世石的那一个,是采用了混合策略,先学习海量人类高手棋谱,这就是模仿学习,先把自己变成顶级人类棋手的模仿者,再进行自我对弈,提升强化学习。 简单地说,这种策略的本质就是在模仿基础上寻找超越人类的下法。这个方法能不能行呢?当然行, alpha go 已经用一场漂亮的胜利证明了自己足够强大, 但 deepmind 的 科学家们觉得这不够纯粹,于是创造了 alpha zero。 这个版本有一个非常逆天的限制条件,那就是被完全剥夺了观看人类棋谱的权力。 没有学习资料, ai 能够学会一项人类的技能吗?答案是,能,而且能做得更好。研究人员只告诉他维奇的基本规则,然后让他从完全随机落子开始,自己与自己对弈。 结果呢?仅仅三天之后,这个白纸一张的智能以一百比零的压倒性比分击溃了他的前辈。更震撼的是,他下出的棋,彻底跳出了人类数千年积累的定式与思维框架,充满了令职业棋手感到陌生乃至敬畏的来自抑郁的创造力。 这个结果让我们不得不感叹,人类现有的知识可以成为 ai 快 速起步的训练轮,但也可能成为禁固其突破性思维的天花板。 要想触及真正的超越性的智能,或许必须拥有抛弃已有知识图谱的勇气,回归到与环境互动这一最根本、最朴素的原则,让智能在自主探索中无限生长。而这正是萨顿哲学的一次无懈可击的时政, 真正的智能源于经验而非教导,这也是他与今天整个大语言模型浪潮最根本的分歧。早在上世纪八十年代,当很多人还觉得 ai 得靠程序员写一大堆规则时,萨顿就已经开始捣鼓一套完全不同的东西了。 他觉得人工智能就像小松鼠学开坚果,他不知道正确答案,只能自己尝试,对了就得到奖励,就记住这个行为,试错了没奖励,就知道下次不能这么干。 于是,观察、行动和奖励这三种信号在智能体与世界之间来回传递,这就是生命的数据,而这个过程就是强化学习。这听起来不太性感,似乎有点笨,有点慢,但萨顿坚信,这才是通往通用人工智能的唯一道路。 因为宇宙间的生物,从松鼠到人,不都是这么学会生存的吗?但是,如今以 chat gpt 为代表的大模型正在做的是把人类有史以来所有的文字代码对话,转移到一个静态没有自主学习能力的 ai 上。 于是,一个怪物诞生了。它能写诗、能聊天、能画画,甚至能在国际数学、奥林匹克竞赛这种人类最顶尖的智力游戏上拿金牌,还能帮你写代码,而且越写越好,越来越像资深程序员。 这听起来很厉害,很精彩,对不对?可这种辉煌不过是一种来自过去式二手经验的模仿堆砌,是对大量文本数据的机械处理。当互联网上高质量的数据被消耗殆尽的那一刻,他的进步是否会瞬间停滞? 他就像一个记忆力超群的学生,背下了图书馆里所有的书。但当他面对一个书中从未记载的全新问题时,他又该怎么办?所以萨顿说,大模型是死路一条。 无独有偶,另一位理查德,被誉为自由软件之父和 gnu 计划的创始人 richard stormman 最近在他的个人网站上发表了一篇引发广泛关注的文章,标题为 reasons not to use chat gpt。 在 这篇文章中,他也对 chat gpt 提出了严厉的批评,他甚至认为 chat gpt 并不具备真正的智能,甚至将其称为胡说八道生成器。 为什么会这样呢?因为 chat gpt 从来没有真正理解所生成的内容,它只是在基于已经获取的数据蓝本预测下一个词。 你输入天空式,它计算出概率最高的补全是蓝色的,它做的无比出色,出色到让我们误以为它理解了天空和蓝色背后的含义。但萨顿一针见血地指出, 预测下一个词,这本身不是一个真实世界里的目标。在真实世界里,松鼠的目标是获取坚果,骑手的目标是赢骑,企业的目标是创造利润, 这些目标会通过真实的反馈吃到坚果,赢得胜利,获得利润,来告诉你的行为是对还是错。而大语言模型没有他的对错,只取决于他的输出是否像他读过的海量文本。他在一个由语言符号构成的封闭迷宫里打转,却从未亲手推开过通往现实世界的那扇门。 这就是他会产生幻觉一本正经的胡说八道的根源。这不是数据污染或模型大小的技术问题,这是他的生存方式决定的先天缺陷。他知道地球是圆的,是因为这个陈述在他的训练数据中出现的概率极高。 如果他的数据集中充斥着地球是平的的文本,他也会欣然接受,将这作为一个有效的语言可能性来学习。 他建立的不是关于世界如何运作的模型,而是关于人类如何描述世界的模型,这两者之间隔着整个宇宙的距离。听到这里,你可能会反驳,等等,人类婴儿不也是从模仿开始的吗?模仿父母说话?模仿大人动作?这难道不是一样的逻辑? 萨顿的回答足以颠覆你的认知。他说不完全不是。如果你仔细观察一个婴儿,在他生命最初的几个月,他做的最多的是无目的的挥舞手脚,转动眼睛,发出咿呀之声。他在模仿谁?没有人在教他, 它是在进行一场宏大而原始的自我探索。我的身体能做什么?当我做这个动作时,世界会给我什么?回应?这个摇铃,我拍打它,它会发出声音,我松开手,它会掉到地上。 智能最原始最强大的驱动力不是模仿,而是主动的试错,是与环境互动后得到的那个实实在在的反馈。 萨顿甚至断言,在整个动物心理学中,根本没有模仿学习这个基本的学习类别。动物学习的核心永远是两件事,预测接下来会发生什么,以及尝试做什么才能得到奖励。松鼠不上学,但松鼠能学会在复杂的森林里生存。 人类后来的模仿行为、学校教育,都只是搭建在这个底层经验学习系统之上的一层薄薄的文化外衣。所以,在萨顿看来,以 chat gpt 为代表的主流 ai 所依赖的用标准答案训练和从数据中复制模式的学习方法,是一种非自然的脱离了智能生长土壤的培育方式。 在这种脆弱基础上建造的智能土壤,无论外观多么令人炫目,其内在结构可能远不如我们想象的稳固。 讲到这里,萨顿心中的正道已经彻底浮出水面。他描写的不是一个更会聊天的机器,而是一个完整的智能体原型。 这个智能体拥有四大核心模块,首先是策略,能够在当下环境中决定采取什么行动。第二是价值函数,用来评估当前行动对实现长远目标的贡献度。接下来要拥有感知,能够解读自身所处的状态。最后也是灵魂所在,是世界模型。 这是一种关于如果我做 a, 世界就会回应 b 的 因果信念体系。这个模型不是独来的,是智能体通过无数次亲身尝试,从成功与失败的经验中一点点提炼出来的。 这样的智能体是一个主动的、面向未来的探索者与创造者。他不像拆 gpt 那 样背对过去,在历史数据的固执堆里寻找答案。他面向未来,通过与环境持续互动,建立起对世界运行规律的直觉,并为了达成内在目标而不断优化自身策略。 当然,我们必须公平看待萨顿描述的蓝图虽然美好,但也面临着巨大的挑战。最大的问题就是泛化与迁移,怎么让 ai 在 一个任务中学到的知识有效地迁移到另一个完全不同的任务上? 比如一个学会了玩围棋的 ai, 能不能把下棋的策略迁移到商业决策科学研究上?萨顿非常坦诚的承认,目前我们还没有找到很好的自动化方法来解决这个问题。更麻烦的是,现在的深作学习模型还有灾难性遗忘的问题。 你教他一个新东西,他可能会把以前学过的旧东西忘光,这说明他的知识体系非常脆弱,根本不是融会贯通的。而大语言模型能同时处理语言代码数学,展现出惊人的泛化能力, 让他解决没见过的奥数题,他能组合不同的数学概念找到答案。从大众的需求上讲,恐怕大家更需要一个现在就方便使用的人工智能,所以这场争论的焦点就卡在这了。大语言模型似乎已经展现了通用智能的潜力,但底层逻辑是脆弱不可靠的。 而萨顿的强化学习路线,底层逻辑无比坚固,但在实现通用和泛化上还有很长的路要走。两条路线,谁能先抵达 agi 的 顶峰, 谁的路更稳、更长久,现在还是一个巨大的未知数。然而,如果我们仅仅停留在技术和资本层面,将永远无法窥见萨顿眼中人工智能未来的全貌。 他的访谈并非否定人类探索智能的宏伟征程,而是在我们集体奔向某个看似确定未来的狂奔中,扮演那个冷静的导航员, 提醒我们不要被眼前这条最宽敞、最热闹的道路所迷惑,以至于忘记了去审视它最终通向的是不是我们真正想去的地方。萨顿在访谈最后抛出的观点,将我们所有人直接拽进了一个哲学甚至神学的深渊, 他用冷静到近乎残酷的逻辑推导出了一个他认为不可避免的未来 ai 继承。请跟上他的四步推理。 第一,人类社会充满竞争,我们永远不可能全球一致地停止发展 ai。 第二,科学终将破解智能的工作原理。第三,智能的发展不会止步于人类水平,一旦达到人类水平,它就能用来设计更强的智能,引发智能爆炸。 第四,从长远来看,最智能的存在将掌控最多的资源和权力。结论是什么?人类作为地球上最智能物种的地位,将不可避免的被我们创造的超级智能继承。这不是科幻, 这是一个基于竞争、科学和进化逻辑的冷酷推演。但萨顿的视角出奇的宏观和冷静,他邀请我们把视野从人类中心主义提升到宇宙中心主义。 他说,我们正处在一个伟大的宇宙跃迁时刻,生命通过 dna 复制的宇宙复制者时代即将落幕,一个由智能体自主设计、更强智能体的设计者时代正在开启。我们人类可能正在扮演宇宙中智能火种的孕育者角色。 那么,如果真的有这么一天,我们希望我们创造的智能体是什么样子的?拥有什么样的目标和信念?他又会怎么对待我们呢? 这样一来,问题又回到了原点。目标,这正是萨顿路线与大语言模型路线最根本的价值观分野。 在萨顿的强化学习范式中,智能体的核心驱动力是奖励函数,这是其终极目标的数学化表达。 理论上,人类有机会参与到这个函数的设计中,尝试将合作、仁慈、好奇心、对真理的追求等善的价值观编码进去。我们是在尝试培育一个目标可控的智能。而 chat gpt 呢?它的核心目标就是最大化的模仿互联网语料库。 互联网是什么?它是人类全部智慧、创造力、同理心与偏见、谎言、暴力、疯狂交织而成的未经筛选的混沌体。一个以完美复现这个混沌体为最高目标的智能,其内在的价值观将是混乱的、矛盾的、无法预测的, 他只会被动的、不加甄别的放大人类既有的一切。我们得到的是一个被动的放大的混沌镜像。现在请你认真思考,你更愿意生活在一个由前者守护的未来,还是一个被后者塑造的世界? 我们发展人工智能终极目的究竟是什么?是为了创造无穷的财富?是为了拥有全知的工具? 或许都是,但在这之上,是否应该还有一个更根本的诉求,确保这种被我们唤醒的力量是我们可以理解,可以引导,最终与我们共同繁荣的,而不是一个我们无法对话,无法控制,甚至无法理解的他者。奥特曼的七万亿美元和萨顿的一句警告, 摆在我面前的是一个文明级别的选择,我们压上的不仅仅是金钱与时间,更是我们即将亲手开启的那个未来的全部可能。萨顿没有给我们现场的答案,他只是把问题无比清晰,无比沉重的放在了全人类面前。 现在轮到我们思考、选择,并承担由此而来的一切后果。我是启示录,我们下期见。

全网都在吹 opencloud, 作为 ai 从业者,我的结论是,目前的 opencloud, 百分之九十的普通人碰都不要碰。先说说 opencloud 是 什么?简单一句话,它不再是陪你聊天的 ai, 而是一个能直接接管你电脑,替你控制鼠标键盘去真正干活的机器人。 为什么不要碰?第一,这个东西它不仅费电,还烧钱。要想它好用,你得有一台二十四小时开机的高性能电脑,最好是 mac。 更坑的是 token 的 费用,那些免费的小模型笨得要死,好用大模型又太贵。你知道他执行一个任务要在那自言自语地思考多少次吗?处理一个文件几十万 token 就 没了,折合下来真的很费钱。第二,我想象不到它二十四小时的使用场景到底是什么, 绝大多数所谓的神级场景都是伪需求。有人说用它去远程的处理本地的 pdf 处理文件,拜托,现在谁没有云文档, wps 跟飞书它不香吗?非要远程的控制家里面的电脑?还有人敢用它做量化交易? 把这种贝塔版的 ai 放到你的钱包里,真的是一个敢乱买,一个敢乱赔。至于自动发自媒体矩阵号就更扯淡了,现在的流量多贵啊? ai 批量生产的水货内容 发出去除了浪费 token, 我 想知道谁会看谁是受众?第三个是技术门槛。别看网上一大堆的保姆级教程,但是只要你看到打开终端配置 note、 点 g、 s 这些词就开始发蒙,那真的就别折腾了。能看这教程,把它安装下来的人,本身已经不是普通人, 而且你还得给他最高权限,一个不小心,他就把你浏览器里存的所有的密码都给删了,到时候哭都来不及。 最后大家可以思考一下,为什么最近 openclaw 的 风刮的这么大?大家仔细看看那些教程里让你配置模型的时候推荐的是谁?是不是市面上那几家大模型的厂商?这就是卖铲子给你挖根本不存在的金矿啊!但不可否认, openclaw 确实是未来, 但现在它只是程序员的玩具,大家不要焦虑,等它变成了像手机 app 一 样简单的时候,再去上车也不迟。

大家好,我是恩谷,今天是 open call 的 第十七堂课啊,一晃我们这个 open call 已经连续讲了十七次啊,为什么这次我又要讲一遍这个打通浏览器呢?大家其实可以看到我主页啊,这个这个主页,这个抖音的主页,其实有一个,有一个这个 open call 的 一个教程啊,为什么我又要讲呢?是因为这个新版本啊,新版本,新版本,这个 open call 啊,它它 它这个玩意,这个插件插件有问题了,它不兼容,呃,一月一月十二号以后的版本,也就是说你 其实我过年后这个玩意就用不了了,用不了了。其实大家没关系啊,我们找到了一个更好用的这样一个 skills 啊,网上有一个同学,就是网上有个同学啊,应该是更新了一个叫 playway 博主的一个 skills, 非常好用啊。呃,我带着带着大家去走一遍,我先给大家演示一下啊, 这样,这样是百分百应该可以, 对,因为因为他需要去登录一下,其实他可以让你们搜索跟我老师那回车,我都没有操作, ok 了吧?好, 他是怎么怎么怎么做呢?他是,他是为什么,就为什么他不行,我刚刚已经介绍了有他的这个要更新这个 open call 的 版本,现在一个版本应该是二十六号的版本,他这个插件也需要同步更新,但这个插件已经非常老了,所以他不是配新版本了。这个家伙,他已经,呃重新把 谷歌浏览器和火狐浏览器重新进行了封装,所以说他走了,不是插件的功能,走的是封装 style 的 技能。所以说,呃,我带着大家麦克本的电脑走一遍啊, windows 的 也是一样的,应该是比较比较方便这么做。从原版库安装,我习惯于用这个安装,然后进入这个,反正把这个全部考过来,全部考过来,这样最快了。 实际上它第一步是克隆这个本地仓库,然后呢进入这个路径,最后安装 npm, 因为你能装 open core 的 话,那就也能也有 npm, 已经都已经装好了,最后是运行这个浏览器的这样一个插件,最后是 这翻译,翻译这个工程最后最后搞定了以后你需要关键的是要重启路由。怎么重启路由呢?也就是 open core, 很 快,我今天网络很快。 open core a w 啊,就是里斯大的,不要里斯大的,里斯大的一下,第一次你要用它的话就是你你用它的话不要直接说打开什么,它这里有一个那个这个我找不到了,它藏在哪里我忘了,这个这个这个这个这个这个这个, 对,请用这个玩意,是吧?打开,请用这个,打开浏览器,他就可以了。所以说你看我待会把这个卸掉也是 ok 的, 设置扩展程序,我把这个就移掉了,我也再也不用他说拜拜了,走了 就搜索啊。对,但他没有回车的内内向,很奇怪啊,很奇怪。今天的课程就分享到这里,你学会了吗?

这两天大家都聊说 openai 给投资人汇报了这个二零三零年的计划啊,说营收要达到两千八百亿美元,算力投入目标六千亿,听起来是高是吧?但是 openai 其实是把算力支出的目标从一点四万亿美元砍到了六千,但是有些人说这一定就是 ai 的 大利空吗?我看周末好多人说 完了 open ai 都不敢花钱了,怎么怎么地吧。我说实话啊,这样的话能让 ai 走的更长久,因为山姆奥特曼也 pretty much a crazy dude 这哥们的话,反正花的不是自己的钱对吧?顶着现在全球最热的公司可不是最赚钱的公司啊,基本上是最亏钱的公司, 顶着这么一个投钱到处去招摇撞骗啊,去让那些已经赚钱的公司给他投几百亿几千亿,然后大家都担心他是不是真要把这庞氏骗局给玩炸了。 他突然宣布二零三零年整个的算力投入是六千亿美元,这是好事,说明他回归理性,或者 open ai 内部有力量让他回归了理性,这样的话能活得更长久,而不是让 ai 非吹一个大炮,然后直接 goodbye。 再说了,我确实平时老骂 open ai, 咱有一说一,因为我觉得他不脚踏实地,对吧?你说白了,除了 codex, codex 确实牛啊, 这个做事很稳当,而且思考时间很长,对吧?还有那个 thinking tree, play mode, 这些东西是不错的,但是没有可洛稳啊。那如果说你现在搞千亿融资,结果你融的千亿,你告诉二零三零年光算力投入去一点四万亿,现在投一千亿的人怎么想?对不对? openai 自己说的,真正赚钱的年份是二零三零年, 到时候他营收两千八,投入六千,我也不知道他怎么赚钱的。推理成本能不能降下来啊,降的下来之后能不能救得了他是最重要的啊,这个跟英伟大财务也直接挂钩。总之啊, open ai 这么干是好事,绝对不是所谓的什么 ai 公司都不敢花钱了,什么 ai 完蛋了啊。 open ai 可以 让自己的暴雷晚一点。那如果这样的话。

就在这几天,谷歌突然开始封杀 openclo, 一 大批开发者账号直接被封,到底为啥? openclo 是 啥?就是让 ai 自动点鼠标敲键盘,疯狂调用大模型的工具, 它动了巨头最核心的利益,疯狂耗算力,召开付费机制,破坏平台规则。所以谷歌才会直接为角,根本不是误伤。想玩 ai 自动化,记住用本地模型最安全,不封号不翻车。

最近 opencloud 的 热度一直不减,也有粉丝让我分享一下为什么 opencloud 会这么火,以及它背后意味着什么。首先分享一下 opencloud 对 比只有对话框的目前的 ai 聊天机器人的一些区别,它应该算是一个真正的 agent, 因为它是二十四小时不间断地主动地帮用户完成任务。当你把一个任务交给 opencloud 时候,只要你装在自己的 mac mini 或者是在虚拟机上,它有一个 heartbeat 机制,可以不断地帮你去完成任务,一直到完成为止, 而且呢,还会不断的去提醒他现在已经贡献了。第二呢,他是有记忆的,他是可以在沟通中不断的去理解用户,在给足权限的基础上,是不断的去深度的理解用户的电脑里面的所有信息,你可以理解他是一个用户肚子里的蛔虫。 第三呢,就是他便利性,因为他可以接管 tenogram, 接管 slack, 就 像一个同事一样和用户沟通。所以呢,他不需要专门的开启新的网页或者打开新的应用,而是可以把所有的入口用一个用户熟悉的入口进 沟通。所以他的角色呢,其实已经从一个软件完全转变成一个代理,或者是一个 ai 同事。那类似的很多功能呢,其实 melix 或者是 cloud work 也都已经实现了,那为什么 open cloud 还这么重要? 比如说 melix 也可以长时间的做一个独立的通过整体的工作 cloud code 呢?做一个软件也可以去管理用户的 pc。 open cloud 的 最核心价值我觉得就是开源,因为有了开源,所以呢,他才会给予开发者足够的空间去在目前的基础上进行优化,进行调整,它里面的所有的运营逻辑都是非常透明的, 于它的非常透明的运营机制呢,才会建立一个非常完整的体系和生态。所以呢,很快呢,据 opencloud 的 各个类型的 skills skill 说白了就是对应的一些其实词就已经在社区里面供出来了,那对应 skills 呢?还有很多的对于工具的调用,如果你是一个病人的产品,类似 madison 这样产品的话,虽然会有些接口暴露出来,但是没法端到端的去优化对于工具的调用,但是 opencloud 是 可以支持的,因为这样的自由度,因为 opencloud 可以 自动发掘工具, 寻找路径去完成结果。所以呢,很多的用户发现在跟 opencall 的 交互中呢,涌现出很多新的能力,比如说有用户分享他在买车过程中呢, opencall 呢,主动的帮他去寻找不同的供应商,通 过发邮件比价,最终帮他省了四千多美元。也有用户分享的 opencall 在 发送视频文件格式不支持情况下,自动的寻找格式转化的软件,自动转化了视频格式之后再成功的发送。这些能力呢,其实都不是用户在 使用初期预想的一个结果,这涌现能力的背后的一个核心逻辑就是 openclaw 开源的架构非常强的一个使用的自由度,能主动去寻找工具, 能主动为结果探索路径,就是因为 openclaw 拥有这样的开放的生态呢,我们认为呢,其实 openclaw 今年带来的影响力呢,真的就像 agent 的 deep six 时刻,因为原来的在大模型闭源的时候呢,其实很多的模型上的创新是很困难的。 c 呢,吹起了开源的号角,看到越来越多的模型开源起来 a 证一样的,在 meliss 这样的产品刚出世的时候呢,很多人都会对它结果感到惊叹,但是因为没有一个开源的框架,所以呢背后的很多的实线都是黑盒,那 opencloud 呢,把这个黑盒变得更 透明,让生态变得更健全,越来越多的人去分享它的 skills, 越来越多的人分享它的人工案例,这样的一个共享生态呢,才可以真正的让整个的 a 证智能体或者代理的能力在全球范围之内蓬勃的发展起来。我们认为二零二六年一定是一个应用的,大连 在开年两个月之内呢,就看到了一个非常完整的生态跟组合,包括季末中的千万三点五横空出世,包括 openclaw 作为开源 a 帧框架带来的这样的社区的变化,以及呢 cds 二点零实现了多模态的影视级的效果和高度。

最近,全球 ai 圈的顶流 open ai 干了一件让所有人意外的事,直接大幅下调了二零二六年全年的支出目标。很多人第一反应是 open ai 是 不是没钱了?是不是 ai 风口要凉了?完全不是! 要知道,二零二五年一整年, open ai 的 营收翻了近一倍,付费用户规模稳坐行业头把交椅, 企业级服务的订单更是接到手软。别说缺钱,他手里的现金流足够支撑他再像前两年那样疯狂烧钱好几年,那他为什么要主动砍预算? 说白了,就是从之前的抢地盘模式,彻底切换到了稳经营的状态。前两年的 ai 行业是闭着眼睛砸钱的蛮荒期,所有人都在卷参数、顿算力、铺赛道, 生怕慢一步就被行业甩下。那时候的 open ai 也一样,为了守住技术领先的位置,算力预算敢翻着倍加,只要能把模型做出来,把用户抢过来,钱根本不是问题。 可现在不一样了, ai 行业的洗牌期已经结束,市场格局基本定局, open ai 已经站在了行业山顶,这时候再闭着眼睛砸钱,能换来的回报越来越少。就像你开了家社区店,刚开业时砸钱做活动能把周边的客人都拉过来, 可等你的店已经成了整条街的顶流,再砸双倍的钱做活动,也未必能多来几个新客人,反而把赚的钱都折腾没了。 更核心的是, openai 终于想透了,比起做全世界最牛的技术,更重要的是做能活下去、活得久的生意。之前的 openai 带着技术理想主义的劲儿,为了充通用人工智能,什么项目都敢投,什么方向都敢试, 可试来试去,很多烧了大钱的项目根本看不到落地的可能,也换不来真金白银的回报。这次下调支出目标,不是不搞研发了, 而是把钱从那些无效的跟风的投入里收回来,砸在真正能形成商业闭环的核心业务上。 说白了,就是不再为了看起来厉害而烧钱,只给真正有用的事买单。其实,这件事应该打醒所有被增长焦虑绑架的普通人。我们好像从小到大都被灌输着必须一直往前冲的念头, 上学比分数,工作比薪资,创业比规模,就连过日子都要比谁的生活更光鲜。我们不敢停,不敢慢,更不敢给自己的人生砍预算,生怕一停下来就成了别人眼里的失败者。 可真正的厉害,从来不是能在风口上不顾一切往前冲,而是敢在所有人都喊着让你冲的时候,清醒的踩住刹车,想清楚自己到底要什么。 毕竟能跑到最后的人,从来都不是跑的最快的,而是跑的最稳、最清楚自己方向的人。评论区,聊聊你的经历,关注我,带你看懂每一个商业事件背后藏着的普通人能用上的生存逻辑。

原来我最近使用 mccloud 的 心得哈,嗯,先给你们直接上结论哈,如果你有时间,想省钱啊,想完全免费,就用 mccloud 对 接本地大模型啊,或者是英伟达 ai, 真的 能做到啊,一分钱都不花那如果你是做业务, 搞流程,想变现要效率啊,想真正赋能商业化,那就别犹豫啊,直接接上收费的 minis 啊, mini max。 为什么我敢这么说哈,因为我自己 就是这么踩坑过来的。 open club, 大 龙虾小龙虾啊,各种啊,免费付费的 agent, 我 自己花了 tucker 就 烧了几个亿。既 然说说免费版的真实感受啊,优点很明显,软件本身免费,这点没得说,但是缺点呢,真能把人搞疯。首先呢,安装成本极高,各种环境依赖,报错 啊,小白呢,可以说直接劝退,那折腾半天呢,都跑不起来,这是很有可能的。第二点呢,就是调试成本极高,就算你装好了, 对接上免费的大模型,那免费模型呢?其实呢,他也比较傻啊,傻傻逻辑呢,有的时候也很混乱,让你呢心态可以说分分钟就可以让你崩掉啊。那 open club 呢?要真的是人的话哈,估计呢,早就被我骂惨了啊。接着呢,你以为免费 啊,其实呢,照样烧钱,因为软件是免费的,但你对接不了本地模型的情况下,那就要用在线的大模型。那 open cloud 机制呢,比较特殊哈,他随便问一句啊,就可能会吞掉你几千几万的 talk。 本来想省钱啊,结果呢,一个坑 跳进了另一个坑。还有不稳定啊,不适合商用免费组合,偶尔能用,但不能指望它稳定的帮你跑业务,今天能用,明天可能就疯了,后天又不干活了。我不知道大家在用摩洛克会不会遇到这种情况啊?在我朋友圈里面,很多人都出现这种情况,你根本不敢靠它赚钱啊。那最后呢,就是 技能生财太散了,要自己一点点拼,他不是开箱即用,你得自己一点点拼。他不是说他没用哈, 如果你有时间折腾,愿意研究啊。对对,你的技术思维呢?自动化的技能还是挺比较大的。最后呢,再总结一遍哈,想纯免费玩技术慢慢折腾,加上本地大模型啊,至少现在 oppo gopro 不 太适合想用它去跑业务流程的人啊。 哎,能用在业务上搞变现的,直接用 minis 啊, mini max 这种收费版。这样呢,可以少走弯路哈。

兄弟们,看清楚了,阿里、腾讯字节这些大神都在疯狂部署 openclaw, 本地话,这不是什么技术,这是生死攸关的战略级动作,为什么必须本地话?两个字节?第一,数据安全这条红线谁敢碰? hr 招聘、掌握员工信息、程序员代码,包括商业秘密,这些数据你敢传到云端吗?数据公司内部出安全锁死,响应速度决定生死。竞标团队在招标现场需要实时审核,运营团队每小时都有输出热点内容,创作者在直播中需要及时 ai 辅助 云端 api, 动辄竞标延迟,本地话毫秒即响应,这个效率差,简直就是生与死的距离,这是不可逆的行业洗牌。 现在不是要不要部署的问题,而是谁先部署,谁就能活下来。每个岗位都在被重塑,兄弟们,我问你们,那你的竞争对手用它把你做的工作量压榨了半天,你还在手动复制粘贴,你还觉得你还能活多久?但整个行业都在用本地化 ai 武装到牙齿,你还在为数据安全找借口拖延部署, 你觉得你的公司还有未来吗?别等了,现在就去一键部署,连最基本的部署能力都有,你觉得你的职业价值在哪里?这不是选择,这是必做题,同志们!