全球免费开源大模型,哪家强?国产得看 deepsea。 放眼全球,获得全球开发者广泛关注的是谷歌 jam 四发布首周下载量就突破一千万次,用三十亿参数跑出了同级别领先的水平。凭什么是 jam 四? 今天这条视频,我用三个核心维度给你讲透 jam 四的技术特点和发展历程,还有普通人怎样用它进行商业落地。首先,你肯定会问, jam 四为什么能全球持续增长, 而不是像其他模型一样发布即巅峰核心?答案是它较为独特的生态爆发力。现在的开源 ai 圈,很多模型都是发布即巅峰,上线时获得较多关注,后续增长乏力,用户量逐渐减少。不少头部模型都在商用规则上设置的限制, 要么付费解锁核心能力,要么营收达标后就要抽成,普通人很难接触到商用权限。但 jama 四采用了不同的策略, 把币源起见,杰姆莱三同源的核心技术,用较为宽松的规则免费开放给了所有人。这和二零二五年的 deepsea 平性价比和开源策略获得国内市场关注的逻辑一致,用明显的技术优势吸引了全球开发者参与, 它在技术能力和开源协议之间取得了较好的平衡。它的增长不是现行的,而是爆发式增长,用几代模型完成了较长时间的技术积累,这种生态爆发力是它快速发展的重要基础。 那么,凭什么 g m 四能被全球用户认可,连中文用户都觉得好用?因为它解决了海外 ai 普遍存在的通病。 很多国外 ai 大 模型能力较强,可一换到中文,场景理解能力就会明显下降。但 g m 四显著改渗了这些行业通病。它原生支持全球超过一百四十种语言,从普通话到各种小众方言都能进行视频和输出。 你问他一个重语什么意思,他能解释清楚字面含义,还能结合上下文说明相关的意境和用法,没有明显的使用割裂感,中文适配较好。他的综合能力也较为全面,全系支持图文、视频多模态处理,不光能看懂文字,还能识别图片、视频里的内容。小模型版本还额外支持音频理解。 大魔性版本最高支持二百五十六 k 的 超长上下文,可以处理几十万字的长篇文档。对于技术爱好者来说,可以直接用它本地部署,从 continue client 这类常用框架到社区里热门的工具,都可以搭建一个完全免费不限量的本地辅助工具。本地部署还能保证数据安全, 所有计算都在自己的设备上完成,不会上传到云端服务器,特别适合处理企业内部文档,个人敏感数据也没有调用次数和速度限制,不用排队等待响应。 更关键的是,他用仅仅三十一亿的参数就达到了较高的性能水平,在部分合金指标上超过了体量是自己二十倍的大模型。 从口袋里的千元手机到工作室的专业服务器,四款模型覆盖了不同使用场景,能力覆盖较为全面。说到这,肯定有人会问,模型再好,不能赚钱也没用。 jam 四真的能帮普通人进行商业落地吗?答案是肯定的,不少顶级开源模型都给商用设下了限准, 营收超过一定额度要给厂商分成,想商用得购买企业授权,普通人很难有机会真正落地。但 gemma 四降低了开元模型的商用门槛,它全系采用 ipatch 二点零开元协议,这是全球开元社区广泛使用且商用限制较少的协议之一。 该协议允许任何人自由使用、修改和分发代码,不需要公开自己的修改内容,也不需要向原作者支付任何费用。用大白话讲,不管你是普通用户搞二次创作,还是中小企业做商业项目,又或者是开发者开发 ai 工具, 全都是免费授权,没有任何营收、用户规模的限制,你不用花一分钱就能用谷歌旗舰级的 ai 技术做自己的项目。而且它和安卓系统深度绑定,未来会迂装到全球超过三十亿台安卓手机里,拥有极其广泛的用户基础。有人会说,开源小模型 再强,也干不过闭源大模型吧?但根据部分第三方评测数据,在特定场景下,小模型的表现接近闭源大模型。还有人会觉得,免费开源的东西肯定没好货,但你要知道, jam 四的免费不是音歌版的引流套路,是谷歌用旗舰技术拓展生态的核心战略, 它的实际能力达到了同级别收费模型的水平。当然, jam 四也不是完美的,这些闭源旗舰模型 在 c 端闲聊娱乐创作的体验上,它也不如国产大模型贴合用户习惯,而且本地部署对纯新手来说还是有一定的技术门槛,所以你一定要清楚,它最适配的使用场景是本地部署、二次开发、商用项目落地和长文本代码的离线处理排原生态的发展 需要不同的技术路线和商业模式。小模型的崛起正在改变整个 ai 行业的格局,让更多普通人和中小企业 都能用上高性能的 ai 技术。你听说过战马四吗?你觉得它和 deep seek 各有什么优势?评论区告诉我,收藏这条视频,关注我一期,拆解一个 ai 巨头,带你看透行业底层逻辑。
粉丝1.7万获赞10.0万

性价比最高的这个模型出现了,就是新上线的这个 deepsea v 四 flash 啊, flash 版本, flash 呢?它现在呢?它有几大优点啊?第一呢,就是超长的上下文,长达一兆呀, 平常的咱们模型都是两百 k, 对 吧?然后有两百五十六 k 的 这个 deepsea 四啊, 一兆啊,一 m 啊,一千 k 的 这个超长上下纹。另外就是它的性价比, 我觉得是目前最高的 v 四 flash 版本就是它不是最便宜的,但是性价比是最高的,两块钱百万头啃。第三个优点呢,就是它速度非常快啊,整体还是不错,但是这个 deepsea 目前它有一个问题啊,我看它这个幻觉可能会有时候会有一点, 所以还是得再验证验证吧。威斯弗莱斯速度非常快,我觉得这是它的最大的一个特点,还有它非常便宜,大概就是这样。


所有米粉全体起立金帆,六月要搞一波大的了!数码博主透露,小米系统最新版本澎湃 os 二十六或者澎湃 os 四会在六月发布,而华为和苹果的开发者大会已经定在了六月份,意味着国产高端三巨头全球销量第三名,而且即将重新定义四千元高端位置的厂商终于要发力了吧。 为什么要定在六月?因为这次金反拿出的东西非常夸张,不管是自研系统,自研折叠屏 os 都是一大亮点。而且这次的系统剔除了 miui 时代的呆萌,正式进入澎湃自研时代,也难怪想跟苹果华为并列。

google 刚刚无偿提供了一款耗资数亿美元打造的模型,无需订阅、无需 api 费用、无收入分成,你可以下载它在自己硬件上运行,并在此基础上构建业务,无需向 google 支付一分钱。这不符合正常的商业行为, 公司不会把自己最昂贵的资产免费送人。所以,要么谷歌疯了,要么是人工智能市场发生了某些大多数人尚未充分注意到的事情,这才是真正发生的事。谷歌这次出手并非只采取了一种策略,他们三层叠加运行, 每一个都价值数十亿美元,每一个都针对不同的竞争对手,其中之一专门用于阻止中国抢占西方公司尚未充分关注的人工智能市场份额。 在本集中,我将带你逐一剖析那三大战略决策。解析 open 人工智能与 antropic 为何正朝两个截然不同的方向迈进、迈进,以及这一切如何预示了人工智能市场的分裂。这一趋势将塑造你我未来数年使用该技术的格局。 如果我们之前没见过面,我是阿里 c 了,目前我在一家科技公司担任总监。在这个频道,我将助您把科技与金融转化为个人优势。 现在,让我展示一下人工智能市场中真正发生的事情,因为一旦你看到了这一点,谷歌的这一举动就不再显得奇怪,而会开始看起来是我们在该行业见过的最精明的策略之一。叉 g p t。 发布后的头两年里,你公司使用人工智能的方式基本上只有一种, 你调用了 a p i and token 付费数据,发给了 open 人工智能 anthropic 或 google, 然后带着答案回来,然后月底你会收到账单,那就是那个模型。简单吧。但随着企业真正开始规模化使用,人工智能第二种模式也随之出现。 它的运作方式完全不同。你下载一个模型,在你自己的硬件上运行它,或者在你直接租用的云基础设施上运行。你从不调用 api, 你 掌控整个技术栈。 这是开源权重层级,而且它正在飞速增长。现在在我继续之前,我想直接了当的谈一件事, 因为如果你对这一领域稍有所知,可能会想,等等,公司难道不是已经在安全的运行闭源模型了吗?我本人工智能刚刚签署了一份五角大楼的合同 x 人工智能也签了一个大型银行,正通过 az 部署 gpt。 那 么这里到底有什么不同? 是的,你可以安全的运行闭源模型。你可以将数据路由至私有云配置中,这样它永远不会被发送至提供方的服务器用于训练。这确实可行,适用于大量企业用力。 但这并未改变根本的经济逻辑。你仍按头肯付费,你仍然依赖于提供商的定价。你仍在由提供商控制的设施上运行。 你本质上是在租用访问权限。你并未拥有该模型。开源权重是另一回事。你物理上拥有模型文件,将其加载到自己的 gpu 上。每个头盔的编辑成本骤降至电力和硬件的成本。在规模化后,这可能比 api 定价便宜十倍甚至一百倍。 你可以随心所欲的微调他,你可以在想升级的时候升级,你可以控制他能做什么,不能做什么?不能做什么?如果发布,他的公司明天就消失了,你的部署依然能正常运行。所以这个决定其实与安全无关,这关乎经济与控制。这里有个关键洞察。 对于任何以大规模使用人工智能的公司来说,最终算账会发现开源权重更有利。一家在 api 调用上每月花费二零零零美元的初创公司会留在封闭模型中,因为便利性比成本更重要。 但一家每月花费两百万美元的公司会开始问自己是否应该自行运行,而这类客户并不罕见。几年后,这种情况将变得司空见惯。 l b n b 早就这么做了。他们将大量人工智能赋载从 open 人工智能迁移到了 t a m。 因为在他们的规模下,这便宜的多。他们不是银行,也不是国防承包商,只是一家算过账的公司。 在未来两三年内,更多公司将重新核算这些招募。所以,人工智能市场正分裂为两层,一层是封闭层,你支付高昂费用,获取最佳模型并接受租用的权衡。另一层是开放层, 你承担自建基础设施的复杂性,以换取更低成本、更多控制权,以及对单一供应商的独立。不同的客户,不同的经济账,最终是不同的商业模式。这就把我们带到了一个所有主要人工智能实验室都面临的核心战略问题,谁同时在两个 层级? opec 情况也一样, met 几乎完全处于开源层级。 deep seek 同样的故事, 他们各自选择了一条赛道,而谷歌是唯一一家同时在两条赛道上认真竞争的公司。 gemini 面向那些想要最佳模型且愿意付费获取 api 访问权的客户,而 gemini 则是为原本会转向 lama q w n 和 deepsea 的 客户打造,因为他们需要能自行运行的方案。 所以归根结底,谷歌发布 gemini 并没有参选 gemini。 谷歌正在捕获 gemini 永远无法触及的市场细分领域, 这正是谷歌在该市场中地位独特的原因。现在,一旦你理解了这种双层架构,真正的问题就变成了,谷歌从开源权重这一层到底得到了什么?因为他们没有直接向 g m a 收费。收益从哪里来?而在现实中,他们有三个。 每个问题都对应一个不同的战略考量,我们如何从中获利?我们如何阻止竞争对手获胜?我们如何借此让其他产品变得更强?第一点,回报关乎谷歌如何从芝麻中真正获利。既然模型本身是免费的,那收入从何而来? 答案就是云端。 java 可免费下载,但一旦你想用它做严肃的事情,比如用自己的数据微调它服务成千上万的用户,或在其上构建一个智能体,你就需要基础设施了。 google 已将 gemma 四直接治于其云站内部,一托自有 tpu 芯片提供服务,支持在 cloud run 上部署与智能体开发套件集成,并为受监管行业提供主权云选项模型是免费的,但它所运行的轨道却不是。 上个季度, google cloud 收入达一百七十七亿美元,同比增长百分之四十八,未执行合同金额高达二千四百亿美元, 那笔记压订单才是生意所在。 gemma 是 漏洞现在商业故事的第二个部分在于端侧 最小的 gemma 四模型。 e 二 b 和 e 四 b 专为直接在手机、笔记本电脑甚至浏览器中运行而构建。 现在想想看,谷歌拥有安卓自有 pixel 设备、 chrome 浏览器,如今又有了能在自家硬件上原生运行的高能模型。而谷歌的软件增强了这三项平台以对抗苹果智能和三星的人工智能占, 而这保护了价值数十亿美元的设备、生态系统和其中流淌的广告收入。所以这就是第一个收益点,商业变现,将模型免费赠送出去,在云端和设备上捕获价值。第二个回报在于阻击竞争对手。 而此刻,席梦斯正面临着真正的紧迫感。在开源权重层级中,对谷歌最大的竞争威胁不是 met, 而是中国。 过去一年,阿里巴巴、 deepsea、 moonshot 和 z i 等中国实验室发布了开源权重模型,其中一些在某种程度上可与 g p t 减五和 cloud 相媲美。而对于任何决定在自己基础设施上运行人工智能的西方面企业来说,最佳选项似乎正开始变成中国的产品。 现在想想,这究竟意味着什么?一家欧洲主要银行在 coin 上微调其人工智能助手,或者一家美国医疗公司在 deep seq 上运行医疗工作流,或者一个政府机构基于中国模型构建其内部工具。 这对谷歌而言是地缘政治问题、商业问题和国家安全问题的三重叠加。如果中国开源权重模型成为西方企业部署的默认选项, google 失去的就远不止开发者的关注了。 google 会失去与每家企业相关的云收入,因为这些工作负债有运行在非谷歌基础设施上的风险。而 jamie 四就像是谷歌插下了一面旗帜,这是谷歌在告诉你,你不再需要转向中国模型就能获得开源权重。 这是一个由美国公司打造的西方替代方案,提供企业级保障,不会收集您的企业数据,用于训练未来的模型。它运行在你已经熟悉的架构上,而这绝非抽象的竞争担忧, 这是谷歌在开门之前故意对中国竞争对手关上了一扇门,而这里是竞争故事的第二部分。这就是 jama 给封闭型竞争对手施加的压力。 o 本人工智能和 antropic 对 其前沿 a p i 收取高昂费用,只要存在质量足够接近的免费替代品,这种定价就站不住脚。当谷歌发布一个接近前沿水平的开源权重模型时,它会对那些高昂的价格施加压力, 而谷歌能承受这一损失,因为它的绝大部分收入并非来自 api 令牌。然而, open 人工智能和 anthropic 会这样做。因此,每当 jama 变得更强大时,封闭 api 业务赖以生存的价格基础就会松动一分。 所以,这是第二个收益点。这是一种竞争性的否认,阻止中国抢占西方开元权重领域,同时挤压封闭型竞争对手的利润空间。 第三个回报是大多数人完全忽略的东西。关键在于 gemma 通过存在本身,让 google 的 其他人工智能产品变得更强大。 从 gemma 开始, gemma 是 google 的 旗舰闭源模型,也是他们唯一收费的模型。 而且 gemma 四建立在与 gemini 三相同的底层研究和相同的技术基础之上。 gemma 赢得的每一项精准测试,每一条积极的开发者评价,每一次有人称赞 gemma 令人印象深刻,都在强化这样一个认知, gemini 背后的技术是世界级的。 gemma 实际上是为 gemini 打造的可信度引擎。免费模型不仅吸引开发者,还推销付费版, 然后使整个开发者生态效应。它燃烧的最慢,但可能是最有价值的。 gemma 四在 app 二点零下发布,这是软件行业中最宽松的许可之一, 它消除了阻碍企业采用早期版本的法律摩擦。每当开发者进行微调发布教程,将 gemma 集成到工具中,或在其之上推出产品时,一件非常重要的事情正在发生。 正是那位正在精通 google 人工智能技术站的开发者,不是卖他的,不是阿里的,也不是 open 人工智能的,这就是他为何重要的原因。今天学习 gemma 的 那位工程师,三到五年后将会坐在会议室里,决定公司使用哪家云服务商。 他们正是那位将为下一次五百万美元采购决策赚写技术建议的工程师。今天的开发者熟练度会转化为明天的采购决策。 这就是你赢得十年平台战争的方法,你让下一代工程师在你的技术战中思考。所以,这是第三个收益组合强化。每一次 gemini 显得更强大。 每一个在 jama 上构建的开发人员都会成为其公司内部对 google 的 支持者。免费模型既是信誉引擎,也是人才管道。现在将这三个收益结合起来,途景就变得清晰了。商业捕获、竞争遏制与组合强化,全部反馈至同一底层业务。 这就是为什么谷歌要花这么多钱去开发一个免费赠送的模型。这并非慷慨或慈善。这是一家审视了人工智能市场,发现其一分为二后,决定在两个领域同时展开竞争的公司, 能收费的地方就收费,在免费送,能赢得细分市场的地方就免费送,并确保无论市场走向何方,谷歌都将身处其中。现在,这里有些事应该让你感到不安了。 如果谷歌采取了如此聪明的策略,为什么没人效仿 open 人工智能、 antropic 这些全球资金最雄厚、人才最顶尖的公司之一,却只在一个层级里竞争?为什么?显而易见的答案是,他们没有谷歌所拥有的东西, 没有云,没有 tpu, 也没有 android 模型,即业务免费赠送便无物可售。但有趣的信号并不在那里, 这体现在 open 人工智能和 astropica 在 开元层级边缘所做的事情上。尽管它们看似都被挡在前沿之外,但在如何参与开元权重世界的问题上,却做出了截然不同的决定。而这些选择或许能告诉你整个市场的走向。 先从 open 人工智能说起,因为他们确实在二零二五年八月踏入了开源层级。他们发布了一个名为 g p t 减 o s s 的 东西,这是两个开源权重模型,可免费下载,采用 apache 二点零许可证。 而且,如果你一直关注着,可能早就预料到了这一点。更有趣的是,他们为何这么做? 因为原因不止一个。这一点更有趣的是,他们为何这么做?因为第一个是 deepsea。 二零二五年一月,一家中国实验室发布了二一,这是一个开源权重推理模型,其能力大致相当于当时 open 人工智能的 o 一。 据报导,训练成本不到六百万美元。那次发布让英伟达的市值在一天内蒸发了约六千亿美元, 美国股市历史上任何公司单日最大跌幅。几周内,山姆阿尔特曼登上 reddit 写道,我个人认为,我们在此事上站在了历史错误的一方,需要想出一套不同的开源策略。 这是 ceo 面对无法掌控的市场时的回应。所以这就是第一个原因。另外三家在他后面安静降落。第二点是企业客户转向拉玛和中国模型,因为 open 人工智能没有任何支持自托管赋载的产品。 第三点是研究社区正转向开源模型,因为难以对闭源模型进行有意义的研究。 第四点是政治因素。特朗普政府早在二零二五年七月的人工智能行动计划中就认可了开放权重模型的地理战略价值。 欧盟称 g p t 减 o s s 是 一个基于民主价值观在美国创建的开放人工智能站,措辞几乎与政府如出一辙。 但这里有个关键细节, gpt 减 o s s 被定位为零四 mini 级别,低于当时 open 人工智能的最佳水平。发布两天后,他们推出了完全闭源的 gpt 减五,真正的尖端仍被锁定。 而当他们在两个月后跟进推出 gpt 减 o s a safeguard 的 时,那根本不是通用模型,它只是一个狭窄的安全分类器,本质上是个合规工具,所以这一模式是一致的。 当符合战略目的时, open 人工智能将发布开元权重的模型,但那些发布版本总是处于前沿之外,定义狭窄或两者兼有,这就是他们开放层战略的形态。现在 antropic 完全是另一回事, 而这正是最有趣的部分之一,因为他们不只是出于商业原因而坚守着量子学原因而持有它。 现在无论是出于真诚的信念还是战略姿态,留给你自己来判断。就我个人而言,我认为两者皆是。 anthropic 从未发布过开源权重的模型,一个都没有, 而近期的行为表明,他们甚至更加背离了这个方向。就在几周前,也就是二零二六年四月, anthropic 宣布了一个名为 claude mithos 的 模型, 而他们对自己模型能力的描述同样令人印象深刻。他们表示已发现数千个安全漏洞,包括各大操作系统和网络浏览器中的若干漏洞, 其中一些漏洞已潜伏数十年未被发现。而 anthropic 认为该模型对公众发布过于危险,但这里才是理解其策略的关键所在。他们并未仅仅将 misos 内部保留。 他们启动了一个名为 project glasswing 的 项目,该项目让 missiles 能够访问一套经过严格筛选的约五十家组织,微软、谷歌、苹果、亚马逊、英伟、达摩根、大通。那么为什么是这些公司?因为这些是互联网其余部分所依赖其系统的组织, 操作系统、云基础设施、金融网络芯片制造商。如果 missiles 能在每个主要操作系统中发现漏洞, 那么 anthropic 希望运营这些基础设施的公司先与对手发现并利用这些漏洞进行修补。现在你们中有些人可能会想,等等,你说过 open 人工智能发布 g p t 减 o s。 的 原因之一是它们正在失去研究社区的支持。 同样的压力难道不会也作用于 anthropic 吗?确实如此,但研究社区实际上分成了两派, 而其中只有一个对 entropic 真正可用。第一类是能力研究社区,即那些致力于让模型变得更强大的群体,他们需要开放权重来完成工作。 这就是 open 人工智能正在失去的那个社区,也是 entropic 永远无法赢得的社区,因为 entropic 从未发布过开源权重的模型,将来也不会。而第二个社区是安全与对齐社区,既那些致力于让模型更安全的人, 他们的大部分工作通过 api 访问、红队协议和已发表的研究展开。这就是 anthropic 多年来通过其奖学金项目、可解释性研究和发布的宪法所构建的社区。 所以这并非 anthropic 无视研究压力,而是它只在其商业模式允许的研究社区中活动。 那么,这是否是长远来看的正确策略,只有时间能证明。所以真实情况是这样的, 谷歌在两个层级都展开竞争,因为它的商业模式允许它这样做。 open 人工智能坚持闭源策略,仅在外部压力使其有利时,才会进行偶尔精心策划的小范围开源发布。 anthropomorphic 出于原则坚持闭源,甚至更进一步推出像 mesos 这样受限的模型,由它们控制谁能访问。 而在另一方面, met 积极开源是因为它的收入来自广告,而中国实验室利用开源权重模型打入全球市场。 而这种分裂是永久性的,这是结构性的,由每家公司的盈利模式以及它们构建品牌所围绕的理念牢牢锁定。斯坦福一直在追踪它。 最佳闭元模型与最佳开元模型之间的能力差距在二零二四年和二零二五年大幅缩小,随后他短暂实现了持平,而截至今年三月,差距已再次拉大至约三个点,因为闭元实验室再度领先,领先者已多次遗主。 这就是一个竞争性的双层市场实际呈现的样子。这实际上意味着你不必在这两个层级中非要选出一个赢家,两者都将存在,两者都会持续变强。 当然,现在还有许多其他参与者,我没有再次展开讨论。微软、亚马逊 perplexity x 人工智能 每家都在下自己的注,要把它们都讲清楚,得专门做一集才行。但你要带走的是对人工智能市场如何悄然一分为二的理解。为何谷歌能独特地在这两班市场中竞争,反而 open 人工智能和 antropic 却走上截然不同的道路,以及这一分裂将如何塑造你极贵公司未来几年使用人工智能的方式。 一旦你清晰的看到这种分裂正确的提问就不再是哪个人工智能最好,并在你开始评估可用选项之前,先确定你的工作流程属于哪个层级? 我知道这期视频和我平时发布的很不一样,所以如果你们希望我多做这类内容,请告诉我。因为频道是为大家服务的,所以我保证会倾听大家的声音。事实上,整个视频的存在是因为你在詹姆斯视频的评论区里让我做的。 说到这,如果你想学习如何真正使用 j 八四,我会指向这边的这个视频,他将带你了解如何在电脑和手机上免费设置并使用它。 一如既往,感谢你把时间交给我,下次再见。保重。

谷歌出手了。二零二六年四月,谷歌把砸了数亿美金训练出的头部级 ai 模型 game 四直接放出来,完全免费。 arpach 二点零协议,全面开源,连个抽成协议都没签。 这不是技术扶贫,这是一场激烈的全面压制。先说清楚一个基本事实,今天的 ai 市场已经被硬生生撕成了两半,一半是闭源付费服务区, open ai and torbic。 这些公司把模型锁在服务器里,你按 token 交服务费,对小团队来说挺香,省去了买显卡折腾的麻烦。 但头部企业一算账就笑不出来。 airbnb 一个月在 a p i 上烧掉两百万美金,这根本算不过来。当你把模型塞进自己的 gpu 阵列边缘,成本只剩电费和硬件折旧, 比按次付费便宜十倍甚至上百倍。更关键的是数据隐私,你把公司核心机密天天往别人服务器上传,晚上睡得着吗?另一半是开源技术自建区,你自己搭场子配显卡,承担所有脏活累活,换来的是相当强的数据主权和极低的运行成本。 过去两年,国内团队在这个桌上疯狂胡牌,阿里通一千问 deepsea, 越知暗面搞出来的开源模型,性能猛的一塌糊涂,有些直接把 gbt 四全面超越。谷歌看明白了这个中局,他们用头部级的 gemini 在 闭源市场抢肉吃,转头用 gemma 在 开源市场疯狂圈地。 这不是双线作战, gemma 吃掉的是那些本来嫌贵,压根就不会用 gemini 的 企业。两套产品,吃两个截然不同的市场。 但免费放出模型,谷歌到底怎么赚钱?这里藏着三层相当犀利的算计。第一层,羊毛出在猪身上。你下载 jm 四确实不要钱,但几十 gb 的 压缩包塞进公司内网,用私有数据微调并发处理几万用户请求,你拿什么跑?你那台普通笔记本吗?必须上云! jm 从代码底层就被死死嵌在谷歌云生态里,在谷歌自家的 tpu 芯片上跑得相当顺畅,和云原声工具配合得天衣无缝。 模型是免费的,但跑模型的基础设施、高速公路按秒收费。谷歌云去年营收一百七十多亿美金,手里攥着两千多亿美金的代执行合同。 jam 四根本不是什么产品,它是一个巨大无比的漏斗,把所有想免费使用头部级 ai 的 企业,通通吸进谷歌云的算力计费表里。 第二层,物理隔绝竞争对手。先看外部,欧美大企业的 cto 四处一打听,发现市面上相当好用、性能相当强劲、成本相当划算的开源模型,全是国内研发的。这画面让谷歌非常紧张。 如果国内开源模型成了欧美企业内部部署的默认选项,谷歌丢掉的不只是几个开发者,是挂靠在这些企业背后的海量云基础设施订单,甚至可能因为合规审查,彻底失去这批头部客户。 gmus 横空出世,就是谷歌在欧美企业市场狠狠砸下的一面大旗。别折腾国内模型了,这儿有一个技术自主的北美本地替代品,企业级安全背书,完美适配你们用惯的谷歌云。这不是防御战,这是在竞争者的门缝还没撑开时,直接一脚把门堵死。 再看内部, openai 和 antroplex 的 核心利益就是卖 token、 卖订阅。它们的商业模式只有一个软肋,市面上绝对不能出现免费且性能逼近它们的替代品。 现在谷歌把无限接近前沿能力的 g m 四免费放了出来,就好比 openai 刚修好一条收费极高的私家高速公路,谷歌直接在旁边贴着重修了一条不限速的免费国道,还送你几桶汽油。谷歌的基本盘是广告搜索,庞大的云服务, 卖 api 赚的那少量收入根本不是营收大头。哪怕在开源模型上倒贴几亿美金,只要能把人圈进生态,这笔账就是赚的。但 openai 和 astropics 不 行, 它们的核心利益就是迈 token。 jama 四每强一天,币源 a p i 的 定价基石就松动一点,客户会拿着免费效果去质问人家免费都能做到这种程度,你凭什么收我这么贵?第三层,生态深度绑定与终极防御。 jama 四和旗舰版 gemini 底层架构是互通的,相当于保时捷把核心发动机技术稍微改改,装在大众高尔夫上免费提供。 当全球几百万程序员惊叹这免费的 gemma 四性能怎么这么出色,这种震撼感会无缝传到收费版的 gemina 身上,免费的都这么猛,花钱买的原版相当有性价比, gemina 变成了 gemina 相当强大的信誉引擎。但这还不是相当犀利的,今天疯狂下载 gemma 四熬夜研究参数写微调教程的是全球几百万年轻程序员 a patch 二点零协议意味着你拿它干啥都行,基本没有法律风险,入门门槛极低。这些年轻人现在可能只是辛苦打工人,但三五年后,很多人会变成初创公司的技术总监、 大企业的首席架构师,掌握着几百万、几千万美金云采购预算的实权人物。当他们面对 a w s e z 和谷歌云的销售代表准备签一份长达十年的基础设施大单时, 他会本能地倾向那个他相当熟悉、相当了解,甚至职业生涯早期就赖以成名的技术战。如果他当年就是靠改 jimmy 模型起家的,他对谷歌的 ai 接口、云原声工具烂熟于心,绝对不想重新去学一套别的东西。 这就是谷歌的公开策略,用免费的 jm 四绑定这一代开发者的习惯。今天你用我的免费代码,明天你就会用你的采购权来报答我。培养出一批忠实的谷歌派工程师,就等于在企业的技术心脏里安插了无数个忠实用户平台。战争打到最后,就是一场争夺年轻大脑的战争。 既然开源这招这么好使,为什么 openai 和 ospec 不 跟着抄作业?因为他们根本没有谷歌那个命。 openai 在 二零二五年八月突然发布了一个开源模型 gptos, 当时整个硅谷都沸腾了,以为奥特曼转性了。 但如果你仔细琢磨,这根本不是什么主动拥抱,而是面临巨大压力后的无奈反击。 deepstack 二一直接把英伟达股价击穿了,一天蒸发六千亿美金。 奥特曼赶紧跑到 reddit 上发帖,说,我们在开源这事上可能站错队了。嗯,这哪是科技霸主该说的话,分明是一个被吓坏了的商人在承认压力,但别高兴太早,这个 gptos 性能、充气量也就 gpt 四 mini 的 水平,跟真正的顶配差了十万八千里。 发布第二天,他们反手就推出了绝对闭源、性能炸裂的 gpt 五。 openai 的 开源策略就是扔两根骨头,安抚舆论核心利润,机器上绝对不让步。 anarch 的 做法更极端, 这家公司从成立第一天起,就咬死绝对不开园。二零二六年四月,他们搞出了个叫 cloud meta sock 的 内部模型,能在极短时间里找出全球几乎所有主流操作系统和浏览器里成千上万个关键安全漏洞。 astropica 感到这东西太危险,当场决定绝对不能公开发布。但他们搞了个叫玻璃盒计划的私密小圈子,只对微软、谷歌、苹果、亚马逊、英伟达、摩根大通等几十家头部巨头开放。 astropica 压根没打算争夺让模型更聪明。那波研究者, 他们通过发表相当硬核的安全研究论文,与政府合作,牢牢把控住了安全与对齐这部分研究者的心智。他们选择了一个只有币源才能玩得转的高端局。 三家巨头的姿态相当戏剧化。谷歌利用庞大生态两头通吃。 openai 一 边死守收费护城河,一边谨慎搞点小开源 and sopec 非常坚定锁死大门,只和相当高层的人玩高级游戏。 这场战争打到现在,已经不再是谁的模型相当智能这种初级问题了。 ai 市场的终局,其实早就注定开源和闭源会长期共存, 就像今天的手机市场, ios 和安卓,谁能消灭谁,长期不可能。斯坦福大学的数据曲线显示,二零二四到二零二五年,开源和闭源模型的差距疯狂缩小,一度几乎打平。结果到了二零二六年三月,闭源先行者们又突然发力,把差距拉开了约三个点。 这个互相超越的过程,说明谁也击败不了谁。两种模式会在互相竞争的过程中变得越来越强。对于普通企业,这意味着你必须马上停止问哪个 ai 模型相当出色这种外行问题。从今天起,你评估 ai 的 第一句话应该是,我的这个业务到底该进哪个区? 如果你是个几个人的小工作室业务,只是偶尔写写文案,做个总结,每个月几千块 api 费用就能搞定。别犹豫,直接买头部级闭源模型,花钱买省心,把精力全放在核心业务上。 但如果你的公司每个月要在 api 上烧掉几万甚至上百万美金,如果你的数据里全是客户隐私和公司核心资产,如果你需要把 ai 深度嵌入硬件设备底层, 这个时候如果你还不明智地去给闭园大厂交服务费,那就是在做无用功。你必须立刻组建团队,研究 jam, 四、研究 lema, 研究怎么把这些开源模型部署在自己的服务器上。这不仅是在省钱,这是在拿回你们公司在 ai 时代的相当强的控制权。 谷歌为什么把投入了几个亿美金的 james 免费放出来?因为他们看透了这个终局。他们知道,未来的世界不可能只有一种 ai。 他 们要在币源市场赚高预算客户的钱,也要在开源市场用免费的工具,把那些想自己动手的硬核玩家统统绑进自己的云生态里, 他们不是出手了,他们是比所有人都清醒。好了,以上就是本期内容,觉得有收获的点个关注,我们下期再见!

deepseek v 四正式上线。作为国产万亿级大模型的全新迭代版本, b 四不仅在产品能力上实现全方位升级,更通过架构革新、算力自主化改造,彻底改写 ai 硬件的需求结构,对 cpo、 gpo 两大核心赛道形成长期且深刻的影响。 相比上一代产品, deep sec v 四带来多项颠覆性升级。首先是上下文能力跨越式提升,窗口从一百二十八万 token 扩容至一百万 token, 可一次性承载约七十五万字文本,能够完整导入企业年报全套代码库,海量合同与科研文献 常文本理解、信息检测和逻辑分析准确率大幅提升,极大拓展了 ai 落地场景。其次,采用 ultra mo e 混合专家架构,分为一点六万亿参数 pro 版于两千八百四十亿参数 flash 版 海量整体参数下,单次任务仅激活少量专家网络,单轮推理计算量仅为上代的百分之二十七,运行效率大幅优化。同时, v 四实现成本的极致下探,推理综合省本仅为同类海外顶级模型的七十分之一, 大幅降低企业与开发者的 ai 实用门槛,加速谱绘化落地。更关键的是,模型完成底层生态切换,彻底摆脱英伟达 c u d 依赖,全面适配华为 c n n 架构 训练,一托国产生腾集群推理,搭载国产高端 ai 芯片,实现全链路国产算力闭环,综合性能对标海外高端算力产品。除此之外,智能体协助与代码能力显著增强, 具备落地办公、研发、专业服务等复杂场景的实操能力。在 cpu 板块层面, deep seek v 四的架构升级,直接扭转了长期以来 gpu 独揽 ai 算力的格局,让 cpu 从边缘辅助角色升级为核心调度中疏。传统大模型运行高度依赖 gpu 显存与算力, cpu 作用微弱。而猫异架构的核心瓶颈转变为专家路由调度、缓存管理、内存分配等精细化控制工作,这些正是 cpu 的 优势领域。模型将大量静态数据基础解锁任务剥离出高成本显存, 将由 cpu 内权统筹管理,大幅降低硬件使用成本。无论是服务器端还是端侧设备, cpu 需求都迎来增量红利。高端服务器 cpu 凭借更强内存、宽带与调度能力, 成为 ai 极权标配,电脑、手机等终端设备依靠 c p u 异构合作即可实现本地大模型部署。 国产鲲鹏、海光等 g p u 一 托国产 ai 生态协调发展,叠加海外厂商竞争格局松动,行业估值与订单预期同步改善, c p u 板块的长期价值被市场重新挖掘,对于 g p u 赛道,行业格局迎来明显分化, 英伟达的长期垄断溢价被持续稀释,国产 gpu 迎来黄金发展期。过去高端 ai 训练与推理高度绑定,海外高端显卡供给稀缺,推高产品溢价。 而 dipstick v 四通过混合精度量化缓存压缩、轻量化推理设计,大幅降低显存占用与算力门槛,中低端算力产品,国产 ai 芯片完全可以承接大部分推理需求,叠加全站国产化适配落地华为、升腾、韩五 g 等国产 gpu 完成顶尖大模型深度优化, 实际落地性能稳步追赶海外产品。互联网大厂与政企端采购开始向国产算力倾斜, 海外高端 gpu 在 核心训练场景仍有刚性需求,但纵涨空间受限,溢价逐步回落。整体来看, ai 算力不再单纯比拼硬件极限性能,软件优化、架构设计、生态适配成为新的竞争核心, gpu 行业从单一算力内卷转向多样化、国产化、高效率的全新竞争阶段。整体而言, deepsea v 四的迭代不只是大模型技术的突破,更是 ai 硬件产业链的分水岭。 cpu 迎来价值重估,国产 gpu 加速替代海外算力,垄断格局逐步瓦解。 随着低成本、高效率、自主可控的 ai 模式普及,算密产业链将迎来结构性行情,软硬件协调发展也将成为未来 ai 行业发展的核心主线。

ai 编程工具排行榜从拉到夯。第七名, open code 开源路线,适合爱折腾的人,但普通人上手没那么顺。第六名, win serve ai 编辑器体验不错,但风头基本被 curser 压住了。第五名 gemini c i 谷狗亲儿子掌上佳文和代码库,理解狠腔,适合中端党。第四名 pick up co pilot 老牌代码,副驾驶补全小改写测试都很顺。第三名, curser e i i 代表边聊边改代码,普通开发者最容易上手。第二名, code code 复杂项目多文件修改代码理解很强,像一个靠谱程序员。 第一名, openai codex, 自动化最猛,能读代码库,修 bug 写功能跑流程,已经开始向 ai 工程师了。一句话,日常开发用 cursor, 复杂项目用 clockcode, 工程自动化看 codex。

科技信息差之十二日科技晚报第一,鸿蒙六点一点一开发者版推送 harmony os 六点一点一开发者 beta 版本现已开启推送,首批覆盖机型包括 mate 六十系列、 mate x 六 pro x、 mate x t s、 畅享七零 x 以及 matepad pro 十三点二英寸二零二五款等多款设备。 需要了解,此次版本 api 升至最新的二十四,在上一个版本的基础上,开发能力全面提升,增强了 ability kit 的 上下文能力。而 qi 的 平行世界状态获取及动态布局容器等还新增了内容嵌入服务和相关企业安全服务。 此外,最近鸿蒙动作颇多,包括畅享九十系列、推送新版本 mate 八零系列备上放心功能等。第 二,变形机甲一拳碎墙语数科技发布了全球首款量产版载人变形机甲 g d 零幺。这台钢铁巨兽整机重量约五百公斤,采用高强度合金与精密四伏驱动系统,既能像人形机器人一样直立行走,上方还设有载人舱位,你可以直接坐进去操控。 更科幻的是,它能自主变形,往后下压,瞬间切换,四足不态,整个过程丝滑流畅,实测中一拳就能锤倒砖墙,力量爆棚。 第三, hyperos 四界面泄露一张据称属于小米 hyperos 四的系统截图在网络上曝光,截图显示,两种可选视觉风格,一种强调更强的透明效果,另一种则采用更柔和的模糊与清晰层次。外观与当前系统明显不同,被指向一种液态玻璃设计方向。 而且根据传闻,小米正在内测新的界面语言,可能引入更精细的透明质感、全新圆角组建、流畅动画和更强的界面深度。第四,天玑两纳米旗舰新手报 有博主曝光了某天机两纳米旗舰芯片的详细规格,采用二加三加三全大核架构设计, cpu 性能目标定的相当高,有望在单核和多核表现上刷新记录。 需要了解,它的缓存方面变化不大,但二级缓存稍有增大, gpu 规模相较于同级产品具备优势,并且支持原升级超真超分技术,光追性能和渲染效率都会得到增强。 第五, ios 二十六点五正式版推送这次带来了一项重磅更新, iphone 和安卓用户之间现在可以互相发送端到端加密的 rcs 消息,安全性直接看齐 imessage。 同时,地图应用新增推荐地点功能,会根据你的位置和搜索记录,智能推送感兴趣的地点。 此外,还推出了全新 pride lumens 动态壁纸,与 apple watch 表盘完美呼应。重点是这次更新更修复了五十多个安全漏洞,涉及图片、内核、快捷指令等多个模块,强烈建议所有能升级的设备尽快更新。 第六,已读访客功能永久不做。针对网上热议的微信状态访客记录,腾讯公关总监张军直接回应承认此前小范围测试浏览人数功能引发了误解,并向大家致歉。 随后他特别强调,关于已读功能和访客记录功能,大家反复表达不希望有,现在已经做出最终决定。这两项功能已正式焊死,不会开发,也永远不会提供。目前那个只显示浏览人数,不涉及具体个体的测试也已经停止,只能说试探失败。第七,光刻胶突破 上海人工智能实验室联合厦门大学、苏州国家实验室等团队,成功攻克芯片核心材料光刻胶树脂的稳定致备难题。 他们基于二零三零人工智能国家专项和书生科学大模型,构建了 ar 决策与自动化合成的全闭环研发体系,实现了高纯度、高一致、高效的 krf 光刻胶树脂自主创制。 该平台已支持多批次合成与验证,产品一致性显著提升,即将进入下游芯片制造客户验证,为全球芯片材料领域探索了标准化、可快速迭代的新研发路径。第八,龙芯三 a 六千全面开花 龙芯中科正式官宣龙芯三 a 六千桌面处理器在主流行业的出货量已突破一百万片。这款芯片采用完全自主的龙架构,自研 ip 合集国内成熟制成工艺,性能表现强劲, 而且目前已构筑起自主信息产业生态,在行政办公领域成为主流之选。在税务行业一托强劲性能和二进制翻译技术实现规模化应用,在教育行业也深度适配,全场景教学软件部署量超十万套。 第九,华为全家桶曝光据博主透露,新品包括 nova 十六系列手机、 mate pro max 新款平板以及超新星手表等产品都在路上, 其中平板采用十三点二英寸,且内置麒麟九系旗舰芯片。手机方面,大大杯重点升级超大底主摄,配备前后多光谱镜头和前望长焦,还加入无线充电,整体的期待值还是非常高的。 第十,编程五月榜来袭 tuntime 公布了二零二六年五月编程语言排行榜, python 继续稳居第一,占比百分之十九点九八, c 语言和 java 分 裂第二和第三。 值得注意的是,统计编程领域正在迎来生态整合趋势。二语言本月回升至第八位,追平历史最高排名。而过去很多小众统计语言和专业工具的排名正持续变化。最后,祝五月十二日的朋友生日快乐!以上就是本期消息,让我们下期见。

金凡确定搞一波大的小米重启 mike 大 会,同派 os 二六或 os 四,六月同派对垒鸿蒙与 ios。 这次时隔六年重启开发者大会,还直接把新系统提前到六月,和两大巨头同台,仅仅是换了个发布时间吗? 这场迟到六年的同台,本质是小米自研系统彻底告别过去的标志性一步。第一个升级是 u i 大 改,全面采用类液态玻璃设计思路,靠通透质感、深度光影和更丝滑的动画效果 提升系统的精致感。第二个升级是底层架构彻底重构,要做成小米首款,便宜了些,把 m i u i 时代的挪移代码全部清理干净。第三就是 ai 和折叠屏 o s。

好,我这几天深度体验了一下,用可老的接上这个 deepsea v 四 pro 之后的效果给我的感觉呢?怎么说呢,在之前最开始时候我用 tree, 我 觉得它非常好用啊,后来的时候我用 vsco 的 里面的 copec, 然后觉得那个非常好用,但是它现在已经出现限额了, 然后后面我用去了,用了 codex, 但是用的是中软战,给我的效果感觉也是一般化吧。直到最后,也就是最近一段时间,我接触到 deepsea 威斯,加上我的可乐扣的我这个组合真的是, 反正给我的感觉就一个字,太便宜了吧,真是太便宜了,可以给大家看一下。我这边的话,这场使用下来啊,就今天一天整整用了三千万头啃, 平均下来是三块四毛九,因为它有这个缓存命中跟未命中缓存吗?啊,有这个命中缓存跟未命中缓存 只用了三块九。三块四毛九,这个价格呢,平均下来每块钱可以换到八百五十七万的头根,这个价格我只能说真香,太香了。这你要是去用 xpt 五点五啊,或者说用 oppo 四点七,这个价格肯定是 太太香了,真是太香了。而且我实际应用下来,包括用克拉克的座椅,下来之后,我发现真的这样之后还挺好用的。当然他也有一个自己的问题吧,就是说他的那个 没有这个图像识别能力,但是我听说后续好像也在开发了,等到后面有这个多媒体功能的话,可能会更好一点,那基本上我感觉就相当于是我们的平替了。 然后这个用下来给我感觉呢,就是现在的算力啊,可能 g p c 公司他们自己想做的,就是去把这个算力打成跟我们以后电费一样的价格吧。我估计以后会这样子,因为他最后的时候不是用深层芯片吗?在下半年的时候大规模的投产,到时候这个价格肯定还会可能还会更便宜点。对, 看看我这边让他做的这个的话,做这个想法集吧,大概是用了十几二十分钟啊,包括前面的前啊前端设计,我是让那个吉米奶三点一 pro 给我做的,然后前段设计好之后,后端功能包括数据库啊,全部都是让这个这个 vc 来做, 然后整体做下来的话,基本上一遍就跑通了,然后你要有问题给他的话,他还能帮你改,基本上不会超过两遍, 而且你后期要什么功能他都能给你加上去。包括你把这个东西移植到我,把我现在做这个页面移植到我之前的那个项目里,他都是可以用的,而且 识别的非常快,然后做的非常准,所以实际体验下来还是非常不错的。我感觉跟我之前用 gbt 五点四差不多,但是你要说有五点五或者奥克斯四点七这种强度吗?应该是没有的,但是他真的便宜啊,是吧?这么便宜了还考虑那么多干嘛呢? 然后包括我这个坐下来这个想法集坐下来之后,是吧?谁可以输入你的想法?你好,把你的想法记录下来。你好,我是 叉叉叉啊,这些东西包括啊这些前端的话都是,呃,基于在三零一 pro 做的,但是后端这些功能包括它有个 ai 整个分析,还有 ai 表达优化,然后还有这个关联想法,这些 啊都是让第四个 v 四来做了,整整体做下来的感觉都非常好好,包括你后面接这些 a p i 啊什么的,他基本上都能帮你完成,也不会出现什么太大问题。如果这东西丢到车里面做,哼,丢到车里面做,那你这个提示词工程能力得非常的强大才行。对,提示词工程能力得非常的强大才行。 可以看到我们这个现在用这个扣的加 v, 呃,第四个 v 四我感觉是 比较适合那种呃自己搞个人开发或者说在方面感兴趣的人去使用。当然如果你大公司是吧,有些公司它会有这些 呃报销的,那你就去用 g p t 五点五 off 四,四点七嘛,反正公司有报销。但对于我们个人来说,平常如果只用用玩玩的话,我觉得 d b c v 四加上可洛克的真的是一个非常好的一个方案。

open i 再次炸了开发者大会,只用了四十五分钟,干掉了一众中间层创业公司,发布了四个重大更新和一系列的优化。一、 gpt 能力增强,推出了 gpt 四的 table 特性,包括了更快的速度,更长的上下文处理,达到了一百二十八 k。 它单次的输入生成文字可以达到五到六万个汉字,同时 api 的价格调至了原来的三分之一 二。 g p t。 也宣布了一个里程碑产品, g p t s。 一个人人都可以用语言构建定制上架到 g p t store 的一个创新平台, 首批就上线了七十个大模型的应用,有猜词、翻译,插股票等等的一些应用,所有的上传者还可以获得分成。如果说 gpds 的 turbo 你可以把它比作 iphone 的改良版,那么 gpd store 无疑是 open the i 成为苹果的关键一步。沙漠奥特曼还做了亲自的演示,怎么样去做出这样一个创建单多模态能力的更新。之前发布的 whisper 让你可以语音识别。这次把 darling three 和 t t s 两个能力发布,让所有的开发者可以用文本生成图片,用文本生成语音。 as the golden sun dips below the horizon casting long shadows across the tranquil meadow the world seems to hush and a sense of calmness envelops the earth。 把这样的创作门槛降到了极低。四、 为什么说干掉了一中的中间层创业公司,因为很多公司都认为 g b t。 没有知识库机器人的定制,吭哧吭哧做了知识库机器人。但这次 open i 自己下场,在 plus 里也直接可以创建自己的 ss 等机器人,直接返求你微调你的模型,让普通人都可以获得自己优化的模型。 机器人完成任务,正在研发中间层 bot 的一众公司正在瑟瑟发抖。当然还有一些眼花缭乱的让开发者欣喜的能力。像 assistant 的 api 的封装,支持持久的现成,内置对检查器,大妈解释器改进函数调用,可以让他支持多个命令的同时处理。 oppo i 又一次的让全球创业者沉默,开发者思考。但是由于中国的特殊环境,也许真的有创业公司基于这些信息差能跑出来呢?你觉得会是谁?又是因为做对了什么?欢迎留言。

小米去安卓化,硬钢苹果华为,往年六月只有华为和苹果召开开发者大会,这次小米也来了。作为国产厂商里唯一拥有人、车家全生态的厂商,两场急需一套更强大、更一级的系统,把手机、汽车、智能家居全部都打通。 懂行的都知道,安卓生态就是时尚代码,各自之间本不兼容。所以这次两场下血本打造澎湃 os 四,将大量增加小米自研代码,融入小米 hypercore 相关技术,甚至内置小米自研 ai 大 户型, 实现底层技术全面优化,进一步剔除米优时代残留代码,加速去安卓化进程,这是好事啊!但很尴尬的是,即便这样,澎湃 os 和红木六还是天差地别啊! 虽然澎湃 os 四有大量资源,可还是基于安卓底座为杨大人打工。如果像红木操作系统一样完全次元国产化,就会彻底改变当下局面。要想房子盖得高,还得地基夯得牢啊!实在不行,加入红木大的家庭,省时省心还省力,关注红木,感受不同!

百分之八十的人都混淆了 ai 的 几个概念啊,你要想玩转这个 ai 编程的话,那么你可以不懂编码,你可以一行代码都不会写,但是你不能把这四个概念给搞混啊, 第一个概念就是大模型,第二个概念就是这个 agent, 第三个概念是 skill, 第四个概念是程序 啊,就这四个概念呢,很多人都弄得非常的这个凌乱啊,我之前说这个引刀和扣子这些东西都已经过时了,都落后了, 然后呢,现在拿 club 可以 直接实现它们的功能,而且不需要拖拖拽拽。那很多人就跟我说,你拿 club 做的那个东西,那个 skills, 它不是每次都会有不同的结果吗?它是不稳定的,它不稳定的话这个企业就不会用,你的客户就不会用 啊,然后我这个就知道他们这个四个部分的概念是非常非常的混乱的,我重新给大家讲解一下啊。第一个叫大模型,大模型其实就是所谓的 jimmy, nike 啊,包括 cloud 啊, gpt 啊,包括咱们的 deepsea 啊啊,大模型就相当于只有一个脑袋,就脖子上面,只有脖子上面的东西, 然后呢他这个神经啊什么的出来的,就是他只能接外接一个身体,他才能做事情,要不然他就只能思考,就只能输入输出,你就只能问他问题,他给你答案,包括现在你们接的 api, 本质上都是问他问题,给你答案, 然后呢这个 agent 是 什么呢? agent 就是 cloud code, 还有这个小龙虾,还有那个大家所所说的爱马仕龙虾,包括这个腾讯的什么 qq 啊什么的,这些反正龙虾类的东西都叫做 agent, 这个 a 针呢,相当于身体啊,然后你的大脑他有输入输出啊,他产生的指令给到了手我才能拿东西, 对吧?给到了这个,我的这个给到了我的眼睛,对吧?给到我眼睛我才能看东西,然后给到了我的嘴,我才能吃东西说话,对不对啊?这个就是这个,这个执行层的这个 a 诊 啊。所以 agent 它就是一个身体的躯壳,没有大脑, agent 它是动不了的,所以 agent 它只有接上了大脑它才能动。然后呢? agent 它再强,你接了一个弱智的大脑,然后照样给你干不好活。这就是为什么你那个小龙虾如果接了 gpt 啊,或者说接了 cloud 啊,就会显得很聪明,对吧?如果你接了个什么 mini, max 啊 之类的这些啊,你就会感觉跟个傻子一样,对吧?这个人的人的这个行为能力还是由大脑去决定的,对吧?理论上大家有手有脚,什么都能干。然后第三个概念呢,就是 skills, skills 相当于一个操作说明书, 就是,呃,你的 skills 相当于所谓的 s o p 嘛?操作说明书啊,你给他一份操作说明书,让他照着这个说明书去干活,这个叫 skill, 但是 skill 还是需要他用大脑去思考这个东西怎么干的,所以不同的人,不同的,不同的大模型,或者不同的 agent, 他 干活的方法是不一样的, 明白吧?哎,所以这个就是 skill 它不太稳定的一个原因,不要太迷信 skill。 第四个才是程序,程序就是给你写死了就做成了产品,比如说你拿着一个灯泡,对吧?你拿了一盏灯,那它开了就是开,关了就是关,这是有确定性的,这是程。
