粉丝418获赞4157

反正 d p 大家都在等他,你不管是 v 四版本出来,他肯定会出来,大家可能还是耐心再等一等。我觉得他现在最主要的问题是没有算力。什么道理?就第一个,如果他把模型发布出来,如果他的效果很好, 那么用的人很多的结果是什么?用的人很多的结果就是他的算力根本就不够。中国目前国产算力还是不行,还没有量产的问题在这,像最近那个 glm 五,它发布了这个模型,应该来讲在开元界还是属于 比较好的那些模型之一。他发布了之后他会发现他的算力根本就不够,所以他不是给很多人道歉,说他有些买了他会员的那些什么用户啊,他可能就没有办法用什么 g l m 五,这临时不能用,所以让他们去退款这个道理。算力不够,我觉得 g p c 如果真的要发出来,他随时随地应该是可以发出来, 只是他还是要准备好。我之前记得他们去年春节发布的时候,这样的根本就算力就不够,一会能用一会不能用,体验是非常糟糕的。


全世界都在等的 deepsea 微四版本终于快来了,它会是 ai 时代的拼多多吗?大家好,这是动力枪极速版,一个直讲前沿科技的账号。就在昨天著名的 ai 开发的社区 l 站上,有博主发帖称,自己正在内测的 deepsea 微四 light 测试版在本周二悄悄升级到了零三零二版,公开测试的部分成绩已经接近了美国 astonropac 公 此基建模型 cloudsonnet 四点六,可以轻松地写出我的世界风格的游戏,相关的前端代码也非常的风格化。其他的测试人员也表示, deepsea v 四将在 app 和网页版首发,大概也是考虑到去年用户量激增对中国云基建产生的冲击, api 接口将暂缓发布,优先保证用户体验,要不然接口开了所有人一起用的话,又得跟去年一样挡机了。 那么问题来了, deepsea v 四能不能成为下一个国运级的 ai 产品呢?答案是肯定的,因为大众对它的期待已经达到了历史的新高度,公众已经不允许它失败了。 我们来看一组晚点统计的数据啊, deepsea 的 中国用户粘性非常夸张,在春节期间红包大战和 cds 二零的冲击之下, deepsea 的 用户使用时长在短时间内是暴跌的。但是随着其他厂家春节活动的结束, deepsea 的 人均使用时长和使用频次又再次回升,回到了绝对第一的位置。 再加上去年中国正体市场的推广,让大量的人手机里面都装上了 deepsea, 这样的数据足以说明 deepsea 在 中国是有绝对的基本盘优势的。 第二就是 deep stack, v 四版本的能力没有拉垮,早在上个月的 ai 混战中, deep stack 就 已经完成开发了,开始闭门测试了,有开发者和云浮厂商参与测试。根据测试人员透露信息,参数模型方面, v 四 light 版本估计为两千亿,而完整版的 v 四参数量可能突破一万亿,同时呢,也支持一百万 token 的 上下文知识库也更新到了去年的九月份, 在任务完成方面表现得更加出色。相关的测试也反馈啊,该版本在深层复杂的 svg、 矢量图形等高难度任务上表现惊艳。 v 四版的性能明显是优于现有的网页端和 app 端的模型的 各项泄露的跑分可以说是遥遥领先,然而却迎来了行业打假。部分媒体对流传的测试数据提出了质疑。新智源和多位技术博主的指出啊,网传跑分途中的数据存在硬伤,比如说这个数据竞赛得分在统计上是不合理的,权威机构也确认网传的数据是伪造的。然而面对泄露的信息和跑分传言, dpc 的 团队选择沉默,没有进行任何回应。 刚才我觉得啊 deepsea 团队还是一如既往的低调,他们是拿产品说话的。在过去两代模型里边, deepsea 一 直在做一件事,那就是用工程能力把成本给打下来。在中美 ai 技术竞赛中,中国从一开始的技术追随者在两段时间内就走出了完全不同的路线。美国现在走的呢,是以 open ai、 algorithmic 和谷歌主导的高端技术路线, 模型更大,训练成本更高,系统更封闭,但是呢,价格要更贵一些,可以理解为是资本密集型 ai。 而像 deepsea, deepsea、 kimi, mini max 等公司在遭遇算力紧张的大背景下, 思考如何优化成本。他们用上了专家混合模型架构,压缩推理成本,优化训练效率,最终结果就是百万投放的成本已经降到了接近一到两块钱人民币。虽然说相关模型的性能可能只有国外旗舰模型的百分之九十,但是它的成本却只有对方的百分之十, 深受普通用户和重要企业的欢迎。所以啊,这个事就非常的,中国制造不拼谁最强,拼的是谁最便宜。好用这种方法呢,也打破了很多人的陈旧认知,美国在定义 ai 的 上限,而中国正在定义 ai 的 价格。 东方商业历史,决定行业规模的不是上限,而是价格,这跟拼夕夕的逻辑是一模一样的,只有让更广大的用户用上了 ai, 才能够继续谈 ai 技术突破和市场规模的事。所以啊, deepsea 微四版本,我既希望他快点来,又希望他不要那么着急。各位,你们期待 deepsea 微四吗?欢迎在评论区里面一起交流哦,记得点关注我们,下次见,拜拜!


复工第一天, deepsea 在 get up 的 大更瞬间勾起了华尔街去年的噩梦。去年它的 v 三和 r 一 一亮相,就凭极致性价比震动硅谷,直接让英伟达市值蒸发六千亿,那就是大名鼎鼎的第几时刻。 今年 v 四将至,春节前后 ai 圈彻底卷风了,智普 glm 五豆包二点零,阿里千问三点五, plus 立即上新, 海外巨头也连夜放大招。而 deep seek 更猛,节后直接把 p r 版本从一百二十一干到五百三十六,皇家开发框架和插件,所有人都在等新一轮 diss 时刻,赶紧来。

嘿嘿嘿,别关注伊朗了,看这里, deepsea 最新大模型 v 四将在下周发布,以前的大模型都是先给英伟达测试,而这次是先给咱们国内的华为测试, 二四年 deepsea v 三发布带动整个科技飞了一把,而这次跟他相关的肯定起飞,国产算力大有可为。关注我其他消息下个视频说。

朋友们啊,今年春节我没拜年,干了一件令人头秃的事,读完了所有头部大模型公司最新的论文和技术 vlog, 发现二零二六大模型之战注定更加激烈, 每两个月发一版新模型,每次烧掉上亿。智普 minimax 股价在上市不到一个月内翻了近五倍,又快速回撤。刚开年, kimi 和千万又发了最新模型,在权威三郎榜单欧瑞那里啊,马上超越了春节前刚刚上线的 minimax m 二点五和 deepsea v 三点二。 到底谁在狂飙,谁在掉队?二零二六有哪三个重要的趋势呢?今天一期视频全说清楚将将。其实说白了,大模型就讲两件事,脑子好不好使,也就是推理深度,体能够不够强,也就是计算效率。而想让模型能走向通用呢,还得加上俩能力,多肽和 agent, 也就是像人一样,去多维度的感知和自主的去执行任务。说到这,你会发现一件神奇的事发生了,大模型自动驾驶人形机器人的技术站啊,彻底同频共振了,都是感知、决策、执行。你看,大模型的多模态能力,负责感知推理能力呢,是思考和决策,而 agent 能力,正是控制与执行。 所以今年啊,三个趋势非常清晰了。为了打好 a 阵这场生死之战,大模型需要先建好基础设施,所以第一步引入现行注意力。我们先花三十秒快速理解一下最硬核的部分,你就明白为什么没有它。百万 token 和实时多模态都不可能实现标准 transformer 呢?是把图书馆的一百万本书啊,全搬你桌上, 一本一本对比和你提的问题有多相关,再根据相关程度给个权重去做加权求和。过程中操作次数就是一百万本书乘以一百万次计算。而现行注意力呢,是带着问题去看书,只记每本书。相比上一本新的东西,操作次数啊,降到了一百万,直接让模型的复杂程度降低了一个数量级。 理论上啊,就能支持多一个数量级的长文本和原生的多模态,但实际上没这么简单。现行注意力啊,他有点走马观花,会丢掉细节,所以目前主流的方案是去混搭。 像千万三点五就用的是三比一的交替组合限性和标准注意力,类似于广角镜头和微距镜头交替拍摄,兼顾宏观和细节, 让模型计算效率最高能提升十九倍。紧接着第二个趋势就是大模型在做多模态和 agent, 从会答题转向了会干活。千万三点五啊,在国内率先实现了原生多模态的 early fusion, 也就是在预训练的时候,让图片和文字数据一起学,显著提升了跨模态的理解能力。而其他多数模型厂商啊,还在分别训练不同的模态再去做拼接。而最近估值刚刚超过百亿美元的 kimi 在 主力押注 agent, 像 kimi k 二点五的架构,能支持一千个 agent 并行工作。第三个趋势啊,是一个非常隐蔽的战场数据闭环。 这不只是把用户和工作流的数据去反哺模型,像 timi k 二用 agent 去合成能用于训练模型的高质量数据,用 ai 去生成 ai 形成数据闭环。这意味着什么呢? 以前啊,大模型拼的是 gpu 数量,现在拼的是合成数据的质量,如果能让 agent 生成的数据把自己的模型教得更聪明,可能十张卡也能打出一百张卡的效果。而始终贯穿这三个重要趋势的呢,是纯强化学习的训练下狗, 大到深度思考多模态的训练 agent 的 调度策略,小到数据标注和合成,都在用这个训练框架。纯强化学习是让模型不再去模仿人类来工作,而是告诉模型你想要的结果,让模型自己在大量的试错中去摸索出一条成功的路径, 反而在很多场景中摸索出了人类都没有发现的解题策略。所以,今年的大模型啊,你只需要记住四个关键词,限性注意力。纯强化学习、原生多模态和 agent 这几大趋势又会带来什么重大的影响呢?首先,大模型会自带更强的 agent 能力,会去挤压第三方的 agent 和 ai 浏览器这类产品的商业价值和市场空间。 同时,芯片层面呢,形成注意力、 m、 o e 等等架构,都降低了对上游芯片的风直算力的需求。但是啊,集群规模反而在扩大,同时 a 阵大量并行,对显存的贷款和互联速度提出了更高要求。 所以单纯堆库大核心的性价比啊,正在降低。回看八年,大模型经历了三次范式转移,从二零一七年 transformers 加 scaling law 暴力堆参数,到二零二四年 deep seek v 二模型用 mo 架构轻巧地实现了千亿参数,从此 mo 成为了标配。而二零二五年纯强化学习让 deep seek 二模型实现了自主思考,震撼全球。 而今年限行注意力加纯强化学习加数据,飞轮很可能开启新的 skill, 令曲线纵使有三次变格,但我依然认为大模型是一个短期看产品,中期看技术,长期看飞轮的游戏。 除了架构革命,高质量数据也同样重要。所以分析了这么多关键的结论是,具备独家数据和生态飞轮的公司将在下一场 agent 的 战役中更加从容自如。所以,听完这期视频,你觉得哪家模型厂商最有机会留在牌桌上呢?我们评论区见。