还没有到春节,梁文凤就要开始整活了。就在刚刚, deepsea 和北大联合发布了一篇论文,里面提到了一个条件记忆,也就是说引入了一种可扩展的查找记忆结构,在相等的参数和相等的算力条 件下,可以显著地提升模型在知识调用啊,包括推理啊,以及代码一些任务上面的这种表现。那 deepsea 也开源了记忆模块,叫 ingram, 我觉得很多人可能都已经去尝试下载来试了。你知道今天的模型迭代,其实我觉得到了一定的瓶颈,瓶颈在哪里?就是长文本的记忆功能,这个不仅是中国,其实在硅 谷现在也在解决这个事情,因为只有解决了长文本记忆,今天大家在说的智能体这个概念才有可能真正的落地。因为我们眼下用的智能体可能就只能执行简单的任务,但真正能够真的帮到我们的智能体,不是说你去帮我定个酒店,这些我也能做,而是你要能做我不 做的事情,那就是非常非常复杂的,包括今天大家看到的任性机器人啊,拿个杯子,你就说日常生活中我们拿个杯子是多么简单的事情,但是在机器人这里,它的整个思维链,它的整个推理的链路,它要拿个杯子是要经历很长的,所以这个东西的优化是 非常重要的。这就是 deepsea 今天推出的这一篇论文,它的含金量。我觉得我只是猜测 deepsea 的 v 四版本在常文本的记忆和推理上一定会有 质的提升。非常的期待春节能够给我们放一个大招啊。大家记得去年春节 tiffany 出来的时候,我当时非常的傲慢,那那篇视频我现在也没有删,我觉得我欠梁文峰一个道歉, 因为我当时真的傲慢到一定什么程度呢?我就觉得怎么可能一个中国这么小小的团队,可以做出媲美 open ai 的 一个模型, 定是蒸馏,就是各种傲慢叠加到他身上。但是经过这一年,我去到了很多的产业,去到很多 tob 的 场景,我发现真的大家都在用 deepsea 的 肌膜,都在用 m o e 架构去优化自己的模型,甚至连千万元宝豆包都在用,这说明什么?他确实做了零 到一的创新,在全世界来说,而现在中国的大模型市场,可能大家看到很多很多的模型啊,天天这个榜单刷刷刷刷不停,但是你会发现 tipsy 是 很少刷榜单的,而且它是真的在做研究的。 前两天我正好去了北大,跟他们的计算机系的一些博士和博士生导师聊天啊,我就说你们现在很多博士毕业了,以后你们会去到哪里呢?他说我们有一部分人留校了,但是很大一部分去了 deep sea, 你 们知道什么概念吗?这些人可不是做应用的人啊,他们是做基础研究,基础理论研究的人,就 是我们中国终于有了一个可以承载做基础研究的人的一个平台, deepsea 就是 一个很好的平台,你要知道这些人过去都是去哪的,去谷歌,去 open ai, 去硅谷的。说到这里我就觉得,嗯,梁文峰加油吧,春节期间我们可以加班,我们准备好了,是不是?
粉丝59.6万获赞426.5万

此刻全世界都在等一个人,他就是梁文峰。马上就过年了,要知道去年这个时候,因为 deepsea 的 出圈,让中国 ai 从此升了不止一个 level。 但现在中国 ai 大 模型竞争进入到了白热化的诸神之战阶段,与其他高调投入的巨头相比,梁文峰跟他创立的 deepsea 就 显得异常的低调和内敛。 发现了吗?无论是技术实力或者是战略选择,都像是一股清流般的存在,沉默的让人觉得他到底还在不在线,因为现在正是巨头烧钱争夺 ai 入口的时候嘛。嗯,又是那熟悉的配方头部,公司都疯狂的投入巨资,无论是现金红包也好,还是补贴或者做活动, 总之就是想尽办法争夺用户。每一个数十亿激励计划都不好意思说自己做大模型就是要抢占市场,快速的培养用户。那再来看看 deepsea 这种反差啊,公司不仅没有参与红包竞争,对于外界期待的新版本发布也是保持沉默, 但是这并不代表它没有东西喔,比如说它们近期其实也有实质性的一些技术动作,例如说将模型上下文长度大幅提升至一百万 token, 并且发布了有关 mhc 超链接和 ingram 记忆的技术论文,可以看出它的重心依然在底层技术研发。 这就解释了 deepsea 倾向于专注技术突破而非市场营销的风格。其实也许是他们没有变,是我们的期望值调整了。所以我们看到这两条并行的 ai 发展路径,一个是利用资金流量和场景优势, 通过应用和营销快速推动 ai 普及,争夺市场,而 deepsea 的 路径呢?回归技术本源,他就是个理工男,追求底层模型的突破、效能和创新。 应该是说,他们的目标可能是更侧重于长远的技术领先地位。但是话说回来,无论是哪一种路径,竞争最终将会回归到解决用户真实需求的能力上面。 还有一个值得注意的信号是,一项重研发的 deepsea 已经开始招聘产品经理了,所以即便是技术驱动型的公司,也在思考如何更好地连接用户,实现技术的最终价值。 所以这轮呢,不仅是市场之争这么简单粗暴,更是技术路径与商业哲学差异的体现。或许这也是对 v 四版本的最后冲刺准备的一种压力测试。那静态佳音吧。
