DeepSeek和混元四月预计同期发布重磅模型 国产AI模型的四月:DeepSeek V4与混元新模型预计同期发布 #DeepSeekV4 #混元新模型 #梁文锋 #姚顺雨 据最新爆料,中国AI界即将迎来一场重磅对决。DeepSeek V4和腾讯混元新模型预计将于2026年4月同期发布,这标志着国产大模型竞赛进入新阶段。 DeepSeek V4作为梁文锋精心打磨的多模态大模型,将在代码能力和长期记忆上实现重大突破。值得注意的是,DeepSeek团队近期的研究方向与V4的技术路线高度吻合。 今年1月发表的《Conditional Memory via Scalable Lookup》论文提出了“条件记忆”机制,而去年12月的《mHC: Manifold-Constrained Hyper-Connections》则聚焦底层架构优化,两者都直指Transformer在记忆和长上下文处理上的瓶颈。 更引人关注的是,DeepSeek V4将深度适配国产芯片,有望成为首个完全基于国产算力生态的大模型。与此同时,DeepSeek App的市场表现也令人瞩目,截至2025年2月累计下载量已超1.1亿次,周活跃用户峰值接近9700万。 腾讯方面,由首席AI科学家姚顺雨领衔的混元新模型同样值得期待。这款约300亿参数的模型体现了腾讯务实的技术路线。姚顺雨在内部明确要求团队“不要以打榜为导向”,避免因过度追求榜单成绩导致数据污染,转而专注于提升模型在真实场景中的稳定性。 技术路线上,两家公司展现出不同侧重:DeepSeek深耕长期记忆和多模态能力,而腾讯混元则强化上下文学习和Agent可用性。这种差异化竞争反映了行业对下一代大模型发展方向的不同思考,但共同目标都是让AI技术更好地服务于实际生产环境。 四月的这场“双雄会”不仅是一场技术展示,更是中国AI产业发展的一个重要里程碑,预示着国产大模型正从追赶到并跑的新阶段。
00:00 / 04:33
连播
清屏
智能
倍速
点赞15
00:00 / 01:47
连播
清屏
智能
倍速
点赞2534
00:00 / 01:48
连播
清屏
智能
倍速
点赞170