00:00 / 00:21
连播
清屏
智能
倍速
点赞258
00:00 / 03:28
连播
清屏
智能
倍速
点赞138
00:00 / 01:29
连播
清屏
智能
倍速
点赞6
根据2026年2月28日的媒体报道,您提到的信息基本属实。以下是关于DeepSeek V4发布的综合信息: DeepSeek V4 即将发布 发布时间:多家权威媒体(包括金融时报、IT之家、第一电动网等)于2026年2月28日报道称,DeepSeek计划于下周发布其全新多模态大语言模型V4。这将是DeepSeek自2025年1月20日推出R1推理模型以来的首个重大版本更新。 核心特性: - 原生多模态能力:支持图片、视频与文本生成功能 - 超长上下文窗口: reportedly 支持100万tokens以上的上下文处理能力 - 架构创新:采用Engram条件记忆系统、Manifold-Constrained Hyper-Connections (mHC) 和稀疏注意力机制 - 参数规模: reportedly 约1万亿总参数(MoE架构),每token激活约320-370亿参数 发布安排: - 下周发布时将同步公开一份简短的技术说明 - 约一个月后发布详尽的工程报告 硬件适配与国产化: DeepSeek已与华为和寒武纪合作,优化V4模型的硬件适配,预计这将大幅提振本土半导体需求,并推动AI模型推理环节向本土芯片靠拢。 reportedly,华为等国内厂商已获得V4的早期访问权限,而英伟达等海外厂商尚未获得类似权限。 市场期待: 业界普遍关注V4在编程能力上的表现,有报道称其内部测试成绩可能超越Claude和GPT系列,目标是在SWE-bench Verified基准上超过当前领先的Claude Opus 4.5(80.9%)。不过,这些性能 claims 目前尚未经过独立验证,仍需等待官方发布后的第三方评测。 值得注意的是,此前曾有预测称V4将在2026年2月中旬(农历新年前后)发布,但该时间点已过并未如期推出。此次2月28日的报道来自金融时报等权威媒体,可信度较高。
00:00 / 00:10
连播
清屏
智能
倍速
点赞1
Qiuming2周前
疑似DeepSeek V4基准测试泄露 疑似DeepSeek V4基准测试泄露,AI社区反响热烈但真实性存疑 昨日晚间,一张据称是DeepSeek V4模型的基准测试成绩图在网络上疯狂传播,迅速引爆了全球AI社区的讨论。泄露信息显示,DeepSeek V4在关键的代码能力评估集SWE-bench Verified上取得了惊人的83.7% 的得分,一举超越了Claude Opus 4.5(80.9%)和GPT-5.2(80%),被许多网友誉为“新王归来”。 除了编程能力的显著提升,泄露的图表还显示V4在数学推理方面同样表现卓越,例如在AIME 2026上得分高达99.4%,在极具挑战性的FrontierMath Tier 4上的得分更是达到了GPT-5.2的11倍。综合网络传闻,DeepSeek V4预计将支持高达100万的超长上下文窗口,并引入名为“Engram”的记忆机制,以实现真正的全仓库级代码推理能力。传闻发布时间锁定在所谓的“春节”期间,即今天(2月16日)或明天。 然而,这份引发狂欢的“成绩单”很快遭到了业内人士的质疑。有证据指出,泄露图中的AIME分数存在逻辑漏洞,因为官方评分系统无法得出99.4%这样的分数。更重要的是,评测数据集FrontierMath的所有方Epoch AI已明确确认,相关数据系伪造,因为仅有他们和OpenAI有权进行评估。这两个关键疑点使得泄露图的真实性大打折扣。 尽管“泄露”事件可能是场乌龙,但业内普遍认为,DeepSeek正在酝酿重大更新。近期,DeepSeek官网及应用已开始灰度测试一个新版本模型,其最大亮点是支持了高达100万token的超长上下文,可一次性处理《三体》三部曲体量的长文本。结合此前Information关于DeepSeek将于2月中旬发布新一代编程能力极强模型的爆料,此次灰度测试被看作是为V4正式版上线进行的“试点”。尽管真假消息混杂,但无疑再次将DeepSeek推向了全球AI爱好者关注的焦点。
00:00 / 03:35
连播
清屏
智能
倍速
点赞13
00:00 / 02:03
连播
清屏
智能
倍速
点赞21
00:00 / 03:06
连播
清屏
智能
倍速
点赞132
00:00 / 00:41
连播
清屏
智能
倍速
点赞NaN
00:00 / 02:36
连播
清屏
智能
倍速
点赞NaN
00:00 / 00:30
连播
清屏
智能
倍速
点赞144
00:00 / 00:09
连播
清屏
智能
倍速
点赞0