华为云短信证实！DeepSeek旧版服务将于3月7日下线，V4将于3月8日正式上线？#华为云 #深度求索 #DeepSeek #DeepSeekV4 #V4

deepseek v3发布时间

Name: deepseek v3发布时间-抖音
Uploaded: 2026-03-06T11:01:59+08:00Z
Duration: 31 s
Description: 华为云短信证实！DeepSeek旧版服务将于3月7日下线，V4将于3月8日正式上线？ #华为云 #深度求索 #DeepSeek #DeepSeekV4 #V4

发布时间：2026-03-06 11:02

汤贝酱

粉丝418获赞4157

相关视频

00:55
DeepSeek V4什么时候发布？ #小工蚁 #deepseek #开源大模型
查看AI文稿
AI文稿
反正 d p 大家都在等他，你不管是 v 四版本出来，他肯定会出来，大家可能还是耐心再等一等。我觉得他现在最主要的问题是没有算力。什么道理？就第一个，如果他把模型发布出来，如果他的效果很好，那么用的人很多的结果是什么？用的人很多的结果就是他的算力根本就不够。中国目前国产算力还是不行，还没有量产的问题在这，像最近那个 glm 五，它发布了这个模型，应该来讲在开元界还是属于比较好的那些模型之一。他发布了之后他会发现他的算力根本就不够，所以他不是给很多人道歉，说他有些买了他会员的那些什么用户啊，他可能就没有办法用什么 g l m 五，这临时不能用，所以让他们去退款这个道理。算力不够，我觉得 g p c 如果真的要发出来，他随时随地应该是可以发出来，只是他还是要准备好。我之前记得他们去年春节发布的时候，这样的根本就算力就不够，一会能用一会不能用，体验是非常糟糕的。
288小工蚁
02:53
盘点一周AI大事(12月14日)｜GPT5.2下周发布 Gemini 3 Deep Think正式上线
OpenAI下周12月9日发布大蒜模型GPT5.2，下月发布大葱模型GPT5.5全面吊打Gemini 3
DeepSeek开源最强推理模型DeepSeek V3.2
Mistral开源Mistral 3家族
OpenAGI发布最强电脑操作模型Lux
Runway发布最强视频模型Gen 4.5
阿里开源数字人直播模型Live Avatar
字节发布顶级图像模型Seedream 4.5
研究员推出3D空间音频模型ViSAudio
微软开源实时语音模型VibeVoice
Harmonic推出亚里士多德智能体，6个小时解决了悬赏30年的数学问题
#抖音知识年终大赏 #AI新星计划 #人工智能 #OpenAI #机器人
7117产品君
03:16
Deepseek新模型V4发布在即我们该如何看待 #Deepseek #deepseekv4 #openai #国产大模型 #AI
查看AI文稿
AI文稿
全世界都在等的 deepsea 微四版本终于快来了，它会是 ai 时代的拼多多吗？大家好，这是动力枪极速版，一个直讲前沿科技的账号。就在昨天著名的 ai 开发的社区 l 站上，有博主发帖称，自己正在内测的 deepsea 微四 light 测试版在本周二悄悄升级到了零三零二版，公开测试的部分成绩已经接近了美国 astonropac 公此基建模型 cloudsonnet 四点六，可以轻松地写出我的世界风格的游戏，相关的前端代码也非常的风格化。其他的测试人员也表示， deepsea v 四将在 app 和网页版首发，大概也是考虑到去年用户量激增对中国云基建产生的冲击， api 接口将暂缓发布，优先保证用户体验，要不然接口开了所有人一起用的话，又得跟去年一样挡机了。那么问题来了， deepsea v 四能不能成为下一个国运级的 ai 产品呢？答案是肯定的，因为大众对它的期待已经达到了历史的新高度，公众已经不允许它失败了。我们来看一组晚点统计的数据啊， deepsea 的中国用户粘性非常夸张，在春节期间红包大战和 cds 二零的冲击之下， deepsea 的用户使用时长在短时间内是暴跌的。但是随着其他厂家春节活动的结束， deepsea 的人均使用时长和使用频次又再次回升，回到了绝对第一的位置。再加上去年中国正体市场的推广，让大量的人手机里面都装上了 deepsea，这样的数据足以说明 deepsea 在中国是有绝对的基本盘优势的。第二就是 deep stack， v 四版本的能力没有拉垮，早在上个月的 ai 混战中， deep stack 就已经完成开发了，开始闭门测试了，有开发者和云浮厂商参与测试。根据测试人员透露信息，参数模型方面， v 四 light 版本估计为两千亿，而完整版的 v 四参数量可能突破一万亿，同时呢，也支持一百万 token 的上下文知识库也更新到了去年的九月份，在任务完成方面表现得更加出色。相关的测试也反馈啊，该版本在深层复杂的 svg、矢量图形等高难度任务上表现惊艳。 v 四版的性能明显是优于现有的网页端和 app 端的模型的各项泄露的跑分可以说是遥遥领先，然而却迎来了行业打假。部分媒体对流传的测试数据提出了质疑。新智源和多位技术博主的指出啊，网传跑分途中的数据存在硬伤，比如说这个数据竞赛得分在统计上是不合理的，权威机构也确认网传的数据是伪造的。然而面对泄露的信息和跑分传言， dpc 的团队选择沉默，没有进行任何回应。刚才我觉得啊 deepsea 团队还是一如既往的低调，他们是拿产品说话的。在过去两代模型里边， deepsea 一直在做一件事，那就是用工程能力把成本给打下来。在中美 ai 技术竞赛中，中国从一开始的技术追随者在两段时间内就走出了完全不同的路线。美国现在走的呢，是以 open ai、 algorithmic 和谷歌主导的高端技术路线，模型更大，训练成本更高，系统更封闭，但是呢，价格要更贵一些，可以理解为是资本密集型 ai。而像 deepsea， deepsea、 kimi， mini max 等公司在遭遇算力紧张的大背景下，思考如何优化成本。他们用上了专家混合模型架构，压缩推理成本，优化训练效率，最终结果就是百万投放的成本已经降到了接近一到两块钱人民币。虽然说相关模型的性能可能只有国外旗舰模型的百分之九十，但是它的成本却只有对方的百分之十，深受普通用户和重要企业的欢迎。所以啊，这个事就非常的，中国制造不拼谁最强，拼的是谁最便宜。好用这种方法呢，也打破了很多人的陈旧认知，美国在定义 ai 的上限，而中国正在定义 ai 的价格。东方商业历史，决定行业规模的不是上限，而是价格，这跟拼夕夕的逻辑是一模一样的，只有让更广大的用户用上了 ai，才能够继续谈 ai 技术突破和市场规模的事。所以啊， deepsea 微四版本，我既希望他快点来，又希望他不要那么着急。各位，你们期待 deepsea 微四吗？欢迎在评论区里面一起交流哦，记得点关注我们，下次见，拜拜！
1389动动枪极速版
01:37
这两个大模型到底有何特别之处？混元 T1 和 DeepSeek-V3-0324最新版，到底有何特别之处？#腾讯元宝 #腾讯混元 #Deepseek #大模型 #深度思考
156大模型烽火台
31:26
顶级模型PK - 到底谁是编程之王？顶级模型PK - 到底谁是编程之王？#DeepSeek #ChatGPT #Claude #Gemini#编程
1728马克的技术工作坊
08:38
DeepSeek低端逆袭当所有人都在比拼“大力出奇迹”时，这家中国公司却用“穷人家的智慧”改写了AI游戏规则！DeepSeek V3横空出世，性能直逼GPT却完全开源，训练成本仅有十分之一！这场“有限游戏”的胜利证明，创新从来不是资源的堆砌！#DeepSeek #AI #技术创新 #企业 #李善友
139李善友
01:39
重磅！Deepseek大幅调价50-100%不等，且正式发布v3.1版本，迈向Agent时代第一步…#DeepSeek价格调整 #财经 #最新消息 #北大博士
460北大博士财经日记
04:23
DeepSeek太适合MCP了！ MCP正在加速普及。同样地，我们也需要一个高性价比的模型来调用MCP。Claude-3.7 Sonnet很强，但真的有点贵。DeepSeek-V3-0324也许可以作为日常主力。
#人工智能 #AI在抖音 #MCP #DeepSeek
2291黄益贺
07:13
Deepseek V3.2 万星开源项目实测！，拒绝玩具de DeepSeek V3.2 号称首个把“思考（Thinking）融入工具使用”的开源模型，但对程序员来说，BenchMark 高不高没那么重要——能不能帮我在真实项目里省时间，才是关键。
这期我直接丢给它三场实战：
1、从 0 到 1 搭一个全栈英语学习进度记录项目：FastAPI + Next.js，带日历、仪表盘、学习时长统计，看看它在终端里能不能独立把活干完。
2、给我的开源爬虫项目 MediaCrawler 加一套 Web UI：考它理解 Playwright 异步架构、读懂现有仓库结构，而不是只会“从头重写”。
3、自动检索并修复项目里的一个真实 bug：让 DeepSeek 先 thinking，再自己查文件、定位问题、尝试修改代码。
视频里你能看到：它在 Claude Code 场景下的完整 thinking 过程、工具调用链路，以及和 Gemini 3 / Claude 4.5 在推理力、速度、稳定性上的真实差距——哪里惊喜，哪里让人想关掉窗口，我都摊开讲。
#DeepSeek #DeepSeekV3 #AI编程 #Claudecode #gemini
972程序员阿江-Relakkes
07:19
DeepSeek让大模型训练成本狂降90% #deepseekv3
2351LLM张老师学堂
06:28
架构大突破，DeepSeek-V3.2重磅发布！架构大突破，DeepSeek-V3.2重磅发布！成本暴降50%！原论文解读+模型特性介绍+DeepSeek稀疏注意力原理介绍！#ai新星计划 #抖音教育
631九天Hector
00:34
去年吓崩英伟达，今年 DeepSeek V4 要来了 #deepseek #ai#英伟达#互联网资讯
查看AI文稿
AI文稿
复工第一天， deepsea 在 get up 的大更瞬间勾起了华尔街去年的噩梦。去年它的 v 三和 r 一一亮相，就凭极致性价比震动硅谷，直接让英伟达市值蒸发六千亿，那就是大名鼎鼎的第几时刻。今年 v 四将至，春节前后 ai 圈彻底卷风了，智普 glm 五豆包二点零，阿里千问三点五， plus 立即上新，海外巨头也连夜放大招。而 deep seek 更猛，节后直接把 p r 版本从一百二十一干到五百三十六，皇家开发框架和插件，所有人都在等新一轮 diss 时刻，赶紧来。
380悠米讲AI
00:27
deepseek下周发布最新大模型V4
查看AI文稿
AI文稿
嘿嘿嘿，别关注伊朗了，看这里， deepsea 最新大模型 v 四将在下周发布，以前的大模型都是先给英伟达测试，而这次是先给咱们国内的华为测试，二四年 deepsea v 三发布带动整个科技飞了一把，而这次跟他相关的肯定起飞，国产算力大有可为。关注我其他消息下个视频说。
423乾哥（biubiubiu）
04:33
烧掉上亿元、股价过山车！ 2026大模型之战，谁是王者？ #DeepSeek #Kimi #千问 #大模型 #AI
查看AI文稿
AI文稿
朋友们啊，今年春节我没拜年，干了一件令人头秃的事，读完了所有头部大模型公司最新的论文和技术 vlog，发现二零二六大模型之战注定更加激烈，每两个月发一版新模型，每次烧掉上亿。智普 minimax 股价在上市不到一个月内翻了近五倍，又快速回撤。刚开年， kimi 和千万又发了最新模型，在权威三郎榜单欧瑞那里啊，马上超越了春节前刚刚上线的 minimax m 二点五和 deepsea v 三点二。到底谁在狂飙，谁在掉队？二零二六有哪三个重要的趋势呢？今天一期视频全说清楚将将。其实说白了，大模型就讲两件事，脑子好不好使，也就是推理深度，体能够不够强，也就是计算效率。而想让模型能走向通用呢，还得加上俩能力，多肽和 agent，也就是像人一样，去多维度的感知和自主的去执行任务。说到这，你会发现一件神奇的事发生了，大模型自动驾驶人形机器人的技术站啊，彻底同频共振了，都是感知、决策、执行。你看，大模型的多模态能力，负责感知推理能力呢，是思考和决策，而 agent 能力，正是控制与执行。所以今年啊，三个趋势非常清晰了。为了打好 a 阵这场生死之战，大模型需要先建好基础设施，所以第一步引入现行注意力。我们先花三十秒快速理解一下最硬核的部分，你就明白为什么没有它。百万 token 和实时多模态都不可能实现标准 transformer 呢？是把图书馆的一百万本书啊，全搬你桌上，一本一本对比和你提的问题有多相关，再根据相关程度给个权重去做加权求和。过程中操作次数就是一百万本书乘以一百万次计算。而现行注意力呢，是带着问题去看书，只记每本书。相比上一本新的东西，操作次数啊，降到了一百万，直接让模型的复杂程度降低了一个数量级。理论上啊，就能支持多一个数量级的长文本和原生的多模态，但实际上没这么简单。现行注意力啊，他有点走马观花，会丢掉细节，所以目前主流的方案是去混搭。像千万三点五就用的是三比一的交替组合限性和标准注意力，类似于广角镜头和微距镜头交替拍摄，兼顾宏观和细节，让模型计算效率最高能提升十九倍。紧接着第二个趋势就是大模型在做多模态和 agent，从会答题转向了会干活。千万三点五啊，在国内率先实现了原生多模态的 early fusion，也就是在预训练的时候，让图片和文字数据一起学，显著提升了跨模态的理解能力。而其他多数模型厂商啊，还在分别训练不同的模态再去做拼接。而最近估值刚刚超过百亿美元的 kimi 在主力押注 agent，像 kimi k 二点五的架构，能支持一千个 agent 并行工作。第三个趋势啊，是一个非常隐蔽的战场数据闭环。这不只是把用户和工作流的数据去反哺模型，像 timi k 二用 agent 去合成能用于训练模型的高质量数据，用 ai 去生成 ai 形成数据闭环。这意味着什么呢？以前啊，大模型拼的是 gpu 数量，现在拼的是合成数据的质量，如果能让 agent 生成的数据把自己的模型教得更聪明，可能十张卡也能打出一百张卡的效果。而始终贯穿这三个重要趋势的呢，是纯强化学习的训练下狗，大到深度思考多模态的训练 agent 的调度策略，小到数据标注和合成，都在用这个训练框架。纯强化学习是让模型不再去模仿人类来工作，而是告诉模型你想要的结果，让模型自己在大量的试错中去摸索出一条成功的路径，反而在很多场景中摸索出了人类都没有发现的解题策略。所以，今年的大模型啊，你只需要记住四个关键词，限性注意力。纯强化学习、原生多模态和 agent 这几大趋势又会带来什么重大的影响呢？首先，大模型会自带更强的 agent 能力，会去挤压第三方的 agent 和 ai 浏览器这类产品的商业价值和市场空间。同时，芯片层面呢，形成注意力、 m、 o e 等等架构，都降低了对上游芯片的风直算力的需求。但是啊，集群规模反而在扩大，同时 a 阵大量并行，对显存的贷款和互联速度提出了更高要求。所以单纯堆库大核心的性价比啊，正在降低。回看八年，大模型经历了三次范式转移，从二零一七年 transformers 加 scaling law 暴力堆参数，到二零二四年 deep seek v 二模型用 mo 架构轻巧地实现了千亿参数，从此 mo 成为了标配。而二零二五年纯强化学习让 deep seek 二模型实现了自主思考，震撼全球。而今年限行注意力加纯强化学习加数据，飞轮很可能开启新的 skill，令曲线纵使有三次变格，但我依然认为大模型是一个短期看产品，中期看技术，长期看飞轮的游戏。除了架构革命，高质量数据也同样重要。所以分析了这么多关键的结论是，具备独家数据和生态飞轮的公司将在下一场 agent 的战役中更加从容自如。所以，听完这期视频，你觉得哪家模型厂商最有机会留在牌桌上呢？我们评论区见。
130姜姜姜讲
02:39
9月29日，（1）Deepseek发布v3.2，API降本50%（2）寒武纪适配Deepseekv3.2，开源推理引擎#deepseek #寒武纪#科技 #国产芯片
57一击即中
01:02
Deepseek V3.2 EXP 版本出来了，主打稀疏注意力文本处理，继续降价，更大惊喜。
8554口罩哥研报60秒
01:58
DeepSeek模型怎么选？一条视频讲清楚！ deepseek大模型的封神之战！#deepseek介绍 #利用deepseek可以做什么 #人工智能 #ai工具
793玺哥说AI

deepseek v3发布时间

相关视频

热门分类