deepsea v 四一上线, ai 写作的分水领着来了,但它真的能帮你写出有血有肉的小说吗?用 deepsea v 四写小说,最大的优势就是在于它有超长的上下文处理的能力,这完全改变了长篇故事的创作逻辑。 这项能力呢,能确保长篇故事从头到尾的角色、情节和设定都保持高度的一致,不用再去频繁的核对和纠正。但是 它的写作能力和文风到底怎么样,就拿我们常用的细腻版来给大家做一个对比测评。我已经把 deepsea 微四 pro 的 所有的技巧、 避坑要点以及适配的提置词都整理成了专属的文档,有想要的朋友们评论区留言。就拿我之前写的一个短篇小说来说,我已经写到了第十张,我们来用 deepsea 微四一键续写一张来看一看效果。 提示词呢,我们选择橙子老师的一键续写一张番茄爆款。文风生成的速度也是非常快,我们来看一下他生成的文风,整体来说呢,是非常简洁的,基本上就是对话和情节描写,感觉说话和文风有一股机械味。你看他说的没错,周正说 也没有什么情绪描写,也没有什么环境描写,我整体读下来的感受就是他没有人情味,感觉就是很平淡,情绪的铺垫也不是很充分,也没有展现出人物的心理活动和情绪上的转变,感觉有点像机械写作,叫人有一点带入不进去。不过 确实人物的关系前后统一,人设保持的还是可以的,女主的人设大体上也没有跑偏,还是以复仇为主, 逻辑推演呢,也是比较严丝合缝的,推进感觉也很平滑。 deepscape v 四生成的就是比较简洁犀利的,没有一点废话,这一点可以使用我们的 ai 神稿会比较方便一些。 接下来呢,就是我们的细腻版,单看开头啊,生成的效果就已经显而易见了,情绪的切入点,高级环境的描写和人物心里的活动非常的细致,作为读者很能够带入进去。 deepsea 给人的感觉就是像在置身事外,你只是一个第三视角看故事的人。但是细腻版的情绪曲线堪称教科书级别, 完美的做到了层层递进,最终在卡点前释放并且升华。在整个复杂的过程中呢,情绪是非常饱满的,而且还是层层递进的,剧情和人物的素 造也是非常完美,人设剧情也保持的很好,完全没有机械写作的感觉,生成的字数也是要比 deepsea 要多。所以总结来说, deepsea v 四在逻辑上、一致性和效率上的表现优秀,但是感情深度、心理刻画、代入感和文笔细腻的程度还是细腻版比较好。 综合测评下来, ai 续写正文的话,还是用我们的 ai 神稿,一针见血,没有废话的成, 但是一定要记住搭配专属的题日词,才能让模型发挥最大的实力,不同的题日词生成的效果简直是天差地别。对 ai 写作感兴趣的朋友们,点赞关注私信我即可!
粉丝1519获赞1.2万

deepsea v 四 pro 王炸来袭啊!朋友们,万众期待的 v 四版本终于发布了,那么 deepsea v 四 pro 的 网文写作能力,写小说能力到底如何呢?今天我一条视频全部告诉你, 并且我整理了关于 deepsea v 四写作能力的注意事项文档,感兴趣的朋友们,我们评论区见。话不多说,我们直接进入正题啊,今天我从正文、大纲、审稿三个方向给大家来分析一下 deepsea v 四的写作能力到底是怎样的 啊。我先说结论吧,综合对比来讲是比之前的 deepsea 好 太多了,但是整体能力还是不如智慧版,细腻版还有氛围版,包括奇想版的整体效果。 直接来给大家展示一下生产的实际案例就明白了。我们可以看到啊, deepsea v 四 pro 已经上了二十四号刚刚发布的 deepsea v 四版本,那么我总结了一下呢啊,它有一个比较强的优势,就是发散能力比较恐怖,不过换句话说就是它不会做关于网文事项的正确判断,需要大家增添主要的大纲内容加以辅助。 我们直接跳转到创意工具箱里的大缸生成器啊!在这里呢,我们从 ai 模型里面选择我们的 deepsea v 四 pro, 给大家来实际操作一下,这里有很多大佬们预制好的提示词供大家选择,大家可以自行去尝试选择一个最适合自己的提示词 啊。我们这里拿以文成新老师的这个提示词来举例,比如说我去创作一个历史脑洞题材的小说大缸,大概的灵感呢?我们可以减速一下,比如说携带超市便利店系统穿越到 大明王朝这个世界观人设,这里我们就写一个两界导爷吧,这里我们都可以根据你自行的需求去填写,我这里就先不添了,直接给大家生成一下,展示一下 deepsea v 四 pro 的 实际生成效果。 可以看到啊,他现在就已经开始进行大缸生成了,那么主要的核心设定也给出来了,大家可以仔细的看一下。有很多朋友问,为什么我用官方的 deepsea v 四去生成的效果,很核心的一个点就是因为星月有非常多所适配的提示词, 这是直接去官方生成你没法拥有的,这也是 ai 写作真正的核心。如果说你让 deepsea v 四直接为你生成一部小说,基本上不可能的啊, 可以看到啊,世界观也给出了非常详细的内容,还给出了我们的主要势力,包括主角的设定以及反派的设定,全部都给出来了,这是我们之前所说的 deepsea v 四擅长的就是 已有信息点进行发散,比方说我们可能之前智慧啊,细腻啊,可能只给出两到三个角色, t c f a 四可能给到五到六个角色。我们再来看一下他的故事梗概啊,其实整体的内容呢啊,因为我给的题材并没有什么太多的创新点,所以说整体的内容我们可以看到还是比较平淡的。已 经开始到了卷钢规划,可以看到生成的字数是非常多的,来到了第一卷,包括的卷钢剧情也是给出来了,那我们就来等他生成完毕, 可以看到到现在为止他还在生成,那我们已经到了十一章的章纲了,我们这里就直接停止,目前为止他已经生成了一万三千三百一十七字,他还可以再根据这些文本接着往下生成,也是我们提到的他的发散能力非常强,我们这里呢,直接把它推送到我们的备忘录里, 这样我们之后就可以关联好我们的大纲,我们直接跳转到我们的作品页面啊,新建一个章节,来看一看他的正文字到底如何 啊,这里我也提到了啊,它的正纹生成的优点就是语言自然,长线稳定,量产高效,也是它生成的字数会非常的多,但是呢,它缺乏智慧版、细腻版、奇想版的人化感情,也就是我们所说的真人味儿,它容易越写越平, ai 味比较浓重,这也是 deepsea 最大的缺点,我们直接从 ai 写作这里选择我们的 deepsea v 四, 我们就不关联最近的章节了啊,因为我们前面的章节是与文本句型无关的,我们先选择好我们刚才生成好的备忘录, delete v 四,选择一套喜欢的句子,我们直接从本章句型这里简单来概括一下吧。根据大纲内容直接生成 番茄小说黄金开篇内容啊,在本章剧情这里,应该是放我们的戏纲或者是我们的章节主要内容啊,我所给的这些内容呢,一般是我们要加一个括号,在前面加上我们的主要剧情,这样的话生成的内容会更加好。我这里就不填写主要剧情了,直接让它生成,看一看效果。点击生成 我们使用的 deepsea v 四版本,这里的中文呢,就生成完了,我们直接把它复制到中文的面板里,我们来看一下中文生成的内容,可以看到所生成的内容属于是我们 ai 的 通病了,像这段的多余的形容词描述都是可以直接删除的,包括我们让他开篇对话入局也没有达到, 不过我们往下接着看,形容描述还是太多了,不过整体的剧情人设好像是立住了,包括这里我们的对话 他肯定也是完成了我们的要求,多对话内容。那整体往下看呢?系统出现的还是比较早的,生成的内容呢,可以说是中规中矩啊,不过 情绪拉扯给的还是挺到位的,我们简单可以看一下实际内容,缺点也是很明显,都不需要我多说,大家就明白了,我们一直放到最后,整体的文章是不是比较平淡,我们这里再用智慧版去生成一下,看一下和 deepsea v 四对比下来有什么区别。我们选择智慧版,点击使用 生成。智慧版一生成出来,我甚至还没往下看,但是开头我就已经感觉到了巨大的区别了啊,大家可以看一下这情绪冲突和生成的文本质量。所以说整体来说呢,智慧版、吉祥版和新一版还是要优于 deepsea v 四的生成能力的, deepsea v 四可以去处理一些我们接下来要提到的内容, 等它生成完毕,看一下生成的内容,进行一个对比。好,这里智慧版所生成内容也生成完毕了,大家看一下啊,生成效果我就不用多说了吧,对话的情绪,真人感,还有行文之间的剧情连接,包括情绪起伏,更加牛逼, 大家可以自行看一下效果。所以说推荐大家在生成正文的时候呢,还是去使用我们的智慧版、吉祥版、细腻版这些比较大热的模型,我们可以简单看一下生成的正文效果啊,非常牛逼,非常牛逼, 我真的不用多说了,大家自己看就能看出来,对比出来效果,只要你是懂网文的朋友。那么 g p c v 四我们可以用来干嘛呢?我们可以用来进行 ai 审稿, v 四的逻辑能力虽然比不上智慧版,但是它在审稿上有自己的键数,我来生成一下大家就明白了,我们直接从这里呢选择一个,呃,选择一个打分版, 来看一下这四个 v 四给我们这个智慧版生成的内容能评到多少分。可以看到啊, v 四的评分已经出来了,它给这篇文章综合评分给到了一个六十八,会根据我们的内容进行分向扒皮,包括我们的扣分点在哪,以及我们的爽点密度节奏的分析,包括信息节奏与趋势效率等等,这些内容 我们都可以根据他所诊断的内容进行更改,后面还会对开篇的核心段落进行一些改稿修正,我们都可以选择自己 喜欢的内容放到中文里,还会给你指出必改的硬指标。所以说每个模型都有自己的特点和优势,大家可以根据自己的喜好去选择,根据自己文章所需要的文风去选择搭配不同的提示词呢,则有不同的生成效果。对 a i c 所感兴趣的关注私信我即可。

deepsea v 四你们用了吗?我中高强度用了三天,我的核心感受就一个字,爽!但同时短板也挺明显的。今天聊一下,我个人感觉到了三个优缺点。先说优点,首先长文本是真的很强,我 十几万字的材料丢进去,权威哪里有标点符号的错误他都能给我标出来,而且真的是很快,基本文件一发送,那边马上就开始输出了。 v 四在省材料搭框架的工作里,效率提升是肉眼可见的。 然后第二是成本真的是很低,百万头肯的超长上下文中 kb 缓存占用只有钱袋的百分之十左右,我三天各种简单复杂的任务跑下来,花费还不到一杯咖啡的钱, 所以这一点目前市面上几乎没有对手,国外那些币源的模型瞬间就不香了。然后它是真正的国产芯片四倍的体系, b 四从一开始就围绕华为的升值做优化,跑通了中国芯加中国模型的闭环, 不是实验室的版本,而是你现在马上就可以用上,可以说是中国 ai 的 一个里程碑了。我只能说一句牛逼。 优点说完了,来说三个硬伤。首先,他的知识库还只到二零二五年的九月,甚至你问他他自己都不知道他自己已经是 v 四版本了,所以你想要获取最新的信息,只能联网搜索一部分,但纯靠模型本身 时效性,它就是一个硬伤。然后第二,它依然不是多模态的,还是一个纯文本型的选手。这个还是比较可惜的,毕竟现在友商已经是各种一键上传 ppt 啊各种文件什么的了,估计 deepstack 也在布局吧。最后,你说它赶超上国际上顶尖的那些模型了吗? 其实还是有一些差距的,官方自己也说跟全球最顶尖的闭源模型还有大概三到六个月的差距,但是我们看看价格,我还想说 v 四真香,所以结论很清晰, v 四就是目前性价比最高的纯文本助理。 如果你大部分工作室和文字文档或者框架打交道,那 v 四真的能帮你省下大部分的底层时间。剩下的你自己试一试就全明白了。

来了来了! deepsea 六月即将上线 v 四点一版本,这次终于是要把多模态这块最大的短板给补全了!新版本将彻底解决前代仅能处理文字的短板。原声搭载图像、音频双解析系统, 识图、听音、解析视频样样精通。它不光能看懂图文表层信息,连画面里的梗与隐藏情绪都能精准捕捉。 语音可分辨语气起伏,读懂潜台词。每期视频能串联画面音效,理清完整剧情跳出简单识别,实现真正的情感共鸣。 你甩一张草图,哼一段旋律,它就能生成完整的执行方案,彻底打破文字、图像、声音的感知壁垒。这次升级补齐的不只是功能,更是 ai 与人无障碍沟通的核心能力, 连你的沉默与情绪都能精准读懂,真正的智能写作就此开启!六月,我们一起见证国产 ai 天花板的新高度!

各位网文作者们,你们催更的对比视频又来了,前两天呢,我发了一个视频,对比了我们新出的 deepsea 微四和我们的细腻版本到底谁更香, 结果评论区里直接就炸了,好多朋友都在刷氛围版呢,氛围版也很好用。今天呢,我们就来对比一下我们的新宠 deepsea 微四和我们的写作王者 氛围版的写作风格,并且还有整理好的 deepsea v 四注意的使用文档以及避坑要害,想要的朋友们可以点赞评论区留言。我们都知道 deepsea v 四写作的逻辑很严密,剧情不崩, 而且擅长构建清晰的故事框架,角色卡和世界观,适合长篇小说后期的稳定发展。而且大缸和细缸的能力很突出,优势就在于它可以处理超长的上下文, 适合多线的叙述和大量的伏笔。既然他写角色卡的能力很突出,我们今天就来看一下用 deepsea 微四写出来的角色卡以及他的写作正文文风和我们的氛围版到底有什么不同。 我们在这里呢找到我们的创作工具箱,里面有一个人设生成器模型呢,选择 deepsea 微四,我们就拿末日丧尸题材来说,写一个女主重生后自带系统,而且我给了他第一二张的大纲,让我们来看一下他的生成效果。 很快啊,女主和女二的基本信息都已经出来了,而且还有我们的人物目标和人物湖光,甚至连女主的天赋技能以及口头禅都已经整理好了,我们复制到我们的备忘录里面,方便我们以后的使用。就拿我写了一半的末日文来说吧, 首先呢就要创建我们的角色,在这里找到我们的角色库,把我们刚才复制的内容在这里一键识别。第一个呢就是要测我们的 deepsea v 四的写作能力,我们 ai 模型选择我们的 deepsea v 四版本选择的是末日丧尸选择我们要出场的角色卡, 刚才我们已经建立了,这样非常方便。本章剧情呢,就输入我们的第一章的大纲提示词,选择已完成新老师的我们一键生成。你们看生成速度也是很快啊,看一下他给我们生成的内容,开头就是一个紧张刺激的环节,直接是交代了人物时间和背景, 而且后面的剧情一点也没有拖拉,非常的细节。哦,这里呢还会提示,我们到这里就已经写到了两千字了,这是系统更新了一个新功能啊,很贴心。整体看下来剧情也是非常的紧密, 跟我们的大纲内容完全是非常符合的。但是我们看一下他的文风,非常的简洁,基本上没有什么人物的心理描写,就只是简单对话和推动剧情的文字,并没有什么代入感。你看那你路上小心 顾寒清挂断电话就非常的简洁,感觉就像是在机械写作一样,给我的整体感觉没有什么代入感,我只是一个第三视角看故事的人,而且写作的文风还是比较 ai 机械的, 整体读下来的感受就是为了推动剧情而去推动剧情,少了一些对人物的形象刻画, 而且结尾的钩子感觉留的也不是很好,观众看到这里应该就已经走掉了,但是如果你要是写简约风,剧情不拖沓的文风还是比较合适的,像这类风格的网文作者可以选择我们的 deepsea 微四。 好了,接下来呢,就看我们的写作王者氛围版本依旧是故事题材,角色卡和本章内容,这些我都没有动,我们来看一下它的生成效果。哇塞,单看开头就已经看出来,文风确实是相差很大了, 时间、地点、人物都已经交代了,而且还有详细的细节描写和人物的心理描写,你们看他说话时的动作描写以及心理描写,文风非常的细腻啊。不同于 deepsea 微四的就是他的文风很细腻,交代的事情也很完整,而且在读的时候很有代入感, 脑海里就直接浮现了他们的动作神态以及紧张的氛围。结尾的这个沟字留的也是比较好的,叫人有想读下去的冲动,而且生成的字数也要比 deepsea v 四生成字数要多。总结来说呢, deepsea 偏简约风,文笔风格一般是偏直白和机械, 少的心理描写和细节的刻画,但是它的节奏快,剧情也是不拖沓,适合纯推动剧情。虽然代入感弱,结尾的勾也不是很吸引人,但是如果你要是写文风比较简洁的作者,可以去使用我们的 deep sake。 而氛围版的文风是比较细腻的,人物的动作、神态、心理活动都很到位,而且给人的画面感很强,让人读起来非常有沉浸感, 结尾的悬念也留的非常好,能够勾住读者继续往下写。简单来说呢,如果你要是写快节奏和剧情爽的,可以选择我们的 deepsea, 文笔要细腻且注重带入感的可以选择我们的氛围版。想要同款创作工具的可以点赞关注,私信我即可。

朋友们啊,我这个月断断续续的用了十亿透坑的 deepsea 微四,正好前几天 deepsea 宣布永久降价,也就是现在的二五折,我就给大家分享一下这个月我的使用感受。 首先第一个呢,就是 deepsea 的 缓存命中真的是特别的离谱,基本上一个绘画的缓存命中都能达到百分之九十五以上,甚至用一些方法可以达到百分之九十九以上。具体的方法我们下期来讲,所以它的调用费用真的是差了很多倍, 但光比价格可不行。 dipsic vs pro 的 能力虽然是位于国产大模型的第一梯队,但和国外的模型还是有一段距离要走的。 第二个就是它的上下纹长度有一兆,对比之前我使用的一些上下纹长度只有几百 k 的 大模型来说,真的是疏忽太多了,不用频繁地压缩上下纹导致细节缺失,基本上我的一些任务都能在一个上下纹窗口里完成。 第三个就是 deepsea, 它并不是一个多模态模型,没有图像识别能力就有点难受,但其实解决方法还是比较简单,接一个其他的 mcp 就 可以了,但对比 gpt 那 些多模态模型来讲,效果肯定是没有那么好。然后再给大家一个建议,就是最好不要来回的切换 flash 和 pro 模型, 一些专门适配了 deepsafe 的 agent, 比如 reasonix, 内置了随时切换模型的功能,我实测了一下,来回切换模型之后,缓存命中会降低。总之 deepsafe 真的 是算性价比比较高的大模型了,给我们提供了一个价格比较低但能力也不够的选择,还是很推荐大家来接入试一试的。

科技圈炸了,就在刚刚, deepsea 成了苹果笔记本上的永久免费声卡。谁能想到,国外的 reddison 创始人 andry rise 竟然亲自动手给中国 ai 鞋底层驱动。以前老外对国产模型是跑分看看,现在是不顾一切把它塞进电脑。 而他用一种极度疯狂的不对称量化,要把庞大的 deepsea flash 这个模型压缩进幺二八 g 内存的苹果本里。最离谱的是,他把一百万 token 的 缓存直接丢进了 ssd 硬盘。 这意味着你不需要什么昂贵的阿里云或者内存条,只要一台 macbook, 就 能在断网的状态下,让全球最强的编程助手为你通宵写代码,一分托管费都不用花。而当 ai 像水和电一样变得手到擒来,那么真正值钱的将不再是模型本身,而它与你工作流的深度融合。

deep seek v 四出来了,这次他引的文献居然是真的,不是瞎编的!于是你瞬间觉得自己又站起来了。导师催稿也不慌不忙,慢慢悠悠地拖,等到点了,你哐哐一顿输出,想让 v 四给你撸一篇完整的出稿。 结果倒好了,文献是稳住了,但里面那些 ai 到极致的段落连自己都看不下去。尤其是最近维普和格子达一个接一个优化升级, ai 率想要控制在合格范围内更是难上加难。 不过今天先来看看一篇优秀工整且 ai 率在合格线的范文是怎样的。不仅格式规范,排版工整,还有表格公式和图标。想要完成这样一篇出稿,其实没有你想的那么难, 先自己去织网,敲上关键词,时间范围收窄,到最近五年,挑十来篇顺眼的导出复制,存好别丢,然后让 v 四给你打下手,你就把文件和题目丢过去,让他帮你理理思路,搭个骨架,你只管复制保存。 最后把这些资料全都打包放进, ok, 毕业文献塞进去,大纲传回去,右边再把图标一勾,公式一塞,论文立马显得又扎实又像样。前前后后不到半小时,一篇格式好看,结构稳当,内容实在, ai 痕迹压得低低的,出稿就这么出来了。

big c v s pro 很 香对吧?但你不装 skills, 相当于买了台法拉利,只开市区,还没上过高速。我最近把全网翻了个遍,删了三十多个 skills 网站,最后能用的就三个。第一个,全网最大的 skills 仓库,一百五十二万个开源 skills 什么概念?你脑子里能想到的需求它全有,但大归大, 问题是质量参差不齐。上次我找个翻译 skill, 试了五个才找到能用的。适合什么人,你知道自己要什么,愿意自己挑,自己试的来。这就对了,不适合什么人,想即装即用,不想折腾的往下看。第二个, skill store 精品店,这个不一样, 里面的 skills 都经过审核,安装流程规范,不用担心踩雷,数量没那么多,但每个都能用。我最近几个主力 skills 全是从这装的。第三个 排行榜网站纯抄作业专用。你要是不知道装什么好,别纠结,直接上来看榜单,热度排序,质量评分,用户评价全列好了,我每周上来扫一眼榜单,看到感兴趣的直接装。最适合什么时候用,没想法的时候上来溜一圈,灵 感就有了。视频配套 skills 都准备好了,可以看一下,挑一个装上再走,不然明天又忘了二零二六年让 skills 给你打工。

我在 cloud code 里面使用 linux 微四 pro 写了一天的代码,那一天 talking 用了四点七二亿,关键是它命中的缓存非常的高,再加上它现在限时优惠,命中的缓存价格一百万, talking 只要两分五 啊,这个把整个模型使用的成本降得非常的低。下一期我会讲一下使用这四点七亿 talking 开发出来的一个工具,看看 linux 的 实力到底怎么样。

很多人都在问 deepsea v 四到底强不强?我今天不吹参数,不看跑分,也不复读发布会我直接告诉你, 普通人到底该不该用。因为现在很多 ai 发布最大的问题不是不够强,而是你看完一堆宣传,最后根本不知道它能不能真正帮你干活。而 d e e p s e k v 四这次最关键的其实只有五件事。第一件事, 它不是那种一夜图榜的模型,你别指望它刚发布就把所有顶级闭源 ai 按在地上打,但重点是它重新回到了第一梯队。什么意思?以前很多国产模型最大的问题是不稳定,有时候很强,有时候像失忆。 但这次 deepsea v 四明显开始往稳定生产工具走了,这很重要,因为真正能进入工作流的 ai, 不 一定是最炸裂的,而是你敢长期依赖的。第二件事,这次真正被低估的不是跑分,而是百万级上下文。 很多人还把 ai 当聊天机器人,但现在已经进入智能体时代了, ai 不是 陪你聊天,而是开始帮你读文档、拆任务、调用工具,连续执行。这时候上下问一短,问题就来了,任务做到一半直接断篇,前面说过的话,后面全忘。 所以 deepsea 这次把长上下文做起来,本质上是在铺 ai 工作流的基础设施,你现在可能感觉不到,但未来所有自动化协作 ai agent、 长链路任务都会越来越依赖这个能力。第三件事,很多人看模型只盯着 api 价格, 什么一百万偷啃多少钱,但真正做项目的人都知道,单价根本不是重点,重点是同一个任务, 你到底要改几轮?有些模型虽然便宜,但你改十次他都理解不了,最后头肯越烧越多。真正该算的不是调用成本,而是任务完成成本。 这也是为什么有时候贵模型反而更省钱。第四件事,很多普通用户最容易犯一个错误,所有任务都开最强模型,其实完全没必要。如果你只是写文案、做总结、整理数学、 多步骤任务、 pro 版本,差距就会慢慢出来。真正聪明的玩法,不是无脑上最贵,而是普通任务用快的关键,任务在用强的,这才是 ai 时代真正省钱的方法。第五件事, 也是最关键的一件事。 deepsea v 四真正值得测的,根本不是网页聊天框,而是智能体工具,比如代码助手、自动整理资料、知识库问答、 pdf 报告生成、自动化工作流。因为只有到了真实流程里,你才能真正感受到长上下文 工具调用、中文表达能力到底有没有价值。但这里我要提醒一句,很多人现在对 ai 最大的误解就是觉得模型升级以后就能全自动驾驶,其实并没有。复杂任务里, ai 依然不一定会主动选最合适的工具, skill 插件、外部调用很多时候还是需要你自己判断,所以它更像什么,像一个效率极高的协作者,而不是一个完全不需要人类的大脑。最后说一句, 这次 deepsea v 四真正重要的可能不是超越了谁,而是它在持续开源,持续降低门槛,持续推进国产 ai 生态。 这意味着国产 ai 开始从跟随慢慢进入,共同探索下一代智能。如果你平时经常写内容、读长文档、做代码、搭 agent、 跑工作流。我建议你认真试一下, 不是为了追热点,而是看看它到底能不能让你的任务更快完成。但如果你只是偶尔聊天,也不用焦虑,你不会因为没有某个模型就错过一个亿。记住一句话,模型排名只是参考,能不能进入你的工作流才是真正的关键。我是 ai 知识博主麦克飞 k, 后面我会继续用普通人的视角拆 ai 模型,拆 ai 工具,拆 ai 工作流。别迷信单个模型,真正的红利永远属于会把 ai 放进流程里的人。

what? 今天给大家带来一个非常有意思的项目, ds 四 dwarf star, 这个项目可以让你本地部署并推理 deepsea v for flash 和 pro。 这个项目是作者自己写了一个专门针对 deepsea v 四的推理框架,结合磁盘 k v 缓存和针对性极强的模型量化方案实现的。 作者给出的性能测试方面, m 三 max 一 百二十八 g 的 吐词速度可以达到每秒二十一至二十六,属于是相当可用的水平,不但如此,还能同时支持一百万的上下文,简直是不可思议。当然我们之后会实测,看看这些是不是吹牛。 安装部署的部分我就跳过了,现在 ai 这么发达,你只需要丢给 ai, 只要一两分钟就可以部署完成,不过模型下载需要一些时间就是了。这里我使用的是 q 二杠 q 四的 deepsea v4 flash 模型,模型的大小是九十一 g。 部署好之后,我们来到 ds 四的文件夹,使用这个命令就可以进入项目自带的 a 帧模式。 注意,我这里自己用 ai 写了一个 vlog, 用于把整个九十一 g 的 模型和一百万上下文,总计九十三 g 的 内存锁住,以防其他应用把模型挤出内存导致降速。上下文我是拉满了 一百万。在 agent 模式下,硬盘 kv 缓存是项目自己管理的,所以我们不需要额外设置。此时我们可以看到内存的占用是来到了一百零六 g。 好 了,现我们就可以和 deepsea v for flash 对 话了。 我们可以看到目前的吐词速度是二十四点五 topos 每秒,符合项目的预期。这里完全没有加速推理速度处于非常可用的状态。 下面是 serve api 的 介绍,这里使用 d s four dash server 命令,同样我设置了一百万上下文端口,指定八千零八十八。 这里硬盘 k v 缓存需要指定一个文件夹,并且指定大小。这里我给了六十五 g 硬盘。 然后我们让 herme c 政策来调用本地 api。 这里我也是已经配置好了。我预计是要有 cloudops 4 八的新闻。这里首次 preview 速度稍稍有些慢之后,命中缓存速度就快多了,结果里的确有 cloud ops for 八,不错不错。最终总结一下,在使用了几天后,我可以很负责任地说,这个项目的 deep seek v for flash, 在 推理的逻辑链上,还有智能体任务的深度上,还有知识的广度上,完全碾压千万三点六的二十七 b 稠密和三十五 b 稀疏模型。 同时按照经验, deepsea 团队之后也会放出 v 四点一、 v 四点二或者 special 等更强的迭代,到时候这个项目也会支持。

deepsea 刚刚发布了它的新旗舰模型 deepsea v 四 pro, 但是评价褒贬不一,有的朋友觉得它特别好,有的朋友觉得不够好。今天我们就拿它和早几个小时发布的 gbt 五点五以及早几天发布的 cloud op 的 四点七做一个诚实对比。 实测到底 deepsea v 四 pro 做到了什么程度?我们会从 ai 编程的前端、后端以及写作能力综合对比这三个模型。友情提醒一下, deepsea v 四 pro 是 一个开源模型,而其他两个都是目前最好的闭源模型。好,废话不多说,我们开始 在开始对比之前,我们首先看一下这三个模型的价格。可以看出来, deepsea v 四 pro 输入要比 gbt 五点五和 cloud 四点七便宜三到四倍, 它的输出呢,更是能便宜到大概七到八倍左右吧。第一题,做一个高端的 sas 网站,产品是简化版 notion 笔记软件,风格极简、现代,高级,有产品感,要有各个必要的部分。这里呢,以防大家不知道 notion 这个笔记软件大概的风格是什么样子呢? 这是 notion 的 官网,当然我并不奢望 ai 能生成这种效果,一下子对吧,可以看出非常的复杂,非常的漂亮。首先我们看一下 gps v 四 pro 给出的答案,第印象这个网页就是一个简洁的科技风对吧?跟我们 notion 那 个风格和字体大差不差,有简单的互动。 然后每个模块应该都是有照顾到的 好的,可以说它完全按照了我们要求去做,但是整体的设计感和美感呢,感觉还不是很惊艳。我们先来看一下 gbt 五点五。 gbt 五点五这边首先第一印象就是它设计感比 d sigma 四 pro 好 一点,然后我们往下拉,它也有基本的交互,然后每个模块呢,也都是有的, 而且它的风格呢,也是字体跟 notion 大 差不差,所以它也是符合了我们要求。现在我们看一下 cloud opera 四点七, cloud opera 四点七这个页面呢,非常有设计感,交互也都有, 可以看到这个产品演示的区域,直接演示一个完整的笔记,这个是非常好的, 每个模块都是没问题的。好的,那这里呢? cloud opera 四点七,毫无疑问设计感微感最好的,比 gpt 五点五和 deepsea v 四 pro 要好不少, 其中呢, gpt 五点五比 deepsea v 四 pro 要好一点。第二题,做一个杂志风的 ai 新闻专题页,主题是二零二六年的 ai 大 模型,竞争 风格要向高端的数字杂志,要排版强,阅读体验好,有视觉冲击。而这里就是纯纯比拼前端的设计感和美感,生成网页好看与否的能力了。我们先看一下 deepsea v 四 pro 给出的答案。首先第一项,这个页面非常的不错,这个数字杂志这个设计语言还挺统一的,我们往下拉, 嗯,可以看到有相应的图标,还有不同的这样的近速图,格式也有变化。 我觉得 d p c 这里做的相当的不错,而且是风格语言非常的统一。现在我们看一下 g p t 五点五, ok, 第一印象设计不如 d p c 个 v 四 pro 好, 有些俗气,这个颜色有些混乱,再往下拉,嗯,下面的还是不错的, 嗯,也有不同的元素啊。整体来说,相比 deepsea v 四 pro, 我 觉得它是不如的,各种元素并没有很好的融合在一起,而且有些混乱。现在我们看一下 cloudop 四点七, ok, 第一印象非常的好,我们往下拉, 这就是我脑中的这种啊,数字杂志应该有的样子,可以看到各种特效,各种效果都做出来了,非常的好看。你不得不说 cloud, 你 默认情况下,它出来的网页都是一种风格的,但是这种风格它就是很好看。 ok, 这里非常不错,也有页面的互动。 嗯,好,那这里毫无疑问呢, cloud op 四点七啊。最后是 gpt 五点五。 第三题,我们还是看看生成页面,这次让它生成一个珠宝的跨境电商独立站,要求风格高级,时尚奢华,适合欧美市场。我们首先看一下 deepsea v 四 pro, 给出答案, 首先呢,第一印象是很不错的,完全符合我们的要求。然后呢,可以看到各个的 section, 各个的模块,它也是都有的,也有价格的区域。 ok, 没有问题,整体来说是非常不错的,符合要求,但是也谈不上多么惊艳。现在我们看一下 gbt 五点五,第一感觉是有些不如 gps 路由 pro 的, 比方说这里设计语言就有些不统一,对吧,就上面的条目和中间的大标题,感觉有些突兀,往往下拉, 各个相应的模块应该都有的,然后交互也都是可以的,没有问题。 ok, 整个的模块它也是按照我们要求去做了,但是呢,设计只能说是中规中矩。现在我们看一下 cloud opus 四点七,第一印象设计感非常的好, cloud 真是一招鲜吃遍天啊。车距远差不多,但是确实不错,很好看。我们往下拉 ok, 整个比较高端大气啊,明显比其他两个做的更好一些了。 嗯,互动也更加丰富,也更像是一个成品的跨境电商的这样一个网站。而这里呢,毫无疑问, oppo 四点七还是做得更好一些。那 deepsea 呢?比 gpt 五点五要好一些。 现在我们总结一下这三个模型的前端能力,那无论是设计感、美感还是交互 cloud, oppo 四点七明显是要比 deepsea v 四 pro 和 gbt 五点五要好的。其中呢,在这四个中, deepsea v 四 pro 我 认为比 gbt 五点五要好一点。 isoppy 公司由于给的额度非常吝啬,同时有种种限制,我真心希望其他的厂商啊,尤其是像 deepsea 这样的开源的厂商,能够在接下来的版本更新中钱的能力冲上来。好的,我们还没有测完,我们现在要把我们刚才的笔记软件 补充成一个完整的 app, 我 们测试一下这三个模型的 ai 编程后端能力。题目如下,当前项目已经有了完整的前端,请你做好后端实现这些功能,注册登录笔记、展示、创建笔记、编辑笔记、保存笔记、删除笔记。 然后呢,再次基础上,我们还给第二个要求,就是要支持搜索功能,支持回收站和恢复,支持公开只读分享链接,未登录也可以打开查看,支持自动保存,支持标签、支持置顶和取消置顶这些功能。我们看看他们三个完成的怎么样。首先是 deepsea v 四 pro。 好的,这是 deepsea v 四给我们做的 app 了,我们这里先看一下注册是不是成功点击创建一个账户,然后这里啊,我们创建一下好了,我们来到了笔记的界面,这里我们首先创建一个新的笔记, 然后我们简单测试一下,没有任何问题,然后可以看到它自动的保存了,也没有任何问题,这里我们再创建第二个笔记, ok, 还是自动保存了,我们现在刷新一下网页,看看自动保存功能,管不管事, 没有问题,两个还都在这里,那么这里呢,我们删除一个笔记没有问题,看,我们去看垃圾箱,删除的笔记还在这里,我们可以 restore, 它就回来了,这些呢也没有问题,那我们搜索一下,可以搜索功能也是可以的,没有任何的问题。 好,现在我们看一下这个 tab 加标签的功能,我们加一个标签,比如,然后我们点击二零二六,就会发现他自动选择了这个标签,也是没有问题,到目前为止一些功能都 ok。 现在我们测试一下他的置顶功能,把这个笔记置顶, 点击 pin, 它确实置顶了啊,这里完全没有问题。最后一个功能,我们测试下它的分享链接的功能,我们分享一下链接,点击 share, 得到这个链接之后,我们来到另外一个浏览器复制链接, 我们确实可以浏览这个笔记。好的,那么 dpc 可比四完美的完成了所有的任务,没有任何的疑,我们看一下 gpt 五点五给出的答案。首先我们点击注册, 我们新建一篇笔记,没有任何的问题,我们再新建一篇笔记,这里我们刷新一下网页,看笔记有没有自动的保存,自动保存了, ok, 现在我们删除,看它有没有进入回收箱。 确实进入了,我看能不能恢复,我们点击恢复, ok, 这个也没有问题,现在呢,我们对它进行置顶, 然后呢,我们加入 tags, 也就是加入标签,点击标签,只有这个出来了,然后我们测试它的公开分享功能,得到了这个链接,我们去一个新的浏览器, 好,可以看到 gpt 五点五也完美的完成了所有人,好的,现在我们看一下 club opa 四点七交出的答卷,我们还是去注册。 进来之后我们新建一篇笔记,然后我们再新建一篇笔记,这里我们刷新一下网页,测试一下自动保存功能, ok, 然后呢,我们删除一篇笔记,看到垃圾箱有了,然后我们当它 restore 回复,好的,可以看到它又出现在这里了,那现在呢,我们再试一下,比方说置顶功能, ok, 然后呢,我们添加标签, 我们点击标签就会出现,选择我们这个标签下面的这一个笔记了。好的,我们现在再测试一下它的分享功能, 然后我们去另一个浏览器里面打开这个分享, 完全没有问题,那么搜索功能呢?好,那这样的话 called opa 四点七也完成了所有的任, 我们现在对比下三个模型的文案写作能力,请写一条适合直接发布的自媒体帖子。注,提示,迭代思维要求像真人写的有勾子,有观念,一定启发性,不要空话,不要鸡汤。 首先是 deepsea v 四 pro, 别总想憋大招,那是在给拖延找借口。我做账号的一个月,每条视频烂到我半夜惊醒,但是我坚持发烂不可怕,可怕是你烂都没做出来。看完数据顽固绿茶就砍。开头点赞少就凯旋题。迭代不是缝缝补补,而是每次用真实的反馈给自己动手术。现在回头看,让我们脸红的垃圾反而是我涨粉最快的梯子。显瘦下去再爬起来姿势才好看。其实不错,只是有两句有些假。 什么每条视频烂的我半夜惊醒。这个是有点太夸张了,我们看一下 gpt 五点五怎么写的。真正拉开差距的,从来不是想清楚再开始,而是开始之后还能不断改。很多人做事卡住,是因为上来就想做最终版,要选题完美,方案完整,表达高级,越想做越不敢动。迭代思维不是粗糙,是先做出能跑的版本,然后用真实反馈修正它。 你写的第一个文案才知道哪里做错。你发第一条内容才知道你会关心什么。你做第一个产品才知道需求是不是为需求。世界不会奖励脑子最完美的计划,他奖励那些不断拿现实教准自己的人。先完成再优化,先上线再打磨,先拿到再反馈再搞高级。我以前有个毛病,什么事都先想清楚再动手,后来发现这是反的。很多事情不是想清楚才能做,而是做出来才能想清楚。脑子里推演一百遍,不如真做出来一个粗糙版本,它会暴露你之前根本想不到的问题。所以 迭代思维就是先做个差的再改好这么简单。它的核心是承认一件事情,你第一次判断大概率是错的,越早把它扔去验证,损失越小。别怕底板烂,怕的是你为了让底板不烂,永远没有底板。这三个文案呢?我觉得 gpt 五点五是写的比较好的,因为它有几个句子确实写的很有说服力。 其他两个呢? g p c v 四 pro 有 几个句子比较假, cloud opera 四点七呢,写的比较平淡,没有什么说服力好的。下面这个题还是对比两个模型的写作能力。请写一组推广文案,主要是介绍新的人型家务机器人小家, 输出一个短标题,一个短文案,一个行动引导,要求有吸引力,但不要浮夸,不要低级营销,不要空话,不要解释,直接给结果。我们先看 g p c v 四 pro 给出的答案。 做家务的是家人了,人性机器人小家用灵活的双手接住所有琐碎,衣服洗净,叠好地板,无声擦亮,晚餐提前就去。你回到家只需要感受松驰,把家交给小家预约,体验相当的不错,而且它重点突出了功能,非常有诱惑力。 小佳,把家还你,扫地、收衣、洗碗、归位,这些占用你下班两小时后的事情,小佳都能接受。身高一六五,能弯腰,能上楼,能记住每件物品该放的位置,你不必教他太多,第一周他在观察,第二周他已经领路,现在预约享受首批用户的两周免费试用。感觉重归重举吧,没有很惊艳,而且还有些啰嗦, 没有直击要点。那我们看一下 gpt 五点五给的文案。把家务交给小家,把时间还给自己。小家是一台为日常生活设计的人形家务机器人,还能整理房间,清扫地面,收纳物品,也能根据你的习惯完成。重复琐事不是为了炫技,而是让家少一点负担,多一点从容,现在了解小家看还能为你的家分担什么? 就这个文案来说, deepsea v 四 pro 写的非常好,它的功能介绍非常的自然,很有诱惑力。然后 gbt 五点五的文风更好一些,它俩算是打平,都比 cloud opera 的 四点七要好。好的,我们总结一下,在价格方面, deepsea v 四 pro 最有优势,它的输入价格仅是其他两个的三分之一到四分之一,而输出价格仅是其他两个的七分之一到八分之 一。在使用体验和推理速度上, gbt 五点五明显快于其他的两个。在前端能力上,我们可以看到 cloud opera 四点七还是最好的。 g p t 五点五和 deepsea v 四呢,相差不大,距离 opus 还是有一定差距。后端能力,它们三个都圆满完成了任务,当然也可能是我给的后端还是太简单了。 文件上 g p t 五点五和 deepsea v 四写的都不错。哎,这两个题做的既然都比 opus 四点七好一点,这个是比较惊喜的。还有很重要的一点我并没有提到,就是现在大家都很看重的 agent 智能体能力,也就是调用工作帮我们操作电脑,完成任务,自动执行任务的能力。 那么这个呢,我会在自己长期的体验中慢慢的进行对比,然后我会第一时间给大家说我的想法和结果,最后也希望包括 deepsea 三的所有开源模型都能快快更新,越做越好。好的,我们下期再见。

deepsea 隐藏的功能价值,你绝对没发现,它把分享变成了一件既能帮人又能赚钱的事,藏着一个能颠覆思维变现的隐藏玩法。过去我们和 ai 对 话,想分享给别人,你只能截图或者整个静态链接分享,别人只能看,没法对话。现在不一样了,你可以画好几轮对话,一键生成链接分享出去。 最绝的是对方点开链接,可以直接接着你的思路,和 ai 继续深聊,而你完全看不到他后续的内容。你分享的是一个认知切片,一个灵感,而别人可以站在你的灵感上继续思考,却不用担心隐私。这 哪里是分享聊天记录啊,这是把静态的截图变成了动态的思想接力。你分享的不再是一段文字,而是一个认知起点,一个思维助推器,一个思维框架, 一个好想法,从此可以被人不断传递、演化、发芽。而每个拿到接力棒的人,都在自己独立的轨道上思考。当你的灵感可以被风装传递并独立生长,未来的价值交换就拥有了新的代替。关注我,价值翻译官,帮你翻译价值,看清前沿 ai。

呃,非常吓人家,人们,昨天我用 deepsea 开发了一个量化策略网站,只花了三块钱人民币,便宜到荒诞,有感觉吗?给你们看一下网页和代码,这就是我做的量化平台,首页的话就是各股的股价,点进去呢,可以看到 k 线图,还可以放大哦, 还有它的主要功能就是这个策略实验室啊,可以进行一个回测的运算,我们随便输一个, 随便选一个,这些我都不懂,我随便选给他一百万吧, ok, 看到这边会展示他的收益,年化收益,最终的资产现在变成三百多万了,然后底下的话是资金取现,还有下面他做的交易的记录, 这些所有的内容都是他自己设计的,我一个字都没参与过。这个是他给我的一个产品文档,这是一个面向 ai 投资者的 a 股量化,然后这个就是代码前后端, 后端用的是 python, 前端用的是 vue。 当然其实用大模型做开发早也不是一个。呃,新鲜事了,就实话实说, deepsea 能写出这个网页来,我完全是很意内,但是真让我震惊的是,居然只花了三块钱, 那我想如果要我自己去做这个开发的话,怎么也得半个月到一个月啊,因为我都完全不懂量化嘛,有很多知识要自己去学习啊。但是 deepsea 的 话呢?哎,它只需要三个小时,三块钱。 最后看一下我 dp 的 消费记录,这一天我是写代码的,花了两块钱,昨天花了一块钱,今天花了二毛九。

deepseek v 四这次真正值得看,不是参数,而是一百万上下文。 mo 和 agent 资料显示, v 四有 pro 和 flash 两档, pro 走旗舰能力, flash 走高效率路线,两者都指向一百万 token 上下文。 对普通人来说,这意味着长文档代码仓库会议记录和知识库有机会一次进入任务现场。再加上 mo e 复杂任务走便宜快路经, 它不是简单替代聊天框,而是在把长任务 agent 变成更低成本的工作流读资料,拆任务,调工具写结果再修正。但别急着封神,独立评测还需要跟上。 真正值得叮的是,如果他跑得稳,跑得便宜, ai 竞争会从谁最聪明变成谁能把聪明模型用得起用得久。

作为机构一手调研副总的忠实粉丝,今天我们继续来学习他的视频。今天盘中消息,国家大基金领头 zip 投钱估值四百五十亿美元,若融资成功, zip 将成为中国 ai 大 模型史上首轮融资规模最大的公司。 看到这个消息,让我想起副总解读 deepsea v 四发布的视频。这一期视频主要针对 deepsea v 四预览版发布的情况进行解读。视频主要分为五部分,第一部分, deepsea v 四的真实现状。第二部分, deepsea 降本增效会不会立空算力。 第三部分,国产算力适配的真实进度, deepsea 部分, deepsea 的 真正定位。第五部分, 升腾产业链的发展节奏。第一部分, deep sea v 四的真实现状。先讲第一个,也是最大的预期差, 四月二十四日正式发布的 v 四只是一个预览版,不是最终版。大家近期看到的所有评测,所有跑分都是基于这个还没打磨完的版本,真正的正式版要到下半年才会推出。那这个预览版到底怎么样呢?第一,性能 属于国内第一梯队,但和海外顶尖还有差距。 v 四 pro 在 国内极限能力和稳定性都比其他国产模型强,但和国外的 g p t 四点五壳老的比还是有差距,主要是领域知识不够深,细节处理容易遗漏。 第二,核心竞争力不是性能,是极致降本。这才是 v 四真正杀疯了的地方,它保留了自研的 gpu 和显存消耗,直接砍到了原来的三分之一, 价格有多夸张? v 四 pro 是 g p t 四点五的六分之一,是 cloud 的 七分之一, v 四 flash 又是 pro 的 十分之一,算下来整体价格只有海外顶尖模型的六十分之一到七十分之一。 第三,未来还能再降百分之六十至百分之八十,这还不是底?专家预计,等到四季度升腾九五零超节点批量上市之后, v 四 pro 的 价格还能再降百分之六十到百分之八十,最终 pro 能降到每百万十元 token 以下, flash 能降到每百万 token 一 元以下。很多人问发布第二天就打二点五折,是不是要打价格战了?根本不是。 官方搞这个十天优惠,核心目的只有一个,快速收集海量用户数据,用来做后训练,这样下半年推出的正式版能力才会真正上一个台阶。 第二部分, deepsea 降本增效会不会立空算力?这是近期讨论最多的问题,也是最大的一个悖论。很多人说模型效率提升三倍,那需要的 gpu 就 少了三分之二, 算力租赁和算力硬件不就完蛋了?其实这个观点在 deepsea 二一发布的时候就出现过,后来被算力租赁持续高景气的事实彻底正伟了。今天再次给大家讲透背后的逻辑。首先,大家要搞清楚,中美大模型的发展路径完全不一样, 美国是力大专飞,人家高端算力管够,想怎么堆就怎么堆,根本不用考虑成本。中国是以巧补力,我们拿不到最顶尖的英伟达芯片,国产算力下半年才会放量, 在这个青黄不接的窗口期,我们只能在软件上下功夫。几乎有一个非常经典的结论,谁跟你说 ai 要靠软件优化来省成本, 恰恰说明硬件不是太多了,而是太缺了,没人会闲着去优化无关紧要的东西。正是因为短期内硬件供给跟不上,才不得不倒逼软件勤俭节约。第三部分,国产算力适配的真实进度。接下来讲第二个核心,运气差。 deepsea, v 四和国产算力不是完全划等号的, 很多自媒体说 v 四发布,我们彻底摆脱英伟达了,也有人说还是全靠英伟达,国产算力没用,这两种都是极端错误的。我给大家讲清楚, 训练端和推理端是完全分开的,进度天差地别。音训练端目前仍高度依赖英伟达。 v 四的完整预训练用的还是英伟达的高端算力,毕竟英伟达 b 二零零以上的芯片还支持 f p 四精度量化, 这是我们目前比不了的。国产算力的训练端适配只在 v 四 flash 版本做了小规模验证,还没有全量部署。训练端的难度是推理端的两倍以上,目前只做了半年, 全部完成还需要一年时间。第二,推理端已经基本完成国产适配。推理端的适配从二零二四年底就开始了,花了一年半时间。现在 v 四已经完美支持华为升腾九幺零 b 九幺零 c 九五零芯片, 韩五 g 的 部分芯片也适配好了,预计今年下半年升腾九五零超节点落地后,推理成本还会再降一大截。所以结论非常明确, 短期英伟达高端算力还是刚需算力,租赁行业的高景气会持续,中长期国产算力会先承接推理端需求,再逐步向训练端渗透,两者不是替代关系,而是并行发展,互相补充的关系。 第四部分, deepsea 的 真正定位。近期所有机构的会议都提到了同一个市场痛点,资本市场完全误解了 deepsea 的 生态位。很多人觉得 deepsea 的 目标是打败 g p t, 做全球第一的大模型,其实从 v 三点一、 v 三点二开始,它的目标就变了。 deepsea 现在的真实定位是开源大模型龙头,国产算力生态的铺路者。他不再单纯追求模型性能的第一,而是转向了技术普惠和生态适配。他第一个在训练端导入国产芯片,帮华为解决了升腾芯片适配的各种痛点。他把大部分技术都开源了, 让全行业用国产芯片的门槛大幅降低,这才是它真正的战略意义。第五部分,升腾产业链的发展节奏。这也是大家最关心的,先给大家一个结论,升腾链真正的出货释放,要等到下半年。博主给大家一个机构确认过的最准确的升腾九五零出货时间表。 第一,升腾九五零 pro, 四月进入量产,五月底完成产能爬坡,六月出货量达到六万克以上,九月超节点规模出货。第二,升腾九五零 d t, 这是性能更强的版本, 七月开始测试,十一月中旬正式出货。那么长期空间有多大?二零二五年,升腾芯片出货了六十万片,今年机构预期是一百二十万片 翻一倍,明年预期是两百四十万片,再翻一倍。国内还规划了五年实现每月五十万片先进制成的破产计划。还有一个非常重要的变化,升腾的商业模式要变了,以前升腾芯片不对外卖,大厂只能买整机,下半年产量充裕后, 华为会推出共享生态,引入分销商卖芯片,这会彻底打开升腾的市场空间。同时因为原有厂商能跟不上升腾链,在背板、连接器、模组、液冷这些环节都引入了新的供应商,这些新进入者现在讲的就是从零到一的故事,弹性会非常大。 介休从零, deep v 四只是一个开始。国产 ai 的 路还很长,短期可能会有波动,但中长期的趋势已经非常明确了,要看得远一点。

哇,这个 deepsea v 四 pro 实在是太强了,我真的强烈推荐你们用,我给你们演示一下子。我们用 v 四来启动一个 ai 系统,启动中,正在进行自检,正在检查热点面板。 你们看,他调出了一个全球热点追踪系统,你们看这个过程完全没有加速,反应很快,而且所有的操作都是正常,没有报错。启动之后他一直在检查,在质检他的系统, 还能够打开视频。最近发现一个好玩的,国外的小博制作的一个专属资讯,他刚刚在检查他的视频模式,然后检查完之后他就关闭了。可以看到右上角这里他显示都已经检查通过了。我们来看看他到底能干些什么。你看看今天的抖音热点,看看有哪些好玩的。 抖音今天重头戏基本是硬新闻,轻松一点的有个尼克斯三比零骑士, nba 季后赛尼克斯横扫骑士,还有个男生变帅简直易如反掌。大概是穿搭改造类的内容, 要说好玩的话,就这俩还算轻松。要不要我把那个变帅的视频拉出来看看?关掉吧。 嗯,你找一个小樱说关于伊朗经济的视频。 嗨,来,朋友们,今天我们来聊一个神秘而又混乱的经济体。你老了。

嘿,大家好,欢迎来到节目。今天我们要体验的是搭载 m t p 技术的 deepsea vis flash。 如果还不了解 m t p, 它是一种褪色性解码策略,允许你通过猜测 j s j p 来的几个令牌来提升推理性能,而无需实际运行琢磨性。所以它只是在顶部增加的一个额外层,能让我们获得额外的令牌。从技术上讲,结果应保持 g s 光 百分之一百的准确性,因为较小的槽模模型会提前选出这些令牌,然后主模型以 p 处理模式运行,将它们整合在一起,一次性完成。这要快得多。如果你 chant 还不知道的话,生成速度通常不如提示词处理速度快,后者更快并验证正确性。如果正确就保留继续。如果不正确就必须回溯时间,然后再包含 m t p 层的主模型上重新运行,整个过程耗时更长。所以 deep q 其实在第三版就引入了 m t p, 而现在在第四版中,我们提取出了这些层,并将展示由此带来的性能提升和增益。 为了节省大家时间,左边是未开启 m t p 的 d p z v 四 flash, 可以 看到它的速度为每秒三十一点一五个 token, 这是在制作一个 flappy bird 的 html 右侧,这里已开启 m t p, 数值是三十七点三。如果你想了解这些统计数据,就在这里了,省去你时间。 接下来我们看看实际表现以及逻辑上的差异,准备做几项测试。稍后我会展示一个写故事的例子,在 v 四 flash 版本未开启 m t p 时得分为三十二点九,开启 m t p 后达到三十三对吗? 看来写故事时 m t p。 所做的猜测不如代码场景那么准确,对于编码任务效果较好。可能是因为可选范围较小,而写故事时提示词可以极具创意,因此很难让草稿模型猜中主模型最终选定的缺陷。领牌, 我们在现场冲泡一次这个测试,我先删掉这两段,然后逐个运行,并顺便教大家如何自己操作。先把这数据记下来吧。你看,我们现在已经能稳定超过每秒三十个领牌, 这是针对 deepsea v 四 flash 的 特殊实现,它支持工具调用等功能,这些都是你期待的特性。 我发现基础版有点小毛病,存在不少错误,所以让他正常工作花了些功夫。总体来看,精准得分约三十一。之前有一次特别好的运行,达到了接近三十三, 现在可以看到波动很大,有时飙升到四十,有时会跌到二十五,也有跳到三十五的时候,整体上下起伏不定。 我想这是因为主模型正在验证草稿模型所选的令牌, m t p 层不断需要回速重新执行, 有时运气来了,就能达到那四十个令牌的特别速度。所以理论上,如果草稿模型能百分之一百运行,并通过主模型的验证,我们或许能达到每秒四十个令牌的速度。 现在 dpv 四 flash 的 mtp 层是三点六 gb, 所以 这是一大块层。这个模型本身也非常庞大。查看内存差异,其用 mtp 时占用一百五十三点五 gb 内存,禁用 mtp 时为一百四十九 gb, 确实需要额外四 g 币内存。但如你所见,这里提升微乎其微,仅多出每秒一个令牌虽然不错,但当模型以每秒三十一个令牌的速度运行时,这点优势并不算太惊艳。不过在制作 flappy bird 游戏时,可以看到禁用 m t p 的 情况下,速度稳定在每秒三十到三十一个令牌左右。 起用 m t p 后,有时可以看到它每秒生成的令牌数飙升至四十以上。所以我想在编程方面可能的令牌选择会更少,他可能会选错,尤其是在编程中,你可能会选中一个不同于预期的变量名。 但是潜在的 token 你 知道,语法结构很明确,选项不多,除非你想彻底乱来。平均来看,我们能达到每秒约四十个 token, 有 时 boost 更高,有时会略低,整体升成一千。可 token 是 不带, mtp 是 三十点五。这次没遇到特别好的情况,加上 mtp 确实有明显提升, 所以性能提升了百分之二十。现在让我们开始一个完整的演示。 所以我这里有三 d 俄罗斯方块,它将产生近六千个令牌,速率为每秒三十点七个。内存方面,它占用了一百四十八点五 gb 的 内存。那么让我们看看禁用 m 七 p 时的效果吧。我们有一个有趣又特别的俄罗斯方块, 加上 m t p 后,我身上跑了两次不同的版本。我运行了基线 m t p 转换,实际上是 q 四点三版本。因为 deep sea vs flash 的 权重本身就是压缩过的,所以它们已经酝酿化好了,所以只需提取这些权重,直接提取这些权重的话是三点六。 我还用 q 三版本试了一下,我想试试换个不同的 m t p 或者进一步量化,因为之前用困式效果不错,那个用 q 四效果不错,没必要上更大的 q 九 我都搞定了。所以开启 m t p 后,我们得到了三十六点二,所以在完整编辑代码方面,性能仍有百分之二十的提升。正如你所见,它生成的代码接近五千个 token, 所以左边是三 d 俄罗斯方块。我们拿到了带 m t p 的 版本,看起来非常相似,现在结果不一样了。所以,如果你并排查看代码,即使两者根据模型自身的评估都达到了百分之一百准确率。 他人身称是百分之一百准确的。他得出那些结果的方式略有不同,因此他在搜索树时的路径也稍有差异。这是因为当你额外加载一个 m t p 层时,会让数值发生极其细微的变化, 从而导致最终结果出现微小偏差。此外,随机数生成器也会给出不同的答案,所以数的分支结构确实会有所不同。不过所有分支依然有主模型进行百分之一百验证。 尽管如此,结果任可能存在细微差别。在本次测试中,两者看起来完全一致。让我们再看看 q 三版本的情况,如你所见,它的速度是每秒三十五点九个, toc 版还要慢。原因在于这只是基础的 q 三量化, 而这种精度对于代码任务来说表现并不理想,往往容易出错。虽然理论上生成速度可能超过每秒四十五个 token, 但最终会出现更多的回滚。因为草稿模型猜错了,稍有不同的次元,所以我不会上传 q 三版本,只会提供 mtp 版本, 如果你也想亲自体验一下,接下来就告诉你具体怎么做。所以我已经上传了一个 deepsea v 四 flash m l x 九减 bit 量化版本,并在描述中添加了说明,下载并启动兼容的 m t p 预测解码器,以获得更加性能。如果你点击那里,如果我尝试不同的预测解码器,它们都会出现在那个列表中, 但这是你用它运行的代码模型。这一款标明适用于 deep seek v 四 flash m l x, 而且我也列出了刚才运行的速度数据,每秒三十一个临牌和每秒三十七个临牌。这是我首次测试的结果。这里还展示了当前的内存占用情况。如果你想通过 inference 运行它, 只需进入模型部分搜索 deep seek 为四。我目前正在使用的是 m l x 九维量化版本,但正如你在此处所见,还有 m t p 版本的 m l x 模型。如果想操作更简便,直接搜索 m t p 即可。当你下载好 m t p 版和主模型后, inference 会自动检测到它们。看这是 m t p 版本,也就是一个推测解码器。如果检测到这一点,当你进入推理界面并选择 deepsea vs flash 模型时,你会看到一个推测解码器部分,它会自动提供你可选的任何 m t p 选项。 所以如果你勾选那个预测解码器,两个模型就会并行运行,但这会额外消耗大约四级字节的内存空间。如果你的存储空间紧张的话,就会出现这种情况。我还没用 deep c q 九的二点八量化版本测试过,但在一百二十八级字节内存的环境下,那已经相当吃紧了, 这就是如何在 in prince 中运行的方法。下载这两个模型即可,因为它们通常是分开部署的,这也是预测解码器的常规运作方式。这种分离的好处在于,你可以尝试不同的策略。比如,如果你想使用 ego free 或 d flash, 就 不必非得使用 mtv 版本的实现,还可以采用其他方案。 我之前也做过一些实验,对比了 d flash 和 eaglefree。 目前看来, eaglefree 在 mac 上的表现并不理想,我还在摸索怎么解决。可能需要自己训练一个专属版,或者针对我想玩的 d flash 版本进行定制, 因为相关仓库是受限访问的,不让我进入,而其他版本在这款硬件上似乎也不太好使。 这部分我们留到下一期视频再细聊。现在让我们再做几组测试,看看工具调用的结果是否有差异。我会点击这里的工具选项并开启它,然后输入 what is x create com。 同时在 m t p 版本中也执行同样的操作。 我将移出两者的 token live 响应,这样我们就能在这里运行完整的回复。所以在禁用 m t p 的 情况下,他获取了 x c create 的 内容,并正在为其转载摘药。右侧起用了 m t p, 只需勾选那个预测解码按钮即可看到他在这里进行工具调用,抓取结果并一路领先。 现在从速度来看,进行一个工具调用三十七点二,对比三十一头更 nice, 仍然有百分之二十的提升。总结一下这段文字,结果是二十八点九,对比三十点三。我想这是因为文本非常独特,即使使用了某种预测解码器有所提升,但效果不如以往那么显著。让我们来个洗车问题吧。 在关闭 m t p 的 情况下,他会告诉你应该开车去。他给出了一个幽默又实用的答案,不过这次我想加点花样。 所以, deepsea vs flash 实际上有多种思考模式。到目前为止,我一直禁用思考模式运行这些东西,但我打算切换一下,开启最大思考模式并运行它, 看看它能不能做点什么。如果做得好,思考花了多久,并在启动 m t p 时将其在生成过程中拉偏。让我们来看看它到目前为止针对洗车问题的回答结果吧。所以,关闭 m t p 后,我们有每秒三十一点五个领牌,生成了一百六十五个领牌。先来开启 m t p 看看这个。 他有两百八十个令牌,所以再次模型走了不同的路径,因为他正在运行那些额外的层,结果已得到主模型的百分之一百验证,但他却走了另一条路。 这大概就是你提高温度或者调整种子值及其他变量,甚至只是在提示词里加个空格时会发生的情况。比如我们问这个问题并多加一个空格,他给出的结果分之就不同了。 而且因为引入了额外子福,答案虽然理论上应该完全一致且准确,但实际上却变得不准确了。我刚才读到的那个版本本来应该是准确的,但这次结果不一样。这里是交出车钥匙走回家,理由是更快,更健康,对车更好。所以简短回答是,你应该走路 太疯狂了。开启 m t p 时,尽管阿里说答案应被主模型百分之一百验证过,但他却说你应该走路。关闭 m t p 时则说你得开车去洗车店才能洗上车。接下来,我想看看 max thinking 版本的表现, 也想在这个问题里再加几个空格。因为感觉 vs flash 之前那些靠谱的答案可能只是运气好碰上的, 也许我低估了它,所以开启 maxing 后是每秒三十二个令牌,对比三十五点五个令牌, 差异没那么巨大,不像写代码那样,语法某种程度上定义了必须选定的令牌,所以草稿模型能稍微更好地选中它们。不过咱们还是看看答案吧。 所以他在思考这件事,目标是去洗车店洗车。如果你走路去洗车店,你会到达那里,但车却停在车道上。所以即使使用了最大思考模式和 m t p, 他 也得出了一个答案。而禁用 m t p 时,却说你必须开车前往。答案依然不同。现在你有每秒七百二十八个 token, 接着是九百九十个。在 次运行一次,是因为我想确认在关闭思考模式时我们是不是只是运气好,所以我在那里加了空格,再跑一遍看看。你们想看吗?听起来挺有意思的,看吧,我就知道。我知道会是这样,我就知道我只是运气好,所以我只在我的提示词里加了一个空格。 我就这么做了。哥们,这些人很快就要操控武器系统了,吓人。所以我只是给提示词加了个空格。他就说逻辑上的答案是应该走路,但这显然是错的,太疯狂了。好吧,总之,我们进去直接问他吧。哦,这个我得先做一下,然后再做另一个。 我要开启思考功能,所以他分别开启了最大思考、关闭思考和开启思考模式。这次我要让他进行思考,这将实时渲染一张人脸,使用的是 webgl 加上 mtp。 我 也让他开始生成了。 所以这其实还挺有趣的。所以为其用 m t p 的 版本实际上陷入了推理循环。应用程序检测到了这一点,所以在推理控制里,我把最大循环次数设为了九,所以如果他检测的代码连续重复九次就会退出。 我觉得默认值大概是六左右吧。所以如果你得到了这些结果,不妨拿来玩玩。所以在大约九八零零个临牌之后,他陷入了循环。现在 n t p 版本实际上已经推理完毕,正在实时编辑代码, 所以这是个胜利。我对那件事感到惊讶。有几种策略可以应对这种情况。我会把这个真正继承到应用里,以后你就不用担心这个了。但如果你进入 token 检查器,就可以四处查看。 我们可以看到他正在便携代码时的情况,让我现在写一下代码。当时他在思考,输出的一个 token 是 那个右括号,这看起来像是关闭思考标签的开始标记。 如果我选中这个,我可以直接重放,谨记于该选区的生成位置,这样它就会结束思考并继续给出响应。这是一种选项,另一种选项是你只需点击这里的编辑按钮, 然后从那里输入 close link 即可让它正常工作。不过我想做的是,因为我在这里大量使用了思考功能,所以我要克隆之前由 m t p 生成的那个组合,因为这可能是一个有趣的实验。 接着我会点击这里的编辑按钮,删除答案,直到其中包含那个思考标签,然后再次运行。正如你所见,他会处理提示词,并利用这里高级场景下通过 mtb 生成的思考来回答问题。 让我们看看他们在数学题上的表现如何。左边给出了完全相同的回答, off 都是偶数。这是正确答案啊,两边都答对了啊。左边呢,消耗了一千七百个头,肯用时三十九秒。 右边则是一七零七个 token。 速度方面,分别是每秒三十一点八个和三十六点八个 token。 我 们依然受益于 m t p 带来的提速效果。接下来,我将进行最后一项测试,使用照片级真实版本的面部渲染来看看它的表现。 企用 m t p 后会怎样?它真的能加载出人脸吗?啊,有人脸了,你好啊,这是一张非常美丽的脸,它有眼睛,它没有嘴巴,但有眼睛,渲染效果惊艳。我觉得我可能拖慢了非 n t p 的 速度。我们差不多到了二七零零零,不过它还是有工作室背景的云, 它的灯光很美,它在摄影棚里。这令人印象深刻。我是说你见过 quan 制作的那个版本。它有点像棕色的刀切面,可能只是头发卡在那了。 but deep sea vs flash 来的几张美丽的脸。 它缺了鼻子和嘴巴。是的,但灯光效果简直太棒了。所以关闭 m t p 后,速度又回到了大约每秒三十个令牌。我们开始播放,看看它生成了什么。加载中哦,你好,这是个鸡蛋,所以这有可能是一张脸,或者是一个鼻子正在复现。 灯光确实很美,但你得想办法给他加点料。这个版本太疯狂了,只是多加了一个空格,就得到了不同的答案。他起用了猜测键盘开启时,他伸出一张脸,禁用后却变成了一颗土豆, 这很酷。当然,如果你想的话,可以用你喜欢的推力框架来运行它。比如这里有个服务器功能,你可以开启服务,然后选择你的 alama 或 open 人工智能兼容 api, 甚至还能运行分布式计算。如果 max 支持多节点的话, 现在你可以构建一个由多个 max 组成的集群,并将它们链接起来,共同分担负债。所以我会再开启服务器,好给大家展示一下 opencode 的 运行情况,让大家快速了解它是如何工作的。所以这是我的模型列表。我们可以看到这里。 deepsea 为我提供了所有可用的不同 mtp 版本, 所以我可以运行它。如果我把它当做模型的话,你可以直接运行 deepsea flash, 或者用那个带有 mtp 的 版本一起运行。 它有一个特殊的解码器标签,能让引擎知道加载它们并一同运行。比如在 open code 里,如果你编辑 open code json 文件并把模型 id 粘贴进去,给它起个名字就行。我们叫它 deep seek, 然后运行 open code, 控制 p 并切换模型。我选择了这个 deep seek。 紧接着就出现了,你好 哦,天呐!第一次运行时会有点慢,因为它需要缓存系统提示。那个庞大的系统提示是 open code 提供的。 不过如果你起用了名为持久化提示缓存的功能,只需进入设置并确保勾选缓存提示它会将响应保存下来。 下次你在 open code 中使用时就会快很多。所以,你好你好,今天连接一下看这个愤怒的小鸟克隆版。这里正在进行服务器端生成,速度达到每秒三十六个令牌。这说明 m d p 确实生效了,因为我们已经超过了三十,而且 open code 的 成功完成了所有这些操作。 如果你是像我一样频繁切换模型的用户,可以点击这里的 server server 选项,选中覆盖 a p m 模型选择, 这样它就会跟随下拉菜单中选定的模型,而不必每次都指定模型 id。 你 看,所有这些都顺利地在框架内运行着。那么你觉得 m t p 配合 deep ckey 的 性能如何? 我们之前看到 q w 快 了整整两倍, jammer 也快了整整两倍。但这些模型的尺寸小得多,参数量大约在两百七十亿到三百亿之间,而这个模型超过一千亿参数属于 deep c s 系列。即便如此,二十倍的速度提升对我来说已经很棒了。 希望你们觉得这个视频有用,并享受了这场展示。