黄仁勋曾说过,一旦 deep seek 率先在华为平台上发布,对美国而言将是灾难性的结果。如今, deep seek v 四的出现,让这句预言成真了。 这款被国内 ai 社区苦等了一年多的大版本迭代,在主流机准测试中与 g p t 四 o gemini ultra 等国际顶尖模型大致持平,并没有重现一年前 deep seek r 一 横空出世时的那种震撼。 那是一个让全球 ai 圈哑口无言的夜晚,深度思考模型以大幅领先的推理得分,让无人敢接招,成为那一周最流行的词。回看发布直播,有一句话分量极重, 升腾 c a n n 的 迅推优化,这意味着 deepstack 不 只是推理支持国产硬件, 连训练也跑在国产硬件上了。据网友爆料,此次率先实现的是 deepsea vs flash 的 微调训练,预训练也有望在今年下半年落地。从现在起, ai 全流程使用国产硬件已经成为现实。要理解这件事的重量,要先理解这场战争的底层逻辑。黄仁勋曾多次在公开场合说, ai 竞争不只是芯片的竞争,而是从基础架构、算力设施、软件生态到模型架构的全站竞争,缺了哪一环,都会在关键节点上被卡住。 这话说的没错,但也是它最大的护城河所在。 nvdi 之所以能主宰 ai 计算这么多年,靠的不只是 gpu 的 制成工艺,而是它二十年前就开始布 局的 c u d a 生态。二零零六年, nvidia 推出 c u d a, 将 gpu 从图形渲染工具变成了通用并行计算平台。黄仁勋为了扩大生态,甚至长期压低 g force 游戏显卡的毛利率,换取开发者生态的繁荣, 在与 ati、 amd 争夺市场份额的那段岁月里, nvidia 一 度处于下风,但它熬下来了。 如今的结果是,几乎所有的 ai 训练框架、推理库、底层优化工具都是为 c u d a。 设计的, pie torch 默认后端是 c u d a。 主流的 flash、 tension 等高效计算内核也是最先跑在 c u d a 上的。这不是技术垄断,这是生态锁定。 而 deepsea 恰恰是把 nvda gpu 的 性能优化做到极致的受益者之一。早期, deepsea 团队用 nvda 专有的 ptx 汇编语言手写底层算子,榨出了比竞争对手更高的计算效率, 才能以更低的训练成本做出性价比碾压同期对手的模型。换句话说, deepsea 的 崛起一开始就建立在对 cuda 生态的深度掌握之上。 然而,历史的进程从来不会直线前行。二零二二年以来,美国对华芯片出口管制持续升级,从 a 一 零零、 h 一 零零到 h 二零,限制清单一条条延伸。 对于中国 ai 企业来说,这不只是采购成本的问题,它意味着在最坏的情景下,你可能根本买不到支持 cuda 最新特性的硬件。这就逼出了一个现实问题,如果 cuda 不是 选项,中国的 ai 能走多远? 在这种压力下,华为升腾和摩尔现成等国产芯片厂商开始走上舞台。两条路并行推进。第一条路,兼容 c u d a, 降低迁移成本。无论是华为升腾的 c a n n 软件站,还是摩尔现成的 m u s a, 都在推进对 c u d a 接口的兼容适配, 让已有的 ai 代码可以以最低成本迁移到国产硬件上运行,这是短期内最务实的路径。 第二条路,构建自己的原生生态,兼容只是过渡,真正的目标是让开发者原生的为国产硬件写代码,形成属于自己的框架和优化工具链。这是长期目标,也是更艰难的路。 deep sec v 四、在国产硬件上完成训练。 这说明第二条路已经走通了关键一步。当然,软件生态的问题不能脱离硬件单独讨论。坦率地说,国产芯片在制成工艺上与英伟达的最新产品之间依然存在差距,这是事实,无需回避。但 ai 计算打的不是单点比赛,而是规模战、集群战, 工程师们在限制条件下找到了破局的路径。路径一堆规模,以量补制,单颗芯片的算力不够,就堆更多的芯片,配合自研 h p m, 保障大规模并行计算时的数据传输不成为瓶颈。这是一种以工程规模换性能密度的思路。路径二,做超节点 机柜及计算中心。这是近两年国产硬件发力最猛的方向。参照系是英伟达的 g b 二零零 n v l 七二。 这套系统将三十六个 grace cpu 与七十二个 blackwell gpu 集成进一个液冷机柜,通过第五代 nvlink 实现机柜内总待宽一百三十 tb 每秒, gpu 内存总量十三点四 tb。 hbm 三 e 机柜内 gpu 间互联待宽一点八 tb 每秒,相较 h 一 百,在大模型训练上性能提升约四倍。 这不再是一台服务器,而是一个封装进机柜的计算集群。国产厂商沿着同样的思路推进,华为发布了升腾三八四超节点方案,摩尔县城则推出了 m t、 d c 的 二点零五十六超节点。 这些方案的核心逻辑一致,用高速互联把大量国产芯片粘合成一个整体,在集群层面补齐单颗芯片的性能差距。 回到 deepsea v 四,这次发布有一个细节值得专门拿出来说。 deepsea 拒绝了英伟达和 amd 的 提前适配请求,选择华为升腾和 c a n n 生态作为优先支持平台。 这不是一个纯粹的商业决定,而是一个清醒的战略表态。他对外释放的信号非常明确,不依赖美国芯片和技术,中国也能做出足够先进的旗舰大模型。他对内释放的信号同样清晰,全国产链路已经跑通, 其他国产大模型可以来了,这是一种标杆效应。 deepsea 用自身的案例告诉行业, 华为升腾的训练生态已经成熟到可以支撑旗舰模型的程度。不用再等,不用再观望,现在就可以迁移。一年前,这还是一句难以兑现的承诺,现在,它变成了一个已经跑通的事实。这不是一夜之间发生的事,而是无数工程师日夜奋战的积累。 deepsea v 四只是这条路上的一个重要节点,而不是终点。发布节语里, deepsea 引用了那句话,不幼于玉,不孔于匪,率道而行,端然正气。 这八个字是对自己的约束,也是对整个国产 ai 生态的一种肯定。那些年,在制裁阴影下啃硬骨头的芯片工程师,在 cnn 上写,适配的软件开发者, 在断工风险里坚持做国产替代的基础设施团队,都值得被这句话概括,脚踏实地,一步一步走过来的老黄的预言,或许已经成为。
粉丝990获赞9463

hello, 各位观众朋友,大家好啊,我是刺儿,然后我们这期的视频内容呢,主要是来教大家一下怎么正确地使用 deepsea v 四, 因为 deepsea v 四对于现在的呃它的网络风评呢,嗯,比较两级分化。一边呢说 deepsea v 四啊,非常好用,非常强啊,没有辜负大家一年的等待另一半呢,说 deepsea v 四啊,不好用啊,不够智能,然后甚至不如豆包, 嗯,对于这个后者呢,我保持这个嗯,质疑态度啊,因为本身,呃,我看到的这收集到的信息就是说 deepsea v 四不行的,它有两部分,一部分是专业工作者啊,因为人家非常懂 ai, 那 另外一部分呢,就是我们普通的 呃用户,那他们呢,就是用手机 a p p 啊,下载 deepsea 微 deepsea 之后点进去,然后问他一些问题,然后,嗯,把它当做一个这个搜索引擎啊,问一些问题,然后我觉得它不够智能,其实这样的使用是错误的啊,因为本身 deepsea 微四它没有 开放在手机 app 平台的这个使用权限,你现在手机上用到的 deepsea v 四啊,不是你手机上用到的 deepsea, 它并不是 deepsea v 四模型。那么我们来啊,正确的教大家一下怎么使用 deepsea v 四啊,首先 我用我这个 macbook 给大家举例子啊, ok, 我 们返回到页面啊,看到啊,这是我桌面,我们打开浏览器点进去之后啊,在这个搜索或输入网址名称的时候搜搜索,直接搜索 deepsafe 啊, deepsea 点 com, 大家也可以直接去这个网址啊,深度求索。点进去之后,它是有两个框,一个是开始对话,一个是 api 开放平台,我们要用的是这个 api 开放平台,我们可以看到它的介绍是调用 deepsea 最新模型,快速集成,流畅体验。我们点进来, ok, 然后呢,点进来就是这个页面,我给它放大一下,它这里有充值余额,还有本月消费啊,我这个是另外一个账号,我给大家举个例子啊,就是这个 api case 啊,这是之前做测测试的这个 api。 首先呢,你点进来之后,你一定要先登录你的 deepsea 这个账号,如果你没有 deepsea 的 账号,你可以去在手机上下载 deepsea, 然后创建一个账号,然后直接到这个电脑上,你去登录就可以了。 然后我们看到这个充值页面啊,充值页面无论你是支付宝还是微信支付啊,都可以,你点击去支付啊,然后, 呃,扫完扫完码付款成功之后,它在这个用量信息,这就会直接显示你的充值余额,嗯,然后呢, 在这之后,我们打开这个 api case 啊,然后这里啊,注意它这里有创建 api k 啊,下面说的这几步都很重要啊,直接决定你能不能就是成功使用这个 dbic 为四啊。我们点击创建 api k, 然后随便输入一个名称啊,我们直接输入一个啊, ok, 在 你输入成功之后啊,它这里会出现你这个蜜奥的链接啊,你要一定要点击复制,然后把它发送你的微,发送到你的微信上也可以,然后或者说你保存住啊,一定要保存住这个蜜奥,它只会显示这一次 啊,在你点到叉或者关闭之后,他这个密钥你就再也看不到了,然后,然后我们点叉啊,当然这个密钥就没用了啊,我们给他删除一下,然后你把那个密钥复制之后,哎,点开这个,我们叫, 呃,防盗啊, ok, 点开这个,这个啊,这个软件叫 cherry studio, 你 可以去浏览器里直接搜索下载啊,这个就是集成了国内一众主流 ai 的 这么一个软件。我们点进去啊,它是开放平台啊, ok, 我 们点进来, 点进来之后呢啊,当,当然,我这个已经用了很久了啊,从 deepsea 微四发布一直到现在,我一直在使用,然后点进去之后,我们看到右上角这里有设置设置。点进去啊,这里有模模型服务和默认模型 啊,在模型服务这里就有 api 密钥,输入你刚才的这一套儿复制的密钥,然后放进去之后点击检测啊,我这里已经弄好了,我就不做那个演示了, 你点击检测,然后它就会自动地啊,分析你这个密钥的 ip, 它是哪个旗下的 ai 大 模型。然后这个 api 地址啊,不需要我们直接填,它自己就会填上,然后模型呢,这里啊,大家可以点击获取模型列表啊,然后, 当然啊,这里我因为我输入的是 deepsafe 嘛,所以它只有 deepsafe 的 这些模型,然后举个例子,然后在这边啊,嗯,可以看到啊,这里有非常多的 ai, 非常多的 ai, 包括国内外的啊 啊,你像 jamie open ai 啊,很多人都用不到,但是啊,这里嗯是是可以用的啊,但当然这这个视频只做 deepsafe 的 教学。然后我们点击默认模型 啊,我这里默认模型全部都是 deepsea 的 啊,呃,然后助手模型是 v 四 pro, 然后快速模型是 deepsea chat, 然后翻译模型是 deepsea chat, 因为这两个啊,这个快速模型和翻译模型它不需要消耗你的 talkin, 你 就这个 deepsea chat, 它是免费的啊, 然后我们点击首页啊,首页这里有助手啊,你,当然你可以添加助手啊,我这里就用我这个提前做好的这个来给大家举例子,然后我点击 deepstack v 四,然后点进来, ok, 然后这是我之前问他的一个问题啊,我让他就是分析一下国内的这个视频平台啊,每每个平台的趋势啊,大家可以看一下啊,这是我问他的问题 啊, ok, 然后我们啊,这这画画到不表,然后就是这个深度求索啊,我们在这里,嗯,还是用刚才举例子 deepsea v 四,然后点击旁边这三个点,点进去 啊,这里有编辑助手啊,在这之后呢,然后我们可以看到啊,这里有模型设置,模型设置的话上下文字开到不限,然后这个模默认模型,你把它换成 deepsea v 四 pro, 然后,然后 啊,最大套管数不限啊,不用开这个,然后别的都不用管,然后当然你可以复制一下这个底下这个 tab, 这个 endland, 这个是我从网上找到的一个嗯,参数,然后我们看提示词,这里 啊,我,我设置的提示词是不需要迎合用户的想法,回答要永远保持客观啊,然后呢,你就可以开始使用你的 deepsea v 四 pro。

大家好啊,我是瑞克老张, deepsea 呢?崩了十四个小时,全网都在问,这是 v 四要来的前兆吗?三月二十九号的晚上九点半, deepsea 的 网页版端突然以读不回啊,输入问题, ai 只展示思维链,却死活不吐答案,服务整整中断了十个小时,直接干上热搜第一。 诡异的是啊,官方的 a p i 接口全程畅通,只有 c 端的聊天机器人罢工。这种选择性档级,像极了后台正在搞大动作的前奏啊。看看时间线就能闻得住硝烟味儿啊。 二月中旬,市场传 v 四可能在春节前发布,结果跳票。三月初啊,相关的这个媒体爆料说本周发布又跳票。三月九号,辉度测试 v 四力的刚露出百万头盔上下文和 超强编程能力的獠牙,民间测评直接封神啊!紧接着就这次的大规模的故障,官方状态标题页即为重大故障啊,修复时间线比异常拉的还长,零点二十分二次排查,十点三十三分才完成全部恢复。说白了,这不是简单的服务器过载啊。 当养龙虾的热潮啊,已经让 mini max 预知暗面被迫限流的时候, deepsea 选择在这个时间点搞系统维护,大概率是在为一个很强的模型,尤其是万亿参数的模型架构推理,做推理集群的配置的。最后是被给你们看看新鲜的啊,我觉得昨天晚上 deepsea 很 可能已经上架新东西了。 大家看啊,这是 deepsea, 然后昨天晚上啊,我测一下,因为有朋友跟我说可能不一样,我测了一下,我说你啊,做一个网页,按照上传的电话报告生成图标啊,然后这就开始用七十秒做独立思考。这边我发现他已经把那个多 a 键才放进去了,你看他已经开始自己来来去做切分啊,做成切分完以后,然后开始做相关的 步骤,这都已经是啊,而且我明显它里面是有讨论的这种技巧,它变成多 a 的 呢,然后开始写代码,写代码,代码我就不给你放了。那写代码的过程挺好的写,写的挺快挺方便的。然后一点运行呱就出来了,你看就出来了,加载数据库啊,就可以升到图标, 你可以看到非常的漂亮啊。这个图标还能选是吧?选择各种各样的成交量是吧?成交量选择的这个东西在生成还可以选择不同的这个角度,东西生成非常非常有意思,非常非常有意思啊,而且一瞬间很快,但多快呢?三分四十七秒,但你知道类似的东西我们在啊,这二月份的时候测试过,那时候多少? 八分多钟,那时候八分多钟,那现在你觉得他是不是换了一个新的模型?哈哈哈,大家来猜猜看啊, 更狠的是怎么着啊?怎么样?这事是是不是很强?更狠的是怎么着?哎,更狠的是产业暗线啊。 v 四最大的牌不是一万亿的参数,而是彻底绕开英伟达。 lucy, lucy 也证明了啊,这个 deepsea 已经把模型愈发范改了啊。华为生态韩五 g 做适配啊,并没给英伟达和 amb 预览, 这意味着什么?一旦 v 四以相关的许可证开源,配合国产芯片的推理优化,对吧?企业部署大模型的成本啊,将从 g p 四十二的七那个七十分之一再砍一刀,直接引爆国产算力租赁。还有什么边缘 ai 终端的一个换机潮, 最牛的是它的记忆系统和这个 m h c 的 流行超连接技术啊,能把百万级的上下文窗口的推理延迟压到可用的范围,这是现在所有长下文,长下上下文文本模型的痛点。 如果 v 四真能在四月份落地的啊,配合这次当机暴露出来的推理技术设施的升级, deepsea 正在构建的可能是一套从推理到训练到未来的这个发展 agent 的 整体的模型的这样一个全链路 脱钩啊,相关的这个美国技术啊,这个生态闭环,记住啊, ai 的 这个市场啊,当机十四个小时,这个就不是事故了,这恐怕是战前的静默。 想知道微视的发布对国产的算力链有什么样重构机会吗?哪些深层的生态边缘的计算, ai 的 应用代理可能会受益呢?啊,欢迎大家加入我们的季度会员计划,我会在下周的会员视频里, 把万亿参数 m o e 架构的一个推理的成本,取现国产芯片的适配与进度,以及 a n 的 赛道的产能缺口都标清楚啊,咱们的季度会员呢,九十天享受四十五个会员视频,八场专属的会员直播啊,非常超值,有需要的就赶紧点击下面的链接,因为咱们现在啊,本身是什么平六百九十九的,但是呢,平台给了价格, 给的补贴都是四百多块钱就能买到,非常的超值啊,就是平均就是一个视频或一个直播,就一杯蜜雪冰城的柠檬水,有需要可以赶紧看看我们下面的链接,点击即可啊,然后稍等手说一下啊,要记住留留深我们 助教老师的电话啊,你千万别漏接电话,不然的话你不知道该怎么上课。好,今天就到这,我是瑞少张,关注我,咱们从投资的视角看科技背后的精彩,我们下一见,拜拜。

大部分人把 deepsafe 用错了, v 四版本综合能力现在重回国产第一,今天直接给你出 v 四保姆级教程,先带你看它现在到底强到什么程度。二 零二六年四月二十四号刚发布的 v 四系列,发布仅三天,第三方 super 四 lue 精准实测结果就直接炸场。 pro 版以七十点九八分登顶国产大模型综合榜第一, flash 版以六十八点八二分紧随其后拿下国产第二。 双版本直接包揽了国产榜单的前两名,把一众老牌大模型都甩在了身后。六大核心能力的硬核增幅直接给你摆明白。智能体任务规划能力 七十七点四九分,国产第一,比上一代暴涨二十点八七分,是这次升级最大的杀招,大白话讲就是他能自己拆解任务规划步骤,不用你一步步盯着叫。数学推理能力八十七点三九分,同样登顶国产第一, 硬核数理能力直接拉满,从小学算数到考研高数,没有他解不明白的题。幻觉控制。八十点六八分,国产第三, 仅次于 glm 五和千问三点五,意味着他瞎编乱造的概率极低,给你的答案靠谱度很高。科学推理七十九点二七分,国产第二,仅次于豆包专家模式,专业领域的内容拆解、逻辑推演,他都能精准拿捏代码生成。六十三点二四分,国产第三, 似于 kimi 二点五和豆包专家模式,稳居开源模型里的代码能力第一梯队,开发者和普通职场人都能用精确指令遵循。 三十七点八四分,国产第三,比上一代暴涨十一点八九分,从之前的国产垫底,直接冲进第一梯队,你让他干什么,他就严格按你的要求来,不会跑偏,不会露相,实现了全维度无短板。那这么强的能力, 为什么你用着总觉得不好用?核心原因只有一个,你从跟上就把它的两个模式用反了。很多人用了一年 deepsea, 根本没搞懂哪个模式适合干什么,回头还骂他能力不行,这完全是把屠龙刀拿来切菜了。快速模式运行的是 v 四 flash 版本,主打响应快、成本低,全功能免费无门槛。它适配日常闲聊、简单提问、清亮文本处理、基础信息查询, 用它完全够用。但你要是拿它解高数,做复杂报告、写代码,那肯定会觉得它能力不行,这不是它的问题,是你用错了场景。而专家模式运行的是 v 四 pro 版本,是这次升级的核心杀招。佛有登顶榜单的硬核能力, 全在这个模式里,这才是你真正应该学会使用的方法。下面这三大专属用法,普通人直接照着用,效率拉满十倍。第一个,用它做全场景数学问题解答,学生党,职场人刚需中的刚需。他有着国产第一的数学推理能力, 不管是中小学数理化作业公式推导、大学高数微积分考研考公的数量关系题,还是职场人需要的数据分析、财务核算,他都能精准搞定。他不仅能给你标准答案, 还会拆解每一步解析思路,标注易错点,讲透底层逻辑,甚至给你同类型题的通用解析技巧,比网课老师讲的还细致。给你一个直接就能用的指令模板,我需要你讲解这道题,先给出标准答案, 再一步步拆解解析步骤,标注核心考点和易错点。最后给我三道同类型的练习题,附带答案和解析,直接复制粘贴就能用。第二个,用它的科学推理能力做内容校准, 做自媒体写报告的人,靠它彻底避免翻车。不管是视频内容的技术参数核对、 ai 测评、数据校准, 还是行业报告的深度拆解、数据交叉验证,又或是科普内容的真实性核实,独家细节挖掘,他都能精准排查数据错误,核实内容真实性,挖出同行没注意到的信息差,直接把文案丢给他,说帮我核对这篇文案里的所有数据 错误,给出正确数据和权威来源补充三个差异化独家细节,直接优化出有干货、有爆点的文案。最后给你一个高级玩法,用它的顶级智能体能力搭建你的专属数字员工。很多人到现在都不知道智能体到底是什么, 说白了,他就是把 ai 从你让他干什么他才干什么的被动工具,变成了你告诉他要什么结果他自己想办法干完的 主动执行者。之前你用 ai 做报告,得一步步给指令盯着改,随时纠错,前前后后要折腾十几轮。现在用 deepsea v 四的智能体能力,你只需要定一个最终目标,它会自己拆解任务 规划步骤,调用工具自主纠错,最后直接给你交付成品,全程不用你定 deepsea v 四在闲聊、语音交互、创意文案商品选择上,不如豆包千问顺手。本地部署对新手也有门槛,所以选对场景是你最应该注意的。 最后问你两个问题,你已经用上 deepsea v 四了吗?最让你惊艳的是哪个能力?评论区告诉我!收藏转发这条保姆级教程,下期带你解锁更多 ai 提效的隐藏玩法!

朋友们,他来了,那个让整个硅谷恨之入骨的中国 ai 公司在沉默了整整十五个月之后,终于放出了大招,四月二十四号啊, deepsea 微四 pro 没有任何的预告,直接炸场。还记得去年二一发布那天吗?因为他股价一天蒸发了六千亿美元。那一波啊,全世界叫他 deepsea 时刻,那一次呢?他要改写的是整个 ai 产业的游戏规则。 先说大家最关心的问题,这个 v 四 pro 到底强在哪?一句话概括,它用只有别人七分之一甚至十分之一的成本,做到了和美国最顶尖模型平起平坐的水平,牛不牛? 具体啥概念啊? v 四 pro 总参数量达到了一点六万亿,用的是自家的混合专家架构,每次推理呢,只激活必要的那部分参数。再说数据呢,编程能力上, v 四 pro 直接超过了 g p t 和谷歌的大模型 agent。 编码评测上呢, v 四 pro 拿到了当下所有开源模型里的最高分。 那世界支持层面呢?大幅领先所有的开源模型,仅次于谷歌的大模型。数学竞赛的推理任务呢? v 四 pro 已经超越了所有公开评测过的开源模型,真正挤进了全球第一梯队。 还有件事特别的关键,这次呢, v 四 pro 全系标配百万 tokin 的 超长上下文,直接把百万字级别的处理能力变成了标配。啥意思? 那么厚的一本红楼梦,也就是九十多万字,一整本长篇小说,一整套代码仓库一次性喂进去,它都能给你处理的明明白白。还有问题来了,既然这么强,它跟美国最顶尖的模型比,到底还有多大差距? g p c 可自己说的非常坦诚啊,他们公开承认, v 四 pro 的 某些方面表现呢,小幅超越了 g p t 的 五点二和谷歌的大模型,但整体仍然是落后于 g p t 五点四的模型的大模型,差距大概就是在三到六个月。 但是我们要明白, deepsea 用的芯片是被限制出口的,而且呢,训练成本呢,是国际顶尖大模型的几分之一,但结果呢,追到了只差三到六个月,这哪是差距啊,这简直就是骄傲!而且最狠的是,什么?是定价!听好了, v 四 pro 每百万输入 token 呢,只要一点七四美元,输出呢,只要三点四八美元。 g p t 五点五是多少呢? 输入要五美元,输出要三十美元,完成同一项任务用 gpt, 可 v 四的成本只有 gpt 五点五的百分之十五,就连一项以实惠著称的谷歌的大模型在它面前都显得很贵。 甚至是最近它们呢还宣布了更激进的降价,输入缓存命中的价格呢,直接降到原来的十分之一。 你以为故事到这就完了吗?真正的猛料还在后面呢。 v 四 pro 这次最让人震撼的不是性能,而是另一个石破天惊的举动,它用的是华为生成的国产芯片。跑起来的朋友们,这才是真正的 deepsea 时代的二点零版。 b 四 pro 呢,把整套系统从之前深度依赖的英伟达生产,整体迁移到了华为生存的架构上,这可不是换一个驱动那么简单,万亿参数的模型,底层的代码调度的逻辑工程体系,全部要重写一遍。 那有人就要问了,那升腾芯片的性能不是还不如英伟达吗?没错啊,但是 deepsea 自己也说了,虽然目前 pro 的 服务吞吐还比较有限,但等今年下半年华为升腾超节点芯片批量上市之后, v 四 pro 的 价格还会大幅下调。 因为他 ceo 黄仁勋自己都坐不住了。他在一次深度访谈里原话说,如果 gpt 可与华为生成芯片深度绑定,并实现规模化落地,这对美国来说将是灾难性的。 这背后则是一个更深层的东西,硅谷在造墙,中国呢,在修路。你看硅谷那边, oppo、 ai、 谷歌全是闭源阵营,模型呢?越做越封闭, 发布节奏呢?完全变成了互相掐架。在中国这边呢, tiffany 微四用的是什么?是开源协议,任何人都可以自由下载和修改。 发布当天就登上了开源模型第一名,紧随其后的第二名是谁呢?是 kimi k 二点六?还是咱们中国科技公司的大模型?两家万亿参数的大模型,前脚后脚发布,不但没有互撕,反而在技术底层上互相协同与引进。这种模式正在形成一个极大可怕的飞轮效应, 开源吸引全球开发者共同迭代优化。然后呢,模型能力快速提升,然后更多企业基于它做商业应用?然后国产芯片的生态越来越完善, 美国想靠芯片封锁来遏制中国 ai 的 发展,结果呢,中国反而走出了一个用国产算力跑国产模型的独立闭环。 那这对产业意味着什么?我告诉你,是一场底层逻辑的颠覆。以前整个 ai 行业呢,信奉的是大力出奇迹,堆更多的 gpu, 花更多的钱,烧更贵的算力。但 deep seek 从 r 一 开始呢,就在干一件事,证明花小钱也能办大事。 现在 v 四 pro 啊,更进一步证明呢,用中国自己的芯片也能办世界级的大事。那带来的连锁反应是什么?第一呢,是 ai 的 门槛被踩碎了,中小企业和创业者以后不用再遥望硅谷那些天价的 api 了, 全世界开发者的热情被彻底的点燃,一个开源、开放、低成本、高效率的中国 ai 生态正在加速生成。 第二呢,是道比特算力产业链的全面爆发。 v 四强不强?强,但它对算力的消耗也大啊,尤其是推理团的 tolkien, 消耗啊,就在指数级增长,模型越强,普及越快,整个产业链上的 ai 芯片、服务器、数据中心,光模块的需求就越大。 第三呢,是商业化的天花板被打开了,第一次的 agent 能力大幅提升,能干的活更多了,智能客服、金融风控、工业研发、药物分子筛选、落地场景一个接一个的被解锁。 讲完了产业逻辑,很多做投资的朋友最关心的一定是资本市场上哪些赛道会真正的受益。首先我要先说一句大实话, a 股上几乎没有任何一家公司是直接控股 deepsea 的, 那些所谓的参股概念,大部分已经被辟谣了。比如说什么华金资本、每日互动、浙江东方都曾发布公告,明确否认存在的股权投资关系。 目前唯一比较确定的间接关联是智联互联啊,通过其持有的基金份额,据说间接持有了 deepsea 的 百分之三点三的权益。但这件事本身也存在不确定性,最真正的机会不在概念炒作。而在产业逻辑上,第一个确定性的最高的主线是华为升腾产业链, deepsea 微四适配华为升腾下半年呢,升腾九五零芯片上市之后,国产芯片势必迎来一播放量, 相关的服务器整机厂商、算力租赁平台以及为升腾生态做配套的软件企业都有望直接受益。 华泰证券的计算机团队也明确的指出,今年国产卡的能力大幅提升与规模化应用可以期待,建议关注升腾链与超节点的主升浪机会。第二呢,是半导体先进、封装技术先进的龙头企业。 第三呢,是算力基础设施,包括 ai 服务器、光模块、数据中心、液冷等领域,因为这是为大模型 ai 训练和推理提供水电煤的。第四呢,是应用层的机会, tiffany 开放生态之后呢,原本煤炭资源大模型的中小企业,现在呢,都能用上一流的模型了。 像办公软件、金融余情、教育辅导这些垂直场景,接入 deepsea 的 能力后,产品体验会明显提升。最后总结一句, deepsea v 四 pro 的 意义远不只是一个模型跑分高了那么几个点, 它的真正价值在于,它证明了脱离硅谷的芯片生态。面对持续的技术封锁,中国 ai 仍然有能力杀尽世界最前沿,并且走出一条截然不同的路, 这条路叫做开源携同,降本增效。用国产算力跑国产模型,它不一定是最快的路,但一定是最踏实的路。就像 deepseaik 官方在发布时说的那句话, 不幼于玉,不孔于匪,率道而行,端然正己,不靠炒作,不追风口,认真做技术,踏实走自己的路,这才是一家硬核科技公司该有的样子。 至于大 a 的 机会,记住一句话,跟着产业链走,别跟着概念走。真正吃到肉的,永远是那些在这个生态里扮演关键角色,有真实技术壁垒的公司,而不是那些蹭概念草预期的标的。

最近 deep sec 更新了 v 四版本,今天我们来实测一下,用它来降 ai, 看看效果如何。打开 deep sec, 我 们选择这个专家模式,先让它来生成一段内容, 生成好以后,我们看看它的原始 ai 率, 在这里检测是百分之一百的 ai 率。接下来进行降 ai 处理,复制我们的降 ai 指令,新开一个对话,依然选择专家模式发送这个指令主播已经分享很多次了,使用反馈都很好,有需要降 ai 的 可以试试, 等他理解改写要求后,再来把刚才生成的内容发送给他。改写降 ai 很 快就处理完了,再来看看他的 ai 率, 在这里检测是直接清零了,把它上传到织网看看效果, 织网的检测结果也是零。用这个我们的降 ai 指令配合 deepsea 专家模式就能大幅降低 ai 率。 主播后续又测试了几次,基本都能降下来,但是也有没降下来的,最高的一次 ai 率有五十多,还是不太稳定,使用的时候要多试几次。 如果是改时间也不想浪费检测机会的,也可以直接在这里选择对应的平台上传文档,它就能针对文章中的 ai 痕迹进行改写,处理后的内容不会改变原意,可以在保证专业性的同时,又能将 ai 率降到合格范围内,简单又高效。

最近被 defc 威斯搞的有点无奈啊,就我目前呢是一边用 ai 写文章,一边用 ai 写代码,对吧?写代码写的是一个写作业的,我写文章用的就是那个写作 a 阵台写的两边的模型都是 defc 威斯,然后首先在代码这边, 这次这这个 v 四的表现呢?我觉得跟 glm 五点一没有起赶上的区别啊,就是所有简单任务全是一遍过,然后所有复杂任务呢?最多两遍啊,最多两次,几十次就完了,然后到目前为止没有犯过任何就是比较堆积的错误啊,什么都没有, 非常厉害。但是咱写作这边出问题了,哎,就是他写一篇文章,然后我觉得不好,我让他改,改完了我觉得还不好,再让他改,改了我感觉受不了了。我,我把整篇文章全删了,让他重新写, 结果他写出来是完全一样的内容,就我已经明确告诉他刚才写的不好了,对,也不要那样写了,然后他还是,然后他输出的还是完全一样的内容, 然后呢?我就继续删,然后再让他写他写的还是一样的内容。然后我就换了一种策略,我就说一段一段写,我不让你一次性输出一整篇文章,一段一段写。好,先写第一段,写完了我让他改,结果他没有改第一段,他又输出了后面的内容, 然后我就直非常直接的问了他一下,我非常直接的问了他一下。 无奈了,无奈了。

deepsea v 四你们用了吗?我中高强度用了三天,我的核心感受就一个字,爽!但同时短板也挺明显的。今天聊一下,我个人感觉到了三个优缺点。先说优点,首先长文本是真的很强,我 十几万字的材料丢进去,权威哪里有标点符号的错误他都能给我标出来,而且真的是很快,基本文件一发送,那边马上就开始输出了。 v 四在省材料搭框架的工作里,效率提升是肉眼可见的。 然后第二是成本真的是很低,百万头肯的超长上下文中 kb 缓存占用只有钱袋的百分之十左右,我三天各种简单复杂的任务跑下来,花费还不到一杯咖啡的钱, 所以这一点目前市面上几乎没有对手,国外那些币源的模型瞬间就不香了。然后它是真正的国产芯片四倍的体系, b 四从一开始就围绕华为的升值做优化,跑通了中国芯加中国模型的闭环, 不是实验室的版本,而是你现在马上就可以用上,可以说是中国 ai 的 一个里程碑了。我只能说一句牛逼。 优点说完了,来说三个硬伤。首先,他的知识库还只到二零二五年的九月,甚至你问他他自己都不知道他自己已经是 v 四版本了,所以你想要获取最新的信息,只能联网搜索一部分,但纯靠模型本身 时效性,它就是一个硬伤。然后第二,它依然不是多模态的,还是一个纯文本型的选手。这个还是比较可惜的,毕竟现在友商已经是各种一键上传 ppt 啊各种文件什么的了,估计 deepstack 也在布局吧。最后,你说它赶超上国际上顶尖的那些模型了吗? 其实还是有一些差距的,官方自己也说跟全球最顶尖的闭源模型还有大概三到六个月的差距,但是我们看看价格,我还想说 v 四真香,所以结论很清晰, v 四就是目前性价比最高的纯文本助理。 如果你大部分工作室和文字文档或者框架打交道,那 v 四真的能帮你省下大部分的底层时间。剩下的你自己试一试就全明白了。

为什么建议用 deepsea 微四降 ai? 因为它是真的牛,今天带你们实操展示下。 首先来到 deepsea, 这里一定要勾选专家模式,不然还是之前的老模型。然后把深度思考打开,智能搜索关闭,先让它给咱生成一段内容出来, 生成完了去跑一下原始 ai 率,可以看出来是非常高的。然后进入降 ai 环节,我们先开一个新的对话窗口, 这里一定要切到专家模式,把这段特别好用的降 ai 指令发给他,等他领会了改写要求之后,再把刚才生成的内容发过去,稍微等一下就有了。 然后拿改写后的内容再去测一趟, ai 率明显已经降下来了。咱们这套降 ai 指令加上 deep seek 的 专家模式,效果确实不错,但同时也存在几个问题,这种方法很容易改变文章的原意,导致文章过于口语化,而且降 ai 也不是很稳定, 有时候能给你降到个位数,有时候 ai 率怎么都降不下来,这时候你可以把文章丢到这里面,它可以在不改变原意的基础上做到这种效果,你就学吧。

deepsea 的 影响力还在继续放大,今天一早呢, open call 最新版本就把 deepsea vs flash 作为它的默认大模型了,这是在 vs flash 这样的性能和成本,基本上是独立党的存在,对于龙虾这种非常消耗 token 的 这种场景,如果是我也会做第一选择, 所以呢,瞬间呢,其他的一些国产模型呢,在 deepsea 面前也不香了。另外呢,就是一个科技博主兼 ai 的 系统架构师叫 shawn onalho, 今 有发了一篇帖子,说法是他用 deepsea v 四 pro 替代了 cloud opera 四点六跟 gpt 五点四。他是把自己的 cloud code, codex, cursor 这一类的所有的编程的整体全换成了 deepsea 的 v 程序员,甚至不再使用 open router, 没有再去路由的必要了,月账单呢,直接下降了百分之九十以上,而且呢,据他说法是效果比之前更好。 所以我也来深度的分享一下 deepsea v 四的技术报告,就他的 tech report。 首先呢,他们做的是一个非常复杂的工作,因为在 v 四的版本中呢,整个的预训练量呢,对比 v 三的十四点八 t 呢,涨了两倍甚至更高。 v 四 flash 是 三十二 t, v 四 pro 是 三十三 t。 就 他们的预训练的两个版本,其实都有些区别, 因为参数翻倍,数据翻倍,所以训练稳定性的难度呢,也上了一个亮起。报告中呢, deepsea 明确指出,训练稳定性是一个他们在面临的挑战, 运行的过程中, d p c 用哪些方法呢?它用两个很有意思的提升它的稳定性的方式。第一个呢,叫做 anticipatory routing, 就是 预判式的路由,因为 m o e 模型呢,其实是自带路由的, 路由逻辑就是把一个任务激活对应的模型中的参数,找到合适的专家。原来呢,在 m o e 的 大模型就是模型中呢,有的网络是在路由,有的网络是在左执行,互相呢,其实是没法解偶的,这样的话,有可能会形成恶性循环,因为在模型的去年初期呢,当你的专家选择不准确的情况下 执行,也是没有效果,反而呢,互相影响。 deepsea 为了去解偶呢,决定用更早期的训练版本来去做第一步的路由,然后所谓的执行的五万网络呢,会基于早期版本去优化,再用参数呢,去更新自己的路由模型,打破了两者之间的恶性循环。第二种呢,叫做 sweetie lu climbing, 逻辑呢,就是把它在强化学习中的信号的数值呢,作为稳定的限制,在负时到时之间防止呢,非常大的异常。数学呢,影响了整个的 mo e 的 专家都有的选择,这个呢,虽然会影响一些准确性,但是呢,是在提升它的稳定性。那 deepsea 的 论文措辞呢,也很保守,说的是 may improve training stability。 所以说明在万亿参数的 m o e 模型的运行率中,没有什么是百分之百可靠的。说完运行率之后呢,说一下 deepsea v 四的中训练和后训练,所谓的中训练叫 mid training, 后训练公司呢,这部分呢,横列叫 continuous pre training, 它注入了海量的阳性 data。 换句话说呢,原来很多的模型是先做一个聊天的模型,再用聊天模型去适配智能体, 那 deepsea 呢?他一上来呢,就像梁文峰之前说的,这版模型就是为智能体而生的,所以他在基础学习阶段就见过非常的长,任务链环境反馈和协调 oxygen 工作,剩下就是他的后训练。 做训练呢,其实很有意思,跟我前面的视频和我们自己公司的做法是很相似的。两个重要的逻辑,一个是关于它的 reward model, 第一次选择引用了一个叫 generative reward model g r m 的 模型。这个呢,在我们公司呢,就叫 u b universalifier。 它呢,其实是针对一些难以验证的任务,就 how to verify 任务。所谓这种比较主观任务,没有用传统的 scale reward model, 类似数学变成这种可以验证的快速的直接给答案的这种可以分数的模型。而是呢,通过预设的 rubric, 就是 评估选择生成一个详细的评估报告,并从多维度呢去做打分。那 这个报告呢,反过来呢,也能给模型指出正确的发展方向,这是 deepsea 内部的回报方程的优化。在这样的回报方式之下呢, v 四的后训练用的一个很重要的方法叫做 multi teacher on policy generation, 就是 多教师在线策略抷瘤。它的所谓抷瘤呢,并不是抷瘤 cloud 这样的速断模型, 而是分两步。第一步呢,针对不同领域训练自己的 specialist, 就是 专家模型,包括数学专家、代码专家、 a 政专家以及办公专家、执行专家等。再通过多个专家去抷瘤到自己的 mo 大 模型里, 那其实如果没有 mo e 的 这种极大程度的大模型的话,它也可以通过多个专家通过手动路由来完成任务。那 mo e 的 逻辑呢,就是把这份路由的工作内化到模型内部,同时呢,再通过 shared experts 实现一些涌现能力。 另外重点就是 mo e 的 去年过程中呢,其实 v 四并没有缓存专家模型的 largest, largest 呢,就是最后的 to token 的 给出的 token 概率,这其实是一个显性的展示,而缓存了专家模型最后层的 hidden state, 就是深度学习网络的最后一层更隐性化的内容。训练时呢,按需呢,通过 prediction head 来重建到,这相当于它不是在缓存这个答案,而是缓存了得到答案的步骤。这步骤呢,比答案的它的整个的空间 space 会小很多,你最后需要答案的时候,你再去做一层计算就好了,这样的话,它的整个的可以生产的专家数量就会多很多, 这是一个很有效的性能的提升。在 a 阵层面呢, deepsea 也为 vce 呢专门做了一些优化。第一个叫做 deepsea 的 a 阵能力呢,在中训练后训练强化学习阶段呢, deepsea 搭建了一个数十万的并发的 sandbox 沙盒的实力,所以呢,它是可以有几十万台虚拟的电脑来跑代码,测 bug, 来不断地生成强化学习的训练反馈的,这是 一个基建的知识。第二呢叫 moe, 这个呢是一个属于通信计算一体化逻辑,因为在 moe 的 架构中呢,其实很多的时间是消耗在通讯阶段的,因为 它需要寻找合适专家,需要路由真正的计算的 g p u 的 掉量呢,其实很多时候在爱豆阶段就是它的很多时候,其实空闲的 deepsea 呢,尝试把通信跟计算都融进一个 single, 一个 hyperline column, 一 边传送一边计算,防止呢 g p u 在 中间中没有有效的发挥,基本上是把 g p u 的 功耗给炸满了, 像一边看食谱一边烧菜,而不是食谱看完之后再烧的一个逻辑。再者就包括他们自研的 d s m l, 是 deepsea 自己设计了一套类似 x m l 的 领域特定语言啊,这个就跟我们公司之前说的 code agents 逻辑是一样,用来替代他们 agent 之间的沟通协议,包括替代 j s 的 沟通方式。这样呢,把工具调用的成功率提升了一个档次。 因为本身 j s m l 这样的格式呢,其实是对人类看的比较稳定,但对 ai, 特别是大模型来说,并没有类似 x m l 这样的,通过定义跟 markdown 标注更加稳定。其他的一些 table 里面,技巧包 或 reasoning effort 分 模型训练,比如说不思考的 non think 模式, high max 模式分别训练,目的就是做到能省则省,该狠则狠,以及 interleave thinking 就是 miss 呢,是在 to calling 观念下呢,保留了完整的跨认知的推理历史,不是只做模型的推理能力的优化,而是包括各种工具的使用,跨维度的,长期的信息保持连贯性, 防止用户二次使用时候丢失它的记忆信息。以上呢,就是我们看到的 deepsea 在 tech report 里面做出的一些很重要的预训练跟中后训练的一些技能提升的技巧。

deepsea v 四刚发布我就开始用了,我使用的是 cloud code 接入的 deepsea v 四 pro 啊,怎么用呢?我跟大家说一下。 首先呢,咱先安装一个 cloud code, 那 这个安装 cloud code 呢,就是咱得有一个 node 啊,安装 node 之后呢,执行 npm 命令, cloud code 就 直接装完了,但是装完之后呢,这个 cloud code 需要登录才能使用,很多小伙伴就卡在这了,因为这个网络问题,咱登录不了,对吧? 那所以呢,这块儿咱可以改一下 cloud 的 配置啊,修改 cloud 的 接收文件,然后加一个配置项,这样就可以跳过 cloud code 的 登录就可以直接用了。但是跳过登录之后,大家又发现一个问题,就是 cloud 的 模型人们用不了,对吧?那怎么配置这个模型呢?哎,有一个开源工具啊,叫 cc switch 啊,咱下载一个 c switch, 然后在里面呢可以添加一些模型。那这里呢,我们就可以添加 deepsea 啊,然后在配置项里面写这个 deepsea v 四 pro 啊这个名称。然后呢,加入 deepsea 的 这个 api key, 可以到 deepsea 官网注册一个啊,有这个 api key 模型咱们也设置好了,然后关闭 c c switch, 再打开 cloud code, 就 可以看到。现在的模型呢,是 deepsea v 四 pro 啊,现在也可以正常使用 cloud code 了。然后为了方便呢,我又在 vs code 里下载了一个 cloud code 的 插件 啊,那默认的这个插件也是需要登录的啊,但是因为咱们配置了这一次文件啊,又添加了 cc switch, 所以 这个登录界面呢,直接晃一下就挑过了啊,我们就可以直接在这个 vs code 里面使用 cloud code 啊。我问他啊,你现在是什么大模型? 大家可以看到啊,他后台使用的是 deep stick v 四 pro, 那 这个就是用 cloud code 接入 deep stick v 四 pro 的 流程。

朋友们,你们在 cloud code 上配置 deepsea v 四的时候,千万不要忘记配置这个上面的 e m 了,还有下面的 max, 我 相信很多人都是用这个 cc switch 的, 然后 cc switch 上它默认是不会给你加这上面的东西的,所以你可以直接让 cloud code 帮你给加上去,我刚才就看他直接把我加上去了,这样你的上下文跟思考能力才是最大的。

很多人都在问 deepsea v 四到底强不强?我今天不吹参数,不看跑分,也不复读发布会我直接告诉你, 普通人到底该不该用。因为现在很多 ai 发布最大的问题不是不够强,而是你看完一堆宣传,最后根本不知道它能不能真正帮你干活。而 d e e p s e k v 四这次最关键的其实只有五件事。第一件事, 它不是那种一夜图榜的模型,你别指望它刚发布就把所有顶级闭源 ai 按在地上打,但重点是它重新回到了第一梯队。什么意思?以前很多国产模型最大的问题是不稳定,有时候很强,有时候像失忆。 但这次 deepsea v 四明显开始往稳定生产工具走了,这很重要,因为真正能进入工作流的 ai, 不 一定是最炸裂的,而是你敢长期依赖的。第二件事,这次真正被低估的不是跑分,而是百万级上下文。 很多人还把 ai 当聊天机器人,但现在已经进入智能体时代了, ai 不是 陪你聊天,而是开始帮你读文档、拆任务、调用工具,连续执行。这时候上下问一短,问题就来了,任务做到一半直接断篇,前面说过的话,后面全忘。 所以 deepsea 这次把长上下文做起来,本质上是在铺 ai 工作流的基础设施,你现在可能感觉不到,但未来所有自动化协作 ai agent、 长链路任务都会越来越依赖这个能力。第三件事,很多人看模型只盯着 api 价格, 什么一百万偷啃多少钱,但真正做项目的人都知道,单价根本不是重点,重点是同一个任务, 你到底要改几轮?有些模型虽然便宜,但你改十次他都理解不了,最后头肯越烧越多。真正该算的不是调用成本,而是任务完成成本。 这也是为什么有时候贵模型反而更省钱。第四件事,很多普通用户最容易犯一个错误,所有任务都开最强模型,其实完全没必要。如果你只是写文案、做总结、整理数学、 多步骤任务、 pro 版本,差距就会慢慢出来。真正聪明的玩法,不是无脑上最贵,而是普通任务用快的关键,任务在用强的,这才是 ai 时代真正省钱的方法。第五件事, 也是最关键的一件事。 deepsea v 四真正值得测的,根本不是网页聊天框,而是智能体工具,比如代码助手、自动整理资料、知识库问答、 pdf 报告生成、自动化工作流。因为只有到了真实流程里,你才能真正感受到长上下文 工具调用、中文表达能力到底有没有价值。但这里我要提醒一句,很多人现在对 ai 最大的误解就是觉得模型升级以后就能全自动驾驶,其实并没有。复杂任务里, ai 依然不一定会主动选最合适的工具, skill 插件、外部调用很多时候还是需要你自己判断,所以它更像什么,像一个效率极高的协作者,而不是一个完全不需要人类的大脑。最后说一句, 这次 deepsea v 四真正重要的可能不是超越了谁,而是它在持续开源,持续降低门槛,持续推进国产 ai 生态。 这意味着国产 ai 开始从跟随慢慢进入,共同探索下一代智能。如果你平时经常写内容、读长文档、做代码、搭 agent、 跑工作流。我建议你认真试一下, 不是为了追热点,而是看看它到底能不能让你的任务更快完成。但如果你只是偶尔聊天,也不用焦虑,你不会因为没有某个模型就错过一个亿。记住一句话,模型排名只是参考,能不能进入你的工作流才是真正的关键。我是 ai 知识博主麦克飞 k, 后面我会继续用普通人的视角拆 ai 模型,拆 ai 工具,拆 ai 工作流。别迷信单个模型,真正的红利永远属于会把 ai 放进流程里的人。

deepsea 微四降 ai 率是真的狠,学长今天就手把手教你们怎么十分钟就把 ai 降到个位数。第一步,先把初稿论文复制一段出来粘到里面去,然后注意了,这里必须要贴到专家模式,不然还是之前的老模型。然后把深度思考打开,把这段提示词指令给输进去,基本上几分钟就能搞定一段内容, 偶尔碰上降不动的情况也很正常,多试几次就好。这方法唯一的短板就是太耗时间,得一段的复制黏贴,而且还容易改变文章原意。这种笨办法很明显不适合学长的, 都现在这个时候了,用这招也铁定赶不上趟了,直接把初稿整篇打包丢进去,再挑好你学校指定的检测平台,也就玩把游戏的功夫,一篇既保住了原文原意 ai 率又在合格线以内的初稿就到手了。

今天全网都在吹 deepsea 微视,我先说一句,可能很多人都不爱听的话,你先别跟风下结论,先自己去用一遍。我是属于比较深度在用 ai 的 人,并且我公司也是在做软件开发的,目前国内国外的大模型 我基本都是长期在用的,包括切的 gpt、 gimini, 也包括这两天很火的 deepsea。 我 给你说一个很真实的感受,这不是说谁更牛的问题,而是阶段不一样。很多人现在刷到几条案例就开始说已经全面领先了, 但你真正拿去做复杂一点的事情,比如写一整套逻辑结构,做深度推演,连续多轮对话,你会明显感觉到一个东西,就是理解深度是有差距的。我不是说 deep sea 不好,相反它已经很强了。 但你一对比就会发现,有些时候啊切的 gpt 和 gmail 更像是在帮你思考,而 deep seek 有 些场景更像是在帮你整理,这个区别只有你真正用深了,才会有感觉。所以我特别建议你一件事情, 别听别人讲,自己去试。同样一个问题,丢给三个模型,你看谁给你的答案更有逻辑,更有深度,更像人,你自然答案就有了。我讲这些不是为了打击谁,恰恰相反,我觉得现在最需要的是理性, 而不是情绪。国内 ai 这两年的进步是非常快的,这一点必须承认,但客观来讲还是有提升的空间。技术从来都不是一夜之间就能做到顶的,它一定是一个长期积累的过程。 所以如果你是真的想用 ai 去赚钱,去提升效率,去做事情,你就不要只看谁火,而是看谁更适合你当前的需求。最后 我只说一句话,不要被情绪带节奏,真正有判断力的人都是自己用过之后再说话。你可以现在就去试一试,然后再回来看看你的答案会不会不一样。

不幼于玉,不孔于匪,率道而行,端然正己。这是 deep sea v 四在官方公众号发布文章中的最后一段,也是令我印象深刻的一句话。我看到这句话的时候呢,肃然起敬。 这句话啊,出自战国时期儒家经典的荀子非十二子,用大白话解释一下,就是不被赞誉所诱惑,也不因诽谤而恐 惧,始终遵循呢道义行事,端正自身,不被外界一切所动摇。我觉得描述 deep sea 再好不过,在 ai formal 情绪冲刺的时代啊,能够进 静下心来搞工程技术突破,这就很不容易了。这个视频呢,我想跟大家来解读一下。 deepsea v 四不会太技术,会先讨论一下 deepsea v 四的基本情况,也会讨论大家关心的华为升腾芯片用在什么地方,我们也使用一下 deepsea v 跟 cloud skill 能不能兼容。那么话不多说, 我们直接开始。先来看一组数字啊, deepsea v 四呢,分成两个版本,一个是 flash 版本,也可以理解为是一个经济的版本,两千八百四十亿的总参数, 一伙呢,一百三十亿,这些数字是什么概念呢?你可以把它想象成一个团队,那 pro 呢,就是一个一流的专家团,那 flash 呢,就是高校的突击队。你现在去官网呢?如果你使用的 instant 就是 快速给你处理,回答呢,它调用的就是 flash 的 模型,如果选择的是专家的模式,它调用的就是 pro 的 模型。 这两个模型最大的亮点,他们都能够一口气读完一百万的 tok 的 上下文,相当于呢,把三体的三部曲从头看到尾,然后回答以 关于其中任何一个细节的问题。然后 v 四也做了一个特别聪明的动作,就是它把整本书压缩成高度浓缩的栽秧锁影,只要在需要的时候去精读对应的段落。这样一来呢,同样是百万字的上下文, v 四 pro 的 计算量呢,也只有前代 v 三点二的百分之二十七,这个显卡占用呢,也只有百分之十。 v 四 flash 呢,那就更狠了,计算呢,只有前代的百分之十,显卡占用只占百分之七,也就是说呢,它既读的又多又快,还不怎么费显卡。这是怎么做到的呢? 背后其实就我们这边提到了三大神技,第一个神技啊,我们叫做混合注意力机制,简单来说就是精读加贩毒。那 v 四内部呢,也有两种阅读模式交替工作,也就是这个 c s a 和 h c a 分 别对应精读和贩毒模式。打个比方呢,你现在有一百万本书的超大图书, 然后你是其中的管理员,有人就会跑过来问你,比如说一九八四年洛杉矶奥运会女排决赛,中国队的助攻手是谁?传统的做法,你就是把一百万本书全部搬出来,或者说你用图书馆的解锁系统看看哪一个是可能相关的,一夜一夜翻,干到天荒地老。那 v 四的这个 c s a 清读模式它是怎么做呢?它是先把每四本书呢合成一本 摘要册,然后再快速扫描所有摘要册目录,立刻锁定其中三本,比如说体育、排球,一九八四相关的 书籍,这种三类型的书籍,把它抽出来,然后答案就可以很快的找到了。那么如果用 h c a 这个贩毒的模式呢,它其实就是把每一百二十本书,这边一百二十本有可能不是一百二十,蛮真实啊,这边是给大家举例子,把一百二十本书呢,就会合成一个主题的卡片,然后快速先扫一下所有的卡片, 万一发现呢,一九八四的时代周刊核电本有提到过这个比赛呢,他就会把它纳入后续这样精读,加上贩毒的这个交替进行,就 可以保证全面又准确。这就像不像你考试的之前呢,你去快速通过目录来找重点,先复习老师提过的考试的重点,然后呢也会把握一下全书的这个脉络,这就是 t p c 的 第一大神技叫混合注意力机制,分别有精读和泛读两种。那么第二个呢,叫流行约束超连接,是不是很难理解?它叫 简单来说呢,就是给一个大楼六十一层的大楼装上了真空的管道。 v 四的 pro 呢,有六十一层深啊,参数有一点六万亿。你可以想象着一座六十一层的摩天大楼,然后每一层呢,它都在处理各种各样的信息,然后向上传递,普通的做法就是直接坐电梯,然后一层一层往上走,对吧?文件呢,有可能在过程中呢被风吹上了, 或者到顶层呢,这个信息都乱。流行约束超连接这个技术呢,等于在大楼中央装了一个真空管道系统,然后文件呢,可以封进 这个标准胶囊里面,里面磁力导轨呢,可以保证不翻滚不丢失。那么无论从哪一层发出呢,到顶层呢,可以保证几乎完好无损的这个信息,这就要让再生的这个网络呢,都能平稳的进行训。 第三个呢,叫做 m u o n 的 这个优化器啊,那么所有的大模型啊,都需要用到优化去去降低 loss, 相当于健身教练帮你去调整动作。行业默认的教练叫做 adam, 这是在 machine learning 时代就非常流行的优化器了,它是给每个参数呢去调一个固定的幅度,但参数之间呢,互相影响,调完这个可能另外一个又歪了,所以呢,你就不断地进 行念经,那 m u o n 就 相当于一个智能私教,这个新教练呢,他就聪明多了,他确保你调整所有的动作的方向呢,彼此垂直或 不干扰,就像这个图一样,这样训练呢,就可以保证又快又稳。那 v 四就用到了这个 m u o n 的 训练优化器,训练一点六万亿的参数,就等同一个教练同时指导了一百万个动作进行协调优化,这样呢,去保证我们这个优化平稳的进行。 接下来聊聊大家关心的问题啊,华为深腾和英伟达的 g p u 到底谁干了什么活?那这可能是大家最八卦的问题了。先说结论,预训练阶段,也就是从零开始把模型喂大的这个阶段,虽然文中没有明确表明,但 大概率还是用的英伟达的 g p u。 这个没有办法,目前超大规模的训练呢,成熟度最高的还是库打的生态。但是在推理优化这个环节呢,华为生成的 n p u 真正证明了自己达到了生产级的验证。 deepsea 的 论文里面有一句话特别有意思, 说我们在英伟达 g p u 和华为生成的 n p u 上两套平台上呢,都验证了推理加速方案,那什么方案呢?它叫做 maga m o e, 细力度专家并行。你先别管这个名字叫什么呀, 就是它能让推理速度呢提升一点到一点七倍,延迟敏感的场景呢,最高能达到一点九六倍。在大模型的推理场景中啊,第一次获得这么权威的实战认证,也是国产 ai 芯片值得骄傲的一件事情呢, 不是象征性的跑一跑,而是真正生产级的验证。那么再具体一点呢,华为的升腾九五零超节点呢,已经完成了对 v 四的深度适配。下半年大家觉得 v 四 pro 的 a p i 价格会比较高,但是因为现在算力还不够。 值得一提的是,除了华为的生产以外,国产的像韩五 g 啊,海关木兮,还有魔幻城等等的国产芯片呢,也完成了对 deepsea v 四的适配。所以你看,虽然御系列的城墙呢,还在英伟达的手里,但是在推理这 条线上的裂缝已经有些明显了,也难怪老黄呢,前段时间的播客采访,希特跳脚,那这个表格呢,展示了一下各个阶段里面具体用的一些技术,像预训练阶段,就是刚我们说的还是主要用的 gpu, 那 后训练阶段呢,就是 gpu 再加上它的深层呢,在文中提到了它用于 flash 版的一个续训练的适配,然后 做了一下这个序训练也是被作为微调。那推理服务呢,在双平台都做了验证,未来推理呢,还进行扩容。 deepsea 呢,也在文中呢,基于 v 四的训练和推理实践呢,向芯片的硬件厂商呢,提出了非常具体的改进方向,分别有四条,涉及一些通信啊,激活函数的一些东西, 属实共创生态的典范。 deepsea 微四啊,不只是会聊天,它是真正会干活的。所以 deepsea 在 后训练阶段里,专门给 deepsea 这个 v 四塞进了几百万条真实的 agent 的 交互轨迹,让他去学会像人一样使用工具,打开浏览器去收集信息啊,调用计算器啊,操作文件系统啊,甚至去调用多个 a p i m 完成一些跨领域的任务。举一个直观例子,你可以跟 v 四 pro 说,把我文件夹里面所有的 pdf 转成文本,或者说找出对应的段落,整 理成 excel, 发我邮箱等等。这当然也是现在大冒险发展的一个方向,就是 agentic task。 关于 deepsea v 四的 benchmark, 我 不想说太多跑分 的内容。 deepsea 这篇报告里面有一个非常值得称赞的地方,就是他们不止展示了这个编程 bug 的 成绩,还专门测试了四类真实世界任务,并附上了与竞品的对比,比如说跟 cloud open 四或者说 jimmy 三点一 pro 进行了对比。这四类任务是哪四类任务呢?第一个是中文的写作,还有第二个是搜索,第三个是百里任务,最后是 coding agent 就 进行了代码的测试。从例子中可以看出来,他们在他们自己的量化团队做了测试,包括呢,写作啊, ppt 或输入代码 说我们来看看中文写作好了,在功能性写作上面呢,他有说 g b c v 四呢,在大多数情况下都是比 jimmy 三点一更好的,而且在创意写作上也是比三点一更好的,但是在复杂和多人写作上呢,他们也承认还是略逊于这个 cloud open 四点五的。那针对于搜索呢,如果你没有开启思考模式呢, 它就是用的 r a g 的 技术,但是如果你开启了思考模式呢,它就会启动 a g t search。 然后也说下百里任务啊,百里任务呢,其实就是一个内部评测器,它去模拟真实职场的使用场景,比如说写报告啊,分析数据啊,查找邮件啊,整理会议纪要等等。 这里面 deepsea 呢,也展示一下他们输出的一些内容,包括比如说 ugc 传播,社交裂变,还有 deepsea 内部搞电话投资,有分波段投资,拆解和资源配置等等。值得一提的是啊,这个白领任务呢,在中文白领任务上面做一下测试。 deepsea v 四 pro max 呢, 是比 opus 四点六 max 表现是更好的,这也被认为呢最实用的一些能力维度。关于 vip coding 这方面呢,邀请了大概八十五位专业的开发者在真实工作中进行盲测。那么其中有百分之五十二的同学呢,觉得 deepsea v 四 pro 呢,已经可以当他们主力编码模型了, 体验优于 cloudsonnet 四点五。那 deepsea 这一次罕见的克制呢,在公告里面也主动承认了,跟币源最强模型的思考模式呢,还是有差距,那这种实事求是的态度,本身就是一种自 信。最后说一下价格啊,这也是 deepsea 一 贯的价格屠夫的风格。 v 四 flash 呢,输出价格每百万 token 呢,只要两块钱,那 v 四 pro 呢,输出要二十四块。相比之下呢, gbt 五点四, cloud open 四点六呢,差不多都要贵五十倍左右。最后做一下总结啊,总结几个常问的一些问题。第一个是 v 四训练全部用了生成的芯片吗?这个是不是的预 系列呢?大概还是用了 n v i g p u? 那 推理车呢?升腾已经可以对标,那库达生态有没被取代呢?短期内还是不会被取代的,但推理车这个壁垒呢,已经被突破了。什么叫 magma o e? 这个就是一个细腻度专家的模型,它可以使整个计算通信执 行呢,加速一点五到一点九六倍,能在我电脑上跑吗?啊,这个模型太大了,在电脑上基本上跑不起来了,但如果你电脑足够强的话, flash 版本是可以尝试部署的。 v 四是最终版吗?目前发布的呢,只是预览版,那之后呢,有完整版对外发布。最后呢,我们来测试一下调用 skill 的 能力,看看是否能够很好地兼容 skill。 我 们可以在 cc switch 里面装上和开启这个 deep seek, 就像我这样的,然后打开 cloud。 我 们先来试试官方的一个 from and design skill, 我 们可以斜杠输入,找到 from and design, 然后输入这么一个任务, prompt。 据当前目录下,这个 deepsea v 四的 pdf 呢,就是 deepsea 出的这个技术报告,我让他去生成一个解读这个技术报告的 html 文章,然后面向 普通大众。 ok, 去,我们先看一下它能否加载这个 skill 啊,它已经完成了这个 pdf 的 阅读,它转化成了这个 txt 文件,然后整个阅读了这篇文章。之后呢,它就开始创建这个 html 文件。 ok, 结果已经生成出来了,它做了一下总结,说采用了深色科技风格,然后大概啵啵说了一堆,我们直接来看这个效果吧。点开哦, 这个还是挺有 feel 的, 它也调用了这个前端的一个 from end 的 skill, 然后去生成了啊整个这个文章的结构。因为我经常用这个 from end design 的 skill 呢,所以我知道大家风格其实它是非常尊崇这个啊 cloud skill 的 风格的, 从这个角度来说,它可以适配我们已有的这个 skill, 这样的话就会方便很多了。我自己也测过呢,你也可以用这个 superpower, 因为开发的时候我经常用这个 superpower 的 这个 skill, 然后用这个 skill 呢去做一些 开发,它相当于一个 harness skill 级别。之前我的视频也有分享,也可以用在这个 deep seek 的 模型当中。总结下来就是 deep seek 也可以适配于我们不同的 cloud 已有这些 skill。 ok, 本期视频就到这里了,如果你觉得还不错呢,欢迎点赞、收藏和关注,我们下期再。

我们快速解读一下这一轮 deepsea v 四预览版到底在发生什么。其实一个很直观的感觉,就是两件事一起拉满了,一个是性能,一个是价格。先说 v 四 pro 这边,它其实已经不是简单对标开源模型了,你会发现它是直接往顶级闭源内档去贴的。 像 agent 这一块,实测下来,使用体验是比 sonic 四点五更顺一点的。但如果你看最终交付质量,其实又还没完全到 oppo s 四点六思考模式那个水平,更接近它的非思考模式。然后世界支持这一块,它已经是明显把开源模型甩开一截了。 但你说跟最顶那一档,比如 gemini pro 三点一比还是差一点,但差距已经不是一个量级的问题了,更像是还没完全贴上去。反倒是数学 stem, 还有那种竞赛型代码 这一块, v 四 pro 其实已经把现在公开测评里的开源模型都压过去了。这个信号还是挺明确的,就是它在硬能力这条线上是有突破的。 再看 v 四 flash, 其实就更有意思一点,它在世界知识上确实弱一档,这个没什么悬念,但你看 agent 的 测评,在简单任务上,它是能跟 pro 打平的,这说明什么?说白了就是很多日常任务其实已经不需要最强模型了,但一旦任务复杂起来,它还是会掉队。这个分层就很清晰, 关键不在能力,在价格,它的输入成本只有 pro 的 十二分之一。这个东西一旦放到实际业务里,你会发现决策逻辑就完全变了,再叠加后面升腾九百五十超节点, 如果真的安预期在二十六 hr 落地, pro 的 价格还会往下压,那整个价格带是要被重写一遍的。再往下看,它这次的技术点其实核心就两个,一个是上下文,一个是 a 卷。 上下文这一块,它用的是 d s a 吸收注意力机制。你可以简单理解,它不是把一百万 token 一 行一行读完,而是能快速抓关键点,然后再去做推理,等于什么?就是有效计算量被压下来了,所以它敢把百万上下文直接做成标配,这个不是单纯堆参数能做到 的,是效率真的上来了。然后 agent 的 这一块,它其实是有点定向优化的意思,像 cloud code、 open curl、 open code body 这些主流 agent 的 工具链,它是专门去做适配的。 你会看到的结果就是两件事,一个是代码任务更稳,一个是文档生成,这种片结构化输出的任务质量在提升,这就不是单点能力提升了,而是在往可交付能力靠,最后再落到产业链。 其实逻辑也比较直接,只要承认一点,就是这种模型再往更大上下文,更高调用频率走,那算力一定是被带起来的。所以深腾这一条链路,像华丰科技、杰华特、航天电器、韩五 g 这些都是直接相关的。 再往上一层, a 准的优化,其实是更吃 cpu 调度和内存带宽的,所以海光信息、蓝起科技这种也会受到影响。 然后再往底层走,算力需求一起来,金源厂也是有关联的,中兴国际、华宏公司这些本质上还是在吃这一轮国产算力扩张的贝塔。你如果把这些连在一起看,其实会发现一个变化, 模型这边已经不只是谁更强,而是开始在谁更便宜的做到足够强,以及谁更适合直接拿去干活。这个方向一旦成立,后面的产业链节奏基本也就跟着变了。

兄弟们, deepsea 微四看完我的微信,说跟我关系最铁的居然不是我妈,是我的同事,我寻思这也太准了吧!哈喽,兄弟们,我用 deepsea 微四和微信的 c r i 戳出了一个小项目,叫聊啥呢?它可以直接读取你的本地微信数据,用 a 来帮你分析聊天记录。 两个功能,一是把你今天所有的未读信息整理成一个报告。二是刚才给你看的,可以分析你和每位好友的关系温度。 每天下班之后,微信里一堆消息没有看,但你根本不想一条条翻,哪些真的要紧,哪些是群里瞎聊的,你根本就不知道。所以你可以一键点击这个分析功能,他会先打通你的微信本地,然后通过微信的 c r i 工具读取你本地的微信记录。 注意看,上面是报告,告诉我有多少个绘画没有读。橙色是相对要紧的,绿色是睡觉前刷刷也来得及。紧接着会给你一份详细的分析报告, 哪些消息是值得我们快速去关注的,哪些只是群友水群,他帮我做了那个值不值得回的决定,而就这个决定每天要消耗二十分钟,个人回话和群撩都会统计,最后给你一个整体的氛围。第二个功能也非常好玩,我们点击温度测试,点击开始分析 他。同样呢会连接你的本地数据,然后拉取你和每个人的关系图谱。注意看,这张图有说法,红色的代表和你关系很近,打分达到了八十五分以上,而绿色可能就相对边缘。点击任何一个图标, deepstack 都会帮你判断这个人可能是和你什么关系,并且给他一句话的描述? 这个概括还是挺详细的,概括商务合作伙伴,利益驱动型,还挺准的,那相对疏远的人可能打分就低一点。同时他会查看我们聊天记录里的信息,当我和一个聊天记录里出现了另一个人,他就会判断我和这个朋友之间也会有关系。 于是他俩之间的连线就代表了我们之间可能共同存在的关系或群。你。当你每天持续的打开这个工具做分析的时候,你的朋友拓普会变得慢慢大起来。每个朋友和我之间的关系, ai 也会替你概括好。这个是不是非常有意思? 但你知道最有意思的是什么吗?这个是我的工作号,所以工作号里面的好友更多的是工作关系。我刚才悄咪咪登了一下我的个人号,你知道 deepsea 会告诉你谁吗?他告诉你列表里和你聊天最多的人是谁, 告诉谁主动找你的次数最多,谁每次都秒回你,谁的信息总是比你长,你想知道列表里谁暗恋你吗?可能 ai 分 析的比你自己感觉的还要准, ok, 兄弟们,至于技术上怎么实现的,其实非常简单,你需要先装一个微信的 c r i 工具,这是 一个 github 上的开源项目,直接把它丢给你的 cloud code 或者 code x 就 可以帮你安装。如果你是 mac 电脑,你需要在本地对你的微信进行一次重签名,它才能扫描内存。读起你的聊天记录,就是数据库的加解密工作。这一部分都比较简单了, 详细的教程我在我的近节课里有讲到,那前端的 deepsea v 四也是 t m l 读取就可以解决,两个文件两百行代码搞定。感兴趣的评论区支呼一声,代码我开源给你玩,我是麦当,带你们 ai 玩点吃鸡的点赞关注。

deepsafe v 四 pro 目前有 api 的 折扣,那么我们今天就来讲讲用 cloud code 如何进入 deepsafe v 四 pro 来实现编码和自动化办公。有一些小细节你一定没有注意到,那么本视频面向的是一些刚开始接触 ai 自动化和 web coding 的 新手大佬和技术专家,请自行跳过。 那么随着国产模型的崛起,想要进一步的进阶,使用 deepsea v 四一定会接触到 cloud code, 那 么这个工具大家一定都听过。另外我们前期准备的工作,我们需要准备 deepsea 的 api 来接入这个工具。如果你不知道如何选择 open curl 和 cloud code, 那 么我来这样形容, code code 更像是一个工程师的助手,更趋向于严谨务实的风格。而 open code 龙虾呢,则像是一个操控电脑的秘书,可以通过飞书等很多聊天软件去接入,他们两个在一定情况下都可以完成相同的任务, 所以不用纠结,选择你的一个工具开始。那么我们这里先从 code code 讲起。很多人看到这种黑色的窗口和面内行,对使用这种工具就会有一种莫名的恐惧感,是不是需要会写代码才能用?是不是需要浪费很多时间? 完全不需要担心,这个窗口只是我们和计算机语言的交互的窗口,我们如果有什么需要他来执行,那么在这里打字告诉他去做就可以。 接下来打开进入命令行,我们粘贴两行命令。这个命令的意思是我们从国内镜像站中下载 copy 这个程序,没记住的朋友们也没关系,我会把我们需要输入的地址以及命令行全部打包成一份文档给大家,这样大家就可以直接复制粘贴了。 然后完成后,我们需要从清华的镜像站里面下载一个 get 工具,这个工具是我们 webcointing 中另一个重要的工具,下载完成后点击安装,如视频演示要按照我们视频里面的选项, 然后其余剩余步骤就按照默认选项进入到下一步即可。到这里我们就大功告成了,我们粘贴另一个命令,测试 copy code 是 否下载成功,当出现 copy code 版本号提示的时候,就代表我们已经下载成功了。恭喜你已经完成了 copy 里面最重要的任务。 在命令行里面输入 cloud, 进入 cloud code 显示,让我们选择一个主题,那么这里面呢?我们就随便选择一个主题就可以了。紧接着让我们登录 cloud 账号,但是我们并没有 cloud code 账号,并且想要把 deepsea 接入到 cloud code 的 里面, 那这个时候应该怎么办呢?好的,让我们继续一步一步来。我们先退出 cloud code 的 命令行界面,哪个选项都不用选。首先我们需要配置跳过 cloud code 的 强制登录环节, 我们需要来到用户的根部, windows 的 话,一般是在用户名下面点 cloud, 点 jason, 点选这个文件,用记事本打开,新增一行命令参数进去。 那么增加命令之前,我们需要在上一行结尾处用逗号去结尾,因为代码的要求比较严谨,所以必须要以逗号结尾程序才能正确的识别出来,然后必须是英文的逗号哦,大家不要搞错了, 在这个命令行后面添加一行命令保存,这行命令的意思就是帮助我们跳过 cloud code 的 登录环节, 然后我们打开命令行,输入 cloud, 这时候我们已经进去了,但是发现并不能使用,而且也没有 deepsafe 的 接入,这时候要怎么办呢?如果你都听到了这里,那么你真的已经做到绝大部分人都没有做到的事情,因为你离真正的成功只差百分之五了。 ok, 那 么最后一步,我们来到 deepsafe 的 官网,点击左侧的 apikey, 创建新的 apikey, 这里面注意保存,如果没有保存关掉就不会再显示了,但是关掉的朋友也不用担心,把这个 apikey 删除掉,重新新建就好了。 apikey 相当于你的 deepsafe 的 入口密码,请完善管理。如果你的 apikey 账户里面没有余额的话,可以充值一些进去,然后复制我们的 apikey 一就是来到我们的 c 盘里,这时候是在用户目录的另一个文件夹里,是在点 close 的 文件夹里,又是用记事本打开 settings, 点 jason 文件,我们开始配置这个文件,在这个括号内部要新增一段命令行,这一段命令行在 deepsafe 的 官方文档里面也有, 我们在大括号内部添加这段命令行,那么同样这段命令行也打包在我们的文档里了,方便你们操作。复制粘贴,然后粘贴完成后,我们把 api key 提换成我们刚才从 deepsafe 官方保存的 api key, 关闭并保存这个文件,那么现在进入命令行输入 cloud code 成功,那么恭喜你,你现在已经成功用上了满血版的官方 deepsafe v 四 pro, 而且刚才我们设置已经把思考模式拉满了, 并且 cloud code 是 原生支持一百万上下文的,而且就在刚刚的命令行里面,我们已经按照规则添加了适配的配置, 给自己点一个大大的赞吧!我们一步一步把真正的国产模型放进了顶级的自动代码工具中。那么 cloud code 加 deepsafe v 四到底能做什么呢? 这个想象空间是无穷的,你可以让他帮你做 ppt, 写一个购物网站,写一个个人薄客,帮助你调查某件你感兴趣的事情,甚至是帮你打游戏,帮你浏览网页,帮你看视频,去收集重要的信息,帮你回复朋友的消息, 一切能在电脑上做的事情,他都能帮你做,甚至你可以让他帮你装一个 openclo, 并且帮你配置好。太好玩了,很多人拿 cloudclo 来维修 openclo, 或者是拿 openclo 来维修 cloudclo 的, 两者之间有一种互补的能力。 好了,好好享受 deepsea 微四的能力吧!朋友们,相信通过我们的不断使用,使得 deepsea 获取到更优质的用户编码数据,让微四的代码能力以后会变得更强。那么我们下期视频再见!