最近的 ai 圈啊, gbt 和 deepsea 实在是太火了,先是 gbt 五点五发布,号称在一些精准测试里击败了 cloud 的 传说模型 mesas, 紧接着 deepsea v 四也来了,继续保持开源跑分,直逼顶级的闭源模型,现在基本可以说是国内最好用的模型之一了。 那经过最近一段时间的高强度使用,今天我就把 gbt 五点五, dbc v 四 pro 再加上稍早之前发布的 oppo 四点七,放一起做个横向对比,看看 dbc 到底能不能追上顶尖的国外模型。那开始之前别忘了点赞加收藏。 首先我们看一下三家公布的跑分软件工程能力这块,也就是真实 get 上的代码问题修复, oppo 四点七是百分之八十七点六,三家里面最高,比 dbc 高出七个点, 更难更多的文件和复杂的工程问题也是 opus 领先,所以做复杂工程的代码修复 opus 还是很稳的。但是中单任务这块, gpt 五点五反超了百分之八十二点七,比 opus 高出十三个点,做命令行跑 agent 的 gpt 五点五会更加的优秀, 然后长上下文解锁 dbc, 竟然跑到了百分之八十三点五, opus 才三十二,差了一倍多,处理超长文档,显然 dbc 会更加的靠谱。 价格方面 deepsea 就 没什么对手了,输出每百万 token 才三点四八刀, gbt 五点五和 opus 分 别是三十和二十五刀,差了将近七倍,不得不说 deepsea 是 真的良心。当然了,榜单归榜单,实际用着怎么样还得看下面的实测。 好,那我们进入第一个案例,在这个场景中,我们先回归大模型最本质的使用方式,原声尺的对话框。虽然现在大家都在整 a 阵的自动化,但一个模型底层的逻辑素质和指令遵循到底行不行,尺的对话框还是能看出很多问题的。这边我把三家大模型的四号模式全都打开,并且都使用了最高的强度。 然后我的问题是提出一个我想做一个开源的笔记类 app 啊,对标 out 店这种本地优先的产品。在动手之前,我需要让三个模型帮我做一轮技术的选型调研。 那为什么会选择这个呢?首先第一步我让他去找资料,考验搜索和筛选能力。第二步是读代码读文档,考验技术理解的深度。第三步啊,则是去看产品,考验抽象和归纳能力。第四步则是给建议考验综合判断和落地的能力。 可以看到这边三家已经跑完了,我们先来对比一下生成的速度。首先最开始输出回答的是 deepsea 啊,接下来是 cloud, 最后是 gpt, 然后输出的内容最长的是 cloud code 啊。然后为了保证客观的公平性,我这边直接把三份三个模型输出的呃大模型的回答整理成三个文件,分别交给 gmail 和千文来进行一个分析。 先看一下杰米兰的回答,他这边选择的是模型币啊,因为他认为作为一个独立开发者,模型币的整体表现会更像是资深的架构师,而不是仅仅的是信息的搬运工。那模型币对应的就是科奥的 opus 四点七, 那 gpt 和 dpc 的 话,他会认为 gpt 的 表现更加优秀。呃, dpc 更多的是信息的一个搬运,并没有站在一个工程化运维的角度去看待问题。 接着我们再看一下千问啊,那他这边的答案跟 gmail 几乎是差不多的,他也认为是文件 b 对 应的 cloud opus 四点七写的是最好,其次是 gbt 五点五,最后是 deepsea 维斯的 pro。 第二个案例,我这边让三家大模型分别帮我实现一个类似杀入监塔的回合制卡牌游戏。这边 gbt 五点五用的是 codex, office 四点七,和 dbc 比四 pro 用的都是 cloud code 的, 可以看到这边三张模型都已经跑完了,跑的最快的是 office 四点七,用了一分半,接着是 codex 花了六分钟, dbc 则是用到了十五分钟。但我觉得这也是情有可原的,毕竟 dbc 的 价格摆在这边,使用的人是非常多的, 所以也会出现一些限速的情况。那接下来我们看一下三个游戏制作的一个效果是怎么样的。我们先看一下 gpt 五点五啊, 可以看到就是 gpt 还是一如既往的,他的这个前端的风格一直都不是特别好,然后做的这个虽然是游戏,但是看上去还是以前端的那种样式啊,用一种网站的那种方式来做的,然后整体的交互应该是都没什么问题啊,攻击重击, 每回合都能回复能量,所以说基本上都能够啊,打出所有的牌。好吧,这个是 codex 加上 gpt 五点五的。接下来我们看一下 cloud code 加上 opus 四点七啊,可以看到它整个页面的一个样式,相较于 gpt 五点五 啊,是要更像游戏一点啊。然后他整个的风格有点偏啊,像那个三国杀,对吧?然后我们来试验一下,我来尝试一下他这个攻击,然后结束回合。我这边量,哎,这个为什么是智慧的结束回合?敌方回合啊,我这边有三点的呢,哎,为什么是灰的 哦,但是我还能点哦,可以看到他这边是有一个显示的 bug, 就是 我虽然结束回合了啊,敌方回合结束之后,我这边能量是回满了,但是我这边前端的样式看上去还是不能点的。好吧,这个算是有一个小的 bug, 然后我们再看一下 cloud 加上 dbc v 四 pro 的 一个效果啊,可以看到它整个页面的风格跟前两个完全不一样的,它做的是偏手机端的,我们来试一下啊,然后它这个动画效果是做的比较好的,有一个高亮的一个提醒结束回合, 哎,我这怎么点不了了?再刷新一下结束回合, ok。 他 这个是有一个呃,比较严重的逻辑上的 bug, 就是 我打完之后我就不能再点下一个了,但是我如果不打牌,我直接点结束回合,我是能够一直点 的,是吧?可以看到有这个 bug 啊,然后这边结束了,敌方也对我造成攻击的,呃,新的回合,然后我是什么都点不了的。 接下来第三个案例,我让三家大模型扮演资深的供应链架构师,挑战一个综合的实战任务,涉及二零二六版全球自动化决策系统,他们需要同时处理欧盟碳关税的合规和苏伊世运河的罢工重油问题。 可以看到这边三家大模型都已经跑完了,那由于是文档的内容居多,我们还是让 jamie 来作为裁判评判一下。这边 jamie 已经跑完了,我们来看一下,先看最终的结果, jamie 认为第一名是模型 c, 也就是我们的 deepsea, 他 有说到这是一本可以直接交给 cto 的 方案,他不仅完成了任务,还在每一个环节都展现了深厚的行业洞察。 那表现最差的是 codex, 然后它的整个分析还是比较详细的,分别从呃合规于政策的分析,再从逻辑算法的建模,再到最后的系统架构和 a 智能的一个设计,都是呃 dbisc 会表现的更加突出,说明 dbisc 现在的一个综合能力已经是非常的强了。 ok, 这边三个案例都已经跑完了,我们来做个总结。首先三个模型在各自擅长的领域上确实表现很突出, 如果你要做深度调研,或者说选技术路线, oppo 的 四点七更好,如果是代码生成和稳定的实现,则可以选择 g p t 五点五。 如果你是常文本,需要做系统设计或者说企业的架构, deepsea v 四 pro 是 一个不错的选择,而且现在 deepsea 的 价格真的太香了。行,那本期的视频就到这,希望能帮大家在模型的选择上面提供一些帮助。我是布鲁,我们下期视频再见。
粉丝4.2万获赞21.6万

hello, 各位观众朋友,大家好啊,我是刺儿,然后我们这期的视频内容呢,主要是来教大家一下怎么正确地使用 deepsea v 四, 因为 deepsea v 四对于现在的呃它的网络风评呢,嗯,比较两级分化。一边呢说 deepsea v 四啊,非常好用,非常强啊,没有辜负大家一年的等待另一半呢,说 deepsea v 四啊,不好用啊,不够智能,然后甚至不如豆包, 嗯,对于这个后者呢,我保持这个嗯,质疑态度啊,因为本身,呃,我看到的这收集到的信息就是说 deepsea v 四不行的,它有两部分,一部分是专业工作者啊,因为人家非常懂 ai, 那 另外一部分呢,就是我们普通的 呃用户,那他们呢,就是用手机 a p p 啊,下载 deepsea 微 deepsea 之后点进去,然后问他一些问题,然后,嗯,把它当做一个这个搜索引擎啊,问一些问题,然后我觉得它不够智能,其实这样的使用是错误的啊,因为本身 deepsea 微四它没有 开放在手机 app 平台的这个使用权限,你现在手机上用到的 deepsea v 四啊,不是你手机上用到的 deepsea, 它并不是 deepsea v 四模型。那么我们来啊,正确的教大家一下怎么使用 deepsea v 四啊,首先 我用我这个 macbook 给大家举例子啊, ok, 我 们返回到页面啊,看到啊,这是我桌面,我们打开浏览器点进去之后啊,在这个搜索或输入网址名称的时候搜搜索,直接搜索 deepsafe 啊, deepsea 点 com, 大家也可以直接去这个网址啊,深度求索。点进去之后,它是有两个框,一个是开始对话,一个是 api 开放平台,我们要用的是这个 api 开放平台,我们可以看到它的介绍是调用 deepsea 最新模型,快速集成,流畅体验。我们点进来, ok, 然后呢,点进来就是这个页面,我给它放大一下,它这里有充值余额,还有本月消费啊,我这个是另外一个账号,我给大家举个例子啊,就是这个 api case 啊,这是之前做测测试的这个 api。 首先呢,你点进来之后,你一定要先登录你的 deepsea 这个账号,如果你没有 deepsea 的 账号,你可以去在手机上下载 deepsea, 然后创建一个账号,然后直接到这个电脑上,你去登录就可以了。 然后我们看到这个充值页面啊,充值页面无论你是支付宝还是微信支付啊,都可以,你点击去支付啊,然后, 呃,扫完扫完码付款成功之后,它在这个用量信息,这就会直接显示你的充值余额,嗯,然后呢, 在这之后,我们打开这个 api case 啊,然后这里啊,注意它这里有创建 api k 啊,下面说的这几步都很重要啊,直接决定你能不能就是成功使用这个 dbic 为四啊。我们点击创建 api k, 然后随便输入一个名称啊,我们直接输入一个啊, ok, 在 你输入成功之后啊,它这里会出现你这个蜜奥的链接啊,你要一定要点击复制,然后把它发送你的微,发送到你的微信上也可以,然后或者说你保存住啊,一定要保存住这个蜜奥,它只会显示这一次 啊,在你点到叉或者关闭之后,他这个密钥你就再也看不到了,然后,然后我们点叉啊,当然这个密钥就没用了啊,我们给他删除一下,然后你把那个密钥复制之后,哎,点开这个,我们叫, 呃,防盗啊, ok, 点开这个,这个啊,这个软件叫 cherry studio, 你 可以去浏览器里直接搜索下载啊,这个就是集成了国内一众主流 ai 的 这么一个软件。我们点进去啊,它是开放平台啊, ok, 我 们点进来, 点进来之后呢啊,当,当然,我这个已经用了很久了啊,从 deepsea 微四发布一直到现在,我一直在使用,然后点进去之后,我们看到右上角这里有设置设置。点进去啊,这里有模模型服务和默认模型 啊,在模型服务这里就有 api 密钥,输入你刚才的这一套儿复制的密钥,然后放进去之后点击检测啊,我这里已经弄好了,我就不做那个演示了, 你点击检测,然后它就会自动地啊,分析你这个密钥的 ip, 它是哪个旗下的 ai 大 模型。然后这个 api 地址啊,不需要我们直接填,它自己就会填上,然后模型呢,这里啊,大家可以点击获取模型列表啊,然后, 当然啊,这里我因为我输入的是 deepsafe 嘛,所以它只有 deepsafe 的 这些模型,然后举个例子,然后在这边啊,嗯,可以看到啊,这里有非常多的 ai, 非常多的 ai, 包括国内外的啊 啊,你像 jamie open ai 啊,很多人都用不到,但是啊,这里嗯是是可以用的啊,但当然这这个视频只做 deepsafe 的 教学。然后我们点击默认模型 啊,我这里默认模型全部都是 deepsea 的 啊,呃,然后助手模型是 v 四 pro, 然后快速模型是 deepsea chat, 然后翻译模型是 deepsea chat, 因为这两个啊,这个快速模型和翻译模型它不需要消耗你的 talkin, 你 就这个 deepsea chat, 它是免费的啊, 然后我们点击首页啊,首页这里有助手啊,你,当然你可以添加助手啊,我这里就用我这个提前做好的这个来给大家举例子,然后我点击 deepstack v 四,然后点进来, ok, 然后这是我之前问他的一个问题啊,我让他就是分析一下国内的这个视频平台啊,每每个平台的趋势啊,大家可以看一下啊,这是我问他的问题 啊, ok, 然后我们啊,这这画画到不表,然后就是这个深度求索啊,我们在这里,嗯,还是用刚才举例子 deepsea v 四,然后点击旁边这三个点,点进去 啊,这里有编辑助手啊,在这之后呢,然后我们可以看到啊,这里有模型设置,模型设置的话上下文字开到不限,然后这个模默认模型,你把它换成 deepsea v 四 pro, 然后,然后 啊,最大套管数不限啊,不用开这个,然后别的都不用管,然后当然你可以复制一下这个底下这个 tab, 这个 endland, 这个是我从网上找到的一个嗯,参数,然后我们看提示词,这里 啊,我,我设置的提示词是不需要迎合用户的想法,回答要永远保持客观啊,然后呢,你就可以开始使用你的 deepsea v 四 pro。

想象一下,一个 ai 能在一秒钟之内读完整本红楼梦一百二十回, 同时记住每一个细节,每一段对话,每一个人物关系,然后它可以回答你关于任意章节的任何问题。这不是科幻小说,这是 deepsea 微四正在做到的事情。 一百万个 token 的 上下文窗口,相当于七百五十万个汉字,相当于一整座图书馆。今天,我们来彻底拆解这项技术。 deep sec v 四系列包含两个旗舰模型, deep sec v 四 pro 拥有一点六万亿参数,每次推理激活四百九十亿参数。 deepsea v 四 flash 拥有两千八百四十亿参数,激活一百三十亿参数。两个模型都原生支持一百万 token 的 超长上下文。更惊人的是效率。 在一百万 token 的 场景下, deepsea v 四 pro 的 推理计算量仅是 deepsea v 三二的百分之二十七, k v 缓存仅需百分之十。 这意味着什么?意味着同样的算力可以处理三点七倍更长的上下文。这背后是三项颠覆性的架构创新。要理解 deepsea v 四的意义,我们必须先理解它解决的根本问题。 transform 架构是当今所有大模型的基础,但它有一个致命的弱点,注意力机制的计算复杂度是序列长度的平方,上下文翻倍, 计算量变成四倍,上下文扩大到八倍,计算量是原来的六十四倍。在一百万透坑的情况下,朴素实现的计算量和显存占用大到根本无法落地。这就是所谓的长上下文效率危机,它像一堵无形的墙,阻挡着 ai 进入真正的长城推理时代, 无法分析完整的法律文书,无法处理整个代码库,无法进行跨文档的深度研究。 deep sec v 四用三把钥匙打开了这道门。 deep sec v 四的三项核心创新分别是,第一,流行约束超连接,简称 mhc。 它从根本上升级了 transformer 中的残差连接,让超身网络训练更加稳定。第二,混合注意力机制,结合压缩吸收注意力 c s a 和重度压缩注意力 h c a, 将 k v 缓存压缩到原来的百分之二,彻底破解长上下文的显存瓶颈。 第三,密网优化器用矩阵正交化替代传统的 item 方向,大幅提升训练收敛速度和稳定性。三项创新环环相扣,共同构成了百万投肯智能的技术基石。 接下来,我们逐一深入解析。第一项创新流行约束超连接 mhc。 我 们先从残差连接说起,在标准 transform 中,每个 block 的 输出会直接加到输入上, 这就是残差连接,它让梯度可以直接流过深层网络,解决了梯度消失问题。但当网络变得极深,比如 deepsea 这样数百层的模型,标准残差连接会出现信号漂移和数值不稳定的问题,滞约了。进一步扩展超连接。 hc 的 思路是,扩展残差流的宽度, 不是简单的加,而是通过三个先行变换输入映射残差映射输出映射来更灵活的控制信息流动,这带来了更强的表达能力,但也带来了一个新问题,训练时频繁出现数值爆炸。 mhc 的 关键突破是给残差映射矩阵加上一个数学约束,必须属于双随机矩阵的流行,也就是 burkoff 多面体双随机矩阵的每行每列之合都等于一,这保证了矩阵的普泛数不超过一, 从而使变换是非膨胀的信号既不会爆炸,也不会消失在实线上。 mhc 通过 synchop knop 算法将矩阵迭代的投影到这个流形上,迭代二十次即可收敛。这个看似简单的约束换来了整个训练过程的数值稳定性, 让 deep sec v 四得以训练数百个传感器而无需任何额外的稳定化技巧。第二项,创新的第一部分,压缩吸收注意力 csa 要理解 c s a, 我 们先要明白 kv 缓存是什么。在自回归生成时,每一步都需要访问所有历史 token 的 key 和 value 向量,这些就是 kv 缓存。在百万 token 场景下, kv 缓存会占用数十 gb 的 显存,成为最大的瓶颈。 c s c 的 核心思路分两步,第一步,压缩 c s c。 将每 m 个相邻 token 的 k v 向量压缩成一个压缩 k v 条目。具体实现时,对 m 个 token 的 k v 向量做加权求和权重,由一个可学习的 token 级压缩器动态生成。 压缩后缩列长度降低到原来的 m 分 之一。第二步,细数选择。即使压缩之后,如果缩列还是很长,全量注意力依然昂贵。 csa 引入了一个叫做 lightning index 闪电锁影器的模块,它对压缩后的 k v 条目进行快速平分,找出与当前查询最相关的 top k 条目,只对这 k 条目做完整的注意力计算。闪电锁影器本身也是用压缩后的锁影 k 来平分,计算量极小, 这样 cic 把注意力计算的规模从 n 降低到了 n, 除以 m 再取 k, 效率大幅提升。同时, cic 还保留了一个滑动窗口的未压缩 k v 条目,用来捕捉局部的细力度,依赖保证模型对最近几个 token 的 感知精度不下降。混合注意力的第二部分,重度压缩注意力 hca。 如果说 csa 是 聪明的压缩, hca 就是 激进的压缩。 hca 的 思路更简单粗暴,把更大范围的偷看 m 撇各 m 撇远大于 m, 压缩成一个 k v 条目,然后直接做全量的多查询注意力,不做稀疏选择。 hca 牺牲了一定的局部精度,但换来了极低的计算成本,因为压缩率高得多。在 deepsea 微四的实际配置中, csa 层和 hca 层交替排列。 粗略理解, h c a 负责低成本地补货全局信息, c s a 负责精准地补货关键局部信息, 两者形成互补,最终效果是什么?在一百万 token 的 设置下, deepsea v 四 pro 的 k v 缓存大小仅为以 b f 十六 g q a 八为基线的百分之二。 deepsea v 四 flash 更极端,仅为基线的百分之一点四。 这意味着原来需要五十 gb 显存的 k 位缓存,现在只需要不到一 gb。 这是十倍以上的效率跃升,让百万 token 推理在实际工程中真正变得可行。第三项创新,密用油化器为什么需要一个新的油化器? 我们知道大模型训练的核心是梯度下降,用损失函数对参数求梯度,然后沿梯度方向更新参数。 edm 是 目前最流行的油画器,它通过自适应学习率来处理不同参数的梯度尺度差异,但 edm 有 一个几何上的缺陷,它独立处理每个参数, 忽略了参数之间的相关性,也就是损失曲面的曲率信息。运用的思路来自矩阵正交化。 对于权重矩阵 w m u, 先用 nestrof 动量累积梯度,然后用 newtshoff 迭代对梯度矩阵进行正交化处理, 把更新方向变成正交矩阵 uv 的 转制乘积。 newtshoff 迭代的公式是, m k i 等于 am k 三加 b, m 开三 m 开三转制, m 开三加切 m 开三, m 开三转制的平方 m 一 经过十次迭代, 所有期一直都收敛到一,得到一个精确的正交矩阵。这个正交化的更新方向等价于在 remine 流行上进行梯度下降, 天然地与损失曲面的几何结构对齐,收敛更快,更稳定。实测中,使用 mu 的 deepsea v 四收敛速度更快,训练损失曲线更平滑,而且不需要 qk, clip 这类防止注意力分数爆炸的额外技巧,因为 mhc 的 rms norm 已经保证了数值稳定性。 三大架构创新之外, deepstack v 四还构建了一套世界级的训练和推理基础设施。第一, telig 定制内核。 deepstack 团队开发了 telig 一 种领域专属语言 dsl, 用于编写高度优化的 gpu 内核。 telig 的 关键能力是将计算、通信和显存访问融合进单个内核,消除了多个独立 kernel 之间的数据搬运开销。 第二, f p 四量化感知训练专家模型的路由参数使用 f p 四精度存储,相比 f p 八再次减半显存占用。 deepsea v 四将 f p 四集成到训练流程中,通过量化感知训练,保证了精度损失极小。 第三,细力度专家并行混合专家模型模拟的训练需要在多台机期间分发 token 到对应的专家,这涉及大量的 auto 通信。 deepsea v 四设计了一种细力度流水线方案, 将专家分批调度成多个 v 五,每个 v 五的通信和计算完全重叠,相比朴素,实现理论加速比高达一点九二倍。第四,分层 k v 缓存推理时的 k v 缓存分为 gpu、 显存、 cpu 内存和硬盘三层, 不同频率的缓存条目存储在不同层级,最大化了有效缓存容量,支持多用户共享长前缀,显著降低了服务成本。在架构和基础设施就绪之后, deepsea v 四进行了大规模的预训练。 deepsea v 四 flash 在 三十二万亿高质量 token 上训练。 deepsea v 四 pro 在 三十三万亿 token 上训练。数据构建方面, deepsea 团队对数据质量有极高要求,包含多语言、文本代码、数学、 科学、论文等多个领域,并通过多轮过滤去除低质量内容。训练稳定性方面, mhc 和 mon 的 结合从根本上解决了超深网络的数值不稳定问题,训练全程无需人工干预来处理 lossback 基础模型评估显示, deepsea v 四 pro base 在 几乎所有基础能力基础上都超越了 deepsea v 三二 base, 在 长上下文、代码、数学等核心领域建立了全面优势。预训练之后, deepsea v 四采用了一套精心设计的两阶段后训练流水线。第一阶段,专家模型独立培养。针对数学代码 agent 指令遵循四个核心领域分别训练独立的专家模型, 每个专家模型先在该领域的高质量数据上做监督,微调 sft 建立基础能力,然后用群体相对策略优化 g r p o 做强化学习,进一步提升领域内的峰值性能。 g r p o。 不 依赖单一奖励模型,而是用一组后选回答的相对质量来计算奖励,更稳定、更高效。 第二阶段,在线策略蒸馏 o p d。 把第一阶段训练好的四个专家模型作为教师训练一个统一的学生模型,同时学习所有领域的能力。蒸馏采用反向 k l 散度作为损失, 让学生模型的输出分布尽可能接近教师模型。这种方式避免了多任务微调式的能力相互干扰, 同时实现了能力的有机融合。最终得到的统一模型 deepsea v 四 pro 在 知识、推理、代码、 agent、 长上下文五大维度上全面达到甚至超越各自专家模型的水平,最终的性能成果令人印象深刻。 效率维度在一百万 token 的 推理场景中, deepsea v 四 pro 相比 deepsea v 三二单步推理, flops 降低到百分之二十七, kv 缓存降低到百分之十,分别实现了三点七倍和九点五倍的效率提升。 deepsea v 四 flash 更激进, flops 降至百分之七,效率提升近十倍。知识与推理维度 deepseek v 四 pro max 在 simple qa 的 广泛世界知识测试中显著领先所有开源模型, 在 hle 学术知识测试中以九十点三的成绩与 gpt 五点四并列第一,在 mmlu pro 上超越了大多数闭源竞争对手。代码与数学在 code forces 编程竞赛题上接近 gpt 五点四水平,在数学推理基础上超越了 gemini 三一 pro 长上下文能力。在一百万 token 的 合成和真实测试基上, deep sec v 四 pro max 超越了 gemini 三一 pro, 这在当前所有模型中处于顶级水平。 agent 的 能力在 stwebench、 代码修复、 terminalbench、 命令行操作等 agent, 基本上 deep sec v 四 pro max 接近 cloud ops 四点五的表现是所有开源模型中最强的。 这些成绩表明 deepsea v 四已经真正进入了第一梯队。让我们站得更高一点来看 deepsea v 四的深邃意义, 它证明了一件最重要的事,架构创新,而不是单纯的堆砌。算力是突破 ai 能力边界的关键路径。 mhc 让我们看到数学约束可以从根本上解决深度网络的稳定性问题。 混合注意力让我们看到压缩和稀疏的结合可以把百万 token 推理的成本降低到实际可用的水平。妙,让我们看到优化器的几何视角可以带来真实的收敛加速。这三项创新的组合 打开了一个新的可能性空间。更长的上下文,更深的推理链,更复杂的 agent 任务。百万 token 只是一个里程碑,而不是终点。 deepsea 团队在论文中明确指出,这项工作为在线学习、超长程推理、多文档深度研究等下一代 ai 范式砥定了基础。高校的长上下文智能不再是少数超级计算中心的专利,它正在走向每一个人。 deepsea v 四已经在这里。

现在 code 可以 直接使用 dc v 四了, code 确实好用,但是额度真的是不经烧,随便几个问题直接就清空了,又得等五个小时。所以我试着把 dc v 四接进去,烧了四 e token 之后,发现操作竟然很丝滑,体验也完全不输原版,关键是真的大碗便宜, 后面我会带你一步步接好。其实步骤是非常简单的,就三样东西, c c 叉, d c 的 a p i, 还有 c c switch, 而且工具我都已经整理好,你照着我这几部点,基本几分钟就可以搞定。 解压后先打开 c c 叉的文档,然后打开 emv 文件,里面会有一个密钥,这里你可以保持默认,也可以自己去修改一个。改完之后记得先保存,然后启动 c c 叉,它会弹出一个终端,你找到这个管理界面的地址, 然后按住 ctrl 键再点击,就会来到这个页面。进去之后把刚才 e v m 里面的密钥粘进去,就能够进入到后台,这里你可以顺手切成中文就行,这部分就基本搞定了。接下来我们去到 d c 的 官网,点击 api 开发平台,第一次进来得先注册一下,然后点击左边的 api key, 新建一个 key, 名字可以随便填。创建完记得先保存好,因为它只会显示一次。然后回到 c c 叉上面,选择 code, 中间点击添加频道,这里就可以直接把这个文档粘进去。最下面把刚才复制的 a p i 粘进去,创建就算成功了。记得顺手做两个设置,一个是选一下 openchain, 另外一个是把规范化,非常健 打开。这一步搞定, d c 其实已经接近来了,然后打开 cc switch, 点击上面的这个标志,右边新增一个配置,具体的参数你可以按照这个来就好。这里有三点是需要注意一下, 首先,这里的 api key 不是 d c 的 那个,是一开始 emv 里面的那个密钥。第二点,点击一下这个获取模型列表,就不用自己手动去填写了。第三点,把 e m 上下文窗口勾上,这样子才能全力去跑,下面这些都不用管,填完之后直接点击保存, 然后点击启动,最后把 codex 安装或重启一下,到了这一步就已经接好了。打开之后, codex 这里不是显示 d c, 它只会显示自定义。别慌,这个时候你随便发一句话,先试试能不能是正常使用。然后直接去看看 cc switch 的 使用记录,你会看到模型这一栏已经变成了 d c v 四 pro, 来源是 codex, 那 说明已经是链接成功了,也就是说后台真正在跑的已经是 deepsea 了。最后我补两个词,已踩过的坑。第一个坑是 cc switch 最新的版本,现在有 bug 会连不上 codex, 所以 别手痒去更新,直接用包里面的版本就行。 第二个坑是 d c v 四没有视觉能力,所以一旦你平时有看图识图这类型的需求,进来之后可能会有部分的能力用不上。不过好消息是这套流程本身是通用的,你可以直接换成其他的多模态模型,思路也是一样的。我是木马,陪你一起玩 air 赛博达子,咱们下期见,拜拜!

今天给大家带来 deepsea v 四接入 cloud code 的 保姆级配置教程,零基础也能一步到位完成。首先第一步,获取 a p i t 与模型参数, 接着记录核心参数,包括 anther pick 协议接口地址,还有 deepsea v 四的两个模型 id。 flash 版本适合高频清量请求, pro 版本适合复杂代码推理,大家可以按需选择。第二步,安装 cloud code 运行环境 cloud code library 持续性,先下载安装 lodash, 安装完成后用 node v 和 p m v 验证环境是否生效。接着执行安装命令,完成后,在终端输入 cloud 进行初步验证,首次启动出现登录提示,属于正常现象。第三步,修改 cloud code 配置文件,先备份原文件, 然后编辑 cloud jason 添加出使化标记字段,避免重复进入引导流程。再编辑 settingsen, 填入 deepsafe 的 a p i t f p 接口地址和目标模型 id, 全部修改完成后保存文件。第四步,启动验证与效果检查配置完成后,在终端输入 cloud 启动,发送测试指令,确认能正常响言 健全或地址错误提示,就说明接入成功了。如果遇到报错,优先检查 a p i t base 二和模型 id 是 否填写正确。至此, deepsea v 四接入 qq code 的 全部配置步骤就完成了,核心就是对其三项关键参数,按步骤验证就能稳定跑通。

加上我, deepsea v 四终于发出来了,我们来看一下亮点。来,我们看一下价格啊, deepsea v 四 pro 和 flash 版本输入输出价格都是最低的,而且上扬纹长度都是一 m, 而且 deepsea v 四还是一个开源模型, 对比 gpt 五点四和二十四点七来说性价比超高。然后这个图标也是 deepsea 有 整理的啊,输入价格对比 deepsea v 四两个版本已经低到可以忽略不计了,五点四还有二十四点七,还是非常非常高,很夸张。 然后这性能对比啊, d p c 两个版本对比的国内外里面著名的模型,可以看到它的性能都是不落后于它们的,甚至有一些还超过了。作为一个开源模型啊,非常的可贵, 快速做了一个网站和这个 office 点六对比,还有其他模型,你可以看到它们基本上差不多了,甚至 d p c 个 v 四还是超过了它。在这个 knowledge 和 reasoning, 也就是知识和推理方面, 开源模型啊,太感动了,依旧开源,可以看到 deepsea 团队的理想和坚持,最后这句话也很感动,嗯,让我们期待一下后续更新吧。

我有个学音乐的老哥,靠 deepsea v 四把 cloud code 的 价格给打下来了,原来动辄几百刀一个月,现在靠 deepsea v 四把成本直接干到了原版的二十分之一,短短几天, get up star 已经冲破二十二 k, 而且还在涨。 ok, 今天就来手把手教大家怎么使用这个爆火的开源项目,为了让更多的朋友都学会,我还特意整理了一份托盘的教程,零基础也能懂。 ok, 我 们直接开始 整。过程呢,一共分三步,第一步呢,安装镜像,第二步呢,输入 deepsafe api。 在 安装之后呢,我们要进行一个注册验证环境,再输入提示词验证就彻底搞定了。 首先我们来执行第一步,旁边的空格搜索终端,点开双击,然后输入第一行命令, npm 注册表,切换到国内镜像。接着安装这个项目,回车看 这里应该是安装成功了。第二步呢,是我们要获取 deepsafe 的 api, 创建 apikey。 接着呢,先用这一步保存到配置文件,填入刚刚的 api。 回车正在下载中。安装好后呢,我们需要验证一下环境, 复制这行指令。回车所有的检查都已经完成了。在正式使用之前呢,我们最好是建一个 deepsafe 的 专用文件夹,然后 cd 空格,把这个文件夹拖进去,以后,我们所有的文件都会储存在这个文件夹里。回车运行 deepsafe, ok, 成功, ok, 回车选择中文 y enter, ok, 我 们现在就可以用了,帮我跑一个超级麻料小游戏。 可以看到整个界面还是非常美观的,百万 talk 上下文,而且思考模式是流势输出的, 也就是说我们在执行任务的时候,可以非常直观的看到他调用了哪些工具,然后他是怎么想的,全程透明,我们可以看着他一步一步把任务推下去。他的交互模式呢,也很简单,输入斜杠 切换到 play 模式呢,去帮我们直接拆解计划,不会乱动我们的文件。然后切换到 agent 模式呢,是默认协助,然后一边做一边向我们确认。 还有一个优路模式,优路模式就比较猛了,他直接把所有的权限开放给 ai, 让 ai 自己完成,一点经历也没有。这里是巴老文科生学 ai 的 第三十八天,我们下期见,拜拜。

本期视频来分享如何将 deepseek 的 vs 模型接入 cloud code, 并解锁 em 的 上下文以及 max 思考等级。我目前已经将 deepseek 的 最新模型 vs flash 和 vs pro 通过 ipad 的 方式来接入了 cloud code。 vs pro 模型在降价之后性价比也越来越高了,并且对 a 键的也有做专门的适配, em 的 上下文对于大多数人来说也更加友好。 视频内容主要分为四个部分,第一需要先安装一下 cloud code。 第二,安装开源工具 c c switch。 第三,需要购买一下 deepsafe 的 api 并完成配置。最后再来测试一下 deepsafe。 v 四 pro 加 cloud code 这套组合表现怎么样。废话不多说,我们现在开始 首先来说如何安装 cloud code。 大家常说 cloud code 经常被封号,那其实封的是拥有模型能力的个人账号,但 cloud code 作为一个单独的软件是可以正常下载和安装的。 没有订阅官方的模型,我们依旧可以使用它的框架当成是 opencloud 或者 hermes nint 这种。在他们的项目官方网站这里也有明确的说明。终端 cli 和 vs code 也支持第三方提供商。 本期视频演示的是安装 cio 版本,也就是最通用的版本。这里有一行中的命令,它支持 macos、 linux 和 windows 这几种不同的系统版本。 windows 这里分为 power shell 命令和 cmd 命令,并且 windows 用户需要先下载安装下 get, 如果没有安装的话,可以到 get 的 官方网站下载安装包进行安装。 这里复制这一行命令,然后打开终端 app 或者 power shell, 输入他们提供的命令回车执行就可以了。我这里已经安装过,所以不再演示具体的步骤。安装好之后可能会出现一个提示,大致意思是安装已经完成,但是 control 的 安装位置并没有加入到电脑的环境变量中。 这里直接复制这行他提供的命令,在终端执行一下,搞定之后输入可拷的 code 杠杠微刃来确定当前的版本号。后续使用的话,直接在终端输入可拷的命令就可以打开了, 但是你那里可能会提示不能连接官方服务。接下来我们来安装第二个工具 cc switch。 cc switch 是 一个开源工具,它能够让 cloud code codeys、 opencloud 这类的 a i a 检测,方便地切换模型。累计下载量有三百多万,在 github 上面也有五万多个 star。 它有很多实用的功能,比如一份配置同步到多个应用,支持热切换,不需要退出应用切换模型。还有用量仪表盘,能够查看你的请求数和头克用量等等。 我们在项目的首页这里有一个已发布的安装包链接,点击进去,然后在这个界面直接划到最下面。这里有很多的安装包版本,如果是 mac os 系统就下载这个 mac os 点 dmg 的 版本,如果是 windows 就 下载这个版本。下载好之后直接点击安装包进行安装就可以了。 它这个项目的说明文档也有比较详细的安装教程。第三步,到 deepstack 的 开放平台购买 api。 我们来到 deepsafe 官网,点击 api 开放平台,我这里之前已经充值了一些,在网页和 deepsafe 对 话是完全不收费的,但是想要调用 api 就 需要进行充值。他们目前没有推出类似 tokpline 这样的按月订阅的套餐,好处就是用多少花多少。 目前他们对 v 四 pro 模型打二点五折,每百万 tokens 缓存命中情况下输入是零二五元,未命中是三元,输出是六元, 这个折扣目前是到五月三十一号截止。 v 四 flash 模型和 pro 模型的价格对比可以在官方的 api 文档里查看,这里点击充值按钮,然后选择金额和支付方式。建议先小额买一笔,用完之后根据自己的实际使用情况再进行补充购买。 付款完毕之后,点击左侧的 api case, 点击创建,然后复制这个 key 的 密钥, 注意这个 k 的 密钥只能够在创建的时候查看,关闭这个页面就看不到了,如果丢失的话,就需要重新创建一个 k, 然后打开 cc switch 这个应用。我这里已经添加好一个 deepsea 的 模型了,选中这里的 cloud 的 图标,然后点击添加, 在预设供应商这里找到 deepsea, 在 api k 这里填写 k 的 密钥,然后这里需要修改一下这几个模型,可以直接参考我这个填写 默认模型就是 deepsafe。 v 四 pro 后面加上 em 是 因为之前的公告有说明,这样才能够开启 em 的 上下文,然后点击添加就可以了, 这里就会多一个 deepsafe 的 模型,点击这个按钮来测试当前 api 是 否可用。点击这里可以配置用量查询,查看当前还剩多少余额, 勾选这里,然后点击保存配置,这样的话就能够看到还剩下多少钱了,然后点击起用,就能够正常的使用可绕的扣子了。左上角有一个设置按钮,通用,这里建议打开开机自启使用统计,这里也能够查看 ai 模型的使用情况和成本。 我们打开终端应用,输入可绕的指令,那这个呢?就是 deepsea v 四 pro 的 模型,并且是一百万的上下文, 我们输入指令斜杠 context 能够查看,这里确实是一百万的上下文 tokens。 这里的默认思考等级是 medium, 可以 使用命令斜杠 effort, 然后空格后面的话就会显示哪些等级可选,这里输入 max 回车确认,这样的话思考等级就会调到最高。还有一个命令可以快速的切换模型, 输入斜杠 model, 然后回车。默认模型其实就是 v 四 pro, 我 们之前配置的 apps 和 sonata 都是 v 四 pro, 嗨酷模型是 v 四 flash, 通过键盘的上下按键来选择,选中这个模型,然后回车确认, 这样的话模型就切换到了 v 四 flash, 这里输入命令 context 能够看到它的上下文,显示是两百 k 的 tokens。 最后一部分来测试一下 cloud code 搭配 deepsea v 四 pro 到底贵不贵,干活效果怎么样。 首先说一下,它是基于文件夹的工作模式,所以你需要先通过 cd 命令跳转到你想要它打开的文件夹,比如我的项目文件夹的路径是这个,就需要输入屏幕上完整的指令回车,到了这个文件夹后,输入 cloud 的 命令来启动它, 如果路径很长的话就比较麻烦。有一种方法可以简化一下, windows 用户应该可以直接在文件夹右键从当前文件夹位置打开终端, mac 用户右键的话是没有的,但是可以直接将文件夹拖拽到终端 app, 那 当前终端打开的文件夹就是这个项目文件夹, 输入 cmd 命令,可以查看当前文件夹的路径,然后输入 cmd, 启动 cmd 的 code。 第一次打开的时候需要确认一下这个文件夹,点击 yes, 后续退出的话需要连按两次 ctrl 加 c。 这里安装一个归藏老师最近开研的一个 ppt skill, 设计是比较美观的。 来到他的项目仓库,这是一个电子杂志风的网页 ppt skill, 纯网页形式,适合线下分享,但是不适合培训课件。这个 skill 的 名称叫做归藏 ppt skill, 这里提供了多种的安装方式, 最方便的就是直接复制这一段话,然后发给 ai, 选中这一段话, command 加 c 复制,然后来到 kol 的 对话界面, kol 加微复制,然后直接发送。 kol 在 执行任务过程中会需要一些权限的许可,遇到的时候直接选中 yes 就 可以了,它的框架对于安全保护还是比较好的。 整个的执行过程我就直接跳过了这里提示安装好了触发词,就是帮我做一份杂志封的 ppt。 ok, 我 在这里输入这句话,然后告诉他要做的内容就在当前文件夹中。在当前的项目文件夹中,我放入了一个 mail 文件, 内容是关于 code 的 使用方法论,然后回车执行。他会先查看项目文件夹的内容和 skill 的 使用说明,执行过程中可能会问一些问题,根据个人的需求选择就行。 我这里也跳过过程,大概直行了六分钟左右,一共生成了九页 ppt, 并告诉了我每页的布局和内容,以及怎么操作。 ok, 我 们直接打开浏览器来查看一下这个网页的 ppt。 这是第一页 codex 的 方法论,整体的设计风格确实是比较美观的,如果是个人制作的话,可能要花费比较长的时间,并且效果还不一定有他这个好。 第二页这里的话可能会有一点点问题,下方的文字有一部分被遮挡了,后面的页数大家可以具体去看一下内容觉得怎么样。 最后再来看一下安装这个 skill 以及制作这九页的 ppt 一 共花费了多少钱。 我在做之前是九点八九的余额,刷新一下网页,那现在还有九点三九的余额,一共是花了五毛钱。这里有一个每月用量的图标,展示每个模型花了多少钱。下面也有 token 的 使用详情,包括输入和输出的具体数量。大家觉得 deepsea v 四 pro 的 性价比怎么样?

今天给大家带来 deepsea v 四接入 opencloud 的 保姆级全流程配置教程,零基础也能一步到位完成操作。首先第一步,登录 deepsea 开放平台。第二步,创建 apikey。 登录成功后,点击左侧导航栏的 apikey 选项,进入妙管理页面,点击创建 apikey, 给妙设置一个好记的名称,完成创建。这里重点提醒大家, apikey 只会在创建时完整显示一次,一定要立刻复制,妥善保存。第三步,进入关键参数。完成妙创建后,我们要准备好接入需要的核心参数, 包括 openai 协议和 antropics 协议的 base url, 还有 deepsea v 四的两个模型 id。 第四步,找到 opencode 的 配置文件, opencloud 的 核心设置都保存在本地私文件里, windows 无缝图和 macos 系统都有对应的默认路径,推荐用 vs code 打开编辑,能避免格式错误。 如果找不到文件,执行 open call setup 命令,就能自动生成默认配置文件。第五步,备份原文件修改配置前,一定要先把原文件复制一份,重命名备份,万一修改出错,直接还原备份文件就能恢复。第六步,全新安装的用户 可以直接用教程提供的完整模板作为配置起点,已经有现成配置的朋友直接跳过这一步即可。第七步,替换核心参数,换成 deepsea 的 api 地址。 二是把 apikey 替换成你刚刚创建的秘钥,注意不要加多余空格。三是替换 modelaid, 选择你要用的模型版本。四是把 workspace 替换成你本机的实际路径,全部修改完成后,保存文件配置就完成了。 第八步,测试效果配置完成后,重启 open code, 在 对话框输入问题就能验证模型是否正常响应。至此, deep c 微四接入 open code 的 全部配置步骤就完成了。整个过程的核心就是获取 a p i t 在 正确填写配置参数。绝大多数连接失败的问题都源于这三个参数填写错误。

家人们谁懂啊, cloud code 居然能完美接入 deep secret 四 pro, 这简直是程序员的省钱天花板,终于不用再写代码的时候,一边用 ai 一 边心疼 toker 了。建议大家先关注点赞收藏,详细的配置教程也给大家整理好了,可以跟着咱们的步骤来。 首先安装 cloud code, 安装完成后输入 cloud version 检查版本。接着第二步,使用 c c c 去图形化工具配置大模型。首先我们打开 github, 搜索 c c c 位置, 找到第一个这个用 rest 写的, 然后点击路由设置,然后点击详情往下面滑动,这里有不同版本的,根据自己电脑下载安装, windows 直接可以下载 mc 下载安装, 我们这里已经提前下载安装完成,安装完成后就是这样的界面,可以对不同的大模型配置,我们这里选择 d p k, 然后这里最关键的就是输入 api k, 接着我们打开 d p k 官网,如果没有账号,先提前注册,找到左边的 api k, 然后创建一个 k, 然后回到 c c 杠 switch, 输入我们刚刚创建的 k, 这里配置下主模型统一都是 d p c k 杠 v 四 pro, 四个都可以填写一样的,填写完成后可以点击测速下看,看到这里 c c c 去的就配置完成了,接着我们就可以点击启动使用 d p c 了,输入 call 检验,看看是否切换成功。到这里我们在 call 的 里面配置 d p c 就 算完成了, 然后有粉丝兄弟问我如何在 call 的 里面配置 d p c 就 算完成了。然后有粉丝兄弟问我如何在 call 的 推荐可以使用 c c g u i, 安装完成后就是这个小图标,正常我们用 c c switch 配置好 idea 里面的插件就会自动识别并切换,可以看到响应速度还是挺快的。好了,本期的视频就先分享到这里,有什么问题都可以粉丝群一块讨论。

我之前从来没有使用过 deepsafe 的 api, 今天就用一下,首先呢我去创建一下 api 的 必要,在这里随便输入一个名称,然后点击创建 api, 创建之后记得一定要保存,避免弄丢了。我之前都是用可导写代码的, 今天用一下 vs code, 我 在这里点击四个小方块,搜索一个叫 client, 一个插件,然后点击去安装,安装好之后呢,这里就会出现一个 client 的 图标, 那这三个选择自己的模型,然后点击下一步,来到这个页面之后呢,这里需要配置一下 open ai 的 一个格式,然后 我们选择 open ai, 然后再回到 disk 的 这个界面, disk 提供了两个地址,一种是 open ai, 另外一种是是背了 osmico 的 地址, 因为我们选择的是这个地址,所以呢,这里我们输入的是 open i 的 地址,然后这里填入自己的 api key。 还有这里要注意一下,这里是默认没有 divx v 四模型的,所以要自己写一下,所以我就写 divx v 四 pro。 我 们要注意一下上下文的长度,如果不输入的话,它默认就是一百二十八 kb, 我输入这个数字就代表了是 e m 的 上下维,这样就设置好了,那后面我就看看效果怎么样。

很多人拿到 deepsea 微四,第一反应都是去官网或者 app 里问几个问题,我一开始也是这么用的,但是用了一段时间之后,我发现一个挺有意思的点, 如果只在聊天框里用,其实很难真正的感受到这次微四的变化。不是因为它不好用,恰恰相反,网页版和 app 版对大多数人来说已经足够用了。日常的问答,简单写作、查资料、做总结, 这些场景他都能完成的很顺利。但问题在于,他的交互本质上还是对话,你问一句,他答一句,你再问一句,他再答一句。这种方式很自然,但也把能力限制在了回答问题这件事里面。而这次 v 四更有意思的地方其实完全不在这里。 我后来换了一种方式去用它,不是让它回答问题,而是把它当做了一个可以做事的东西,放进了一个完整的工作流里。整个测试环境搭建起来其实并不复杂,大概只有三步,创建 api, 安装 clock code, 用 cc switch 把模型接进去, 然后在终端里启动,选到 v 四,把推理强度调高。到这里为止,其实都是准备工作。真正有意思的是后面开始给他的任务。 第一个测试,我给他了一个比较简单但完整的目标,处理一段客人视频,不是单一的动作,而是一整套流程,下载,转字幕,理解内容,剪掉不重要的部分。 虽然他一下子没有全部做对,但过程中有一个细节非常关键,他知道自己在做哪一步,会先检查用哪些工具,然后把任务拆开,一步一步往下执行,中间如果有结果,会基于结果继续往下推进,那种感觉有点像不是在等回答,而是在看他干活。 第二个测试,我把难度稍微提高了一点,给他了一个开源音乐软件,让他只从支持 windows 改成能在 mac 上跑, 整个过程更接近真实的开发。要读取项目的结构,要看依赖,要理解报错,还要判断哪些是系统相关的问题。而且有一个引擎要求尽量不把原文件改坏, 这个任务也不是一步到位完成的,但是他会根据报错继续往下修,你可以明显的感觉到他不是在深沉答案,而是在尝试解决问题。 第三个测试,我主要想看看他能不能长时间持续工作,因为在网页版里其实有一个很明显的限制输出长度,写长一点的内容很容易在中途停下来,这在聊天场景下是没有问题的。 但是如果是一个长任务,比如写一篇很长很长的小说,或者持续生成内容,就会有点卡,所以我换了一种方式,用目标驱动的提示。 简单的来说就是给他一个目标,再给他一个完成标准,让两个 agent 的 分工,一个执行,一个负责检查,他就会一直跑下去,中间不断的自我检查,直到接近目标为止,可以持续运行很久,而不是一次性输出完就结束。 坐到这里,我大概理解了一件事情,像克拉蔻这种东西,重要的点其实不在于聊的有多好,而是在于他把模型带进了真实的工作流,从一个回答问题的工具变成了一个可以参与任务的角色。 deepsea 微四这次给我的感受也是类似的,他在聊天里当然有提升,但更值得注意的是, 是他开始具备进入工作流的能力。官方技术报告里也写的挺克制的,提到他在 a 阵的相关测评里已经进入到了开源模型的第一梯队,但和最前沿的闭源模型还是有差距。 这个说法我反而觉得非常的舒服,没有那种一发布就全面超越的语气,更像是在说我们到了哪一步,还有多远,这很实在。现在的 ai 讨论其实我们都非常清楚,很容易走向两边,一会是在说我们到了哪,一会是不过如此, 一会是开源碾压,一会是差距拉大。情绪的变化比技术的进展还要快。但如果把注意力拉回到实际的使用上,像 v 四这种变化其实是很具体的, 它开始不再是会说,而是慢慢的可以去做。我们也期待 deepsea 可以 越来越好。如果你平时有其他一些固定的工作流,其实可以试着把它拆出来,让模型参与进去跑一跑, 不一定一次就能好,但是这个方向确实和单纯的聊天不太一样。我这边也在继续测试不同的场景,如果你有比较具体的工作流,可以分享给我,看一看能不能跑起来。当然,我也把这个视频里的所有资料和相关的测试项目整理好了, 放到了评论区,有需要的小伙伴可以收藏一下。最后我是元宝,一台 ai 和黑科技的挖掘机,我们下期见。

三步,把 deposit 为四,接入到 cloud code 里面。第一步,找到 api 开放平台,找到接口文档,接入 app 的 工具 cloud code, 找到这个配置项。 第二步,打开 cloud code 的 文件夹,找到它的 settings 文件, 然后把配置的像分别复制进来。第三步,打开 clock 的 口的新窗口, 配置完成。

bbc 又升级了啊, v 四正式启动,但今天,我不跟你说参数。我告诉你个事实,这款大模型正在悄悄改变像我一样的普通人的命运。我为什么这么敢讲?因为就在两个月前,我干了一件特别狠的事情,我把我的出生年月日时精准的 大字日注,甚至连我这辈子都不敢给任何人说的真实想法,全都喂给了 deep sleep。 没有找大师,没花一分钱,他帮我制定了一个个人的终极使用说明书。他告诉我,我天生适合什么,碰什么不行,在哪方面使劲会翻倍,在哪方面做会稳赚。我照着执行了五天一个月,把我的拖延症做好了, 让我自律了,写爆款,改文案。云轩有龙那个账号,一个月暴涨二十万粉丝。这不是玄学,这是 deepsea 自我解剖的工程学。那 deepsea 微四到底更新了什么呢? 它能帮着普通人做到哪一步呢?第一,长的离谱的上下文文案,它也能帮你解决。微四支持百万级别的书写能力啊,就是你给自己从小到大的日记、八字拍盘,几百条的碎碎念,一口气全都扔进去。 他能一字不落的把你从小到大的整个经历给你总结出规律来,把你一生在哪个节点会变好,都能给你梳理出来。以前我要找心理专家啊,找命理师,甚至还要找教练。现在 一个 double c 个 v 四全包了。第二点,便宜到上瘾啊,输出一个百万级的,一个文案,只要两块钱的人民币,每天花一点时间雇一个二十四小时不睡觉,懂命理又懂逻辑的私人军师,你上不上瘾?第三点, 快到起飞,几乎实时响应啊,你问完他就回答,他能向脑子里长出第二个,云轩,越用越顺手,越用越离不开他。就凭这三点,普通人跟着 ai 推倒最后一班墙,让 deepsea 微四 帮你成功。来,我直接上干货给大家拆分三步,每一步都值得你抄作业。第一步,建一个云轩的专属大模型,你可以是二轩,我用 deepsea api 现有的模型啊,你不用写代码,它一个属于自己的智能体。 然后给他喂三个东西,第一个,我的出生年月日时,具体到时间,出生地。第二个,我去过三年最好的地方,最舒服的地方。 我每天几点起床,几点睡觉,极致的状态是什么?好几次想撞墙的记录都告诉他,点滴就是真实的,自己没必要藏着掖着,都告诉他。第三点,我内心最真实的想法, 我想要成为一个博主,但是又怕别人说我装,我明明很努力,总是半途而废,只能一直无效的复制 这个问题。你也告诉他,你的梦想是什么,他会推着你去完成你的梦。梦想第二步,让 deepsafe 给你做人生 ct 扫描,它会结合你的基础命理逻辑、日柱强弱、时辰组合和行为数据,给你输出一份 个人的最优行动指南。我的日柱是什么呢?哎,大脑兴奋期在申时,中午的时间点允许你创作比较好。 平时我创作就是中午时间,晚上硬写稿等于慢性自杀,所以晚上我从来不熬夜做内容。我不适合做琐碎的运营啊。呃,回私信啊,对数据啊, 哎,这些都是他告诉我的。我适合做创意破局,有镜头表演力的事情,我适合,因为我爱动情绪。我最内耗的时间段是凌晨两点,这个时间段必须强制关机。第三步,把分析的结果变成每日自律的指令啊。我把上面的结论再问给 就是你,得出了结果再背给他,让他声称每天我只做三件事情的事,你的效率就会提升十倍。我以前一天列出十件事, 做完两件就崩溃了。我现在每天做完的就三件事,做完就完事,而且人特别放松,特别轻松。你看看最近今日头是不是特别好,而且越做越有劲。你看啊,这不需要意志力,你只需要把你的 deepsea 当成你的外挂。那我为什么要做黄金赛道的博主呢?内容一直创新呢?粉丝一直在涨呢?真相很扎心, 不是因为我有天赋,而是因为 deepsafe 让我把百分之九十九的内耗都转化了,百分之一的有效的输出。 别人还在纠结我适不适合做这个的时候,我已经让 ai 从八字行为数据里面找出了答案。他告诉我,二零二六年云轩会大火,别人还在找灵感。我已经让 deepsafe 结合现在热搜,结合我个人的喜好,生成属于我的 爆款方向。而且啊, deepsea 自己也在不断地进化, v 四只是开始,以后会更快、更便宜、更懂你,它越强,我就越强。这就是普通人在 ai 时代唯一的捷径。你不需要成为技术专家,你只需要成为你最会使用 ai, 了解自己的那个人就行了。如果你也想试试这一套 ai, 哎,剖析一下自己,让它驱动自己,自律成事。那么你在评论区留下你的观点,我把我这一套逻辑包括自己的一些点滴可以分享给你。记住,所有逆袭的第一步都不是学方法,而是先搞懂你是谁。我是云轩,一个用 ai 改造自己的长期主义的博主,咱们下期见。

已久的 deep six v 四,他终于来了!从去年 v 三爆火之后,关于 v 四的传言就没停过,万亿参数,百万上下文,彻底换掉英伟达国产芯片底层适配代码能力吊打全球旗舰。这些网传的神奇升级到底是真是假?本次官方发布的 v 四到底有哪些实打实的升级? 实际体验下来,他能不能打得过 cloud、 量子这些海外顶流?本期视频我们从官方升级拆解到多移动横向实测,带你一次性把 deepsea v 四发的明明白白。 首先我们来系统拆解一下 deepsea v 四官方发布的几大核心升级,每一个都精准命中了当前大模型的核心痛点,也彻底拉开了和上一代的产品差距。第一个也是最核心的战略级升级,全链路国产算力深度适配,实现真正的自主可控。 这不是简单的兼容运行,而是从算子变器、底层代码训练框架到推理管线全流程,和华为升腾芯片做了联合优化。行业里之前的模型都是先给英伟达做优化,国产芯片只是能用,而 v 四直接把国产芯片当成了主力,英伟达反而成了备选。 第二个全新架构加万亿参数微模,实现能力与效率的双重突破。 v 四采用了全新的 mhc 架构, 最高可扩展至万亿参数,对比 v 三的六百七十一亿总参数直接是量级的飞跃。但最厉害的不是参数堆料,而是它的稀疏激活技术,把活跃参数控制在和 v 三的三十六倍参数相持平的水准。 这就相当于你用一辆家用车的油耗开出了超跑的动力,在保证推理延迟和 v 三相近的前提下,模型的知识储备、推理能力、复杂任务处理能力都实现了质的飞跃。 第三,百万透坑超长上下文搭配全新记忆机制,百万上下文窗口,不只是数字的提升,更是应用场景的彻底拓展,直接可以把一整个企业级代码库、十几篇长篇小说一次性喂进去,实现跨文件、跨章节、跨领域的深度关联分析。 第五个,极致性价比延续,成本粉碎机再升级, deepsea 能火遍全球,极致的性价比是核心原因之一,而 v 四在能力全面跃升的同时, 依然延续了这个核心优势。官方明确 v 四会保留前缀自动缓存机制,缓存命中后价格直接下降百分之九十。对比海外旗舰模型, cloud code 是 每百万输入头肯五美元, gpt 五是二点五美元,而 v 四定价在零点一四美元,成本差距达到了十几倍甚至二十倍。讲完了官方的升级,相信大家最关心的还是说的这么厉害,实际用起来到底怎么样?接下来我们就进入实测环节, 逻辑推理能力是大模型的大脑核心,也是 g p t 长期以来的标杆级优势项。这一轮测试,我们直接对标 check g p t。 第一个场景,我们准备了全网爆火的三个盒子标签错题, 三个盒子分别装着苹果、橘子混合水果,所有的盒子标签全贴错了,只能从其中一个盒子里拿一个水果。要确定所有盒子的真实内容, 首先看一下 gpt 回答的结果,答案没问题,推理过程采用的是排除法,加分情况讨论结尾有总结也有拓展,效果不错。接下来我们看看 deep six 的 表现。首先,它具有深度思考过程,答案同样没问题。它的正文推理采用了三步走的拆解法。 这一轮测试下来,我认为两者打了个平手。文案生成是绝大多数人用大模型最高频的功能,也是最考验模型本土化、语境理解、用户情绪拿捏和细分场景适配能力的核心项。 这一轮测试,我们对标国内文案创作顶流豆包,全程盲测,完全相同的提示词,只看最终成品的效果如何。 第一个场景,爆款口播文案生成,我们给出的需求是写一条一分钟的家居好物。口播文案产品是可折叠恒温泡脚桶,目标受众是二十五到三十五岁的上班族,要有沟子,有痛点, 卖点,有行动指令,口语化不生硬。首先看一下豆包写出的文案,结构比较完整,拿来改改就可以直接用了。在开头还有镜头说明,还有一些细节,比如说袜子勒出一圈印等。但是每句话的末尾给我的感觉还是稍微有些许 ai 浮夸的感觉。看下 v 四的效果, 钩子稍微有些长,动作指导没有豆包的给的多,文案给我的感觉也略有些浮夸。 博博文案这个场景,我个人认为豆包是强于 tip 四。 v 四的第二个场景,节日走心祝福文案,我们给出的需求是春节给领导发祝福文案要真诚,不油腻,不群发,不拍马屁。能让领导记住分两条,一条给直属领导,一条给公司大领导。 看一下豆包生成的文案整体偏通用模板,但对直属领导和大领导的称呼上做了区分,如果直接使用的话,还需要结合自身情况以及所属行业在优化下。 再来看一下 deepsea v 四的效果,称呼也做了区分,细节更多在给大领导的文案中还接受了自己的所属部门。最后还有温馨小提示,对比下来,我认为这个场景 deepsea v 四更优于豆包 代码能力。这一轮测试,我们对标 q 丁界顶流 cloud, 用一句话生成可运行的 html 格式化页面。先看一下 cloud 生成的效果,背景符合预期,鼠标旋停旋转暂停效果有些问题,图片内容和效果有时也会出现不一致的情况。 再看一下 v 四生成的背景没有问题,鼠标旋停也没有问题,图片缩略和点击也出现了不一致的情况。 这一轮代码能力测下来,虽然都不完美,但是相比来说,我个人认为 deepsea 效果更好些,原因是 cloud 的 那个旋停 效果不太好。好了,所有维度和场景的测试全部结束。看到这,大家对 deepsea 微思的能力已经有了初步的判断,欢迎把你的感受打在评论区,本期视频就到这里,咱们下期见。

我就问了 deepsea v 四 pro 一个问题,花了我一块九毛四。 deepsea v 四虽然来了,但是它大概率不是你的菜。通用 ai 的 c 端用户可以分为下面五类, q 度 chat、 重度 chat chat 加 cooke chat 加 code chat 加 cooke 加 code。 如果你从来没有订阅过一三家的产品,那你基本上就是 q 度 chat。 程序员和极客是后两种。 co work 是 最近几个月出现的,因为龙虾类 a 卷的出现了之后,大家就有了新的认知,不光可以和 ai chat, ai 还可以帮你在电脑上干活。重度 chat 的 用户呢,是以文本创作需求为主,比如说职场白领,这部分用户很容易向 chat 加 co work 转化。 那为什么说 v 四大概率不是你的菜呢?如果你是后两种,你瞧不上。 v 四模型能力很强,但是产品力几乎没有, 这两波人早就被三 c 圈走了。 cursor、 cloud code code 这些产品能够给他足够好的体验, dbc 不 一样,他压根没有产品体验。如果你是前两种,你用不爽。打开 app 或者网站,两种模式切换智能搜索开关,深度思考开关用户一个问题面临八种选择,太糟糕了。 轻度 chat 的 用户直接就懵逼了,专家模式叠加深度思考有什么效果?我哪知道这个问题要不要深度思考,联网搜一对网页强行拼凑答案也很差劲。重度 chat 的 用户更不爽, 再加上 v 四还是纯文本模型,没有多模态,中间的 chat 客户群体基本上也不会用。所以从产品体验上来说, v 四真的很一般。举个例子啊,我想知道,英特三二零和大疆的产品竞争策略要不要问八次?至少得问两次吧。 还有这个问题,专家模式加思考模式加联网都开了,结果就只输出了简单的几句话。同样问题, opus 四点七 adaptive 按钮开启,自适应思考深度自己决定什么时候联网搜索,你看看这个质量,前后关键节点梳理的清清楚楚, 还会提醒一个容易被忽略的历史细节,一个更深的问题,以及 post training skill 目前的状态,遇到不懂的可以随时选择我 reply 还可以一次 reply 好 几个,这都是好的产品体验。 你再看这个搜索的质量,一个是引用一手的 o m i 官方博客,一个是引用二手的新浪财经报道, website 的 质量太差了。再一个就是先搜后达的这个架构,你搜了八十六个网页,把它们都塞进上下文里面,微思的思考就被动地围绕这些垃圾材料展开,很难再跳回去做真正的推理。这就是为什么 dbc 一 联网就拉跨的原因。 不是说 v 四能力差, v 四模型能力不等于产品能力,也不是说 deepsea 做不好产品,是他们压根就没打算花心思做好 c 端产品,这是他们的战略选择。所以你要问 v 四强不强,强, v 四好不好用,不好用起码在 deepsea app 这里面很不好用。 所以说 v 四就不是你的菜,不是直接给 c 端用的,他的目标是 b 端的开发者。 ap 文档里面高情商的写了,出于兼容考虑,说白了就是来切客户的。 v 四模型是一个知识扎实,数学和代码极强,中文第一,深度推理和 ag 的 能力比顶尖币源稍微差一点的开源模型,它的亮点是上下文架构上的创新,还有极具侵略性的价格,跟一三家比真的太便宜了。但如果说你自己配置 ag 的 调用 v 四 pro 的 api, 我 跟你讲它真的不便宜。 怎么调研也很简单,随便搞一个龙虾 agent, 然后到 dsp 官方 api 文档里申请一个 api key, 买十块钱的玩一下,然后自己复制粘贴一下 api key, 还有 base, url, model name, ok 了,就这么简单。 我先调用的是 v 四 pro, 就 问了一句,你是谁,花了七分钱,还行吧。然后我问 davidson, v 四有什么新的技术亮点?你在豆包千万元,宝提米随便都能免费问的问题,他深度思考了四次,调用了五次,工具,花了我一块一。 如果再复杂一点,问个英文问题, opus 四点七比四点六在 agent 的 编程方面有哪些能力提升?四点七的后续的方法有什么改进?这一次花了我一块九毛四,一个茶叶蛋就没了。如果你自己折腾用 agent 的 调用 api, 一 天就问十个吧,还算简单的问题,一个月就是将近五百块哦,你受得了吗? 那为什么不便宜?真相,在它的 api 文档里写了思考模式,这里默认开启思考,默认思考深度为 high, 但是对一些复杂 agent 的 请求,思考深度会自动切换为 max。 你看我跑任务之前,我明明选的是低思考档位的 v 四 pro, 任务跑起来,它就立马自动切换到高档位了。龙虾这类产品就是 agent 的, 它会调用工具,像前面 web search, web fetch, 它都是调用工具。 a p p。 文章里还说了,如果模型进行了工具调用,思维链就是思考过程是需要参与上下文拼接的,这是 agent 的 任务必带的。没辙, 像我们日常提问推理模型,思考过程用完就丢了,不会输入到下次对话。但是 ag 的 调用工具的时候,思考过程不难丢,因为任务很长。他第五轮的时候为什么调用工具? a 调用的结果怎么样?这些关键信息会影响 ag 的 后面的思考和行动。 这也是为什么我只问了一个很简单的需要联网搜索的问题,就花了我一块多钱,因为上下文里面塞了很多思维链,你说现在 ai 干活怎么可能不调用工具?当然 flash 很 便宜,参数量摆在那,是一个比较小的轻量模型,但是便宜,真的有好货吗?嘿,我测了好几轮, 价格是真的便宜,基本上每次都是四到五分钱,跟 v 四 pro 差了二十倍左右。还是那个问题, deepsea v 四有什么新的技术亮点?这里注意啊,他们用的 web search 和 web fetch 是 一模一样的,是 a 键的框架自带的表现差异就体现在他们决定怎么搜,去哪搜,搜什么搜多深。 vs pro 是 五次工具调用,四次深度思考。 vs flash 是 三次工具调用,三次深度思考。 vs pro 搜了十个网站,还知道搜英文网站,有技术博客,官方仓库等等,都是偏一手偏技术的信息源。 vs flash 的 八个搜索全是中文网站,都是偏二手的新闻网站,再看输出结果,明显 vs pro 更深更细。 v 四 flash 这里注意力机制方面新的亮点其实不是 d s a, 官博里面说的是结合 d s a d s a 是 v 三点二勺的技术概念,在一手的官方技术文档里面有介绍。 v 四新的亮点是设计了 c s a 加 h c a 的 注意力机制,你看 v 四 pro 就 做得更好。 在 a 键的场景下,他俩的思考深度都是 max, 调试工具也都是一样的。造成这种差距的原因是 vs flash 的 原知识就是没有 vs pro 的 多,因为 pro 参数量大很多,他见得多,他知道去哈根 space 找一手消息,他知道搜英文关键词交叉验证更可信。 虽然官方说他俩的推理能力相近,但是他们骑手的动作和认知就有差异,所以结果就有差距了。我们再看另一个更难的英文问题就更明显了, v s pro 十九次工具调用,十一次深度思考, v s flash 只有五次工具调用,三次深度思考。 v s pro 反复在搜索中生化问题,从整体改进到 system card 再到 r l h f 的 变体,一层比一层深刻。 v 四 pro 的 输出也惊喜很多,它单独列出了已知回归项这个负面信息, vs flash 根本没提 v 四 pro, 还引用了 espac 官方公告的英文原文 投屏消耗对比。 v 四 pro 相当于做了三点七倍的思考,处理了二点三倍的新信息,输出了二点五倍的内容,整体大概就是三倍的工作量,花了二十八倍的价格。 注意,这还是用国产 web search 的 工具,交互结果的差距已经很明显了,一个普通本科生的水平,一个博士级的水平,但是相差二十八倍的成本,值不值需要你自己去判断。 如果你打算用 v 四模型跑 agent 的 任务,重要的活用 v 四 pro 不 到两块钱,能帮你节省半天的工作量,那肯定非常的值。一些简单的 agent 的 任务,那肯定还是 flash 的 七分钱更有性价比。 a 阵的干活,光靠聪明的推理模型还不够,还要长上下文窗口。现在一照是标配,但是 v 四的一照上下文窗口工程上成立,在可用性上要打个大折扣。 他在前一百二十八 k 还能维持住性能,从两百五十六 k 到一照会迅速衰减。 oppo 的 四点六一照的照回率是百分之七十八点三,这是为什么 cloud code 在 程序员里口碑那么好, 它是目前唯一一个能在五百 k 以上的上下文里稳定工作的编程 agent。 v 四 pro 以照的照回率是百分之五十九,这个得分低, agent 的 工作记忆就很难兜住, agent 的 表现就不理想。当然,官博也承认在 agent coding 方面和 opus 四点六思考模式相比有一定差距。 那这个一照上下文窗口跟你 c 端用户有什么关系?没关系,你不倒腾 a 九的调用 a p i, 你 的日常需求一百二十八 k 足够了。很少有人能在一个窗口下把 cloud 聊到压缩对话的地步,一照还是两照,你根本感觉不到。 如果你早就习惯了拍照提问,或者说语音对话,或者有 ai office 的 需求, v 四和你就更没关系了。它是纯文本模型, 没有动模态, v 四就不是直接给 c 端用的东西。 v 四的高价值场景不会出现在 c 端消费者面前,它的基本盘是 b 端 a p i 调用的大批量文本处理,比如说电商平台,每天处理几百万条的商品描述、评论、客服对话等等。 v 四的价值是以币源旗舰级的能力和极具侵略性的价格去抢占三家的弊端市场。但是 v 四不是 r 一, r 一 爆火是因为它让大众强烈的群体来说和 r 一 没啥差别, 确实很难体验出差别,所以毫无波澜。对重度用户来说,他们用过更强的,很难瞧上,也毫无波澜。 虽然现在 v 四是预览版,正式版会更强,但是他依旧不会把你放心上。其实很多发 v 四视频的博主,上一次用 deepsea 还在去年, 所以免费用户继续刷国内 app, 付费用户继续你的订阅。 v 四是好模型,但不是好产品。会有人用 v 四做出好产品。等着吧,限量时间,下个视频再见。

最近 deep seek 发布了 v 四版本,我帮大家测试了一下,使用这个 deep seek v 四模型,配合指令, ai g c 率可以直接改到零。但我发现好多宝子真的纯莽夫操作,直接把豆包整好的出稿,二话不说一股脑往里丢。结果一查, ai 率不但没降,反倒往上涨, 瞬间慌到不行,还搁那怀疑 deep sec v 四不好用。我真的想说,纯属你自己用法太粗糙了好吧,正确操作其实很简单,首先记得切到专家模式,不然很多时候你用的还是普通版本。然后把深度思考打开,重点来了,智能搜索一定要关掉,不然联网后容易混进一堆乱七八糟的信息, 反而影响效果。可以结合这段提示词,一小段一小段的降 ai。 但很多人又遇到新问题, ai 率是降下来了,整篇文字跟唠嗑似的,口语感太重, 一点初稿内味儿都没有,改完等于白改,纯属浪费时间。这时候就该咱们老朋友登场,看学校,要求选知网或者维普就行,把文档丢进去,他会跟着各大平台的算法逻辑,帮你重新梳理文本结构,专门降低内谷 ai 位,这样处理一下基本都能合格。

这是由 cloud code 使用了 agent team 模式之后,要用 deepsea v 四生产出来的三 d 图形环效果图。 四月二十四号,万众瞩目的 deepsea v 四终于发布,值得注意的是,在官网中, deepsea v 四明确提到了针对 cloud code、 opencloud 等主流的 code agent 做了专门的优化。 所以我很好奇 deepsea v 四和 cloud 能产生怎样的火花呢?直接打开 deepsea 官网, 点进来之后,点击 api 开放平台,这里可以看到用量信息、 api key 等关键信息。注意左下角,这里有接口文档,在接口文档里你可以看到如何去调用 deepsea v 四的 api。 值得注意的是,文档下方有一个接入 ai 工具,点进来后看到的第一个就是接入 cloud code, 而 cloud code 的 所有的配置已经详细地写在了这里, 我们只需复制粘贴到自己的终端即可开始使用 deepsafe 为四。打开 cloud code 之后,我们输入 context, 看一下现在是不是传说中的百万上下文, 果然是 em 的 上下文。这里需要值得注意的一点是,如果你的环境变量没有按 deepstack 官方文档所给出的方式去写的话,比如后面少了 em 这个标识,那么这个时候你再启动 cloud 查看上下文的时候,你会发现只有两百 k 的 上下文。 那么这里我就很好奇了,如果我把这个改成二 m 的 配置,同样输入 context, 发现还是只有两百 k, 那 我就更好奇了。没事,我们有 cloud code 的 源码,我们直接在源码中启动 cloud, 让他帮我分析一下这个是怎么一回事。 好吧,经过一个漫长的分析之后,发现这个 e m 是 个以字母串形式写死的逻辑。 好吧,果然世界是一个巨大的草台班子。好,这里我们也是直接使用 cloud 来做一个项目。为了更好地测试 deepsea v 四和 cloud code 的 设备性,我们这里直接也是使用 cloud code 的 agent teams 功能。注意,如果你要使用 cloud code agent teams 功能,需要声明环境变量之后才能开启。这里我们启动 cloud code, 输入我们已经准备好的提示词。总体来讲,这个提示词就是让 cloud code 分 成三个专业的开发小队,然后有项目主理人,还有一个前端工程师,还有一个视觉光影设计师, 然后就是制作一个三 d 土星环的全屏沉浸式网页。可以看到,在启动任务之后, cloud hold 在 t max 开了三个紫禁城, 这三个紫禁城分别是 pm 项目经理, designer 设计师,还有一个 indiegineer 工程师。 在经过将近十分钟的代码编辑之后,三人小队终于完成任务。那最后我们来看一下效果吧。 嗯,不错,很满意。比较可惜的是, deepsea 官网现在还没有提供 good plan 的 套餐模式,期待以后会出。

我们回到 cloud 桌面版的登录界面,注意这里不要点 get started。 我 们左上角点击 help troubleshooting enable developer mode, 在 弹出的对话框中选 enable, 这里还是不要登录。点击 developer configure third party inference, 进入第三方模型配置,这里可以按照我的方式填写,这里填写 dpc api key 默认不要动,剩下的地方先空着。 skip login mode choose, 打开,点击 apply local 里再弹出的对话框,选 relouch now 等三秒。 我们可以对话测试下是否可以正常对话,没有问题再试试联网搜索也成功了。再测试一下代码能力,我让他写段游戏代码,这里弹出了选项,那就写个贪吃蛇的吧,技术实现,我们就用 python 试试。好,他写完了,右边可以看到代码,他给了一个终端运行命令, 打不开,但是看他的代码确实是写出来了。这个 show in folder 打开也是代码。我跟他要了一个打开方式,他给了我一个 html 的 打开方式。来,我们试一下,可以玩,那我们来试一下好不好玩 啊?不好,代码能力验收通过。关于访问网页核实图如, 如果你只是想让 cloud 访问网页,就改白名单,把要访问的网站域名加到 kyrocross 里,改完以后重启。 clouddesk 最好新建一个 cooke 绘画再测试,但注意白名单只解决网页访问,它解决不了。图片识别,如果你想让 cloud 看截图读图片识别界面,就需要 mcp 工具, mcp 可以 理解成给 cloud 的 加一个本地助 手, cloud 负责聊天界面, deepsea 负责文本和代码, mcp 负责把图片、网页、文件这些内容取出来,图片识别可以接支持视觉输入的模型, a p i 也可以先走 o c r m c p 配置大概长这样,配置好以后重启跨点,然后在对话里直接让它调用工具,比如调用 facebook 的 识别这张截图,或者调用 webber 的 读取这个网页。最后总结一下,只想用 d c c 写代码,接 api 就 够了,只想让它访问网页,改白名单就够了。想让它看图读文件,处理复杂网页,就加 m c p。 这里我配置好后,截一张图片试试视觉识别效果。调用这个 m c p 工具识别图片,再弹出的交互选 l o one 可以 看到识别成功了,再试一下 webflix 访问网页能力,给他一个链接,让他调用另一个 m c p 试一下 也成功了。以上就是本期视频的全部内容了,如果有用的话记得点赞。关注这期内容的 m c p 工具,我全都会免费送给大家,欢迎来拿!