deepsea 预计 v 四点一将在六月发布,补齐图像和音频理解,补上 v 四只能纯文本的短板,听起来像常规补全,但拆开成本结构,事情没那么简单。 v 四 pro 运行成本比 gpt 五点四 mini 低百分之五十三,技术代差收窄到八个月,数学和软件工程国产第一一个成本只有对手一半的模式。现在要把感知补齐, deepsea 是 在极致性价比的底座上加感知。多模态不是加分项,是攻进企业市场的入场券。企业不需要最强的模型,需要够用便宜能接近工作流的。 deepsea 的 逻辑不是拼谁更聪明,是五折价格八成能力再用多模态补上最后两成场子缺口。六月如果价格不变,不是追赶,是重新定价。
粉丝8790获赞18.2万

本期视频来分享如何将 deepseek 的 vs 模型接入 cloud code, 并解锁 em 的 上下文以及 max 思考等级。我目前已经将 deepseek 的 最新模型 vs flash 和 vs pro 通过 ipad 的 方式来接入了 cloud code。 vs pro 模型在降价之后性价比也越来越高了,并且对 a 键的也有做专门的适配, em 的 上下文对于大多数人来说也更加友好。 视频内容主要分为四个部分,第一需要先安装一下 cloud code。 第二,安装开源工具 c c switch。 第三,需要购买一下 deepsafe 的 api 并完成配置。最后再来测试一下 deepsafe。 v 四 pro 加 cloud code 这套组合表现怎么样。废话不多说,我们现在开始 首先来说如何安装 cloud code。 大家常说 cloud code 经常被封号,那其实封的是拥有模型能力的个人账号,但 cloud code 作为一个单独的软件是可以正常下载和安装的。 没有订阅官方的模型,我们依旧可以使用它的框架当成是 opencloud 或者 hermes nint 这种。在他们的项目官方网站这里也有明确的说明。终端 cli 和 vs code 也支持第三方提供商。 本期视频演示的是安装 cio 版本,也就是最通用的版本。这里有一行中的命令,它支持 macos、 linux 和 windows 这几种不同的系统版本。 windows 这里分为 power shell 命令和 cmd 命令,并且 windows 用户需要先下载安装下 get, 如果没有安装的话,可以到 get 的 官方网站下载安装包进行安装。 这里复制这一行命令,然后打开终端 app 或者 power shell, 输入他们提供的命令回车执行就可以了。我这里已经安装过,所以不再演示具体的步骤。安装好之后可能会出现一个提示,大致意思是安装已经完成,但是 control 的 安装位置并没有加入到电脑的环境变量中。 这里直接复制这行他提供的命令,在终端执行一下,搞定之后输入可拷的 code 杠杠微刃来确定当前的版本号。后续使用的话,直接在终端输入可拷的命令就可以打开了, 但是你那里可能会提示不能连接官方服务。接下来我们来安装第二个工具 cc switch。 cc switch 是 一个开源工具,它能够让 cloud code codeys、 opencloud 这类的 a i a 检测,方便地切换模型。累计下载量有三百多万,在 github 上面也有五万多个 star。 它有很多实用的功能,比如一份配置同步到多个应用,支持热切换,不需要退出应用切换模型。还有用量仪表盘,能够查看你的请求数和头克用量等等。 我们在项目的首页这里有一个已发布的安装包链接,点击进去,然后在这个界面直接划到最下面。这里有很多的安装包版本,如果是 mac os 系统就下载这个 mac os 点 dmg 的 版本,如果是 windows 就 下载这个版本。下载好之后直接点击安装包进行安装就可以了。 它这个项目的说明文档也有比较详细的安装教程。第三步,到 deepstack 的 开放平台购买 api。 我们来到 deepsafe 官网,点击 api 开放平台,我这里之前已经充值了一些,在网页和 deepsafe 对 话是完全不收费的,但是想要调用 api 就 需要进行充值。他们目前没有推出类似 tokpline 这样的按月订阅的套餐,好处就是用多少花多少。 目前他们对 v 四 pro 模型打二点五折,每百万 tokens 缓存命中情况下输入是零二五元,未命中是三元,输出是六元, 这个折扣目前是到五月三十一号截止。 v 四 flash 模型和 pro 模型的价格对比可以在官方的 api 文档里查看,这里点击充值按钮,然后选择金额和支付方式。建议先小额买一笔,用完之后根据自己的实际使用情况再进行补充购买。 付款完毕之后,点击左侧的 api case, 点击创建,然后复制这个 key 的 密钥, 注意这个 k 的 密钥只能够在创建的时候查看,关闭这个页面就看不到了,如果丢失的话,就需要重新创建一个 k, 然后打开 cc switch 这个应用。我这里已经添加好一个 deepsea 的 模型了,选中这里的 cloud 的 图标,然后点击添加, 在预设供应商这里找到 deepsea, 在 api k 这里填写 k 的 密钥,然后这里需要修改一下这几个模型,可以直接参考我这个填写 默认模型就是 deepsafe。 v 四 pro 后面加上 em 是 因为之前的公告有说明,这样才能够开启 em 的 上下文,然后点击添加就可以了, 这里就会多一个 deepsafe 的 模型,点击这个按钮来测试当前 api 是 否可用。点击这里可以配置用量查询,查看当前还剩多少余额, 勾选这里,然后点击保存配置,这样的话就能够看到还剩下多少钱了,然后点击起用,就能够正常的使用可绕的扣子了。左上角有一个设置按钮,通用,这里建议打开开机自启使用统计,这里也能够查看 ai 模型的使用情况和成本。 我们打开终端应用,输入可绕的指令,那这个呢?就是 deepsea v 四 pro 的 模型,并且是一百万的上下文, 我们输入指令斜杠 context 能够查看,这里确实是一百万的上下文 tokens。 这里的默认思考等级是 medium, 可以 使用命令斜杠 effort, 然后空格后面的话就会显示哪些等级可选,这里输入 max 回车确认,这样的话思考等级就会调到最高。还有一个命令可以快速的切换模型, 输入斜杠 model, 然后回车。默认模型其实就是 v 四 pro, 我 们之前配置的 apps 和 sonata 都是 v 四 pro, 嗨酷模型是 v 四 flash, 通过键盘的上下按键来选择,选中这个模型,然后回车确认, 这样的话模型就切换到了 v 四 flash, 这里输入命令 context 能够看到它的上下文,显示是两百 k 的 tokens。 最后一部分来测试一下 cloud code 搭配 deepsea v 四 pro 到底贵不贵,干活效果怎么样。 首先说一下,它是基于文件夹的工作模式,所以你需要先通过 cd 命令跳转到你想要它打开的文件夹,比如我的项目文件夹的路径是这个,就需要输入屏幕上完整的指令回车,到了这个文件夹后,输入 cloud 的 命令来启动它, 如果路径很长的话就比较麻烦。有一种方法可以简化一下, windows 用户应该可以直接在文件夹右键从当前文件夹位置打开终端, mac 用户右键的话是没有的,但是可以直接将文件夹拖拽到终端 app, 那 当前终端打开的文件夹就是这个项目文件夹, 输入 cmd 命令,可以查看当前文件夹的路径,然后输入 cmd, 启动 cmd 的 code。 第一次打开的时候需要确认一下这个文件夹,点击 yes, 后续退出的话需要连按两次 ctrl 加 c。 这里安装一个归藏老师最近开研的一个 ppt skill, 设计是比较美观的。 来到他的项目仓库,这是一个电子杂志风的网页 ppt skill, 纯网页形式,适合线下分享,但是不适合培训课件。这个 skill 的 名称叫做归藏 ppt skill, 这里提供了多种的安装方式, 最方便的就是直接复制这一段话,然后发给 ai, 选中这一段话, command 加 c 复制,然后来到 kol 的 对话界面, kol 加微复制,然后直接发送。 kol 在 执行任务过程中会需要一些权限的许可,遇到的时候直接选中 yes 就 可以了,它的框架对于安全保护还是比较好的。 整个的执行过程我就直接跳过了这里提示安装好了触发词,就是帮我做一份杂志封的 ppt。 ok, 我 在这里输入这句话,然后告诉他要做的内容就在当前文件夹中。在当前的项目文件夹中,我放入了一个 mail 文件, 内容是关于 code 的 使用方法论,然后回车执行。他会先查看项目文件夹的内容和 skill 的 使用说明,执行过程中可能会问一些问题,根据个人的需求选择就行。 我这里也跳过过程,大概直行了六分钟左右,一共生成了九页 ppt, 并告诉了我每页的布局和内容,以及怎么操作。 ok, 我 们直接打开浏览器来查看一下这个网页的 ppt。 这是第一页 codex 的 方法论,整体的设计风格确实是比较美观的,如果是个人制作的话,可能要花费比较长的时间,并且效果还不一定有他这个好。 第二页这里的话可能会有一点点问题,下方的文字有一部分被遮挡了,后面的页数大家可以具体去看一下内容觉得怎么样。 最后再来看一下安装这个 skill 以及制作这九页的 ppt 一 共花费了多少钱。 我在做之前是九点八九的余额,刷新一下网页,那现在还有九点三九的余额,一共是花了五毛钱。这里有一个每月用量的图标,展示每个模型花了多少钱。下面也有 token 的 使用详情,包括输入和输出的具体数量。大家觉得 deepsea v 四 pro 的 性价比怎么样?

就在今天, deep sec 发布了他们的 v 四模型,并且同步开源了,这一次发布最大的亮点就是支持了百万 token, 然后重点优化了 crow code, open crow code 等等这样的 agent 工具,从过年等到了现在,终于发布了。 更巧的是,就在前脚 gpt 五点五刚发布,我上一个视频刚做完,刚实测完,他就发布了,这次他们发布了双版本 deep sec v 四 pro、 deepsea v 四 plus。 两个的差别,第一个是参数上啊,一个是一点六 t 的 参数,第二个是二百八十四 b, 那 这个的话就是走性价比的路线嘛,还是非常的便宜。那这个 pro 的 话这一次就比较贵了,如果你没有走到缓存的话,百万托管是十二块钱,就相对来说还是挺贵的。 我刚刚实测下来, v 四 pro 在 这个复杂推理上面真的是比之前上一个版本我个人感知还是挺明显的,尤其是在 crocodile 里面,它的写代码的这一个感觉啊,跟现在国内的顶尖模型 gm 五点一啊, kimi 二点六啊都差不多了。下面的话我们直接来看实测环节, 那我们这边的话还是沿用之前的一些评测任务,同样的提示词,同样的项目,然后我们把这一个今天新发布的 gbt 五点五以及 deepsea 微四 pro 我 们都接进去,然后来看一下它整体的评分情况,分别两个项目,第一个是从老项目迁移到新项目,让它去做 一个大项目的迁移,这个难度还是挺高的。那第二个项目的话,也是之前经常测试的,就是把一个已有的一个 skills agent 是 终端交互的,把它做成这个外部 ui, 主要考察它全站以及 sync 啊工具调用流速输出的能力。那我这边的话是用 ppl 去测试 deepsea v 四 pro 的, 因为之前测试智普 gm 五那期视频, 他们官方直接卖受气呢,所以说我就找了一个国内做这个开元模型,推你的,那价格的话也是一样的,跟官方都是一样的,这 这一期视频大家可以有福利了。因为那一期视频的缘故,所以说这一期视频呢,他给了我们一百张的这个三十块的代金券,可以直接用 deepsea 微四的模型,你也可以用 kimi k 二点六还是其他的模型,因为国产的模型其实比较便宜嘛,三十块钱的话你大概率也还是能用一用,一会儿不薅白不薅是不是? 那我把他们的这一个得到优惠券的链接也放在这一块了,大家就是先到先得吧,只有一百份哈,而且是要新用户才可以,大家可以去尝试去试一下。因为本身都是开源的模型嘛,所以说不管是用官方的还是这些的,其实区别都不大,因为价格都是透明的。下面我们来看一下整体的一个评测情况。我这边准备的就是五个目录嘛,那 五个目录的话分别代表着就是最顶尖的 gbt 五点五 off 四点六 off 四 pro, 还有就是今天发布的嘛, gbt 五点五, 为什么要把这些名称隐藏起来呢?就是为了后续我去里边有代码的时候,让他们要公平公正,不能说因为是啊,国外顶尖的模型或者模型代号是新的,他就有那种权重的,这个偏离是不对的。好,我们来看下第一个任务就是给这一个图片 a g 的 从另外一个项目里面迁移过来,做谷歌认证登录,然后做 gmail 登录。整体的项目复杂的挺高的,可以看到他这边已经 一百万的托管都已经压缩了一遍了,并且他之前还做了很多的探索嘛,所以说整体这一块项目也比较复杂,那他完整情况怎么样呢? 一次性完成,并且这个项目能正常启动。以往我测试其他国产模型的时候,在上一代的时候其实很多都会翻车,那这一代看的话就是提升还是挺明显的,因为官方也说了,他在整个的这个 qq 链接的这块的优化是挺明显的,但是也会有一个小问题啊,这个小问题是什么呢?就是他忘记写了落地页了,因为我要他写落地页,他没写 好,这是他写的这个落地页嘛,就是我有一个图片生成的 agent, 整体效果就还行吧。然后我们来看一下登录登录,主要是让他去做 github 的 这个认证以及谷歌的,我们来点一下, 可以看到是认证成功了,他也帮我们把头像昵称拿出来了,那我们看一下另外一个就是谷歌的认证登录, 可以看到这块也是 ok 的。 那在测试 deepsea 和 v 四的时候,我的直观感受就是它一次性完成的,除了落地也忘记写了,但它整体的这个认证登录这块完成的非常好。接下来我们来看一下这一个 gpt 五点五完成的, ok, 这是 gpt 五点五写的,这个落地也就也还行, 就它的风格跟它其实还是就跟我们刚看到的这个 deepsea 还是不一样的。那它这一块,这一个就是登录这块也是还是有些区别,看个人感受吧,我还是比较倾向于 gpt 五点五这个感觉的,然后点一下这个认证登录,这个也是 ok 的。 光看功能这一块的话,其实两个就 deepsea 跟 deepsea 五点五 差不多,但是核心的是什么呢?核心的就是看它的代码实现这一块,因为你只要涉及到登录认证这些,安全性就是非常非常要保证。好的,之前 我们测试 cloud 跟 gpt 对 比的时候,就会发现 cloud 有 偷懒的行为,这次我们看一下 deepsea 到底怎么样。好,我们来揭晓一下它整体的这一个评分情况。 ok, 这个评分出来了,那 ai 给它的评分是七点零,那它这个评分是怎么得出来呢?就是 发现啊,就是我们这个申图的任务里面,因为你加了用户体系嘛,那是不是每一个人的这个申图任务,它应该是隔离的,但是 deep sec v 四这边是没有隔离的,另外的话 web socket 也没有集成件全,还有后端集成测试还有些失败的,所以说它整体的评分会比较低一点。那 gpt 五点五这边的话,它这边也新增了一些配置文档, 还有但是会有一些小 bug 嘛,所以说整体评分的话,可以看到不管是 cloud 的 off 四点四还是 cloud 的 off 四点六, 还是没有这个 g p t 五点五,再加上我上一个视频也说了, g p t 五点五真的相当的强,而且它不封号,我觉得大家都可以去试一下 g p t 五点五真的挺猛的。第二个项目的话就不带着一步步去看了,直接把这个结果揭晓一下吧。那第二个的话会相较于上一个会好一点,因为整体这个的难度没有那么高,但是你看啊,它会比 cloud of 四点六要好, 那是因为在这个项目上面, cloud 的 opt 我 不知道为什么表现的就有点差,那它这块的话也说会有一些就是好的地方嘛,比如一次性完成的后端跟前端,然后 setting 工具调用,然后一些流势回复都 ok 的。 但是它这个 ui 的 感觉会比较弱一点,因为我的主观感受也是它的 ui 相对说比较差一点,最好的还是 gpt 五点五。 好,我们来总结一下,这一次它的上下文变强了,它的这个 a 键的能力也变强了,是真的变强。还有就是它的这个适配性,不管是 cloud code 还是 open cloud 这些都适配的比较好,但是的话就是限阶段比较贵,一百万拓客的话需要十二块钱。但是问题来了,官方今天发的一个博文,里面有一个很关键的小字,是什么呢?就是国产芯片 在适配了,因为现在算力跟不上,所以说他们这个没办法就要标这么贵,但是未来会很便宜很便宜,他们预计是下半年。 ok, 这就是这期视频所有内容了,我是阿娇,我们下期见,拜拜。

现在路由接 dc 不 用那么麻烦了,以前中间还要加一层 c c 叉,现在 c c switch 更新后可以直接在里面配置了,你按上下文也能够正常开启,额度不够用时可以试试让 dc 接上,毕竟真的大碗便宜。 下面一分钟带你配好。先打开 c c switch, 接到路由这一栏,点击右上角的加号,然后找到 dc, 选好后默认信息都会帮你填好,只需要填你自己的 api key 就 可以。再检查一下这两项有没有打开, 然后保存配置,回到首页,点击左上角的这个开关,最后重启一下 c c switch 还有 codex, 这样子 codex 就 可以成功的接上 d c 了。现在整个流程会简单很多,也少一些麻烦,还有不稳定。今天的分享就到这了,我是木马,陪您一起玩 a 的 赛博达子,咱们下期见,拜拜!

今天一分钟带你告别命令行,直接从 kol 的 桌面端里面进行 deep 配置,并且完美支持一照上下文和 kol 的 全部功能。打开 kol 的 离线安装包,直接安装,安装之后直接打开左上角 help, 跟我一起选,进入开发者模式, 同意再点击左上角开发者模式,开始进行裁放配置,这里自定义,可以看到。打开第四个官网 api 开放平台创建, api key 创建之后复制 粘贴进来,然后再从我们的 url 从接口文档这里进行复制粘贴进来,然后模型列表选择添加 我们直接复制粘贴,记得打开一招上下文开关,继续复制粘贴。打开一招上下文开关, 前面加可导杠空格,一定要加这个直接应用,后面可以继续关注我会大家从零开始完成自己的软件和网页开发,完成自己的 web coding, 感兴趣也可以点击主页进群。

deepsea 这次没开发布会,没拍宣传片,就发了一篇五十八页论文,一句话,一百万 to 肯上下文,显存只要老版本的十分之一。先说问题, transformer 的 注意力机制太贵,一百万 token 直接把显存撑爆。 deep secret 一 口气塞了三个全新结构,压缩稀疏注意力, csa 更猛,压缩的 hca 加上残差稳定层 mhc, 翻译成人话,把每几十个 token 折叠成一条, 该禁读的禁读,该跳过的跳过,该压扁的压扁啊,省了多少?同样跑一百万字, v 四 pro 单步推理只用老版本百分之二十七的算力,显存缓存只剩百分之十, flash 版本更狠,算力百分之十,缓存百分之七。哈哈, 老版本要五十个 g 显存的活 v 四五个 g 就 办了。架构是软的,工程才是硬功夫。 v 四这次至少有三个动作,以前没人做出来过。他们把摩羯训练的通信和计算融成一个内核,比之前的搜塔快了百分之九十二, 而且整套代码已经开源到 deepgram 仓库。再就是 f p 四量化感知训练,把四比特精度做到无损,征回 f p 八。还有 beatwise, 一 致训练和推理之间每个 token 输出完全一样,没有任何开源框架做到过。再看论文第十六页这一句话, 同一份代码, nvda 和华为升腾两个平台都跑通了。这就解释了为什么 v 四定价表底下藏了一行小字,等升腾九五零下半年批量到位,价格还要再砍。 deepsea 也说了句大实话, 推理能力比 gbt 五点四和 jammin 三点一还差三到六个月,但内部 agent 扣顶实测体验已经超过 sanet 四点五,接近 opps。 四点五最后一个彩蛋公告里点名适配的 agent 四点五最后一个彩蛋公告里点名适配的 agent open claw open cold cold body open claw 是 海外开源的个人 ai 助手,海外圈刚被吹爆,能从 whatsapp 替你做事。这次 deepsea 把它跟 cloud code 并列写进了公告。关注我,解读 ai 前沿动态。

我为什么不建议你们用豆包跟 deepsea 来写初稿?哪怕 deepsea 已经升级到了 v 四版本诗歌也不建议。原因很简单,他们提供的文献是要比以前准确率高一些,但依然有胡编乱造的情况。然后你准备自己搭个框架,让它们一段段生成, 那 ai 率高的你绝对受不了。相反,正确的做法是用它们搭框架,不让它们铲正文。今天三十分钟,手把手教你用升级版的 deepseek 加织网,辅助你完成初稿。首先,文献得自己找,不管用什么,我们就认定两个标准,近五年前研领域的以及本科生二十篇起步 文献找好后全部丢给 deepsea, 让他根据选择题以及刚才上传的文献给我们生成论文的研究思路跟三级大纲。这一步完成后就到此为止,不要再让他们做任何事情了。之后就是跟着提示上传我们刚准备的所有东西,不想改革式在这里勾选, 不想画图表在这里选你们需要的细胞机制图、建模图、仿真图啊之类的,全部都没问题。东西拿到后也不要偷懒,通篇阅读,根据自身情况进行改写,不然答辩的时候导师一问三不知,那也不行啊。

哈喽,大家好,这是我用 dipstick 一分钟做出来的东西,逻辑清晰的思维导图,风格各异的 ppt, 精美高级的课程海报,以及有趣而又详细的日程表。甚至呢, dipstick 还帮我用来剪视频了。大家想知道上面的这些都是我怎么做出来的吗?点好关注和收藏,赶紧上车。 近两个月呢,一直疯狂深度的使用 dipsick, 如果你在 dipsick 中用的很卡的话,可以给大家一个表,这个表格里面就是已经接入了 dipsick 的,可以选选上面的模型用一用吧。今天这期视频是一期保姆级的用 dipsick 应用在我们工作生活中的视频。终于,今天我也来交作业了。第一个是思维导图, 你需要 dipstick 加 x mind。 比如说,我在 dipstick 中输入了这样一段话,我是一个研究生,我正在写一篇论文,论文的主题是二语习得中的母语迁移现象,以英语学习为例,请帮我规划这篇论文生成。 x 是慢音格式的 markdown 文本,我需要这周五跟导师汇报,非常急。大家看 dipstick 非常方便,帮我生成了 markdown 文本的。这个论文规划包括这个研究的背景和意义啊,文献综数啊,理论基础非常完全。然后把这段文本复制下来,打开电脑自带的文本编辑复制进去 保存。那保存之后,点开这个文本的简介,把它修改成 m d 格式,再存储下来。下一步就是打开 x my 的思维导图这个软件,然后在这里点击文件,点击导入,选择刚刚的这个文档。大家看 一个非常丰富详细,富有逻辑性的这个思维导图就出现了,你还可以在上面进行修改,那这些节点呢?你也可以都隐藏打开,大家看,是不是很方便哈。我看到这个思维导图,我觉得确实很具有逻辑性和专业性,作为这个专业的博, 是我没有看出不合适的地方,基本全部都覆盖到了。第二个呢,是用 dipstick 来帮我制作 ppt, 你也需要 dipstick 加 kimi。 假设我是一个文学院的大学老师,我需要现在给留学生上一门课, 中国文化概论。我需要做一份 ppt 来介绍中国文化,给我一份 ppt 的大纲和内容框架,并且也给我 mark down 的格式来呈现。当我把这段话放进去的时候, dipstick 就帮我输出了一段非常完整的 这个 ppt 大纲,然后把它生成的这一段复制下来,把它发给这个 kimi 中的 ppt 助手,一键生成 就完成了这个 ppt 的制作。当然你也可以在 kimi 里面选择不同的模板,主题,颜色,还有这里的场景以及文字,全部都可以自己修改。说实话,我觉得真的这个 ai 生成的 ppt 比很多老师用了二三十年的这个 ppt 模板真的好看太多哈。第三个是制作视频,这是我们工作室的小伙伴强烈跟我安利,让我体验了一把的。如果你想用 dipstick 来帮助你做视频哈,他可以全流程的帮助你,比如说寻找选题,撰写脚本,优化脚本, 甚至呢,后期你也可以用 dpc 加剪映来拓宽你的剪辑思路,优化你的剪辑方案,然后让你快速的剪完一期视频。比如说我把二零二四年的年终总结的这个脚本发给他,我想让他根据我的这个脚本来设计剪辑思路,比如说什么地方需要添加素材,什么时候需要加花字,加什么的 bgm。 大家看他给的实在是 太震惊了,这个是他生成的这个 e d l 表哈,非常的方便,然后精确,这个 e d l 表就是专门用来剪辑视频方便记录的,在这个表里面他标注了这个时间码,那你需要的视觉元素是什么?还有这个音效哈,还有这个入场 场的动画以及素材的来源,他自己会在剪映里面找。不仅我看完直接惊呆哈,剪辑工作室的小伙伴看完之后直接泪目啊,真的是人类之光。第四个呢就是做海报, 相信很多小伙伴都会在公司里面或者活动中需要做各种各样的海报,当你需要做海报的时候,你需要 dipstick 加急, 为什么不直接用吉梦呢?因为你的描述颗粒度越细,你才能生成出更符合你风格的。那这个时候呢,我们就要用 dipstick 来给出 出生视频的指令,那为了考考他哈,我告诉他我完全不知道我的这个视频风格,告诉他我的个人背景,我想用 ai 生图的方式制作一个课程海报,海报上呢,需要标注我的 课程名称,讲师的名称,开课的时间。但是呢,我不知道他的风格,排版和细节,希望他帮我生成几个不同风格的用 ai 生图的提示词,我希望他提示 词详细一些哈,比如说我给他刚刚发完这段话,他每一个呢,其实他都给了这个关键的细节,字母字体啊,然后还有很详细的这个提示词,之后你就可以打开即梦这个网站或者 app, 选择这里的 ai 作图,输入刚刚 dipstick 给你的这个提示词, 然后选择这里的精细度以及图片的比例,还有不同的模型,大家看一下这些风格,觉得怎么样?是不是比你们自己设计的还要好?需要注意的就是吉梦呢,他是有一定的免费额度的,然后超过了需要付费,不过我觉得他已经能满足大部分人的需求了。最后一个呢,来跟大家分享,用 dipstick 来做日历, 真的骗人,一定要试一下,比如说我给他一个场景,我需要准备这个六级的备考,考试主要的就是有三步,第一步就是去 dipstick 里面提问生成 i c s 的代码,第二步就是把 i c s 的代码变成后缀为点 i c s 的文件,然后把它导入到日 里来。同样的,我也是跟他说,我是一个大学生,正在准备这个六级的英语考试,请你帮我制定一个学习计划,具体呢,需要到每一天干什么?我还要跟他强调一下,我这个学习自控力不高,再告诉他我的薄弱项目是什么。同时呢,大家一定要记得让他给你生成这个 i c s 的代码,大家看 细不细,就问你们细不细,连每天你要干什么,以及你每天要学的英语材料都给你安排好了,不知道跟着这个学能不能考到这个六百多分哈。当这个 dipstick 生成之后,你只需要复制给出的 ics 代码,然后打开麦克 系统里面自带的这个文本编辑,点击格式纯文本制作代码粘贴上去,然后点击文件选择存储。大家注意,存储这个文本编码的格式的时候,要选这个 utf 八的格式,文件名的后缀呢,再改为点 ics, 跟刚刚制作这个思维导图一样。第三步就是打开这个 个自带的日历,点击文件新建日历,然后将存储好的 ss 文件拖入到这个日历中,选择自己新建的计划日历,一个用 dipsack 私人订制的个性化的日历就完成了。如果你有觉得哪里不太合适的地方,还可以自己去修改这些,所有呢,都可以设计成代办事项提醒,然后你就可以有了一个 监督你学习的非常高效的个人计划表啊。如果你要同步这个到 iphone 呢,把 ics 文件隔空投送到手机,也可以同步的生成了。如果你遇到任何不兼容 ics 文件的各种问题, 就按照他的步骤自查,然后把这些所有的问题就丢给这个 dipsake 来问他怎么解决就可以了。上面呢,我们就是跟大家分享了五个我在日常生活和学习工作中使用 dipsake 的案例。但其实呢,这个视频还有下半部分,我也很想跟大家探讨一下,为什么这一波 dipsake 让大家如此的着迷。很长一段时间,我其实是一直在用这个对话类的模型, 比如说跟他打电话呀,聊天啊,做心理咨询,但 dipsake 呢,是一个推理的模型,就会有人好奇,同样是 ai, 为什么有的 ai 擅长聊天,有的 ai 擅长推理,他们之间有什么差别呢?我应该在什么情况下 使用什么 ai 呢?这里呢,就不得不提到现在使用 dipsake 的很多的误区,我经常看到有人在网上分享说给了 dipsake 很多的指令,为什么他生成出来的东西还没有原来其他的模型好用呢?其实就是你把这个推理模型当成了对话模型来使用。所以呢,在你想要更好的使用这个推理模型的时候,你要首先搞清楚 什么是推理模型,对话模型呢,他其实重这个及时的回复,他没有思考过程,能够快速的处理这个闲聊,甚至和你语音进行视频通话。而推理模型呢,不仅能给出答案,还要给出他详细的思考过程,还有更长的思维链。那我给出日常生活的推理场景,大家就知道什么情况 下我用对话模型,什么情况下用推理模型啊?比如说,我给他出了一道这样的数学题,小明买苹果,然后买五个剩十元,买七个差六元,一个苹果多少钱?我把这个数学题哈放到这个对话模型中,我们可以看一下他直接给出的答案和这个操作步骤,完全没有任何的思, 然后我们再把它放到 dipsyk 里面去看,那他不仅给出了这个思考过程,而且还对比了算数方法和代数方法之间的差别,得出来的结论是不是一样的,甚至还进行了反向的这个验证。最终告诉你啊,这个算数方法和代数方法啊是一样的,没有任何问题 输出了,结果。一个呢,心直口快,着急直接给你答案。另一个呢,深思熟虑,推理很久,谨慎思考之后给出了答案,好,那这个就是对话和推理模型的第一个差别,那第二个差别是生活场景下的。我告诉他我想买一个电动车,但是呢,我的预算只有两万块钱,我每天通勤二十公里。特斯拉 model 三,五菱宏光 mini, 小米 苏七,我应该选适合哪个?我还是先把它放到一个对话模型下去看哈。大家看他也是没有任何思考的,就直接告诉了我特斯拉 model 三,五菱宏光以及小米苏七的优缺点。然后最后的结论是,哈,考虑到你的预算为两万,你当然就是买最便宜的五菱宏光吧。我们会发现他 其实没有识别到我的个人预算以及想购买产品之间的冲突哈,实际上我的两万块钱是五菱宏光 mini 都买不起的。 我们把它放到推理模型下去看哈他是怎么去处理的。首先他给出了很长的思考过程,以及更重要的是给出了我三个车型的对比哈,比如说他告诉了清晰的告诉我五菱宏光的这个价格是三点二八万起, 明确告诉我我的这个预算不足以购买上面所有的车型。更重要的是,虽然我没钱买上述的三个车,他给我推荐了这个御捷祥和 a 二六零,还有一些啊, 他的二手车型,还告诉我买二手车可能遇到的风险。更简单的例子,比如说你问对话模型,你今天想去吃西餐,让他给你推荐一些餐厅,他马上就给你跳出十个评分非常高的餐厅。但是你去问一个推理模型,可能会去问啊,你的距离,然后你的价格,甚至如果你把你的体检报告表告诉他,他还会告诉你哪些菜的糖分 含量是什么样的适合你吃的这个呢,你就会发现一个具有推理能力的 ai 和一个只具有对话型的 ai 他们之间的差别。对话就是我要最快的告诉你,不会根据你的这个问题去思考你切实的需求,而 推理呢,回答之前会认真的去思考,搞清楚两个模型的差别之后,那你就可以很清楚的知道,那最错误的用法就是你把一个数学题或者说需要根据你实际情况的例子拿去问这个对话的 ai, 而你给一个推理模型,给了他太多的例子和更多的指令。推理的模型之所以现在受到大家的欢迎哈 啊,很重要是因为原来简单的对话模型已经不能满足我们来解决这种复杂问题的需求了。尤其是 dipstick 的思考方式呢,他有一个三阶的思考方式,他用批判的视角来看你的需求, 然后再逆向推演,最后跨界迁移十分钟完成。我们原本需要数个小时的很多深度的报告。所以推理的模型我们怎么去用呢?只需要三步。 第一个就是一定要简单直接,不要复杂的提示词哈,直接给出问题,比如说你直接问他普通人怎么样年入百万,或者问他糖果果的未来要发光这个账号怎么样可以拿到百大哈,而不是分步骤的指导。 第二步呢,就是给他一些明确的场景,比如说用初中生都能听懂的话来解释量子力学,最重要的一步是第三步,一定要对他信任,不要过多的去引导他,不要用很多的指令模板来修复模型。 好的,说了这么多,不知道大家有没有搞清楚对话的模型和推理的模型,这期 dipstick 的作业交的怎么样?喜欢记得给我点个赞和关注哦!

今天把 tree 和这个 deep sea 那 个 v 四啊连起来了,然后让它来跑一下这个代码。呃。总体感觉呢?呃。因为我是让它做一个 coser 也没办法完成的一个任务,就是, 呃一个网页对话框,然后它弹出了这个滑块,我想让它去自动的去解决这个滑块的问题。呃。 coser 没有完成,然后 deepsafe 也没有完成。 呃。很难,但是给我的感觉啊,就是他们两个好像还是差不多,就是思路啊什么的都差不多。呃。也尝试过。然后最后呢?呃。我尝试了用这个 devic 的 这个 flash, 还有这个 pro 啊,它两个都试了。那个,呃。 pro, 反正最终给出的结果就是因为那个它这个滑块啊。滑块它是跨域的,它是啊调用了另外一个,一个啊,一个域名下的,所以是没办法处理的啊,只能是手动。然后 呃 coser 的 话也是类似的处理方式,然后他是单独的把那个弹出来了,但是他也没有解决。呃。总之吧,我感觉就是给我的感觉啊,就是他们两个其实上是差相差不多。 呃。然后再说说这个,呃 pro 和这个 flash 它俩的区别,呃给我的感觉也区别也不是太大。然后我专门就是问了一下 deepsea 它们的差别嘛,我附一张图给大家看一下。 呃。你看那张图的话,那就是,呃,它是,呃就是 pro 的 pro 版呢,它是这个对于这个世界知识它就储备要丰富, 呃。就是你可以理解为他的那个脑容量更大,记忆的东西更多,然后处理这。所以他处理这些复杂的东西啊,复杂的逻辑啊,就是可能需要很多环节的都需要考虑的。哎,那他是比较擅长的。而这个 flash 的 话, 呃,他就是比较,比如说你,你就是针对一个功能,比如说软件的一个功能的编辑,那他应该是也没啥问题的。你看他那个对比,其实就是对于这种编辑代码的这个逻辑什么的,他俩实际上是相差差不多的。 呃。然后还有这个费用的问题啊,就是这个 pro 版,虽然它标价好像挺贵的,但是我看了一下啊,呃,我再截一个图, 你再看这这个图的话,就是它的这个缓存命中啊,特别的高。 呃,我用了两千多万的 tokon 啊,然后,呃呃,两千,将近两千,两百万的 tokon, 它的缓存命中能达到两千一百多万, 然后那个没命中缓存的只有三十多万,所以说它这个这个成本就省的太多了,因为它命中缓存的话,它这个价格跟 flash 的 价格差不多,它就是那个非命中缓存的那个才贵,但是那个很省,真的很省。 呃,我还没有实际的做过,就是一个产。呃,用它来直接生成一个 啊,成功的一个一个案例啊。呃。等到我有再有这个新的功能的时候,然后我就尝试着用这个 tree 加上这个,呃, deepsea 微四版本,然后我来试一下,我感觉这个 flash 的 版就可以。这 flash 还是挺便宜,太便宜了, 我如果是这个型的话,我 cos 那 边我都不续费了,我宁可我支持国产,哪怕它稍微差一点点,我也支持国产呢。

最近的 ai 圈啊, gbt 和 deepsea 实在是太火了,先是 gbt 五点五发布,号称在一些精准测试里击败了 cloud 的 传说模型 mesas, 紧接着 deepsea v 四也来了,继续保持开源跑分,直逼顶级的闭源模型,现在基本可以说是国内最好用的模型之一了。 那经过最近一段时间的高强度使用,今天我就把 gbt 五点五, dbc v 四 pro 再加上稍早之前发布的 oppo 四点七,放一起做个横向对比,看看 dbc 到底能不能追上顶尖的国外模型。那开始之前别忘了点赞加收藏。 首先我们看一下三家公布的跑分软件工程能力这块,也就是真实 get 上的代码问题修复, oppo 四点七是百分之八十七点六,三家里面最高,比 dbc 高出七个点, 更难更多的文件和复杂的工程问题也是 opus 领先,所以做复杂工程的代码修复 opus 还是很稳的。但是中单任务这块, gpt 五点五反超了百分之八十二点七,比 opus 高出十三个点,做命令行跑 agent 的 gpt 五点五会更加的优秀, 然后长上下文解锁 dbc, 竟然跑到了百分之八十三点五, opus 才三十二,差了一倍多,处理超长文档,显然 dbc 会更加的靠谱。 价格方面 deepsea 就 没什么对手了,输出每百万 token 才三点四八刀, gbt 五点五和 opus 分 别是三十和二十五刀,差了将近七倍,不得不说 deepsea 是 真的良心。当然了,榜单归榜单,实际用着怎么样还得看下面的实测。 好,那我们进入第一个案例,在这个场景中,我们先回归大模型最本质的使用方式,原声尺的对话框。虽然现在大家都在整 a 阵的自动化,但一个模型底层的逻辑素质和指令遵循到底行不行,尺的对话框还是能看出很多问题的。这边我把三家大模型的四号模式全都打开,并且都使用了最高的强度。 然后我的问题是提出一个我想做一个开源的笔记类 app 啊,对标 out 店这种本地优先的产品。在动手之前,我需要让三个模型帮我做一轮技术的选型调研。 那为什么会选择这个呢?首先第一步我让他去找资料,考验搜索和筛选能力。第二步是读代码读文档,考验技术理解的深度。第三步啊,则是去看产品,考验抽象和归纳能力。第四步则是给建议考验综合判断和落地的能力。 可以看到这边三家已经跑完了,我们先来对比一下生成的速度。首先最开始输出回答的是 deepsea 啊,接下来是 cloud, 最后是 gpt, 然后输出的内容最长的是 cloud code 啊。然后为了保证客观的公平性,我这边直接把三份三个模型输出的呃大模型的回答整理成三个文件,分别交给 gmail 和千文来进行一个分析。 先看一下杰米兰的回答,他这边选择的是模型币啊,因为他认为作为一个独立开发者,模型币的整体表现会更像是资深的架构师,而不是仅仅的是信息的搬运工。那模型币对应的就是科奥的 opus 四点七, 那 gpt 和 dpc 的 话,他会认为 gpt 的 表现更加优秀。呃, dpc 更多的是信息的一个搬运,并没有站在一个工程化运维的角度去看待问题。 接着我们再看一下千问啊,那他这边的答案跟 gmail 几乎是差不多的,他也认为是文件 b 对 应的 cloud opus 四点七写的是最好,其次是 gbt 五点五,最后是 deepsea 维斯的 pro。 第二个案例,我这边让三家大模型分别帮我实现一个类似杀入监塔的回合制卡牌游戏。这边 gbt 五点五用的是 codex, office 四点七,和 dbc 比四 pro 用的都是 cloud code 的, 可以看到这边三张模型都已经跑完了,跑的最快的是 office 四点七,用了一分半,接着是 codex 花了六分钟, dbc 则是用到了十五分钟。但我觉得这也是情有可原的,毕竟 dbc 的 价格摆在这边,使用的人是非常多的, 所以也会出现一些限速的情况。那接下来我们看一下三个游戏制作的一个效果是怎么样的。我们先看一下 gpt 五点五啊, 可以看到就是 gpt 还是一如既往的,他的这个前端的风格一直都不是特别好,然后做的这个虽然是游戏,但是看上去还是以前端的那种样式啊,用一种网站的那种方式来做的,然后整体的交互应该是都没什么问题啊,攻击重击, 每回合都能回复能量,所以说基本上都能够啊,打出所有的牌。好吧,这个是 codex 加上 gpt 五点五的。接下来我们看一下 cloud code 加上 opus 四点七啊,可以看到它整个页面的一个样式,相较于 gpt 五点五 啊,是要更像游戏一点啊。然后他整个的风格有点偏啊,像那个三国杀,对吧?然后我们来试验一下,我来尝试一下他这个攻击,然后结束回合。我这边量,哎,这个为什么是智慧的结束回合?敌方回合啊,我这边有三点的呢,哎,为什么是灰的 哦,但是我还能点哦,可以看到他这边是有一个显示的 bug, 就是 我虽然结束回合了啊,敌方回合结束之后,我这边能量是回满了,但是我这边前端的样式看上去还是不能点的。好吧,这个算是有一个小的 bug, 然后我们再看一下 cloud 加上 dbc v 四 pro 的 一个效果啊,可以看到它整个页面的风格跟前两个完全不一样的,它做的是偏手机端的,我们来试一下啊,然后它这个动画效果是做的比较好的,有一个高亮的一个提醒结束回合, 哎,我这怎么点不了了?再刷新一下结束回合, ok。 他 这个是有一个呃,比较严重的逻辑上的 bug, 就是 我打完之后我就不能再点下一个了,但是我如果不打牌,我直接点结束回合,我是能够一直点 的,是吧?可以看到有这个 bug 啊,然后这边结束了,敌方也对我造成攻击的,呃,新的回合,然后我是什么都点不了的。 接下来第三个案例,我让三家大模型扮演资深的供应链架构师,挑战一个综合的实战任务,涉及二零二六版全球自动化决策系统,他们需要同时处理欧盟碳关税的合规和苏伊世运河的罢工重油问题。 可以看到这边三家大模型都已经跑完了,那由于是文档的内容居多,我们还是让 jamie 来作为裁判评判一下。这边 jamie 已经跑完了,我们来看一下,先看最终的结果, jamie 认为第一名是模型 c, 也就是我们的 deepsea, 他 有说到这是一本可以直接交给 cto 的 方案,他不仅完成了任务,还在每一个环节都展现了深厚的行业洞察。 那表现最差的是 codex, 然后它的整个分析还是比较详细的,分别从呃合规于政策的分析,再从逻辑算法的建模,再到最后的系统架构和 a 智能的一个设计,都是呃 dbisc 会表现的更加突出,说明 dbisc 现在的一个综合能力已经是非常的强了。 ok, 这边三个案例都已经跑完了,我们来做个总结。首先三个模型在各自擅长的领域上确实表现很突出, 如果你要做深度调研,或者说选技术路线, oppo 的 四点七更好,如果是代码生成和稳定的实现,则可以选择 g p t 五点五。 如果你是常文本,需要做系统设计或者说企业的架构, deepsea v 四 pro 是 一个不错的选择,而且现在 deepsea 的 价格真的太香了。行,那本期的视频就到这,希望能帮大家在模型的选择上面提供一些帮助。我是布鲁,我们下期视频再见。


deepsea tui 是 由美国独立开发者 hunter wang 用 rust 写的终端编程智能体,为 deepsea vs 量身打造 cloud code 的 平替 em 上下文两万三千的 star m i t 开源。它不是 ide 插件,不是聊天机器人竞品,是 cloud code。 em 上下文是原生支持,不是 r a g, 整个项目源码一次性塞进去。跟 cloud code 的 不太一样的是, deepsea tui 目前只能在终端里跟它对话、 写代码、跑命令,管 get, 全程不出。终端自身定位上呢,它终端原生,全站编程,三十多个工具全覆盖, a 阵智能体,多步推利自动选模型。从软件工程角度上看呢, deepsea tui 注重核心稳,边界活。比如说呢,它采用双二金置设计, deepsea 管调度, deepsea tui 管运行分开升级更安全。还有工具链覆盖,文件搜索、 shell git 诊断,此 agent 还支持 m c p 扩展。这么设计, scopes 不是 工具,而是知识包, agent 启动时加载名称和描述,需要时才拉取完整内容,相当于给 agent 装了一套操作手册。 ipsticku i 的 奥特模式下,不用纠结 flash 还是 pro, 先, flash 做轻量路由判断, 简单任务 flash 直接搞定,复杂任务自动切。 pro 加强推理,按实际模型计费,相对于 open cloud 对 实际任务太天马行空。这个问题呢, tui 采用渐进式信任模型,提供三种模式, plan 指读 agent、 日常确认、优漏、全自动。还有系统急刹箱、 linux 用 lan lock, make 用 set belt, windows 用 app container os 原声隔离。 deep sec tui 的 架构,核心设计上分别解决了不同层面的性能问题,都可有异步引擎、思维链、实时流转式、十六路 flash 紫 a 帧的并行推离强度, shift 加 tab 秒切 off high max 三档日常 high 就 够了。几种问题咱们直接上 max 聊到成本呢, tipsy pro 百万套可能约四块钱,现在还有百分之七十五的折扣, flash 不 到 pro 的 三分之一,两个都支持 em。 上下文对比, cloud code 呢? tui 国内直链 mit 开源,成本大概是 cloud code 的 十分之一,但 cloud code 是 opus 推理人式天花板, ide 集成更成熟,团队生态更完善。简单聊聊 tui 安装 win, linux micro 都能装,安装上大同小异。手册里有详细命令,我们以 win 为例, 一条命令就能安装。自动装好两个二金制配 k 就是 按指示粘贴带跑。 deepsea doctor 五项全绿环境 ok api, 国内直链不用代理。 启动后呢,开始工作,自动调工具,思考过程,实施流势展示,底部显示套坑和费用。总的来说呢, deepsea t o i 还是挺容易上手的,预算有限的独立开发者值得一试。点赞关注评论区可以向我留言,要五十七页完整项目的朋友们千万别错过。

deepsea 微似于篮板,刚刚上线了,朋友圈又是一片国产之光哈。作为一个天天把 deepsea 塞进屋里引擎里跑生产的人,今天我就不客气了,泼三盆冷水给同行们冷静一下。嗯,先说最吸睛的 agent 能力吧,官方说追评甚至超过了 sony 四点五。 好家伙,我们刚把 cloud code 的 工作流调顺了,你们就说可以换了啊。 benchmark 是 一回事,真塞进长链路工程调用里,工具选择错误修复吨轮稳定性这三道坎,有一道算一道。 anserpik 在 agent 这一块整整砸了一年的工程, deepsea 一个预篮板就说跨过去了, 格局说实话也没得挑。但是我劝你生产环境先别切了吧。呃。再说第二点, dsa deepsea's first attention 架构创新,全球领先。上下文听上去确实很硬呃,但疏散注意力这条路,从 longformer, big bird 一 路到现在了,跑了快五年了。技术报告那张 tulops 曲线画的确实漂亮,但稀疏注意力真正的痛点从来不是理论算力,而是真持。长文本里的召回率到底衰弱多少? 法律合同代码仓库多文档 read 这些常用的 recall 数据呢?没有放,只给你了一看 tulops 的 这种最好看最容易最简单的图是有点讲究的我觉得。 嗯,再说第三点吧,也是最容易被老板种草的 em 上下文, flash 版只要零点二元每百万 token 真香。跟你说一句实话吧, em 上下文不等于 em 可用上下文。所有宣称百万级模型的,我们压测下来,只要是过了二十万,指令遵循推理练完整度,命中率就会断崖式下滑。这一次发布连一张你都 in a heistick 都没给,只给你看 tops。 这叫理论性能,不叫产品可用性。降价是真的降,但是你要是拿 e m 当卖点跟老板去拍胸脯,我觉得这不太现实。说到底, deepsea 仍然是国内开源模型做得最好最扎实的,这个我确实服, 但是预览版这三个字,这次发布的节奏还有避重就轻的 banchberg, 选材味道有点开始不对劲了,希望正式版出来的时候能回来打我自己的脸吧。

最近 ai 圈最火的是什么?是 deepsea v 四发布了,很多人只看到了它的价格啊,但是你没有想过这个价格背后意味着什么?意味着很多可能今天终于可以实现了。 而 ai 这件事情,终于从大企业的专属游戏,变成了普通人也能用的工具,甚至让普通人能够拿到结果的一些方向也随之出现了。以前你总是觉得 ai 很 远很贵,很复杂,但是现在 deepsea v 四把成本又给你降到了零。什么意思?我给你翻译翻译,翻译啊,就是不用再懂技术,不用再写代码,不用配置任何东西,只要你说一句话, 他就能给你干活,整理文件,发邮件,写文案,搜信息,定闹钟,写 ppt, 做视频,全能高手!以前是要干事啊,必须找一个团队,现在是一个人加一个 vp 可乐就能解决问题。 而这个黄金组合就是 deepsea 微四的底层处理能力和 vp 可乐落地到你桌面上的动手能力。我们当然也给 vp 可乐起了一个外号,叫有钱侠,就是有钱有手啊,可以干活的,可以帮所有的老板去解决所有问题,帮所有的高管去打杂的。当然, vp 可乐也是一个叫职业经理人, 这两件事加起来就是一个 ai 普惠的开始。同时我要对你说,别再等了,你缺的从来不是 ai, 缺的是一个好用的工具。现在啊,就是最好的时机, 想要在 ai 领域创业,想要抓住万亿级别的这个 ai 员工,这个大市场的话,欢迎在评论区扣个六六六,刷到这的朋友千万别忘了点个关注再走啊,关注人为带你起飞,每天分享人工智能的前沿商业应用。

朋友们,就在今天, ai 行业直接炸出了年度王炸事件, deepsea v 四预览版正式官宣上线,而且直接同步全面开源了!你以为这只是又一次普通的大模型版本更新? 大错特错!这次的技术突破不仅直接拉高了国产大模型的全球天花板,更会彻底改写 a 股整个 ai 赛道的投资逻辑。 先给大家把这件事说透,今天 deepseek 官方正式发布了全新的 v 四大模型预览版,上线的同时直接把模型完全开源了。这次的 v 四模型直接把 e m 也就是百万字的超长上下文做成了全系列标配, 给大家翻译一下,就是这个 ai 能一次性读懂记住整整一百万字的内容,相当于一口气看完五本长篇小说,还能精准抓住每一个细节,不会遗漏任何关键信息。更关键的是,这次它直接做了双版本布局, pro 旗舰版性能直接比肩国际顶级闭源大模型,在代码生成、智能体 agent 能力上做到了开源领域的全球第一。而 flash 高效版把推理成本打到了极低,响应速度更快,性价比直接拉满。很多人到这里只看到了模型性能有多强,却完全没看懂这次上线即开源背后的真正杀招。我问大家一个问题, 之前全球顶级的大模型是不是要么闭源收高额的 a p i 费用,普通企业根本用不起,要么开源但性能拉跨根本没法商用。而 deepstack 这次直接把笔尖国际顶尖水平的大模型能力完全免费开源放出来了。 这意味着什么?意味着国内成千上万的企业不用再花天价买海外大模型的授权,不用再自己砸几十亿从零训练大模型,零成本就能做二次开发、垂直场景落地, 这才是这次事件最核心的本质。它不是一次简单的技术迭代,而是直接把国产 ai 应用的门槛直接打到了地板上,彻底打破了海外大模型的技术垄断,更会引爆整个国产 ai 生态的全面爆发。 而且它全新的注意力机制和 d s a 稀疏注意力技术,把百万上下文的算力成本大幅降低,让长文本处理能力从少数企业的专属特权,直接变成了全行业的普惠能力。讲完了事件的底层逻辑,大家最关心的肯定是,这件事对 a 股市场到底会带来什么样的影响, 哪些赛道会受益?哪些方向又会成压?我给大家做了精准的分层拆解,全程只讲产业逻辑,不做任何投资建议。首先先给大家定个整体的调子, 这次事件对 a 股 ai 板块不是全面普涨的利好,而是一次极致的结构性分化。有真实技术落地、有场景、有生态的企业,会迎来真正的产业红利。而那些纯蹭概念、没有核心技术,只靠讲故事的公司,反而会在这次行业洗牌中加速被淘汰。第一层算力,基础设施赛道, 这是最底层逻辑最硬的收益方向。很多人会问,模型都开圆了,成本降低了,是不是算力需求就少了?恰恰相反, 我给大家算笔账,之前只有少数大厂能用得起百万上下文的大模型,现在全行业成千上万的中小企业都能零成本用上这个模型去做私有化部署、二次开发、垂直场景落地,这会直接带来海量的增量算力需求, 尤其是国产算力隧道,也就是华为、深腾产业链,还有 ai 服务器、 idc 数据中心、算力租赁,这些方向会直接承接这波爆发的增量需求。 第二层,大模型国产化与垂直适配隧道,这里会出现明显的分化,受益的是那些有核心技术积累,能基于开源模型做深度优化,在金融、工业、医疗等垂直领域有成熟适配能力的企业,他们能快速把顶级模型能力转化成垂直行业的解决方案。 而承压的是那些没有核心研发能力,纯靠买海外大模型授权做简单封装就讲故事的公司。开源模型的免费顶级能力会直接对它们形成降维打击。 第三层, ai 应用落地隧道。这是未来弹性最大的方向,也是分化最严重的方向。这次 v 四模型专门针对代码生成、智能体 agent、 长文本处理做了极致优化,而且开源之后,应用开发的门槛和成本直接大幅下降, 谁能最快把这个顶级模型能力和自己的业务场景结合,落地成能赚钱的产品,谁就能吃到最大的红利。具体来看,代码开发工具、智能办公、金融科技、工业软件、传媒、内容生产这些垂直赛道会率先迎来落地爆发,因为这些场景刚好完美匹配 v 四模型的核心优势。 第四层,纯情绪驱动的概念板块。这里要给大家重点提个醒,市场上有一些纯蹭 deep seek 概念的公司,没有实锤的业务合作,没有真实的落地订单,纯粹靠市场情绪炒作,这类标的短期可能会有资金博弈,但长期没有基本面支撑,一旦情绪退潮,风险会非常大,大家一定要擦亮眼睛。 朋友们,这次 deepsea v 四上线即开元,你觉得在 a 股的 ai 赛道里,最有机会跑出超额收益的是底层的算力赛道,还是落地的应用赛道?评论区留下你的观点,我们一起交流。

一个专门为 deep seek 做的终端编程工具,刚把缓存命中率拉到百分之九十七,但真正的信号不在这个数字,而在他怎么把 deep seek 的 e m 上下文窗口变成实际可用的工作区。百分之九十七的实时缓存命中率,意味着你改代码时,他几乎不用重新读整个项目。 从 github 仓库的说明看, will 这个工具专门针对 deep seek 的 prefix cache 做了优化,每次对话只传变换的部分,上下文窗口再大也不浪费。证据来自 github 开源仓库。 核心说法是, m c p 工具集成 skills 扩展系统、 prefix cache 优化。三件事绑在一起做。 我的解读是,他不是在造一个新模型,而是在给 deep seek 配一个更懂终端的操作层。实际工作流分三步,先在终端里用自然语言描述任务,微软调用 deep seek 理解你的代码库,然后通过 m c p。 协议直接操作文件,跑命令,读结果。 关键变化是,他把理解代码和执行操作放在同一个上下文里,不用来回切换工具。值得关注的三条信号, 第一,缓存命中率百分之九十七,意味着长绘化成本可控。第二, skills 扩展系统,让它可以接入外部工具,不是封闭环境。 第三, em 上下文窗口在终端场景里终于有了实际用途,不只是 benchmark 数字,但先别上头,目前只有 github 一个信息源, 没有独立评测,没有定价,没有社区反馈。我的判断是,这个工具把 deepsea 的 终端能力边界往前推了一步,但证据还不够,判断稳定性适合现在上手的人已经在用 deepsea 写代码,习惯终端操作,对 m c p 协议有概念。 如果你主要用 ide 里的 copilot 类工具,或者对命令行不熟,先观望,等第一批用户反馈出来再说。

口袋终于实现国产模型自由了, dc 切问质谱随便切,重点是绘画记录还能够完整保留,这下真的不用再整天盯着额度了。这次使用的工具是 echo ball, 你 可以理解成 给口袋加了一个模型切换器,上次我们连接 dc 的 时候还要配 cc 叉和 cc switch, 这次更加的简单,模型都放在同一个面板里面,想用哪个直接切?安装包我都已经整理好了,下载之后直接运行就行。 我们先来打开这个 echo board, 左边点击我们的模型中心,这些模型呢都是可以直接链接的,只要符合 open a 的 协议就没有问题。点 击模型,然后添加我们的模型 id 还有 api key。 接下来我们再点击右边的应用管理,这里可以看到有很多的 ai 工具,但这期我们主要讲的是 code, 所以 我们先找到 code, 点击我们已经配置好的 d c 模型,点击启动就会自动弹出我们的 code, 看已经切过来了,我来测试一下,让他解析一下 echo ball 这个项目。 ok, 没有问题。重点来了,直接回到我们的 echo ball, 切换千问,点击启动就会自动重启我们的 codex, 看刚才的聊天记录都还在继续追问,刚才那个项目他也能够接的上。模型都放在同一个面板里面管理,不用反复去配置,这可比以前舒服多了。最后再给大家补三个坑,第一个我测试的时候发现先换回默认的 open ai 反而会丢失他的绘画记录,检查后发现原来是工具里面的一个小 bug, 不过包里面的版本已经是修复好的。第二点是部分的绘画可能会出现模型切换之后不能继续对话的情况,因为不同的模型对话里加密信息和工具调用状态他不一定能够兼容的。建议切换模型之前呢,先总结一下上下文,然后新建对话,再继续项目。 第三点,很多朋友也反馈过, a p i 模式下没有办法正常的去使用插件,但是我最近看到一些解决方案,这两天我会再去实测一波,到时候再给大家分享,不过目前又是不影响的,是可以正常使用的。今天的分享就到这了,我是木马,每天一起玩 a 的 赛博大志,咱们下期见,拜拜!

这次 deepsea v 四直接放出了双王炸全系列某混合专家架构,精准覆盖全场景需求。旗舰 v 四 pro 性能怪兽一点六万亿,总参数四百九十亿,激活参数用三十万亿。 tokun 海量数据预训练打磨 精量化 v 四 fresh 高效王者两千八百四十亿,总参数一百三十亿,激活参数三十二万亿。 tokun 预训练,小体积也有硬实力,两款模型全系列标配 em tokun 预训练,小体积也有硬实力,两款模型全系列路突破 自研 c s a 加 h c a 混合注意力架构 em 长文本场景下算力消耗直接改到了前代的百分之二十七,显存仅占百分之十,编程能力直接封神。 swede 降价得分百分之八十点六,无限接近 cloud office 四点六,支持三百三十八种 编程语言,数理推理更是杀疯了! code fossils 评分三千二百零六,直接超越 g b t 五点四,开元阵营里妥妥的天花板。全新底层架构优化推 微利成本仅限 gpc 四的七十分之一,深度适配华为、深腾、海光等国产芯片,开源可本地部署,核心技术完全自主可控。国产大墨镜直接冲到了全球第一梯队,这波国产 ai 真的 是靠硬实力领跑了!