deepsea 微四今天上午发布了一共四个版本,两个是 base 模型,两个是经过后训练的, 大家对它的期待都非常高,我第一次在模型才发布了一两个小时的时候就在社区看到它,有这么多条评论啊,不过大部分都是怎么自己认, 官方也是把这几个模型做了个跑分的对比呀。我做了个图表总结了一下。 在代码层面, deep sea 打败了解 b t, 这么奈何 cold 排在第一,而数学推理方面排在第二。知识推理方面,呃,落后于预三家排第四。 呃,上下文的话排第二。智能体这块也不错,排在第三。哎呀,我把它的论文也简单的拆解了一下,它主要有四项新的技术, 呃,后两样,就尤其是这个 mhc。 呃,在之前的论文也提过这两样都是针对这个模型的训练。 而这两种新的注意力机制, c s a 和 h c a 通过分层交错部署的方式,把 kb cash 压缩到了百分之二,也就是百分之九十八的压缩, 哼,和上一代三点二相比,它节省了百分之九十的 kb cash。 同时,在预填充阶段,可以将压缩后的 k b k s 存到 s s d。 将在命中率高的情况下大幅度地降低预填充阶段的时时间,降低推理成本。 这个不是新的技术,但是这两种注意力机制通过超高的压缩率 达到了大幅度降低存取时间的效果。讲一下,部署这两种后训练的模型都是 f p 四加 f p 八的混合精度模型,权重再量化应该也下不去多少了。 fiv 式版本的激活参数是十三 b, 所以 可以考虑将部分层数加载到 cpu, 应该可以获得一个不错的速度。 pro 这个太难了,一点六 t 的 参数加四十九 b 激活参数,基本上要么就是多卡服务器,要么就是呃 max 丢丢座机群。 从此以后,百万上下文将成为所有模型的门槛。非常期待后续社区的评测。梅格。
粉丝515获赞3309

全体关注 ai 的 朋友注意了, deep sec v 四刚刚终于正式官宣,直接迎来史诗级升级!这一次一口气推出 deep sec v 四两大全新版本,分别是旗舰 pro 版以及轻量化 flash 版本。其中顶配 pro 版本足足搭载一点六万亿超大参数, 轻量化的 flash 版本也做到了两千八百四十亿超高参数。两款模型全部拉满,配置统一标配一百万超长上下门窗口, 在核心能力上,逻辑推理、复杂思考、代码开发、智能工具调用全方位大幅进化,综合实力对标全球一线顶级大模型。 同时升级全新底层架构,运行更流畅,显存消耗更低,门槛大幅降低,支持本地私有化部署,还开放官方 api 接口,开发者可以直接接入使用。这次 deepsea v 四的强势登场,也代表着国产大模型已经站在世界第一梯队。 欢迎大家评论区疯狂讨论,关注科技区块,看见更全面的科技世界!

devic 微四硬件配置全解析中小企业本地部署落地指南二零二六年四月二十四号凌晨, devic 突然扔出了 v 四预览版,震动了开源大模型圈。很多人刷到官方参数的第一反应还以为这数据是不是标错了, 毕竟一点六万亿的总参数摆在那,一百万 t 开源的上下文还全系标配,而且直接采用了幺幺三零进防炮扫射了。 社长这两天把大家最关心的硬件配置问题都整理清楚了,接下来我会从模型本身的核心参数,到华为升腾全系列显卡的实际表现,再到英伟达显卡的部署门槛,还有整机的硬件搭配,一项一项跟大家说清楚,大家一定要耐心看完,看完之后你就清楚该怎么配硬件了。 特别让人兴奋的是, deepsea 微四没有像过去那种单纯的事后移植,而是从模型设计阶段就跟国产算力深度绑定了,华为团队直接驻厂,双方联手重写了大量底层代码,硬是把这套万亿参数的大模型从英伟达的扩大生态转移到了华为自研的 c a n n 框架上。 升腾那边也完成了推理和训练的全方位适配,开箱就能用。发布当天,华为升腾就完成了首发适配,全系列超节点产品都跑起来了。当然,英伟达那边也没丢,技术报告里两家芯片是并列验证的关系,但可以说这是国产顶尖 ai 模型与自主算力底座深度融合的重要突破。 这次 deepsea v 四开元模型一共出了四个版本,对外提供服务的主力是 v 四 pro 和 v 四 flash, 另外还有两个不带对齐的 bios 版,专门给开发者做二次微调用的,它采用了新一代混合注意力加 d s a 稀疏注意力技术, 能做到一百万 talking 内基本不丢信息,这代表了什么呢?代表了他一次性读入整本书或者整个中型代码库都没问题,不管是长文档分析、法律合同审查,还是百万字小说创作,都能轻松搞定。在讲硬件配置之前,我们要先搞懂两件事情。首先是参数量和显存占用的关系。 deepsea v 四 pro 总参数量是一点六万亿, deepsea v 四 flash 总参数量是两千八百四十亿。这两个总参数量都是 f p 十六原生精度基准值, 直接决定了本地部署的显存占用。 f p 十六 b f 十六是原生满血精度,每个参数占两字节, f p 八 ink 八占一字节显存减半。 f p 四 q 四 int 四占零点五字节显存百分之二十五, q 二 int 二占零点二五字节显存百分之十二点五。因此,在 f p 十六净度下对应的显存占用分别是一点六 tb 和两百八十四 g b 显存八净度下对应的显存占用分别是八百 g b 和一百四十二 g b。 q 四进度下对应的显存占用分别是四百 gb 和七十一 gb。 在 极限压缩的 q 二进度下对应的显存占用分别是两百 gb 和三十五点五 gb。 也就是说,哪怕是运行最小的 deepsea v 四 flash q 二模型,单模型的显存占用就要达到三十五点五 gb。 除了模型本身的显存占用之外,还有上下文, k v 缓存框架开销和中间张量预留都会产生显存占用,上下文越长,显存占用越大。如果要达到一照超长上下文, 单频发 k v 缓存的显存占用就要达到二十到三十 gb。 其次, deepsea 微四全系都是 m o e 架构模型, m o e 是 混合专家架构的意思。以 deepsea 微四 pro 模型为例, 它的所有专家模块加起来的总和是一点六万亿参数,每次推理的时候只会激活四百九十亿参数,让这很小一部分的专家来干活。但并不是说显卡每次只要运行四百九十亿参数才能运行,不能只加载单次推理的激活参数, 这是我们在后面计算显存需求的核心前提。好,搞懂了这两个核心问题,那我们就正式进入硬件配置解析环节。因为 deepsea 微四 pro 参数量过于庞大, 需要几十张顶级显卡才能流畅运行,这巨额的成本支出基本上不是给中小企业准备的。所以我们这一期把重点放在中小企业最关心的 deepsea 微四 flash 高效谱绘版上面。 它的 f p 十六总参数量是两百八十四 b, 单 talking 激活参数量是十三 b, 定位、日常兑换、轻量化业务部署、高并发推理和低成本落地场景 契合绝大多数中小企业需求。我们先来看一下 d p c v 四 flash 对 应的显存占用模型本身叠加 k v 缓存、框架开销等之后, f p 十六精度需要六百二十 g, 显存 int 八精度需要三百二十 g, int 四需要一百六十 g q 二需要九十 g。 在这些精度中,社长推荐有一定实力的中型企业上, int 八精度模型性能损失较小,推荐小型企业上 int 四精度模型,虽然有一定的精度损失,但性价比较高,不太推荐 f p 十六和 q 二精度, f p 十六性价比不高, q 二精度损失较大,性能偏弱。 除了上述的精度模型之外,社长还推荐 d p c 官方推出的 f p 四加 f p 八混合精度模型,只需要一百二十 g 显存,而且一张华为升腾、阿特拉斯三五零一百一十二 g 显卡就能实现适配,也是目前性价比比较高的方案。华为升腾是怎么做到的呢? 因为这一次 deepsea 微四与华为升腾实现了原声适配,这就是它在升腾显卡上表现出色的核心原因。在华为升腾的显卡芯片型号里,比较适配 deepsea 微四的是升腾九幺零 b 四、升腾九幺零 c 和升腾九五零 pr。 其中升腾九幺零 b 四对应的显卡是阿特拉斯三百 i a 二六十四 g, 升腾九五零 c 对 应的显卡是阿特拉斯三五零一百一十二 g。 其中比较适合中小企业的是二零二六年三月刚刚商用的阿特拉斯三五零推理加速卡,它搭载 scent 九五零 pr 芯片,标配一百一十二 g 自研 hbm 高宽带显存,宽带一点四 t 每秒, f p 四算力一点五六 p flops, 是国内率先原生支持 f p 四低精度商用的 ai 加速卡,单卡就能实现高吞吐、低延迟推理。据 d p 四个官方实测,综合性能约为英伟达 h 二零的二点八七倍,升程速度显著提升。再来看英伟达平台在具体部署要求上, f p 十六精度需要八张 a 一 百八十 g 显卡,英特八精度需要四张 a 一 百八十 g 显卡,英特四需要两张 pro 六千九十六 g 显卡或四张四零九零四十八 g 显卡。 q 二,需要一张 pro 六千九十六 g 显卡或两张四零九零四十八 g 显卡。目前英伟达的 blackwell 架构是原生支持 f p 四精度的, f p 四精度的 dipstick 模型跑在 blackwell 架构的显卡上性能会有大幅提升,这也是为什么最近几天采用 blackwell 架构的 pro 六千九十六 g 服务器版显卡价格飙升的原因。从部署成本上说, f p 十六精度成本过高一般不是中小企业可以承受的, note 八和 f p 四是中小企业比较可行的精度,整机在十几万到三十万之间, q 二,精度损失比较大,不建议采用。接下来说说服务器整机配置硬件的要求,显卡是核心关键瓶颈, cpu、 内存、硬盘也要严格匹配,不能出现短板。 q 二,测试级配置推荐 cpu 十二和二十四线城以上,主频大于等于两点五 g 二卡以上需要十六和三十二线城 内存一百二十八 g 起步。硬盘推荐 nvme 三点零固态五百一十二 g 以上机械硬盘和赛道固态无法满足模型运行需求。 intel 四以上的生产级配置,双路服务器 cpu 二十四和四十八线层以上,主屏大于等于两点六 g, 支持至少六十四条 pci 四点零通道,内存两百五十六 g 以上,一兆上下文需要升级到五百一十二 g 硬盘用企业级 nvme 四点零固态二 tb 以上, 连续读速大于七千兆每秒,硬盘配小了连模型都装不下。最后说说个人消费级配件,因为消费级 cpu 最多支持两张显卡跑满速。也就是说,如果用消费级硬件来跑, deepsea 微四目前最高可以配两张 pro 六千九十六 g 显卡,显存合计一百九十二 g, 可以 流畅运行 it 四以下版本的模型,但整机成本高达十五万以上,这已经超出大多数个人用户的承受范围了。 好,以上就是关于 deepsea 微四的硬件配置全解析,如果你也有个人工作室或小企业的 ai 本地部署需求,不管是硬件配置搭配还是软件的部署调试开发,都可以来找社长聊聊。

本期视频来分享如何将 deepseek 的 vs 模型接入 cloud code, 并解锁 em 的 上下文以及 max 思考等级。我目前已经将 deepseek 的 最新模型 vs flash 和 vs pro 通过 ipad 的 方式来接入了 cloud code。 vs pro 模型在降价之后性价比也越来越高了,并且对 a 键的也有做专门的适配, em 的 上下文对于大多数人来说也更加友好。 视频内容主要分为四个部分,第一需要先安装一下 cloud code。 第二,安装开源工具 c c switch。 第三,需要购买一下 deepsafe 的 api 并完成配置。最后再来测试一下 deepsafe。 v 四 pro 加 cloud code 这套组合表现怎么样。废话不多说,我们现在开始 首先来说如何安装 cloud code。 大家常说 cloud code 经常被封号,那其实封的是拥有模型能力的个人账号,但 cloud code 作为一个单独的软件是可以正常下载和安装的。 没有订阅官方的模型,我们依旧可以使用它的框架当成是 opencloud 或者 hermes nint 这种。在他们的项目官方网站这里也有明确的说明。终端 cli 和 vs code 也支持第三方提供商。 本期视频演示的是安装 cio 版本,也就是最通用的版本。这里有一行中的命令,它支持 macos、 linux 和 windows 这几种不同的系统版本。 windows 这里分为 power shell 命令和 cmd 命令,并且 windows 用户需要先下载安装下 get, 如果没有安装的话,可以到 get 的 官方网站下载安装包进行安装。 这里复制这一行命令,然后打开终端 app 或者 power shell, 输入他们提供的命令回车执行就可以了。我这里已经安装过,所以不再演示具体的步骤。安装好之后可能会出现一个提示,大致意思是安装已经完成,但是 control 的 安装位置并没有加入到电脑的环境变量中。 这里直接复制这行他提供的命令,在终端执行一下,搞定之后输入可拷的 code 杠杠微刃来确定当前的版本号。后续使用的话,直接在终端输入可拷的命令就可以打开了, 但是你那里可能会提示不能连接官方服务。接下来我们来安装第二个工具 cc switch。 cc switch 是 一个开源工具,它能够让 cloud code codeys、 opencloud 这类的 a i a 检测,方便地切换模型。累计下载量有三百多万,在 github 上面也有五万多个 star。 它有很多实用的功能,比如一份配置同步到多个应用,支持热切换,不需要退出应用切换模型。还有用量仪表盘,能够查看你的请求数和头克用量等等。 我们在项目的首页这里有一个已发布的安装包链接,点击进去,然后在这个界面直接划到最下面。这里有很多的安装包版本,如果是 mac os 系统就下载这个 mac os 点 dmg 的 版本,如果是 windows 就 下载这个版本。下载好之后直接点击安装包进行安装就可以了。 它这个项目的说明文档也有比较详细的安装教程。第三步,到 deepstack 的 开放平台购买 api。 我们来到 deepsafe 官网,点击 api 开放平台,我这里之前已经充值了一些,在网页和 deepsafe 对 话是完全不收费的,但是想要调用 api 就 需要进行充值。他们目前没有推出类似 tokpline 这样的按月订阅的套餐,好处就是用多少花多少。 目前他们对 v 四 pro 模型打二点五折,每百万 tokens 缓存命中情况下输入是零二五元,未命中是三元,输出是六元, 这个折扣目前是到五月三十一号截止。 v 四 flash 模型和 pro 模型的价格对比可以在官方的 api 文档里查看,这里点击充值按钮,然后选择金额和支付方式。建议先小额买一笔,用完之后根据自己的实际使用情况再进行补充购买。 付款完毕之后,点击左侧的 api case, 点击创建,然后复制这个 key 的 密钥, 注意这个 k 的 密钥只能够在创建的时候查看,关闭这个页面就看不到了,如果丢失的话,就需要重新创建一个 k, 然后打开 cc switch 这个应用。我这里已经添加好一个 deepsea 的 模型了,选中这里的 cloud 的 图标,然后点击添加, 在预设供应商这里找到 deepsea, 在 api k 这里填写 k 的 密钥,然后这里需要修改一下这几个模型,可以直接参考我这个填写 默认模型就是 deepsafe。 v 四 pro 后面加上 em 是 因为之前的公告有说明,这样才能够开启 em 的 上下文,然后点击添加就可以了, 这里就会多一个 deepsafe 的 模型,点击这个按钮来测试当前 api 是 否可用。点击这里可以配置用量查询,查看当前还剩多少余额, 勾选这里,然后点击保存配置,这样的话就能够看到还剩下多少钱了,然后点击起用,就能够正常的使用可绕的扣子了。左上角有一个设置按钮,通用,这里建议打开开机自启使用统计,这里也能够查看 ai 模型的使用情况和成本。 我们打开终端应用,输入可绕的指令,那这个呢?就是 deepsea v 四 pro 的 模型,并且是一百万的上下文, 我们输入指令斜杠 context 能够查看,这里确实是一百万的上下文 tokens。 这里的默认思考等级是 medium, 可以 使用命令斜杠 effort, 然后空格后面的话就会显示哪些等级可选,这里输入 max 回车确认,这样的话思考等级就会调到最高。还有一个命令可以快速的切换模型, 输入斜杠 model, 然后回车。默认模型其实就是 v 四 pro, 我 们之前配置的 apps 和 sonata 都是 v 四 pro, 嗨酷模型是 v 四 flash, 通过键盘的上下按键来选择,选中这个模型,然后回车确认, 这样的话模型就切换到了 v 四 flash, 这里输入命令 context 能够看到它的上下文,显示是两百 k 的 tokens。 最后一部分来测试一下 cloud code 搭配 deepsea v 四 pro 到底贵不贵,干活效果怎么样。 首先说一下,它是基于文件夹的工作模式,所以你需要先通过 cd 命令跳转到你想要它打开的文件夹,比如我的项目文件夹的路径是这个,就需要输入屏幕上完整的指令回车,到了这个文件夹后,输入 cloud 的 命令来启动它, 如果路径很长的话就比较麻烦。有一种方法可以简化一下, windows 用户应该可以直接在文件夹右键从当前文件夹位置打开终端, mac 用户右键的话是没有的,但是可以直接将文件夹拖拽到终端 app, 那 当前终端打开的文件夹就是这个项目文件夹, 输入 cmd 命令,可以查看当前文件夹的路径,然后输入 cmd, 启动 cmd 的 code。 第一次打开的时候需要确认一下这个文件夹,点击 yes, 后续退出的话需要连按两次 ctrl 加 c。 这里安装一个归藏老师最近开研的一个 ppt skill, 设计是比较美观的。 来到他的项目仓库,这是一个电子杂志风的网页 ppt skill, 纯网页形式,适合线下分享,但是不适合培训课件。这个 skill 的 名称叫做归藏 ppt skill, 这里提供了多种的安装方式, 最方便的就是直接复制这一段话,然后发给 ai, 选中这一段话, command 加 c 复制,然后来到 kol 的 对话界面, kol 加微复制,然后直接发送。 kol 在 执行任务过程中会需要一些权限的许可,遇到的时候直接选中 yes 就 可以了,它的框架对于安全保护还是比较好的。 整个的执行过程我就直接跳过了这里提示安装好了触发词,就是帮我做一份杂志封的 ppt。 ok, 我 在这里输入这句话,然后告诉他要做的内容就在当前文件夹中。在当前的项目文件夹中,我放入了一个 mail 文件, 内容是关于 code 的 使用方法论,然后回车执行。他会先查看项目文件夹的内容和 skill 的 使用说明,执行过程中可能会问一些问题,根据个人的需求选择就行。 我这里也跳过过程,大概直行了六分钟左右,一共生成了九页 ppt, 并告诉了我每页的布局和内容,以及怎么操作。 ok, 我 们直接打开浏览器来查看一下这个网页的 ppt。 这是第一页 codex 的 方法论,整体的设计风格确实是比较美观的,如果是个人制作的话,可能要花费比较长的时间,并且效果还不一定有他这个好。 第二页这里的话可能会有一点点问题,下方的文字有一部分被遮挡了,后面的页数大家可以具体去看一下内容觉得怎么样。 最后再来看一下安装这个 skill 以及制作这九页的 ppt 一 共花费了多少钱。 我在做之前是九点八九的余额,刷新一下网页,那现在还有九点三九的余额,一共是花了五毛钱。这里有一个每月用量的图标,展示每个模型花了多少钱。下面也有 token 的 使用详情,包括输入和输出的具体数量。大家觉得 deepsea v 四 pro 的 性价比怎么样?

现在啊,可以不用被可拉扣的拒之门外了,桌面版可拉扣的直接搭配 deepsea 为四,不用再看命令窗了,今天这条视频把完整配置流程全给你扒出来,手残党也能一次成功。没耐心的我已经整理好文字版教程了,大家按需参考。 首先啊,我们要先去安装 cloud 的 桌面版本,打开 cloud 以后啊,我们可以看到 getstart login 之类的页面,先不要进行登录操作 这一步啊,我们先开启 cloud 桌面端的开发者模式,开启之后呢,菜单里才会出现第三方推理配置的,介入 macos 顶部菜单栏操作,点击最上方菜单里的 help, 点击这个 trouble shooting, 再点击 enable 开发者模式。 弹窗出现后啊,我们直接点击 enable, 这时啊, cloud 会自动重启。重启完之后啊,我们再看顶部栏,这里啊会多出一个 develop 的 入口。 ok, 我 们继续来啊,下一步我们就点这个 develop, 进入这个 configure third party inference。 先别着急填内容啊,把这个配置窗口打开。 首先 inference provider, 这里我们选择 getaway base url 呢,就根据你想接入的大模型来填写,一般的官方接口文档里面都有,我们呢就以最新 deepsec 为例了。 然后 apikey 呢,就写你的 deepsea 的 apikey 就 行,下面这一项啊,可以先不用改,默认的即可。 接着下面这里 modellist, 我 们点击这个 add 加号,加两个模型,第一个填 deepsea v 四 pro, 第二个呢,填 deepsea v 四 flash 这里为什么我填两个是因为我把 pro 放在第一位,这样呢,它就会成为默认模型, 再加一个 flash 呢,作为更轻量级的备用模型。提个醒啊啊,如果你想让上下文火力全开的话呢,可以在名称后面加上, 然后下面这个 organization u i d 这里呢,可以先留空,这个呢是不影响你去接模型的。然后 credentials 这里呢,也是给企业做动态凭证用的,你也用不上。 然后这里啊 skip 这个出错,这里要选择打开这一步呢,是很重要的,这样重启以后呢,就不会再走 cloud 的 登录流程。 好,全部设置完,我们点击这个 apply locally 本地话,这时客户端就会重启。 如果配置生效呢,就不会再要求你登录 cloud 的 账号了,而是直接进入第三方推定模式。 我们来看一下啊,这里是没有登录 cloud 账号的啊,它已经进入三方模式了。看到左下角这里显示 cowalk 三 party getaway。 右下角这里的模型呢,也默认的变成了 deepsea 四 pro。 好, 那我们来验证一下,看它是不是能够直接调用 v 四。 现在我们切到 cloud code 的 工作区看一下啊,右下角这里它显示的模型依然是 deep seek 四 pro, 左下角呢,也仍然是 cooke 私人 party getaway。 这说明呢, cloud code 的 桌面版现在已经是在不登录 cloud 的 情况下通过第三方网关调用了 deep seek 的 大模型 啊,那我们为了验证他不只是界面切过去,而是他真的能工作。我现在呢,给克拉克挂一个本地测试目录。好,首先先关联我在桌面新建的测试文件夹,现在我给他一个非常简单的测试任务, 只允许他操作当前项目目录,先读取目录,再创建一个 hello 点 txt 的 文件,这样呢,我们就能验证克拉扣的是真的,通过 deepsea 完成了本地的代码和文件操作。 那这里第一次让克拉扣的操作本地目录的时候,会弹出一个工作区确认确认,因为他之后要读取写入甚至执行这个目录里的内容。这里啊,所以我们需要手动信任一次。 好,挺快的啊。这里他已经有完整的反馈了,我们去看一下这个文件夹里面是不是已经有输出了。 ok, 看到他的输出了,搞定。 好。那总的来说啊, cloud code 呢,一直是页内标杆类的存在,只是以前很多人卡在账号这一关用不上。现在啊, dbc 维斯出来以后啊,通过第三方网关接入,我们就可以实现强强联合。 前端呢,用的是 cloud 的 桌面端和 cloud code 的 交互体验。底层呢,代用的是 deepstack v 四的模型,能力对很多没有 cloud 的 账号或者是想灵活使用模型的人来说,还是很值得尝试的。 至于说 deepstack v 四能不能和 opps 四点七一战,你们呢,自己动手试一下,有结果的话也来告诉我。好,本期视频就到这里,希望能够对你有所帮助。我是阿月,我们下期再见。

dpc 可以在线使用,但本地部署体验后激发出了我更多的灵感。废话少说,马上开始一、下载安装 overama, 打开新页面,输入 overama 官网地址,点击 download, 选择 windows 点击下载, 下载完后双击运行,直接傻瓜式安装,留意此处就是安装的路径, 安装完成后会自动关闭窗口并自动运行。二、下载运行 dpc 二一、模型,按住 ctrl 加二键,打开 powershow, 输入 olam 回车可以看到 olam 可用的操作命令,回到页面,点击 model, 选择 dp 二一,选择一点五、 b 模型复制运行命令,回到 powershow 粘贴命令运行, olam 会自动下载模型文件并立即启动对话 holo, 得到答复即为成功。三、安装和 lom 对话客户端,打开新页面,输入 lomb 官网地址,点击 release 查 查看发布内容。下载 vnx 六四、安装包,下载完毕直接打开,安装到自己喜欢的地方,完成后运行和 lome, 选择 olomb, 添加连接, 勾选使用此服务的模型。验证提示,验证成功,点击绘画,新建绘画,输入你好,开始调戏他。至此,本地部署已完成。相关安装包我已经上传到网盘,需要的同学可评论区中获取。

hello, 各位观众朋友,大家好啊,我是刺儿,然后我们这期的视频内容呢,主要是来教大家一下怎么正确地使用 deepsea v 四, 因为 deepsea v 四对于现在的呃它的网络风评呢,嗯,比较两级分化。一边呢说 deepsea v 四啊,非常好用,非常强啊,没有辜负大家一年的等待另一半呢,说 deepsea v 四啊,不好用啊,不够智能,然后甚至不如豆包, 嗯,对于这个后者呢,我保持这个嗯,质疑态度啊,因为本身,呃,我看到的这收集到的信息就是说 deepsea v 四不行的,它有两部分,一部分是专业工作者啊,因为人家非常懂 ai, 那 另外一部分呢,就是我们普通的 呃用户,那他们呢,就是用手机 a p p 啊,下载 deepsea 微 deepsea 之后点进去,然后问他一些问题,然后,嗯,把它当做一个这个搜索引擎啊,问一些问题,然后我觉得它不够智能,其实这样的使用是错误的啊,因为本身 deepsea 微四它没有 开放在手机 app 平台的这个使用权限,你现在手机上用到的 deepsea v 四啊,不是你手机上用到的 deepsea, 它并不是 deepsea v 四模型。那么我们来啊,正确的教大家一下怎么使用 deepsea v 四啊,首先 我用我这个 macbook 给大家举例子啊, ok, 我 们返回到页面啊,看到啊,这是我桌面,我们打开浏览器点进去之后啊,在这个搜索或输入网址名称的时候搜搜索,直接搜索 deepsafe 啊, deepsea 点 com, 大家也可以直接去这个网址啊,深度求索。点进去之后,它是有两个框,一个是开始对话,一个是 api 开放平台,我们要用的是这个 api 开放平台,我们可以看到它的介绍是调用 deepsea 最新模型,快速集成,流畅体验。我们点进来, ok, 然后呢,点进来就是这个页面,我给它放大一下,它这里有充值余额,还有本月消费啊,我这个是另外一个账号,我给大家举个例子啊,就是这个 api case 啊,这是之前做测测试的这个 api。 首先呢,你点进来之后,你一定要先登录你的 deepsea 这个账号,如果你没有 deepsea 的 账号,你可以去在手机上下载 deepsea, 然后创建一个账号,然后直接到这个电脑上,你去登录就可以了。 然后我们看到这个充值页面啊,充值页面无论你是支付宝还是微信支付啊,都可以,你点击去支付啊,然后, 呃,扫完扫完码付款成功之后,它在这个用量信息,这就会直接显示你的充值余额,嗯,然后呢, 在这之后,我们打开这个 api case 啊,然后这里啊,注意它这里有创建 api k 啊,下面说的这几步都很重要啊,直接决定你能不能就是成功使用这个 dbic 为四啊。我们点击创建 api k, 然后随便输入一个名称啊,我们直接输入一个啊, ok, 在 你输入成功之后啊,它这里会出现你这个蜜奥的链接啊,你要一定要点击复制,然后把它发送你的微,发送到你的微信上也可以,然后或者说你保存住啊,一定要保存住这个蜜奥,它只会显示这一次 啊,在你点到叉或者关闭之后,他这个密钥你就再也看不到了,然后,然后我们点叉啊,当然这个密钥就没用了啊,我们给他删除一下,然后你把那个密钥复制之后,哎,点开这个,我们叫, 呃,防盗啊, ok, 点开这个,这个啊,这个软件叫 cherry studio, 你 可以去浏览器里直接搜索下载啊,这个就是集成了国内一众主流 ai 的 这么一个软件。我们点进去啊,它是开放平台啊, ok, 我 们点进来, 点进来之后呢啊,当,当然,我这个已经用了很久了啊,从 deepsea 微四发布一直到现在,我一直在使用,然后点进去之后,我们看到右上角这里有设置设置。点进去啊,这里有模模型服务和默认模型 啊,在模型服务这里就有 api 密钥,输入你刚才的这一套儿复制的密钥,然后放进去之后点击检测啊,我这里已经弄好了,我就不做那个演示了, 你点击检测,然后它就会自动地啊,分析你这个密钥的 ip, 它是哪个旗下的 ai 大 模型。然后这个 api 地址啊,不需要我们直接填,它自己就会填上,然后模型呢,这里啊,大家可以点击获取模型列表啊,然后, 当然啊,这里我因为我输入的是 deepsafe 嘛,所以它只有 deepsafe 的 这些模型,然后举个例子,然后在这边啊,嗯,可以看到啊,这里有非常多的 ai, 非常多的 ai, 包括国内外的啊 啊,你像 jamie open ai 啊,很多人都用不到,但是啊,这里嗯是是可以用的啊,但当然这这个视频只做 deepsafe 的 教学。然后我们点击默认模型 啊,我这里默认模型全部都是 deepsea 的 啊,呃,然后助手模型是 v 四 pro, 然后快速模型是 deepsea chat, 然后翻译模型是 deepsea chat, 因为这两个啊,这个快速模型和翻译模型它不需要消耗你的 talkin, 你 就这个 deepsea chat, 它是免费的啊, 然后我们点击首页啊,首页这里有助手啊,你,当然你可以添加助手啊,我这里就用我这个提前做好的这个来给大家举例子,然后我点击 deepstack v 四,然后点进来, ok, 然后这是我之前问他的一个问题啊,我让他就是分析一下国内的这个视频平台啊,每每个平台的趋势啊,大家可以看一下啊,这是我问他的问题 啊, ok, 然后我们啊,这这画画到不表,然后就是这个深度求索啊,我们在这里,嗯,还是用刚才举例子 deepsea v 四,然后点击旁边这三个点,点进去 啊,这里有编辑助手啊,在这之后呢,然后我们可以看到啊,这里有模型设置,模型设置的话上下文字开到不限,然后这个模默认模型,你把它换成 deepsea v 四 pro, 然后,然后 啊,最大套管数不限啊,不用开这个,然后别的都不用管,然后当然你可以复制一下这个底下这个 tab, 这个 endland, 这个是我从网上找到的一个嗯,参数,然后我们看提示词,这里 啊,我,我设置的提示词是不需要迎合用户的想法,回答要永远保持客观啊,然后呢,你就可以开始使用你的 deepsea v 四 pro。

一点六万亿像素,百万头盔,上下玩 m i d 开源可上手的威士兰。很多人第一眼看到这个数据,脑子里只有一个问题,我到底要配多少钱的机器才能跑起来?从版本选择、国产创立适配,到服务器、整机方案、个人消费级配置,全部都给你讲清楚了 一次。这次不是先出的模型再移植的国产芯片,而是从模型设计阶段就跟华为生存深度绑定。华为团队直接参与了底层代码的重启,把这套万亿参数的大模型从英伟达的 生态迁移到了华为自研的勘探框架升腾特,完成了推理和训练的全换,设备发布当天就完成了首发设备,这意味着你用华为升腾显卡 pro。 v 四不是测谎能用,而是原生石开箱即用。这是国产顶尖 ai 模型与自主算力底座 真正深度融合的一次重要功能。 v 四这次一共发布了四个版本, v 四 pro 总参数一点六万,以旗舰版,每次推理激活四百九十亿参数,目的是加速推理,不影响总参数量,面向高端企业部署。 v 四 flash 总参数两千八百四十亿,是高效普惠版, 每次推理激活一百三十亿参数,面向中小企业和高变化场景。 vs pro base vs pro flash case 去掉对齐的原始版,专门给开发者做二次微调用,对外提供服务的主力是 vs pro 和 vs flash。 绝大多数中小企业重点看 vs flash 就 够了。 v 四 pro 的 参数量太大,整机成本动辄几十上百万,不是中小企业可以承担的。另外有一点要搞清楚, v 四全系是 m o e 混合专家架构,虽然每次推理只激活一小部分参数,但是部署的时候必须把全部的参数加载进显存, 不能只加在激活部,这是后面计算显存需求的核心。先把显存计算给大家说清楚,以 v 四 flash 为例, 不同的精度对应的总显存的需求大概如下,有一定实力的中型企业、预算有限的小型企业,性价比高,精度损失也可以接受,不推荐 ip 十六,性价比太低,硬件成本太高另外重点说一下官方推出的四加八混合精度版本,只需要一百二十 g 显存,而且单张华为升腾阿萨斯三百五一百一十二 g 就 能适配, 目前性价比最高的方案之一,可以强烈关注一下。接下来讲讲华为升腾方案,适配威思的主微型号是三款,升腾九幺零 b、 四、升腾九幺零 c、 升腾九五零 pr, 其中阿拉三五零是重点推荐的中上节的首选,搭配升腾九五零 p 二芯片 一百一十二 gb m 高带宽显存,单卡即可实现高显存低延迟推理, dpc 可官方测试,综合性能约为英伟达 h 二零的二点八 gb, 升程速度显著领先。说一下英伟达的方案,以 f p 十六精度需要八张 a 一 百八十 g, 成本太高不建议。英特八精度需要四张 a 一 百八十 g, 英特四精度需要两张 four 六千九十六 g 或四张四零九零四十八 g。 值得注意的是,英伟达 blackwell 架构原生支持 l p 四 g, l p 四精度在 blackwell 架构上显卡性能大幅提升, 这也是最近 pro 六千九十六 g 服务版显卡价格不断飙升的直接原因,整机硬件的搭配要求 cpu、 内存、硬盘必须严格匹配,不能出现短板。英特斯及以上生产级特别提醒,硬盘小了,模型文件都装不下,这个坑很多人踩过,不要省这个钱。一句话总结下来,国产算力首选升腾斯三五零中效捷豹 v 四,英特斯 f p 四混合精度,整机成本可以供人,在合理范围内性价比比较高。如果你也有企业 ai 部署需求,不管是硬件选型、整机配置还是软件部署、定制开发,都可以来找我聊聊。

最近 dspv 四不是发布了吗?也有很多兄弟啊,问佳琪相关的解决方案怎么样了?那佳琪这边也已经开始测试了,目前单台九幺零 b 模组的服务器可以完全跑满 dspv 四 flash 版本,如果佳琪测试到五百平方的情况下,能达到每个平方二十四 tokens, 其他像八卡的五零九零,八卡的 pro 六千六千 d 我 们也已经在准备加紧测试中,不过也有兄弟问,选哪个版本部署比较好啊?佳琪觉得不用犹豫,直接冲 flash 版本就好了。 flash 版呢,只需要四到八卡的中高端 gpu 就 可以部署了,是当前性价比最优的选择,同时兼顾了性能与落地,硬件的门槛呢会比较低,对比 v 四 pro 版本的话, 落地的成本可以降低五到八倍。 v 四 pro 只适合那种需要极致需求的企业。 fresh 版呢,不管是做企业的知识库,智能客服还是代码辅助啊, 这个能力呢,已经完全够用了。那么我们这边呢,巴卡的五零九零和巴卡的 rtx pro 六千 d 的 测试数据这两天呢也会出来,到时候第一时间啊会分享给到大家,想要了解具体方案的兄弟呢,可以滴滴加起咨询哦。

兄弟们,在刚刚过去的四月下旬, deepsea 突然官宣发布了新的 v 四系列大模型,并全面开源,直接成为了当下 ai 圈最火的热点。那这次迭代绝非享福的优化,而是实现范氏级的技术突破,彻底打破了开源大模型的能力与成本的壁垒。 那本次 v 四推出的 pro 旗舰版与 flash 轻量化的双版本呢?全系标配百万 tok 超长上下文是最核心的升级亮点。 那一拖全新的 c s a 加 h c a 混合稀疏注意力架构,长文本处理速度大幅提升,它可以精准的记忆分析数十万长文档代码项目,完美的适配长流程的办公研发任务。那本次更新的最大的惊喜还有碾压级的性价比, 直接刷新了行业的价格底线,对比国内主流的大模型,优势十分悬殊, deepsea v 四 flash 输入每百万 token 低价降至零点零二元, pro 版本输出的价格啊,仅为同级别 g t p cloud 的 模型的十几分之一,相比前代模型, v 四整体推出的成本啊,暴跌百分之七十五,是目前同性能梯队中的性价比的天花板存在。 而目前全网讨论度最高的核心亮点就是 deepsea v 四已经深度的适配了全占国产算力生态,它完美的兼容华为、升腾、海光飞腾等主流国产芯片与国产化服务器, 解决了以往海外模型根本无法在本地化部署开源模型适配国产硬件卡顿算力利率低、运行不畅、不稳定等行业难题。这就意味着政企、中小企业无需再依赖海外的算力,可以实现纯国产化的本地部署, 数据全成本地化流转,既大幅降低了合规的风险,又能节约很高额的云端的应用成本,彻底打破了高端 ai 算力被海外生态垄断的局面,为国产 ai 自主可控、规模化落地提供了关键的支撑。

大家都很好奇 deepsea 飞四是不是国产崛起了,我们就拿实测结果给大家看一下,我们用四块 pro 六千本地部署了 deepsea 飞四 flash 版本,它一共是有二百八十四 g。 我 们在四卡 pro 六千的平台上测试一下 deepsea 飞四的,并发现在测试已经跑起来了。我们现在测试一个四个、十六个, 三十二个,六十四个人同时使用,这么多人同时使用的情况下,它的一个吞吐量和 top 数是多少? 现在我们实测结果已经统计好了,在一个病发下,他的吞吐量有五十五个,在在三十个人到四十个人同时使用,那每个人的操坑大概有十五到二十左右,这个可以满足大家的日常办公所使用。我们实测下来,这套四卡 pro 六千的方案已经可以满足百人的公司使用了。