今天继续我们的第四讲,前三讲我们基于 web coding 实现了我们的项目代码,有同学反馈相关的方法我学会了,能否给我推荐一套高性价比的工具。 那么今天接下来我们会花三分钟时间讲基于 vs code 加上 cloud code 加上 c c switch, 结合我们的 deepstack 微视模型,实现我们开发环境的搭建。 接下来开始我们的安装操作,我们主要分为以下四步,第一步,我们打开 vs code 的 官网,点击 download for mac os, 点击下载之后会下载我们的通用版,我们下载完成之后正常双击安装即可。 接着我们的第二步回到我们的浏览器,找到我们的 dbc 官网,在这里选择 api 开放平台,当然我已经购买过,如果是第一次进来,我们点击接口文档,我们可以看到 它的 api 调用相关信息。这里我们要用的是 cloud code, 所以 我们的 base url 这个信息要用 srb code, 我 们把这个模型的名称复制过去即可再回到开放平台。 那么第一次进来之后呢?第二步要做的动作就是我们创建 api 的 key, 这里我们已经创建完成了,下一步要做的事情就是点击充值, 由于是国内的模型,我们不管使用支付宝还是微信都可以满足我们的充值需求。接下来我们要做的事情搜索 cc switch, 我 们要找的 cc switch 就是 第一个,它的 star 是 七十二点二 k 的 readme, 点 md, 看一看我们的 macos 是 如何去安装的,我们把这两条命令拷贝过去,然后回车。安装完成之后,我们的应用程序里面会有一个 cc switch 的 小花瓣一样的一个图标。第四步,接下来就回到我们的 vs code 安装 cloud code 插件,我们在 mac 里面用 shift command 加上 x, 我 们可以看一下。第一个就是 cloud code for vs code, 我们点击安装,安装完成之后我们可以看到欢迎界面,这几个复选框我们都要勾上,回到我们的应用程序,点击 cc switch 的 图标,点击加号,选择我们的 deepsea 模型, 选择完成之后分别填入我们刚刚在 deepsea 官网开通的 api key。 复制过来之后呢,我们再看一看它的 base url 是 否是对的。 api deepsea com sorbike 这里我们要使用 deepsea v 四模型,回到我们的 deepsea 官网,复制 deepsea v 四模型,输入我们的主模型,一键设置完成之后 点击添加。此时回到我们的 vs code, 打开我们的对话入口 lucas, 我 们问一下 cloud code 你 使用的模型是什么, 此时它会选择当前的是 deepsea vs 模型。那到这里我们所有的配置工作就完成了。日常我们想了解我们的 deepsea 平台,可以再回到我们的 deepsea 平台, 点击用量信息,可以看到金额月里面的每天的使用情况,以及我们的 api 请求次数和 token 的 一个使用量。
粉丝79获赞407

一百二十八 g 的 mac 现在是最便宜的 deepsea v 四满血推力方案 reddit 支付推出开源的 d s 四,把 mac 的 算力和统一内存发挥到极致,最绝的是首创的十盘 k v 缓存, 轻松跑一百万超长上下文三万多买台 mac, 超低功耗全天候跑代码 tucker, 从此彻底自由。你之前买显卡的钱可能真白花了。 mac 要取代算力卡了吗?你怎么看?

本期视频来分享如何将 deepseek 的 vs 模型接入 cloud code, 并解锁 em 的 上下文以及 max 思考等级。我目前已经将 deepseek 的 最新模型 vs flash 和 vs pro 通过 ipad 的 方式来接入了 cloud code。 vs pro 模型在降价之后性价比也越来越高了,并且对 a 键的也有做专门的适配, em 的 上下文对于大多数人来说也更加友好。 视频内容主要分为四个部分,第一需要先安装一下 cloud code。 第二,安装开源工具 c c switch。 第三,需要购买一下 deepsafe 的 api 并完成配置。最后再来测试一下 deepsafe。 v 四 pro 加 cloud code 这套组合表现怎么样。废话不多说,我们现在开始 首先来说如何安装 cloud code。 大家常说 cloud code 经常被封号,那其实封的是拥有模型能力的个人账号,但 cloud code 作为一个单独的软件是可以正常下载和安装的。 没有订阅官方的模型,我们依旧可以使用它的框架当成是 opencloud 或者 hermes nint 这种。在他们的项目官方网站这里也有明确的说明。终端 cli 和 vs code 也支持第三方提供商。 本期视频演示的是安装 cio 版本,也就是最通用的版本。这里有一行中的命令,它支持 macos、 linux 和 windows 这几种不同的系统版本。 windows 这里分为 power shell 命令和 cmd 命令,并且 windows 用户需要先下载安装下 get, 如果没有安装的话,可以到 get 的 官方网站下载安装包进行安装。 这里复制这一行命令,然后打开终端 app 或者 power shell, 输入他们提供的命令回车执行就可以了。我这里已经安装过,所以不再演示具体的步骤。安装好之后可能会出现一个提示,大致意思是安装已经完成,但是 control 的 安装位置并没有加入到电脑的环境变量中。 这里直接复制这行他提供的命令,在终端执行一下,搞定之后输入可拷的 code 杠杠微刃来确定当前的版本号。后续使用的话,直接在终端输入可拷的命令就可以打开了, 但是你那里可能会提示不能连接官方服务。接下来我们来安装第二个工具 cc switch。 cc switch 是 一个开源工具,它能够让 cloud code codeys、 opencloud 这类的 a i a 检测,方便地切换模型。累计下载量有三百多万,在 github 上面也有五万多个 star。 它有很多实用的功能,比如一份配置同步到多个应用,支持热切换,不需要退出应用切换模型。还有用量仪表盘,能够查看你的请求数和头克用量等等。 我们在项目的首页这里有一个已发布的安装包链接,点击进去,然后在这个界面直接划到最下面。这里有很多的安装包版本,如果是 mac os 系统就下载这个 mac os 点 dmg 的 版本,如果是 windows 就 下载这个版本。下载好之后直接点击安装包进行安装就可以了。 它这个项目的说明文档也有比较详细的安装教程。第三步,到 deepstack 的 开放平台购买 api。 我们来到 deepsafe 官网,点击 api 开放平台,我这里之前已经充值了一些,在网页和 deepsafe 对 话是完全不收费的,但是想要调用 api 就 需要进行充值。他们目前没有推出类似 tokpline 这样的按月订阅的套餐,好处就是用多少花多少。 目前他们对 v 四 pro 模型打二点五折,每百万 tokens 缓存命中情况下输入是零二五元,未命中是三元,输出是六元, 这个折扣目前是到五月三十一号截止。 v 四 flash 模型和 pro 模型的价格对比可以在官方的 api 文档里查看,这里点击充值按钮,然后选择金额和支付方式。建议先小额买一笔,用完之后根据自己的实际使用情况再进行补充购买。 付款完毕之后,点击左侧的 api case, 点击创建,然后复制这个 key 的 密钥, 注意这个 k 的 密钥只能够在创建的时候查看,关闭这个页面就看不到了,如果丢失的话,就需要重新创建一个 k, 然后打开 cc switch 这个应用。我这里已经添加好一个 deepsea 的 模型了,选中这里的 cloud 的 图标,然后点击添加, 在预设供应商这里找到 deepsea, 在 api k 这里填写 k 的 密钥,然后这里需要修改一下这几个模型,可以直接参考我这个填写 默认模型就是 deepsafe。 v 四 pro 后面加上 em 是 因为之前的公告有说明,这样才能够开启 em 的 上下文,然后点击添加就可以了, 这里就会多一个 deepsafe 的 模型,点击这个按钮来测试当前 api 是 否可用。点击这里可以配置用量查询,查看当前还剩多少余额, 勾选这里,然后点击保存配置,这样的话就能够看到还剩下多少钱了,然后点击起用,就能够正常的使用可绕的扣子了。左上角有一个设置按钮,通用,这里建议打开开机自启使用统计,这里也能够查看 ai 模型的使用情况和成本。 我们打开终端应用,输入可绕的指令,那这个呢?就是 deepsea v 四 pro 的 模型,并且是一百万的上下文, 我们输入指令斜杠 context 能够查看,这里确实是一百万的上下文 tokens。 这里的默认思考等级是 medium, 可以 使用命令斜杠 effort, 然后空格后面的话就会显示哪些等级可选,这里输入 max 回车确认,这样的话思考等级就会调到最高。还有一个命令可以快速的切换模型, 输入斜杠 model, 然后回车。默认模型其实就是 v 四 pro, 我 们之前配置的 apps 和 sonata 都是 v 四 pro, 嗨酷模型是 v 四 flash, 通过键盘的上下按键来选择,选中这个模型,然后回车确认, 这样的话模型就切换到了 v 四 flash, 这里输入命令 context 能够看到它的上下文,显示是两百 k 的 tokens。 最后一部分来测试一下 cloud code 搭配 deepsea v 四 pro 到底贵不贵,干活效果怎么样。 首先说一下,它是基于文件夹的工作模式,所以你需要先通过 cd 命令跳转到你想要它打开的文件夹,比如我的项目文件夹的路径是这个,就需要输入屏幕上完整的指令回车,到了这个文件夹后,输入 cloud 的 命令来启动它, 如果路径很长的话就比较麻烦。有一种方法可以简化一下, windows 用户应该可以直接在文件夹右键从当前文件夹位置打开终端, mac 用户右键的话是没有的,但是可以直接将文件夹拖拽到终端 app, 那 当前终端打开的文件夹就是这个项目文件夹, 输入 cmd 命令,可以查看当前文件夹的路径,然后输入 cmd, 启动 cmd 的 code。 第一次打开的时候需要确认一下这个文件夹,点击 yes, 后续退出的话需要连按两次 ctrl 加 c。 这里安装一个归藏老师最近开研的一个 ppt skill, 设计是比较美观的。 来到他的项目仓库,这是一个电子杂志风的网页 ppt skill, 纯网页形式,适合线下分享,但是不适合培训课件。这个 skill 的 名称叫做归藏 ppt skill, 这里提供了多种的安装方式, 最方便的就是直接复制这一段话,然后发给 ai, 选中这一段话, command 加 c 复制,然后来到 kol 的 对话界面, kol 加微复制,然后直接发送。 kol 在 执行任务过程中会需要一些权限的许可,遇到的时候直接选中 yes 就 可以了,它的框架对于安全保护还是比较好的。 整个的执行过程我就直接跳过了这里提示安装好了触发词,就是帮我做一份杂志封的 ppt。 ok, 我 在这里输入这句话,然后告诉他要做的内容就在当前文件夹中。在当前的项目文件夹中,我放入了一个 mail 文件, 内容是关于 code 的 使用方法论,然后回车执行。他会先查看项目文件夹的内容和 skill 的 使用说明,执行过程中可能会问一些问题,根据个人的需求选择就行。 我这里也跳过过程,大概直行了六分钟左右,一共生成了九页 ppt, 并告诉了我每页的布局和内容,以及怎么操作。 ok, 我 们直接打开浏览器来查看一下这个网页的 ppt。 这是第一页 codex 的 方法论,整体的设计风格确实是比较美观的,如果是个人制作的话,可能要花费比较长的时间,并且效果还不一定有他这个好。 第二页这里的话可能会有一点点问题,下方的文字有一部分被遮挡了,后面的页数大家可以具体去看一下内容觉得怎么样。 最后再来看一下安装这个 skill 以及制作这九页的 ppt 一 共花费了多少钱。 我在做之前是九点八九的余额,刷新一下网页,那现在还有九点三九的余额,一共是花了五毛钱。这里有一个每月用量的图标,展示每个模型花了多少钱。下面也有 token 的 使用详情,包括输入和输出的具体数量。大家觉得 deepsea v 四 pro 的 性价比怎么样?

大家好,今天我带大家使用 vs code 来安装一下这个 cloud code 的 插件,并且在 cloud code 上面配置两个模型,一个是 deepsea 的 模型,另一个是 cloud 的 模型。首先我们打开 vs code, 在 vs code 的 左侧面板找到扩展,点击扩展,然后在扩展这里面找到 cloud code, 选择第一个 cloud code for vs code, 然后点击安装 好,这个安装很快啊,安装好了 cloud code 之后,我们发现在左侧的面板最下面多了一个 cloud code 的 图标,我们点击 cloud code 好,它现在出现一个这个登录界面,配置 api 的 一个界面,我们现在使用它自带的这几个功能是配置不了 api 的, 因为在国内我们是访问不了这个 cloud 的 官网, 所以我们这里要借助一个其他的工具,我们这里使用的工具是 cc switch, cc switch 呢,大家可以在 github 上面的这个网址去找到并且安装, 我这里使用的是 windows 版本的,它可以支持 macos 还有 linux, 大家在自己的电脑上面找到相应的操作系统的版本去安装就可以了, 我这里已经安装好了,我们打开 cc switch, 在 cc switch 这里面找到 cloud 的 图标,点击 cloud, 然后点击右侧的加号,然后在这个供应商这个界面选择自定义配置,在供应商名称这里输入 deepsea 备注,我们可以不填,官网链接也是可选的,我们可以不填,这里比较重要的一个选项就是 api key, 我 们在 api key 的 网站上面去注册一个,然后在 api keys 这里面来创建一个 api key, 我们把这个 api key 把它复制一下,然后回到 c c switch, 在 api key 这里面把 api key 粘贴进来,看一下这里面请求地址,它这里有个说明,填写兼容 cloud api 的 服务器端地址,不要以斜杠结尾。我们找到这个 这个文档,然后在这个文档里面有一个 s u i, 有 两种格式,一种是 open ai, 一 种是 isnoop, 我 们这里使用 isnoop 的 这种 api 复制粘贴到这个 c c switch 里面来。 好,点开这个高级选项。有五个模型的配置,我们这里可以都配上同一个模型,也可以分开配几种模型,比如现在我们 deepsea 支持的最高版本的微四啊,我们找到这个模型的名称,复制 回到 ccc 去,把这个模型名称填进来, 我们可以使用 seek 微四的 flash 模型填到其中的一个模型里面。好,现在我们点击添加, 这样我们这个模型就已经配置好了。我们回到这个 vs code 的 界面,然后关掉 vs code, 重新打开一下,我们重新点开这个 color code, 此时我们看到 color code 已经出现了这个绘画的界面, 我们打开一个项目,然后点击这里的 cloud code, 或者在这个窗口的右上角也有一个 cloud code 的 这个图标,我们点开,这时候我们就可以对它进行对话了。 比如我们问一下你现在使用的模型是什么 啊?我当前使用的底层模型是 deepsea 维斯 pro, 这样我们就证明到这个模型已经配置成功了。这时候我们也可以在这里面去切换模型, 我们看到这里可以切换这个 deepsea v 四 flash 的 模型。好,这是 deepsea v 四的这个模型的配置,我们接下来再看看怎么样配置一个这个 cloud 模型。配置 cloud 模型,我们使用国内的这个中转商, 我这里使用的是 a p i e, 大家可以在 a p i e 这里面去注册一个,然后我们回到 c c switch 新增一个供应商,同样我们这里选择自定义配置这里的供应商,我们输入 a p i e a p i k 这里面我们回到这个 a p i e 的 这个令牌,这里面把自己的这个令牌复制进来。请求地址,我们这里面也要看一下啊, 我们打开这个 a p i e 的 这个文档,这里面有一个 c c c v 曲的配置, 我们把 api 地址设置成这个,然后点开高级选项,这里设置这个模型名称,我们看一下模型名称啊,找到这个标准模型,还有推理模型,把这个模型名称把它给复制过来, 好,点击添加。现在我们这个 api 的 模型也已经配置过来了, 然后这里已经有了两个模型,我们可以随时去切换模型,我们现在切换到 a p i e 这里面来,点击启动,然后回到 vs code, 我 们关掉,重新起一个绘画。 现在我们来问一下你现在使用的模型是什么? 好,这里我们看到我当前使用的模型是 cloud 双列克四,然后同样的我们也可以在这个模型切换里面去切换相应的模型。好,今天的分享就到这里,谢谢大家。

hello, 大家好,我是阿江,今天给大家分享的视频是在 cc 里边如何免费使用这个 deepsea 的 新模型。 首先我们需要下载这个 cloud code, cloud code 就是 你打开你的这个命令行,比如说你是 windows, 你 就把这一段粘进去就可以了。 如果你是这个苹果,你就把这个命令粘进去,它自己去安装了。安装之后让我们找到一个目录,直接输这个 cloud, 它这边就可以了,具体的就可以上网上去查一下教程,这个非常简单,上次我推荐那个 o b 去启动这个 cloud 的 时候,小伙伴问我如果有中转站或者是有其他的是怎么去配?我们这边需要用到一个工具,就是这个 cc switch, 可以 在这去下载适合你的这个版本, 像我这个就是 windows 版本的。我们今天免费用这个 deepsafe 是 通过这个平台摩塔的话,它免费提供一些额度,我们直接就是在我们这库里找到我们想用的,比如就 deepsafe 吧, 等它进去之后,它这儿会有一个查看代码视例,它这边就有你的 key, 你 把这个 key 复制,这是你的 key, 这是你这个 u l l 的 链接,就是对应的是这是你的 key, 这是那个链接。配置好之后, 可能有的人没有,你把这得点开,有的人会这块会被被折叠,你点开它有一个获取模型列表,可以获取到六十三个模型,我们要用的那个模型,往后看,这是 d 和 c flash, 我 们就用这个 flash 吧,它速度非常的快,我们就把这些主模型啊,这个海库啊, smartnight, opus 都配好 好之后点保存去测一下就是配置,配置好起用之后直接点可乐,他这边就运行了,所以就是大家想免费尝试的话,可以通过这个摩塔还有 cc switch 在 可乐里边使用。 ok, 那 这期视频就到这,如果各位小伙伴还有什么关于 ai 想要了解的内容,欢迎在我的视频下方留言,拜拜!

好,各位小伙伴们,大家好,那么今天带来一期我们的这个 cloud 桌面端的一个配置,我们国产模型 dbc v 四的一个详细教程,主要是演示我们在 windows 系统里面如何去配置啊,那么我看网上大多数是,大多数是 mac 系统,那么今天我们来演示一下这个 windows 系统里面是如何去配置这个桌面端,去用来去配置我们的国产模型。那么首先你需要去下载这个 cloud 官方的这个桌面端程序啊,这里我就不演示了,自己去下载。下载完之后,那么这地方我们首先打开这个左上角这里哈,然后找到我们的 help, 然后找到这个 trouble setting, 然后里面有一个 enable developer model, 然后把这个开发者模式给打开,然后点这个 enable, 然后等它重启一会。 好,那么重启完之后,我们再在这个地方打开我们的 developer, 然后找到这地方有一个 configure 这个设置,第三方这个设置哈,点开, 然后我们就按第一个来哈,我们这地方主要是配置的是我们国产模型 dipic v 四,那么这地方你就默认选第一个,然后这里的 u i l 你 选这个 dipic 点 com, 然后后面加上我们这个 astropic 里面的这个 这个单词哈,然后再把你的密钥给添加进去,然后这个地方你去添加你的这个模型的名称,那么这个地方你可以去开启它是否具有 一一照上下文,包括这个 devic v 四 flash 版本都是可以的哈,然后你配置完之后,然后我们点这个应用就可以了哈,然后这地方它会重启, 让我们等它一会儿,那么重启完之后,那么你就可以在我们的国内去用到我们的这个模型,你可以去测试一下啊,比如说我们这地方新开一个任务, 然后我们可以给他问一个你是回车,然后等他翻译出来, 好,正在思考,显示我们已经配置成功了啊,那么这个地方显示 回复的话,那说明已经成功打成功配置完我们这个 windows 系统里面这个国产模型的一个配置啊,那么在这个地方我们就可以很方便去操作我们本地的一些环境,还有我们本地的一些文件可以进行直接上传,包括这个地方的 code 模式啊, 后台模式类似于我们在本地终端你用的这个终端上的 cc, 它是一样的哈,只不过这个地方相当于是一个格式化界面,那么你按需获取,如果你喜欢用这种桌面端工艺去操作的话,也是可以的哈,在这地方你可以去设置它的一个模型, 包括它的一个思考的长度,对吧?你也可以去打开你本地的这个文件夹,让它进行操作啊,那么相当于是呃这个桌面端去用来去配置我们国产的 一个模型啊,那么这样的话就可以在国内很方便的用上我们这个靠的一个桌面端工具啊。那么这个地方你可以去慢慢研究,这地方是新建任务,然后也可以去对我们的这个每一次对话进行一个, 相当于是建一个文件夹嘛,建一个文件夹,然后上传自己的文件,然后进行一个操作,然后这里面有些功能可能是用不了,因为毕竟是配置的是我们国产的模型,那么今天主要是来介绍一下这个, 呃,桌面端是如何配置我们的国产模型, dsp 为四。好,那么今天的分享就到这里,而另外有一个点是大家要注意的时候, 我们在配置的时候可能会出现一个问题,就是有些这个电脑的一个讯息机没有安装,那么你点击这个左上角,它会自动的去安装我们的这个讯息机,然后再重启一下电脑就可以正常的去使用了。啊,好,那么今天的分享就到这里,谢谢大家。

现在 code 可以 直接使用 dc v 四了, code 确实好用,但是额度真的是不经烧,随便几个问题直接就清空了,又得等五个小时。所以我试着把 dc v 四接进去,烧了四 e token 之后,发现操作竟然很丝滑,体验也完全不输原版,关键是真的大碗便宜, 后面我会带你一步步接好。其实步骤是非常简单的,就三样东西, c c 叉, d c 的 a p i, 还有 c c switch, 而且工具我都已经整理好,你照着我这几部点,基本几分钟就可以搞定。 解压后先打开 c c 叉的文档,然后打开 emv 文件,里面会有一个密钥,这里你可以保持默认,也可以自己去修改一个。改完之后记得先保存,然后启动 c c 叉,它会弹出一个终端,你找到这个管理界面的地址, 然后按住 ctrl 键再点击,就会来到这个页面。进去之后把刚才 e v m 里面的密钥粘进去,就能够进入到后台,这里你可以顺手切成中文就行,这部分就基本搞定了。接下来我们去到 d c 的 官网,点击 api 开发平台,第一次进来得先注册一下,然后点击左边的 api key, 新建一个 key, 名字可以随便填。创建完记得先保存好,因为它只会显示一次。然后回到 c c 叉上面,选择 code, 中间点击添加频道,这里就可以直接把这个文档粘进去。最下面把刚才复制的 a p i 粘进去,创建就算成功了。记得顺手做两个设置,一个是选一下 openchain, 另外一个是把规范化,非常健 打开。这一步搞定, d c 其实已经接近来了,然后打开 cc switch, 点击上面的这个标志,右边新增一个配置,具体的参数你可以按照这个来就好。这里有三点是需要注意一下, 首先,这里的 api key 不是 d c 的 那个,是一开始 emv 里面的那个密钥。第二点,点击一下这个获取模型列表,就不用自己手动去填写了。第三点,把 e m 上下文窗口勾上,这样子才能全力去跑,下面这些都不用管,填完之后直接点击保存, 然后点击启动,最后把 codex 安装或重启一下,到了这一步就已经接好了。打开之后, codex 这里不是显示 d c, 它只会显示自定义。别慌,这个时候你随便发一句话,先试试能不能是正常使用。然后直接去看看 cc switch 的 使用记录,你会看到模型这一栏已经变成了 d c v 四 pro, 来源是 codex, 那 说明已经是链接成功了,也就是说后台真正在跑的已经是 deepsea 了。最后我补两个词,已踩过的坑。第一个坑是 cc switch 最新的版本,现在有 bug 会连不上 codex, 所以 别手痒去更新,直接用包里面的版本就行。 第二个坑是 d c v 四没有视觉能力,所以一旦你平时有看图识图这类型的需求,进来之后可能会有部分的能力用不上。不过好消息是这套流程本身是通用的,你可以直接换成其他的多模态模型,思路也是一样的。我是木马,陪你一起玩 air 赛博达子,咱们下期见,拜拜!

众所周知, c c 和 codex 这些智能体现在可以帮我们办很多事情。这里主包在使用的时候发现, 如果在 ide 的 插件中打开我们的 c c, 比如我现在让它帮我生成一个英语 ppt, 然后 ok, 这个 ppt 生成完了,我现在要查看,就还得打开文件夹再点开,然后才能查看。对于我这种日常进行一些小项目的人来说, ide 就 非常不方便, 每次打开终端的话还得重复去敲命令,而且终端也没有简洁的对话窗口,如果使用桌面端的话,又没办法像终端一样多开。于是主报就想到了一个好办法,能不能设计一款小小的应用,帮我把终端和对话储存这类功能结合起来。于是就有了这么一款软件, 就是它是以文件夹为对话起点,每次拖入一个文件夹进去,它就能自动识别这个文件夹里面的内容,并进行任务处理。这里的话, a p i 默认和你 cc 的 一样, 然后你可以选择 windows 的 几种终端。那么好,现在我们把文件夹拖进去,它就会自动帮我们打开终端并运行我们的扩展,它能识别这个文件夹,并以这个文件夹为起点进行任务处理。与此同时,我们还可以在这个文件夹中与 ai 进行对话。这里额外提一嘴, 由于主包是大一学生,用不起高昂的酷 loft 和 gpt, 只能用一些相对便宜的国产模型,但是这里必须大大支持一下梁总。 deepsea 就是 廉价劳动力,它的缓存命中率相当的高,再加上这个月的打折活动,蒂斯帮我处理一些小问题,还是非常好用的,比如现在我们跟他说 帮我整理一下文件夹里面的内容,他就能比较好地完成, 然后我们再一次打开的时候,它又能保存上一次的对话内容。现在是演示环节,我们新建一个文件夹,我们现在要做一个番茄中文件夹,拖过去之后自动帮我们打开终端,我们现在要给它提要求, 然后就等它自行完成,无脑的选 yes 就 ok 了。在它处理的时间我们可以和它对话,比如这里我们问它 这个使用终端的好处,就是我们可以同时打开多个终端,我们现在新建一个终端来执行我们另外一个任务,然后他现在就是在同时执行两个任务,我们等一下 可以看到他的这个注意事项先完成了,我们看一下直接在文件夹里面给我们建了一个文件, 完成的还不错。然后现在它的这个番茄盅也做好了,我们看一下还是比较方便的。这里煮包也是第一次 制作并分享这种类似的程序功能,还是比较简单,没有太多独特的地方,但这也是我的一次小小的尝试吧,我觉得如果有了新的想法,就要有着能够把它变成现实的勇气。 如果大家有好的建议或者 idea 可以 及时和我交流,谢谢大家。

兄弟们,今天给大家分享一个最近在 get up 上连续霸榜好几天的开源项目 ds 四。这是由 reddison 支付亲自操刀,用纯 c 语言打造的 deepsea v 四本地推理引擎,开源不到一周就已经狂揽一万星标,只需要一台一百二十八 g 内存的 mac, 无需额外花钱购买 token 就 能本地运行。最新满血版 deepstack v 四更绝的是它直接把 ssd 硬盘当显存用,靠着磁盘 kv 缓存技术,就算是一百万长度的上下文,推理起来照样丝滑流畅,而且显存占用稳得一批,还 兼容 openni 接口,能无缝对接好多现有的 a 阵的工具,关键是所有数据都存在本地,隐私安全这块直接拉满。

本地大模型的天花板彻底被打破了, reds 之父亲手下场用纯 c 语言写了个 deep seek v 四本地推理引擎,就是这个项目,短短几天就拿下了八千五百个 star, 就 刨起满血版 deep seek v 四,每秒二十六个 token 的 生成速度。更离谱的是它把 ssd 硬盘当显存使,通过磁盘 k v 缓存技术,哪怕一百万长度的上下文推理 也能丝滑顺畅,而且显存占用极其平稳。兼容 open ai 接口,现有的 agent 工具可以直接无缝对接就非常夸张。

宇哥,这个分享非常非常棒啊,然后我想也来体验一下 cloud 的 桌面端来对接国产模型。因为习奇 switch 这个大版本更新以后,支持了科奥的桌面端,所以哈,有了这个桌面端,这个桌面端的配置就非常的省事了,就不需要一些骚操作来处理了。然后呢,首先我们点击右上角的那个添加按钮, 选择国产模型 deepsea, 因为国产模型 deepsea 现在相对来说性价比非常高啊,既便宜又好用。选择完以后呢,对应的参数啊,这些参数都有了,我们主要又管一个 关那个 api, key 复制进来就好了。嗯,添加好,添加好这个对应的 key 之后, 跳到右下角的位置,以户上下文一照,你以为那个的不希克也已经支持了一照的上下文,然后点击添加就可以了。然后呢, 要开启这个模型,那么这里有个注意项,就是要首先开启本地路由,本地路由在哪呢?我们再返回到那个首页啊,点击左上角小齿轮,然后点路由, 然后他有一个路由,有两个都给他打开,打开以后啊,还有一个 log 按钮给他起用, ok 啊,这样的话基本配置就差不多了,怎么回到首页,点击这里的启用,然后现在准备打开那个 cloud 桌面端进行验证了, 你看啊,打开以后呢,他这个模型按道理来说已经加载,已经加载完毕了,好,出来了,我们看一下啊,基斯模型已经有了, ok, 模型模型都有了, 现在我们来输入一个,比如说你,好吧,测试一下,看看到底能不能跑通, 看看他回不回复 哦,回复了,回复了就说明跑通了哈,真正的接通了,然后现在我们再返回吸气死位置小齿轮, 然后有一个使用用量的统计,啊,使用量统计可以看到那个哎 do see 了, ok, 那 就说明 对接真的真的就成功了。最后呢,这里再提醒一个,提醒一个问题,就比如说我们切换模型的时候,比如说有啊切换,也不能说切换模型,切换供应商吧?模型供应商,比如说切换到七 kimi 切换的时候切换完了。其实现在如果说我们直接用 cloud 那 个桌面端的话,它是没有切换到 kimi 模型的,因为它还是有问题的,没有进行热切换,所以大家也要重启。

卧槽,发现一个宝藏项目,本地大模型天花板被捅破了!目前已经十点二 k 星标了, radis 支付亲自下场,用沉思语言写了一个 deepsea v 四的本地推理引擎,一百二十八 g 的 mac 就 能运行满血版 deepsea v 四, 每秒二十六 token 的 生成速度。更炸裂的是,它把 ssd 硬盘当成显存使用,通过磁盘 k v 缓存技术拿捏一百万上下文对话长度,兼容 open i i 接口,现有 a 阶 t 工具也可以集成,赶紧去试试吧!记得点赞关注!

codex 大家应该都用上了吧,但是它的缺点就是额度太少了,完全不够用,而且它的头款实在是太贵了。那一种解决方式就是把咱们自己比较便宜的一些模型借进去,比如说 bitcoin, 咱们需要 c c 叉, c c switch 以及 bitcoin 的 api k。 首先我们在 bitcoin 点击 api 开放平台 api case, 创建 api k, 这个 k 一定要保存好。然后我们搜索 c c 叉, 点击这个,在下面找到适合自己的版本,我下载的是 windows 版本,然后搜索 cc switch, 点击下载,在这个界面一直往下翻,找到适合自己的版本,我仍然下载的是 windows 版本,然后安装 在 c c 叉文件夹下,我们新建一个 text 文件,命名为点 e n v, 把这些内容填进去。 k 就是 你设置的登录密码,我这里设置一二三四五六,然后重命名,把点 txt 删掉,运行 c c 叉,这个时候会弹出终端,复制这个 local host 地址,到浏览器打开点,点击 contacts, 选择添加渠道。在这里可以打开 delete 官网找到调用 api, 复制 c u r l, 把这一行改成 api k, 填写你自己的 delete 的 k, 选择详细配置。我们要选择 open ai chat 模式,继续往下翻,把这两个按钮打开,然后就可以了。现在我们在 c c switch 点击 codex 图标,再点击右上角的加号,供应商名称可以随便写。 api k 是 你在 c c x 的 点 e n v 文件里设置的登录密码,我的是一二三四五六 api 请求地址填写这个,点击获取模型列表,可以看到 deepsea 模型了,选择即可。然后我们点击测试模型,如果正常,说明已经配置好了, 我们重启 codex, 选择其他方式登录。这里的 k 也是你在点 e、 n、 v 文件里设置的登录密码,比如我的是一二三四五六,然后就可以了,现在 codex 里面的模型已经是 zip 了。

devic 微四硬件配置全解析中小企业本地部署落地指南二零二六年四月二十四号凌晨, devic 突然扔出了 v 四预览版,震动了开源大模型圈。很多人刷到官方参数的第一反应还以为这数据是不是标错了, 毕竟一点六万亿的总参数摆在那,一百万 t 开源的上下文还全系标配,而且直接采用了幺幺三零进防炮扫射了。 社长这两天把大家最关心的硬件配置问题都整理清楚了,接下来我会从模型本身的核心参数,到华为升腾全系列显卡的实际表现,再到英伟达显卡的部署门槛,还有整机的硬件搭配,一项一项跟大家说清楚,大家一定要耐心看完,看完之后你就清楚该怎么配硬件了。 特别让人兴奋的是, deepsea 微四没有像过去那种单纯的事后移植,而是从模型设计阶段就跟国产算力深度绑定了,华为团队直接驻厂,双方联手重写了大量底层代码,硬是把这套万亿参数的大模型从英伟达的扩大生态转移到了华为自研的 c a n n 框架上。 升腾那边也完成了推理和训练的全方位适配,开箱就能用。发布当天,华为升腾就完成了首发适配,全系列超节点产品都跑起来了。当然,英伟达那边也没丢,技术报告里两家芯片是并列验证的关系,但可以说这是国产顶尖 ai 模型与自主算力底座深度融合的重要突破。 这次 deepsea v 四开元模型一共出了四个版本,对外提供服务的主力是 v 四 pro 和 v 四 flash, 另外还有两个不带对齐的 bios 版,专门给开发者做二次微调用的,它采用了新一代混合注意力加 d s a 稀疏注意力技术, 能做到一百万 talking 内基本不丢信息,这代表了什么呢?代表了他一次性读入整本书或者整个中型代码库都没问题,不管是长文档分析、法律合同审查,还是百万字小说创作,都能轻松搞定。在讲硬件配置之前,我们要先搞懂两件事情。首先是参数量和显存占用的关系。 deepsea v 四 pro 总参数量是一点六万亿, deepsea v 四 flash 总参数量是两千八百四十亿。这两个总参数量都是 f p 十六原生精度基准值, 直接决定了本地部署的显存占用。 f p 十六 b f 十六是原生满血精度,每个参数占两字节, f p 八 ink 八占一字节显存减半。 f p 四 q 四 int 四占零点五字节显存百分之二十五, q 二 int 二占零点二五字节显存百分之十二点五。因此,在 f p 十六净度下对应的显存占用分别是一点六 tb 和两百八十四 g b 显存八净度下对应的显存占用分别是八百 g b 和一百四十二 g b。 q 四进度下对应的显存占用分别是四百 gb 和七十一 gb。 在 极限压缩的 q 二进度下对应的显存占用分别是两百 gb 和三十五点五 gb。 也就是说,哪怕是运行最小的 deepsea v 四 flash q 二模型,单模型的显存占用就要达到三十五点五 gb。 除了模型本身的显存占用之外,还有上下文, k v 缓存框架开销和中间张量预留都会产生显存占用,上下文越长,显存占用越大。如果要达到一照超长上下文, 单频发 k v 缓存的显存占用就要达到二十到三十 gb。 其次, deepsea 微四全系都是 m o e 架构模型, m o e 是 混合专家架构的意思。以 deepsea 微四 pro 模型为例, 它的所有专家模块加起来的总和是一点六万亿参数,每次推理的时候只会激活四百九十亿参数,让这很小一部分的专家来干活。但并不是说显卡每次只要运行四百九十亿参数才能运行,不能只加载单次推理的激活参数, 这是我们在后面计算显存需求的核心前提。好,搞懂了这两个核心问题,那我们就正式进入硬件配置解析环节。因为 deepsea 微四 pro 参数量过于庞大, 需要几十张顶级显卡才能流畅运行,这巨额的成本支出基本上不是给中小企业准备的。所以我们这一期把重点放在中小企业最关心的 deepsea 微四 flash 高效谱绘版上面。 它的 f p 十六总参数量是两百八十四 b, 单 talking 激活参数量是十三 b, 定位、日常兑换、轻量化业务部署、高并发推理和低成本落地场景 契合绝大多数中小企业需求。我们先来看一下 d p c v 四 flash 对 应的显存占用模型本身叠加 k v 缓存、框架开销等之后, f p 十六精度需要六百二十 g, 显存 int 八精度需要三百二十 g, int 四需要一百六十 g q 二需要九十 g。 在这些精度中,社长推荐有一定实力的中型企业上, int 八精度模型性能损失较小,推荐小型企业上 int 四精度模型,虽然有一定的精度损失,但性价比较高,不太推荐 f p 十六和 q 二精度, f p 十六性价比不高, q 二精度损失较大,性能偏弱。 除了上述的精度模型之外,社长还推荐 d p c 官方推出的 f p 四加 f p 八混合精度模型,只需要一百二十 g 显存,而且一张华为升腾、阿特拉斯三五零一百一十二 g 显卡就能实现适配,也是目前性价比比较高的方案。华为升腾是怎么做到的呢? 因为这一次 deepsea 微四与华为升腾实现了原声适配,这就是它在升腾显卡上表现出色的核心原因。在华为升腾的显卡芯片型号里,比较适配 deepsea 微四的是升腾九幺零 b 四、升腾九幺零 c 和升腾九五零 pr。 其中升腾九幺零 b 四对应的显卡是阿特拉斯三百 i a 二六十四 g, 升腾九五零 c 对 应的显卡是阿特拉斯三五零一百一十二 g。 其中比较适合中小企业的是二零二六年三月刚刚商用的阿特拉斯三五零推理加速卡,它搭载 scent 九五零 pr 芯片,标配一百一十二 g 自研 hbm 高宽带显存,宽带一点四 t 每秒, f p 四算力一点五六 p flops, 是国内率先原生支持 f p 四低精度商用的 ai 加速卡,单卡就能实现高吞吐、低延迟推理。据 d p 四个官方实测,综合性能约为英伟达 h 二零的二点八七倍,升程速度显著提升。再来看英伟达平台在具体部署要求上, f p 十六精度需要八张 a 一 百八十 g 显卡,英特八精度需要四张 a 一 百八十 g 显卡,英特四需要两张 pro 六千九十六 g 显卡或四张四零九零四十八 g 显卡。 q 二,需要一张 pro 六千九十六 g 显卡或两张四零九零四十八 g 显卡。目前英伟达的 blackwell 架构是原生支持 f p 四精度的, f p 四精度的 dipstick 模型跑在 blackwell 架构的显卡上性能会有大幅提升,这也是为什么最近几天采用 blackwell 架构的 pro 六千九十六 g 服务器版显卡价格飙升的原因。从部署成本上说, f p 十六精度成本过高一般不是中小企业可以承受的, note 八和 f p 四是中小企业比较可行的精度,整机在十几万到三十万之间, q 二,精度损失比较大,不建议采用。接下来说说服务器整机配置硬件的要求,显卡是核心关键瓶颈, cpu、 内存、硬盘也要严格匹配,不能出现短板。 q 二,测试级配置推荐 cpu 十二和二十四线城以上,主频大于等于两点五 g 二卡以上需要十六和三十二线城 内存一百二十八 g 起步。硬盘推荐 nvme 三点零固态五百一十二 g 以上机械硬盘和赛道固态无法满足模型运行需求。 intel 四以上的生产级配置,双路服务器 cpu 二十四和四十八线层以上,主屏大于等于两点六 g, 支持至少六十四条 pci 四点零通道,内存两百五十六 g 以上,一兆上下文需要升级到五百一十二 g 硬盘用企业级 nvme 四点零固态二 tb 以上, 连续读速大于七千兆每秒,硬盘配小了连模型都装不下。最后说说个人消费级配件,因为消费级 cpu 最多支持两张显卡跑满速。也就是说,如果用消费级硬件来跑, deepsea 微四目前最高可以配两张 pro 六千九十六 g 显卡,显存合计一百九十二 g, 可以 流畅运行 it 四以下版本的模型,但整机成本高达十五万以上,这已经超出大多数个人用户的承受范围了。 好,以上就是关于 deepsea 微四的硬件配置全解析,如果你也有个人工作室或小企业的 ai 本地部署需求,不管是硬件配置搭配还是软件的部署调试开发,都可以来找社长聊聊。