deepstack api 完成扩容,默认支持五百并发。一家一百人 ai 公司实测从 cloud 迁移到 deepstack 后,月 token 费从十二万降到零点八万,降了百分之九十三。但别光看价格,三个差异, deepstack 中文强,英文长文本不如 cloud, 五百并发够一百人团队用,但批量任务要排队缓存,命中零点零二五元,每百万 token 未命中三元,差一百二十倍。优化提示词能省大钱迁移建议英文代码场景留 cloud 中文内容场景全切 deep sec 你 们用哪家? a p i 我 帮你算千亿张。
粉丝1.6万获赞7.7万

如果你还在苦恼 deepstack 的 改变,从现在开始用 api 吧啊,上期视频我虽然提到了,但是很多人说太复杂了,更多人说不知道怎么用,那这期视频我们就来一期手把手的教程啊,不会很复杂,而且相信我,这有可能是你实现 ai 认知跃级的一大步。 你现在用的 deepsafe, 不 管是网页版还是手机 app, 它的背后其实是一堆服务器在跑。给大家看一看我们的老师在服务器里最原始的样子,一个黑底的界面,先加载各种乱七八糟的东西,加载完之后就会出现一个箭头,你打字进去,他会一行一行的给你回应, 看起来就很原始哈,能用吗?是能,但是只有技术人员能用,这时候他就在想,我怎么能把这个服务器共享给别人呢?毕竟这设备钱跟电费都烧着,如果我能共享出去,还能够按量付费去收点钱回血,对吧?那么就会有第一个问题,怎么能让别人知道你这台服务器在哪呢? 答案也很简单,给大家一个统一的调用网址,然后大喊所有人连接这里,保持 wifi 稳定。 第二个问题,我怎么知道谁来用了,用了多少呢?也很简单,给大家一堆密钥,按照密钥来统计个数就行,其实这块就挺像账号密码的,它就是两行参数。然后会有第三个问题,因为 deepsea 它也不止一个模型,那你到底要调用哪一个?需要你指定它的模型名称, 只要你手上具备了这三个东西,你就可以在任何地方去调用。迪老师, 比如你来到了一个酒馆,跟 d 老师扮演的几位男士女士非人类聊聊天。又比如你打开了一本全是日语的材料,辛勤的 d 老师一句一句的把它们翻译成了中文,然后你脑子突然冒出了一个想法,想搞一个创业的网页 代码,当然都是由 d 老师亲自来写,当然你也可以什么都不想,就在一个简单的聊天框里面,跟老 d 老师好好的聊聊天, 你之前应该也遇到过的老师说到一半,然后紧急撤回,又或者是服务器繁忙,请稍后再试,那在这里就都不复存在了,而且尺度无限大啊。如果你听兴奋了,那我们就快速去过一遍,流程就很很简单, 然后我再去跟大家分享一些更多我对于 ai 的 一些想法操作,一共就两步,那我们先来解决后端,也就是拿到我们开头讲的那三个东西, 用电脑或者手机都行。打开 deepsea 的 官网,左边这个网页版就是我们熟悉的老路,我们这次走右边 注册一个账号,然后就开始充值,最低一元起充,具体充多少呢?我就给大家一个参考。我上个月总共花了两块三,最多的一天花了四毛,而这一天我大概跟 ai 聊了十二万字,说白了, d 老师真的很便宜,就是充十块钱,应该能够聊到你历劫了。 充完值,找到左边的 api case 点创建这个名字,你随便起,这串密钥要保存好,因为它只会出现这一次,相当于我们也拿到了我们的一个身份码。所以后台呢,其实就是充值跟创建密钥这两步。我们再去看一眼它写的接口文档, 对老师的请求地址就是这个 api 点 deepsafe 点 com api k 就是 你刚刚创建的那个。然后模型名称你有两个选择,分别对应着 v 三点二版本的非思考模式和思考模式。如果你好奇的话,可以看一眼左边的价格标准,输入两块,输出三块,每一百万, 这个比起国外的大模型真的是白菜价了。好了,至此,我们后端的这三个东西就齐了,接下来呢,我们来选前端。前端的软件是非常多的 啊,我现在给大家报个菜名,网页版有 open web ui, next, chat labor, chat, 桌面端有 chat studio, deepchat, chatwise, 手机端有 chatbox, replay, hub, cleveland 多的是。但是你要记住,就这些软件,它们所有的软件除了功能上有些细致的差别以外,其实都一致,它们就是一个壳,来为你提供一个对话的聊天界面。我们这一次呢,以 chatbox 为例啊,因为它的 ios 跟安卓都是免费的, 虽然界面会有点简陋,但其实还挺好用的,当你第一次打开它的时候,里面是空的,但如果你配置好了,它是可以什么模型都有的。 首先我们一进来全部插掉,在这个菜单里面找到设置模型,选择提供方,找到 deepsea 这里,因为 deepsea 实在太有名了,所以大家都用那个地址还有模型的名称,所以它呢,简化了,都给你填好了, 这里你就只需要填入你的密钥就可以用了,填完呢也可以检查一下,一般是没有什么问题。现在呢,再一路返回,你就可以在下面选择 d 老师了。前后段的教程就到这里结束啊,应该讲的还挺细的,如果你还有什么疑问,都可以发在评论区,我是会看的。 这里你细想一下,其实 deepsafe 的 官方 app, 它不也是这么一个壳吗?只不过官方帮你把这些地址、密钥、模型全都接好了,再给你免除了 api 的 费用,大家就这么习以为常着用着了,对吧? 到这你可能会想啊,就为它这个模型升级,然后我为了找回老模型,就费了这么大劲,值吗?说实话,如果你只是把这个 api 接入到一个聊天软件里,那体验上确实跟之前聊天没什么区别,而且你现在还开始花钱了。 但是呢, api 这个东西,一旦你学会了领悟了它的用法,那它打开的就绝不是一个聊天窗口这么简单了。 其实我看到了一个比较主流的 ai 的 理论,它会把使用 ai 的 人分为了四层,第一层跟 ai 聊天,用网页端或者手机版的 app 去帮你查查资料,写个周报,你个新年贺词,或者帮你处理一些感情问题啊,也不是说有错,只是说这样其实没有发挥到 ai 所有的能力。 第二层,其实就是我们这次讲的用 api 的 方式把 ai 拉出来,放到各种不同的软件里面,那区别在哪呢?比如说,我这里有五个需要翻译的文件,用网页的方式一次复制不完,我就得把它们分段去粘贴, 不仅麻烦,而且这个流程是很不规范的。但凡 ai 出现一次幻觉,那字幕的格式就会错,非常容易出现各种各样的问题。 但有了 a p i 之后,我们就可以利用现成的翻译工具,只让我们的老师去做这个翻译的部分,而且整个过程都是批量的,处理完之后自动合并成一整个文件,准确而且优雅。如果你用好了 a p i, 其实你工作的效率会有很大的提升。 第三层其实就是现在爆火的 ai 编程,刚才我们翻译是有现成的工具的,但有些小众需求,比如说我想要自动抓取一些 ai 热点,然后主动推送给我, 市面上没有这样的程序,那就自己造。有一种很特别的程序,专门为 ai 编程而优化,同样它需要 api 的 方式接进去,然后你跟它自然语言描述你想要的东西,它就能帮你一点点做出来,而在这一层,无论你的需求有多小众,它都可以解决。 最近呢,我是用 ai 来搭建了整个写作的工作流,虽然文章还是我自己写,但是有一些选题的想法,或者是发布之后的数据总结,我就都交给 ai 去做了。昨天晚上我去跟 ai 复盘总结,也说了很多的想法,然后我觉得有点累了,就跟他说,不然今天就到这里, 然后他就说好了,今天就先到这大概讲了什么东西?合上电脑,我突然有点恍惚,就过去的一个小时,我是完全没有看手机,没有呃,刷短视频,完全就是种心灵模式,而这个心灵模式竟然是我在跟一个 机器在协同工作,这种感觉真的还挺奇妙的。至于第四层,其实很多人都还在观望,应该也是一个今年的趋势啊。一个 ai 是 已经可以帮你很好的完成任务了,但是更加复杂的,更大的任务可能他还是做不了的。那么一群 ai 如何去协同合作? 这个事情还是比较难的,就目前还是一片混乱。就是你让一个总领导的一个人去安排几个不同的小 ai 去做事情, 他就会着急的说那 ai 还没做完呢,他就自己上手去做了。总之现在的视觉效果是远大于实际的效果的啊,还不是很好用,跟大家发散的会演多了,只是想让大家去了解一下现在的 ai 进行到什么程度了。 呃,这一次的小事故,如果能够让你有机会去接触到 api 的 用法,我觉得是一个非常好的机会。好了,这期视频呢,我们就讲到这里啊,应该都听懂了吧,如果,嗯,哎,反正后续我也会做各种各样的,一步一步的,这种 ai 的 内容也可以先关注一下我。 嗯,就讲到这吧,然后我是大黑,以纯人工的方式去帮你去去分享智能。好,我们就下次再见。拜拜。

最近有个事在技术圈炸了,上海一个做 api 中转站被刑事拘留了三十七天,取保候审出来以后自己发帖说将来肯定会被判刑。什么是中转站?简单说就是中间商。国内大模型接口便宜到什么程度? ipc 每百万 token 只要两分五,海外同级别模型要一百多块,价差几百倍。所以有人就干起了这个低价批量拿国内模型的接口,转手加价卖给需要的人。看起来是个信息差,实际上处处踩红线。 一、无证经营中转站,向公众收费,提供信息服务,按电信条例必须持 icp 许可证,市面上几乎没一个有。第二,数据过境。你发的每一条提问,每一份文档,每一行代码,都要经过中转站的服务器,再转发 你的商业计划书、客户数据、核心代码对中转站来说全是透明的。有调查发现,部分中转站会偷偷记录用户的对话内容,打包成数据级出售。第三,偷梁换柱。 你以为在用顶级模型,实际上中转站把一部分请求悄悄换成了便宜模型。 有实测发现,有的中转站实际收费比预期高出百分之六十二,但你从账单上根本看不出来。还有的截断你的上下文长度,一百二十八 k 的 额度只给你用三十二 k。 模型突然变笨了,你还以为是自己的问题,所以很多人说我懂技术,我自己接 api 就 行了,真的行吗? 你要自己搭中转,得先搞定服务器域名、接口对接载均衡、异常监控、合规备案,光这些隐性成本比你省下来的接口费高的多。而且刚才那个上海的案例就是个人搭的, 对普通人来说,你根本不需要自己去接接口,你需要的是一个已经帮你接好的所有模型的工具,打开就能用,在你需要的场景里直接用,我们就是把国内主流大模型都接好, 你不需要碰一行代码,不需要自己搭任何东西。在 ai 视频创作、文案生成、图片处理这些场景里直接用就行,信息差会消失,但工具价值不会。与其研究怎么搭中转,不如研究怎么用 ai 把事做成千山 ai, 让创作变得很简单。

你用 codex 成本高,很可能不是用不起 ai, 而是模型没接对,就很多人用 codex 只会配默认的配置。就是如果你 开始写高频,写文案,做 ppt 或者跑代码处理资料,你会发现一个问题,就是调用成本会越来越明显啊,这时候就去接这个 deepsea v 四这类模型就是一个很实用的思路, 逻辑很简单,就扣袋子负责工作流, deepsea 负责模型能力,就是一个负责操作,一个负责这个输出,就搭配起来成本会降低一点,中文场景也更顺手。 就大概这几个流程啊,第一步就是去 deepsea 后台拿官方的 api key, 第二步准备一个 cc switch, 第三步,把 api key 填配进去 啊。第四步,在这个 c c 维 switch 里面扣代词,去添加模型供应商啊。第五步就把请求地址填成这个本地的这个地址,这里有个坑啊,很多人会填错啊, apikey 就是 delete 的 这个,但是请求地址很多人就不会填,叫后台地址留言哈,我给你模板。 还有一个细节就是 cc 十位工具启动后啊,不要关,要关的话他调用就会失败。所以抠袋子接这个事情老点不在技术,而在你。没搞懂啊,这个模型跟中转的关系, 搞懂以后你就能够用更低的成本去跑不同的 ai 任务。就下一条,我出一个,就是这个小白怎么接的这个教程以及闭坑指南啊,照做。

大家好啊,我是瑞考张,有朋友问啊, deepsea 最近要降价了,什么情况?那这个咱们简单说, deepsea 这次是永久的把 v 四的 flash 和 pro 的 价格, a p i 的 价格降下来了,而且降得还非常大,原因在哪呢?这其实三点啊,第一点的话, deepsea 它已经找到了在华为、升腾等国产专利之上 部署推理能力,甚至推理能力进一步挖浅的这条路,而且这条路现在跑通了啊,它的成本会进一步的降低。第二点的话呢, deepsea 在 之前优化过程中,把很多的这种意向型的工作,像那个编程啊,很多东西他说都做了前期的这种训练和推导,所以说的话,人们在编程中发现它这个 啊,这个缓存命中率非常高,缓存命中率就是缓存就有结果的,直接呢不用预算就给你反馈,所以它的成本会进一步降低。 第三个的话呢,就是说他对于推理方向其实做了很多的深度优化和算法的优化的啊,包括 ingram 是 吧?包括 mhc 啊,这些技术咱们之前都讲过,做了很多这样的优化,使得本身推理上面的成本就在大幅的降低,所以他才敢进行进一步的降价, 进一步的推升自己的这个市场份额。从这个角度上来看啊, deep 接下来就完全可能要去冲击奥数 pick, 就是 cloud 啊 啊, cloud code 啊,他们这个的地位,为什么?因为第一个它的这个这个模型的能力差不多的排在前三啊,现在开源、闭面闭源排在一起呢,它应该排在前三。第二的话呢,就是它的这个 成本是比美国的模型便宜很多的,大概咱们的五十分之一的成本,所以那个后续的东西可以看的话, deepsea 现在也在招人要做自己的 cloud code, 当然那个,呃,硅谷的大神已经做出来一个 deepsea 的 那个这个类似 cloud code 的 东西嘛,现在那个下载量也非常大, 大家用起来非常爽,对吧?所以这个事逻辑在这呢,那这个东西他要跑通的话,后续代表的就是所有人都特别关注的话题了,就是中美之间的这种在模型领域的啊,这个运营成本上的,也就是我会拿更低成本 啊,这个价廉物美的模型去冲击你的市场,你接住,接不住,如果你接不住的话,那就跟咱们以前其他那些行业中的一样了,就进入到了啊,这个进入到了我们所熟悉的领域,对不对?拼这个性价比的领域了, 这个事是我们现在看到的一个方向了,而这个方向呢,可能会对于后续的一系列产业链,包括算力啊,包括电力啊,包括,呃,这个夜冷啊,是吧?包括这些东西有一系列的影响, 好,那一些的影响到底怎么落地啊?我们准备在后续的季度会员课不课里深度解读啊,需要的话赶紧看看啊,因为咱们的课呢,九天四十五个视频,八场专门的直播,非常的超值,非常超值啊,因为之前你看这周咱们的,呃,这个直播的话,我们素颜直播就在讲这个,呃,两存是吧?长一长,长存那个申请上市带来的一系列变化, 那后续也要讲这事啊,非常下个星期也要去讲啊,所以需要的真的赶赶紧看啊,因为对于 deepsea 这块国产算力的变化,我们下周的会员视频肯定是要讲的啊, 最需要的真的好加入进来啊。呃,因为咱们内容非常优优质啊,本身的话呢,我的月卡呢,都已经两百多千三百块了,季卡的话都应该八百出头才对。那现在的话,平台给的贷了补贴叠加六幺八,咱们六百出头就能拿到,而且有些平台不到六百你就能拿到,非常的超值,非常超值啊。需要的话赶紧看看,链接就在底下, 点击即可。好吧,啊,刷在手说一句,一定要接助教老师电话,不然你不知道该怎么看课。好,今天就到这,我是瑞克老张,关注我,咱们投资的视角,看科技背后的精彩,我们下期见,拜拜。

今天跟你分享一个我最近挖到的神器 linux, 专门给 deepseek 用的,能把 ai 编程的成本直接压到一整不夸张。很多人说 deepseek 便宜,但自己一用账单就爆炸。别怪模型,怪你用的那些通用框架,它们正在背后偷偷烧你的钱。 reseek 是 deepseek 官方文档置顶推荐的,它不做花哨的兼容就死磕 deepseek, 把缓存和推理链的性能全榨干了,正好赶上 deepseek 永久降价, v 四 flash 缓存输入只要两分钱,一百万 toc v 四 pro 也才两分五,官方已经把地板价打穿了。给你看个真实跑出来的数据,单日四亿多 toc, 通用框架烧掉六十一美元, linuxix 只花了十二美元,省了将近八成。为什么通用框架费钱? 因为 deep sec 有 前置缓存,命中后只收一成费,但通用工具每轮都重排压缩,截断缓存,一费折扣全丢。 reisix 的 做法特简单,不删不改,只追加前面内容,一字不动,缓存命中率日常能到百分之九十以上, 极端情况冲到百分之九十九。他有两个大招,第一个是回收二一的思维链,二一的推理过程本来要被扔掉,他抓过来整理橙子目标和执行步骤,精准度直接拉满。第二个大招是成本旋钮,日常写脚本,自动用小模型,几乎不要钱,遇到复杂重构一键切,高性能版本, 性能和钱包两不误。总结一下, deepsea 已经把模型价格打到地板。 reese nicks 就是 那个帮你八美,一分钱都花出十倍价值的工具。别再交智商税了,上手就一心命令 in p x reese nicks 扣了国内直联不用代理,赶紧去试试,把开发成本压到一折,不是口号,是已经跑通的事。

deepsea 又放大招了,开发一个应用竟然只要不到十块钱!一款叫 deepsea t u i 的 神器直接杀进 get 榜第一,为什么他这么火?一句话,他把开发的门槛直接从月薪三万拉到了不到十块。以前你想开发个应用得学编程,买服务器没个几万块根本下不来。现在你只需要十块钱的 a p i 额度,连代码都不用写,直接在中单跟他对话,小白也能上手。 此次开发一个记账插件或者天气,入手成本甚至不到一顿早餐钱。当大家都盯着硅谷的奥特曼 g p t 时,却没发现家门口的 deepsea 已经悄悄把 ai 的 价格战打到了地板以下。它不是在做模型,它是给全球 ai 行业做了一次暴力降本, 同时也是为了证明 ai 的 主权不该只在几家巨头手里。这种技术平权的狠劲才是二零二六年最硬的国产光芒。

最近企业端都在抢着用 deepsea v 四 pro 做生产,高性价比 api 通道去哪找?现在越来越多企业把 deepsea v 四 pro 作为核心生产模型,不管是常文本处理、复杂推理还是智能体任务,它都能稳定扛住高病发业务需求。但不少团队反馈,官方通道不仅额度紧张,长期高频调用下来,成本压力不小, 一直在找靠谱的低价 a p i 渠道。我们平台已深度接入 deepsea v c pro 官方接口,全程直连,无中转数据传输,安全合规调用,颜值低,稳定性强。目前开放专属折扣通道, 价格远低于官方标准价,缓存命中场景,成本更低,完美适配企业高频调用、大规模生产部署需求,无需复杂申请,快速接入即用,支持按量灵活计费,全程无隐藏费用,专注为企业提供高性价比、 稳定可靠的大模型 a p i 服务,助力企业低成本落地。 ai 业务有 deepsea v 四 pro 调用需求,欢迎私信对接!

哈喽,欢迎光临!昨天我花了大半天的时间用了一下 deepsea 的 api, 最后查了一下账单,发现花了六块钱。其实说实话,这个结果还挺让我意外的,其实我切到 deepsea 的 这个 callin plan, 其实我切到 deepsea 的 api 也很简单,是因为我自己买的火山引擎的扣丁 plan 的 额度用完了,因为最近切到了 glm 五点一透,肯用的是哗哗的,所以这个月的额度都已经用完了,就刚好最近 deepsea 在 做促销,大概是二五折,所以就切到它的 api 用了大半天,六块钱,其实也相对比较便宜。结果他帮我解决了一个其他模型并没有解决的方案,并且他帮我补全了相关的单元,测试动力非常好。 这个问题就不是单单的简单的写几行代码,而是要把命令的发送,接收通道的多通道的管理,并且异常处理都处理好。更重要的是,他在写代码的过程当中,帮我补全了相关的侧身力,他 不单单是给我了一个能跑的实现,并且且还帮我把自身侧身力全都补上了,这点对我来说很重要,因为在芯片平台的开发里,代码能跑只是第一步, 我们需要需要做到能验证好维护,并且将来能够扩充相关的功能。我看了一下统计,缓存命中率大概有百分之九十八,这个缓存命中率还是很高的,所以费用其实也不是很高。到他的促销应该是到五月底。 这次体验给我的感觉就是大冒险,已经不单单是能帮我来写代码了,可以参与到工程方案的设计,代码的实现, 还有测试补全这整个一套的流程当中,对于我们做芯片的来讲, ai 并不是替代工程师,而是帮助工程师更快的能够将方案落地,并且能够让它可持续的维护并且扩充功能。 ok, see you next time。

deepsafe 这两天发了一个公告啊,说这个月底结束之后呢啊, deepsafe v 四 pro 的 api 接口价格啊,正式调整为原价的四分之一,就等于打二五折。之后啊,就永久的二五折了啊, 价格便宜了好多啊。但对于 ai 模型来说啊,价格只是一方面啊,最重要的我认为还是信息的真实准确性。

录一个视频讲解一下。呃, codex 如何去接入 deepstack 的 api? 那 网上视频很多啊,然后去讲解,但我认为太麻烦了,就我自己也做了一个。 然后这个比较简单,就是打开我们的这个界面,然后这里就是对应的接口嘛,然后默认的,然后模型就是你用你要用的模型, 比如说你可以打开这个接口,文档有这个 flash p r o 之类的都可以啊,然后你自己去配,我这里是用了 flash, 然后 api 接口就是这里 啊, api 接口就是这里,在这个开放平台这里 api k, 然后你添加了一个 k, 然后添加 k 之后粘到这个界面,粘到这里 啊,然后其他的都不用管了,健康端口就是用默认的这个幺幺四三四就行,你也可以改啊,都可以。然后第一步是什么呢?第一步就是我们在这里,在这里去配置对应的这个模型和 api k, 然后接下来就是启动, 然后我这里已经点点完启动了哈,然后我就可以进入第二步,这里有三步嘛?第一步我们已经启动这个调节了,然后第二步就是打开片号设置,然后我们可以去写入这个文件,那我这里就点击写入文件, ok, 完事。 然后接下来第三步就是健康检查,其实也不用检查。第三步其实就是直接打开 codex 就 可以了, 然后你等那个 codex 现在已经变成了 local breeze 啊,然后问一下 hi, 然后它这边就会,因为因为我没有进入到项目文件啊,然后它就直接是在一个还没有项目文件的情况下,然后去发送, 然后我们看它的一个处理效果是怎么样的?然后你可以看到海尔那个后壳还没有得力啊,然后说明我们已经对接成功了啊?这就是很简单,然后如果你后边不需要的时候,也可以在这个片号设置里,然后去把它给恢复,也都可以啊。

别再说什么 deepsea 永久百分之七十五折扣了,如果这个价格是长期有效的,那它就不是促销,它本质上就是新定价。 说白了就是一句话, deepsea 现在是永久二五折,你算一下就知道了。折后每百万 token 的 输入价格大概是零点四三五美元,输出价格大概是零点八七美元,缓存命中率更低,只有零点零零三六美元。 这个价格有多狠,我直接给你一个对比。如果是一个相对复杂的任务,像 solid 这一档,包括更贵的一些顶级模型,很多时候输出成本一上来就是十几美元,但威斯 pro 呢?输出端大概只要零点八七美元, 也就是说,它不一定是最强的,但它真的是便宜太多了。所以我一直觉得很多人天天吐槽 v 四 pro, 说它比不过更强的那些模型,没有超越这个,没有追上那个。但问题是,它的价格可能只有人家的十五分之一,甚至三十分之一,那它的定位就非常清楚了。 你不要指望他在所有的场景里都能当最终的决策者,但你完全可以让他先把那些重活、脏活累活先干掉。比如说前期的信息整理,大批量的代码初审,基础性的问题排查,还有第一轮的草稿和执行,这些活先交给他。等到了真正关键的节点,比如要做最终判断了,要挑核心问题了,要改关键代码, 这个时候你再把更贵更强的模型派出来,这才是最合理的打法。说到底,模型竞争不是只看谁绝对最强,而是看谁能不能卡住成本和质量的。帕累托前沿什么意思?就是在这个价格代理,如果我的能力最强,那我就有意义 是一定非得是全世界第一才有价值,而是你要在自己的成本区间里做到最优。谷歌其实也在干一样的事,像他前几天推出的 flash 三点五,本质上也是这个思路。所以你现在再看 deepsea 这一招,意思就很清楚了,他不是去正面应聘最贵最强的旗舰模型,他打的是另外一条路, 就是用十五分之一的输入价格,甚至三十分之一的输出价格去抢那些对成本极其敏感但又需要大规模调用模型的场景。所以这波不要再理解成打折促销了,这更像是 deepsea 直接掀桌子,我不跟你比,谁最贵我就比谁在这个价格下最能打。

今天 deepsea 官宣了两件大事,足以让每一个 ai 使用者都热血沸腾。第一个, deepsea v 四 pro 模型 api 价格正式调整为原定价的四分之一,这意味着什么?可以让所有想学习 ai, 想使用 ai 的 人都能用上便宜好用的大模型。 我测试下来的体验是, deepsea v 四 pro 在 中文的处理能力上真的是处于这个地位,很厉害。 第二个消息更炸裂, deepsea 创始人梁文峰官宣要实现通用人工智能的目标,也就是所谓的 agi 时代。很多人可能不了解当前 ai 与 agi 的 区别, 我给大家详细的说一下。 agi, 也就是通用人工智能,它主要有四大能力,第一,能在任意治理任务上达到或超越人类的水平。第二,具备自主学习推理规划能力,无需针对每一个任务重新训练。 第三,能跨领域迁移,就是学会编程的知识,可以帮助他理解生物学。第四,具备原认知,知道自己不知道什么,能主动去学习当前 ai, 也就是所谓的弱人工智能。 他只要有以几下以下几大特性,一,只能在特定任务上表现出色,比如说写代码、生图等。第二,需要针对特定的每个任务单独训练或提示。 第三,没有真正的理解,本质上就是模型匹配与统计预测。第四,不能自主设定目标,也没有迁移能力。 比如 alfa go, 它只能下围棋,但不会叠衣服。 gbt 能写文章,但不能自己决定。今天我要想去学习物理学。好啦,今天的分享就到这里,感谢观看,希望能对大家有所帮助。

朋友们,今天聊一个重磅消息, deepsea 官方刚刚宣布, v 四 pro 模型的 api 价格将永久降至原价的四分之一。 没错,不是限时促销,是永久降价。之前几个月的二点五折优惠活动会在五月三十一号结束,但价格不会涨回去,直接定格在这个史上最低价。这意味着什么? 大模型的 api 调用成本正在逼近地板价免费时代,可能真的不远了。我们来拆解一下这个公告。首先,时间节点很明确, 五月三十一号,持续好几个月的二点五折优惠活动正式结束。但关键来了, deepsea 选择把优惠价直接固化为永久定价。 这意味着什么?意味着他们不是在用现实低价拉新,而是对自己的成本结构有绝对的信心。 原价的四分之一,这个力度在全球大模型 api 市场上都是史无前例的。对于企业用户来说,以前用大模型可能要精打细算省着花,现在经济门槛儿几乎没了。而对整个行业来说,这标志着价格战进入了一个新阶段, 不再是小打小闹的九折八折,而是直接打到骨折。这次降价最亮眼的数字是这个, 零点零二五元每百万 tokens。 这是缓存命中时的输入价格。什么概念?假设你在做一个 reg 知识库应用, 用户反复查询相似的文档内容,大部分请求都会命中缓存,每次调用的成本低到几乎可以忽略不计。智能客服、文档分析、合同审查这些场景,天然就有很高的缓存命中率。 deepsea 这一招非常聪明, 表面上是降价,实际上是引导开发者优化架构,多用缓存,最后形成双赢。 对于真正在企业级场景里跑过大模型的人来说,这个价格意味着从试试看到全面铺开的最后一道障碍被拆掉了。配合降价, deepsea 也调整了,并发现制 v 四 flash 给到五百, v 四 pro 直接拉到两千五百。 这个数字什么概念?绝大多数中小企业和个人开发者根本摸不到这个天花板,超过限制会收到四百二十九报错。但说真的,两千五百的并发症,对于百分之九十九的场景来说都绰绰有余了。 更值得关注的是这背后的信号。从去年开始,国内大模型厂商就在打价格战,一轮接一轮地降, 但这次不一样,永久四分之一这个力度说明 deepsea 不是 在玩营销套路,而是它们的推理成本真的降到了可以支撑这个价格的水平。这对于整个行业来说意味着什么? 意味着大模型正在从高端服务变成基础设施,就像云存储、 cdn 一 样,越来越便宜,越来越普及。对开发者来说,这可能是最好的时代。 最后一个问题留给大家, deepseek v 四 pro 永久降价到原价的四分之一,缓存命中场景低到零点零二五元每百万 tokens, 这个价格已经无限逼近免费了。那么问题来了,你觉得大模型 api 会迎来完全免费的那一天吗? 是会像移动流量一样,三年内就无限逼近零?还是说,模型推理的硬件成本决定了它永远有个底线?欢迎在评论区留下你的看法,我们下期见。

就在刚刚, deepsea 官宣旗舰 vs pro 模型 api 永久降价到原价的四分之一,之前的二点五折促销直接变终身定价,把大模型价格砸到了全球地板价。 而也就在昨天,全球头部算力租赁商 nebius 正式宣布,六月一日起,全系列 gpu 租赁价格全面上调。 h 一 百单卡小时价从二点九五美元涨到三八十五美元,涨幅百分之三十一。 b 两百涨幅也高达百分之三十。 全网都在吵,这完全是矛盾的啊,大模型都卖成白菜价了,算力怎么还在涨?是不是算力租赁行情要崩了? 别急,看完我这期视频你就懂了。我很负责任地告诉大家,这两件事不仅不对力,恰恰是 ai 行业进入真正爆发期的正向循环信号。 deepsea 越降价,算力的涨价潮就越停不下来。 这根本不是算力行情的终点,而是整个行业第二次周期行情的起点。先给大家掰透两个核心事实, 这次 deepsea 降价后,缓存命中的百万 tokens 仅需零二十五元,综合调用成本只有 gpt 五点五的四十分之一, cloud 的 七十分之一,直接击穿了全球大模型的价格底线。 而算力端、高端 gpu、 hpm、 高宽带内存、液冷机柜乃至制算中心电力配额全是稀缺品,供给扩张周期长达十八到二十四个月,完全跟不上需求增速。 国内云厂商也结束了烧钱补贴阶段,进入盈利周期,全行业涨价是必然结果。很多人看到这就蒙了,上游算力天天涨,下游大模型却往死里降, 这不是赔本赚吆喝,大错特错,它根本不是亏本打价格战,而是靠技术革命重构了成本逻辑。算力涨价的影响完全被技术进步抵消了。 deep seek 敢于降价,是因为有真底气。 一靠自研稀疏注意力 k v 缓存压缩技术,他把单 token 算力消耗做到同行的四分之一,同一张 g p u, 别人跑一百万 token, 他 能跑四百万、 百万上下文场景下推理计算量仅为上一代百分之二十七。说白了,算力租价涨了百分之三十,他的单位服务成本却降了百分之七十五,哪怕降价到原价四分之一,利润反而更高,这就是技术带来的硬底气。 第二,他早已和头部算力厂商签了一到三年长协,锁死租价,市场涨价根本影响不到他。 加上前期促销让日军 a p i 掉用量破四二亿次,硬件折旧、人力等固定成本被海量调用,贪薄到几乎可以忽略。第三,这是赢者通吃的战略定价, 用全球最低价抢全球开发者和中小企业客户,用户量越大,模型迭代越快,成本越低,形成正向循环,哪怕单 token 利润薄,总利润只会越涨越高。 而我说 deepsea 降价,不仅不会让算力降价,反倒会助推其继续涨价。三个底层逻辑,听完你就彻底懂了。第一个逻辑, 降价绝非算力过剩,而是直接打开十倍需求空间。大模型调用门槛打下来,原本因高成本放弃的中小开发者企业需求会全面释放,价格降一倍,需求涨十倍。 这就是经典的杰文斯辩论。技术提效不仅不会减少资源需求,反而会引爆总需求。 此前算力需求只是大场训练的一次性消耗,接下来将是全球推理业务二十四小时不间断的指数级刚性需求,直接给算力租赁打开了十倍的市场空间。第二个逻辑,算力租赁彻底告别炒卡时代,进入效率为王的真业绩周期。 此前行业逻辑是拿卡就涨,本质是赚倒卡差价。但 deep six 的 核心优势不是卡好,而是把同一张卡跑出了四倍效率。接下来,大模型选算力不再只看有没有卡,而是看能不能降本提效。 行业即将大洗牌,只会转租,赚差价的小厂商会被淘汰,能做集群优化、深度绑定大模型的头部公司将拿下更多长单行情,从炒卡的稀缺性转向炒服务的业绩兑现。 第三个逻辑,也是最核心的,这是国产算力正式崛起的标志性拐点。 deepsea 敢降价,最大底气就是国产算力的成熟,其核心集群大量采用华为升腾芯片,靠国产架构优化跑出了比英伟达更高的性价比, 直接打破了国产算力只是备胎的误区。接下来,大模型订单会加速向国产算力集群转移,国产算力租赁将成为赛道最强主线运营商和头部,国产算力厂商将吃到这波国产替代的最大红利。最后给大家做个终极总结,把这个看似矛盾的循环彻底讲透。 deepsea 技术提效,所以敢降价,降价带来需求爆炸,反过来对算力的需求就会越来越大, 算力的稀缺性就会越来越强,涨价自然停不下来。这件事的本质是, deepsea 把 ai 从大厂的奢侈品变成了全行业的水电煤,当所有企业都能用得起 ai 的 时候, 对算力的需求只会像洪水一样涌过来。算力租赁的行情远没有结束,只是接下来它会从炒概念、炒稀缺转向炒业绩、炒效率、炒国产替代。真正有技术、有稳定客户绑定、有国产算力布局的公司,才会在这波分化里走出真正的长牛。

你知道吗?就在今天, deepseek v 四 pro 直接官宣 api 永久降价,不是限时促销,是长期降价。同时 api 还完成了输出提速、服务扩容,默认支持五百并发,企业还能申请更高规格。店内人士称,这次降价完全是改写行业的节奏, 输入缓存命中价从零点一元百万, tokens 暴跌至零点零二五元。缓存未命中价从十二元砍到三元,输出价直接从二十四元降到六元,整体价格直接打至原来的四分之一。 别觉得这只是数字游戏,在真实开发里,长上下文读取代码库全局分析, agent 多轮自动执行,都是 tokens 消耗大户,过去成本高到个人和小团队根本玩不起。现在 deepsea 把价格打下来,这些高阶 ai 开发场景直接变成普通人也能轻松承担的玩法。性价比碾压之下, 开发者用惯 cloud openai gemini 的 习惯,说改就改。国内靠 a p i 收费的模型厂商更是直接面临巨大市场压力。有人会问,这么低价是烧钱补贴吗?完全不是! deepsea 创始人早明确按成本定价,不贴钱不赚暴利。降价的核心底气是下一代模型架构加顶级工程优化,大模型处理长上下文越长显存压力越大。有博主硬核测算, 一百万 tokens 上下文 g l m 五要六十 gb, 显存 q n 三要八十九 gb, 而 deep seek v 四仅需五点四八 gb。 表面是架构优化,本质是大幅降低对高端显存、 顶级 gpu、 海外 c u d a 生态的依赖,这才是真技术降本。但你以为他只想做个便宜的底层 api? 太小看他的野心了。 deep seek 的 真正目标是做中国版 cloud code。 最近, google c o o sundry 在 接受采访时承认, google 目前在 agencoding, 也就是工具调用、指令跟随和长周期任务上确实还有差距。他提到一个极其核心的词,数据流。 ai 编程工具必须要进入终端,看到开发者如何提出任务、如何修改、何时拒绝,以及测试的真实日制。有了这种数据回流模型,才能不断迭代。 然而, deepsea 早就摸透了这个关键,最近疯狂招人专门做 agent 的 算法研究员、产品经理,全力搭一套叫 cold harness 的 系统。 行业大佬一句话点透模型是 ai 的 大脑, harness 就是 ai 的 手脚,大脑负责想方案,手脚负责把方案落地到真实开发里,俩家一起才是真正能用的智能 agents。 为了把这套手脚系统做稳做快, 他们还挖来了大神崔天意,在顶尖量化公司干了九年,拿过六次 a c m 亚洲区金牌。量化交易最看重低延迟,全自动辅,刚好和 ai 编程 agent 的 需求完美匹配。讲到这儿,这场十万亿 ai 大 棋局的完整套路, 你一下就看明白了。先用超低价 e p i 把海量开发者全都吸引过来,再靠超低缓存成本让 ai 智能体跑起来,成本极低,门槛大降。接着用 cold harness 这套执行系统,让 ai 真正扎进企业的真实开发场景里。 最后,真实工作流的数据在反哺模型,让 ai 越学越聪明,越迭代越强大。今天,中国 ai 技术的飞轮已经全速启动,这场大模型的颠覆性变更,你怎么看?评论区留下你的看法,关注我,带你一眼看透科技圈最硬核的底层逻辑!

开源让 deepsea 一 炮而红,但也可能正在成为它最大的枷锁。数据很残酷,月活暴涨六成多,算利只增百分之八八倍的供需缺口。本月三次档期只是开始,如果不解决,供给端用户跑得比服务器修复还快。 更反直觉的是, deepsea 不 但没涨价缓解压力,反而把 v 四 pro api 永久降价七成五。 逻辑很清楚,先用低价锁定开发者生态,再用规模去谈判更好的芯片和算力价格。底牌也在不断翻开,估值冲到五百亿美元,内蒙古五十亿,算力中心在建,华为升腾芯片深度适配 开源路线的底层逻辑是模型开源、算力自建,生态开放。但这三步必须同时走通。 更大的问题是,整个 ai 行业都在看这个实验极致效率到底能不能跑赢暴利堆算力。如果 deepsea 撑不住开源路线就真的到天花板了。觉得开源路线能走通的扣一,觉得迟早要转闭源的扣二。我是叶哥,专注 ai 效率。