粉丝50.1万获赞294.6万

d c 真的 太炸裂了,二十四日才发布的 v 四 pro 版本,接着二十六日就打二点五折,什么概念呢?上一期我有讲到拿五十码内强先才跑了一千六百万 toc 就 消耗完了。 今天我又测了一遍,跑了六千七百万 toc 才花了四块多,就这个价格,对标两百一个月的扣定片都毫无压力。关注我强,先体验 aigc 不 迷茫。

deepsea 直接把模型价格打成白菜价了。 deepsea 宣布,旗舰模型 v 四 pro 的 百分之七十五降价将变成长期价格。也就是说,这不是临时促销了,原本到五月底结束的二点五折优惠,后面会直接变成正式价格。按照 deepsea 官方定价, v 四 pro 现在的输出价格 是每百万 tokens 零点八七美元,输入价格更低,如果缓存命中,每百万 tokens 只要零点零零三六二五美元,这是 什么概念?对比一下, openai 的 gpt 五点五和 cologne opus 四点七缓存输入读取价格都是每百万 tokens 零点五美元,而 deepsea v 四 pro 只要零点零零三六二五美元,也就是说,它大约只有 gpt 五点五和 cologne opus 四点七的百分之零点七三。再看输出价格, gpt 五点五每百万 token 三十美元, cologne opus 四点七是二十五美元,而 deepsea v 四 pro 只要零点八七美元, 这不是便宜一点,而是直接把高频调用模型的成本打到了另一个档位。以前,很多开发者想用强模型做 a 阵和写代码跑长任务,最大的问题不是模型不够强,而是成本太高,尤其是 a 阵太累,应用一次任务可能要反复调用模型、 读文件、写代码、调用工具。模型越强,用的越多,账单也越吓人。而 deepsea 这次把 v 四 pro 的 低价固定下来,等于是在告诉开发者,你可以长期按照这个成本来做产品。 这件事的重点不只是便宜,而是 deepsea 正在改变国产大模型的价格锚点。过去大家拼参数、拼榜单、拼发布会,现在开始拼,谁能让开发者真正用得起,谁能让 ai 应用大规模跑起来? 模型能力当然重要,但如果价格太高,很多应用只能停留在 demo 价格降下来之后, ai agent、 代码助手、企业自动化内容工具才有可能真正进入高频使用。 所以这次 v 四 pro 永久降价,不止是一次价格调整,它更像是国产大模型价格战进入新阶段的新号。未来 ai 公司拼的可能不只是模型有多强,还要看谁的模型既强又便宜,还能稳定供应,这才是开发者真正关心的东西。欢迎在评论区说说你的看法。

本来今天不打算更新内容的,但看到 david 的 刚刚得到 david 最新的一个降价的一个消息啊,其实心里还是挺震撼的,又一次震撼到我了。嗯,大家不知道有没有看过他公众号里面有一句话,我觉得跟他现在做事风格如出一辙, 这句话是这样子的,这样子说的,不做重用的事情,带着好奇心,用最长远的眼光回答最大的问题,这次定价的一个决策,也是可以看得出他们的一个行事风格。 短短的一段时间里面呢,价格迎来了两次的关键调整,先是放出了限时二点五的优惠,原本到期时间马上就要到了吗?五月三十一号就快要恢复原价了。就在大家都觉得马上 这个羊毛马上就要薅完了,就要结束的时候,官方又重磅表态了啊,不能说是重磅,对我们来说的话是是比较重磅的,他这个呢,只是在官网上面简单的改了一下这个文案的一个描述,根本没有做宣传,很低调,所以说他这个 现在是把那个折扣固定下来了,永远使用这个位置的一个角度来讲,变化感觉很直观, 以往高端的一个模型,资源大多数都掌握掌握在那个大企业的一个手里,跟开发者小团队调用的时候,多少都会有点会考虑这个成本,没办法放手放开手脚去调试跟验证。 现在在这个价格进一步下探,明显的变化就是技术平权又往前推进的一步,普通从业者也从没有压力的,也可以没有压力的去使用这个他现在的这个万这款机械模型, 所以说高端的 ai 资源的使用壁垒啊,明显在整个行业的格局来说的话,是被弱化了。行业简单层面来看的话,开源的时间,开源的时代啊到来的同时, 门槛就进一步再宽松放松,这次调价的话,也是算是带动了整个市场的一个良心的一个调整,对其实对我们实际开发的人来说的话,实实在在的是减少了这个成本的一个顾虑,也也能让我们更加从容的去探索各种可能性。

ai 圈最狠价格屠夫诞生! deepseek v 四 pro 这次永久降价百分之七十五,与其说是促销,不如说是一次彻底的战略性新定价。每百万偷看输入仅零点四三五美元人民币三元,输出零点八七美元人民币六元,缓存命中低至零点零零三六美元。两分五厘 什么概念?你买瓶可乐的钱能跑几十次文档?总结对比一下, cloud opus 四点七,每百万输出要二十五美元人民币一百八十元, g p t 五点五要三十美元人民币两百一十元,而 v 四 pro 只要零点八七美元人民币六元,便宜了整整三十倍。 有人诟病他打不过其他模型,但他其实是同价位全能王者,日常退利、代码审查、批量翻译等能力完全够用。 而且 ai 竞争早已进入帕累托性价比时代。什么意思?你不需要让一个模型包打天下?日常代码审查、批量翻译、文档预处理,这些累活交给 v 四 pro, 成本几乎可以忽略,等到关键攻坚节点,再取出 g p d 五点五或克拉 opus, 精准收尾。 这套流水线打法就是成本和质量的最优解。谷歌 gemini 三点五 flash 走的正是同一条路,但 v 四 pro 比它在便宜三到十倍。 deepseek v 四 pro 凭极致性价比,成为开发者与企业降本的刚需,彻底重塑 ai 调用逻辑。

朋友们,这下其他模型厂商是真的天塌了,梁文峰的温情现在真的还不完了。就在昨天, deepsea 官方宣布, v 四 pro 的 价格永远降至首发价的四分之一,也就是原先持续一个月的 v 四 pro 二点五折优惠,现在变成了 永久优惠。所以现在 v 四系列模型售价是这样的, v 四 flash 和 v 四 pro 缓存命中的情况下,输入每百万 token 仅需两分钱和 一坤分。朋友们,两分钱!两分钱!两分钱呐!哪怕是缓存未命中的情况下,百万输入 tiktok 也只需要一块钱和三块钱,输出百万 tiktok 更是低到了两块钱和六块钱。 无敌了!朋友们,这是真的无敌了! dippec 甚至他不收你创建缓存的钱。如果你没用过多个品牌的模型,你可能不知道这个价格是什么概念。我来选一个性能比较接近的,像 g l m 五点一的价格,它是这样的, 呃, cooling plan 那 玩意儿永远是放货就秒空,我从来没有抢到过。这个月我做一个小项目,用了一下小米的 miimo v 二点五 pro 的 模型,性能确实要比 deepsea v 四 pro 要好一些,但价格几乎是 deepsea 的 十倍左右。 这个月我在 deepstack 上用了大概七亿的 token, 花了一百二十二块钱,核算一下,差不多是一亿 token 十七块钱。但是在小米这里,一亿 token 就 要花掉我两百块钱的添加,在性能差距只有百分之十左右的情况下,价格差距却拉出了十倍。 怎么选,还需要我教各位吗?而且各位注意,小米 v 二点五模型的上下文长度只有区区两百 k, deepsea 是 e m。 考虑到实际可用的情况下, deepsea 的 可用上下文也是小米的五到六倍。 这个时候就有人要问了啊,主播主播,价格定这么低,那个 deepsea 他 们真的能赚钱吗?这个你别管,你梁文峰叔叔每个工作日上午九点半开始,就会自动的有大量的钱刷新进他的钱包。要我一句话评价当前大模型市场的情况就是,跑赢 deepsea 没奖励,跑输了有惩罚 啊。这个时候我知道就会有朋友要说了,主播主播,你扯这些都没有用,它的性能就是不如 cloud, 就是 不如 g p d 的 新模型啊。我知道你很急,但你先别急, 当 deepsea 把价格定到这个程度的时候,就意味着它和你提到的那些模型已经不能算是同一类同一个定位的产品了。我觉得可以这么说, 如果你的工作需要你使用最先进的模型,我也充分认同您的时间相当相当的宝贵啊。那你应该毫无疑问的去选择 cloud 或者 gpt, 五点五就行了,你根本不需要来关注或者踩脚 tpc, 这是毫无意义的。您的时间是十分宝贵的。 很默认选择最先进的模型就行了,这是一个有多大脚穿多大鞋的事情,有多宽屁股,穿多宽裤子,这种情况下你是不需要考虑模型价格的。 当你的工作对模型这个能力的需求,它超越了 devic v 四 pro 的 时候,你的工作创造的价值或者给你带来的这个收益应该是要远远高于你使用最先进的那批模型它的成本的。你都需要使用最先进的模型来辅助你的工作了, 那你创造不出超过这些 token 价格的那个价值。这是一个很奇怪的事情。你来批判 devic 的 性能,那是没有什么意义的。 如果你还需要考虑价格,那说明你对高性能模型的需求是伪需求。单纯讨论模型的性能没有意义,单纯讨论价格也没有意义,但是你组合起来看才有意义。相应的啊,如果你的工作场景对价格很敏感,那说明你这个工作场景 对模型性能的需求也没有到非最先进不可。我想不出是什么场景需要你使用最顶尖的模型来辅助你,而你又创造不出什么价值呢?嗯,超级有钱,想找 ai 谈谈心的朋友们。

眼下, ai 圈迎来了重磅消息, hiphop v 十 pro 重磅官宣调价,直接将常规定价压至原价的四分之一,原本仅持续到五月三十一日的二点五折优惠不再限时,活动结束后,该折扣直接转为常态化售价。 在别家模型接连涨价的当下,他却让你给用户先看一下具体收费标准。以百万支付来算,全新五副用内容的输入费用约三元,内容生成输出六元。横向对比热门的 cloud、 索尼十点六,这是差距悬殊。 对方输入单价约二十点五元,输入单价约一百零二点五元,换算下来,输入价差六倍,输出价更差到了十六倍。要清楚,这并非短期福利,而是官方敲定的常规售价。行业普遍涨价的大环境下,这款模型直接定下超低价位,长期稳定不变。 凭借开元赛道顶尖的综合性能,搭配这般实惠定价,竞争力十分突出。入球所此方所诚意满满,也让全球 ai 使用者包括我在内都享受到实实在在的好处,要给他点个大大的赞。 不妨一起探讨一下,脂肪调教过后,其余厂商是否会跟风一下调教位,尤其是现在国内特别难抢,一秒就售空的那家,你觉得他扛不扛得住?评论区里聊聊你的看法吧,我是陈元万宇,陪你一起看懂人工智能,下期见,拜拜!

呃, hello, 观众朋友们大家好,我是神奇的录音。那么相信朋友们等了很久了,这个 deepsea v 四出来这么长时间了,也没有一个好的本地的部署的方案, 然后大家也想在 windows 下能不能便捷的操作一下呀?我们能不能用上这个这么好的东西啊,尤其是现在这个内存又降价,这个东西又便宜 deepsea v 四呢?现在网上这个模型呢, api 的 价格可能后续又比较贵,那现在有没有更好一点的解决方案能在本地跑 v 四和 pro 呢?那么今天呢,我们终于是拿出了这个方案,你没看错啊,最低仅需幺幺九九九元,你就能在本地部署 deepsea v 四与 pro, 注意,这都是满血版的, 那么视频开始前有需要的话,请看一下我们这个右下角啊,然后呢,这里边就给大家看一下我们这个给大家今天带来的这三套方案吧,这些东西叫左边这两套啊,如果大家是我们这个老朋友的话,熟悉这个东西叫 k n 一, 那现在它为什么变成 k n 一 点一了呢?是因为我们对它进行了一次小幅的改动更新,那这个更新呢,不影响它这个性能, 我们只是优化了它的这个性价比。那左边是幺幺九九九元,是一百二十八 g 的 内存,中间是幺三九九九元,是二百五十六 g, 右边是五百一十二 g, 是 二五九九元。这三套都能跑 deepsea v 四, 但是朋友们知道,呃,这个 deepsea 除了 v 四普通版以外,它有一个 pro 版,那么我们可以看到一百二十八 g 呢,它只能跑普通版本的,那么 deepsea v 四 pro 呢? 是的,你没看错,中间二百五十六个 g, 幺三九九元,你就可以在本地跑了,然后右边是二五九九元,你就能跑质量更好的 v 四 pro, 那 么他们的速度呢?都差不多十一到十四,头尾每秒的这样的一个速度,在本地就能完美的运行 deepsea 的 最新的模型, 这里可以给大家看一下实际演示,这是我们幺三九九九元的机器跑 deepsea 微四的速度,十二 t 十二点五 t 左右。 那么我们图除了这个随机部署 deepsea v 四 pro 这个模型以外,我们还会随机附赠图形化的 open cloud, 然后我们自己训练的悟空这个大模型。这个如果啊大家不知道这是什么新朋友的话,可以看到往期我们视频当中会有解释。 还有我们附赠一个跟随 openclaw 使用的数据保护工具,一旦你的龙虾误删除了你机上的任何一个文件,通过这个数据保护可以方便的去找回,那么我们图形化的 openclaw 就是 这样的一个界面,大家可以看一下,非常方便。 那么我们重点介绍一下啊,这个 deep 四 v 四 pro 是 怎么实现的?我们首发实现了 windows 系统下的支持, 无需使用 linux, 全部都进行 windows 下进行操作,这个是目前全网范围内的首发,就是在 windows 系统下提供了 deepsea v 四与 v 四 pro 的 支持。第二, 我们根据 deepsea v 四官方技术指南的白皮书,结合华为的 s i n q 量化方法,成功地把 deepsea v 四 pro 运行在了二百五十六 g 的 运行内存下,且二百五十六 g 这个量化度我们做到了八点二以下, 大概是七点五到七点九,随着任务的你的测试级的不同,他的困惑度啊可能会不一样,但是平均都是在八点二以下的。 五百一十二 g 那 款机器的困惑度可以小于零点三,就是一个几乎无损的状态,并且我们还有纯显存部署的方案这套机器呢,大家再等一等,我们会直接发布这套机器啊,最低可能两万元,一万多块钱 就能实现二十五 t 每秒的速度,就是纯显存部署 deepsea v 四的方案,这个大家可以期待一下,如果就是大家,呃,但是这套机器我先跟大家说,可能会开发的时间比较久一些,目前还不知道什么时候能出来。如果大家觉得就是十多 tokens 每秒,这个速度还可以 在本地,因为我们这所有的机器,目前 k n e 这几款,它的推理时的功耗是二百八十八左右,也就是说,呃,它的费用是要比线上的 a p i 低了大概百分之七十左右。 呃,如果是算上 v 四 pro 的 api 的 话,那更是它的价格,如果算进电费的话,只有线上推理的百分之十都不到这样的一个价格。所以说,如果大家觉得这个速度可以在性价比每生成一个 token 的 性价比这一块,这个机器上是完全没有问题的。 那么我们这里重点讲一下这个 snq 量化是什么。首先这个大家要知道哈,如果你们就是没有了解 snq 是 什么,你们去搜这样的一篇文献, 在网上搜就行了, s m q 一 种这个低精度的,这个给低精度本地模型的一个不需要校准的一个量化的一个方式。这翻译过来大概就是这样,你搜这个,这个这一大串英文就可以了,它就会告诉你这个东西是什么,然后这东西是华为研发出来的, 它的特点是呢,无需校准数据,就直接可以对模型进行量化了,并且可以大幅降低模型的显存需求。 并且呢它与比如说常用那些量化工具包相比,除了无需校准以外,还有一个比较好的一点,就是它可以大幅降低量化引起的浑厚度提升,但是是是模型架构不同而定的,什么意思呢?不同的模型被量化以后的结果不一样。那么这次 deepsea v 四 pro 呢? 我感觉是 deepsea 跟华为的官方做了深度的优化,它非常的适合用 s n q 进行量化。 那么呃,它量化的结果刚才已经向大家这个展示了,我们就不赘述了,那么我们这里说呢,它其实也可以 兼容常见的一些格式,比如说什么千问呀,还有什么呃, g u f 格式,它反转成 g u f, 这都是支持的。华为已经放出了相关完整的这个工具包,在 github 上买,这个有兴趣啊,大家可以搜一搜,我觉得这个技术挺好的,可能未来国产的一些大模型也会适配这个技术, 那么呢,有没有更加有性价比,或者是啊一些其他的方案呢?这里也给大家展示一下。这是我们 k n 三的机型,那么 k n 三呢?现在降价了,他不是这个价格啊,不是一万三和两万块钱,这个你们去问啊,看右下角,你们去问一下他现在是什么价格会比这个便宜很多。 这个两套机器的速度,还有这个运行内存都标注出来了,有需要的话可以看一下这两款机器全部都支持 v 四 pro, 然后呢,有没有更有性价比的机器朋友们,那当然也有,我们还有 k n 三点五这两套机器,但是值得一提的是,这两套机器目前 v 四 pro 的 这个知识还没有完全做好,我们只是现在先给大家这个画出一个这个 呃,我们这个路线图,那么未来在一周之内,这两套机器的这个部署就会做好。那么如果追求性价比在五千元、八千元左右的这个机器的这个朋友们,想要这一个价位的机器,那么你们可以看看这两款机器,它这个速度是四到七 top, 什么这个稍稍慢一点 啊,他们满载的推理功放二百瓦左右,反正就是怎么算都是比线上 a p i 要便宜的。这是我们今天这个带来的 deepsea v 四本地部署,注意,我们是 windows 系统下,我们永远 不会对普通用户的机器上预装 linux, 永远也不会让小白就学怎么用 linux, 我 们起步直接装的就是 windows 十一,并且我们保证这个速度是过关的,我们的质量也是过关的。 同时我们还会随机附赠 opencloud, 还有我们自己训练的一些大模型,还有一些未来这个模型的这个支持和更新,这个都是都 free of charge, 如果你们购买了机器的话,我们是免费赠送的, 是终身提供的软件这个帮助与更新的知识。那么如果大家觉得我们这个做的好的话,给我们一箭三连吧,这期视频呢,我们多更了一些,呃,主要原因还是 deepsea v 四本地 windows 的 支持稍稍有点难做,但是也还好。 再一个就是我本人感冒了,出不了视频,录不了视频这个,所以拖了大概有一周多,那么现在呢?呃,赶了一个五一的这个末期那,呃,可能明天大家就要就是结束五一的假期,然后回到自己的这个工作与生活当中,也希望大家呢, 呃,在看这个 deepsea 的 v 四这个 pro, 我 们出了一些这样的好的机器,为大家可能带来一些工作上啊,包括生活上的一些新想法,或者让他们成为你工作上的一个新的一个助手,来减轻你平时工作上的一些麻烦啊,或者是把一些东西做成自动化的, 成为你的好助手啊,也是能让你平时减轻工作负担的一个重要的一个途径吧。我觉得现在 ai 对 我们最大的意义。 然后呢,如果未来 deepsea 还有这个 g l m 啊,还有 kimi 啊,他们有进一步的更新,我们也会进一步的这个 放出支持的视频。那么大家都知道现在有一个叫 kimi k 二点六,那么这个模型是什么情况呢?我们下周的视频会跟大家说一下这个模型呢,呃,它不是那么的十全十美,但是我们还是会做一期它这个视频,这是我们下周可能会要做的这个东西大家可以跟进一下就行了。 那本期视频就到这里,喜欢我们的频道就点点关注,然后有需要的话还是看一下右下角啊,这个给我们一键三连,那本期视频就到这里了,谢谢朋友们。

给大家看一下 deepsea 的 之前 v 四 pro 的 价格是 两点五折,然后当前当时的活动是说到五月三十一号结束,对吧?六一之前结束,然后大家可以看到后面又出来一条新的规则, 正式调整为原价的四分之一,也就是说它六月一号活动结束之后,它的正式的价格也将变成原来的四分之一,也就是持续之前的活动。 我们之前是两点五折,也是四分之一嘛,原价一个十二的,一个二十四的,对吧?折扣之后是三块和六块, 然后它这个活动结束之后,它将调整为原价的四分之一,同样也是同样道理,就相当于往后的话 deepsea 它的 pro 啊这些它的价格持续保持 三元和六元的价格,大家如果感兴趣的话可以去试一下,大家有什么想相关的可以在评论区里面留言。

欢迎收听我们的播课! deepsea v 四 pro api 价格大跳水,直接从原价降到了二点五折,这个是一个永久的降价, 我们会给大家聊一聊这个价格到底是怎么调的,为什么会有这个降价,以及这个降价对整个行业会带来什么样的影响?那我们开始咱们先来聊第一部分是这个价格调整的详情, 咱们直接开门见山。就这个 deepsea v 四 pro api 它这个价格到底是怎么调的?它新的政策是说它这个价格是永久的降到原来的四分之一,比如说原来你这个输入 缓存命中是零点一元,每百万 tokens 现在就是零点零二五元,那如果说你这个缓存没有命中原来是十二元,现在就只要三元,输出原来是二十四元,现在只要六元, 这个幅度真的很大是,而且这个价格已经比市面上其他的同类的产品都要低很多了,就你用起来会便宜很多。对这个降价对于不同的用户场景到底意味着什么?比如说你是一个创业公司,或者说你是一个独立开发者, 你现在用这个 api 去做一些试验,或者说去做一些小型的项目,你会发现你的这个门槛一下子就被拉低了,你原来可能很紧张的去算着我这个钱怎么花,现在你就可以更大胆的去尝试一些新的点子。对, 确实对于创新团队来讲真的是一个及时雨。对,而且已经有很多这种做大流量的这种业务的公司,他们也在算这个价格调整之后,他们可以省下一大笔钱,他们就可以把这些资源再投入到产品里,或者说投入到市场里去,更快的拓展自己的业务。 为什么 deepsea 可以 做到把价格压得这么低,就是远远低于国外的同类产品呢?这个其实背后的原因是因为他们有自己研发的这种稀疏注意力架构, 还有就是混合专家模型,这两个东西就使得他们的这个模型推理非常的高效,再加上他们对于国产的这种算力芯片的深度适配,整个的这一套组合权下来,就让他们的成本极大的被压缩了,所以他们可以把这个红利让给用户。 那我们接下来聊一聊降价背后的逻辑。技术层面想问一下就是 deepsea v4 pro 它是怎么做到大幅降低这个推理成本的?就是这个这一代的模型,它用了它们自研的这种稀疏注意力的架构,把这个计算量压缩到了上一代的百分之二十七, k v 缓存的这个占用也缩小到了原来的十分之一,就这两个就直接把掌上下文的推理效率拉上来了,听起来像是一次底层的革命,没错,而且他们还用上了这种混合专家模型,然后加上这种 f p 四的这种低精度的计算, 配合上他们自己的这种融合算子以及这种流水线的调度,让整个的推理的过程不仅算的快,而且还可以非常好的去利用这种国产的芯片,就比如他们和升腾的这种超节点配合,可以做到几乎两倍的这种加速, 所以实实在在的把这个成本给压下来。对,所以说 deepsea v four pro 这个降价到底是反映了一个什么样的市场策略?这个其实就是他们在趁着自己技术领先的时候, 直接就把这个价格就定到了一个别人很难去跟的一个位置,同时他们也用这种永久降价的这样的一个方式去打破了大家对于价格回调的这样的一个顾虑,所以会让这个行业的定价权 就彻底的倾向了高校的一方。那其他那些还在依赖着传统的这种架构和高成本的这种厂商,他们就只能要么就是跟进,要么就是被边缘化。 那这其实就是国产的大模型在市场上面抢占主动权的一个非常典型的一个打法。你觉得就是 deepsea 4 pro 这个降价对于整个行业和社会来讲会带来哪些真正的改变?他们其实把这个门槛降到了一个极低的程度, 所以说无论是创业公司还是大企业都可以非常容易的去接入这种非常强大的 ai 能力, 然后就会大大加快这个应用的落地和创新的速度。确实普绘化的趋势越来越明显,再加上他们的这个模型是用非常宽松的协议去开源的,所以全球的开发者都可以非常容易的去使用。那其实中国的 ai 的 标准 正在被推到世界的舞台上面,那未来我们其实是可以期待这个行业会形成一个围绕着 deep sync 的 这样的一个生态。那我们来进入到我们的第三 part, 我 们来聊一聊这个行业影响,就是这个 deep sync v four pro api 这个永久降价 究竟让谁成了最大受益者?我觉得最直接的受益者就是中小开发者和创业团队,就是他们现在可以以极低的成本去把大模型的能力嵌入到自己的产品里面,然后他们不用再去担心说我这个账单会爆表了,他们可以更专注于去做创新。 确实这个门槛降低了之后,大家的试错和迭代的速度肯定就上来了。没错没错,对,那不光是这个初创公司, 其实像一些做智能客服,或者说做一些这种内容创作平台的这些企业,他们的成本也被大大贪薄了。就比如说你做一个智能客服,可能你的 api 的 支出只占你很小的一部分了,你的毛利率可以飙到百分之九十以上。 包括一些这种海外的开发者,他们现在也可以很方便地去接入这个 deepsea 的 多鱼种的模型,那这个真的是让全球的这种创新都被拉了一把。那你觉得这个 deepsea vivo pro api 这个降价会让哪些企业或者说哪些群体 感受到明显的压力?就原本靠高溢价活着的一些海外的和国内的大模型的厂商,他们会特别难受。因为 deepsea 直接把这个价格的天花板给拉下来了,那用户肯定就会去重新衡量说我这个东西到底值不值这个差价。 所以说那些高价的模型会被用户重新去审视。没错,对,那像一些这种专门做 api 聚合,或者说做一些这种简单的代理的这种 中间商,他们其实也很难再去靠这个价格差活着了。包括一些没有什么独特的能力的这种小的模型也会被快速的边缘化,甚至有一些 这个上市的公司的股价都已经因为这个事情受到了影响。你觉得就是 deepsea 为 four pro api 这个降价会给这个大模型的市场带来哪些新的变化?现在大家都被逼着去重新定价了,对,大家 很多头部的厂商,他们都已经跟进了降价,甚至有一些开始做一些定向的免费的策略,同时大家也在拼命的去突出自己在一些领域的专长,或者说在一些安全合规上面的一些优势。 看来这个行业的玩法是越来越多样化了。对,那就是价格战,其实是在加速整个市场的分层。那 deepsea 其实它也借着这个低价和国产芯片的适配,把本地的产业链也带动起来了,那它其实也为自己争取了在全球市场的一个话语权, 那未来的竞争其实就是生态和标准的竞争了。表到这我们也可以看到,就是这个 deepsea v four pro api 这个降价, 它不仅仅是让更多的人可以用上这种强大的 ai 能力,它其实也在倒逼整个行业去重新思考这个定价的逻辑,那未来的这个大模型 a p i 可能真的要换一种玩法了。 ok, 今天的分享咱们就到这里了,感谢大家的收听,咱们下期再见,拜拜!

朋友们,今天聊一个重磅消息, deepsea 官方刚刚宣布, v 四 pro 模型的 api 价格将永久降至原价的四分之一。 没错,不是限时促销,是永久降价。之前几个月的二点五折优惠活动会在五月三十一号结束,但价格不会涨回去,直接定格在这个史上最低价。这意味着什么? 大模型的 api 调用成本正在逼近地板价免费时代,可能真的不远了。我们来拆解一下这个公告。首先,时间节点很明确, 五月三十一号,持续好几个月的二点五折优惠活动正式结束。但关键来了, deepsea 选择把优惠价直接固化为永久定价。 这意味着什么?意味着他们不是在用现实低价拉新,而是对自己的成本结构有绝对的信心。 原价的四分之一,这个力度在全球大模型 api 市场上都是史无前例的。对于企业用户来说,以前用大模型可能要精打细算省着花,现在经济门槛儿几乎没了。而对整个行业来说,这标志着价格战进入了一个新阶段, 不再是小打小闹的九折八折,而是直接打到骨折。这次降价最亮眼的数字是这个, 零点零二五元每百万 tokens。 这是缓存命中时的输入价格。什么概念?假设你在做一个 reg 知识库应用, 用户反复查询相似的文档内容,大部分请求都会命中缓存,每次调用的成本低到几乎可以忽略不计。智能客服、文档分析、合同审查这些场景,天然就有很高的缓存命中率。 deepsea 这一招非常聪明, 表面上是降价,实际上是引导开发者优化架构,多用缓存,最后形成双赢。 对于真正在企业级场景里跑过大模型的人来说,这个价格意味着从试试看到全面铺开的最后一道障碍被拆掉了。配合降价, deepsea 也调整了,并发现制 v 四 flash 给到五百, v 四 pro 直接拉到两千五百。 这个数字什么概念?绝大多数中小企业和个人开发者根本摸不到这个天花板,超过限制会收到四百二十九报错。但说真的,两千五百的并发症,对于百分之九十九的场景来说都绰绰有余了。 更值得关注的是这背后的信号。从去年开始,国内大模型厂商就在打价格战,一轮接一轮地降, 但这次不一样,永久四分之一这个力度说明 deepsea 不是 在玩营销套路,而是它们的推理成本真的降到了可以支撑这个价格的水平。这对于整个行业来说意味着什么? 意味着大模型正在从高端服务变成基础设施,就像云存储、 cdn 一 样,越来越便宜,越来越普及。对开发者来说,这可能是最好的时代。 最后一个问题留给大家, deepseek v 四 pro 永久降价到原价的四分之一,缓存命中场景低到零点零二五元每百万 tokens, 这个价格已经无限逼近免费了。那么问题来了,你觉得大模型 api 会迎来完全免费的那一天吗? 是会像移动流量一样,三年内就无限逼近零?还是说,模型推理的硬件成本决定了它永远有个底线?欢迎在评论区留下你的看法,我们下期见。

v 四 pro 输出价格只有 gpt 五点五的三十四分之一,而且永久生效。用 gpt 五点五或 cloud opus 的 同学每月 api 费用可能上千,但 deepsafe v 四 pro 直接把成本打下来了。 v 四 pro 输出每百万 token 零点八七美元, gpt 五点五是三十, opus 四点七是二十五,差价三十四倍和二十九倍,而且支持一百万上下文窗口三八四 k 输出长度缓存命中成本几乎可以忽略。 追求性价比的看 v 四 flash 输入零点一四,输出零点二八,适合大批量调用。但说实话, v 四 pro 精准性能还是落后 gpt 五点五和 opus 四点七。 便宜归便宜,不是每个场景都能替代,选模型看场景不是越便宜越好,觉得价格重要的扣一,觉得性能重要的扣二。我是叶哥,下期见。

北京时间五月三十一日, deepseek v 四 pro 的 二点五折优惠活动正式结束,但等来的不是恢复原价,而是直接把这二点五折永久化原价的四分之一,从此成为正式定价。不是促销延期,不是新一轮优惠, 是永久降价百分之七十五,缓存命中后,每百万 token 输入只要零点零二五元人民币。对于系统提示词固定、高频调用、知识库问答这些场景,输入成本基本可以忽略不计。 这不是降价的边际改善,是直接改变了哪些应用形态在经济上可行。缓存位命中输入每百万 token 三元,输出六元。作为对比,原价分别是十二元和二十四元。 一个旗舰级推理模型,价格达到了去年开元小模型的水平。永久降价百分之七十五,意味着两件事, deep seek 的 推理成本真的降了,以及大模型定价的下一个基准线被重新划好了。 与降价同步的官方文档还更新了限速与隔离规则,官方文档新增了 user 下划线 id 隔离。同时公布的并发现,制 v 四 pro 五百, v 四 flash 两千五百, 当百万 token 输入只要三块钱,输出只要六块钱。 ai 推理成本已经不再是创意的瓶颈,多部 agent 常练推理实时 red, 所有这些之前因为 token 账单不敢放量跑的场景,门槛一夜之间消失了。 deep seek 这一刀砍掉的不是价格,是 ai 应用落地的最后一道墙。关注我,每天第一时间带你看懂 ai 圈!

前两天黄仁勋跟那个印度主播做节目的时候,气得半死,你们还记得不? they're they're childish, they're childish, yeah the logic that you use you might as well say it to micro processors and d rams。 这几天啊,老黄绝对又破防了。 deepsea, deepsea v 四直接适配华为生态战略,中国大陆 ai 现在要全面的去美化。 this is a big problem and we need to talk about it american ai will die。 这啥意思呢?意思就国产的 ai 啊,从训练到推理,直接软件硬件全线贯通。 deepsea 的 性能呢?大家测三天了,你觉得好用吗?好用的话在评论区可以留下,你看看有些争议的原因啊,我们晚点再谈。我们先谈一下这个 deepsea 的 价格, 目前的价格绝对是单方面的屠杀和模型,五月五号前直接百分之二十五,我一开始你都以为我自己是看错了,是七五折, 这价格呢,是很多顶尖模型的十几分之一,甚至几十分之一。朋友们,你很没意识到啊,这件事情对美国硅谷的那帮人来说,是一个让他们睡不着觉的小细节,甚至是灾难性的。为什么呢?因为 deepsea 目前的表现来看, 在训练上它是不需要那么多的算力和电力的。这个点跟老黄采访时试探那个原因底层上是一样的。目前来说,谷歌的泡沫确实很大了,再多些这种消息,算力罢全这种说法就站不住脚了。这让我们也第一时间啊,对这个模型本身的能力做了测试。 目前主流的说法是, deepsea 大 致落后顶尖闭元模型三个月的时间。那我们在 v 四出来之后啊,用 flash 尝试了一个中小的编程项目, 对比之前 kimi 一 周一个模块, v 四这两天就搞定了一个中型模块,个人使用下来呢,我觉得是综合预三家下面最强的。 我个人觉得币源模型啊,就该跟币源的比,要是哪个币源模型还比不了开源模型,我觉得倒是这一家不用再做了。这次的 v 四啊,绝对不像很多人说的低于预期,他反而是非常符合我们预期的。 为什么呢?你们还记得吗?二五年的时候, deepsea 其实也不是性能第一,当时是依靠混合多专家模型这些先进的架构以及硬件上的调优,让这个算力的消耗降到了顶尖模型的五十分之一。 这个才是我觉得我们这个本土的模型每次更新最吓人的地方就是它的超级性价比。再一个,现在顶尖的模型啊,其实大头的收入都在 tob 上, 基本上是看不上兔 c 那 点小钱的,很多订阅计划的算力呢,对于一些深度使用的 c 端会员来说,厂商他们都是亏的。我们跟一些外企的行业头部了解下来, 大头的 app 嵌入私有化的服务器,以及这个大批量的这个 api, 一 年消费的刀刃能到半个小目标。而对于很多企业来说, v 四的极具性价比和智力的成绩, 百分之九十九的人用这种 web 版的,哎,免费的专家版其实就用不完了,何况呢,你有时候还会用千问豆包这些,大家不用听那么多测评啊, deepsea 这价格啊,你自用个一两天,我是不是在尬吹啊?一切真的就明了, 要是 v 四 pro 二十四块钱你黑他我都不挑你理。关键是目前来说六块钱这性能这价格如果还有的黑就不容易了。对于个人来说,最怕的其实就是用国外模型,有一种喝星巴克的微妙形态, 个人使用上你花二百刀二百五十刀买 pro 买 cloud, 如果你是用不明白其中差别的,只是追个风,就真成了 ai 时代的轻奢气氛组。

不是 dbz 微四 pro 永久百分之七十五折扣了,那就是永久二五折,那就不是促销了,是新定价呗。 你算一下,除完了之后,每百万偷看输入是零点四三五美元,输出翻个倍,零点八七美元缓存命中的话,价格是零点零零三六。不是你这么糟的话,我跟你讲,如果是一个比较复杂的任务, colodsonnet 按照十五美元百万输出 gpt 三十,那 vs pro 是 零点八七,输出端便宜的倍数还要更多。 那其实现在它的作用就很清晰了,你老说这个东西,你,你天天诟病 vs 四 pro, 你 说它比不过 oppo 的 四点七,没有超越 g b d 五点五 x high, 但是它是十五分之一到三十分之一的价格,那做一点终端的编程代码审查对不对啊?你把活先干了,把那个累活先让它干出来,然后到了一个非常重要的节点,比如说挑出问题,真要改,这时候你再派出 oppo 四点七大神不完事了吗?在成本质量的帕累托曲线上,只要在最前沿 有意义,也就是说在这个成本下,我们是最强的啊。谷歌其实也是追求帕累托曲线,比如说他前几天发布的 flash 三点五都是一样的。所以 deepsea 现在就来了这招,就是对标你 c c, 对 标你 cologne 的, 但是主打十五分之一的输入价格和三十分之一的输出成本。

deepsea v 四 pro 要永久降价,小米 mayo 今天也宣布最高降百分之九十九。很多人的第一反应是大模型价格战又来了。但我觉得这件事更重要的信号不是模型便宜了,而是 ai 正在从一个高级工具, 变成像话费、水电费一样的基础设施。 deepseek 官方价格也写得很清楚, v 四 pro 现在的百分之七十五折扣结束以后, api 定价会正式调整为原来的四分之一。小米 miimo v 二点五这边也一样,不只是短期促销,而是永久降价,最高降百分之九十九, talking plan 的 用量直接提升到原来的五到八倍。这些数字放在一起看,说明一件事,模型能力的编辑成本正在快速往下掉。过去我们讨论 ai, 最喜欢问两个问题,第一个,哪个模型最强?第二个,哪个模型最便宜?但接下来真正重要的问题 可能会变成 ai 用量怎么计量,怎么结算,谁来偷管,谁来审计,谁来溯源。因为 ai 一 旦进入公司政务、金融、教育、医疗这些场景,它就不能只是每个平台各卖各的 a p i, 它需要像话费一样被计量,像电费一样被结算,像网络服一样能被管理。这也是为什么最近三大运营商上线偷肯套餐这件事, 我觉得非常值得关注。中国移动、中国联通、中国电信本来就擅长几件事,实名计费、网络、企业服务,还有合规接口。所以未来 ai 不 一定只是拟去某个模型官网充值, 它很可能会变成企业套餐、办公套餐、行业套餐,甚至像今天的话费和宽带一样,进入一个更统一的计量和结算系统。换句话说, token 可能会变成 ai 时代的话费单位。 那这件事对普通人意味着什么?不是说你终于可以便宜的玩 ai 了,而是 ai 便宜以后,真正的门槛会转移。以前门槛是你用不用得起模型,以后门槛是你有没有一个值得 ai 持续运行的工作流。如果你只是偶尔打开聊天框问两句,模型再便宜也只是省了几块钱。但如果你把 ai 接近选择题、 素材、脚本、剪辑、发布、复盘,或者接近获客、客服、销售、交付、管理,那 ai 就 不再是一个工具,它会变成你系统里每天都在运行的一部分。所以今天 deepsea 和小米降价,我 看到的不是单纯价格战,我看到的是 ai 正在变成基础设施。当 ai 变成水电费,真正拉开差距的就不是谁会聊天,而是谁有一套值得 ai 持续执行的系统。

我们今天来聊两个问题啊,第一个问题是 deep stack v 四的收费情况,第二个问题呢,就是我的电脑上有哪些工具已经接入到了 deep stack v 四?首先看一下收费情况, 像我这个月的话,其实已经使用了九块四毛五分钱。那么使用 token 的 话,首先第一个是 pro 模式之下,我大约是消耗了两百七十万 token, 然后是在 flash 模式之下呢,我大约是用了一千万,这样 token 加起来是不到一千三百万 token, 花了不到十块钱,那么合算下来的话,其实就是每百万 token 不 到一块钱,性价比其实很高的。 那么第二个就是我有哪些工具已经接入到了 deepsafe v 四。那首先的话,其实就是最适合我们普通人用的 workbody, 大家可以看一下,在这里的话,其实直接去配置到 我们的 deep deepsafe v 四就可以了,那这是我的第一个,其最也是最常用的。那么第二个呢?其实是我的龙虾 opencloud, 那 么我所接入的模型也是 deepsafe v 四,再有的话就是 cloud cloud code, 那 么我用的模型依然是 deepsafe v 四,是一个 pro 版本啊。 那么很多人会说我不会用 cloud code, 也不会去用 opencloud, 那 这种情况之下应该怎么办?那我可以给大家看一下我刚才的指令啊,我们以 cloud code 去举例子, 那我直接输入的第一个指令就是打开我电脑上的 cloud code, 那 么这个时候它会自动打开,但是我遇到问题它是没有用的,那我把问题复制到了对话框当中,让它自己去修复,并且接入到 tipsy v 四的大模型,那么它自己就会去运行了,那么所呈现的结果就是我可以再去自如的去使用这个 cloud code。 那 所以说就像昨天所说的,如果大家真的不会去用,那很简单,你就下载一个 work buddy, 然后把你所有不会的问题去问他,让他自己去解决了,这就是我们普通人去用 ai 的 唯一秘诀。

deepsea 宣布,旗舰模型 v 四 pro 的 api 价格将永久下调七十五百分点,即收费标准永久设为原价的四分之一。新价格将于五月三十一日现有优惠活动结束后立即在全球生效。此次降价主要惠及开发者和企业用户, 微利成本已降至潜在的二十七百分店。同时华为升腾九五零 ai 芯片供应增加有助于降低运营成本。在全球 ai 服务普遍涨价的背景下, deepsea 的 降价只在吸引更多开发者和企业用户,兼具 ai 行业的价格竞争。

大家好,欢迎收听今天的 ai 热点播客。最近国产 ai 圈出了一件大事, deep seek 连续放出两个重磅消息, 一个是 api 永久降价到全球最低,另一个是要融资七百亿。这两件事加在一起,被很多人解读为国产大模型要掀起一场价格战。 今天我们就来聊聊这个话题,嘉宾你怎么看?这次 deep seek 的 动作?我觉得这是一个标志性事件。 五月二十二日, deepsafe 官方正式宣布,旗舰模型 deepsafe v 四 pro 的 api 价格将在五月三十一日结束限时优惠后,永久调整为原价的四分之一,也就是二点五折。这不是促销活动,而是永久定价策略的调整。永久降价到四分之一,这个幅度确实很大。 那具体价格是多少呢?对普通开发者来说意味着什么?降价后输入 token 的 价格最低可以到零点零二五元每百万 token, 输出是六元每百万 token, 这是什么概念呢?以前用 gpt 四级别的模型,成本可能是现在的几十倍, 现在一个小型创业团队,甚至个人开发者都能负担得起调用顶级大模型的费用了。我听说这次降价被叫做地板价,是全球最低水平。是的, 从公开信息来看, deepsea vc pro 降价后的价格确实处于全球旗舰大模型的最低区间。更重要的是,这不是限时促销,而是永久定价。 deepsea 官方明确表示将把折扣永久化,这意味着它们是在用长期低价策略来争夺市场。那 deepsea 为什么要这么做呢?是技术成本真的降下来了, 还是在烧钱抢市场?两方面因素都有。从技术角度看, deepsea 一 直以开源加推理优化著称,它们在模型效率上有自己的优势。 但另一方面,这次降价确实也有战略意图。就在宣布降价的同时, deepsea 还被批露正在推进约七百亿元人民币的新一轮融资。七百亿?这个数字很惊人啊。 一边是永久降价,一边是大规模融资,这两件事放在一起看, deepsea 到底想干什么?这其实是当下 ai 行业的一个典型策略,用资本换市场,用低价换规模。 创始人梁文峰之前明确表示过, deepsea 的 主要目标是推动技术发展边界,而非变现。也就是说,他们限阶段更看重技术领先和市场份额,而不是短期盈利。这让我想起了当年的网约车大战、外卖大战,都是先收钱补贴,把竞争对手熬死,然后再涨价盈利。 ai 行业也会走这条路吗?有这个可能性,但 ai 行业有一些特殊性。首先,大模型的技术迭代非常快,今天的领先不代表明天的优势。 其次,用户迁移成本相对较低,如果另一家出了更好的模型或更低的价格,用户很容易切换。所以单纯的价格战可能持续不了太久,最终还是要回到技术和服务质量上来。那对其他国产大模型厂商来说, deepsea 这一手是不是很有压力? 肯定会有压力,字节、百度、阿里、腾讯这些头部厂商现在面临一个选择,是跟进出击,还是坚持现有定价策略? 如果跟进降价,利润空间会被压缩,如果不跟进,可能会失去价格敏感性用户。据说字节跳动已经把二零二六年的 ai 基础设施资本开支从一千六百亿上调了,说明大家都在加码。说到字节,我注意到他们五月份也发布了火山引擎的 agent plan, 月费四十元起。 这是不是说明国内 ai 竞争已经从卷参数进入卷应用和卷落地的阶段了?完全正确,二零二六年的 ai 行业确实在发生一个根本性转变。 前几年大家比的是谁的模型参数更大,谁的成绩单更好看。现在比的是谁能真正把 ai 用到实际场景里,谁能帮企业和开发者省钱增效。 deepseek 的 降价和自洁的 agent plan, 本质上都是在降低 ai 的 使用门槛,那对普通用户和中小企业来说,这是好事儿吧?短期来看,绝对是好事。 成本降低了,意味着更多创新应用会涌现,比如以前只有大公司才能做的智能客服、内容生成、数据分析,现在小团队甚至个人开发者都能尝试。 但长期来看,如果价格战导致一些厂商出局,市场集中度提高,价格可能会回升。还有一个问题, deepsea 一 边降价,一边融资七百亿,这笔钱准备怎么花?从纰漏的信息来看,这笔融资是国家队加巨头加创始人自投的组合 资金,用途主要是换算力,保人才抢技术话语权。 ai 大 模型是一个极度烧钱的行业,训练一次大模型可能需要几千万甚至上亿美元的算力成本。 deepsea 要在技术上保持领先,就必须持续投入。我注意到你提到国家队参与,这有什么特殊意义吗?这说明 deepsea 已经上升到国家战略层面的布局了。在当前国际环境下,拥有自主可控的顶尖大模型能力,不仅是商业竞争问题,也是科技自立自强的一部分。 这轮融资如果成功,将是国产 ai 发展的一个里程碑。那从技术角度看, deepsea vc pro 到底是什么水平?和 gpt 四 cloud 的 这些国外模型相比怎么样? deepsea vc pro 在 推理能力和代码深层方面表现不错,特别是在数学和逻辑推理任务上有自己的优势。 当然,各家模型在不同场景下各有千秋,很难简单地说谁绝对领先,但 deepsea 的 优势在于开源策略和成本效率,这让开发者可以更灵活地使用和定制。这次降价会不会引发一场全行业的价格战? 就像当年的云计算价格战一样?很有可能,实际上价格战已经开始了。不只是 deepsea, 智普、 minx、 悦智、暗面等国产大模型厂商都在调整定价策略, 二零二六年可能是 ai 大 模型从技术竞赛转向商业落地的关键一年。那对于想进入 ai 领域的创业者或开发者,你有什么建议?现在是一个非常好的时机, a p i 成本大幅下降,意味着创业门槛降低了。 但也要注意,不要单纯因为便宜就盲目使用,还是要根据自己的业务场景选择合适的模型。另外,要关注厂商的长期稳定性,毕竟 ai 是 一个需要持续投入的行业。说到长期稳定性, deepsea 这次融资七百亿是不是也有这方面的考虑?毕竟降价之后现金流压力会很大。没错, 降价意味着单客收入减少,要保持运营就必须扩大规模或者持续融资。七百亿融资可以给 deepsea 提供几年的弹药,让它们在价格战中坚持得更久。但这也意味着它们必须在接下来的时间里证明这种策略是有效的,能够换来足够的市场份额和生态影响力。最后一个问题, 你觉得 deepsea 这一系列动作对整个国产 ai 行业意味着什么?我觉得这标志着国产 ai 进入了一个新阶段, 以前是追赶,现在开始有底气在商业模式上创新,在全球市场上竞争。 deepsea 的 降价策略如果成功,可能会重塑全球大模型的定价体系。同时,这也给其他国产厂商提出了挑战,如何在价格压力下保持技术投入和创新能力。 好的,感谢嘉宾的精彩分享。今天我们聊了 deepsea api 永久降价和七百亿融资这两个重磅消息,分析了背后的战略意图和对行业的影响。 对于普通用户和开发者来说,这无疑是一个好消息。 ai 的 使用门槛正在快速降低,但价格战的最终结果如何,还要看各家厂商的后续动作,我们下期再见。再见!