是不是总觉得自己平平无奇,连自己有什么天赋都不知道?今天这个 deepsea 王炸用法,只要给 deepsea 发三个指令,就能一步步摸清自己核心擅长领域。 指令一直接跟 deepsea 说,帮我挖掘隐藏特长和个人天赋,找到技能、兴趣与经验交汇处的独特价值。这一步直接帮你定方向,让 ai 帮你梳理核心脉络。指令二接着说,请设计十五个采访式问题, 一次只问一个,过程流畅自然,逐步升化。指令三最后补充每个问题,引导我分享具体例子,区分主动热爱和被迫掌握的能力,最终精准找到自己隐藏的天赋以及对应的核心擅长领域。 deepsea 的 这波操作,直接帮我们拨开迷雾线阵仗。我已经找到自己的隐藏天赋了,你也赶快试试吧!关注我,带你解锁更多 ai 职场神器,拜拜!
粉丝7155获赞6.6万

因为很多洗衣粉不会用这个网盘,所以这一期我就来录一下怎么用以及怎么发给 d c。 首先点开网盘, 然后点开这个指令,点击搜索,输入要查找的指令,最后保存, 可以选择保存下来直接发给 deepsea 图片,也可以在相册 w x 长按提取文字,提出出来后自己填补自己的人设即可。

大家好,我是二次元文少,我祝 d p c。 的 公司老板梁文峰身体健康,万事如意,发东南西北炫风采,顺风顺水顺财神,股票买叉啥行情? 收集散户资金,训练爱国模型。我祝 d p c。 的 公司广大贤才招到我这样的社会精英人士、中流砥柱,早日进出世界最强大模型,把反华公司 and rolex 踩在脚下! 祝梁总早日实现财务自由,住上大平层,开上帕拉梅拉,可以环游世界,长生不老,永远不死!爱你呦!

中等参数模型高并发服务器怎么配才不翻车?大部分人都觉得参数不是很大的模型,不怎么吃配置。但今天社长想说,如果你要几百人同时用,每个人都在和模型做交互,二十七币也能把大显存显卡直接干趴下。前几天有一个客户找到我,说我想部署一个千万三点五二十七币的模型, 需求是五十并发,怎么找你报价?客户的名字是一串英文字母,我们就叫他字母哥吧。这是字母哥发给我的第一句话。后来字母哥不断拉高了他的需求,我也跟着改了好几轮方案,从显存怎么算, 吞吐量怎么测到需求从五十并发涨到一百并发,从四卡机改到八卡机,报价从二十多万一路到五十多万是怎么回事呢?社长来还原一下当时的过程。 拿到字母哥的初步需求之后,我先算了显存二十七 b 硬特八量化版本模型权重,本身显存占用约二十七 g, 五十并发单并发平均六十四 k 上下文,合计可以被缓存大概两百 g, 系统预留五 g 加百分之十峰值余量,一共两百五十五 g 左右。上三张 pro 六千九十六 g 或四张 pro 五千七十二 g, 用塔式服务器方案滴滴二十 k 上下文的话,这个配置每秒大概能处理多少? talking, 我说三张 pro 六千九十六 g 方案稳定生成,吞吐量大概是两百二到两百六 toking 每秒。四张 pro 五千七十二 g 方案大概是一百八到两百二 toking 每秒。他马上追问了一句很关键的话, root toking 呢? 字母哥一看就是研究了很深入的,很多人只看生成速度,不问输入速度,但输入才是 ai, 读你发过去的内容,他同样会大幅影响模型的 toking 吞吐量。 我告诉他,三张 pro 六千方案的输入吞吐量稳定在三千五到四千多 k 每秒,单条二十 k 上下文,请求编码号是大概零点几秒,用户那边基本感觉不到延迟,当然病发量越高,每个客户的延迟感知会更强一些。四张 pro 五千方案,输入大概两千六到三千多 k 每秒,编码零点七到一秒。 听完又问,这个数据依据是哪来的?你们之前测过吗?我跟他说,报给你的数字是取了保守值实际部署跑出来的,只高不低。接下来字母哥没急着跟我继续聊,他先用自己手头的显卡测试跑了一遍,七十几秒,输入一万两千 talking 生成六千 talking。 他 把数据发给我看, 峰值输出吨数五百二十 talking 每秒,峰值并发二十,但稳定输出只有二十三 talking 每秒。我看到这个数据直接问,你这个有点慢啊,二十三 talking 每秒,用什么显卡跑的? 他说是一张六十四 g 的 显卡,我看了显卡的品牌和型号,确定是显卡的锅,这个显卡没有扩大生态加持,确实适配性会差不少。字母哥说,他看到报告上那个二十三的时候,自己也有点蒙,不过他也没纠结太久,很快就开始追问技术细节了。他问是最大输出那种,还是混合场景的? 我说并发是输入输出混合二十 k 上下文,输入十五 k, 输出五 k。 接下来他又担心二十多万的机器能不能扛住五十并发?说到并发,社长稍微展开来讲一讲一款显卡跑大模型上下文推理。在 v l、 l、 m、 s、 g 浪等优化充分的推理框架下, 显卡的 token 总吞吐量基本是恒定的,并发使用的时候,如果只有一个用户就是独占这张显卡的吞吐量,十个用户同时在使用的话,每个用户平均占到了总吞吐量的十分之一。在显卡数量不变的情况下,用户并发数越高,每个用户感受到的吐字速度就越低。 所以社长在算并发显存的时候,会按照每并发平均多少上下文的 k v 缓存占用来进行计算。模型的参数量固定单并发平均上下文长度下, k v 缓存也是相对固定的,系统的框架开销等因素也是相对固定的。当然,我在计算的时候,保守起见一般都会加上百分之十的峰值波动熔余, 所以这样计算下来一般不会错。然后他又把测试数据那里的峰值并发请求数据发过来问我,我报的并发测算是不是这个?这块又要跟字母哥解释一下了。我的并发测算是基于稳定并发得出的,是业务混合场景下首包小于一点五秒,单 talking 延迟小于五毫秒, 无请求失败。在实际业务场景下,我的并发测算跑起来是能扛住的。他问的那个峰值数据是压测瞬时值,不统计延迟和超时。在实际业务场景下,每 没法直接作为参考,很多刚接触服务器的人都会把这两个搞混。字母哥听完我的解释,回了一个 ok, 我 以为这事可能还得等几天,结果他紧跟着就甩出来两句话,有报价单吗?我要对比一下。到这里我们双方开始进入正式报价环节了,说明前面的几轮沟通,他已经把该核实的东西核实的差不多了。 方案出给他之后,到了第二天他又找过来了,这次明显是他们内部又开了一次会,需求往前推了一大步。他说他们讨论过了, 可能会有梯度变化的情况,不是固定一个规格用到底,而是不同场景不同的输入输出组合。比如二十 k 上下文配三 k 输出,或者四十 k 上下文配四 k 输出,会有好几档。他们这种梯度的话,是不是按我之前方案里估计的显卡内存配置扩一倍或者两倍就可以了?我跟他说,这里面分三种情况, 第一种是上下文不变,输出从五 k 降到三 k 或四 k, 对 显存压力反而小的,原有的方案就能覆盖,不需要额外扩容。第二种情况是上下文从二十 k 拉到四十 k, 并发保持五十,那单并发的 k 位缓存占用就要翻倍得扩容,显卡内存也要跟着扩。第三种方式是并发翻倍到一百, 上下文保持二十 k, 多出来的五十并发显存占用大概一百多 g, 扩充到四张 pro 六千就能扛住,但内存同样得扩容。他对并发这个点问的特别细,又再次跟我确认了一遍,五十并发是不是指五十人同时用 首次一点五秒,后续 tokin 输出五毫秒,是否可以完整的等这些都响应完,而且不考虑这些人中途去干其他的,又跑回来占大模型的资源吧。我说对,五十并发就是同时在线处理五十个用户的完整请求, 从首次生成到所有 tokin 输出完成,方案中的估算已经按请求的完整生命周期和显存峰值占用来算了,默认用户不会中途断联,资源不会被无效占用。如果真的要考虑用户中途离开的情况,可以再加一层绘画超时机制,然后再多预留大概百分之二十的算力余量,当 目前看暂时没必要。话说到这,字母哥又提了新要求,他让我按一百并发再做一版报价单发给他。于是我又给他算了一遍, 给他出了四卡 pro 六千九十六 g 的 方案,显存合计三百八十四 g, 四卡机架式服务器电压五平台,基本上能够满足他一百并发的需求了。这时候的报价就飙到了四十多万。 结果第二天方案报过去之后,字母哥的需求又升级了。他问四卡方案还能升级吗?如果未来配置不够用了,能不能在这个配置的基础上直接加显卡加内存?我说目前的方案最多只能上四卡,如果要上八卡,就得重新做一份新的配置单, 于是就有了最终版的四 u 八卡配置单。显卡这块仍然沿用四张 pro 六千九十六 g 显卡不变显存合计三百八十四 g, 给他预留了四个空槽位,未来需要升级的话,直接加显卡就好了。于是最后一版方案的报价定格在了五十万出头,从五十并发到一百并发,从三卡到四卡,满配到八卡,预留荣誉需求是一步步被推上来的, cpu 能不能扛住调度?主板留不留得住槽位?显卡插几张留几张?内存跟不跟得上显存的节奏?电源顶不顶得住未来的功耗?每一个环节都得跟着需求走,算清楚了才知道哪里该加哪里能省。如果你也在搭 ai 服务器,不知道怎么评估并发,怕花冤枉钱买到不适合自己的配置?欢迎来找社长聊聊。

你敢信 deepsea 基于 scale 能五十六秒搞定瑞数六代,牛逼。今天我们来看的是 deepsea ai 去结合 scale 来去逆向分析这样的一个瑞数六的网站。我们这里先进入网站当中,右键去选择检查,打开开发者工具,然后在这里我们先去清一下这个 缓存啊,然后过滤到这个网络面板当中,有个文档类型的,好来去刷新一下页面,在这里呢,你会发现呢,就会先去发一些四幺二的数据包,然后这个是两百,这个是瑞数六的一个流程啊,他会先去 呃请求得到的四幺二,然后再去做后续的那些啊代码啊,以及对应的一些逻辑啊,去出第二个库,去请求第二次,就能够去得到正确的一个响应内容。 那么现在我们这个地方要去结合 skill 它呢,其实直接把这样的一个链接啊,就直接给到它,然后去分析就可以了,可以给大家看一下啊, 基于当前 skill 逆向分析啊,这就是那个网页的链接代码文件呢,创建到啊这个路径当中,这是一个瑞数好,它就开始去开始去按照这样的一个流程去做处理了, 最终这个就是他整个的一个结果啊,一共就是只耗费了五十六秒就能够去出这样的一个代码,我们可以看一下,搜一下中文看,是吧?来右键去运行,他整个这里会比较慢啊,他这个网站响应会比较慢,所以要稍微等待一下。 好,那么在这个地方可以看到是吧?它能够去得到正确的一个响应内容呢,其实我们这里还可以把这整个文件啊,这个文件给它删掉之后,让它重新去跑一下啊,删掉之后,对吧?然后我们这里这次是五十六秒跑出来的吗?我们再把这个提示词拿过来啊,教大家怎么去 看整个的一个流程,把这个提示词拿过来。好,我们这里重新开一个,重新开一个 open code ai 编程工具, 我们这里选择用基于当前 scale 逆向分析啊,实现这样的一个网站。然后代码文件呢?穿越到这里面去啊,这是一个瑞数,我们当前的这个文件里面已经是空的了,来回测一下,它就会去做逆向分析了。 首先呢会先去读取对应的这个 skill, 然后在这里呢会继续去做这个读取啊,这都是做读取的,一秒钟,一点五秒,一点七秒,三百二十七毫秒。然后这里就开始去做整个瑞数的流程呢,是我们我们已经封装到了这个 skill 当中了,所以它整个这个速度会比较快, 那如果说你想要去完全就是分析一个新的瑞数,他其实也不会,就他我们这里的话刚刚是五十六秒嘛,这次估计会稍微慢一点点啊。 呃,然后这个可以给大家看一下啊,这个是我完全没有去分析过的一个一个瑞数六代的啊,这也是提示词啊,提示词是就当前是要去实现这样的一个瑞数网站代码就能穿越到这里面去, 那一共就一共是耗费了。这个地方是编码的问题啊,这个是后面的编码问题,我们来看一下他整个出值的时候是耗了多久呢?呃,出值的地方,这个是对吧?这个是编码的问题啊,他已经是出值了的,只不过编码有点问题而已, 我们来看一下整个是在上面应该是差不多就六分钟的样子啊,六分钟的样子,这里还是那个编码问题,往上面看一下啊,这里对吧?编码问题也是编码问题啊,对吧?这个地方一共是耗费了,我看一下啊,这里有没有结果呢? 这地方就出了也是编码的问题啊,看一下下面呢,哎,我看一下我上面的那个绘画啊,做六分钟就能够去实现啊,整个他能出纸啊,这个是他出了一个代码出的那套代码啊,这里已经收起来了啊, 对,差不多是六分钟就能够去实现一个啊,没有去分析过的一个瑞数,这个还是瑞数六代的啊 啊,运输六代的,就这一次完整的报告,整个的一个参考,然后控常常控制保存的材料,先去请求得到四幺二,再去请求得到两百,得到正确的一个数据。我们来看一下当前这一次呢,这一次的话过了吗?在这里是吧?这里啊 啊,这里还在跑啊,这一次稍微慢一点了,但他在这地方看起来已经是得到了正确的一个响应了,因为我在这里面是给他加了一个解析了的啊,加了解析了的就是要去把这个数据给他解析出来, 你会发现是吧?整个的一个数据已经是拿到了的,在这个地方他最终只是给大家加一些解析,把数据提取出来而已啊,整个就出来了啊,出来了,一共就是两分钟的样子,这一次稍微慢一点,因为他这个不稳定,但我们整个刚刚分析的那个是四十六五十六秒啊,就出来了。 好,来看一下现在这一次能否去请求得到正确的一个响应内容呢?先去请求啊,这是这个稍微等一下,这个网站会比较慢, 然后我这里可以给他看一下刚刚那个,我们那个什么深圳,对吧?这个瑞数六的这个也非常也是非常快的啊,对吧?就能够去得到它的一个响应内容,所以整个去基于这样的一个 skill 的 话呢, 它实现起来是非常的方便的。你说以前,呃,去自己搞一个瑞数是吧?那你估计要是没有逆向基础的话,你估计搞个半个月 都不一定能搞得出来。那现在 ai 其实一一两分钟啊,几分钟就能够搞定一个瑞数了,所以大家想要我的这些 skill 也好啊,想要我的这些代码也好呢,都可以后台去自己领取的。


前段时间呢, open ai 联合创始人特斯拉前 ai 总监安德烈卡帕斯发了一篇文章,他给三百四十二个职业打了 ai 替代的风险分。马斯克看完直接转发了,但这篇文章我拿出来跟 deepsea 讨论了一下,他全盘的把这个逻辑推翻了。 那么卡帕斯的打的分数呢,是零到十分,高危的是谁?像财务分析师啊,软件工程师啊,翻译啊,客服啊这些是八到九分啊,替代率是极高的。反过来呢,像这种水管工啊,电工啊,幼儿园老师啊,心理咨询师啊,只有零到两分,几乎是安全的, 结论就是坐办公室的最危险,修水管的反而安全。那么文章给的逻辑听起来其实特别对的,他说 ai 替代的本质不是聪明或笨的区分,而是标准化和情境化的区别。 写代码,做翻译,分析、财报都是规则,系统,输入输出清清楚楚。 ai 能学,但修屋顶呢?你站在房顶上,每块防水膜的大小不一样,旁边还有个邻居老大爷可能唠叨,你就没有办法标准化。那么给小孩当老师呢?孩子的反应千变万化,你需要去情境判断啊。所以安全 文章还给了三个自测的问题,就是你马上能测一下自己安不安全。第一个就是这件事换个人来做,结果一样吗?第二就是这件事有没有标准答案,有的话就危险。第三,这件事你需要认识人才能做好吗?不需要就危险。 就这三个问题啊,那么好多人可能测完之后都觉得说我干的活要看情况,要建立信任,换个人结果不一样, ok, 稳了。而且再加上马斯克转发,感觉这篇文章呢,就是权威盖章了。我其实当时看到之后我也这么想的,觉得挺有道理,那我就觉得说,我拿出来跟 deepsea 讨论一下吧。 而且呢,我跟他讨论我,我更喜欢的是让 deepsea 跳出来这个框架去讲一些东西。结果呢,我这一个提问啊,他的回复第一句话就让我坐直了,他说 这个文章的框架太人类中心主义了,我当然看到我都惊了,他说藏着一种危险的自我安慰,我就追问他为啥,他给了我一个解释,这是我从来没听过的逻辑啊。他说 ai 替代的根本不是什么标准化和情境化,而是两个词,叫数据密度和压缩比。 为什么呢?为什么这个翻译最先被替代呢?不是说因为翻译是标准化的工作,恰恰相反,高级的翻译需要处理文化语境啊,双关语啊,文体风格啊,非常需要情境的判断。真正的原因是翻译的输入输出都是纯文本,都是数字符号,这个数据的密度极高,没有任何物理损耗就能被模型学习。 在 ai 眼里,翻译就是一份特别好压缩的数据包。为什么修水管到现在没被还没被替代? 不是因为要临场发挥,而是因为我们还没有一百亿小时的带精确动作捕捉的屋顶维修视频去训练 ai, 这个数据的获取成本太高了,安全的是成本,不是那个情境本身。然后呢,他又说了一句让我后背发凉的话,他说这个文章 说体力活是安全区啊,是假设了机器人的技术永远不会进步,这是一个非常危险的假设。 deepsea 说,一旦传感器和机器人成本降下来,体力活会是第一个被彻底替代的。为什么呢? 他说,因为体力活的目标太他妈清晰了。哇,这里边的粗口是 deepsea 报的啊,我都惊了。我说这现在都会报报粗口,我觉得越来越有人味了。然后呢?他说,就是像这个血管的一些动作,他说这些都是极其明确的一些评估的信号,他只需要知道活干成了没有。他说这篇文章的逻辑 就正好说反了。所以,那其实聊到这呢,我就问他,我说那我现在学点啥呀,练点啥呀,还来得及到底什么是安全的呀? 没有给我什么列什么职业清单。他就说了一句话,让我觉得听完这话难受很久了。他说,就是比失业更可怕的是,你还留在岗位上,但你失去了主体性,你变成了 ai 的 附件。然后他给我举了个例子,但不再是从零写合同,而是检查 ai 生成的合同有没有漏洞。 他说,设计师还在,但不是从概念出发去设计,而是从 ai 给出的一百个方案里,挑出三个给客户选。 医生还在,但工作变成了把 ai 的 诊断结果翻译给病人听。他说,你没有失业,你只是被放到了一个叫人类的接口上。他说,你去见客户,不是因为你的方案最好,而是因为 ai 没有办法出现在那个咖啡厅里去握手。你去签字,不是因为你的判断最准,而是因为 ai 暂时没法承担法律责任。 你的经验,你的专业,你的判断,慢慢变成只是在给 ai 点一个同意的这样的一个按钮,他说这才是 ai 时代最深的恐惧,不是说没活干,是有活干,但干的活跟你这个人没什么关系,他攻击的不是你的饭碗,他攻击的是你做事的意义。 听到这,其实说实话,我都有点这个,不知道怎么接了哈。然后呢,这个 dpc 又说,对抗 ai 的 终极方法不是找到一份他干不了的工作,而是 啊,我念他的原话,培养一种不需要向任何人证明自己有用的能力。他的意思是说,你要不断的去爱一个具体的人,去爬一座山,去感受那口凉空气,去花一下午给朋友做一顿饭去记住你发呆的时候窗外穿过来的那束光。 他说, ai 可以 生成一封比你写的好一万倍的情书,但他永远生成不了你在那个下午那阵风里的身体记忆,那个第一人称体验是你唯一绝对私有不可剥夺的东西。 他的原话是,你不靠有用活着,你靠存在活着。我当时就觉得说这话说的也太虚无了,然后我就问他,我说那现在呢?我们现在 还是得靠有用来赚钱活着呀。然后呢,他就说,在你现在还需要靠有用来换钱的日子里,你需要就是两条腿走路,第一条腿就是在系统之内踩着 a a 的 肩膀变得更有用。 你是一个程序员,那你就别只写代码,你去做那个能跟客户喝咖啡,从他混乱的抱怨里面提炼出真实需求,然后把把它翻译成 ai 能理解的指令的人。你是一个设计师,你就别指画图,你去做那个能摸透老板没说出口的审美偏好,敢在会议室里指着屏幕说这个感觉不对的人, 把你的工作位置从 ai 的 输出端挪到 ai 的 输入端去成为那个定义问题解释结果消化不确定性的人, 用这条腿呢?去跑,用这个时代去换取你需要的生活资源。但还有第二条腿在系统之外,你必须每天花一点时间去偷偷修建一个完全不属于这个系统,只属于你自己的精神世界,那个世界不需要来生产任何东西,它只是用来提醒你,你是一个人,不是一个工具, 而是为了活着。一条腿是为了作为一个人活着。就我觉得这场对话最吓人的不是说它预言的未来有多灰暗,而是我发现真正诚实的未来预言可能就藏在 这些正在和我们聊天的 ai 里。他这个真正的是做到了不再雾化人。他,我觉得他这个其实唱响的我觉得是比较美好的啊。我是觉得听完之后我是更加乐观,是因为我觉得说他完完全全回到了人的存在价值,而不是功能的价值。对, 所以呢,如果有一天你终于不用向任何人证明你有用了,你准备好了怎么去火吗?拜拜。

hello, 家人们,今天我用这个 tipsy 让它帮我们改编了一首歌曲,就是最近很火的,我会一直顺,然后我写的是我会一直翻,我们运用一下给它复制, 然后返回我们的像素。这个是在音源创作里边,下面有 ai 写歌,有这个写词模式,把刚刚这个复制的粘贴上去,然后我们立即生成。我选的是 dj, 可以 听一下 这首还不错哈,看一下第二首, 不喜欢第二首,看一下第三, 所以还是第一首好听,是不是?我们就用这一首立即应用,把这个包装给他去掉,刚刚他是一直唱到后面,我听一下好了,三十五秒吧,给他来一个 这样的一首歌曲,我们就初步完成。给他带上一个素材,放上一张图片吧, 大约就这样子,然后背景模糊一些,主要是这个歌词。给他添加一个模板,他最近更新了一些模板,我们可以看一下,有这种是最近刚更新的, 我会一直发发发发发,或者是第二个,我会一直发发发发四个,我会一直发发发发发。 字体不知道能不能改变一下。对勾吧,我们看一下,主要调整一下,看一下这个好不好看,感觉这个还不错, 每一秒都在报复啊,我说,啪啪啪啪啪,从背信红包到别的地方贫穷已是上辈子的事了,此刻我正被金山浇灌着长大, 我觉得还不错,这个样子,这个样子。我们可以直接去发布的,就是滤镜啊之类的,滤镜无非给他来一个,给他加一个白皙吧,高级编辑,我们再给他加一个锐利, 按到后面与他对齐,因为我们这个是可以同时发为模板吗?如果你不让他成为模板,就滤镜也不需要加,只需要有原创自己的音乐还有字幕上去我们去发布就可以。 嗯,这个它要成为模板的话,它这个字幕可能会有点大,我们稍微给它放小一点吧。 正中间,正中间好吗?这首歌的名称叫财富瀑布,我们可以直接用财富瀑布 活动任务,有需要的就加。嗯,同时成为模板也可以精选也给他打上,这样我们去抖音发布就可以了。

朋友们,昨天绝对是 ai 史上最戏剧性的一天啊,不喷 ai 的 gpt 五点五和中国的 deepsea v 四掐着点同时发布, 没有发布会,没有广告,两个相隔万里的实验室就这么悄无声息的亮出了各自的王牌。这不是一次普通的更新啊,这是中美 a i d 是 正面硬钢。今天我给你讲五个最无法想象的事,听完你就明白为什么黄一勋半个月前急得睡不着觉, 第一皇军最怕的事情真的发生了,这次 deepsea 追不起眼的一行小智藏在定价业的最底下,预计下半年升腾九五零,超节点批量上市,以后 pro 的 价格会大幅下调。 意思就是现在的 deepsea 同时用英伟达和华为的芯片在跑,下半年就要全面转向华为了。而且这根本不是华为一个人在战斗,中国的算力已经形成了集团军,华为今年计划出货七十五到一百二十万颗芯片,阿里平头哥已经交付了四十七万片的资源, c p、 gpu, 百度的昆仑星、韩五 g、 海光也都完成了万卡级别的集群的部署。最新的数据是,二零二五年,国产的 ai 芯片在华的市场占有率已经突破了百分之四十一,三年前英伟达还占百分之九十五,现在只剩下五十五了, 年底可能会跌到百分之八。第二,英伟达拍的根本不是芯片啊,很多人说华为芯片不如英伟达,华为讯有什么好拍的? 我跟你说,他怕的根本不是芯片的性能,过去二十年,因为他垄断全世界的靠的不是芯片,而是库达圣泰,他定义了所有 ai 软件的规矩,现在 deepstack 说,我不跟你玩了,我自己也能定规矩。不料明的是,现在所有的 ai 大 佬都达成了共识,堆的算力越多, ai 就 越聪明。 所以这个呃 skateboard 的 规律根本没有到头。 open air 砸了一千亿美金去建星际之门,马斯克的超算目前用电比整个球形山还多。所有人都在疯了一样对算力,而中国现在已经是全世界第二大的算力国家了。 第三,价格差了一百零二倍,直接打的地板价。这次 deepsea 的 定价已经不是价格战的,而是宣的桌子。 deepsea 写一百万字只要两块钱,而同一天发布的 gpt 五点五写一百万字要两百零五块,差了一百零二倍。什么概念?就是别人卖你一百块钱一杯的咖啡, deepsea 直接卖你九毛八一杯,而且味道还差不多。 第四,性能正面硬钢,中国 ai 真正的进入了第一梯内。我先把话给说清楚啊,目前全世界最强的 ai 确实是 iceworks 的 msos, 只给四十多家关键的企业试用,但是现在所有公开的能用的模型里面, deepsea v 四绝对是第一梯队的水平。而且在编程,数学这两个 ai 最难的科目上,他直接把 gpt 五点五给干翻了。 全球最权威的编程竞赛评分, deepsea 是 三千二百零六分,目前全世界第一。现在的情况是,美国有 ms 和 gpt 五点五,中国有 deepsea v 四,我们和美国的差距已经从望尘莫及变成了并跑 第五,真正的 ai 评选来了。最后也是最重要的一点, deepstack 把这个模型直接开源,所有人都可以免费下载,免费使用,这 不是简单的免费,这是真正的智力评,全国际只有大公司用得起的顶级 ai。 现在你一个普通人打开手机就能用。比如说有个很火的玩法,就是用 deepstack 做量化交易。一个简单例子,你不用编程,只要说一句,帮我筛选出近三个月 roe 大 于百分之十五的 ai 概念股, 他十秒钟就能够给你生成完整的选股公式和结果。据说有个博主今年三月份就用这个方法,在双利板块上两周赚了百分之二十一,原来每天要花四个小时的复盘,现在十分钟就搞定。 除此之外,大学生整理考研资料,单月赚三万多,义乌老板用他来写三十六种语言的文案,一年卖两千万双袜子。只要你有想法, ai 就 能帮你把想法变成钱。 就是说解决啊! d p c v 四的发布,绝对是 ai 发展史上的一个里程碑,它不仅证明了中国 ai 的 实力,更打破了美国对高端算力和顶级模型的双重垄断。别人把 ai 做成奢侈品,我们把 ai 做成日用品。别人想垄断,我们想普惠,这就是中国公司的厉害之处。好了,今天就聊到这里,关注我,带你看这个变化的世界。

deepsea 干了一件让全球 ai 巨头集体失眠的事,用两个王炸直接打破偏见。 vc flash 版以三点四三万亿 token 周掉用量登顶全球调用榜。同时七百亿重磅融资,创始人梁文峰个人出资两百亿全力压住未来。如今中国大模型总掉用量连续四周超越美国, 把 open ai cloud 全甩在身后,他打破了巨头垄断,成为全球 ai 领域耀眼的新星。当中国创新者开始领跑属于我们的 ai 时代,已经以不可阻挡之势到来。

你敢信,调用一次中国性能最强的大模型,成本比发一条短信还便宜?就在今天, deepsea 扔了一个出乎所有人意料的王炸, v 四 pro 模型 api 的 价格 不是限时优惠到期恢复原价,而是直接永久锁定在百分之七十五二输出价格,每百万 token 降到六块钱,一次正常对话大约两千个 token。 意味着每次调用只要一分二厘,缓存命中的输入更是离谱, 每百万托肯子只要两分五厘,不到三分钱。一年前单次调用的平均成本在一到三毛钱,今天跌到了零头都不到。 deepsea 从发布第一天起跑的就是二点五折,原计划五月三十一号恢复原价,现在直接告诉大家,不恢复了,永久二点五折。这就不只是促销了,这是在改写行业规则。 deepsea v 四 pro 综合能力稳稳排在前三这一位,数学推理、代码生成、掌文本理解 和 g p t 四 o cloud sonic 四正面硬钢完全不落下风。而且它是开源模型,全世界任何一个开发者,任何一个创业公司都可以基于它做二次开发,不用被任何一家美国公司锁定。 用全球前三的性能,配上行业地板价的 a p i, 这才是最要命的地方。 g p t 四 o 输出定价约每百万 tokens 六十元, cloudsonnet 四约九十元,国内豆包 pro 约八元,门芯四点五约十二元, deepseek 只要六元。一个性能全球前三的模型价格是 g p t 四 o 的 十分之一, fod 的 十五分之一。而且 v 四 flash 版本输出只要两元,每百万托管一次缓存命中只要两分钱,两分钱跑一百万托管,核心在于 deepsea 字研的 m l a 架构, multi headlight 的 touch 传统大模型,推理时,每生成一个字,都要把所有对话内容的注意力全重重新算一遍。就好比你写论文,每次写一句新的话,都要把前面一百页重新读一遍。 mla 做了一个巧妙的优化,不让模型每次都读完整记忆,而是提取出压缩过的前空间表示。就像学生听课这记关键词,不记竹字口,推理质量几乎不变,计算量大幅下降。加上 deepsea 自建算力集群, 不走云厂商高一家路线,从芯片调做到推理引擎全面的优化。而且上下文窗口是一百万托肯,输出可达三十八万托肯。上下文越长, m l a 的 算力优势越明显。二点五折卖了几个月,如果亏钱, deepsea 可不会选择永久化, 这说明这个定价就是它们的真实成本,甚至还有利润空间。这不是补贴抢市场,是成本结构创新。 对于开发者来说,二十四小时语音助手、实时多 agent 的 协助,大规模代码审查这些。过去最大的障碍从来不是技术,而是成本。一次调用几毛钱,跑一个 agent 练几十次调用根本 hold 不 住。现在成本变成了可以忽略的变量。 计算资源成本在快速逼近内,这件事历史上不是第一次发生。算力从稀缺品变成商品,从商品变成基础设施,当核心资源像水电煤一样廉价时,真正颠覆性的应用才会爆发。 deepsea 这次降价,是整个 ai 行业进入非彼白菜价时代的信号。

deepsea 最近火的一塌糊涂,怎么用它来找客户呢?今天这条视频专门讲 deepsea, 你 是不是遇到这个问题?你听说 deepsea 很 厉害对吧?但你不知道客户会不会用 deepsea 来找本地商家。 你不确定 deepsea 跟豆包有什么区别,该不该重点做?背后原因是什么? deepsea 是 专门做 a a 大 冒险的,搜索逻辑呢,跟豆包不太一样。 deepsea 更看重内容的深度和准确性,如果你发的内容很专业,够详细,有干货, deepsea 就 愿意把你推荐给客户。 而且啊, deepsea 的 用户有个特点,喜欢深度研究,反复对比。像装修月子中心这种决策周期长的生意,用 deepsea 的 收的人特别多。具体该怎么做呢? 第一步,打开 deepsea, 搜阜阳加盟的行业,看看有没有你的店。第二步,如果不在,去百家号、今日头条发几篇干货内容。比如你是坐月子的,就写阜阳坐月子要注意什么?阜阳月子中心怎么选? 第三步,内容要写具体,不要写套话,越详细越好, deepsea 喜欢有深度的内容。第四步,把店名啊,地址啊,电话在内容里写清楚,方便客户联系你 做完能得到什么呢? deepsea 的 用户虽然比豆包少,但转化意向特别强,用 deepsea 搜月子中心的十有八九是真的要定你把 deepsea 的 推荐位占住了,来一个成交一个老板。这条你先收藏,下次要用的时候翻出来。