昨晚 deepsea 悄悄搞了个大动作,输入框上面多了两个图标,闪电和钻石。闪电是快速模式,日常对话秒回简单。快速。钻石是专家模式,专门对付复杂推理、数学和代码,思考有一定深度,但高峰时可能回复较慢。 我实际体验对比了一下,确实有点意思。我问了一个经典的逻辑陷阱问题,我家里洗车房就五十米,现在下着小雨,我是开车去洗车还是走着去洗车?先看快速模式的回答,他一上来就识破了这道题是个逻辑陷阱,但是 最后的答案还是开车去,理由是洗车吗?车必须要在现场才行,至于下雨,就当是免费预冲洗了。再看专家模式的回答, 专家就是专家,开头就点出了最明显的矛盾点,下雨天洗车图啥?而且很幽默的告诉我,走着去洗车,开车去洗车都不对。最终专家给出的答案也是,开车去。理由是因为下雨天洗车本身就是一种行为艺术,开车去才能完成整套表演。 总之,这次升级表面看是多了两个按钮,实际是 deepsea 改变了以往一刀切的服务模式,随着用户激增,类似今晚吃什么的提问越来越多, 不可避免的造成大量的算力浪费。而两种模式让模型在回答问题之前,经过一次算力调度,简单任务走低成本路径,复杂任务才启动高算力,从而有效降低整体的运营成本。 可以预见的是,未来专家模式很可能会演变为付费订阅制,为代码编辑、复杂分析等专业用户提供稳定高质量的服务。这也会是 deepsea 在 c 端商业化探索上的重要一步。
粉丝28获赞84

万众期待的 dc 大 版本更新就要来了,就在今天,二零二六年的四月八日, dc 网页版已经变了,新界面出现了快速模式和专家模式。这可不是简单的改版啊,这背后隐藏着很多重要的信号,下面我们来一一拆解。 第一层看点是产品逻辑变了。以前很多 ai 产品呢,都想用一个模式包打天下,但现在 dc 把快和强拆开, 转向按任务分成调用的新路线,新增的这两个模式,快速模式和专家模式,按字面意思其实也很好理解,是吧? 快速模式主打的一个是响应快,适合日常提问、普通聊天高频使用。专家模式呢,明显是冲着复杂任务去的,比如更长练路的推理代码、数学逻辑分析等等,但高峰时期可能要排队,速度还不一定快。 据说后面还有 vs 模式,这个可能不是常规的视觉模型,而是某种深度统一世界模型。 那第二层看点呢,是新版本微视落地前的信号了,界面先变,模式先开,部分用户先撤,这很符合大模型产品发布前的节奏。 而且距离 dc 上一个大版本的更新,也就是大家所熟悉的 r e 推理模型,已经过去了十五个月了,憋了这么久的大招,也该更新了。第三层看点啊,为什么外界对 dc 新版本微视这么关注,这么敏感呢? 这不仅仅是因为 dc 是 国民大模型,大家充满期待,还因为他们一直在推进一件更大更大的事情,就是国产芯片的适配。据多方消息报道, dc v 四已经深度适配华为升腾九五零 pr 芯片, 这可不是简单的兼容啊,而是从底层架构到上层模型,全链路原生优化,彻底摆脱对国外芯片英伟达的依赖。 那么过去国产模型大多先在英伟达芯片生态上面开发,再移植到国产芯片,性能呢?是打折, bug 不 断。而这次微视不一样,从设计之初就基于华为芯片架构开发,真正实现了中国芯片、中国模型的全站自主可控。 这意味着什么?意味着我们不再被国外芯片卡脖子算力,供应链完全自主可控!这绝对是里程碑式的突破。而这还不只是模型技术上的突破, 而是对中国整个 ai 生态体系起到革命性的突破。从芯片到模型,从技术到生态,中国 ai 终于走出了一条独立发展的新路线。

如果 deep six v 四这个月还不出来, ai 区一半的 up 主都要被狼来了这三个字送走了。你先别划,我后面要讲一个更刺激的,这次大家看到的灰度按钮,可能压根不是你以为的那个王炸版本, 而是一次很典型的铺路动作。顺手先说一句啊,关注我后面这种 ai 圈,半夜放风,早上炸锅,中午辟谣,晚上复盘的局,我给你盯着。大家好,我是杜宇,带你看懂 ai 赛道的钱和事儿。 先说事实,今天 it 之家发消息说梁文峰在内部沟通里透露啊, deepsea v 四会在四月下旬正式发布。注意啊,我这里说的是媒体原音内部沟通,不是 deepsea 官网正式官宣啊。所以这条消息你可以高度关注,但先别直接当红头文件盖章。 deepsea 的 同学如果刷到这条视频来评论区回我一下, 我今天纯属替全网催更。但说真的呀,这事现在已经有点狼来了那半了。最近几天大家都在盯 d p 个新版的灰度,结果很多人一上手,第一反应不是经验,而是就这我自己刷下来,包括很多用户测评,最明显的感受就是两个字,分层网页端。现在公开能看到的主流还是闪电和钻石这两个按钮, 一个偏快,一个偏复杂任务。可问题来了,有网友又给我发了五个按钮的版本,还有扮演模式、视觉模式、代码模式。所以我也想问问你们,你们到底被挥霍了几个按钮啊?打在公屏上, 我想看看全国网友到底谁是天选内测人。我自己现在的判断很简单,这一版先别挠,补成 v 四全面降临,更像是产品架构再重搭地基。哎。你看他的方向很明确,一个是把用户分层,轻任务走快,难任务走深。那个是把后面的 a 字的能力先埋进去。 p c 官方后续公开版本也一直在强调工具调用和 age 的 能力,这说明啊,行业已经不满足,会聊天都在充会执行。还有一个很现实的点,很多人猜,这波也在给全国产化适配铺路。因为真正往正企行业、国产芯片环境里走, 拼的就不只是榜单成绩了,还得拼部署成本、稳定性、兼容性。说白了呀,能打和能落地中间隔着一条护城河。所以我建议大家对这轮灰度稍微控一下预期,别一看见新按钮就以为明天直接把全球前排全断了。现在海外头部模型已经卷到快 g p t 六这条线了。 国内这边也不是 deepstack 一 家公司在跑,阿里的坤三、百度文星五点零月占面的 kimi k 二点五,再加上腾讯混元豆包,这些都在拼模型能力、工具链和应用入口。今天这场仗已经不是单点模型的升级了,是全战能力、产品节奏和生态卡位一起打。 从投资的视角看,这事更有意思。 deepsea 每往前一步,一级市场和二级市场都会一起抖一下,为什么呢?因为它会直接改写市场对国产大模型的定价逻辑。以前投模型,很多人看故事,看参数,看谁更像中国版的 open ai, 现在不太一样了,资本越来越看三件事,第一,你能不能把能力稳定跑出来。第二,你能不能真正接住 agent 这部商业化。 第三,你有没有机会把成本打下来,变成一个可复制、可部署、可结算的生意?一旦 v 四真出来,而且不是实验实验化,而是性能、成本、产品化,都往前拱一大步的话,那质谱、 minimax、 月值、暗面,这些公司的估值预期一定会被重新拉扯, 头部会更贵,中央部会更难,市场会更任强者恒强,也更不愿意给差一点意思的公司留耐心了。 讲得再直白一点儿, v 四如果真能打,影响的不只是 deepstack 自己,而是整个国产模型圈的时间表都要被迫提前,大家会更快上强推理更快上多模态更快上 agent 更快往行业方案和企业付费冲, 谁还停留在我也有个聊天助手,那基本上就是在 ai 牌桌上端茶倒水了。所以这条消息最值得看的不是四月下旬这四个字啊,而是它背后的信号, 国产大模型竞争已经从有没有进入到了谁先形成闭环,闭环一旦跑通,模型公司就不只是技术公司了,它会开始长出平台溢价、生态溢价,最后才是资本市场最爱听的那三个字,稳定性。 最后我还是那句话,别神话,也别看清 deepsea。 要真的把这一步走出来,受影响的不会只是 ai 圈的热搜,可能是未来两三年中国大模型产业的排位赛。 qq 四到底是真狼来了,还是又一次集体空耳呢?我们一起盯 deep six 的 同学啊。评论区给个准话,被灰度到五个按钮的朋友也别藏着了,发出来让我开开眼。点关注不迷路, ai 搞钱,我带路,我是杜宇,咱们下期见!

别等了, deepsea v 四真的要来了。 v 四四月上线,专为江板增效。别打招,去年 v 三靠 mo 一 架构把算力成本砍半,今年各种 agent 和小龙虾疯狂好讨论,成本又涨回去了。 deepsea v 最近当季专家模式上线,全是 v 四回头测试大模型落地,关键不是堆参数,是算力成本场景的综合能力。这次 v 四很可能再次定义 ai 性价比。

ok, 最近这个 deepsea 不是 更新了一个新的模式吗?他有一个快速模式,还有专家模式。然后呢,我们接下来测试一下新模式的一个能力啊。我们准备了一个天气卡片的提示词,然后我们发给他看一下他生成的效果如何。我们可以看到他这个已经开始生成了, 思考的内容非常非常的丰富,他一共思考了一分半。好的,他的这个卡片的代码已经生成好了非常的多啊,去用行一下看看效果,这个效果很不错。哎,我,我只跟他讲了一句话。 ok 啊,现在是我们把 tiffany 可一次性生成的天气卡片代码,然后放到了一个 html 的 文件里面,然后这是展示的一个效果。一次性啊,这个效果非常非常强,非常非常强。

hello, 大家好,非常激动,刚到家就给大家录视频。我有一个非常惊天的发现, deepsea v 四应该已经上架 api 端了。就在前几天,它已经上架了手机端和网页端的聊天儿灰度测试。 然后就在今天四月八号,手机端和网页端已经可以开启专家模式了,这证明 deepsea v 四已经上线了。抱着试一试的心情,我对 deepsea v 三点二进行了测试,发现它的数据跑分能力远超 jammer, 打平 os 超过 solit 四点六。好的,具体怎么操作的,我现在坐到电脑面前给大家看一看。 好的,我回到了电脑前,我被逼着要换模型做 open cloud 的 底座。于是呢,我就对国产四大模型进行了一个评测,我订阅了国产所有模型的 call 定 plan, 因为我这个人比较偏执,我要用就一定要用尽可能好的。当然, 如果使用 cloud code 的 a p i 的 话就太贵了,分分钟钟五万美金,十万美金就没有了。我用 oops 对 它进行一个测试,以及对所有的一个模型进行一个全量的测试。好的,那我们给大家看一下。最后我让这个 ops 进行了一个测试。 ops 的 测试一共是八个模型,二十四道题的一个全面的测试,而且它还使用了一个交叉互评最后的得分。从理科上来看, deepsea 和 ops 是 持平的,数学和编程是持平的,而且它们遥遥领先国内的别的模型,甚至遥遥领先 cloud 四点六模型。但是有一个有一个重点,就是它们一分之差啊, 但是它们的价格是差很多的, deepsea 的 a p i 调用的费用只有 opps 费用的六十分之一,非常非常的便宜。 ok, 这就是本期的一个测试内容了,简单的来讲, deepsea v 四一定是最好的,一定 带来颠覆性的改变。接着我给大家看一下,把它融入到我的工作流之后还我还跟他说,竟然 deepsea 给我去 ai 网,去完 ai 网之后, 他又给我做了一做了一批,做了一批之后后还给我生成了六张漫画,大家感觉感受一下。怎么样 漫画呢,就可以让我发图文社交媒体了,我觉得这个还是很不错的,对不对?简单的说,我用 kimi 的 api 来生成了一个简单的网站来展示这个评分,我觉得它太简单了,不过也还可以,该说的都说了,只是没那么深层。 然后呢,我让它固化成一个 skill。 把它固化成 skill 之后呢,以后我再生成类似的网站,我就不需要用 cloud code 了,我就可以用 kimi 直接进行生成了,这样成本就打下去了,这也算是一个干货,大家觉得有用的话 给我点赞。另外呢,视频也预告一下,我们的网页版 tipsy 已经可以做可以玩的游戏了,非常的强啊, 非常的强,可以做能玩的游戏。下一期视频我就详细给大家说一说。好的,点击关注,点击赞,拜拜!

兄弟们,万众期待的 deepsea 新版本终于要来了嘛,昨天盘后我看到有机构在说啊, deepsea 新版本在测试了,那 app 里面呢,是出现了一个新的专家模式,但是呢,因为 deepsea 之前确实是钞票太多次了,那我手机上的 app 呢,又没有更新, 所以昨天晚上呢,其实我还是抱着半信半疑的态度,然后昨晚准备睡觉之前呢,我再打开了一下 deepsea 的 app 啊,那就发现呢,我现在呢打开我的 deepsea app 的 界面啊,就是这个样子的, 大家可以看一下,左边呢是快速模式,右边呢是专家模式,大家呢,可以打开自己的 d p c a p p, 可以 看看有没有抽中绘图测试的资格。那抽中的小伙伴呢,可以来评论区里面说一声,我做个小统计啊,看看呢有多少比例的人抽中了这个绘测的资格。我直接问了一下 d p c 它的专家模式到底是什么大模型版本, 它呢只说自己是最新版本,那既不是 r 一 也不是 v 三啊,它说的是综合优化或者版本,没有明确说呢,就是市场比较期待的这个 r 二。然后我再多测试了一些问题, 发现最明显的变化就是回复速度啊,是比以前快了不少,但是呢,回答问题的深度啊,我暂时没有感觉到啊,有太明显的变化。主要是我之前就觉得 dsp 的 老版本呢,在单纯的回答问题的方面就已经做的不错了, 而代码编程呢,这方面呢,我还没来得及测啊,后面呢再给大家去更新。然后还有一点啊,这个专家模式呢,依然是不支持动态的,也就是说不支持图像语音视频输入,这一点呢,跟老版本是一致的,从目前的信息来看呢,其实还不足以去直接 下结论呢。就说呢,这就是 deepsea 的 r 二,但是呢,他们 app 上大张旗鼓的搞专家模式的追踪测试,那很有可能就是给新版大模型铺路,即使现在没来,那也应该是快了。反正呢,市场的热度还是挺高的啊,很多人在讨论。那恰好啊,今天早上呢,局势是有一些缓和,油价大幅回落,那科技股这边的资金呢,其实还是非常的兴奋的啊,看看市场对于这个事情怎么反应。


兄弟们, deepsea 掀桌子了,彻底不用英伟达换成华为了,速度还快了三十五倍,这一刀砍的是黄仁勋的大动脉。评论区扣个一,让我看看有多少兄弟关注这个事。以前训练 ai 模型离不开英伟达的芯片和系统,就像安卓离不开高通,苹果离不开 a 系列。 deepsea 干了什么? 把整套系统换成华为的了?从英伟达换到华为,就像从苹果换到安卓,整个生态系统全部重建,结果呢?好的比原来快三十五倍,能耗降百分之四十,成本只要三分之一。问问你自己,你公司买英伟达的卡花了多少钱?现在华为只要三分之一, 老板还会继续买贵的吗?我 it 的 兄弟最清楚,英伟达的 h 一 百一张卡,三十万起步,配一套训练集训 几千万砸不住。 appc 换成华为商腾九五零, pr 性能更强,价格更低,以前烧一个亿的训练费用,现在只交三千万。问问你自己, 你公司今年采购预算多少?省下来的钱老板会干什么?会不会砍掉一些不赚钱的部门?兄弟们,别觉得这个事跟你没关系。 ai 训练成本降三分之一意味着什么? 意味着更多公司用得起 ai 了,意味着更多岗位被 ai 抢了。以前 ai 训练太贵,小公司用不起你的岗位还能保住, 现在成本打三折,连小老板也买得起了,你的岗位还安全吗?问问你自己,你的工作有没有可能被 ai 替代?当 ai 便宜到人手空空的时候,老板凭什么留你?兄弟们,这次不是国产 ai 崛起, 整个 ai 底层逻辑变了,以前 ai 是 大公司的游戏,烧得起钱才玩得起,现在成本打三折, ai 会像手机一样普及,每个公司都能用,每个老板都会用,还觉得 ai 替代是以后的事, 还在想我的岗位不会被剥削吧?兄弟们,成本降三分之二,以前养不起 ai 的, 现在养得起的,以前不敢用的,现在敢用了, 你还在等什么?三条路今晚就能走。第一条,去了解华为升腾芯片,现在华为在招人, 这是下一个就业风口。第二条,学 ai 应用,别等技术来淘汰你,主动学会用 ai 工具。第三条,想想你的岗位会不会被替代,提前做准备,别等失业后才后悔。 兄弟们,关注我,每天掰扯一个 ai 替代现场 deepsea 换华为,砍到黄连勋一刀,下一个被砍的是谁?是你的岗位吗?评论区说说你是做什么工作的,觉得 ai 会不会威胁到你?

deepsea 的 v 四为什么迟迟出不来?根据官网的更新啊,出了快速模式和专家模式。那好多人都在催啊,赶紧上线吧,真的不要催,这件事情比想象的要难的多得多,而且要做足充分的准备。那难在哪? 上周外媒啊 information 的 报道说 v 四在做国产适配是在华为的申腾和韩无忌两家身上,那这边我们的官方是没有证实的,也不可能主动来证实,而且是永远不可能。后面我会说,为什么我们假设适配是真的,那你知道 适配国产算力底座,它不是把代码改一遍就行,而是要从底层的你的训练的语料,底层的代码迁移,算子翻译器,就是从硬件到软件,一 整个国产生态的适配,比想象的要复杂得多,得多得多。但是啊,这次它还不仅仅是真正的从零到一,还有一层双重的压力,国产适配以后,你的能力上要超越最新的从零到一,还有一层双重的压力,国产适配以后你的能力 gps, 它没有一个非 非常创新的点,我觉得没必要着急出来,因为国内现在也不缺模型用。那它为什么不直接在英伟达上直接迭代呢?很多人不知道,我觉得从去年的年初开始, tipsy 的 使命就是要 死磕国产酸粒生态了。因为对梁文峰来说, v 四在国产底座上训练出来,它其实有两层非常重要的意义。首先大家一定要意识到,这件事情是一件极其 高壁垒的事情。那在国产底座上从零到一,训练出一个全世界顶尖的大模型,这在国内将会是第一个。注意啊,我说的是从零到一以及顶尖两个前提,不要跟我杠什么讯飞啊质谱,从此 deep secret 就 可以摘掉那个国外给他扣上的非常傲慢的帽子啊,说他只会蒸馏的这顶帽子。而且 更重要的是未来国内的金融、教育、医疗这些国际民生相关的产业,它的安全自主可控的这个底层的要求,只要它未来布局 ai, 它都会长在 deepsea 的 底座上,这个是 巨大的产业级的机会,那机会越大,准备就要越充分。其实大家想过没有,一旦 v 四正式推出,背后对于国产算力的需求会是指数级的,你的产能准备好了吗?不管是深腾还是韩无忌,你今年有多少卡可以供得上?所以他要考虑这个发布的时机,是一个整个产业链的事情, 是单一一个模型的事情。那今天更新两个巴腾,市场就开始慌了,一旦正式发布,会有哪些影响?我先说我的观点,即便有一天正式推出了,我认为官方也不会告诉你,告诉我,告诉国内外的媒体,他是不是从硬件到软件,从工具全部是国产自主,让对手猜不透, 这是一种顶级聪明的战术。但是你会从年底的国内的 ai 算力的采购和消耗的数据上去直观的看到,从去年二零二五年,英伟达是百分之五十五的占比,华为是百分之二十, amd 百分之 四,大家可以猜一下,今年二零二六年会是多少呢?其实国外的算力产业会抖三抖,这个是一定的了啊,不止英伟达,我说的是包含整个算力产业链的所有,但是我认为影响更大的其实是国内的模型跟大厂,国外的这些公司,它毕竟是全 全球生态,全球产业链,而国内其实是在一个池塘里的竞争,国内的这些模型和大厂,你不快速的去适配国产算力生态,我认为至少要准备两套方案, 如果你不准备好,就我刚刚说的国际民生相关的这些产业机会,可能就跟你没啥关系了。这就是为什么有很多消息也在猜测,国内大厂都在加速的做适配, v 四一旦出来,国内的这些模型可能要等五等,所以啊, v 四的价值对于国产算力生态它是无价的,它会带动国内的模型和互联网大厂 真正意义上去主动地接纳国产算力,而不是被迫。 vs 的 发布会成为 ai 路线,就是中国和美国两条路线,一个真正意义上的转折点,全世界会真正意义上有两个选择,把整个算力价格打下来的一个底层逻辑,只有你有更多的选择了,价格才能下得来,对不对? 所以不要催啊,给梁文峰和他年轻的团队一些时间,也给其他的模型和厂商加速适配一些时间。那你们有什么看法也可以在评论区聊一聊,就这样,点赞关注不迷路。

deepsea 昨晚开始灰度测试,这次界面直接甩出两个新模式,快速专家。 deepsea 这波连夜改版到底在掩盖什么算力真相?如果你是天选之子,会看到这几个新入口带闪电的快速模式主打清亮, 而带钻石的专家模式专攻深度推理,并且专家模式被硬性限制了,不支持文件上传。为什么?因为砍掉文件解析,这个吞是 token 的 大户,是 deepsea 为了让专家模式继续全免费做出的最硬核的算力妥协。也有网友在传,第三种模式,视觉模式 应该不实,即使模型具备了视觉能力,应该也不会单开一个模式,不符合用户使用直觉。 为什么选在这个时间点推?这得联系到三月底那次长达十个小时的大当季,当时官方 a p i 好 好的 c 端却全线崩溃,这暴露出它的瓶颈根本不是模型智力,而是 c 端推理集群的算力严重短缺。 所以这次分层表面是功能上新,本质是用产品设计来给算力基建减压。日常闲聊走快速,硬核代码走专家按需调度。你是这次的辉度测试用户吗?来评论区分享一下。

华为呢,最近的话有一个新的 ai 芯片叫做升腾九五零,根据我这边得到的信息哈,咱们的国产的 ai 芯片升腾九五零的话呢,已经都被各大厂商给订购完了啊,现在大中型的厂商的话,都在针对升腾九五零做各种各样的算法的优化和迭代, 尤其是其中有一家很重要的公司啊,去年过春节那段时间,有一家公司火了, deep sec, 深 度求索,这家公司非常非常出名啊哈,他们那个时候靠什么火的呢?靠的是他们的 deep sec r e 二零二五年的三月份发布的,到现在的话一年了,根据我这边得到的一个最新的情况,就是说 deep sec v 四,它将首发适配华为的 ai 芯片。 可能很多人不理解这件事情,它到底有多牛?你们知道 deepsea 最早的时候它是怎么火出圈的吗?不是说这个人工智能它到底有多聪明,而是他们震惊的地方在于说这个 deepsea 它到底有多便宜。刚刚发布的时候,它的成本只需要 国外同样性能的人工智能大模型的二十分之一的成本就能够跑出,大概相当于是西方顶级的 ai 大 模型的差不多百分之九十以上的一个能力,这性价比一下就出来了,这就让西方人感到非常非常震惊, 那么它到底是怎么做到的呢?其实就是基于它在算子层面上的一个优化,一般咱们国内做大模型的,无论是阿里啊还是腾讯呢,它们都属于在软件层面,那么一般做软件的话是很难涉及到算子层 面的,但是 deepstack 它牛就牛,在这个地方它是在算子层面上做了优化,优化了之后的话提升了对应的 ai 芯片的计算效率。 但是在去年这个实验点深度求索是基于谁的算子去做的优化呢?是基于美国的英伟达 的这套生态的算子去做的优化,也就说是基于美国的库大生态去做的优化。现在我们即将要发布的这个 v 四的版本,它要全面的适配我们的国产的 a e i 芯片,而且将首发适配我们国产的, 也就是华为的这一套 ai 生态。在二零二五年的六月份的时候,其实华为做了一个非常非常重大的一个决策,将它的升腾的算子级别的能力全面开源。相对比而言的话,英伟达那套扩大生态,它是闭源的, 为什么要开源?这就要说到 deepsea, 当时在 v 三那个版本,他们虽然说基于英伟达这东西的话做了一些优化,做一些迭代,当他们想再往下更进一步的时候,就会发现一个最大的问题在哪里?最大的问题就是英伟达的这套生态是闭源的, 什么叫开源和闭源?它的区别到底是什么呢?就是意味着说像深度求索这样的技术能力非常非常强的公司,对于他们来讲的话,他们已经没有继续开发的空间了。因为英伟达这东西他不给你用,他不告诉你里面是什么样子的, 所以你就没办法改,就是一个黑盒,黑盒上面它只有几个接口,你往上插,插完之后你就能用,但是这个黑盒里面你是打不开的,你不知道这里面是什么东西,所以这就导致说你想改你改不了,但现在华为做了一件什么事情呢?把盒子给你打开了,让你看到每一个芯片的算子 它是如何去运行的,如何去计算。也就意味着说,如果你的技术能力真的足够强的话,你就可以深入到芯片的算子层面的话去做优化,而这件事情正是现在深度求索,我相信他们即将要做的一件事情。 而如果你用美国的那套 ai 芯片呢?也许它也能跑,但是因为它盒子里面东西它没动,所以它的效率将会远远低于我们国产的这套 ai 生态, 这意味着整个生态的替换呐。以前我们国内训练 ai 用的算力芯片基本上都是美国的, 而以后很有可能全世界未来所有的人工智能可能都要切换到我们国产的 ai 生态了,因 只有这套生态的话,跟 deepsea 那 套模型,那套架构是最适配的。全世界对于我们国产 ai 算力的需求一定会呈现一个叫做爆炸式增长,国内的 ai 算力芯片未来一定会供不应求,包括华为的升腾,包括韩五 g 等等,这些芯片将会从原来的背血变成未来的主流。所以啊,这颗叫做 deepsea 微四的石头一旦投下去之后,我们国内的 ai 大 模型的生态可能就会彻底建立起来,而且可以孕育出 非常非常多不同的可能。所以你看,对于美国来讲,它们还能靠 ai 继续收割吗?它们还能靠它们的 ai 芯片继续收割吗?没有办法了对不对? 而当这些传统的美国的这些高端的领域都没有办法再赚取暴利的时候,美股的那些巨头们还能够再继续维持高估值吗?很多人其实啊都没有意识到, 其实在人工智能这一块的话,中美之间正在进行一场非常非常激烈的技术竞争,但是我觉得他不是一个简单的技术竞争,我觉得甚至我们可以把这场人工智能之争,我们把它看作是一场国运之争。

就在刚刚, deepsea 网页端输入框上方多了两个图标,闪电对应快速模式。钻石对应专家模式。这个更新啊,看着只是多了两个图标,实际上是在把免费 ai 的 玩法重写,很多人还当他是改了个按钮。我直接说,简论 这一步已经踩进产品分层了,后面大概率连着算力分流、用户分层,甚至微次的前台预演都会一起跟上。 大家好,我是杜宇,带你看懂 ai 赛道的钱和事儿。相信很多网友已经关注到了。 deepsea 网页端输入框上方多了两个图标,闪电对应快速模式。当你把鼠标移到图标位置,会看到提示语,写的也挺直白的。就喜欢 deepsea 这种言简意概,通俗易懂、大众友好的风格。 一个快速模式适合日常对话,及时响应。第二个专家模式擅长复杂问题,高峰期可能需要等待。按目前公开实测和社区拆解,快速模式支持图片和文件识别,专家模式反而暂时不支持文件上传和多模态。这个细节特别有意思,强是强,功能没铺满 说明啊,它现在更像一条灰度中的高推理通道,还在试跑。更关键的是,它和上一版的区别根本不在图标。在产品语言以前, deepsea 前台给你的是深度思考按钮,用户得自己琢磨什么时候该开,开了到底意味着什么。现在它把技术黑化翻译成人化了,哎,你要快还是要强? 这个动作特别像我平时看项目的时候,最关注的一件事,有没有把模型逻辑翻译成用户能秒懂的选择题。你不需要懂 reason, 不 需要懂 thinking, 也不用关心后面挂的到底是哪一套参数,点闪电就干活,点钻石就空间门槛儿一下就下来了。 那他为什么现在做这个更新呢?我觉得有三层,第一层最现实就是算力大模型,最怕所有人都开大马力去问中午吃啥,把日常低难度请求导去快速模式,把数学代码、复杂分析这类的高价值任务送进专家模式,整个系统的吞吐延迟、峰值压力都会好看很多。 第二层是商业化准备入口,一旦分层,后面的限额、优先级会员套餐其实都能设置挂上去。 deepsea 以前还是太克制了,网页端长期免费,大家一锅炖,现在它开始让用户感知能力有档位,哎,这一步非常产品经理,也非常商业。 第三层是传播效率,闪电和钻石这种符号啊,截图一发,所有人都懂,比深度思考这四个字更像消费级产品了。再往深一层看, 这次更新还挺像 deepsea 一 贯的迭代逻辑,底层先跑前台轻轻放,先会度,少开发布会,让用户自己发现带,靠社区和口碑把热度供起来。它以前更像是模型先行,这次明显开始往产品先分流走了。这个变化我觉得比单次能力提升还要重要,因为从今天开始, deepsea 前台不再只是一个聊天框, 它更像一个调度台,你眼里看到的是用户路径、资源分配,还有下一步怎么接更多的能力。 那这事和 v 四到底有什么关系呢?我先把边界说清楚,官方目前明确公开对外服务的正式版本还是 deepseek v 三点二,这一点官网文档写得很清楚。至于专家模式是不是已经上 v 四了,或者访间传授的 v 四 light, 今天都没有官方认领。更稳一点的讲法就是它很像一个更强模型的灰度入口,也很像在给 v 四时代做前台预演。先把快和强的路由跑顺,让用户习惯不同任务,走不同通道,后面针切更强的模型,用户几乎无感。 社区还从前段代码里翻到过 vision 的 线索,这也很像后续路线,先把快慢分层立住,再把视觉多模态慢慢接上。所以我自己的判断是,专家模式未必等于完整的 v 四,但它大概率和 v 四的产品形态有强关系,像彩排,像试营业, 想先把舞台灯光都调好,主角上场就只差一步。那最后说说普通人到底能得到什么。第一个影响特别直接啊,以后别什么活都一股脑的点最强,写文案,改简立读图,看文件,日常问答先用闪电,速度快,体验通常更丝滑。 第二个影响是碰到要拐好几个弯的事,再点钻石,比如南代码,复杂数学研究框架,商业分析,这种任务对推理链的要求高,专家模式更值。 第三个影响也很现实啊,别被专家两个字辅助他限阶段不一定全能,尤其是你要传文件读图,有时候快速模式反而更顺手。第四个影响是心态上要更新,你今天看到的是双模式,过阵子很可能就是双额度双权限,甚至双价格。 很多人以为 ai 产品就是谁模型分高谁就赢。我越来越觉得真正拉开差距的是谁,先把能力变成可用的路径,所以我给这次更新的定性很简单, deepsea 终于从模型很强走到了产品开始长芽了。 这步一旦迈出去,后面每一次升级,大家盯的都不只是跑分了,还要盯入口、路由限制、功能组合。谁先看懂这个变化,谁用 ai 就 会更省时间,也更容易踩中新机会。点关注,不迷路, ai 搞钱,我带路,我是杜宇,咱们下期见!

呃, deepsea 微四今天上架了专家模式,在网页端和 app 端都可以看得到,然后很多人说这个专家模式非常屌,就是脚踢 gpt, 拳打 cloud, 所以 我就好奇试了一下,然后我发现跑出来的结果可能没我想象中的那么好。 当然很多人会说,这个 deepsea v 四本来是在会度测试啊,然后那他跑了这个 svg 图,我觉得 svg 图它是没办法跑,比得过这个 gpt 还有 java 的 svg 图的。就是我简单的试了一下,呃,包括简单的提示词,复杂的提示词我都试了。 然后另外我想说的就是,截止今天,我不知道梁文峰会不会后悔,因为国内的开源大模型 mini max, 智谱,包括将来要上市的 kimi, 包括今月星辰,他们的有些市值已经上千亿了,对吧?大家也看到这个 mini max 和智谱。 呃,如果 deepsea 当时选择做成一个上市公司,我不知道会不会更好,它能不能享受到更多的资源,然后 deepsea 会不会进步的更快? 但显然我觉得如果 deepsea 没有商业化,可能会有一些资源没有那么好。 呃,也可能。当然我我不否认梁文峰是一个纯粹的人,我只是今天在想,如果 deepsea 商业化,会不会他做的会更好,或者是他的技术会更强? 呃,这都是不可而知的嘛,因为今天大家都知道 mini max。 呃,这个质朴,包括那个几月星辰,包括阿力的千问,再包括各家很多的模型,包括小米的 mimo, 对 吧?呃,包括 mimo 那 个主要的负责人罗浮丽也是从这个 deepsea 跳槽到小米的。 如果,假设,假设,可能这个 deepsea 商业化了,然后能给到这种研究人员更好的薪酬,会不会 deepsea 今天会不一样?或者是 deepsea 微四今天会不一样?嗯,可能会更好吧。就是我的一种假设嘛。

大家好,欢迎来到本期视频, deepseek 官网刚上线了新模型和新界面, 目前官方信息还比较少,但外界普遍猜测这就是 deepseek v 四模型,目前正在逐步推送,我已经抢先用上了,所以我用自己的测试机测了一下,我也觉得它就是 deepseek v 四。 为什么这么说呢?我们来看看我做的深层测试和单次提示测试表现。首先带大家看看它的界面,可以看到这里有两个选项,分别是基石和专家模式,你可以根据需求进行选择。 专家模式通常对应最强体量最大的模型,也就是 deepsea v 四。这里也支持上传图片等内容,只要上传图片,系统会自动切换到基石模式, 这说明它应该是一个多模态模型。还有一点是专家模式下目前不支持运行多个提示词,在不同县城中同时进行,每次只能处理一个提示词。 话不多说,我们来看看效果。首先我让他画一张一千五百八十五平方英尺的三 d 户型图, 要求包含两个卧室,两个卫生间,并且要符合实际居住需求。使用 h t, m l, c, s, s 和 g s, 并结合 three g s, 最终只生成一个 h t m l 文件,方便我直接运行查看。来给你们看个东西,这效果真的很赞, 可以看到它的布局非常合理,浴室也能看得很清楚,甚至还有卧室,体验非常棒。接着我让它生成一个 svg, 内容是熊猫手拿汉堡。 这次的效果不太行,看着不太协调,你看这手部的比例完全不对,表现确实一般。接着我让它用 three js 做个精灵球, 要求只输出一个整合好的 html 文件,做出来的效果确实很赞。我发现它越来越倾向于使用深蓝色调, 这风格感觉跟 gpt 四之类的模型很像,所以这个做得相当不错。随后我让它做一个带全套棋子的棋盘,并加上自动对弈功能,可以自动走棋,直至决出胜负。 我只需要你生成一个 html 文件,你看它呈现的效果还不错,看起来真的很棒。看得出来这个游戏完成度不错,但控制功能完全没法用。 接下来是花园里一只翩翩起舞的精美蝴蝶,我要求它生成一只在花园中飞舞的精美蝴蝶。要求是三 d 效果,可以用 free g s 来实现。我还应该能移动镜头 背景也得是蓝色的,效果也不太行,可以看到代码是可以跑通的,但这蝴蝶看起来更像沙奈朵,完全不像。蝴蝶表现确实很一般。接着我让他做几道简单的题,结果表现也不怎么样, 回答问题时总是中途卡住,体验非常糟糕。显然这些问题在 a p i 版本中或许会得到解决。我觉得他表现还不错,但规模可能不如之前的 r 一, 不过还得再看看。以上仅是我的一些初步看法,以及我目前能做的测试,也欢迎在评论区分享你们的看法,等它正式全量发布后,我再进行综合评价。总之它确实挺酷的。总之,欢迎在评论区留言交流。

大家好,我是 ai 启示录。最近这段时间,整个 ai 圈最受关注的国产大模型毫无疑问是 deepsea, 从开源模型图榜到海外用户疯狂追捧,甚至被不少人称作是能对标国际顶尖水平的国产黑马。 但就在三月三十日,一条消息直接刷屏, deepsea 服务出现了波动,而且前后断断续续,整整持续了十多个小时。 很多用户吐槽网页打不开, app 一 直转圈登录不上,绘画建不起来,好不容易恢复了,刷新一下又掉了线。但更有意思的是,不少日内人看完这场事故,反而说了一句,这对 deepsea 来说其实是件好事。为什么这么说? 因为这场发生在深夜的服务波动,刚好给 deepsea 的 创始人梁文峰敲了最及时也最响亮的一次警钟。毕竟坊间一直有传闻,四月份 deepsea 就 要发布万众期待的新版本了, 如果连现在这点流量都扛不住,等到新版本发布,全网甚至全球的用户都涌进来的时候,后果可想而知。接下来,我们先把这件事的来龙去脉给大家完完整整讲清楚。 按照 deepsea 官方状态页公布的时间线,这次事故最早出现在三月二十九日晚间二十一点三十五分,官方标记网页和 app 的 对话服务出现异常。 到了当晚二十三点二十三分,官方说问题已经修复,进入监控状态。结果没想到仅仅过了不到一个小时,三月三十日零点二十分,服务再次出现性能波动,这一下就直接持续到了当天上午十点三十三分,官方才正式标记问题彻底解决。 前后算下来,从第一次出现故障到最终完全恢复,整整过去了十三个小时,中间就算有短暂恢复,也很快再次中断。 对普通用户来说,就是长达十多个小时的服务不可用。很多人一开始以为是 deepstack 的 模型出了问题,或者是算力不够用了,推理服务扛不住了。但其实不是, 模型本身的推理服务,尤其是 api 服务,并没有出现系统性的故障。真正出问题的是用户从打开网页、登录账号、进入对话框,到发起对话、读取历史聊天记录的这一整条前端链路。 这里我也要给大家做一个区分。很多人分不清模型服务出问题和入口服务出问题到底有什么不一样?如果是模型本身的推理资源不够了,通常表现出来的是回复变慢、排队时间变长,生成内容中途中断或者高峰期给你弹出一个统一的服务繁忙提示。 但如果是入口服务出问题,就是你连登录都登不上,网页一直白屏转圈,对话根本建不起来,刷新一下直接掉线,连让你排队的机会都没有。 这次 deepsea 的 故障,完全符合后者的特征。当然,到目前为止, deepsea 官方并没有公布这次事故更底层的根音,我们也不能断言到底是网络分发节点出了问题,还是数据库出现了瓶颈。但从目前公开的信息来看,我们至少可以确定一件事, 这次长达十多个小时的服务波动,核心问题不是模型能力不行,而是承接用户访问的整套交付系统掉了链子。 说到这里,很多朋友可能会问,不就是服务器波动吗?现在哪个热门 app 没遇到过?至于这么多人拿出来说吗?真正值得我们关注的,从来不是服务波动这件事本身,而是这件事背后两个特别反常,也特别值得深究的细节。第一个细节就是事故发生的时间。 第一次故障出现在北京时间三月二十九日晚上九点多,第二次复发是在零点之后。说实话,这个时间点对于国内用户来说,既不是工作日的白天高峰,也不是周末的晚间黄金时段,算不上是能把一个全国性热门 app 直接压穿的常规流量峰值,更别说第二次故障发生在凌晨。 难道真的有那么多国内用户大半夜不睡觉,疯狂刷新 deepsea, 把服务器给刷爆了?但如果我们把这个时间点换算成海外时区,情况就完全不一样了。北京时间的晚上九点多,对应的是欧洲中部时间的下午两点多,美国东海岸的上午九点多, 这刚好是欧洲和美国东海岸两个主要英语用户时区的活跃时段,两个时区的用户重叠在一起,形成了一个海外用户的访问高峰。那为什么偏偏这个时候会有这么多海外用户集中去访问 deepsea? 这就要说到第二个反常的细节,也就是最近在海外社交平台上传的沸沸扬扬的一个传闻。有海外的 ai 博主发了帖子,说自己测试发现,现在 deepsea 网页端的模型已经不会再像以前一样自称 deepsea, 而是会统一说自己是 deepsea v 三, 而且输出的代码风格、回答逻辑和几天前完全不一样,所以很多海外用户推断 deepsea 已经偷偷把网页端的模型换成了即将发布的新版本,只是故意伪装成 v 三掩人耳目。 这条帖子一出,直接在海外 ai 圈炸了锅,无数海外用户不管是平时用不用 deepsea 的, 全都涌了过来,疯狂刷新页面、登录账号、开新的对话,反复提问测试,就是想看看这个模型到底是不是传说中的新版本,到底有没有偷偷升级。 对一个互联网产品来说,最可怕的流量从来不是正常的日活流量,而是这种围观式的探测流量。 正常的用户流量是什么样的?大家打开 app 是 真的要问问题,要干活,要使用功能,行为是相对平缓的,请求也是循序渐进的,不会给系统带来突然的极端冲击。但这种围观探测流量不一样,它的核心不是使用产品,而是验证传闻、测试变化。 大量用户在同一个时间段里集中做同一件事,反复刷新首页、反复登录账号,反复开新的对话,反复重连页面。 这种流量对模型本身的推理压力其实不大,但对外部对话服务,也就是我们说的入口服务。对话服务的压力是毁灭性的。为什么这么说?我给大家拆解一下这个恶性循环的过程。一开始只是短时间内大量用户同时访问首页,发起登录,创建新对话。 最先被顶到压力峰值的不是负责生成答案的模型,而是负责分流,健全管理对话的前置服务。 紧接着这些请求要去读取用户的账号信息、历史聊天记录上下文数据,负责存储这些内容的缓存和数据库读写压力瞬间拉满,连接池直接被占满。少数慢请求很快就变成了大量的排队请求,排队一多,前端就会出现超时掉线。 用户看到页面不动了,第一反应是什么?绝对不是乖乖等着,而是疯狂刷新页面,退出重登,再开一个新的绘画。 这样一来,系统一边要处理还没消化完的旧流量,一边又要接住用户刷新制造出来的新一轮流量,压力直接翻倍。这个时候,就算你临时加服务器扩容节点,也未必能解决问题,因为负责管理用户登录状态对话历史的服务是有状态的服务。 什么叫有状态?就是系统需要记住你是谁,你之前聊到了哪?这轮对话是不是你的?不像无状态的应用,加机器就能扩容,有状态的服务会受制于共享缓存、数据库、连接池存储的读写能力,不是简单加服务器就能解决的。 到了这个阶段,最麻烦的已经不是有多少人在用,而是系统开始自己放大问题,用户越卡越刷新,越刷新系统越卡,就像一扇本来就卡住的门,后面的人还在拼命往前挤,最后只能彻底堵死。这也是为什么这次 deepsea 的 故障第一次修复之后,很快就再次复发, 形成了长达十多个小时的连续异常。说到这里,大家应该就能明白为什么我说这次服务波动对 deepsea 来说是一件好事, 因为他提前把 deepsea 当前最致命的短板完完全全暴露在了聚光灯下。过去一年多的时间里, deepsea 能从一众国产大模型里杀出来,靠的是什么?靠的是顶尖的模型能力,极致的训练效率,在开圆圈的超强影响力。 从 deepsea v 三到推理模型 r 一, 再到后续的版本更新, deepsea 每一次出手都能在页内掀起波澜,甚至在很多国际评测榜单上都能和国际顶尖的大模型打得有来有回。但我们必须承认一个现实,面向普通用户的消费级市场,从来不是只看模型能力的。 对绝大多数普通用户来说,他们根本不会去关心你的模型在评测榜单上比对手高了零点几个百分点,你的上下文窗口涨了多少?你的推理能力强了多少?他们对产品的判断标准特别简单,我能不能打开?能不能登录,能不能稳定的得到回复? 你跟用户说,我的模型是世界顶尖的,但是我的网页经常打不开, app 经常掉线,用户会怎么想?他只会觉得你这个产品不行。用户不会把模型很好,只是服务不稳当成两件独立的事。在他们眼里,打不开的产品就是不好的产品。 模型评测榜单领先,影响的只是日内的专业讨论,但服务高峰期连续波动,影响的是每一个普通用户的真实记忆参数差一点,推理慢一点,普通用户未必能感受出来。但网页能不能打开,服务稳不稳定,所有人都能看得清清楚楚。 而这次事故最核心的警示意义,就在于,它给即将到来的 deepsea 新版本提前做了一次压力测试。关于 deepsea 的 新版本,虽然坊间已经传得沸沸扬扬,有无数种说法, 但到目前为止, deepsea 的 官方文档里并没有正式发布新版本的相关说明。官方 api 文档里公开的主线版本依然是 v 三系列,但不管新版本什么时候发布,只要它一上线,必然会带来一场远超现在的流量冲击。为什么? 因为新模型只要发布,必然会带来更强的推理能力,更长的上下文支持、更适合代码、智能体这些高强度的使用场景。 这也就意味着,单次对话占用的系统资源只会更重,不会更轻。再叠加媒体的关注、页内的讨论、普通用户的尝鲜、开发者的测试,还有海外用户的疯狂围观, 新版本发布当天, deepsea 要面对的流量压力必然会比平时高出好几个量级,而且这种流量和我们平时说的平稳增长的流量完全不一样, 它是由外部预期驱动的,突发的、集中的同步访问既不可预测也不均匀,还会优先冲击网页和 app 的 入口层,恰恰就是这次出问题的地方。其实这已经不是 deepsea 第一次在稳定性上遇到挑战了。 早在今年一月, deepsea 就 在海外应用商店热度暴涨之后,出现过大规模的服务异常。当时官方还公开表示服务遭遇了大规模恶意请求,临时限制了新用户注册。 而到了三月,短短一个月的时间里,根据官方状态页的记录,三月十日,网页和 app 一 度不可用。三月十八日,网页和 app 再次出现性能波动,再到这次长达十多个小时的连续异常,这已经不是某一次的突发事故,而是一个反复出现的问题。 只要流量一上来,关注度一高,网页和 app 端的服务稳定性就会优先遇到挑战。模型发布带来关注,关注带来流量高峰,流量高峰又反过来暴露了交付系统的薄弱。对现在的 deepsea 来说,模型能力已经不是它的软肋, 真正的软肋是把顶尖的模型能力稳定顺畅地送到每一个用户面前的工程化能力。很多人觉得大模型公司的竞争就是拼算力数量、拼参数规模、拼模型能力。 但其实,当一个大模型公司走到 deepsea 这个规模,真正决定用户体验上线的已经不只是算力的多少,而是全链路的容量治理能力,是整套交付系统的稳定性。 deepsea 现在面对的已经不是封闭的小众流量,而是带有全球传播属性的公共流量。 只要他的下一代模型继续保持现在的话题性和影响力,未来他要面对的用户结构只会越来越复杂。有人是真的来使用产品,有人是来围观凑热闹,有人是来做高强度的极限测试,还有人只是想验证一下新版本有没有上线。 这些不同的用户带来的是完全不同的流量结构,也对整套系统的稳定性提出了更高的要求。从这个角度来说,这次十多个小时的连续异常不是一件坏事,它没有发生在新版本正式发布的那一天,没有在万众瞩目的时候让 deepsea 掉链子, 他提前暴露了问题,给了 deepsea 足够的时间去补全自己的短板,去优化整套交付系统,去做好迎接新版本冲击波的准备。对整个国产大模型行业来说,这件事也同样有警示意义。 过去这几年,我们的大模型行业一直在疯狂,卷参数卷性能卷榜单、卷开源,所有人都在比谁的模型更强,谁的技术更领先。但很多人都忽略了,大模型的终局从来不是实验室里的技术报告,而是落到每一个用户手里的产品,体验 一个顶尖的模型。只有能让每一个普通用户随时打开,随时能用,随时能得到稳定的回复,它的价值才能真正被释放出来。否则,就算你的模型再强,用户连入口都进不去,一切都只是空谈。我是 ai 启示录,感谢点赞与关注,我们下期再见!

deepsea 深夜悄悄上线了专家模式,可能维斯版本真的要来了?简单试用了一下,和豆包以及 kimi 那 种深度研究不太一样。 目前专家模式整体使用下来没有发现有什么特别的地方,他如果进去没有发现这个模式的话,可以退出来,等会重进应该就有了。看到还有人发了网页版的截图,还支持扮演模式视觉模式代码模式。如果这个截图是真的话,那大概率就是维斯版本了。他如果有新的发现,也欢迎交流。

兄弟们,你们可以说我之前在 open rota 的 mimo 的 模型是搞错了,对吧?不是 deepsea v 四,但是今天晚上十一点左右,我实测了这个 deepsea 的 网页端,这绝对不是 deepsea v 三点一、三点二能做出来的效果。 我给你看一下时机的效果,时机的粒子效果,我新测的前端的能力以及 deepsea, 我 感觉这次应该是 v 四稳了,它我觉得它已经上架网页端了,它带出来的这个效果包括整个前端的效果,包括 svg 图, 这绝对是 deepsea v 四,我觉得你们还记得之前我用 mini 模型生成的这个粒子图以及粒子效果,对吧?它会把这个米粒撒在外沿,那这次我们用 deepsea 网页端新上架的这个模型能力测试一下,看一下它到底怎么样,好不好? 我觉得这个粒子效果已经没谁了,他能做到这个效果,我不断的改清道速度,包括清道的这个角度,包括重力,包括粒子数量,我觉得它是比 miimo 强大的多的一个模型,它绝对也是万亿参数的模型。 我不知道现在是不是在会读测试,我会把完整的我跑的代码,以及完整的整个 deepsea 新上架网页端的推理过程全部截图给你们看, 录视频给你们看。这次网页段上架的这个新模型也非常接近,这就是让我非常兴奋。那对于我一个特别喜欢玩 ai 的 人,我觉得那么今天这个网页段新上新的能力,我觉得这应该就是 d p、 c 和 v 四了吧, 有没有知情的朋友告诉我一下,就是让我这种紧张而又忐忑的而又开心的心落下来呢。我,我简直看到这种能力,我有时候有点语无伦次。

deepsea 更新了,现在在移动端开启了会读测试,然后他有超强的一百万上下文,还有他知识库更新到二零二五年的五月份,不知道是不是 v 四模型,但是根据以往的经验呢,我估计不是 啊,可能在大年大年的时候会发布一个更强更新的模型,然后之前有据可靠消息呢,这次增强了啊,因为所有的模型都在卷这个方向增强这个编码。

重磅消息! dbisk 微四版本即将发布!微四版本是一次架构革命!核心亮点第一,百万 token 超级记忆,上下文创可可达百万级 token, 相当于二十本小说,全程连贯不失忆。第二,编程能力全球第一, 超越了 gpt 五点二和这个 cloud ops, 数十万行跨文件理解和重构能力。第三,原生多模态实现图像视频的深度融合, 无需 o c r 的 中转,看完设计图直接出代码。第四,国产算力彻底去掉了英伟达,百分之百跑在华为升腾九五零芯片上,大大降低了成本,大概是 g p t 四的七十分之一。 第六,推理速度提升三十五倍,显存占用减少百分之六十五。一句话总结,微视版本拥有超级记忆能力、顶级程序员的能力、多模态的能力和极致性价比的能力,再也不需要使用国外的大模型了,赶紧把你们订阅的国外的大模型退掉吧!关注我,交个程序员朋友!