hello, 大家好,非常激动,刚到家就给大家录视频。我有一个非常惊天的发现, deepsea v 四应该已经上架 api 端了。就在前几天,它已经上架了手机端和网页端的聊天儿灰度测试。 然后就在今天四月八号,手机端和网页端已经可以开启专家模式了,这证明 deepsea v 四已经上线了。抱着试一试的心情,我对 deepsea v 三点二进行了测试,发现它的数据跑分能力远超 jammer, 打平 os 超过 solit 四点六。好的,具体怎么操作的,我现在坐到电脑面前给大家看一看。 好的,我回到了电脑前,我被逼着要换模型做 open cloud 的 底座。于是呢,我就对国产四大模型进行了一个评测,我订阅了国产所有模型的 call 定 plan, 因为我这个人比较偏执,我要用就一定要用尽可能好的。当然, 如果使用 cloud code 的 a p i 的 话就太贵了,分分钟钟五万美金,十万美金就没有了。我用 oops 对 它进行一个测试,以及对所有的一个模型进行一个全量的测试。好的,那我们给大家看一下。最后我让这个 ops 进行了一个测试。 ops 的 测试一共是八个模型,二十四道题的一个全面的测试,而且它还使用了一个交叉互评最后的得分。从理科上来看, deepsea 和 ops 是 持平的,数学和编程是持平的,而且它们遥遥领先国内的别的模型,甚至遥遥领先 cloud 四点六模型。但是有一个有一个重点,就是它们一分之差啊, 但是它们的价格是差很多的, deepsea 的 a p i 调用的费用只有 opps 费用的六十分之一,非常非常的便宜。 ok, 这就是本期的一个测试内容了,简单的来讲, deepsea v 四一定是最好的,一定 带来颠覆性的改变。接着我给大家看一下,把它融入到我的工作流之后还我还跟他说,竟然 deepsea 给我去 ai 网,去完 ai 网之后, 他又给我做了一做了一批,做了一批之后后还给我生成了六张漫画,大家感觉感受一下。怎么样 漫画呢,就可以让我发图文社交媒体了,我觉得这个还是很不错的,对不对?简单的说,我用 kimi 的 api 来生成了一个简单的网站来展示这个评分,我觉得它太简单了,不过也还可以,该说的都说了,只是没那么深层。 然后呢,我让它固化成一个 skill。 把它固化成 skill 之后呢,以后我再生成类似的网站,我就不需要用 cloud code 了,我就可以用 kimi 直接进行生成了,这样成本就打下去了,这也算是一个干货,大家觉得有用的话 给我点赞。另外呢,视频也预告一下,我们的网页版 tipsy 已经可以做可以玩的游戏了,非常的强啊, 非常的强,可以做能玩的游戏。下一期视频我就详细给大家说一说。好的,点击关注,点击赞,拜拜!
粉丝82获赞374

如果 deep six v 四这个月还不出来, ai 区一半的 up 主都要被狼来了这三个字送走了。你先别划,我后面要讲一个更刺激的,这次大家看到的灰度按钮,可能压根不是你以为的那个王炸版本, 而是一次很典型的铺路动作。顺手先说一句啊,关注我后面这种 ai 圈,半夜放风,早上炸锅,中午辟谣,晚上复盘的局,我给你盯着。大家好,我是杜宇,带你看懂 ai 赛道的钱和事儿。 先说事实,今天 it 之家发消息说梁文峰在内部沟通里透露啊, deepsea v 四会在四月下旬正式发布。注意啊,我这里说的是媒体原音内部沟通,不是 deepsea 官网正式官宣啊。所以这条消息你可以高度关注,但先别直接当红头文件盖章。 deepsea 的 同学如果刷到这条视频来评论区回我一下, 我今天纯属替全网催更。但说真的呀,这事现在已经有点狼来了那半了。最近几天大家都在盯 d p 个新版的灰度,结果很多人一上手,第一反应不是经验,而是就这我自己刷下来,包括很多用户测评,最明显的感受就是两个字,分层网页端。现在公开能看到的主流还是闪电和钻石这两个按钮, 一个偏快,一个偏复杂任务。可问题来了,有网友又给我发了五个按钮的版本,还有扮演模式、视觉模式、代码模式。所以我也想问问你们,你们到底被挥霍了几个按钮啊?打在公屏上, 我想看看全国网友到底谁是天选内测人。我自己现在的判断很简单,这一版先别挠,补成 v 四全面降临,更像是产品架构再重搭地基。哎。你看他的方向很明确,一个是把用户分层,轻任务走快,难任务走深。那个是把后面的 a 字的能力先埋进去。 p c 官方后续公开版本也一直在强调工具调用和 age 的 能力,这说明啊,行业已经不满足,会聊天都在充会执行。还有一个很现实的点,很多人猜,这波也在给全国产化适配铺路。因为真正往正企行业、国产芯片环境里走, 拼的就不只是榜单成绩了,还得拼部署成本、稳定性、兼容性。说白了呀,能打和能落地中间隔着一条护城河。所以我建议大家对这轮灰度稍微控一下预期,别一看见新按钮就以为明天直接把全球前排全断了。现在海外头部模型已经卷到快 g p t 六这条线了。 国内这边也不是 deepstack 一 家公司在跑,阿里的坤三、百度文星五点零月占面的 kimi k 二点五,再加上腾讯混元豆包,这些都在拼模型能力、工具链和应用入口。今天这场仗已经不是单点模型的升级了,是全战能力、产品节奏和生态卡位一起打。 从投资的视角看,这事更有意思。 deepsea 每往前一步,一级市场和二级市场都会一起抖一下,为什么呢?因为它会直接改写市场对国产大模型的定价逻辑。以前投模型,很多人看故事,看参数,看谁更像中国版的 open ai, 现在不太一样了,资本越来越看三件事,第一,你能不能把能力稳定跑出来。第二,你能不能真正接住 agent 这部商业化。 第三,你有没有机会把成本打下来,变成一个可复制、可部署、可结算的生意?一旦 v 四真出来,而且不是实验实验化,而是性能、成本、产品化,都往前拱一大步的话,那质谱、 minimax、 月值、暗面,这些公司的估值预期一定会被重新拉扯, 头部会更贵,中央部会更难,市场会更任强者恒强,也更不愿意给差一点意思的公司留耐心了。 讲得再直白一点儿, v 四如果真能打,影响的不只是 deepstack 自己,而是整个国产模型圈的时间表都要被迫提前,大家会更快上强推理更快上多模态更快上 agent 更快往行业方案和企业付费冲, 谁还停留在我也有个聊天助手,那基本上就是在 ai 牌桌上端茶倒水了。所以这条消息最值得看的不是四月下旬这四个字啊,而是它背后的信号, 国产大模型竞争已经从有没有进入到了谁先形成闭环,闭环一旦跑通,模型公司就不只是技术公司了,它会开始长出平台溢价、生态溢价,最后才是资本市场最爱听的那三个字,稳定性。 最后我还是那句话,别神话,也别看清 deepsea。 要真的把这一步走出来,受影响的不会只是 ai 圈的热搜,可能是未来两三年中国大模型产业的排位赛。 qq 四到底是真狼来了,还是又一次集体空耳呢?我们一起盯 deep six 的 同学啊。评论区给个准话,被灰度到五个按钮的朋友也别藏着了,发出来让我开开眼。点关注不迷路, ai 搞钱,我带路,我是杜宇,咱们下期见!

deepsea v 四四大升级预判?大家盼了很久的 deepsea v 四马上就要来了,结合日内消息和当前大模型趋势,我大胆预测一下, v 四版本将会有以下四大升级, 第一,网传编程能力相比上一代会有大幅突破, acb 一 b 只是权威编程机制,网传 v 四得分百分之八十三点七,超过 gbt 五点二, cloud 二 or 四点五,如果数据准确的话,就是国产大模型首次在这个指标中表现突出。 第二,百万头等上下文, gpt 四欧月十二点八万, clas 四约二十万, v 四直接到一百万,记忆准确率很高,一次性读完整本书,整套合同不用分断,企业知识库,法律审计效率会大幅提升。 第三,成本会再次大幅下降,新架构 roe 二点零,推利成本仅为 gpt 的 七十分之一,中小企业月成本往常可控制在千元内,保持 dyp 一 贯的高性价比路线。 第四,深度适配国产芯片,网传对升腾含五 g 海光适配率很高,升腾优化后速度提升明显,国产大模型加国产芯片形成技术壁环,数据安全层面将会有大幅提升。以上仅是个人技术预判,一切以官方发布为准。

昨晚 deepsea 悄悄搞了个大动作,输入框上面多了两个图标,闪电和钻石。闪电是快速模式,日常对话秒回简单。快速。钻石是专家模式,专门对付复杂推理、数学和代码,思考有一定深度,但高峰时可能回复较慢。 我实际体验对比了一下,确实有点意思。我问了一个经典的逻辑陷阱问题,我家里洗车房就五十米,现在下着小雨,我是开车去洗车还是走着去洗车?先看快速模式的回答,他一上来就识破了这道题是个逻辑陷阱,但是 最后的答案还是开车去,理由是洗车吗?车必须要在现场才行,至于下雨,就当是免费预冲洗了。再看专家模式的回答, 专家就是专家,开头就点出了最明显的矛盾点,下雨天洗车图啥?而且很幽默的告诉我,走着去洗车,开车去洗车都不对。最终专家给出的答案也是,开车去。理由是因为下雨天洗车本身就是一种行为艺术,开车去才能完成整套表演。 总之,这次升级表面看是多了两个按钮,实际是 deepsea 改变了以往一刀切的服务模式,随着用户激增,类似今晚吃什么的提问越来越多, 不可避免的造成大量的算力浪费。而两种模式让模型在回答问题之前,经过一次算力调度,简单任务走低成本路径,复杂任务才启动高算力,从而有效降低整体的运营成本。 可以预见的是,未来专家模式很可能会演变为付费订阅制,为代码编辑、复杂分析等专业用户提供稳定高质量的服务。这也会是 deepsea 在 c 端商业化探索上的重要一步。

随着二零二六年三月来临,全球 ai 社区的目光都聚焦到了同一个搜索词, deep seek v 四 release date。 据知, deep seek v 四将于二零二六年三月上旬正式发布,这不仅是一次模型版本的迭代,更是国产 ai 试图彻底摆脱 c u d a 依赖,实现算力与算法深度自足的里程碑。 最新的信息显示, v 四的内部开发系列代号为 silicon light, 这个代号暗示了 deep seek 对 新模型灵活性与海洋级吞吐量的追求。 与 v 三相比, v 四不再只是一个强大的文本模型,而是一个原生多模态巨兽,尤其在深层高精度 svg 图形和理解复杂视觉逻辑方面展现出了跨代级的统治 力。为了应对不确定的算力封锁, deepsea 团队巨船已与华为达成战略级合作。 v 四在训练阶段就针对升腾算子库进行了原生重构。 这种软硬一体的深度垂直优化,使得 v 四在华为芯片上的运行效率理论上能达到甚至超过同规格模型在 h 一 百上的表现。即将出现的 deepseek v 四,标志着国产大模型正在从追赶者变为定义的制定者。

万众期待的 dc 大 版本更新就要来了,就在今天,二零二六年的四月八日, dc 网页版已经变了,新界面出现了快速模式和专家模式。这可不是简单的改版啊,这背后隐藏着很多重要的信号,下面我们来一一拆解。 第一层看点是产品逻辑变了。以前很多 ai 产品呢,都想用一个模式包打天下,但现在 dc 把快和强拆开, 转向按任务分成调用的新路线,新增的这两个模式,快速模式和专家模式,按字面意思其实也很好理解,是吧? 快速模式主打的一个是响应快,适合日常提问、普通聊天高频使用。专家模式呢,明显是冲着复杂任务去的,比如更长练路的推理代码、数学逻辑分析等等,但高峰时期可能要排队,速度还不一定快。 据说后面还有 vs 模式,这个可能不是常规的视觉模型,而是某种深度统一世界模型。 那第二层看点呢,是新版本微视落地前的信号了,界面先变,模式先开,部分用户先撤,这很符合大模型产品发布前的节奏。 而且距离 dc 上一个大版本的更新,也就是大家所熟悉的 r e 推理模型,已经过去了十五个月了,憋了这么久的大招,也该更新了。第三层看点啊,为什么外界对 dc 新版本微视这么关注,这么敏感呢? 这不仅仅是因为 dc 是 国民大模型,大家充满期待,还因为他们一直在推进一件更大更大的事情,就是国产芯片的适配。据多方消息报道, dc v 四已经深度适配华为升腾九五零 pr 芯片, 这可不是简单的兼容啊,而是从底层架构到上层模型,全链路原生优化,彻底摆脱对国外芯片英伟达的依赖。 那么过去国产模型大多先在英伟达芯片生态上面开发,再移植到国产芯片,性能呢?是打折, bug 不 断。而这次微视不一样,从设计之初就基于华为芯片架构开发,真正实现了中国芯片、中国模型的全站自主可控。 这意味着什么?意味着我们不再被国外芯片卡脖子算力,供应链完全自主可控!这绝对是里程碑式的突破。而这还不只是模型技术上的突破, 而是对中国整个 ai 生态体系起到革命性的突破。从芯片到模型,从技术到生态,中国 ai 终于走出了一条独立发展的新路线。

大家好啊, deepsea v 四估计很快就到了,而且甚至我看现在它这个网页其实就是一个灰度测试版了啊, 昨天我们做了一个深度的测试啊,发现很多能力做了大半倍提升,尤其是编程上面,能力真是提升的速度非常的快,而且你能看到它的编程过程中啊,现在的网页版,它已经分出这个普通版啊,就是所谓速度的和这个专家的嘛啊,然后有些灰度的那个用户已经发现还有视频版了, 预计的话, deepsea v 四呢,其实是三个版本。 deepsea v 四的 lead 版啊,就是速度这个版本啊,普通版啊,就是咱们正式专家版本,还有一个是杜莫泰的版本啊,这是属于加能加视觉的一个版本,而这三版本的话呢,有可能未来是为商业化准备的啊, deep, deepsea 这回终于开始准备商业化了 啊,未来做商业化准备的,然后可能会有不同的套餐,但是前期的话,它应该是免费的,所以我们现在正在薅羊毛啊,速度非常好,而且呢效果也非常不错,相关的编程的效果,包括它还能帮我们去做相关的脚本管理,服务器等等,所有东西它都打通了。据说呢,这正式版里面还要把 a 准能力也叠加进,叠加进去啊, 会产生更多的这种啊,工作的这个效率我觉得特别好,更何况这一次啊,梁文峰已经啊,不管是什么情况,已经多次的啊, 那个发布各种各样的论文,把底层的整体的技术都推出来了啊,所以这套东西的话呢,我觉得非常的,尤其是它的 mhc 是 吧?尤其它的 ingrate 这些内存啊,那个数据传输啊,包括计算,包括分布等等都已经做出来,所以它的底层的这个技术已经是划时代的,而且据说整个架构也换了, 那么为了适配国产的这个芯片做了一段时间的调整,现在据说写了四十多万个相关的算子啊,把整个的升腾的系列的那个性能拿到这个最优啊。人,我跟你讲,这个已经是你超乎想象的,他花了四个月的时间干这个事,而而那个 啊,那个科大讯飞人家干了一年,整整一年,那么说明梁文峰他们在这个啊,科大讯飞之前已经做好那个基础上又往前再做了一步,所以这个很可能是未来非常非常重要的事啊。我判断未来梁文峰那个 deepsea 有 可能会进入到那个那个 一体机啊,或者是整体方案交付啊这个领域,这可能是他们未来冲入弊端那个重要东西,因为他可以把华为的整体的生存系列的能力发挥到极致,因为他们自己做的,据说做了四十多万个算子,这个时候特别强, 特别响。还有的话呢,就是现在在传说梁文峰说这个四月下旬上市啊,这个消息呢,我不知可否,但是我从内部,我从我的心缘呢,没有确认啊,但是我们现在看到这个速度呢,应该就在中下旬的时候就会放了,就会放了,基本上也是这么个时间点啊,你们现在的灰度测试,现在就是在灰度测试 啊,不管是网易版还是爱版,都是在规度测试了,而且呢,嗯,他没有告诉你,但是他告诉我是最新的模型这个事的话,就等着到那个时候直接把论文往上一推啊,然后整正式把模型的那个限制解开,就完事了, 好不好啊?我觉得你们现在都可以去试了,已经是一个很强的东西啊,未来咱们再看他们的跑分吧,但是跑分其实不意味着什么,你如果真能帮你干活,才是真正第一位的啊。而且呢,这一次他完全是配国产算力啊,主要就是 那个华为的升腾啊,探五 g 和默先生这三家,我觉得非常棒啊,非常棒啊。当然这背后意味着呢,可能对中国国产算力的一个新的气息出现,就是完全一托于国产算力训练国产算力这个推理的这样的模型出现了,那后续的一系列的话,可能就形成我们自己避远这个发展的通道, 这对整个产业链来说是一个大机遇,这是一个大机遇,原本我们要看啊,比如说啊,那个哈,那英伟达的链是吧?谷歌链啊,我们看 openai 的 相关那个需求带来的相关的这个硬件的东西,所以我们产生各种各样的链, 但其实未来很可能会出现 deepsea 链啊,质谱链啊这样的,在国内的才产生的这样的一个硬件叠加的效应,那么这些东西的话,可能会拉动整个啊,整个产业链的一个变化啊,背后的话会有一系列的机会啊,那些东西的话呢,我们会在下个星期的会员课里边 单独给大家讲我们的这个季度的这个科普课啊,咱们的这个科普课九十天四十五个视频,八场专门的直播啊,然后非常的超值,因为平台给补贴了六百多块钱,咱们现在只要四百多就能拿到,非常的超值啊,如果需要咱真的可以好好看一看啊,而且呢啊,咱们所有东西的话都是切入这种行业热点的,对大家来说非常有帮助啊。 然后抖音的朋友呢,因为我的那个橱窗这两天有问题啊,大家到那个想想,想要的话到啊,抖音商城啊,就咱们那个买东西的抖音商城啊,搜 瑞克老张,嫉妒啊,这这几个字就行啊,就把我们的课调出来了,点击就考好,那就到这啊,我是瑞克老张,关注我,咱们从投资的视角看科技背后的精彩,我们下期见,拜拜。

deepsea 崩了十二小时,但 a b i 可以 正常访问,官方发推文说,再等等, deepsea v 四真的要来了!这次不是升级,是架构革命。扒出三张技术底牌,第一, n u 二点零用算法,暴力压缩算力成本。 deepsea v 四作为迄今为止最大的开源专家,混合源模型,不是靠传统 top 二选专家,而是让十六个专家同时干活。 万亿参数模型推理成本压到三百二十亿级别,用百分之三的算力干百分之百的事,助力缓存压缩到百分之五到百分之十,三百万图腾不再堆显卡。 第二,映光条件记忆。 b 四能一次性读完三体,并对传输做人物互关分析。这不是堆算力,是条件记忆机制,让大模型像人脑一样选择性遗忘常文本,只记关键,忘掉废话,真正能读懂而非死记, 彻底解决大模型读得多记得乱的顽疾。第三,原生多模态推理成本在腰斩。 deepsea r 一 是纯文本 b 四端到端图像加视频理解,并且实现了全国产替代华为升腾深度优化 推理成本再降百分之八十八,打破因为达垄断国产模型加国产芯片闭环成型。 deepsea v 四推出,将会对开源大模型市场产生怎样的影响? v 四,是否开源权重?如果开源,国内中小厂将直接起飞。当中国掌握大模型定价权,你更怕技术落后,还是怕标准被国产垄断?评论区留言关注我懂 ai 快 一步!

你用过 deep seek 吗?昨晚他突然自爆了,有用户发现深夜更新后的 deep seek, 在 对话里直接说,我是 v 四, 不是 v 三,是 v 四,这操作像不像明星自己提前剧透新专辑?但问题来了,官方还没官宣呢。 作为产品经理,我觉得这可能是两种可能,要么是真要发布故意放风试探市场反应,要么是模型出现了幻觉。自己脑补了个版本号,你觉得是哪一种?评论区聊聊。

四月十日消息, deep sec 创始人梁文峰在近期的内部沟通中表示,公司旗下新一代旗舰大模型 deep sec v 四将于四月下旬正式发布。在确认新模型发布节点的同时, deep sec 的 产品端已先行展开功能调整。近期, deep sec 网页端上线了快速模式与专家模式两种全新的交互模式。根据设置,这两种模式主要支持简洁搜索和长城等相关交互功能。 当前,大模型技术处于持续发展阶段,各类产品更新频繁, deepsea 网页端交互模式的调整可视作在为 v 四版本的推出进行产品形态上的铺垫。通过对交互场景进行细分,该平台在日常搜索的应用性与长城任务的专业性之间建立了区分。关于 deepsea v 四的具体技术指标及其实际应用表现需等待四月下旬的正式发布。

朋友们,国产 ai 圈的大消息终于来了,千呼万唤的 deep seek v 四终于定档,四月正式上线,这是国产大模型的里程碑时刻,之前 v 三版本就已经在代码推理上追平了 gpt 四, 这次的 v 四更是直接搞了底层重构,参数规模直接冲到了万亿级别,还用上了全新的 mhc 流行约束技术,解决了大模型训练的稳定性问题,而且专门做了国产芯片的适配,华为韩五 g 的 芯片都能完美跑。 之前跳票了两次,就是为了打磨极致的性能,这次终于要来了,这意味着国产 ai 的 商业化彻底加速了。之前大家还在依赖海外的模型,现在我们自己的旗舰模型不仅性能够强,还能绕开海外的限制,整个 ai 的 产业链从国产芯片到应用层都会迎来爆发。但是咱们也要说清楚风险, 要是上线之后实际性能比市场预期的差,或者开放之后企业的需求没跟上,那整个板块的情绪就会直接反转。从投资的角度说,你可以布局给 deepsea 做配套的国产芯片龙头,比如含五 g, 还有云服务的相关标地, 这些能直接吃到 v 四上线的红利。短期如果板块涨太多,可以减减仓,但是长期来看,国产 ai 的 替代空间还很大,这些龙头可以拿着投资,有风险,入市需谨慎。

重大发现, deepseek 的 大动作根本藏不住了!三月二十九号 app 直接从一点七点一跨越式更新到一点八点零大版本,三月二十九日当晚就蹦上微博热搜,三月三十日凌晨更是网页 app 全平台全线瘫痪,亲自测试了跨越大版本的更新, 在行业内通常对应着核心能力升级,底层架构重构,会把多轮灰度测试的功能合并成一个完整的正式版本集中发布,绝非简单的小补丁更新。 三月三十号凌晨三个时间点连续的故障,绝对不是普通故障。综合各方面的猜测,这绝对是在为新的大版本甚至多模态上线做最后的全量压测和底层切换。

大家好,美国特朗普屈辱性停火之后,全球原油期货价格暴涨,各大股市纷纷暴涨,我们也终于可以分一些啊经历,来看一看全球科技领域的最新动态。 今天我们要关注的是 deepsea 的 最新重磅消息, v 四的新版本消息是越来越多,全面适配华为的 gpu 芯片,而且性能效果非常出色。美国硅谷近日对 deepsea v 四版本的讨论也非常多,那么我们今天呢,就来为大家做一些详细的介绍和分析。 首先呢,我们说一点,这几天啊,很多朋友呢,开始去打开 deepsea 的 网页版本做试用啊,已经发现了哎,好像它的很多功能啊,都发生变化了啊,这里呢,我要声明一下啊,咱们不是在给 deepsea 打广告啊,它首先就是一个大家非常关注的啊,这个中国的大模型,开源大模型的一个 平台对吧?之前呢,它的 v 三版本呢,也引起了呃, r one 版本,引起了硅谷的这个震撼,包括华尔街对吧,对英伟达的这个巨大的冲击,一天跌掉十七个百分点等等。所以 deepsea 呢,始终是一个大家讨论的焦点, 那么现如今呢,新的版本发布啊,那当然呢,我们要作为科技博主吧,我们也要为大家做一些介绍,那么因此呢,我们不是说拿拿没,没有拿 deepsea 一 毛钱啊,这个呢,我们要说清楚啊,那么目前呢, deepsea 的 网页版本啊,大家这个打开可以看到啊, 已经变了,它的输入框上面呢多了两个选项,一个叫快速模式,一个叫专家模式,那你可以去做一些测试, 对吧?你比如说问他一个问题,我们也做了一些测试啊,然后呢,快速模式呢,就很快了啊,两秒钟给出一个结果,专家模式呢,他就要去各做各种深度思考,所以给出的时间呢,是四秒,对吧?那么这个呢,看起来差不多,对不对?但是呢,如果做一些复杂的推理呢?那实际上这个差距呢,就会比较的明显。 页内呢,都在猜,哎,这里呢,到底是更新了哪些东西,对吧?因为我们在前台体验的只是它的功能,但它的大模型的底底层,它到底更新了哪些呢? 这个呢,其实是非常关键,那么很大程度上呢,这也是意味着前端 two c 的 网页版本的变化,意味着 deepsea v 四版本的它的这个发布呢,已经进入了倒计时。 快速模式背后可能跑的是一些优化过的轻量版的模型,而那个专家模式极有可能是传闻中的那个拥有万亿参数的 v 四的本质,在进行小范围的压力测试。 deepsea 这家公司呀,他一直被贴着叫做技术理想主义的标签, 那么之前的 v 三版本和 r one 版本出来的时候呢,直接把全球科技股呀给干趴了,对不对?为什么呢?太便宜了,效率太高了。那如今呢, v 四搞这样的一种分层,其实是一种现实主义的回归, 为什么要做分层?因为算力太贵,哪怕是 deepsea 这种省钱专家,面对万亿级别的参数,也不得不考虑所谓的商业闭环, 这其实是为接下来的大规模商用,甚至是付费体系在做铺路。那么这个是这个情况本身呢,我们看到了这个当下 deepsea 的 进展,那么下面呢,我们要做一些深度的解密啊, 我们说这个外行看热闹,内行看门道,那么一些科技媒体,包括 the information 啊等等, 那实际上最新的爆料呢,已经把 v 四的底牌呢翻开了一半。首先是参数的规模啊,这个呢,根据呃科技媒体的爆料是一点二万亿参数,采用的是改进型的 mo 一 的架构,也就是混合专家的架构。模型 虽然总参数惊人,但真正被激活参与计算的参数只有三十二 b 和到七十三十七 b, 这意味着什么呢?意味着它用极低的推理成本实现了吊打 g p g p t five, 直面 g p t six 的 性能。 最玄学的是这个,它里面所搭载的 ingram 技术。那么它们之前发的论文 v 四解决了一个困扰人工智能界的这个世界难题啊,叫做大海捞针。 在百万级别的透肯的上下文里面,以前的模型啊,跑着跑着就失忆了,根本就不记得之前有哪些事情。准确率呢,能有百分之八十就算是到提到顶了, 但是 v 四呢,把这个准确率直接拉到了百分之九十七,这意味着你可以把一整年的会议纪要,甚至是几百本书一次性扔给他,他能够过目不忘,像天才一样精准的找出你想要的到底是什么。 还有那个 mhc 技术,叫做流行约束超连接技术,这个名字呢,比较这个难记啊,通俗点说呢, 就是给万亿级别的模型装上了超级的稳定器。以前呢,这个训练这么大的模型啊,动不动就崩溃了对吧?几千万美元的电费瞬间打水漂,但 deep 级别的模型训练可谓是稳如老狗 啊,这就是为什么我们看到当下大家呢是比较关注哎, deepsea 到底会发出哪些个这个比较震撼的技术路线呢? 我们也看到了,美国方面主要是 open ai 对 吧?那么有一消息说,呃,四月份呢, open ai 可能会发布 gbt 六,对吧?那么这个呢,我想可能,呃,在大概的时间,如果是两厢相遇呢, 那可能是两种技术范式的巅峰对决。当然,美国如今呢,其实比较引发关注的模型呢,已经不是 open ai 了,而是 cloud, 对 吧? cloud 大 模型以及呢谷歌的肩并肩大模型。那这个呢,也是在日新月异,美国在这些大模型的发展当中呢,速度也非常快。 那么接下来我们要说的一点呢,是比较重要啊,那么也就是说呢,涉及到中美科技站当中,我们知道英伟达有库达的生态,对不对?哎,那华为方面呢?中国的芯片呢?那么在 deepsea 大 模型当中到底有怎样表现呢? 我们看到路透社还有 the information 等等这些科技刊所爆出的一个重要的内幕, deepsea v 四已经彻底地去英伟达化了。 也就是说呢,在以前,全球大模型都有这一个,都有一个不成文的惯例,发布新模型之前,先要给英伟达去送去啊,请人 来帮忙做优化,做适配,这叫什么呀?交保护费?因为大模型未来的什么推理啊,计算啊等等,最主要使用的平台呢?还是英伟达的平台。所以啊,你必须去找到英伟达,必须去给他送上保护费, 但 deepsea 这一次呢,是直接拒绝了英伟达,他们把早期的访问权限独家给了华为和韩五 g。 这个事情呢,是非常重要的,这也意味着 deepsea 的 v 四版本是跑在华为所自研的深腾九五零 p 二这款芯片上。 他们花了几个月时间,硬生生地把底层代码从英伟达的酷达架构重写到了华为的 c a n n nex 的 架构上 啊。大家可能对这个可能不太了解,但无论怎样,这是一个巨大的工程量啊,把这个事情能够做到去实现打破英伟大的枯的生,枯打的生态,一点都不容易。 因为这个英国的金融时报之前还说, deepsea 研发 r two 的 时候,尝试过全占华为,结果因为稳定性不行,最后被迫退回英伟达。但是正所谓士别三日当刮目相看,这一次 v 四版本的延迟发布,就是为了死磕华为芯片的适配。 如今的局面是阿里巴巴、字节跳动、腾讯等等这些,这个科技大厂巨头已经疯狂下单采购数十万颗华为的最新升腾芯片。为什么呢?因为现在 ibisc 威斯版本已经在上面彻底的跑通 国产芯片加国产模型这条路不仅能走通,而且还跑出世界顶级的速度,这就是所谓的全站自主可控。 那么至此呢,可以说我们不再是建立在沙滩之上的堡垒,那么我们有了这样的一块地基,是钢筋混泥土哎,国产替代,自主浇注完成。 聊到这里呢,我们不得不引用一下 mit 的 荣誉校长叫做拉斐尔雷夫,那么他的最近在这个外交事务上所发表的一篇震动美国的文章,叫做美国正在输掉创新竞赛,这个创新当然指的是科技创新。 雷副校长说了一句大实话,他说长期以来,美国人都觉得中国只是个世界工厂,只会山寨,只会抄袭,不会创新。 但是过去十年,中国证明自己在电动车,在电池,在量子通信甚至制药领域的领先。而如今呢,在人工智能这样一个最后的阵地,美国发现自己的优势也正在动摇。 雷夫分析的几个点,我觉得是特别的扎心啊,也比较的真实。第一个就是人才流失的反转,以前很多是清华,北大,中国的这些,对吧?这个著名的高校,中科大等等,那么毕业生呢?毕业之后去硅谷啊,到美国发展,现在是二零二四年以来,到二零二六年,我们看到 至少已经有上百名的在美国的顶尖的华裔科学家重返中国,那整个的逻辑,整个的趋势开始迅速的翻转。二零二五年的顶级人工智能会议上,三分之二的中国本科生选择了留在中国, 那这个趋势本身呢,非常非常重要。二十一世纪最重要的竞争是什么?竞争啊,是人才的竞争,有人才,才才能够有所谓的科技发明,专利等等。第二个是战略耐心。 那么按照美国 mit 校长的这个说法呢,美国如今啊,在政治上极度的这个急化非常严重啊,两党撕裂啊,大家呢,越来越偏激,对吧? 科研资助跟开盲盒一样,一届政府比一届政府来的少,把钱都花在了打仗上面,都给了军火商。而这些科研机构呢,他们拿到的科研资助,拿到的经费呢,依然是越来越少。 而中国方面呢,政府是企业最大的天使投资人,那个所谓的政府引导基金,给科技企业提供了美国人难以想象的资本。耐心 我们回顾一下历史,八十年代日本半导体崛起的时候,美国也是这么的焦虑,但这一次不同,人工智能是生产力的终极杠杆, deepsea 的 成功证明了中国体制在面对这种超大规模工程时的组织优势。我们不仅仅是做了一个软件, 我们是硬生生的憋出了一套从芯片设计、指令集到编程的完整的产业链。 那么未来走势会如何呢?我们不妨做一些预测。二零二六年之后的人工智能版图,我们站在此刻的时间点之上,坦白的说,中美两国都在全力以赴的在人工智能,在科技领域来寻求创新突破,引领新一次的科技的革命浪潮, 但是谁能够成为赢家呢?坦白的说,中美目前是各有优势,美国的传统优势依旧强劲,但中国方面在科技应用,在制造业,在很多的 toc 领域呢,有中国自身的这个应用的啊,优势走在前面。 首先第一,算力主权将会成为国家竞争的核心,随着 deepsea 微四版本适配华为成功,我们会看到更多的国内企业抛弃昂贵且受限的英伟达啊, h 二零或是 h 一 百, h 两百芯片等等。而国产算力不再只是备胎,而会成为首选。 那这又是一个重磅的一个时刻啊,当国产战力成为首选的话,就如同如今天的中国汽车产业,对吧?如同中国的这个啊,电池等等,现在谁买汽车啊?买电汽车的电池会选择国外的呢? 当然是国内的呀,包括宁德时代,比亚迪还有很多其他公司都有非常优秀的电视电池啊,这个电池呢,可以说是世界最强,那当然包括摩托车 对吧?之前大家想到的都是什么?雅马哈啊等等,这些川崎对吧,都是日本欧洲的摩托车对不对?那谁能想到短短成立两年时间的,对吧?张雪机车哎,他自主研发这个三缸的这个发动机,然后呢,取得重要的突破, 然后呢,我们就看到了,对吧?在国际的重大的摩托车比赛当中呢,能够连续两场夺冠, 这个就是实力的展现啊。我想现在如果您是一个摩托车爱好者,机车的爱好者,对吧,你恐怕就不会像以前那样了啊,痴迷于外国的车对不对?哎,对于国内的张学机车,我们也看到目前订单非常的多, 对吧?这说明什么?说明你的技术过硬,你是经受住考验啊,有热情对吧?有梦想啊,然后去实现啊,这个真的是非常的感动人, 那么这个叫做从过去的备胎到首选,那以前会说啊,如果我有钱,我就买个老外的,买个这个,对吧?进口货啊,如果说,呃,我这个实在是没多少钱,我就买个国产的,那言下之意呢?这国产的质量呀,这个可能一般啊,等等,但现在不是这样了,对不对? 张雪机车比国外的,比他们的这这些同样在赛场之上的国际顶级的摩托车呢?哎,比他又牛,对吧?这个这个啊,技术又先进啊,又好,跑得又快,对不对?马力又足, 然后价格呢?只有你的几分之一,所以在这种情况下,你说当然是就会成为爱好者的首选 啊,我们讲到什么算力啊,芯片呀,啊,这个 gpu 啊,啊,大模型啊,这个因为跟我们生活坦白的讲,我们作为一个消费者,其实你这个电脑啊,计算机到底怎么搞的?算力中心怎么搞的?这个其实我们很多时候也不懂对不对?但是同样的类比,我们讲到摩托车呢,那其实都是 大家就感受就比较强烈啊,因为这个生活中就很常见吗?汽车也是如此,对吧?你现在很多人你说买国产车,这效果就就挺好的啊,你看你像比亚迪,他们很多车在国内卖的价格,那就是很一般的车,对不对?就是说,比如说,比如说十几万啊,人民币,那在国外的话都卖到大几十万人民币 啊,三四十万,四五十万都很正常的,对吧?那在欧洲,我一个好朋友在欧洲差不多差不多这样吧。 啊,所以呢,我们讲到这里呢,就是说,呃,国产的很多技术平台呢,他会成为首选,而不再是以前的所谓备胎啊。那么那么这是第一个层面,叫做算力主权呢,将会成为国家竞争的核心。那第二个层面呢,是人工智能的产品分层将会成为主流。 dbisc 的 变证,也意味着大模型将从技术的炫技而转向所谓的精细化的运营,专家模式收费,快速模式免费,或者针对不同硬件版本来做优化模型将成为行业的标准。 第三个层面是中美人工智能的顶峰对决将会进入白热化。我们也看到这个美国的各大的大冒险公司,包括 cloud, 包括谷歌的揭秘奶,也包括 openai 的 切尔吉普 t 等等,那么陆续的发布,实际上如果 deepsea 维斯版本的性能 与之持平,甚至在某些维某些维度上,比如说长文本呀,比如说推理效率等等,能够实现超越的话,那么美国领先于中国两年的神话,或者领先于中国的神话,都会不断的被突破。 所以最后呢,我们也看到了当下的这个啊,这个中美两国在很多时候呢,虽然最近因为伊朗战争,大家把视角移向了中东,移向了传统的,比如说石油呀,啊,比如说一些这个,这个液化天然气,还有相关那些化工的上下游产品, 对吧?但是呢,我们说中美两国竞争博弈的核心呢,还是在科技,在半导体,在大模型,在芯片等等 啊,这个其实还是核心,他会事关未来几十年的人类的新一次的科技浪潮。至于说能源价格随着战争的爆发而暴涨,随着战争的慢慢的这个一些和平的声音,挺火的声音出来呢,开始下跌,这都是实属正常 啊,这叫做短期效应啊,长期中美博弈的结构性的关系呢?结构性的竞争领域还是科技领域?那有人会说军事领域才是核心,打的赢才行,对不对?打不赢什么都没有了,是不是啊?讲的也对了,但是呢,我们讲科技,如今,呃,讲军事,对吧?你现在打仗还不还照样是科技吗? 对吧?你科技先进,你就有更强的战力,这就是现实,那当然这个就比较复杂了,我们这里就不展开,反正不管怎样,中美两国竞争的核心领域当然就是科技,那这也不是信口开河,对吧? 那如今我们也看到了国内的很多的这个需求端,你比如说我前面讲的阿里,阿里啊,字节啊,腾讯啊,很多这些国内的互联网大厂啊,他们也开始不断的转向国产,算力呢,是相当的惊人。 所以前面这么多呢,我真的是看了也确实蛮感慨的啊。那么包括像 deepsea 这样的公司,也像张雪机车这样的公司,虽然他们是完完全全两个不同的行业啊,一个属于机械对不对?一个属于大模型啊,人工智能等等,但是呢,始终都在各种喧嚣当中,被人瞧不起当中,保持这种冷静, 然后在创新当中不断的寻求突破。所以这些故事本身呢,包括梁文峰的故事啊,包括王欣欣的故事,包括张雪的故事,他们都处他们是中国不同的地方,对吧?你说有在杭州的,有在 重庆的,有在其他地方的啊,他们也是不同的教育背景,不同的文化,不同的这个这个专业领域等等,但是呢,都绽放了他们的光彩啊,都实现了他们的梦想啊,都在不断的追求创新,追求卓越,这一点确实是非常的了不起啊,令人感到非常的敬佩。 deepsea 维斯版本到底能怎么样,我们当然还不知道,但是最近的消息呢,是越来越多,包括最近的 deepsea 网页版本的更新,让外界呢有了更多的想象空间。 我这里特别喜欢雷副校长文章里的观点,叫做科学的未来可能是中国的,那这不是我说的是美国顶级理工科院校的,对吧?一个这个啊共荣誉校长,他的一个看法, 那这当然也并不代表着美国今天就没有竞争力,当然不是如此,也并不是说像有些人讲的美国已经衰败了啊等等,也不是如此,而是我认为呢,更大的是代表着中国这样一种拼搏精神,中国这样一个古老的文明,终于回到了他应该有的位置。 所以在这样一个二零二六年的青青春天呀,发生了太多的事情,中东地区的战争,对吧?俄战争尚未消停,那么伊朗战争,中东地区还在啊,这个,这个打仗,然后呢?全球能源市场,金融市场遭受巨大的震荡,然后以色列方面呢?对泥巴的入侵还在继续, 在硅谷的震荡当中,在华为芯片的这个最新的进展当中,我们看到了中国科技人的这样一种韧性,无论外界环境啊,多么的复杂多变,国际局势多么的波云诡绝,那么中国科技人呢,始终在坚持 科技创新,不断突破啊,被卡脖子领域呢,越来越少,那么我们也看到了,当下 这个中国科技人呢,逐渐的开始扬眉吐气,在国际话语权当中呢,已经得到越来越多的认可啊,那过去呢?被封锁,被误解,被看不起啊,被轻视,那如今在不同的领域,硬生生的杀出一条血路,这也展现出中国的这种任性啊。 我们说 deepsea 微四箭在弦上,到底能够给我们带来哪些的惊喜呢?我们可以拭目以待啊,不断地去观察。那么这场好戏,中美的科技博弈,实际上在人工智能这样一个新的时代,新的科技浪潮这样一个未来的啊,这个发展的过程当中,会有非常多的 大的这个事件会产生,而现在的人工智能也只是开始,所以说中美两国在非常核心的科技的竞争领域当中,他真的也只是开始,那么后续的走势呢?我们会持续的为大家做观察。

deepsea 深夜悄悄上线了专家模式,可能维斯版本真的要来了?简单试用了一下,和豆包以及 kimi 那 种深度研究不太一样。 目前专家模式整体使用下来没有发现有什么特别的地方,他如果进去没有发现这个模式的话,可以退出来,等会重进应该就有了。看到还有人发了网页版的截图,还支持扮演模式视觉模式代码模式。如果这个截图是真的话,那大概率就是维斯版本了。他如果有新的发现,也欢迎交流。