粉丝1.1万获赞4.5万

今天呢,又一款中国的应用占上了美国 app 下载的首位,那就是国产大模型 dipsek, 他超越了 chad、 gbt 以及 mate 公司旗下的 thres 等一众 美国科技公司生成的 ai 模产品。那么不仅如此呢,那么 deepsick 呢,还实现了同时登顶中美两区免费下载的排行榜, 此前呢,还从未有过先例。而在昨天呢, dipsyk 还曾出现了短时闪崩的现象。据 dipsyk 回应说,原因啊,可能是访问量激增,导致了服务器一时无法满足大量用户的并发需求。 那么 deepsick 的热度呢?飙升, a 股多支概念股,包括浙江东方、华金资本、每日互动等。今天呢,强势上涨, 港股多支 ai 概念股呢,也普遍高开。另外一方面呢,美股的科技股普跌, 英伟达盘前一度跌幅超过了百分之十三。那么位于美国 a 胎生态链中的日本科技公司,今天呢,也集体暴跌,东京电子跌进百分之五,英伟达上游的设备供应商 advantage 同样下跌。 引发行业震动的 deep sick 究竟是什么?又能够为我们做些什么呢? did seek 由国内人工智能技术企业杭州深度求索公司发布,该公司成立于二零二三年七月,专注于开发先进的大语言模型和相关技术。公司运营方为聚焦 ai 投资的量化对冲基金换房。量化深度求索成立的当年十一月, 就发布了首个开源代码大模型 dipsy coder, 到去年十二月,大模型已更新到 b 三版本。本月二十日,新一代 ai 推理模型 dipsy 二一正式发布,性能对标美国 open ai 的欧万,此时距离欧万的正式发布过去还不到半年, 与 check gpt 需要购买会员不同, did seek 网页版、手机端都可以免费使用。 and did seek 自己的介绍,他能提供信息查询、语言翻译、学习辅导、技术支持、娱乐互动、形成规划等功能。 dc 界面很简洁,除了文字输入框,只有深度思考、联网搜索、发送三个按钮,以解数学题为例,如果点了深度思考按钮,在正确回答问题之外,还能详细展示思考步骤,部分问题还能反复验证答案,甚至使用其他方 方式再计算一次。好,我们马上来连线上海人工智能研究院数字化治理中心的主任彭家浩先生。彭先生, dipsik 引发了行业的震动,我们可以看到呢, a 股多支概念股强势上涨,美股啊,科技股 普遍的下跌,另外还波及了与美国 ai 生态链息息相关的。呃,其他国家和地区的一些股票。那么有分析啊,就说这反映了投资者呢,实际上有两个焦虑,一个呢,是对投资这个大模型人工智能是不是盈利有焦虑, 另外一个呢,就焦虑美国在人工智能方面是不是一只值牛尔的地位没有人撼动。那么你怎么看目前的这些现象?嗯,好的,主持人好。嗯,首先啊,资 本是很聪明的,那钱的嗅觉非常灵敏的,那这个背后呢,实际上是反映出来了全球 ai 产业链的价值重估,或者我们可以这么说,就是非美国的技术路径 也是可行的,当你有了自己的技术,那你就有了定价的能力和溢价的能力,那么这次呢, deep sleep 的成功呢? 呃, dbc 的成功呢,也是对美国日本产业化发展道路都可能产生比较大的冲击,但是呢,我个人呢认为啊,短时间内我们还是嗯 还是无法撼动美国这个处于第一的这个这个位置的,但是呢,中国已经成为了美国必须正眼相看的竞争对手,那我可能目前还我们还打不过他,那这个我们承认,但是呢,这种差距已经是可以通过产业 市场规模,深度的研发等的这样的手段一点点咬上的了,那么中美之间已经从这种 已经变成了齐头并进,你追我赶的这样的一种新局面了。嗯,呃,就像这个千古格的这个合伙人啊,包括扎克伯格呢,最近两天都说了啊,中美的人工智能的差距实际上是缩小,比想象的距离还要小, 那么 dipsec 的影响呢?真正的能改变人工智能全球格局的这样一个地步的吗? 那么 dbsik 呢,阿一在这个数学啊,编程推理等关键的这个领域当中的表现都能与 open ai 最强的推理模型啊 one 那么掰手腕了,因此呢,也被认为是大模型行业的最大的黑马,甚至呢,被称为神秘的 东方力量。在推理能力方面, did see 表示,而一在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,在数学代码,自然语言推理等任务上性能笔尖。 open li o one 正式版, 值得一提的是,二一还在训练中展现出类似人类的反思行为, dc 公布的技术报告就展示了这样一个案例,在解决一道复杂数学问题时,二一在解题步骤中突然停下来说等等,这是个值得标记的时刻,随后自主修正了解题过程。 此外,二一在执行编码类任务时也展现出专家级水平,在算法竞赛平台 coforces 上的表现超过了百分之九十六点三的人类参赛者。除性能外,更让 业界关注的是 diseak 的性价比。据介绍, r 一的预训练费用只有五百五十七点六万美元,在两千零四十八块英伟达 h 八百 gpu 集群上运行五十五天,完成成本不到欧盆 ai gpt 四 o 模型训练的十分之一。 技术报告还显示,而一面向开发者的服务定价为每百万输入字符串一至四元人民币,大约是 open aio one 运行成本的三十分之一。 除了极致性价比,让 tips 一个大模型呢,能够脱颖而出的还有其代码和训练方法的完全开源。 开源与闭源呢,对应的是两种软件开发模式,与闭源不公开源代码只对外发布编译后的软件不同。开源呢,就是将模型的源代码和技术细节公开,并允许用户根据 自身的需要对模型进行任意的使用和修改以及衍生开发。在推出阿一时, dipsig 同时开源模型权重,并允许用户利用模型输出,通过模型蒸馏等方式训练其他模型。 一同开源的还有技术报告, dipsek, 将那些训练二一时踩过的坑、做过的事,毫无保留在外界进行公布。那么连日来呢,网络上已经出现了一波复现热潮,复现成本甚至低至几十美元。 那么继续请出彭主任啊,刚才的片子展示了 dipsake r 一在顿悟啊以及自我修正方面的能力,说明呢,他有相当程度的思考和学习的能力。那么业内人士说 dipsake 已经进入到了强化学习阶段,那么请您 解读一下啊,强化学习与过去的题海战术靠海量的数据投位相比,差异呢?在什么地方?另外呢,这样的一种转变啊,对于推理模型来讲意味着什么? 嗯,那我用听众朋友们能听得懂的这个语言来描述吗?嗯,就是,就像你教你家的小孩学习一样,那 dipsec 呢,他没有把精力放在教小孩子去做大量的题目上,而是让小孩子自己去思考,让他自己去做卷子,那做对了表扬,那做错了那打板子。 而且呢,这种是在没有监督的情况下,让小朋友们反复去做,直到他自己做对了为止。而且呢, dipsake 他并不是只交一个小朋友,嗯,而是交一堆小朋友,还要开展小组之间的竞争。那么这种给推力模型带 带来的就是效率的大幅度提高,以及成本的大幅度下行啊。是的,这个效率大部分提高呢,我们还可以举一个例子啊,比如说我们说这个开车啊, 你五升排气量,你百米的加速速度可能是一个能量级,现在的二点五升,他就可以到五升排气量的百米加速度极了,比如说做一个涡轮增压,对吧? dipsik 呢,就在做类似的事情。好,对于 dipsik 阿姨采取开源路线呢,您怎么看? 这种对于产品的进一步完善有什么样的好处?另外啊,这会不会导致竞争对手了解和掌握技术呢? 首先啊,这个 ai 的竞争,它不光是单纯的技术竞争,它背后还有标准、市场和资本层面的竞争,开源的本 本质,他并不是说我简单的说我把我的东西免费给了别人了,他背后有标准跟市场的争夺,还有资本的博弈。那对手呢,肯定是会掌握我们那些技术的,但是他也要按照我们的标准来走,这些背后全都是利益。 另外, deepsick 你他就是因为他开源了别人才能够复现出这个技术,那才知道。哦,那原来你中国的人工智能已经发展到这样的程度了,那这也是对我们国家人工智能影响力的提升。 嗯,好。那么 dipsyk 阿一这支神秘的东方力量的持续在海外开发者社区啊,引发了轰动,更是凭借极低的训练成本震撼了硅谷。在 dipsyk 发布而一后不久,美国科技巨头 mete 的一名员工发帖称,公司内部已经进入 恐慌模式。据悉, meta 成立了四个专门小组来研究 dipstick 的工作原理,并基于此改进自己的大模型产品。 美国舆论同样高度关注,福布斯发文指出, dc 让世界认识到中国并未退出这场人工智能的竞赛。纽约时报则表示,如果最好的开源技术来自中国,美国开发人员将在这些技术的基础上构建他们的系统。 从长远来看,这可能会让中国成为研发 ai 的中心。 it is an immediate rival to america's open ai, google and open ai years and billions and billions of dollars to build the latest ai large language models, but now a chinese research lab has built a competitive model in just two months with dumbed down gpus for less than get this six million dollars。 面对 dipsec 四两拨千斤 挑战,美国仍然相信大力出奇迹,决定继续砸钱。本月二十一号,美国总统特朗普在白宫新闻发布会上宣布启动一项名为星际之门的庞大 ai 基础设施计划。预计呢,将会在未来四年投入五千亿美元 用来建设数据中心、计算设施等关键技术平台。该计划将会由 openai、 日本软银集团和美国甲骨文公司三方共同参与。 此后不久, meta 的首席执行官扎克伯格表示,为了实现在 ai 领域的目标,公司正在建设一个功率达到两级瓦以上的数据中心,占地面积能够覆盖纽约曼哈顿的很大一部分。 预计到今年年底,公司呢,将会拥有一百三十万块 gpu, 今年的资本支出将会达到六百亿至六百五十亿美元的规模。 好,我们继续请出彭主任。呃,彭主任分析认为说 dipsake 直接改变了 ai 领域的游戏规则,那就是不再依赖高性能的芯片啊,您怎么看? 同时呢,我们仍然要面对的就是美国持续对华的芯片打压,以及刚才提到的像 open ai 啊, mate 啊等等巨头砸重金来提升竞争力,挑战重重之下,中国 ai 该怎么样走出一条自己的发展道路? 好的,呃,我个人认为啊,这其实是两个层面的问题。首先, deepsick 呢,它确实改变了游戏规则, 他可以实现在资源更少的情况下,呃有更大的效能,但是呢,他这并不意味着我们对于更高性能芯片的需求会减少,因为市场的需求是在不断扩大。 那呃这款 a p p 目前在中国和美国都已经登顶下载榜的第一了,那说明有更多的人来用了,那这必然会带来算力的提升以及算法的进一步迭代,那这都是需要更多更强的芯片的,所以说 算法的提升和优化是可以缓解呃,这个对算力的依赖的。那但是呢,我们肯定也要不断的提升自身硬件的建设能力啊。那我们国家这这些年来一直在加大科技领域的技术投入, 打造我们国家层面的数字化算力基础底座,那这也是我们国家目前在走的算法优化加国产算力适配的一条道路。




