就在刚刚,没错,除夕夜阿里发布快按三点五贺岁版,不仅能秒懂复杂图标,最恐怖的是两小时的视频丢给他,瞬间生成高清摘药,在权威榜单上,以五十八点三分力压 g p t。 五点二,拿下人类最高难度测试冠军 g p q a。 博士级科学推理能力也超越了 cloud 四点五,更狠的是,显存占用直接降低百分之六十,真正的速度快,能推理又便宜,你觉得可以称得上国产之光吗?
粉丝9.3万获赞110.3万

八毛钱呢,在今天也就是半个馒头的钱,但在 ai 圈呢,现在可是一百万 token 的 价格。今天可是除夕啊,阿里正式开源了新一代的千万三点五系列, 我想这大概就是科技圈最卷的拜年方式了。这次发布的企业模型千万三 plus api 价格呢,直接达到了每百万 token。 八毛钱什么概念啊,这可是谷歌 gmi 三 pro 价格的十八分之一,而且阿帕奇二点零的协议,全尺寸开源,不管你是个人开发者、学生还是中小企业,都能直接免费的商用。 以前我们都知道最强和最便宜的这两个词呢,它是不可能出现在同一模型上的,要么性能顶级贵的离谱,要么是便宜呢,但是能力打折。千万三点五 plus 这次不仅是价格地板价,性能呢,更是直接硬钢了。这俩币源顶流登顶了全球最强的开源模型, 支持的源数量呢,也扩展了两百零一种。就因为这次用上了极致稀疏的 m o e 架构,传统模型呢,是所有参数同时干活,参数越多呢算的越贵。 m o e 的 思路呢,是按需激活,你问一个代码问题, 他就激活擅长代码的那组专家,你问数学题呢,他就切换到了数学专家,等于三百九十七币的知识储量,十七币的算力消耗不熟,显存占用直接降了百分之六十,推理速度快了八倍,这就是省钱的原因。 而且他还是原生多模态,不是后期拼装的视觉模块。从预训练第一天起呢,就是文字和图像混合数据上一起预训练的,天生就能看懂图片和视频,这种就很像当年的 linux, 当一个最好用最便宜最聪明的模型是开源的时候,他就会成为整个行业的空气和水。 以前要花大价钱才能用上,能力呢,现在门槛被技术本身再次拉低。摩达社区哈根 face 千万 a p p 千万披萨呢,现在已经可以体验了。不知道阿里这一波 ai 半年啊, open ai 和 google 看了是什么心情。

龙虾加困三点五能擦出什么样的火花呢?我们知道困三点五在除夕夜正式发布了,它呢也是号称最强的开源模型,它的能力可以说拳打 g p t, 五点二 叫 t cloud, 四点五是可以和国际的这些顶级的大模型搬一搬手腕的。那好,那么这样一个国产的重量级的开源大模型,我们能不能在龙虾里面免费调用呢? 答案是可以的,接下来一个视频,带着你从零到一的在龙虾里面去接入困三点五,完成免费的调用。好,那话不多说,咱们直接进入正片吧。那么接入的步骤呢?其实也不多啊,总共呢四步就搞定了。首先第一步啊,如果你本地没有欧拉玛的情况下, 你先下载一个欧拉玛,注意下载最新版的,如果你的欧拉玛很长时间没有更新的,那么也是一样先更新到最新版本啊,那么这个没啥好说的,你呢,就把它下载下来,一路下一步就可以安装了 啊,安装完了之后呢,接下来咱们要在我的欧拉玛上去安装你的问三点五的模型。好,那么安装的话怎么安装啊啊?复制这行命令,然后这时候呢,把命令输进去就行了, 这个就是开源的问三点五的模型了。好,然后这时候敲回车,咱们只需要等待欧拉玛去安装千问就行了,很快咱们就可以看到。哎,我的千问三点五就已经安装到本地了啊,这时候呢,我知道有同学就说了,说,磊哥啊, 我本地的电脑配置不是特别高,问三点五能不能部署啊?这个还真能,为什么呢啊?因为在欧拉玛里面的这个问三点五的这个模型,大家可以看到了,后面跟了一个谁呀? cloud, 这个是欧拉玛新推出的一种 云端的模型啊,这些新模型呢? ok, 大家可以看到它都是有 cloud 标识的,像 win 三点五呀,智普的五呀,还有像 mini max 的 二点五啊,都是 cloud 的, 那么这个 cloud 是 什么意思啊? 啊?它指的是欧拉玛远程帮你已经部署好了满血版的这些模型了,你只要有欧拉玛的这个客户端,你就可以快速的去连接欧拉玛帮你部署好的这个开源模型了,所以这时候你不需要担心自己的电脑不好,因为这个满血版的大模型, 它的本质上是没有在你本地部署的,而是在欧拉玛的服务器上部署的,你有欧拉玛,你是可以直接去用的啊,所以它是这样的一个逻辑,因此呢,你电脑不好没有关系,是可以去用的。好, ok, 那 么很快咱们就部署好了啊,部署好了之后呢,接下来第三步啊,咱们就去登录我的欧拉玛账号。好,这时候复制这行命令, 来到命令窗口里面输入这行指令敲回车,然后敲回车之后呢,它会自动打开页面啊,这个是欧拉玛的登录页面,如果说他没有出现,大家看这个地址了没,复制这个地址,手动的粘贴到你的浏览器里面就行了。好,那这时候 ok, 去填写你的欧拉玛账号。那有人说,哎,那磊哥我没有欧拉玛账号怎么办?那没有邮箱的情况下呢,我们就去点击底下这个注册按钮啊,然后点击完成之后呢,然后接下来 在上面这个输入框里面去填写你的邮箱信息啊,那我就填写我的这个邮箱信息,点击继续。好,这时候呢,他让你去输入创建一个密码啊,那你就输入密码,然后点击继续, 然后点击下一步。好,点击完成之后呢,他要求登录到你的邮箱了,他把这个验证码收到你的邮箱了。好,输入完邮箱之后呢,他要求绑定一个手机号啊,那我们这时候呢,就去填写我们的手机号, 然后点击发送验证码。好,然后拿到手机上的验证码之后呢进行输入啊,输入完成之后呢,咱们就完成了登录了啊,大家看到没?我就登录了 啊,登录完了之后呢, ok, 去点击呃,底下的 connection, ok, 它就显示已经登录成功了,那么到这咱们的第三步就已经完成了啊,完成之后呢,接下来咱们就可以执行最后一步了, 使用这行命令来去启动你的 open class 啊,就可以完成 open class 接入欧拉玛里面的问三点五的模型了。好,那这时候呢,咱们最后一步啊,使用这行命令 来启动进行交互了。好,那这时候咱们来试着启动一下,回到命令窗口里面,把这行命令呢输入进去。好,稍回车。好,那么等待片刻之后呢,咱们可以看到啊,咱们的 open class 了,并且使用的模型呢,是欧拉玛的千问三点五的 cloud 模型啊,但是能不能用呢啊,那么接下来咱们可以打开命令窗口, 或者是打开咱们的飞书啊,来测一下。那我这呢就打开我的命令窗口啊,然后完了之后呢?好,接下来咱们就呃给他新开一个 new session 吧, 新开一个窗口啊,然后咱们来问一下他,我给你更换了新的大模型,告诉我你使用的大模型是啥,那咱们就给他一行这个命令啊,然后点击 send。 好, 那这时候咱们来看一下他给咱们返回的模型是啥,看到没?那他说的是我现在用的就是啥呀,问三点五的模型了,那这样的话,咱们就使用 openclo, 可以 免费的使用 欧拉玛里面的问三点五的模型了,好,这时候可能有人就问了,说,难道这么简单吗?我可以这样免费的去使用欧拉玛的云端模型吗?有没有限制啊?答案是有的啊,比如说欧拉玛的云端模型,人家也是有成本的吧, 所以说那么欧拉玛的调用云端模型的调用也是有额度限制的,然后这个额度限制在哪呢?给大家来看一下啊。这时候呢去点击账号右上角的这个账号啊,点击完了之后呢,在这大家看到没, 这块呢就是云端模型的使用限制啊,它是有一个百分比的,那么每周它会有一定的额度,然后每四个小时会有一定的额度,那么当你把这个额度用完之后呢,那么云端的模型就不能掉了, 所以我刚才问了两个问题,那么基本上就消耗了百分之一点二,所以这个免费的模型的话,每四个小时应该是能够调用一百次左右啊,根据你的这个上下文的这个计费是不一样的, 所以总体来看,这个免费的额度相比于其他的免费的额度来说啊,欧拉玛还是更实在一些。那么到这儿咱们就完成了在 opencloud 里面去接入问三点五的功能了。我是李哥,每天分享一个干货内容。

ai 圈啊,真的太凶了,除夕夜呢,阿里又发大招,上线旗舰新模型千万三点五,据称啊,是原生多模态,激活参数更少,智能体能力更强, api 接入价格更是只要每百万 八毛。这是目前一些主流的 ai 模型的 api 接入价格啊,千万三点五呢,比 g p t 五点二便宜了整整十五倍,比科奥的便宜四十五倍。这么便宜的旗舰开源模型, 炒分看起来还比肩世界顶流与三家。为了验个真伪啊,我看到消息呢,就带你们测试去了。目前啊,千万三点五已经可以在 q n chat 免费使用,如果呢,想要测试编程能力,可以去阿里云百链接入 a p i。 那 我呢,就把自己的品牌手册 pdf 和商品图丢给他,让他呢帮我做品牌官网, 他呢就可以读懂 pdf 的 内容,还能精准识别每一张产品图,自己对号入座。我把前几天做的 ai 教程给他,让他自己做个网站,他呢提取了视频当中描述的这个模型特点,直接帮我做了个卖模型的网站,类比我当时测 gmi 三 pro 的 案例,现在 用千问三点五处理这样的三 d 游戏也完全不是问题了,有粒子特效,还能自动配上音效。小男孩面对这种游戏啊,哪有什么抵抗力,这不过年了嘛,我还会让我九岁的侄子提需求,他想怎么改啊,我们就让千问现场改带娃的互动性啊,也是 plus 了,一整天测下来,我跑了几十个案例。 确实啊,千万三点五的能力啊,目前已经可以算是世界顶尖模型了。我呢也去翻了他们的官方文章,里面呢介绍了模型用到的新架构,很显然啊,这次突破是架构创新带来的直接结果, ai 的 使用门槛正在一步步被技术本身推倒。目前世界上顶尖的 ai 能力 已经开始从高算力、高成本的壁环当中跳出来,成为个人、开发者、创业团队,甚至每一个普通中小企业都能随时调用的底层基建。这其实让我联想到最近爆火的 open cloud, 作为一个私人 agent, 它呢,需要分布处理,执行多个任务,消耗托克的量非常大。要是你们自己装过,你们肯定知道,如果大家直接给自己的 bot 配置上高价的闭源模型驱动,那个账单啊,真的会让你惊掉下巴。那这时候,像千万三点五 plus 这样的模型,就可以在性能强大和性价比之间找到一个合适的平衡点,真正让普通人也能用得起二十四小时随时在线的全能 ai 助手。这个呢,对开发者、企业和学生教育类的用户啊, 尤其友好。接下来啊,千万三点五可能还有其他尺寸的量化版本和更强的王炸版本会陆续登场。我呢,会持续跟进这些模型的 api 调用、实测、长文本压力测试,以及它们在 a 阵的开发中的实际表现。如果你也关注开源生态的下一次进化,或者正在寻找更高性价比的 国产大模型替代方案,别忘了点赞关注,我会第一时间为你带来千万三点五全系列模型的深度评测,我们下期再见!

除夕夜别人都在放鞭炮,阿里直接放新模型,困三点五三百九十七 b a 十七 b 呢,正式开源了,这次呢,不是参数再大一点的升级,而是架构层面动刀, 它是一款原生多模态模型,就不是那种视觉,一个模型语言一个模型,在推理的时候呢,做一下拼凑, 而是从训练阶段开始啊,图像视频文本就混在一起学,属于从底层就打通了。参数呢是三千九百七十亿,用的是 m o e 的 混合专家架构,每次推理呢,只需要激活一百七十亿参数,简单来说呢,就是三百九十七币的脑子,只花十七币的电费,再加上啊限行注意力, getty dotnet 上下文呢,直接给到了一照支持二百零一种语言,速度呢,比上一代更快了,成本却更低。榜单成绩呢,的确很好看啊,但是呢,我们更关心另外一个问题,就是这些听起来很猛的架构升级,到底能不能够实际落地呢? 他能不能够真正做到看图,搜信息,写代码,读视频,一条龙完成?所以说今天这个视频呢,我们就不看榜单,不念指标,直接上真实任务, ok, 我 们现在开始。 那我们首先呢,丢给他一道之前很多模型都翻车的问题,我会问他啊,我想去洗车,洗车店呢,离我们家五十米,我应该是开车过去还是走过去,那很多模型呢,可能会下意识的回答,走过去更加环保,但忽略了一个关键点,就是我们洗的是车,而不是人。 困三点五呢,直接是抓住了这个问题的核心逻辑啊,车还在家里,最终呢,是必须要把这个车开过去, 他没有被距离很近这种表层信息带偏,而是理解了真正的目标。那这类题目呢,不是很复杂,但是他很考验啊,场景理解的一个能力。 所以说接下来呢,我们就把这个难度再拉高一点,我这里准备了一张电影截图,我会跟他说这部电影呢,我有点印象,但是具体的剧情,主演导演是谁我已经记不清了,你帮我做一个详细介绍的 html 网页, 我们点开看一下他的这个执行过程吧。那首先呢,他会识别图像,从而确定这是哪部电影,然后他就开始获取电影阿甘正传的一个详细信息了, 紧接着他会开始整理信息,并构建结构化的内容。最后呢,生成了这样的一个网站,我们现在呢,把这个网站下载下来,看一下它的效果。整体的这个电影脉络呢,他已经是梳理的非常清楚了, 不过呢,他这边是没有去搭配啊剧照图片,而且整体的这个紫色配色还是有些单调的,对吧?那于是呢,我就去啊,让他再加一点剧照,然后改一下这个电影感的配色。稍等片刻呢,他就开始去搜索相关的一个电影剧照了。然后呢做了这个配色 ui 的 一个调整,我们再次看一下它的这个效果, 那这一版呢,整体内容就更加丰富了,对吧?而且呢,他每一个经典的画面都会有这种匹配的剧照,这个呢,其实就是一次完整的多默契协同任务啊。从图片的这个理解,到互联网搜索,再到最后的这个网站代码的编辑落地,大家觉得他做的怎么样呢?可以在弹幕给他打个分啊, 那接下来的话呢,我们来测试一下它的这个代码能力和任务规划的能力啊,我这边呢使用 open code 来做,来到 open code 的 配置文件,首先呢我们需要去修改这个 base url 和 api key, 那 这些信息呢,大家可以在百联云平台获取。 配置完成之后呢,我们输入斜杠 models 来切换这个 queen 三点五 plus 模型。那这次呢,我们做的不是一个小 demo 小 游戏,而是呢直接让它在一个现有的后台里面做一个完整的电商后台 mvp。 并且呢我对范围做了一下控制啊,只需要做商品管理,订单管理, 库存扣减以及基础的一些状态流转。并且呢我们这边只需要去完成管理端,不需要去做小程序。那我把这个需求调给他之后呢,他没有开始直接写代码,而是先分析需求,拆解模块,规划结构, 这一点呢是很关键的,因为真正的工程能力啊,不是说你速度有多快,而是思路是否清晰,在任务执行的过程当中呢,他会边思考,然后边调用相关的工具。这种连续的任务推进呢,其实就是原生视觉语言模型的一个优势 啊,所有的步骤呢,都在同一个模型当中去完成,而不是拼接式的写作。在数据库部分呢,它设计了这个 product order, order item, 还有 user 这些核心表,库存校验啊,订单状态啊,也都是考虑进去了。 后端层面呢,它也做了这个代码分层,结构是非常的清晰。前端部分呢,它生成了商品列表,页表单页和订单管理前端后端数据库都是在协助推进的,项目也是可以直接启动并运行的。来我们看一下它的这个实际效果,商品列表搜索,新增上架、订单查询这些呢,都是可以去完美跑通的, 从任务规划到最终的代码落地,它没有出现结构混乱或者是推翻前面设计的这种情况,整体的逻辑啊,还是非常的连贯的。同样的任务呢,我之前也用这个 gmail 三 pro 测试过啊,虽然说两者最后都能够把这个项目给做出来,但是昆三点五呢,它这边是开源模型,而且 api 成本是更低的, 那如果说两个模型能力接近,但是其中一个成本更低,步数更自由,这对开发者来说意义就不一样了。如果是我的话呢,我会选择做的到但是更划算的那一个。最后呢,我们来测试一下他的视频理解能力啊,那这里呢,我准备了一个小游戏的测试视频,我们把它上传上去, 我让他呢自己去读懂这个视频,然后复刻这个小游戏。首先呢,他会去分析这个游戏的核心机制,玩法与视觉风格。接下来的话呢,他就开始构建游戏的一个视觉与交互框架。最后呢,他开始用 html 代码编写游戏。 ok, 现在他已经全部写完了,我们下载下来看一下效果。 整体功能界面我觉得还原度还是很高的啊。星空的背景,星空的元素大家可以看到,而且呢,在生命值这个地方,它没有去像呃原来的素材那样继续去使用数字,而是采用 icon 来代替。 并且呢在 level 这里,他也会随着数值越大,游戏难度相应增大,整体可玩性我觉得还是非常不错的。 ok, 那 到这里的话呢,四个 case 就 已经全部测试完毕了啊,从图像到搜索,从文本到代码,从视频到程序,这种端到端的能力呢,正是原生视觉原模型想要去解决的问题。 那这条视频呢,其实只是一个开始啊,后面我们还会继续用更加复杂的业务系统,甚至是多轮智能体写作。 如果说你对上面某 case 印象深刻,或者说想要让我去加大难度,可以在评论区告诉我。那现在呢,这个 quan 三点五相关模型啊,已经是开放使用了,大家可以在掐点 quan, 点 ai 或者是摩达社区使用。 ok, 那 以上呢,就是本期视频的一个全部内容了,感谢大家的收看,我们下个视频,再见, peace!

朋友们大家过年好啊,各种 ai 的 红包领到了吗?现在呢国产大模型啊也来拜年了,大模型领域的元神千问在除夕当天呢,发布了开源模型的新版本千问三点五, 虽然说啊,最近好多新模型发布,但是呢,千问三点五确实是我最关注的,因为呢它是毫无疑问的开源模型的领军者,所以呢,我也第一时间啊去做了上手的测试。今天呢就来分享一下我的千问三点五的实际体验。 如果说啊,你也做了体验,那可以来聊一聊。首先呢是参数,虽然呢我对参数现在不是特别的敏感,但是还是想和大家快速的过一下千分三点五的整体参数情况,那这一次开源的呢是千分三点五三九七 b a 十七 b, 也就是啊,三百九十七 b 的 总参数激活十七 b。 那 这次模型啊,采用了创新的混合架构,将限性的注意力啊和稀疏混合专家呢进行结合,力争呢在能力,速度和成本之间啊去达成一个最优的结果。 那还有一点啊,要特别注意的就是千万三点五是一个原生的多模态模型,也就是呢,从训练之初啊,他就让视觉和语言在统一的表征空间当中去联合学习,这个呢也是目前模型发展的一个趋势,在 g u i 理解还有视频分析等场景当中呢,都可以做到一模到底了, 数字呢总是很抽象的。那接下来呢,我们就进入实际的体验环节,因为啊,三百九十七币的总餐数量,估计大家呢想本地部署也比较困难,所以呢,想体验的话,主要就是通过千万 chat 还有阿里云百链的 api, 那我们先到千万 chat 里来做一些热身活动,先试试它的推理能力。那最近啊, ai 洗车的问题在网上很火,很多的模型呢都翻车了,我呢就先来试一下千万三点五怎么样?那我这里告诉他啊,洗车店离我家五十米,那我要洗车的话,我应该开车去还是走过去呢? 这里呢,千分三点五没有翻车,他注意到了问题的关键呢是洗车,另外呢还提示了一下可以叫上门洗车的服务。但是呢,这个服务在国内多吗?反正我是没有体验过啊。 那接下来呢,我再让他去写一个祝福语来试一下。在中文方面呢,其实我觉得啊,谦问的表现一直是可以信任的,这个祝福语的水平呢,也是相当可以的,文字方面的内容啊,我就不想放太多的精力了。接下来呢,我们就来试一下多模态,感受一下呢它的原声多模态支持。 那首先呢,我想试一个场景,在春节期间啊,大家都会刷到很多的爆款的 ai 视频,那很多时候呢,都会去求提示词,那是不是啊,可以用千字三点五来去帮我理解。然后呢直接去复刻这个视频, 这里呢,我传一个看到的很酷的视频啊,然后呢让千问去帮我分析一下视频的画面的整体风格,还有色彩,运镜动作。那最终啊,给我提示词,来去复刻视频。那很快呢,千问呢就可以分析出来视频的内容了。 其实呢,很多时候我们做不出高质量的 ai 视频,就是因为我们自己啊,写不出合适的描述,那我呢也使用同样的模型来试一下这个推理出来的提示词,它的生成效果, 那基本上可以说啊,它的复刻程度达到了百分之九十以上。那我呢也用千瑞 chat 自带的这个视频生成啊,也试了一下,那因为默认啊,它生成的是五秒视频,效果上呢就会有一些差异,但大体上呢也能复刻,所以呢,说明啊,它的理解是没有问题的。 那这一次啊,千万三点五也特意强调了它在开发方面的提升,而这个呢正是我最关注的一个部分,同时呢千万 chat 也加了一个 web dev 的 功能。那我们呢就先来快速的试一下,开发一个 web 上的小应用。 那昨天晚上啊,春晚的哈尔滨分会场,我觉得非常的不错,那我呢就给谦问一张哈尔滨分会场的图片,让他啊帮我去用三 d 的 方式重构这个场景,那还要可以自由的缩放和切换角度,那代码生成的速度啊,确实非常快,稍等一小会儿就能拿到结果。 那从功能的完成度来说呢,非常不错,尤其是啊,还非常细节的注意到了烟花灯光还有人群的特效处理, 可以单独的去做开关,特别是人群啊,真是太细节了。还有呢就是预设的这个镜头和时间,可以说呢,他在我的基本要求之上延伸出了很多有用的细节的内容。 可能唯一需要提升的呢就是这个建模的细节吧,那能根据一张图片做到这种程度,总体来说是非常不错了。另外呢,这个外部 app 呢,是可以直接做发布的,那发布出去之后啊,你就可以把拿到的这个链接丢给别人去看和使用了。 那除了这种基础的小型外部的开发呢,我还想试一下这种复杂场景下它的开发效果, 那我啊就在 cloud code 里去接入一下纤维三点五,然后啊最近我刚好有一个需求,就是呢,我本地呢经常会启动很多的开发服务,比如呢像 cloud code 里启动的, ide 里启动的,命令行里启动的,有的时候呢,我自己也记不清楚有哪些,那在启动新服务的时候呢,就经常冲突, 那我呢就想做一个工具啊,可以自动的去扫描所有的端口,然后呢通过格式化的界面来去给我查看和操作。另外呢还要可以做收藏,我可以把经常会使用到的服务呢收藏下来,下一次呢直接在这启动就可以了, 那我呢就来实际的开发一下,那开发的过程当中啊,我们配合上一些 skill, 它的体验是很不错的,那千万呢会先去准备计划,然后再实际的去执行开发。这里呢我开发的这个内容啊,其实它是麻雀虽小,五脏俱全的,它会涉及到前端的页面,后端的 api, 还有底层的扫描命令, 以及呢还有保存收藏信息的这个数据库,所以呢是一个比较完整的一个项目结构。那最后我们来看一下效果啊,也说一下我个人的感受。首先呢在功能上啊,它是完成了我需要的全部功能的,可用性呢是通过的, 那在效果方面来说呢,我觉得视觉的效果还是不错的,你觉得怎么样呢?因为我这里啊也特意要求了使用萨德 c n u i, 所以呢,其实它自己能发挥的自由空间不算大。 那第三个在 bug 处理上啊,开发的过程当中也遇到过 bug, 那 铅汞三点五我觉得有个比较强的能力呢,就是它确实能够把遇到的 bug 给解决掉。那最后呢,我们再来试一下这 u i 理解的能力。 那刚好前面我们开发完成了这个项目的功能,我呢就直接把铅汞三点五配置给本地的 openclo, 让他呢去用视觉的方法去操作一下网页,来试用一下这些功能。 那这里啊,我的动作描述呢,其实相对来说比较简单,那能够看到啊,它会根据自己的理解再推理出来应该如何去操作,最后呢也会自己进入到松仓夹来去做确认,整体的表现呢,我觉得非常不错。 而且呢,还必须要提一句啊,就是速度非常快。这里呢,我是有点惊喜的,因为现在啊,大家去配合 open cloud 使用的时候呢,速度快,在体验上的提升啊,那真是非常直观的。 那截止到二零二六年一月,哈根 face 上最新的数据显示啊,千万衍生的模型数量呢,突破了二十万,成为了全球首个达成此目标的开源大模型。同时呢,千万系列模型的下载量突破了十亿次,平均呢每天被开发者们下载一百一十万次,稳居呢全球开源大模型的 top one。 所以呢,千万模型的更新啊,很多时候不单单是为了无数的子子孙孙都会呢进入新时代。 那还有一点呢,我很关注的就是后续的基于千万三点五出的更小规模的模型,如果呢有七十倍八十倍左右的模型出来,那在本地和端侧呢,就会有更多的想象力。 那这一次啊,我综合的体验来说呢,我觉得是非常不错的,尤其呢,这一次的原生多媒体支持,让他的表现呢更加全面。那在二零二六年选择模型的时候呢,千万依然会是我第一时间想到的一个选择。好了,这里是爱的咖啡馆,我们下次再见。

除夕通一千万发布了,通一千万三点五是一个旗舰模型,刚刚他发布四个小时前那通一千万,这次发布的这个模型还是按了按十乘以万。为什么?第一个它是个旗舰模型, 旗舰模型应该是它一千万版本里面是一个顶级的这样的,而且它是开源的,是基于阿帕奇二点零的这样的一个是非常好。 他这个旗舰模型他的能力怎么样?我们大家看一下,这是官方公布的一个数据,一个他对标的都是他的一些。呃,国内的那些旗舰模型,他是 gpt 五点二,最新的 loft op 四点五、 jimmy 三 pro, 包括还有同一千万他们自己的三 max thinking, 这些都是些旗舰模型,你可以看到啊,他跟他们比起来,他有些能力甚至是超过他们,特别是在他跟他们比起来,他有些能力甚至是不如, 特别是。呃,看了一下他指令的遵循,这个应该是 top 最厉害。写代码的能力应该也是跟奥的 ops 还是比较接近的,他多模态的能力,特别是 ocr 的 这种按摩墙应该来讲非常不错的。还有一个三 m u pro, 它达到了七十九分,非常高的一个分, 非常接近于 google 的 germany 三 pro 要与 autop 四点五这个版本基本上跟 g p t 五点二最新的版本是接近了,在有些编辑方面的能力也是超过了像我们前面讲的五点二,对吧? autop 包三, autopcom 在 写代码能力是不如 这次提升比较厉害的是这个叫 terminalbench 二,二的这个主要是智能体写代码,它对于这个终端命令的这样的一个准确率 非常快,原来是比较糟糕的二十二点五,现在达到了十二点五提升费,这是他一个比较大的一个程度, 说明他在写代码能力,目前在挖一个编程这个方面是显著提升了。好,我们可以看看他的这个模型,应该来讲不是很大,大概是三百九十七个 b active 是 十七个 b 是 一个,应该来讲是一个模型,但是他的能力是基本上是达到了,达到 k m k 二点五 e t active 三十二 b 的, 这样 对企业级来讲非常好,是模型能力超强,但是它的模型的大小要比旗舰模型都要小,所以它的效率会要的算力也会更少啊。 这个都是他一些详细的一些评测,重要写代码的,能写多模态的一些不圆的能力,设置 a 境产写通用的智能体的一些能力,这个能力也是比较重要。 f c l 杠米斯,我们经常会给大家讲 u c bookle 的 一个人体调用工具的这样一个停车也是非常重要,推定能力也是不错。 还有一个是长上下文,它这个模型目前长上下文能力也非常强,全身是二百五十六 k, 它也可以扩展到一兆的这样上下文,超长上下文。哦,那这个模型应该来讲在春节除夕晚上发布出来,应该来讲这个模型是对企业来讲非常有价值, 也可以商用的大模型。这个模型跟原来一样,它也是本科架构,跟原来通一千万三 next 这个架构是一样的, 这样效率会比较高,又是个多模态的,原来 next 它是个纯文本的,现在通一千万三点五,它又是个文本,又是多模态,这写代码能力也是不错,所以它是个旗舰模型。好,我们简单就给大家就介绍一下。

你好,我是郑工长。最近看到一个数字让我有点震惊,一百万 tokens 只要八毛钱,你知道吗?这是阿里 quan 三点五 plus 的 定价,一百万个 tokens 才八毛钱, 更重要的是,它的性能已经超越了 jammy 三,直接登顶了开元榜首。很多人看到这,可能第一反应会觉得,哎呀,这是不是价格炸啊? 但我的判断是,这根本就不是什么价格战,这分明是一场革命。咱们先来看两个数据你就明白了。第一个数据就是咱们前面说的 quan 三点五 plus, 一 百万个 tokens 才八毛钱, 它有三千九百七十亿个参数,性能已经超越了 jammin 三,而且它是开源免费的,所以 api 调用成本特别低。你看,这可是国产大模型第一次能在性能和价格上同时把海外竞品给双杀了,这事是不是挺有意思? 再看第二个数据,最近软件行业的市值啊,蒸发已经超过了万亿美元。为什么会这样? 就是因为投资者特别担心 ai 会彻底颠覆传统软件,像 salesforce、 sap 这些企业软件巨头,它们的股价都暴跌了,因为什么? 因为 ai agent 正在一点点跌,吃掉传统软件的市场蛋糕。这两个数据看起来好像没什么关系,但是它们背后啊,有一个共同的逻辑,那就是 ai 的 能力正在从以前的稀缺品慢慢变成基础设施。 你说是不是这个理?可能很多人就不理解了,大模型训练成本那么高,为什么 api 还能卖这么便宜呢? 其实核心原因啊就三点。第一点就是它的开源策略直接降低了门槛, quan 三点五 plus 是 开源模型,这意味着任何人都可以直接下载部署,甚至在此基础上二次开发。 所以阿里呢,它就不需要通过卖 api 来收回全部的研发成本。第二点,边际成本趋近于零,模型训练啊,它是一次性的投入, 虽然推理也有成本,但是随着硬件不断优化,架构不断升级,这个成本正在快速下降,几乎可以忽略不计了。第三点,这是阿里的生态战略,阿里真正的目标根本不是靠卖 api 赚钱, 他希望的是让更多的开发者和企业都能用上 quan, 这样就能形成一个庞大的生态。而真正的变现路径,其实是他的云服务,还有企业解决方案。 关键是呢,从商业角度看,模型本身他不赚钱,模型之上的生态才是真正赚钱的地方。 那这个白菜价到底意味着什么呢?对咱们开发者来说,这意味着什么?首先,成本不再是门槛了, 你可以放心地去调用大模型 api, 就 连中小团队也能开发出自己的 ai 应用了。对企业来说呢,你不需要自己组建模型团队,也不需要投入巨额的算力,可以直接快速地去验证各种 ai 应用场景。 而对整个行业来说呢,这更是一个巨大的变化, ai 能力已经变成了像水电煤一样的基础设施竞争的焦点啊,也从以前的谁有模型,彻底变成了谁会用模型, 这意味着应用层的创业,真正的黄金时代已经到来了。以前很多人都觉得 ai 的 竞争啊,就是比谁家模型更强。 但是你看 quan 三点五 plus 这个白菜价,它在告诉我们一个非常重要的事实,模型能力正在快速的同质化。所以啊,当 gpt 四级别的能力都变成了标配的时候,真正的竞争就会转移到这几个方面。第一,应用层, 就是看谁能把 ai 能力真正变成用户需要的产品。第二,场景层,谁能在垂直领域深耕,真正解决实际问题。 第三,服务层,谁能提供更好的集成部署、运维服务。记住一点,模型是基础设施,它不是护城河,一百万 tokins 八毛钱,我跟你说,这仅仅只是个开始, 接下来啊,你会看到更多有意思的事情发生,会有更多的厂商跟着阿里一起降价,国产大模型的性能会继续提升, ai 应用也会迎来一个爆发式的增长。 所以啊,对于咱们普通人来说,这绝对是最好的时代。 ai 能力,它不再是少数公司的特权,而是每个人都能用得起的工具。 而对于创业者来说,问题早就不是你用不用得起 ai 了,关键是你能不能用好 ai。 对 了, quan 三点五 plus 现在已经开源了,你可以直接下载部署,完全免费,你别小看它,这才是真正的白菜价。

二月十六日除夕当天,阿里巴巴正式开源全新一代大模型千问困三点五 plus, 性能媲美 jameson 三 pro、 gpt 五点二等顶级闭源模型,登顶全球最强开源模型 千问三点五,实现了模型架构的全面革新。此次发布的困三点五 plus 版本总参数为三千九百七十亿,激活仅一百七十亿。以小胜大 性能超过万亿参数的 quan 三 max 模型,算力部署成本降低百分之六十,推理速度提升八倍,多项精准评测结果媲美超越 gpt 五点二这门 i 三 pro 等闭元第一梯队模型。原声多模态训练也带来千万三点五的视觉能力飞跃。 在多模态推理、通用视觉问答、 dk 文本识别和文件理解、空间智能视频理解等众多权威评测中,千万三点五均斩获最佳性能。相比上一代昆三 max 模型推理效率大幅提升,最大推理存储量已升至十九倍,且上下文越长,速度优势越明显。 在模型部署端,千万三点五通过混合注意力极致显著优化长文本场景的显存占用,并结合高希书猫架构,将每次推理的时机、计算量控制在极低水平,部署显存占用降低百分之六十。 这意味着大模型第一次真正具备了下沉到边缘设备陷入日常应用的工程可行性。当行业仍聚焦于跑分竞赛时,千万三点五已将竞争推向新阶段,谁的模型更实用、更易用、更多人用得起? 不光卷性能,阿里在 ai 应用端也实属卷亡。一月十五日,千问啊发布全球首个消费级 ai 购物 age 的 春节期间,千问 ai 购物 age 的 六天时间帮用户完成了一点二亿笔订单,在全球首次实现大规模真实世界任务执行和商业化验证。 age 的 能力大幅增强的千问三点五,将进一步打开千问 app 在 工作和生活中帮人办事的想象空间。

家人们,春节党可不只有电影神仙打架, ai 圈这波王炸才是真的杀疯了。今天这条视频,我敢说会彻底颠覆你对大模型的所有认知。你是不是还以为现在的大模型拼的就是堆参数比跑分,看谁烧钱更多?是不是觉得模型越强就越贵,越遥不可及, 只能被大厂攥在手里,普通人小公司根本碰不到。我告诉你错!今年春节,阿里直接扔出一枚行业核弹,天文困三点五 plus 除夕当天重磅开园,直接打破了整个大模型的游戏规则。先给大家说一个特别扎心的真相,过去两年,整个大模型行业陷入了一场疯狂的烧钱竞赛。大家都信奉一句话,大力出奇 迹,参数从千亿堆到万亿,部署要专用,集额算力,中小企业望而却步,个人开发者想碰都碰不。 技术越来越强,却离我们真实的需求越来越远,最后变成了大厂专属的炫技工具。但千万三点五 plus 偏偏就不按厂里出牌,他不去拼参数有多大,只 拼技术到底有多聪明。总参数三千九百七十亿,但是只激活了幺七零亿,用最小的身材干出了最猛的效果,性能直接对标甚至超越那些靠堆参数堆出来的老款模型,媲美 g p t。 三点五 pro。 更狠的还在后面部署,显存占用直接降了百分之六十,推理效率直接翻了十九倍。但最炸的还不是性能,是价格, 千万三点五 plus 的 a p i 价格,每百万 token 只要八毛钱,仅仅是同类产品的十八分之一。可能有人会说,便宜而已,有什么了不起? 告诉你,这根本不是简单的降价,这是架构创新带来的效率拐点,是整个大模型行业的一次真正革命。你以为便宜就会牺牲性能吗?恰恰相反,它不是靠压缩成本,不是靠补贴烧钱。而 全新的底层架构,天生就决定了它可以又强又快又便宜。这是行业里第一次把最强和最便宜揉进同一个模型里。当整个行业还在死磕谁的跑分更高时,千万已经把竞争带到了下一个维度,谁更好用,谁更实用, 谁更多人用得起。为什么我敢说,性价比会是未来 ai 的 核心竞争力?因为 ai 的 时代已经彻底变天了。过去是聊天机器人,现在正在全面迈向 ai 智能体时代。 一个高频使用的 ai 应用,一天就要消耗数亿 token。 对 中小企业、对开发者来说,他们不需要过剩到浪费的极 致性能,他们只需要恰到好处的智能,更关心的是能不能覆盖成本,能不能真正赚钱。性价比就是通往万物 ai 时代的唯一门票。阿里的布局从来不是搞技术炫技,而是双线进攻。技术上追求星辰大海,深耕底层创新,打破算力天花板,应用上服务人间烟火,让 ai 真正走进我们的生活。就说千问 app 上线才三个月,日活直接冲到七千三百五十二万大榜,应用商店免费榜上线四百多项 ai 办事功能,是全球首个能完成真实生活复杂任务的 ai 助手。春节期间 ai 大 免单活动,六天时间,用户通过 ai 一 句话下单超过一点二亿笔, 奶茶买年货、订机票、订酒店,说一句话全部搞定,这是全球首次 ai agent 在 真时世界大规模商业化跑通,别人还在圈聊天,千万已经在帮我们办事了。讲到这里,我可以非常肯定的说,千万三点五 plus 的 发布,一定会彻底改写 ai 行业的格局。 第一,它会让技术红利不再只属于金字塔尖,个人开发者、创业团队、中小企业都能用得起顶级大模型。第二,它会催生无数新的创业机会,让 ai 不 再 是空中楼阁。第三,它会推动开源力量全面崛起,把 ai 基础设施的标准制定权从闭源巨头手里转向开源生态。第四,它会让 ai 真正落地千行百业,走进每一个普通人的生活。记得点赞关注哦!


就说春节阿里会搞事,一分钱喝奶茶,无门槛免单卡,这场狂欢刚把服务器挤到卡顿崩溃,官方紧急扩容,延长免单有效期。这边热度还没下去,阿里又扔出一个王炸,春节期间正式升级新模型 q n 三点五, 这波操作直接把 ai 圈的春节氛围拉满。要说这个 q n 三点五最能打的地方,绝对是它全新的混合注意力机制, 比传统模型速度快十倍,训练成本直接降低百分之九十,既能快速响应简单任务,又能深度搞定复杂推理效率和精度直接双在线,这也是它和其他模型拉开差距的核心优势。 这是去年 deepsea 二一爆火的逻辑,今年要被阿里改写吗?还是 deepsea v 四会更火?接下来解析下,我们解析下 q n 三点五有什么具体特点。第一是模型形态特别贴心,兼顾了普通人、开发者和企业的所有需求。 这次计划开源两个核心版本,一个是二 b 级的轻量密集模型,轻便到手机、普通电脑甚至边缘设备都能轻松运行,不用再依赖昂贵的服务器。 另一个是三五 b a 三 b 的 莓模型,极致稀疏的架构,虽然总参数够大,但干活时只调动少量算力,性能顶尖还省钱, 企业级的复杂任务也能轻松扛住。第二是智能体能力的全面强化。对比上一代模型, q n 三点五的工具调用更稳定,长链路推理能力也大幅提升,不管是帮你订票、处理售后, 还是写代码、做内容创作,甚至是复杂的 ai agent 的 场景,都能高效完成,真正实现从会聊天到会干活的转变。第三是它延续了 q n 系列的开言策略,采用 ipad 二点零协议,开发者不仅能免费用,还能用于商用,没有任何法律后顾之忧。 这也难怪,他还没正式发布,就已经在海外开源社区掀起了热潮。而且他原生支持一百一十九种语言,中文表现尤其出色,不管是日常对话还是专业创作,都特别贴合我们的使用习惯。其实熟悉 ai 圈的朋友都知道,阿里这波操作看似突然,实则早有准备。 之前 q n 三发布时就引发了行业震动,如今趁着春节三十亿补贴的热度顺势推出 q n 三五,不仅巩固了自己在开元大模型领域的优势,也让更多普通人感受到了 ai 的 实用性。 说到这儿,真的忍不住感慨,以前国内 ai 界的更新节奏大概是一周一更新,偶尔出一个新功能、新模型就足以引发热议。但今年春节大家应该都有感觉, ai 圈的新闻简直天天不重样。阿里这边三十亿补贴报服务器升级新模型, 其他厂商也在悄悄憋大招,各种新突破、新应用层出不穷,我们甚至还没完全适应上一代 ai 模型的功能,新一代的升级就已经到来。不得不说, ai 的 时代真的来的太快了, 它不再是高高在上的技术名词,而是慢慢融入我们的日常生活。从薅羊毛时的 ai 指令,到工作中的高效辅助,再到未来可能普及的数字员工, ai 正在以我们想象不到的速度改变着我们的生活和工作方式。 相信等 qwind 三点五正式开源上线,一定会带动更多 ai 应用落地,也会让更多普通人开发者受益。咱们不妨趁着春节多关注一下这些 ai 新动态,也可以关注我,咱们普通人一起 ai 落地。

这个春节,无论是老百姓的热搜还是 ai 圈层,都被千万刷屏。谁也想不到,在除夕当天,阿里正式开源新一代大模型千万三点五 plus, 亮出春节档真正的杀手锏。 为什么这么说,千万三点五的这次开源,真正把 ai 使用成本降下来了,在性能相当的情况下,每百万 token 零点八元,这仅为 gemini 三 pro 的 十八分之一,成本大降百分之九十五, 降低了中小企业使用模型门槛,真正实现让 ai 走进千行百业。在用户端,千问 app 春节免单活动依旧爆火,仅六天就完成了一点二亿笔下单。千问总裁吴佳也出面回应了千问爆火背后的故事。 二月六号,千万推出春节大免单,结果用户太热情,九小时订单破一千万,全天直接干到一千五百万单,是他们自己预估的十五倍。夸张的是,凌晨两点多还有人在定酒店买电影票。更令人意外的是,低线城市用户冲的比一线城市还猛。 面对这场破天流量千万, c 端事业群总裁吴佳却特别冷静,他在采访里反复说一句话,我们不是要和谁决, 不是卷补贴,不是卷流量,更不是为了跟谁打价格战。他真正想干的事就一句,让 ai 融进老百姓的日常生活。而且他坚信,这是未来一定会发生的事。 回想一年前, ai 只是一个能对话的聪明的朋友,谁也没有想到,仅仅过了一年,我们已经在用千问实现消费闭环,只需要和千问说,千问帮我。大到定酒店,小到买一杯奶茶,全网都在体验 ai agent 给生活带来的变化。 吴家自己也有个习惯,每天盯着看用户说了多少次千问帮我。他说这代表用户心智的形成。比起 dau 追评豆包,他更关心 ai 到底有没有提升帮人办事的能力。 也有人质疑,这不就是烧钱换用户?吴家的回答很干脆,这不是卷流量,而是让 ai 在 真实世界里被不断打磨。 他还透露,因为用户太热情,实际投入早就远超原计划的三十亿。今年不少国外的 ai 公司纷纷晒出自己模型的最新成果,只有千万已经进入寻常百姓家,服务于真实世界的人。所以他对中国的 ai 应用特别有信心,我坚信,这一波中国一定会走在世界最前沿。 说到底, ai 不是 少数人的专属,而应服务多数人的生活。从一张返乡车票,到一场家庭电影,再到一杯随手点的奶茶, ai 的 红利正通过千万渗入千万家庭的日常,而这正是吴嘉和千万团队一直相信的未来。

二零二六年农历除夕,阿里云正式发布了旗舰大模型 qen 三点五 plus, 这不仅是性能上的跨越,更是直接化身成了价格屠夫。它的 api 定价直接压到了零点八元。一百万头肯这个数字是什么概念?它仅仅是竞品 gemini 三 pro 价格的十八分之一。 可以说,阿里这次发布,就是要在对标 gpt 五点二和 cloud 四点五这种全球顶级模型的商业性价比。 刚才说完了价格,咱们来看硬实力。在衡量模型综合认知能力的 mmlu pro 测试里, qone 三点五 plus 跑出了八十七点八的高分, 这个成绩直接压过了 gpt 五点二。这意味着在处理海量通时和复杂常识问题时,这款国产旗舰的底层脑容量已经站稳了世界第一梯队。 不仅是通世强,在专门针对博士级科研问题的 g p q a 榜单上, q n 三点五 plus 拿到了八十八点四分,成绩甚至超过了 cloud 四点五。 这就说明他不是在死记硬背资料,而是真的具备了深度逻辑推理能力,能处理那些让普通人都头大的高难度科学难题。 最夸张的是指令遵循能力, i f bench 测试的是模型听不听话,活干的准不准。 q n 三点五 plus 拿到了七十六点五分,直接刷新了全球纪录,位居世界第一。 简单说,你给他下达复杂的长指令,他的执行准确率是目前全球最高的,这就保证了他在实际工作中不会胡言乱语,而是能精准完成你交代的每一项任务。 分数跑得高,实际好不好用,还得看真本事。 q n 三点五 plus 的 多模态能力非常离谱,它具备一种原生直觉, 你给他一张鲨鱼骑在马上的图片,他五秒钟就能告诉你这是沙琪玛。但在处理马王堆这种复杂的文物图片时,他会进入长达三十七点三秒的深度推理模式。这种叫做 system 二 thinking 的 机制, 让它能像专家一样,层层拆解视觉背后的文化隐喻,而不是简单的做文字复述。它不是在识别像素,它是真的看懂了文化。在写代码这块, q one 三点五 plus 的 逻辑闭环 做得更好。有很多开发者在 reddit 上反馈,它写的 svg 矢量图代码比 gmail 还要稳。更实用的场景是,你随手在纸上画个 ui 草图,拍张照片传给他,他就能直接给你吐出能用的前端代码。 这种视觉和编程逻辑的深度融合,意味着 ai 已经能直接参与到从创意到工程的转化过程了。 最后说说容量问题, q n 三点五 plus 支持一百万 token 的 超长上下文,这意味着什么? 以前的 ai 看视频只能看个几分钟的片段,现在你把一整部两小时的电影扔进去,它不仅能给你总结剧情,还能把里面复杂的人物关系变化分析的透透彻彻。这种对长视频的原声权局理解,彻底解决了以往处理长内容时首尾不顾的痛点。 聊了这么多经验的功能,你肯定会问,这东西凭什么卖的这么便宜?咱们揭开盖子看发动机。 kvin 三点五 plus 采用了一种非常超前的混合架构,把限性注意力机制和稀疏混合专家摩易结合到了一起。虽然它的总参数量接近四千亿, 但神奇的是,他每次跑起来,其实只动用了其中的一百七十亿参数。这就好比一个巨大的专家库,每次只叫最专业的几个人出来干活,结果就是他的推理速度直接飙升到上一代的十九倍, 显存占用反而砍掉了百分之六十,这就是他敢把 api 价格打到地板上的底气。之后咱们不看跑分,看实战技术的强弱,得在春节这种高病发场景下见真章。 在二零二六年的春节期间,通用 app 的 agent 的 调动量突破了四十一亿次,这可不是简单的聊天,而是大量用户在用它自动点奶茶、买年货,甚至是处理跨软件的复杂工作流。 这种海量并发下的稳定性,足以证明 q n 三点五 plus 已经不是实验室里的玩具,而是真正能帮大家解决问题的生产力工具。一句话总结,他用十七币的成本跑出了四百币的智商,而且还便宜的离谱。