粉丝2656获赞2.1万

朋友们大家过年好啊,各种 ai 的 红包领到了吗?现在呢国产大模型啊也来拜年了,大模型领域的元神千问在除夕当天呢,发布了开源模型的新版本千问三点五, 虽然说啊,最近好多新模型发布,但是呢,千问三点五确实是我最关注的,因为呢它是毫无疑问的开源模型的领军者,所以呢,我也第一时间啊去做了上手的测试。今天呢就来分享一下我的千问三点五的实际体验。 如果说啊,你也做了体验,那可以来聊一聊。首先呢是参数,虽然呢我对参数现在不是特别的敏感,但是还是想和大家快速的过一下千分三点五的整体参数情况,那这一次开源的呢是千分三点五三九七 b a 十七 b, 也就是啊,三百九十七 b 的 总参数激活十七 b。 那 这次模型啊,采用了创新的混合架构,将限性的注意力啊和稀疏混合专家呢进行结合,力争呢在能力,速度和成本之间啊去达成一个最优的结果。 那还有一点啊,要特别注意的就是千万三点五是一个原生的多模态模型,也就是呢,从训练之初啊,他就让视觉和语言在统一的表征空间当中去联合学习,这个呢也是目前模型发展的一个趋势,在 g u i 理解还有视频分析等场景当中呢,都可以做到一模到底了, 数字呢总是很抽象的。那接下来呢,我们就进入实际的体验环节,因为啊,三百九十七币的总餐数量,估计大家呢想本地部署也比较困难,所以呢,想体验的话,主要就是通过千万 chat 还有阿里云百链的 api, 那我们先到千万 chat 里来做一些热身活动,先试试它的推理能力。那最近啊, ai 洗车的问题在网上很火,很多的模型呢都翻车了,我呢就先来试一下千万三点五怎么样?那我这里告诉他啊,洗车店离我家五十米,那我要洗车的话,我应该开车去还是走过去呢? 这里呢,千分三点五没有翻车,他注意到了问题的关键呢是洗车,另外呢还提示了一下可以叫上门洗车的服务。但是呢,这个服务在国内多吗?反正我是没有体验过啊。 那接下来呢,我再让他去写一个祝福语来试一下。在中文方面呢,其实我觉得啊,谦问的表现一直是可以信任的,这个祝福语的水平呢,也是相当可以的,文字方面的内容啊,我就不想放太多的精力了。接下来呢,我们就来试一下多模态,感受一下呢它的原声多模态支持。 那首先呢,我想试一个场景,在春节期间啊,大家都会刷到很多的爆款的 ai 视频,那很多时候呢,都会去求提示词,那是不是啊,可以用千字三点五来去帮我理解。然后呢直接去复刻这个视频, 这里呢,我传一个看到的很酷的视频啊,然后呢让千问去帮我分析一下视频的画面的整体风格,还有色彩,运镜动作。那最终啊,给我提示词,来去复刻视频。那很快呢,千问呢就可以分析出来视频的内容了。 其实呢,很多时候我们做不出高质量的 ai 视频,就是因为我们自己啊,写不出合适的描述,那我呢也使用同样的模型来试一下这个推理出来的提示词,它的生成效果, 那基本上可以说啊,它的复刻程度达到了百分之九十以上。那我呢也用千瑞 chat 自带的这个视频生成啊,也试了一下,那因为默认啊,它生成的是五秒视频,效果上呢就会有一些差异,但大体上呢也能复刻,所以呢,说明啊,它的理解是没有问题的。 那这一次啊,千万三点五也特意强调了它在开发方面的提升,而这个呢正是我最关注的一个部分,同时呢千万 chat 也加了一个 web dev 的 功能。那我们呢就先来快速的试一下,开发一个 web 上的小应用。 那昨天晚上啊,春晚的哈尔滨分会场,我觉得非常的不错,那我呢就给谦问一张哈尔滨分会场的图片,让他啊帮我去用三 d 的 方式重构这个场景,那还要可以自由的缩放和切换角度,那代码生成的速度啊,确实非常快,稍等一小会儿就能拿到结果。 那从功能的完成度来说呢,非常不错,尤其是啊,还非常细节的注意到了烟花灯光还有人群的特效处理, 可以单独的去做开关,特别是人群啊,真是太细节了。还有呢就是预设的这个镜头和时间,可以说呢,他在我的基本要求之上延伸出了很多有用的细节的内容。 可能唯一需要提升的呢就是这个建模的细节吧,那能根据一张图片做到这种程度,总体来说是非常不错了。另外呢,这个外部 app 呢,是可以直接做发布的,那发布出去之后啊,你就可以把拿到的这个链接丢给别人去看和使用了。 那除了这种基础的小型外部的开发呢,我还想试一下这种复杂场景下它的开发效果, 那我啊就在 cloud code 里去接入一下纤维三点五,然后啊最近我刚好有一个需求,就是呢,我本地呢经常会启动很多的开发服务,比如呢像 cloud code 里启动的, ide 里启动的,命令行里启动的,有的时候呢,我自己也记不清楚有哪些,那在启动新服务的时候呢,就经常冲突, 那我呢就想做一个工具啊,可以自动的去扫描所有的端口,然后呢通过格式化的界面来去给我查看和操作。另外呢还要可以做收藏,我可以把经常会使用到的服务呢收藏下来,下一次呢直接在这启动就可以了, 那我呢就来实际的开发一下,那开发的过程当中啊,我们配合上一些 skill, 它的体验是很不错的,那千万呢会先去准备计划,然后再实际的去执行开发。这里呢我开发的这个内容啊,其实它是麻雀虽小,五脏俱全的,它会涉及到前端的页面,后端的 api, 还有底层的扫描命令, 以及呢还有保存收藏信息的这个数据库,所以呢是一个比较完整的一个项目结构。那最后我们来看一下效果啊,也说一下我个人的感受。首先呢在功能上啊,它是完成了我需要的全部功能的,可用性呢是通过的, 那在效果方面来说呢,我觉得视觉的效果还是不错的,你觉得怎么样呢?因为我这里啊也特意要求了使用萨德 c n u i, 所以呢,其实它自己能发挥的自由空间不算大。 那第三个在 bug 处理上啊,开发的过程当中也遇到过 bug, 那 铅汞三点五我觉得有个比较强的能力呢,就是它确实能够把遇到的 bug 给解决掉。那最后呢,我们再来试一下这 u i 理解的能力。 那刚好前面我们开发完成了这个项目的功能,我呢就直接把铅汞三点五配置给本地的 openclo, 让他呢去用视觉的方法去操作一下网页,来试用一下这些功能。 那这里啊,我的动作描述呢,其实相对来说比较简单,那能够看到啊,它会根据自己的理解再推理出来应该如何去操作,最后呢也会自己进入到松仓夹来去做确认,整体的表现呢,我觉得非常不错。 而且呢,还必须要提一句啊,就是速度非常快。这里呢,我是有点惊喜的,因为现在啊,大家去配合 open cloud 使用的时候呢,速度快,在体验上的提升啊,那真是非常直观的。 那截止到二零二六年一月,哈根 face 上最新的数据显示啊,千万衍生的模型数量呢,突破了二十万,成为了全球首个达成此目标的开源大模型。同时呢,千万系列模型的下载量突破了十亿次,平均呢每天被开发者们下载一百一十万次,稳居呢全球开源大模型的 top one。 所以呢,千万模型的更新啊,很多时候不单单是为了无数的子子孙孙都会呢进入新时代。 那还有一点呢,我很关注的就是后续的基于千万三点五出的更小规模的模型,如果呢有七十倍八十倍左右的模型出来,那在本地和端侧呢,就会有更多的想象力。 那这一次啊,我综合的体验来说呢,我觉得是非常不错的,尤其呢,这一次的原生多媒体支持,让他的表现呢更加全面。那在二零二六年选择模型的时候呢,千万依然会是我第一时间想到的一个选择。好了,这里是爱的咖啡馆,我们下次再见。

除夕夜别人都在放鞭炮,阿里直接放新模型,困三点五三百九十七 b a 十七 b 呢,正式开源了,这次呢,不是参数再大一点的升级,而是架构层面动刀, 它是一款原生多模态模型,就不是那种视觉,一个模型语言一个模型,在推理的时候呢,做一下拼凑, 而是从训练阶段开始啊,图像视频文本就混在一起学,属于从底层就打通了。参数呢是三千九百七十亿,用的是 m o e 的 混合专家架构,每次推理呢,只需要激活一百七十亿参数,简单来说呢,就是三百九十七币的脑子,只花十七币的电费,再加上啊限行注意力, getty dotnet 上下文呢,直接给到了一照支持二百零一种语言,速度呢,比上一代更快了,成本却更低。榜单成绩呢,的确很好看啊,但是呢,我们更关心另外一个问题,就是这些听起来很猛的架构升级,到底能不能够实际落地呢? 他能不能够真正做到看图,搜信息,写代码,读视频,一条龙完成?所以说今天这个视频呢,我们就不看榜单,不念指标,直接上真实任务, ok, 我 们现在开始。 那我们首先呢,丢给他一道之前很多模型都翻车的问题,我会问他啊,我想去洗车,洗车店呢,离我们家五十米,我应该是开车过去还是走过去,那很多模型呢,可能会下意识的回答,走过去更加环保,但忽略了一个关键点,就是我们洗的是车,而不是人。 困三点五呢,直接是抓住了这个问题的核心逻辑啊,车还在家里,最终呢,是必须要把这个车开过去, 他没有被距离很近这种表层信息带偏,而是理解了真正的目标。那这类题目呢,不是很复杂,但是他很考验啊,场景理解的一个能力。 所以说接下来呢,我们就把这个难度再拉高一点,我这里准备了一张电影截图,我会跟他说这部电影呢,我有点印象,但是具体的剧情,主演导演是谁我已经记不清了,你帮我做一个详细介绍的 html 网页, 我们点开看一下他的这个执行过程吧。那首先呢,他会识别图像,从而确定这是哪部电影,然后他就开始获取电影阿甘正传的一个详细信息了, 紧接着他会开始整理信息,并构建结构化的内容。最后呢,生成了这样的一个网站,我们现在呢,把这个网站下载下来,看一下它的效果。整体的这个电影脉络呢,他已经是梳理的非常清楚了, 不过呢,他这边是没有去搭配啊剧照图片,而且整体的这个紫色配色还是有些单调的,对吧?那于是呢,我就去啊,让他再加一点剧照,然后改一下这个电影感的配色。稍等片刻呢,他就开始去搜索相关的一个电影剧照了。然后呢做了这个配色 ui 的 一个调整,我们再次看一下它的这个效果, 那这一版呢,整体内容就更加丰富了,对吧?而且呢,他每一个经典的画面都会有这种匹配的剧照,这个呢,其实就是一次完整的多默契协同任务啊。从图片的这个理解,到互联网搜索,再到最后的这个网站代码的编辑落地,大家觉得他做的怎么样呢?可以在弹幕给他打个分啊, 那接下来的话呢,我们来测试一下它的这个代码能力和任务规划的能力啊,我这边呢使用 open code 来做,来到 open code 的 配置文件,首先呢我们需要去修改这个 base url 和 api key, 那 这些信息呢,大家可以在百联云平台获取。 配置完成之后呢,我们输入斜杠 models 来切换这个 queen 三点五 plus 模型。那这次呢,我们做的不是一个小 demo 小 游戏,而是呢直接让它在一个现有的后台里面做一个完整的电商后台 mvp。 并且呢我对范围做了一下控制啊,只需要做商品管理,订单管理, 库存扣减以及基础的一些状态流转。并且呢我们这边只需要去完成管理端,不需要去做小程序。那我把这个需求调给他之后呢,他没有开始直接写代码,而是先分析需求,拆解模块,规划结构, 这一点呢是很关键的,因为真正的工程能力啊,不是说你速度有多快,而是思路是否清晰,在任务执行的过程当中呢,他会边思考,然后边调用相关的工具。这种连续的任务推进呢,其实就是原生视觉语言模型的一个优势 啊,所有的步骤呢,都在同一个模型当中去完成,而不是拼接式的写作。在数据库部分呢,它设计了这个 product order, order item, 还有 user 这些核心表,库存校验啊,订单状态啊,也都是考虑进去了。 后端层面呢,它也做了这个代码分层,结构是非常的清晰。前端部分呢,它生成了商品列表,页表单页和订单管理前端后端数据库都是在协助推进的,项目也是可以直接启动并运行的。来我们看一下它的这个实际效果,商品列表搜索,新增上架、订单查询这些呢,都是可以去完美跑通的, 从任务规划到最终的代码落地,它没有出现结构混乱或者是推翻前面设计的这种情况,整体的逻辑啊,还是非常的连贯的。同样的任务呢,我之前也用这个 gmail 三 pro 测试过啊,虽然说两者最后都能够把这个项目给做出来,但是昆三点五呢,它这边是开源模型,而且 api 成本是更低的, 那如果说两个模型能力接近,但是其中一个成本更低,步数更自由,这对开发者来说意义就不一样了。如果是我的话呢,我会选择做的到但是更划算的那一个。最后呢,我们来测试一下他的视频理解能力啊,那这里呢,我准备了一个小游戏的测试视频,我们把它上传上去, 我让他呢自己去读懂这个视频,然后复刻这个小游戏。首先呢,他会去分析这个游戏的核心机制,玩法与视觉风格。接下来的话呢,他就开始构建游戏的一个视觉与交互框架。最后呢,他开始用 html 代码编写游戏。 ok, 现在他已经全部写完了,我们下载下来看一下效果。 整体功能界面我觉得还原度还是很高的啊。星空的背景,星空的元素大家可以看到,而且呢,在生命值这个地方,它没有去像呃原来的素材那样继续去使用数字,而是采用 icon 来代替。 并且呢在 level 这里,他也会随着数值越大,游戏难度相应增大,整体可玩性我觉得还是非常不错的。 ok, 那 到这里的话呢,四个 case 就 已经全部测试完毕了啊,从图像到搜索,从文本到代码,从视频到程序,这种端到端的能力呢,正是原生视觉原模型想要去解决的问题。 那这条视频呢,其实只是一个开始啊,后面我们还会继续用更加复杂的业务系统,甚至是多轮智能体写作。 如果说你对上面某 case 印象深刻,或者说想要让我去加大难度,可以在评论区告诉我。那现在呢,这个 quan 三点五相关模型啊,已经是开放使用了,大家可以在掐点 quan, 点 ai 或者是摩达社区使用。 ok, 那 以上呢,就是本期视频的一个全部内容了,感谢大家的收看,我们下个视频,再见, peace!

八毛钱呢,在今天也就是半个馒头的钱,但在 ai 圈呢,现在可是一百万 token 的 价格。今天可是除夕啊,阿里正式开源了新一代的千万三点五系列, 我想这大概就是科技圈最卷的拜年方式了。这次发布的企业模型千万三 plus api 价格呢,直接达到了每百万 token。 八毛钱什么概念啊,这可是谷歌 gmi 三 pro 价格的十八分之一,而且阿帕奇二点零的协议,全尺寸开源,不管你是个人开发者、学生还是中小企业,都能直接免费的商用。 以前我们都知道最强和最便宜的这两个词呢,它是不可能出现在同一模型上的,要么性能顶级贵的离谱,要么是便宜呢,但是能力打折。千万三点五 plus 这次不仅是价格地板价,性能呢,更是直接硬钢了。这俩币源顶流登顶了全球最强的开源模型, 支持的源数量呢,也扩展了两百零一种。就因为这次用上了极致稀疏的 m o e 架构,传统模型呢,是所有参数同时干活,参数越多呢算的越贵。 m o e 的 思路呢,是按需激活,你问一个代码问题, 他就激活擅长代码的那组专家,你问数学题呢,他就切换到了数学专家,等于三百九十七币的知识储量,十七币的算力消耗不熟,显存占用直接降了百分之六十,推理速度快了八倍,这就是省钱的原因。 而且他还是原生多模态,不是后期拼装的视觉模块。从预训练第一天起呢,就是文字和图像混合数据上一起预训练的,天生就能看懂图片和视频,这种就很像当年的 linux, 当一个最好用最便宜最聪明的模型是开源的时候,他就会成为整个行业的空气和水。 以前要花大价钱才能用上,能力呢,现在门槛被技术本身再次拉低。摩达社区哈根 face 千万 a p p 千万披萨呢,现在已经可以体验了。不知道阿里这一波 ai 半年啊, open ai 和 google 看了是什么心情。

新年快乐啊,阿里发了最新的千万三点五 plus 啊,然后登顶开元大模型啊,笔尖全球顶尖币源大模型。接着这一波呢,再来聊聊阿里的一些投资逻辑, 之前讲过的那些就不讲了,有兴趣可以往前翻一翻啊,或者在我的频道搜索一下阿里,应该就能够听到。今天主要是补充一些新的内容啊,春节期间啊,那个智普光靠一个开元大模型,市值已经突破了三千亿港币啊,那阿里现在只有二点八万亿港币啊,简直是离谱,光凭这一点,阿里现在就是物超所值。 除此之外,再补充一个逻辑啊,就是美股七巨头的特斯拉和苹果肯定是要往国内走的,对吧?那国内到国内以后,他不可能选一家美国公司,所以来做大模型的服务商,所以呢,一定要选一家国内的大模型公司来作为他的 ai 的 服务提供商。 那我们来看看他们会怎么选啊。首先,这家公司大模型能力首先得强,这个毫无疑问,对吧?那目前国内比较强的就是 deepsea 豆包千问 百度不太看好啊,可以排除掉,对吧?智普我觉得目前还是一家小公司,也排除掉。第二呢,是必须是可稳定长期提供服务的,对吧?那像 dbc 这种没有大规模工程能力,团队比较小,那可维护持续维护提供服务的能力相对就比较弱,所以也可以排除掉。当然, dbc 本身自己也志不在此啊。排除? 大概你这两家也会选一家美股的上市公司啊,因为这样才能够做比较有效的管控啊,场地管家啊,不上市是不太可能的啊,因为这么大的事情,不上市的合作方各方面都不透明,那决策也不用通过董事会,不用股东同意。那这个肯定让特斯拉和苹果是不放心的啊,自己也没上市, 所以豆包也就排除了。经过上面的这些分析,其实你可以看到剩下来的可能只有千万了,所以我觉得这对阿里来说是一个潜在的隐形的利好。所以我现在的策略是一卖 put, 只要跌到目标价,我就会大批买入阿里,同时每跌一点我就会少买一点。

二零二四六年二月十六日,阿里发布昆三卷府,三百九百七零亿参数,一千七十亿激活某 o e 架构开源,免费对标 g p t。 五点二 官方参数,总参数,三百九十币三百九十七零亿激活参数,十七 b 推力成本超低, 五海一十二个专家激活,十个加一个共享 m o e。 混合专家架构,效率拉满技术亮点, gated delta networks 加 m o e 高效推理上下文二十六万 tokens 可扩展到一百万 原生多模态图文一起理解,支持二派零一种语言,官方 benchmark, m m l u pro 80 七点二分,和 g p t f i。 二相当, c e v l 两度三分,中文顶级 if bench 谢莱伯六点五分,全场最高 kimi k 兔懂五也是对手。一万亿参数,春节中期发布 g p t。 五点册 claude four point five opus gemini 三 pro kimi k two point five one t a search 二 b 国产双雄 quan 三点五和 kimi k two 点五 quan 开元免费 kimi 币元,但免费额度大,怎么用? quan 三点五 plus api one man 上下文, hugging face 下载本地部署 g g u f 版本,消费级显卡也能跑 apec 二点零协议可商用总结,宽三点 f。 二零二六春节国产最强开源大模型 三九七 b 参数,十七 b 激活 apec 二点零开源,转发给程序员朋友,关注我,下期教你本地部署。

今晚有两场春晚正在上演,一场是央视春晚,再搁在五万家团圆。另外一场是科技春晚,平地惊雷,重塑未来。就在刚刚,千万春节档真正的杀手锏来了,阿里正式开源了全新一代大模型千万三点五 plus。 可能有人会问,这模型有啥特别的,为什么可以称之为杀手锏? 就这么说吧,如果用七个字来概括它,那就是又快、又强、又省钱。相比上一代千万三 max, 千万三点五 plus 推理速度快了整整八倍, 除显存占用降低百分之六十。更夸张的是,在性能相当的情况下,宽三点五 plus 每百万 token 只需八毛钱,几乎是 jama na 三 pro 的 十八分之一,成本大降百分之九十五。过去几年,大模型圈信奉大力出奇迹,各家都在圈参数、拼榜单,参数从千亿堆向万亿,性能确实在涨, 但代价也居高不下。但千万三点五的出现,就好像为大模型行业开辟了一条全新的道路,他不比谁更大,而是比谁更聪明,比谁能用相对更小的模型,借助技术创新获得更大的智能,说白了,就是花更少的钱,办更大的事。这样一来,大模型之间的竞争直接拉到了好用、实用、用得起的新维度。千万三点五的实力到底如何呢? 在 m m l u pro 认知能力测试中,千万三点五拿下八十七点八分,超越 g p t 五点二。在博士级知识挑战 g p q a 中,以八十八点四分力压 clod 四点五 r, 在 指定遵循 if bench 榜单上以七十六点五分刷新历史记录。而在通用 a 阵评测 b f c l v 四搜索 a 阵评测、 broscom 等基 准中,千万三点五表现均超越 gemini 三 pro 技术向下扎根,应用向上生长。阿里不仅在模型曾追求星辰大海,也在产品端深耕人间烟火。 一个月前,千万 a p p 上线超过四百项 ai 办事功能,成为全球首个能完成真实生活复杂任务的 ai 助手。今年春节,数千万用户通过他点奶茶、买年货、订电影票,在日常点滴中切身感受到 ai 带来的便利。如今,随着 ai 阵的能力在快三点五中大幅增强, ai 不 仅将拓展技术的变 边界,也将进一步打开他在工作与生活中帮人做事的可能性。正如昨天千问总裁无加回应千问爆火时所言,阿里会一直追求模型的智能水平和先进性,两者合起来就是我们一直坚信的技术,不仅要追求星辰大海,也服务人间烟火。

二月十六日除夕当天,阿里巴巴正式开源全新一代大模型千问困三点五 plus, 性能媲美 jameson 三 pro、 gpt 五点二等顶级闭源模型,登顶全球最强开源模型 千问三点五,实现了模型架构的全面革新。此次发布的困三点五 plus 版本总参数为三千九百七十亿,激活仅一百七十亿。以小胜大 性能超过万亿参数的 quan 三 max 模型,算力部署成本降低百分之六十,推理速度提升八倍,多项精准评测结果媲美超越 gpt 五点二这门 i 三 pro 等闭元第一梯队模型。原声多模态训练也带来千万三点五的视觉能力飞跃。 在多模态推理、通用视觉问答、 dk 文本识别和文件理解、空间智能视频理解等众多权威评测中,千万三点五均斩获最佳性能。相比上一代昆三 max 模型推理效率大幅提升,最大推理存储量已升至十九倍,且上下文越长,速度优势越明显。 在模型部署端,千万三点五通过混合注意力极致显著优化长文本场景的显存占用,并结合高希书猫架构,将每次推理的时机、计算量控制在极低水平,部署显存占用降低百分之六十。 这意味着大模型第一次真正具备了下沉到边缘设备陷入日常应用的工程可行性。当行业仍聚焦于跑分竞赛时,千万三点五已将竞争推向新阶段,谁的模型更实用、更易用、更多人用得起? 不光卷性能,阿里在 ai 应用端也实属卷亡。一月十五日,千问啊发布全球首个消费级 ai 购物 age 的 春节期间,千问 ai 购物 age 的 六天时间帮用户完成了一点二亿笔订单,在全球首次实现大规模真实世界任务执行和商业化验证。 age 的 能力大幅增强的千问三点五,将进一步打开千问 app 在 工作和生活中帮人办事的想象空间。

大家好,我是 tommy, 今天很高兴给大家分享最新的潜水内容,那今天我们来聊一个非常火的模型,阿里通用切问三点五。那如果你还把大模型当成聊天工具,那么切问三点五啊,想做的事情其实会更加的激进, 他要把模型推向一个全新的时代。 agni, 也就是啊,能自己干活的 agent, 那 这期视频啊,我会用一条非常清晰的主线,把它讲透, 它为什么会火,技术上到底做了什么,强在哪里,弱在哪里,以及我们应该怎么去应用。那首先我们需要记住啊,切问三点五的五大关键词,第一个就是希数的 mo, 总参数是三百九十七币,但每次推理呢,只会激活十七币。那第二点呢,就是更便宜更快,成本啊,降低了百分之六十, 吞吐提升了八倍,长上下文场景呢,高达十九倍。那第三个就是原生的多模态,从预训练阶段把文本、图像、视频统一融合,不是在后期外挂一个模块。那第四个呢,就是支持二百零,一种语言全球化覆盖,非常的激进, 这个数字啊,在同级别模型里面是最高的。那第五呢,也是最有辨识度的视觉, ag 的 能够看懂并且呢主动去操作手机桌面的技术啊,到底心在哪里? 我们做三层拆解,第一层啊,就是稀疏的 mo 一 传统的大模型全量激活,参数越大,算力就越贵。 但是呢,切问三点五的做法是,总共是五百一十二个专家网络,每次处理一个 token 时啊,只路由了十个专家以及一个共享专家,那其余的呢,全部是在休眠,那结果就是啊,你用的是接近四百币的模型之力,但是付出的只是十七币的一个推力成本。 那第二层呢,就是混合注意力机制。那切问三点五呢?它使用了一种交替堆叠的结构,在十五个周期里面,信信注意力啊,占据了百分之七十五。那传统的全注意力呢,只占了百分之二十五。那为什么要这样去设计呢?因为上下文越来越长,全注意力的计算成本是平方级增长。 信信注意力它主要是用来处理大量普通的上下文。全注意力呢,保留下来专门捕捉关键的长城依赖, 两者搭配啊,既省钱又不漏信息。那第三层啊,就是门控的一个网络,再加上一个大规模强化学习训练。那这一层是训练层的创新。切问三点五引入了异步强化学习框架,在两万个并行环境里啊,同时去跑这个 route, 专门训练模型的多步规划工具调用能力。那同时加入了多 token, 也就是 m t p 预测,让模型啊在每次前向传播能够生成多个 token, 进一步提升推理速度。所以你会发现,千万三点五的设计目标,它并不是更会聊天,而是更会去执行任务。那最后为什么说它是原生多模态加视觉 agent 呢?原生多模态这部分关键词是 early fusion, 也就是早期融合。它不是训练完语言模型之后再外挂一个视觉模块, 而是从域训练第一阶段起呢,文本 token 和视觉 token 就 一起处理,这就意味着视觉信息和语言信息呢,进行了真正的融合,而不是间接的一个连通。那具体支持的上限是 图像最高处理一千三百四十四乘以一千三百四十四的一个分辨率,还能够处理复杂的 pdf 和图标。那视觉 agent 这步法,它主要是切问三点五最有差异化的一个能力, 它可以接收手机桌面的截图,识别出按钮、输入框、菜单等可交互的一些元素,规划出完整的目标所需的多步骤的一个操作。那最后呢,生成点击、输入、滑动等具体的指令, 它不只是看图说话,而是像一个真正的操作员,能够跨应用、跨界面的完成一个完整的工作流,这才是 agni 的 全景介绍。那么等阿里啊正式发布切问三点五技术报告之后呢, 我会第一时间给大家做详细的解读。那其实啊,看完这期视频,你会发现切问三点五的核心突破,无论是 alfusion 的 原声多模态架构, m o e 的 高效推力设计,还是视觉 agn 能力,那背后呢,都涉及大量多模态领域的前沿技术。那如果你真正想吃透这些技术,而不只是停留在听懂了的层面,那么我非常推荐你学习我的精品课程,多模态大波形前沿算法与实战应用第一季。那 么这个课程呢,覆盖了主流多模态架构、多模态的 agent, 数据构建、训练、流程评估与幻觉分析,并且配套了多个项目实战,比如说 lava, lava, next、 切文森 vo, in term, lm, ex composer, time search、 视频理解等,包含算法讲解、模型微调推理、服务部署以及核心源码的讲解。 那么我在这门课程里啊,专门讲解了切文森 vo 的 原理与实战,包含交错式 m o p、 未知编码、 deep shock、 视觉特征融合 视觉、 system two 慢思考等核心机制。那这些啊,正是理解切问三点五多模态能力的底层基础。那本课程啊,目前呢,正在更新当中,你可以呢,在我的 b 站唐国聊 tommy 以及我的个人官网 t g o tommy com 参与学习,课程内容永久有效,并且呢会实时的更新,你可以呢,跟随我的课程终身学习。那参与课程之后呢,你还可以啊,加入到由我亲自打理的 ai 技术学习圈,跟一群志同道合的伙伴交流学习。那 如果你已经在做动脉胎方向,或者想从切问三点五这样的前移模型出发,系统的搭建自己的技术体系,那这门课程一定会给你很多的启发。那么接下来呢,我将为大家详细的演示切问三点五的多个实战力,不要错过。那接下来给大家详细的演示一下切问三点五的应用,那这里主要给大家讲解两种不同的方式。 第一种啊,非常简单,我们只需要在它的官网注册这个账号就可以呢进行交互。那第二种呢,稍微复杂一点啊,我们需要在阿里云百念这个平台注册账号,然后获取模型的 api key, 然后我们就可以呢调用模型的 api 了。 那下面我们先演示第一种方式,很简单,各位同学只需要在这个网站注册阿里的这个账号,然后呢我们就给它进行交互。那这里啊,我们可以选择两种不同的模型,第一种呢,是在这个云端,它托管的这个模型三点五 plus, 那第二种呢,是它开源的这个模型啊,那这个模型参数量非常大,那基本上需要六百四十 gb 的 显卡才能够跑起来,所以呢我们这里啊是基于它这个 api 给大家演示,我们选择这个最强大的这个三点五 plus。 然后呢我们就可以呢进行一个多模态的一个问答。那首先我这里呢,比如说上传一个图片来做一个问答,那这里啊我有一张图片,这是一个太阳系的一个图片,然后我这里呢给大家上传。 好,那现在这个图片呢已经上传了,对吧?然后呢我就问一下,请详细的描述一下这张图片,然后我们回车走,那这里呢它是有一个选择的,一个是自动,就它可以自动切换思考模式,还是说快速模式,我们自动就可以, 那这个呢,它在描述这张图片,对吧?那这是一个太阳系的一个图片,然后呢它的描述是准确的 啊,首先呢是一个整体的布局,然后呢描述了不同的天体,从左到右,由近极远,这个描述啊也是非常准确的,这个图片理解呢是没有问题的。那下面我们再来看一个视频,这个视频理解呢,我是从网上下了一个库里投篮的视频,我们先大概的看一下,一共三十秒,我们来看一下, 注意啊,我们一定要记一下库里他在这里的投篮投了几次,因为我们待会呢会让模型去统计一下,看他准不准,你看这是第一次,对吧?投篮, 好,这是第二次投篮,对吧?投中了,已经投中了,好,这是第三次投篮,大家记住了这个次数,好,这是第四次投篮, 好,这是第五次投篮啊,好厉害哦,每一次都投中了,注意哦,一共是五次投篮,每一次都投中了,那下面我们就要考验一下模型了,它能不能完全的理解。 所以呢,我们这里啊,先把视频给它上传,点击上传,这是库里的投篮视频,一共投了五次,每一次都投中了,对吧? 那下面我们就要来挑战一下了,比如说,请告诉我视频中的球员是谁,他一共投了几次篮筐,然后投中了几次? ok, 那 这里呢,一共有三个问题啊,球员是谁?他一共投了几次篮?投中了几次, 那这样三个问题,那这里啊,我们就切换到思考模式,让大家来深度思考一下。走,一共他投了五次,每一次都投中了,看他回答是怎么样的,我们稍等片刻。 那这里呢,有一个思考过程,那么你可以点一下,这里呢,他是一个思考,我们也可以观察一下。好,他这边已经完成思考,我们来看一下。哎, 他这个回答是正确的,视频中的球员是斯蒂芬库里,他一共投了五次篮,每一次都投中了,他这个识别是非常准确的,对吧?没有问题啊,其实啊,我在之前测的时候,他这里是有幻觉的,他认为库里一共投了七次篮, 其实是五次。所以呢,我们这个模型,他这个幻觉是难以避免的,你看,我这次去问他,他就完全答对了,对吧?那这里啊,我来反驳一下,挑战一下他,就是看他是否能够坚持自己的一个判断。有时候说不对,球员是詹姆斯, 他一共投了十次蓝,呃,只投进了两次,你是否认同?好,那现在我是在诱导他,看他能否坚持自己的一个回答。走, 这里呢,他有个思考的过程,对吧?我们也可以查看一下。你看他已经在分析我的问题,然后呢,他会去观察球员的外貌以及动作的细节,你看,然后呢,他继续分析投篮的动作和时间戳, 然后,哎,他纠正我的一个错误了,看到了吧,你看他纠正我的错误了,然后确认视频的内容,并且呢,纠正我的误解,再次确认球员的身份以及投篮数据, 然后坚持他的一个分析判断,完成思考。好,我们来看一下最终答案。你看球员身份是斯蒂芬库里,不是勒布朗詹姆斯,他还是坚持自己的这个判断,没问题啊。 然后他的证据是球馆上有金州勇士队的这个旗帜,还有呢,这个标志,你看这是他的一个依据,没问题。 然后他说一共投了五次篮,全部投中,并不是十投两中,甚至啊,他把每一次投篮的时间都已经写出来了,这个还是非常厉害,非常厉害,对吧?我本来想诱导一下他,因为现在很多模型,你一旦去反驳他这个模型啊,他马上就会改变主意。 那说明阿里的这个切文三六 plus 模型还是很厉害的,你看他甚至啊,把这个具体的这个数据都全部给你给出来了,还是很厉害的。好,那这里呢,主要是通过官网这个交互窗口给大家演示了,那各位同学也可以呢,注册一个账号,自己去玩一玩,体验一下。好,那这是第一种方式啊,很简单,在官网去体验, 那下面我们稍微讲一个复杂一点的方式,我们这里呢主要是调用模型的 a p i。 并不是啊,在这里直接去交互,因为我们很多的任务呢,可能是通过模型 a p i 去完成的。那怎么去注册呢?很简单,第一步我们需要在阿里云的百炼这个平台注意哦,它这个阿里云百炼注册一个账号,如果你没有,你去注册一个, 然后呢注册完之后,如果说你没有充值啊,那么你去充个值,我这里啊充了十块钱去玩一玩,充完值之后呢,那么你就可以呢去调用它这个模型 a p i 了。 如果说你是初次的创建账号,它会给你一百万 token 的 一个使用量,不要以为这一百万的量很多且很少的,你跑几次它就跑完了,你看这里,我跑完之后免费的额度啊,就已经没了, 当你的免费额度用完之后,它才会去消耗你这里的费用。那这个是第一步啊,你首先呢需要去注册账号,然后呢去充一个值,那这里呢,你要去创建一个 key, 点一下这个北京的就可以啊,前往北京。 那么点完之后呢,你就会进入到这里来创建一个 key, 这里有一个创建 api key, 看到了吧,点一下创建,然后这个里呢可以选一下你的用户名, 这个啊是默认,你就不用选,懂我意思吧,这里他选不了,你就不用选,直接确定就可以了。 ok, 直接确定了,那么你就会创建好一个 key, 然后创建好之后呢,那待会呢,我们会用到这个 key, 你 只需要点一下这个复制,然后再去粘贴就可以了,那这个窗口呢,也可以呢,通过另外一个窗口来查看你的费用 啊,因为我之前是已经用了一会了,所以呢十块钱,现在剩了九块钱了,对吧?然后呢,我们就可以在 vscode 里面去做配置,那这里啊,注意啊,我们一定要去下载一个插件,这个插件叫做 client, 你 看在这里就这个 client, 懂我意思吧?下一个插件出来,那下载之后呢,然后呢,我们就可以呢去做配置了, 如果说你下载之后,这里没有显示这个图标,把鼠标放这里,然后右击一下,注意啊,是右击,把这个给它打上勾,你看现在呢,它这边是没有了这个图标,一定要右击啊,把这个勾给它打上,那么它就会显示出来, 显示出来之后,我们要去配置一下配置呢,点一下这个配置,这里啊,我们要选一下 openai 啊,这个适配的,一定要去选这个东西吧,然后这里的 url 呢?从哪里去拷贝呢?很简单,在这里啊,你看在这里呢,它是有这个说明的,往下滑,你看这里有个使用的说明, 你把这个 url 拷贝一下,然后呢你就粘贴到这里来,那这个 key 呢?就是你刚才创建好的这个 key, 把这个 key 给它粘贴过来在这里, 然后这个模型 id, 你 这边输入成千万三点五 plus, 然后呢选择当,懂意思吧,那这样就配置好了, ok, 这是第一个配置, open a 叫 compatible, 然后呢你的 u l, 然后你的 api key, 然后是模型的 id, 然后当,那这样你就可以去使用整个模型服务了,懂意思吧?那刚才呢,我是创建好了这样一个三维的这个太阳系,那这个是我创建好的,通过这个 vpx 图层啊,它自动模型帮我去生成代码, 然后这是一个三维的这种效果,对吧?你看这是太阳系,然后这里面呢有八大行星,对吧?你看这是一个太阳系,正在围绕太阳去转。 ok, 那 这个呢,是我写的一个需求啊,简单的需求,让 ai 帮我写了一个需求,然后呢我就把这段需求在这里啊 delete 这个千万三去实现的,比如说我这里啊点一个加号,那这是一个新的一个窗口,对吧?那么你只需要把你的需求在这里啊,给它粘贴过来, 比如说我把需求拷贝一下,在这里啊,给它粘贴过来,然后你回车就可以了。那这里呢有 plan, 有 act, 一 般来说呢,你选择 act 就 可以了, 那这是一个非常简单的方式啊,最关键的一点啊,就是你需要去注册账号,然后呢在 vs code 里面通过 client 去配置一下,那这样呢,我们就可以啊进行这个编码了。 ok, 你 有什么需求,可以让模型帮你去生成现在这个代码,那这里我就不再给你去演示了,那这个呢,就是我这边生成好的这个代码。 ok, 你 们自己呢也可以去玩一玩。好,那关于这个千问三点五的应用啊,咱们就先讲到这里,主要是两种方式,第一种呢,直接在它官网注册一个账号,我们就可以呢去进行问答。那第二种方式呢,就是我们注册一个模型 api key, 然后呢通过 vsco 的 以及这个 client 插件去做配置, 然后我们就可以呢进行这样一个编码,无论你是什么项目都可以呢,通过这个模型去实现,那过洞穴啊,也可以自己去对比一下,相比较于质朴的模型和 minimax 的 模型,哪一个效果更好? ok, 好, 那么关于这个应用啊,咱们就先讲到这里,因为目前呢,阿里呢,它还没有开源一些小模型,它 梦想开源了一个超大的模型,就这个模型,那么等他后续啊,开源其他小模型之后啊,那么到时候呢,再给大家做后续的一个分享。那如果说你在学习当中还有什么疑问,那么可以在视频下方给我留言,我也会尽快的去回复。那如果说你觉得本节课啊对你有帮助, 请三零关注,感谢支持!那本次分享就先到这里,学无止境,一起加油,拜拜!

全球硬件大佬们排着队给中国模型接风,这到底是怎么回事呢?那就在除夕夜,阿里把千万三点五开源了,然后呢?英伟达、 amd、 苹果第一时间跳出来说已经适配 华为升腾、摩尔县城这些国产 gpu 更是对零官宣,摩羯刚发,他们就跟上。兄弟们,这是什么场面呢?全球芯片巨头抢着给一个开源模型铺路,势无前例吧? 那最关键的是,千分三点五,凭什么?我带大家看看几个参数啊,总的参数三千九百七十亿,但一次推理呢?只需要激活一百七十亿,不到百分之五的参数量,性能呢?干翻了自家上代万亿参数模型部署显存占用直接降百分之六十,推理吞吐量最高标十九倍。更狠的是价格呀, 阿里云百链上千万三 plus 的 a p i 每百万 token 才八毛钱啊,什么概念?只有 jimmy 三的零头,不到百分之五的价格竟能能跟人家平起平坐?那什么叫性价比啊?这就是啊!所以国家超算曙光云 openroot to getar ai 内外的平台一夜之间全都上线了, 千万三点五成了第三方平台争着抢的。向婆婆这帮硬件大佬为什么这么积极啊?我估价他们已经闻到味了,开源平台里能打的不多,能打还便宜的更少,千万三点五这一下直接把门槛砍到了脚脖子。 那么有意思的事来了,当全球最贵的芯片集中适配中国大胃型的时候,这到底是谁在给谁铺路呢?兄弟们怎么看呢?

最近一段时间,我相信很多朋友都关注到一个名叫大龙虾,英文叫 opencloud 的 ai 产品。 opencloud 本质上是一个 ai agent, 也就是智能体,它跟某宝、某包这样的聊天机器人最大的区别是不仅能聊天,还能干活, 正是这种实用性,让他刷屏了。龙虾的大火,代表了 ai 已经从聊天机器人时代进入了智能体时代。龙虾只是一种智能体,未来会有越来越多针对不同场景的智能体出现。但是我自己,包括我身边所有用过龙虾或者其他类型智能体的朋友们,都会抱怨一个事,太费钱了, 每次龙虾干活的时候都会消耗大量的 token, 如果模型的 token 费用还比较高,龙虾就成了碎钞机。你可能想问,为什么不换个便宜点的模型呢?因为便宜的模型性能又差点意思。那有没有性能足够强,价格也足够低的模型呢?之前没有,但现在有了。 二月十六日除夕当天,阿里正式开源全新一代大模型千问三点五 plus, 性能媲美 gemini 三 pro gbt 五点二等顶级闭源模型,登顶全球最强开源模型。 同时每百万头肯输入价格低至零点八元,是 g p t 五点二的十五分之一, g m n i 三 pro 的 十八分之一。价格这么实惠,性能真的能打吗? 我第一时间就对千万三点五 plus 做了测试,这次我们测试的重点是这个模型的 ag, 也就是智能体能力。 为了让大家好理解,我先介绍一下智能体的工作原理。智能体主要包含两部分,一个是 ai 可用的工具,当智能体接收到一个任务的时候,大模型需要先拆解任务, 形成工作计划,在调用工具一步一步的完成工作计划。所以所谓的测试大模型的智能体能力,就是测试它拆解任务推理并且正确调用工具的能力。可以说智能体能力的测试相当于是大模型的铁人三项,是个综合能力的测试。但是想要深度测试一个模型的智能体能力 并不容易,你需要有足够多的 ai 可以 用的工具才行。正好我们自己做的 reportify 是 商业研究智能体里面已经有一堆商业研究会用到的 ai 应用的工具。为了这次测试,我专门把大模型换成了这次最新发布的千文三点五 plus, 做了一个基于千文模型的商业研究智能体。 那接下来我们就用这个智能体做测试。第一个任务,对比一下未来理想小鹏二零二四年全年和二零二五年前三季度的利润,做成表格和柱状图。 我们看这里千万模型。首先拆解任务生成了代办事项,这个代办事项生成的是比较合理的,然后就开始调用工具干活了,比如要调用财务数据查询工具来查这三家的利润。 其次还要做一些计算,因为我的要求是对比二零二五年前三季度的利润,所以模型需要把查到的二零二五年前三季度的利润做个加总。最后还要调用图标生成工具来生成柱状图,结果不错,数据和图都是正确的,速度也挺快。 第二个任务,请列出美光、三星电子、 s k、 海力士三家存储龙头公司的核心产品,以及过去半年的涨价幅度,最近不是存储行业大火吗?我相信很多关注 ai 的 人都对这个问题感兴趣,还是同样千万三点五 plus 先是把这个任务拆解成了代办事项, 然后调用各种搜索工具搜索相关信息,一项一项完成代办事项,结果也不错,数据正确,内容详实,也给出了所有数据的出处。 第三个任务,请帮我下载过去三个月纳斯达克指数的价格数据,保存到 excel。 经常做商业研究的朋友们应该对这个任务不陌生。过去你需要在某德这种数据软件里各种点,选标地、选指标、选日期,操作难度不低,而且很麻烦。有了 ai, 你 就直接说你要啥数据就行了。你看 千万三点五 plus 模型,理解了你的需求之后,会选择正确的工具,填写正确的参数,最后还会写程序,把所有数据写到 excel 里。之前 reportify 装的大脑是那种性能很好但很贵的模型, 这次换上千万三点五 plus 这个大脑之后,成本大幅下降,同时它的干活能力并没有打折。那为什么千万三点五 plus 能做到性价比这么高呢?这里面的核心技术是阿里千万团队的门控技术, 这个技术前不久刚刚获得了 neo 一 ps 二零二五的最佳论文奖。这可不是一个普通的奖项, neo 一 ps 是 全世界最顶尖的 ai 学术会议之 一,基本相当于 ai 研究的奥运会。二零二五年,这个会议一共收到了两万多篇有效投稿,最终只接收了五千多篇,接收率不到四分之一。也就是说,论文能被接收就已经算赢家了。在这么多论文里,只有四篇论文含金量有多高? 获奖论文的主题就是门控技术。那什么是门控技术呢?简单来说,门控技术就是通过在注意力层的输出端加一个智能开关,把信息像水龙头那样进行智能调控,这样既防止了有效信息被淹没,也防止无效信息被过度放大。 这带来的结果是,模型更少被噪音带偏,训练更稳,长文本更不容易出现注意力被无关信息吸走的问题。 更关键的是,这个改动,四两拨千金,改动不大,但效果又好又稳定。在美国的 ai 同行都在砸钱拼算力的时候,以阿里千万为代表的中国团队却在算法效率上做极致优化。这就是为什么千万三点五 plus 能做到 token 价格只有 g p d 五点二的十五分之一, jimi nike 三 pro 的 十八分之一。 千万是真正通过技术创新把 ai 模型的价格打下来的。这个思路很可能在智能体时代会大放异彩。 为什么这么说呢?我之前说过,智能体的作用已经被龙虾给验证了,唯一的痛点就是费钱。所以性能足够强、价格足够低的模型,一定是智能体时代的刚需。其次,我们再看远一点,如果想要让智能体越来越有用, 你就需要把自己更多的信息、更多的权限给到智能体。这时候隐私就会成为一个不可回避的问题。怎么保护隐私呢?最好的办法就是让智能体在自己的设备上运行。 想要做到这一点,肯定不能靠堆算力,只能靠算法优化,靠开源模型。未来大概率会出现一个现象,全世界每个电脑里都会有 ai 大 模型,而这些大模型大部分都是中国的开源模型。

除夕当天, ai 圈迎来重磅炸弹,阿里巴巴正式开源,千问、 q 问三五大模型一经发布便登顶全球最强开源大模型。官方数据显示,这款模型多模态能力全面拉满,综合性能直接对标谷歌,真 nice, 三 pro 位理速度提升十九倍,库数成本降低百分之六十, api 价格低至每百万投外同类产品。 一夜之间,国产 ai 从追赶者变成领跑者,全球开发者为之沸腾。千万三点五最大的突破是实现了原生多模态能力, 文字、图片、视频、音频理解与生成一气合成。三千九百七十亿参数规模下,实际激活参数仅一百七十亿,宣布了超强能力以及低门槛个人开发者、中小企业都能低成本部署使用。相比海外币源模型,它对中文语境的理解 更精准,生成更自然,适配电商、办公、教育、创作等几乎所有主流场景,真正做到好用、易用、够用。 这次开源意义远超一款产品更新,它标志着国产大模型正式打破海外技术垄断。 过去很长一段时间,全球大模型市场被国外巨头主导,国内厂商只能跟随。千万三点五的出现,让中国 ai 在 开源领域拥有了绝对话语权,不仅技术不落后,反而在场景适配、性价比上实现反超。 越来越多海外开发者开始转向国产模型,国际化竞争正式进入新阶段。大模型开源本质是开放共赢,千万三点五将激活百万级创新应用,让 ai 不 再是大厂专属企业,可以降本增效,开发者可以快速落地创意, 普通人能享受更智能的服务。二零二六年被视为国产 ai 全面爆发,声言千万三点五只是开始,未来会有更多技术突破落地,属于中国 ai 的 黄金时代已经正式到来。

家人们,春节党可不只有电影神仙打架, ai 圈这波王炸才是真的杀疯了。今天这条视频,我敢说会彻底颠覆你对大模型的所有认知。你是不是还以为现在的大模型拼的就是堆参数比跑分,看谁烧钱更多?是不是觉得模型越强就越贵,越遥不可及, 只能被大厂攥在手里,普通人小公司根本碰不到。我告诉你错!今年春节,阿里直接扔出一枚行业核弹,天文困三点五 plus 除夕当天重磅开园,直接打破了整个大模型的游戏规则。先给大家说一个特别扎心的真相,过去两年,整个大模型行业陷入了一场疯狂的烧钱竞赛。大家都信奉一句话,大力出奇 迹,参数从千亿堆到万亿,部署要专用,集额算力,中小企业望而却步,个人开发者想碰都碰不。 技术越来越强,却离我们真实的需求越来越远,最后变成了大厂专属的炫技工具。但千万三点五 plus 偏偏就不按厂里出牌,他不去拼参数有多大,只 拼技术到底有多聪明。总参数三千九百七十亿,但是只激活了幺七零亿,用最小的身材干出了最猛的效果,性能直接对标甚至超越那些靠堆参数堆出来的老款模型,媲美 g p t。 三点五 pro。 更狠的还在后面部署,显存占用直接降了百分之六十,推理效率直接翻了十九倍。但最炸的还不是性能,是价格, 千万三点五 plus 的 a p i 价格,每百万 token 只要八毛钱,仅仅是同类产品的十八分之一。可能有人会说,便宜而已,有什么了不起? 告诉你,这根本不是简单的降价,这是架构创新带来的效率拐点,是整个大模型行业的一次真正革命。你以为便宜就会牺牲性能吗?恰恰相反,它不是靠压缩成本,不是靠补贴烧钱。而 全新的底层架构,天生就决定了它可以又强又快又便宜。这是行业里第一次把最强和最便宜揉进同一个模型里。当整个行业还在死磕谁的跑分更高时,千万已经把竞争带到了下一个维度,谁更好用,谁更实用, 谁更多人用得起。为什么我敢说,性价比会是未来 ai 的 核心竞争力?因为 ai 的 时代已经彻底变天了。过去是聊天机器人,现在正在全面迈向 ai 智能体时代。 一个高频使用的 ai 应用,一天就要消耗数亿 token。 对 中小企业、对开发者来说,他们不需要过剩到浪费的极 致性能,他们只需要恰到好处的智能,更关心的是能不能覆盖成本,能不能真正赚钱。性价比就是通往万物 ai 时代的唯一门票。阿里的布局从来不是搞技术炫技,而是双线进攻。技术上追求星辰大海,深耕底层创新,打破算力天花板,应用上服务人间烟火,让 ai 真正走进我们的生活。就说千问 app 上线才三个月,日活直接冲到七千三百五十二万大榜,应用商店免费榜上线四百多项 ai 办事功能,是全球首个能完成真实生活复杂任务的 ai 助手。春节期间 ai 大 免单活动,六天时间,用户通过 ai 一 句话下单超过一点二亿笔, 奶茶买年货、订机票、订酒店,说一句话全部搞定,这是全球首次 ai agent 在 真时世界大规模商业化跑通,别人还在圈聊天,千万已经在帮我们办事了。讲到这里,我可以非常肯定的说,千万三点五 plus 的 发布,一定会彻底改写 ai 行业的格局。 第一,它会让技术红利不再只属于金字塔尖,个人开发者、创业团队、中小企业都能用得起顶级大模型。第二,它会催生无数新的创业机会,让 ai 不 再 是空中楼阁。第三,它会推动开源力量全面崛起,把 ai 基础设施的标准制定权从闭源巨头手里转向开源生态。第四,它会让 ai 真正落地千行百业,走进每一个普通人的生活。记得点赞关注哦!

这千万的奶茶我都还没收到!转头啊千万他又扔出了一个核弹级的更新,今天阿里千万三点五版本代码提交了,马上就要开源全球顶级 ai 社区!刚曝光的这个消息, 中国大模型的疯狂二月正式开始卷起来了!这波到底疯在哪里啊?咱白话唠明白 第一,直接给 ai 换脑子了,更灵活, 真真正正的多模态来了!兄弟们,说白了,这版 ai 生来他就会看图片看视频,以后你发个表情包给他,他就秒懂你的潜台词!更狠的是,阿里这次开元阵容直接给你拉满啊!压箱底的技术全部拿出来,而且全部免费给开发者白白用的!

除夕通一千万发布了,通一千万三点五是一个旗舰模型,刚刚他发布四个小时前那通一千万,这次发布的这个模型还是按了按十乘以万。为什么?第一个它是个旗舰模型, 旗舰模型应该是它一千万版本里面是一个顶级的这样的,而且它是开源的,是基于阿帕奇二点零的这样的一个是非常好。 他这个旗舰模型他的能力怎么样?我们大家看一下,这是官方公布的一个数据,一个他对标的都是他的一些。呃,国内的那些旗舰模型,他是 gpt 五点二,最新的 loft op 四点五、 jimmy 三 pro, 包括还有同一千万他们自己的三 max thinking, 这些都是些旗舰模型,你可以看到啊,他跟他们比起来,他有些能力甚至是超过他们,特别是在他跟他们比起来,他有些能力甚至是不如, 特别是。呃,看了一下他指令的遵循,这个应该是 top 最厉害。写代码的能力应该也是跟奥的 ops 还是比较接近的,他多模态的能力,特别是 ocr 的 这种按摩墙应该来讲非常不错的。还有一个三 m u pro, 它达到了七十九分,非常高的一个分, 非常接近于 google 的 germany 三 pro 要与 autop 四点五这个版本基本上跟 g p t 五点二最新的版本是接近了,在有些编辑方面的能力也是超过了像我们前面讲的五点二,对吧? autop 包三, autopcom 在 写代码能力是不如 这次提升比较厉害的是这个叫 terminalbench 二,二的这个主要是智能体写代码,它对于这个终端命令的这样的一个准确率 非常快,原来是比较糟糕的二十二点五,现在达到了十二点五提升费,这是他一个比较大的一个程度, 说明他在写代码能力,目前在挖一个编程这个方面是显著提升了。好,我们可以看看他的这个模型,应该来讲不是很大,大概是三百九十七个 b active 是 十七个 b 是 一个,应该来讲是一个模型,但是他的能力是基本上是达到了,达到 k m k 二点五 e t active 三十二 b 的, 这样 对企业级来讲非常好,是模型能力超强,但是它的模型的大小要比旗舰模型都要小,所以它的效率会要的算力也会更少啊。 这个都是他一些详细的一些评测,重要写代码的,能写多模态的一些不圆的能力,设置 a 境产写通用的智能体的一些能力,这个能力也是比较重要。 f c l 杠米斯,我们经常会给大家讲 u c bookle 的 一个人体调用工具的这样一个停车也是非常重要,推定能力也是不错。 还有一个是长上下文,它这个模型目前长上下文能力也非常强,全身是二百五十六 k, 它也可以扩展到一兆的这样上下文,超长上下文。哦,那这个模型应该来讲在春节除夕晚上发布出来,应该来讲这个模型是对企业来讲非常有价值, 也可以商用的大模型。这个模型跟原来一样,它也是本科架构,跟原来通一千万三 next 这个架构是一样的, 这样效率会比较高,又是个多模态的,原来 next 它是个纯文本的,现在通一千万三点五,它又是个文本,又是多模态,这写代码能力也是不错,所以它是个旗舰模型。好,我们简单就给大家就介绍一下。