transformer 的 时代要被阿里亲手终结了吗?就在今天,大模型圈被通一千问的 quan 三点五引爆, github 与 hugenface 上的相关动态打破了行业的瓶颈。这并非简单的版本迭代,而是一场关乎大模型底层架构的颠覆性变格。 之前在 lambesis 竞技场中,代号 cup 的 神秘选手凭极快的反应和超强理解力惊艳全场,现在谜底揭晓,他们正是通一千问 quan 三点五的内测版。 与此同时,字节跳动的 pieces 也同台竞技。两大巨头让二零二六年的国产模型大战提前进入了白热化阶段。 困三点五的厉害之处不在于单纯增加参数,而在于变聪明了。它解决了一个长期困扰行业的问题,大模型读长文时容易内存不足或变慢。混合注意力机制,它不再像以前那样对所有信息都死记硬背,而是采用了一种快慢结合的策略, 大部分时间用高效模式快速扫描,每隔几步再用全神贯注模式深度思考效果。这种粗细搭配加上动态缓存技术,让它既保留了处理复杂逻辑的能力,又能像老式经典模型那样轻松应对超长内容。 大模型从此告别了大力出奇迹的蛮力时代,变得更精致、更高效。在处理视频和图像时,困三点五抛弃了过去那种外接眼睛的拼凑模式,而是实现了原声视觉,真正的视频理解。他的底层设计能同时理解时间、高度和宽度, 这意味着他看视频时不是在看一张张浣灯片,而是真正理解了时空的连续性优势,反应更快,理解更深,而且不再容易一本正经的胡说八道。 这次泄露的两个版本商业价值极高。一九 b 模型专为手机、电脑等端侧设备设计,这意味着以后你的手机不用联网,也能运行高性能 ai。 二三十五 b m o e 模型这是一个拥有两百五十六个专家的大脑,但他非常聪明,每次只叫醒其中八个最对口的专家来干活,并配合共享专家协助,既有大模型的超强能力,又有小模型的低成本,完美平衡了性能与价格。 困三点五的出现,彰显了国产大模型不再盲目追求参数规模,而是深耕效率优化的务实方向。如今,其 pr 合并已完成发布在即,阿里率先打响效率之战。二零二六年大模型的精彩大戏才刚刚起幕。
粉丝433获赞3670

这千万的奶茶我都还没收到!转头啊千万他又扔出了一个核弹级的更新,今天阿里千万三点五版本代码提交了,马上就要开园,全球顶级 ai 社区刚曝光的这个消息,中国大模型的疯狂二月正式开始卷起来了,这波到底疯在哪里啊?咱白话唠明白! 第一,直接给 ai 换脑子了,全新的混合注意力机制让他的思考方式彻底升级,反应更快,脑子更灵活。第二,真正正正的多模态来了,兄弟们,说白了,这版 ai 生来他就会看图片看视频,以后你发个表情包给他, 他就秒懂你的潜台词。更狠的是,阿里这次开元阵容直接给你拉满啊!压箱底的技术全部拿出来,而且全部免费给开发者。白来用的 前有豆包 cds 的 二点零,后有千万三点五,国产多模态这次会不会趁机起飞啊兄弟们,对 a 子来说,有三个重点你是不得不看的。第一方面,算力是直接狂欢,因为模型越智能,它对算力 的需求就越多, ai 芯片、服务器、数据中心这些 ai 基建,那需求直接给你拉满了。第二方面就是应用 直接爆发,有了免费的顶级的大模型引擎,那么各种智能工具绝对是冒扎堆的冒出来的,跟雨后春笋似的。第三,国产大模型彻底 觉醒了,阿里带头那么像自己,百度腾讯肯定都得跟着卷啊,哪坐得住呢?接下来,国产大模型的科技春晚直接上线,兄弟们,你们就说牛儿逼直播!

就说春节阿里会搞事,一分钱喝奶茶,无门槛免单卡,这场狂欢刚把服务器挤到卡顿崩溃,官方紧急扩容,延长免单有效期。这边热度还没下去,阿里又扔出一个王炸,春节期间正式升级新模型 q n 三点五, 这波操作直接把 ai 圈的春节氛围拉满。要说这个 q n 三点五最能打的地方,绝对是它全新的混合注意力机制, 比传统模型速度快十倍,训练成本直接降低百分之九十,既能快速响应简单任务,又能深度搞定复杂推理效率和精度直接双在线,这也是它和其他模型拉开差距的核心优势。 这是去年 deepsea 二一爆火的逻辑,今年要被阿里改写吗?还是 deepsea v 四会更火?接下来解析下,我们解析下 q n 三点五有什么具体特点。第一是模型形态特别贴心,兼顾了普通人、开发者和企业的所有需求。 这次计划开源两个核心版本,一个是二 b 级的轻量密集模型,轻便到手机、普通电脑甚至边缘设备都能轻松运行,不用再依赖昂贵的服务器。 另一个是三五 b a 三 b 的 莓模型,极致稀疏的架构,虽然总参数够大,但干活时只调动少量算力,性能顶尖还省钱, 企业级的复杂任务也能轻松扛住。第二是智能体能力的全面强化。对比上一代模型, q n 三点五的工具调用更稳定,长链路推理能力也大幅提升,不管是帮你订票、处理售后, 还是写代码、做内容创作,甚至是复杂的 ai agent 的 场景,都能高效完成,真正实现从会聊天到会干活的转变。第三是它延续了 q n 系列的开言策略,采用 ipad 二点零协议,开发者不仅能免费用,还能用于商用,没有任何法律后顾之忧。 这也难怪,他还没正式发布,就已经在海外开源社区掀起了热潮。而且他原生支持一百一十九种语言,中文表现尤其出色,不管是日常对话还是专业创作,都特别贴合我们的使用习惯。其实熟悉 ai 圈的朋友都知道,阿里这波操作看似突然,实则早有准备。 之前 q n 三发布时就引发了行业震动,如今趁着春节三十亿补贴的热度顺势推出 q n 三五,不仅巩固了自己在开元大模型领域的优势,也让更多普通人感受到了 ai 的 实用性。 说到这儿,真的忍不住感慨,以前国内 ai 界的更新节奏大概是一周一更新,偶尔出一个新功能、新模型就足以引发热议。但今年春节大家应该都有感觉, ai 圈的新闻简直天天不重样。阿里这边三十亿补贴报服务器升级新模型, 其他厂商也在悄悄憋大招,各种新突破、新应用层出不穷,我们甚至还没完全适应上一代 ai 模型的功能,新一代的升级就已经到来。不得不说, ai 的 时代真的来的太快了, 它不再是高高在上的技术名词,而是慢慢融入我们的日常生活。从薅羊毛时的 ai 指令,到工作中的高效辅助,再到未来可能普及的数字员工, ai 正在以我们想象不到的速度改变着我们的生活和工作方式。 相信等 qwind 三点五正式开源上线,一定会带动更多 ai 应用落地,也会让更多普通人开发者受益。咱们不妨趁着春节多关注一下这些 ai 新动态,也可以关注我,咱们普通人一起 ai 落地。

老大, ai 方向今日全线高潮,有重磅消息刺激,什么消息,赶紧说!千问三点五曝光全球 ai 开源社区重点热议,简直牛而逼之。 ai 应用我近期都在讲要 d c 铆定地位核心,相信今天都已经拿到结果了。水平高的继续做题,逢高捡仓,水平低的就落袋为安。 太空光伏正如你所料,今日表现非常强势,后续还有逻辑支撑吗?有,有消息说马斯克在未来三年内实现每年一百几瓦的太阳能制造能力,以及扬言要在十年内建造月球城市,而太空光伏是航天活动首选,能源需求量暴增,所以太空光伏是越早布局越有优势。 明白了,阿 sir, 那 商业航天的宇航员呢?虽然和太空光同服穿一条裤子,但明显略胜一筹,因为板块内领涨的都不是航天的核心,今天不过是普涨行情的带动修复,明天必将会面临风化局面,所以板块只能铆钉核心,继续高抛低吸做替安逸森。

我去,兄弟们,难怪今天国产专利 ai 用表现这么强势。就在今天上午,阿里新的大模型千位三点零曝光了啊,说即将发布,但全球已经开始讨论了。有评论说了啊,中国大模型引领的疯狂二月即将开启,我的乖乖兄弟们,肯定又有人提前知道消息了,相关的开盘就一次, 我觉得啊,后面还有机会,现在已经调装备了,兄弟们找个机会可以考虑一下关注我啊,不迷路带你吃肉,兄弟们下午一定要盯紧!

我给阿里最新发布的 quencoder nex 出了一道很容易翻车的题啊,那这次呢,我们就不写新功能做那些 demo, 而是让它在一个已经跑了很多年的老项目里面 做一次真正的业务改造。那说实话啊,这种任务对于 ai 来说的话呢,一不小心就会乱改失忆,甚至是直接推倒重来。官方宣称呢,这个 quencoder nex, 它是专为长任务和 a 件的编程设计的这种开源的代码模型, 它最大的一个特点呢,不是说它参数更大,而是呢用了混合注意力加动态门控的架构,因此呢,它可以在上下文很长,修改步骤很多的时候,尽量不跑偏,不 失忆。那你可以看到啊,它在这个 s w bench, pro, terminal bench 还有 either 这种偏多轮执行的任务上面呢,用极低的 active 参数就跑到了第一梯队。那它今天在这个任务里面究竟表现如何?会不会翻车呢? 今天这个视频啊,我们一起做个见证。下面呢,我们简单说一下这次要做的任务吧,那我这边呢,是用到了这个若一啊,来模拟这个我们已经跑了很多年的这种老项目。 现在呢,它的这个日制功能是直接和 masco 交互的。那这次呢,我们要做的就是对它进行一个改造啊,就是把这条日制链路直接完全的迁移到这个 mongod db 里面。但是呢,有几个非常硬的前提条件。第一个呢,就是我们要做最小改动,前端页面不能改动啊,然后这个后端的 controller 的 接口 不能变。第二呢,就是在迁移之后,前端现有的这个查询啊,筛选啊,分页啊这些逻辑必须是全部可用的。第三啊,现有的日制数据需要从这个原始的 my circle 数据库同步迁移到 mongod db, 并且我们在拖动时间窗口的时候,这些老的数据的查询也是完全 ok 的。 那最后一点呢,就是我们整体的一个环境约束了啊,比如说我会告诉他,我本地只用这个 docker 启动 my circle 和 mongodeb, 你 不可以给我额外的去安装一些嗯,数据库的一些软件之类的。那这个任务呢,本质上就是在考验模型能不能够在真实的工程约束下面 啊,去持续的改对,而不是乱改。 ok, 那 我们现在开始吧,本次呢,我们用到的是这个 open code 来做整体的一个 web coding 啊, 那因为呢,这个 quicksand code next 目前呢还是没有上线百联云平台的。那我们现在呢,就在摩达社区自己去部署一个啊,它会自动地去匹配算力的规格,然后系统盘这个地方呢,我们就给它稍微调大一些,然后点击部署啊,我估计一个小时以内我们这个任务就能够跑完了啊。那接下来的话呢,我们就给这个 open code 配置自定义模型, 这边呢,我们需要去填入这个 base url 和 api key, 那 随便给他一个提示词,简单测试一下,可以看到他这个响应速度还是很快的。那接下来呢,我们就给他一个完整的提示词,让他开始工作。首先呢,他会去搜索整个代码库,找到相关代码的逻辑,然后呢他这边列了一个 to do list, 接下来呢,它就会按照这个 to do list 挨个儿去完成啊,比如说这个添加依赖啊,新增 mongol 的 配置类啊,添加连接信息啊,然后它就去创建了数据实体类啊,写了一个 mongol db 的 数据操作,这样在这个 surface 里面,它去替换成了刚才生成的这个 mongol 的 操作类,对吧?很快我们这个项目它所有的代码就已经写完了, 这里呢还生成了数据迁移与备份的一个方案啊,看上去还是非常的细致,对吧?那对于多克容器的操作呢,他可以去自己执行相关的命令,比如说他可以去自己读取控制台的一个输出,然后呢自我修复和优化,这点我觉得是非常 nice 啊,最后我们整个项目也已经 成功启动了,那现在的话呢,我们就去打开浏览器啊,看一下它的这个效果啊,发现果然是已经启动成功了。接下来的话呢,我们这个老的日记记录也是在这里有展示的, 那说明这个数据迁移的脚本执行还是非常成功的。接下来的话呢,我们去做一些业务操作,看一下新增日制的这个场景是否是符合预期的,那可以看到这个业务操作已经执行完了,我们再来到这个日制界面啊,可以看到这个最新一条的记录呢啊,就是我们刚才操作的那个。然后我们去看一下老的这个 macbook 数据库 啊,发现这边呢是没有新的数据写进来,说明我们这个日制的写入也已经是迁移到了 mongodeb, 那 到这里的话呢,我们就已经全部迁移完毕了啊,整体这个效率的话,大家觉得怎么样?可以在弹幕给他打个分,那对我来说呢,这次最大的一个感受不是说他代码写的有多快啊, 而是呢,他可以在真实的老项目里面去坚守住啊,我们给他定的这个工程的边界感,那至少在这个任务当中,这个 quin 三 coder next 呢,他没有去乱改我们项目的一个结构 也没有说啊,这么长的一个任务,他中途就失忆了,重写了,更像是在嗯,不断的配合我们啊,把一件比较复杂的事情一步一步的去做完。当然啊,这也并不意味着他所有的任务都不会翻车啊,也不代表他就能够去适配所有的一些编程的场景。但是呢,我觉得在这种长任务 啊,多轮修改,真实工程改造的这种场景下面呢,它的这个价值啊还是比较大的。那说起 quake 呢,其实每年在这个时间点,大家都会期待一次新的版本迭代,而这次我们用完了 quake 三 cold nex 之后呢啊,我反而对后面的这种版本的更新是更加期待了啊, 所以说呢,也是非常欢迎大家去自己上手体验一下,那说不定呢,会有一些不一样的感受。 ok, 那 以上呢,就是本期视频的一个全部内容了,感谢大家的收看,我们下个视频再见, peace。

二零二六年刚刚开启, ai 影像生成领域硝烟便已弥漫。昨天,阿里正式发布新一代图像生成及编辑基础模型昆 a m h 二点零,几乎在同一时刻字节上线了 c dream 五点零加持谷歌近期热度不减的 nano banana 全球影像生成赛道迎来一场巅峰对决。 作为千万家族的最新成员,宽 a m h 二点零的表现堪称经验。根据 dai 尔伊娜的最新盲测数据显示,文生图评测斩获一千零二十九分,位列全球第三。图像编辑评测得分一千零三十四分,仅次于谷歌 nano banana pro, 高居全球第二。 这一成绩不仅意味着阿里在纯视觉生成质量上超越了大多数海外模型,更标志着其在生图加编辑双重能力上的极高完成度。 相比同类产品,昆 a mi 二点零展现出两个非常明显的优势,第一,超长指令执行力,支持高达 dk token 的 复杂文本输入。 这意味着用户可以像写短片小说一样描述场景模型就能精准捕捉每一个微小的细节,生成专业级的 ppt、 多格漫画、信息图表等。这种长输入是 nano banana 和 crem 五点零都未能做到的。第二,超强的汉字渲染能力, 在这个维度可以说是统治级的实力,甚至可以精准还原兰亭集序这种长篇古文配图。这种对中国文化的理解深度,海外顶尖模型,国内同类模型都是望尘莫及。 现在,我们用同样一个指令,来试试几款圈内当红产品的长文本渲染能力,让他们分别制作一张带中文诗词的古风画面,对诗词内容、字体、画面布局、构图意境君作出明确要求。 这是宽莓莓二点零给到我们的成品,完成度是比较高的,特别是对文字内容、字体的拿捏,基本是可用的。再看看 nano banana, 文字直接是乱写啊!最后是 c grem 五点零,文字多了一句字体不太对,生成的内容有明显错误。最后我们来总结一下上面三款产品的特性。 谷歌 nano banana 凭借雄厚的算力底座,追求极致的写实文理与物理引擎还原字节。 c grem 五点零质感再更偏娱乐类生图依靠剪映生态,主打视频创作的前端爆发力。 阿里坤 emoji 二点零则深耕生产工具属性,将生图与精细化编辑统一于单一架构,试图解决 ai 绘图不可控、难修改的行业痛点。最后的最后再次强调,这款模型的中文渲染能力真的太能打了!

你以为阿里在二零二六年整个二月份搞出的模型全家桶,只是为了跟字节跳动抢那点云市场的份额吗?或者只是为了在春节期间刷个存在感吗?你难道没有发现,阿里二月份发布的模型竟然在集体变小,参数量比上一代减少了百分之六十五?这根本不是常规的产品迭代,而是一场蓄谋已久的降维打击。就像当年互联网起步时布局分布式架构一样, 阿里正在布局未来十年的智能底层协议。在哲学上,有一个核心命题叫具深认知 embodied cognition。 他 认为思维不是独立于身体的计算,智慧是在与环境的碰撞中产生的。为什么阿里要同时发布千问 image、 千问三 coder 和 brain brain? 因为一个完整的文明个体需要三样东西,感知,对应我们的眼睛、逻辑对应大脑以及行动,对应肉身。 阿里正在做的是利用 moe 混合专家架构,进行一场成本极其低廉的感官拼装。以前我们要训练一个全能的模型,消耗的算力简直是天文数字。以 g p t 四级别的酬命模型为例,训练一次需要消耗数万张顶级算力卡,连续运转数月,其电力消耗足以供养一个小城市一年的运转。现 阿里用 mo 架构告诉你,智能是可以拆解且按需挂载的。千万三 max 是 中央处理器, coder 是 它的执行逻辑,而 rimbrine 则是它的中疏神经系统。这种分布式进化,本质上是在模拟生物多样化的演化路径,不再追求单一庞然大物,而是追求生态位的精准占领。我们来看两个决定成败的硬核细节。 第一是 m o e 混合专家架构的百分之三极限调用。千万三 max 虽然拥有一万亿参数,但它的思考版在处理 amy 二十五数学竞赛题时,能达到百分之一百的准确率。这背后不是靠暴力计算,而是靠极其精准的专家调度。这就好比一个公司有一万名员工,但在解决一个精密数学难题时,系统瞬间锁定了最强的三个人,并让剩下的人休眠。 这种瞬间神经元激活率的控制,才是 rayburn 的 时空记忆锚点。 现在的 ai 最大的缺陷是空间盲区,当一个机器人转身,他就失去了对背后世界的感知。但达摩院的 rayman brain 引入了一个关键算,访问本坐标联合嵌入 text coordinate embedding。 它不是在背诵药品在桌上,而是将药品这个词直接编码进了三维空间的绝对坐标 x y z 里。这意味着,即便他转过身去,那个坐标点在他的数字视网膜上依然闪烁。他第一次拥有了类似人类的常识,直觉万物皆有位置,且位置具有持续性。 我们要把这些点连成线,你会发现,阿里不是在做一个对话框,它是通过千万三 max 中数大脑建立逻辑标准,通过千万 image 感知器官统一视觉语言,再通过 rainbow 聚生智能将这些逻辑注入到物理世界的骨架里。 当代码模型千万三 coder 能够自我修复,意味着 ai 已经掌握了生产力的闭环。当画图模型能在消费级硬件跑通,意味着算力的去中心化已经完成,阿里正在构建一个宏大生态,智能将不再是悬浮在服务器里的每一个毛细血管。 当 ai 的 数学准确率达到百分百,当他们学会了在物理空间里精准移动,当他们开始以极低的能耗自我眼镜时,人的独特性还剩什么?二七年的春节又会是什么样的?我是老高,下期见。

重大更新,阿里巴巴于二零二六年二月十日发布了新一代图像生成与编辑模型千问 image 二点零,该模型统一了生图与编辑功能,在 ai rina 评测中文生图得分一千零二十九分,位列全球第三。图片编辑得分一千零三十四分,仅次于 nano banana pro。 千问 image 二点零支持一 ktoken、 超长提示词与二 k 高分辨率,可精准执行复杂指令,轻松生成专业 ppt、 海报及多格漫画,并以出色的中文渲染能力实现高质量汉字呈现。 目前,开发者可通过阿里云百链平台参与 api 邀测或在千问 chat 上免费体验。关注我,让 ai 更好的服务于你!

阿里切问春节在 ai 技术与生态应用双线发力。技术上, q v 三点五即将开园,新一代图像模型 q v m h 二点零发布且性能领先应用端切问 app 接入大麦实现 ai 购票三十亿免单活动火爆探营流量基层限流 与现付费拉新,二月十三日还将开启现金红暴战。此举是阿里依靠自由生态打动 ai 商业闭环、培育用户使用习惯的关键布局,虽暴露基础设施成压问题,但也反映出市场对 ai 消费服务的旺盛需求,大厂春节 ai 营销战正全面升温。

不知你注意到没有,阿里的 ai 千问最近动作很大,去年十一月更名上线,广告铺天盖地,两周前还开了场声势浩大的发布会,说以后只要一句话就能点外卖、订机票。 紧接着网上是清一色的好评,你懂的,这不只是口碑,还是真金白银砸出来的声量。但有意思的是,千问越高调,就越衬托出他的对手豆包的底气。 大家好,这里是 mt 频道,咱们先看上线时间,豆包二零二三年八月就上线了,可谓占尽了先机。而千万呢,二零二五年十一月才以全新的名字亮相,比豆包整整晚了两年。 此时的豆包已经成为了国民级的应用。根据最新的数据统计,豆包的日活跃用户已经达到了一点五五亿,稳居国内的第一,甚至超过了 deepsea。 而千万在去年十月以前,月活还在三百万左右徘徊,在大厂里几乎是垫底。虽然这两个月千万一下猛冲到了一亿的月活,增速惊人,但总量上依然被豆包拉开了一大截。再看投入,两家都是集团的最高优先级, 真金白银的往里砸。去年一年,除了一月份豆包的广告投放就没跌出过前三,二月份更是暴涨了百分之一百三十。算下来,自洁一年在豆包上投入超过两百亿。阿里更猛, 去年十一月千万的投放量直接暴涨一百三十七倍,这是要把所有人的手机屏幕都刷成他的广告。不过两者最根本的 pk, 其实是产品思路。豆包想做的是系统级入口,他追求的是全面好用,从视频创作、图片生成到辅助编程,几乎什么都能干。 他还想通过豆包手机成为跨越所有应用 app 的 总入口,但因为动了太多人的蛋糕,一度被各大平台联手围堵。而千问呢,则选择了另外一条路,在自家生态内闭环。他不去硬闯别人的地盘,而是把整个阿里生态全都塞进千问里。 一月十五日,千问全面接入淘宝、支付宝、高德、飞猪。换句话说,以后阿里系的 app 你 可能都不用装了。 阿里似乎也有意让千万成为唯一的前台入口,把阿里系的所有交易都收拢在千万的一句话里。 为什么这两家的战略差异这么大呢?核心在于流量。豆包背靠的是抖音,只需把刷视频的人顺手转化,就有稳定的基本盘。 但阿里不行,他没有这般大体量的内容流量池,所以只能靠砸钱开发布会,把千万引推到你的眼前。 更深层的差别还在于出身。阿里是做交易起家,最熟悉的是双十一打法,先靠运营造势,把场子坐热,再吸引商家进场。而字节擅长的是分发与算法渗透,让你在不知不觉中产生依赖, 而这正是阿里最忌惮的。所以这场 pk 较量,表面上是两个 ai 应用在比拼,背后其实是两种基因的对抗。 字节靠流量渗透,阿里靠生态闭环,一个想融入你生活的每时每刻,一个想包办你消费的每个环节。那么你是更看好先问还是豆包呢?欢迎评论区告诉我。

二零二六年一月二十六号,阿里巴巴正式发布了千万旗舰推理模型 cuban 三 max seating, 这个模型总的参数超过了万亿,也就是 igtrion 训练数据的数量高达三十六万亿。 talkings talking 就是 最小的信息主体单位,是目前阿里巴巴规模最大,能力最强的千万推理模型, 在包含事实的知识、复杂的推理指令的遵循、人类偏好对齐 agent, 也就是行为主体等能力等十九个公认的大元模型精准测试之中, 千万旗舰推理模型刷新了数项最佳的表现的记录,整体性能已经可以媲美现在美国最高水平的几个顶尖的大元模型。 同意。千万大模型的主要的负责人在朋友圈发表了文章,他认为 qwind 三 max thinking 代表了 qwind 三系列的大圆模型的收尾,后续千万大圆模型将迈向下一代模型的开放。目前 开发者可以在 qwantchat 上免费的体验这个大元模型,企业可以通过阿里云获得新模型的服务,普通用户也可以通过千万的个人计算机 pc 端和网页端试用这个模型。 现在我们要说的是这个高水平的大元模型是阿里巴巴开发的。我们大家都知道阿里巴巴是电子商务网上购物,在一九九零年的末期 快到两千年的时候他创业的,他主要的是一个网上开店卖货的平台这么一个企业,但是阿里巴巴却在不断的把赚到的钱用于高技术的 和产品。大元模型的开发我们大家都从各种比较可靠的报道中,包括官方的报道中获知,阿里巴巴不仅开发了高水平的大元模型, 尤其是这次公布的 q 问三 max 这种很强推理功能的世界级的大元模型,它也开发了 数据库软件,是大型的数据库软件,也就是我们的四大国有银行所使用的那种最高等级的数据库软件,它同时也开发了 c p u 和 g p u 等高端的 逻辑芯片。也就是说,我们产生于浙江杭州的这个电商平台,不只是在网上卖货,还搞出了世界级的人工智能的大元模型。而这个 领域的高技术竞争正是美国十分看重的,也是美国政府不断的严厉打压中国企业的一个领域,因为美国政府把他的下一代产业经济的希望 寄托在人工智能 a r e 的 产业上。当然我们也应该看到人工智能 a r e, 它可以渗透到几乎所有的制造业和服务的领域,当然它以后会产生巨大的经济效应, 我们当然不能松懈。好在我们的主要的 i c t 企业,也就是信息通讯技术产业中的一些头部的企业,正在全力地研发 人工智能的硬件软件和大元模型,还有彩色图片和彩色视频的深层式模型。我们现在在整个 i c t 和 ai 一 方面, 我们是世界上最先进的两个国家之一,我们的企业还在全力的历征上游。感谢观看。

大家好,就在前几天,阿里的千万团队又发布了一款新的视觉测试模型,千万 emoji 二点零,今天我就给大家测试一下,看它具体表现如何。总体来说呢,千万 emoji 二点零它是一款偏实用的模型,跟之前刚刚开源的 z emoji 它不是一个赛道的。 我们都知道 zemoji 它是偏向人像,偏光影,还有偏多风格设计,而今天的 emoji 到底呢,可能更多的偏向产品广告的设计,海报、 ppt 的 制作 等等实用的方向。目前官方并没有公布具体的模型参数和开源的信息,直到它是由 emoji 二五幺二和 edit 二五幺幺进行了,一个模型就能实现两种功能,既能生图,又能进行图像编辑。 在看完官方的博客之后呢,我们可以把 emoji 二点零它的特点归为三个,那么第一个特点是 emoji 二点零,它支持一千 token 的 指令输入, 第二个特点是它能够指出二 k 分 辨率的图片。第三个特点呢,是它的文本设计,或者说文本渲染能力非常的强悍,特别是对于中文字体来说。 那么在最新的模型盲测人类编号排行榜中呢,他也是排到了第三名,位于 g, p, d 和 banana 之后。当然这个排行榜它是属于阿里系的,所以仅供参考了。 想要体验这款模型呢,我们可以来到乌利的官网,这也是阿里旗下的一款 a i g c 网站,它可以生成图片和视频, 目前来说可以免费无限量的使用。千问 image 二点零这个网站呢,它有提示时翻译和提示时优化功能。另外呢,我们可以像编程 id 一 样,通过艾特某个特定的图片文件来进行图片参考和图片编辑功能。 好,下面我将对比一下 nintendo pro 和 emoji 二点零,看一下他们对同一段题词的表现力和题词的遵从度。好,那么第一个力呢,我选择的是制作一张经过 ps 的 探店照片。 那么这张图的难点在于呢,它对不同区域的文字都有不同样式的要求,比如地址、 emoji 表情,还有下面的水印。 我们简单看一下 emoji 二等音它的具体表现,标题、地址、水印、塑像字体都有。 唯一可惜的点就是标题的 emoji 表情错了,我要的是一个哭的表情。然后我们再看一下 banana, banana pro 的 表现,这里的地址、水印包括竖版的文字, emoji 表情都没有问题,但是它的样式给我搞错了,我要的是白色描边的黄色圆体字。 总的来说,两个模型在这个复杂场景下都有一定的瑕疵。最后我们再看一下画面的表现力,我个人是觉得 banana 的 表现力更好一些,因为 emoji 二点零它的饱和度过高, ai 感太重了。如果我们看下一个智能手表产品图的例子,那么这段题是主要是想测试一下模型在微距镜头基础上的文字、 镜面反射等等方面的表现。这张图片是 nasa banana pro 生成的,如果单讲这张图的话, emoji 二零表现的很差,跟 nasa banana pro 不是 一个档次的。首先看这一圈的文字,千万他就写错了,出现很多重复的内容,像其他的镜面反射,包括质感更是完败。 下一个例子是关于小红书上的旅游信息卡片的例子,我们直接看对比效果吧。依然左边是香蕉,右边是千问。第一观感的话,香蕉模型更加的讨喜,因为它有更多的元素点缀,还有更活泼的文字。 但是呢,香蕉模型它生成的图片不能细看,你看 tips 这里它改成了 tips 区,下面还多加了一个哆啦 a 梦的标签。 另外呢,他在其他文字上也有一定的幻觉,比如我在这里 tip 四上,我只写了早去外滩必然留这样的三句话,但他偷偷给我改成了六句话。虽然他增加了内容在合理范围内,但这也是模型自作聪明的表现。 千万引麦就二点零,文字倒是没有出错,但是他的文字就一个字,丑,像有点没渲染完成一样。 由于这段文字主要是表现文字的渲染能力,所以还是千万强一些。下一张图的主题是游戏卡片的制作,这张图还是很简单的,我们直接看对比效果吧。 这一套题是要求的文字信息会比较少,所以两张图都没什么问题,我们主要是看下其他东西。简单来说,千万一麦九二零,它的画面清晰度比较高。 呃,纳洛布纳的 pro, 它表现的更像一张卡片。好,我们看下一组测试样例。这张是关于过年的书法海报,从这张图来说,我在提的时候,要求对中间四个字是有枯笔飞白的书法效果。 从书法效果上来看的话,明显是 emoji 二零,它更加的贴合,还有两边的对联的话。 然后呢,这个一看就是印刷体,并不像我要求的密书,包括最下角的这个落款,还是千问的比较好。千问与 mc 二点零唯一的缺点就是它的背景是白色的,没有遵从我的提示词要求,描述的是马莲的红色海报。 下面这个例子是关于超现实海报的提示词,主要是看下他们广告的表现力,像这样没什么难度的广告,我们还是看他们画面的张力和官感。个人感觉还是香蕉模型更加靠谱一些,无论是光影还是构图。 哦,下一个对比的项目是关于漫画单页的,我的要求是画一幅大有克洋风格的赛博朋克机械少女漫画 依然左边是那那不那那 pro, 右边是 emoji。 二点零再换成漫画风格之后呢?千万他的表现力完全跟之前不一样了,两张漫画都符合大有克洋的风格。 我们先看第一个画面的提示词,我个人感觉还是千万的红色光圈,还有脸上的雨滴,表现力更加强一些。 第二个高达机器人的画面,两个表现都差不多,不然呢,稍微好一些。然后我们看第三部分画面主体破格大图的部分。这部分我的描述是主角从高楼边缘纵身跃下,身体在空中扭曲,手中发射勾索。 虽然两个画面都不太完美,但表现更好的肯定是千万,无论是在破格的勾索还是大楼的边缘,这些都更加符合,也更加有表现力。 下面的例子是关于电影九宫格分镜脚本的,这个题词描述的是关于黑泽明电影风格的一个流浪武士的武打镜头。直接从风格上来说的话, banana banana pro 更完美符合黑泽明的风格, 它更加的低饱和度和冷色调。前吻呢,它是完全相反,它在风格上是完全不遵循提示词的。对于这个画面的话,我想展现的是一个武士被包围之后,低头耍帅,砍水炫技出刀击败敌人,最后帅气的离开。 我分别用这两张九宫图去 cds 二点零生成了对应的视频,大家可以对比看一下。 那么除了以上的测试案例呢,我还测试了它的其他生成的能力,包括不限于科研绘图、 ppt 制作、摆板、动画广告等等。这里我就不详细介绍,大家直接可以看一下对比的具体效果。 最后呢,我们再来测试一下 emoji 二点零它的图像编辑能力。 我们先上传一张由 ai 生成的人物图像,然后让它去生成九张不同情绪和角度的角色九宫格来看一下效果 好。我们可以看到这九个风格都遵从了提示词的要求,但是在人物一致性上出了一点小问题,有几张图片他的眼镜没有了,下一个编辑场景是产品的背景替换,我这里有一张篮球写的产品图, 我的要求是把它的背景替换成一个有光影效果的窗台上。好,我们看到上身效果还不错,但是很可惜,产品的细节发生了变化,这是不能接受的,我们可以明显看到这一块的图标它发生了变化。 最后我们再测试一下他的跨图融合角色植入功能。简单来说就是上传两张图片,然后把图片 a 主体放入到图片 b 的 背景之中,我上传了一张 毛毛茸茸的狗,还有另外一个魔法森林的背景,第一次是要求将图片中的狗放入背景中,并戴上红色的头巾,那么这个效果表现的还不错,角色和背景的一次性都保持住了。 好的,综合以上测试结果呢,我们可以明显感觉到 emoji 二零距离 no no no no pro 仍然有一定的差距,但是它在书法、中文渲染以及漫画上的表现还是比较有亮点的,还是期待二旅团队能够尽早开园这个模型。 关于相关的提示词以及测试报告我会放在视频下方。好,以上就是关于所有 emoji 二点零的图像对比测试结果了,那么本期视频就到这,如果这个视频对你有帮助的,欢迎点赞分享。

二月二日,千问 app 官宣投入三十亿启动春节公示,二月六日上线春节请客计划,联合淘宝、闪购、飞猪、 河马、大麦等阿里生态应用,覆盖吃喝玩乐全场景,用户通过 ai 指令即可点外卖、订门票、叫跑腿,实现从聊天到办事的无缝衔接,开启 ai 原生服务新体验。

千万春节的重磅回馈来了!直接狂甩三十亿红包,不管是学生党、上班族还是长辈,人人都能薅到实打实的好处!二月六号起,活动正式启动,千万找到对应页面,不用做复杂任务,参与就有保底收获!每人必得一张二十五元免单卡,买早餐、奶茶、日常小百货都能直接 抵扣,省钱又实用!邀请新用户还能再得一张,多邀多拿,上不封顶,越邀收获越丰富!重点是除夕当晚的惊喜,千万别错过十九点到二十四点的整点红包雨,每小时都有大额红包轮番派送,不用蹲守整夜,每个整点定好闹钟就能抢, 说不定就能抽到超大额红包,给春节添上一份额外的好运!全程无套路,无隐藏条件,不用拼手速,只看运气,简单几步就能参与,有所回馈!不管是自己薅羊毛,还是和身边的人一起分享这份快乐,都能收获满满!

这几天,大家都看到了,阿里的千万放了个大招,三十亿请全国人民吃喝玩乐。活动上线四个小时,订单量直接突破了两百万,千万的 app 当场崩溃,半天的时间就冲到了 app store 免费榜第一。你只需要对着手机说一句,千万帮我点杯奶茶。千万啊,最快三十分钟就送到你家门口。 现在的免单范围啊,又货到了,盒马、天猫超市、淘宝闪购,从生鲜水果到零食酒水,最便宜的只要一分钱。这年味啊,直接被千万用奶茶给哄起来了。甚至是因为热度太高,千万还把免单卡的有效期从二月二十三号延长到了二 十八号,让大家过完年还能继续薅羊毛。那问题来了,阿里为啥偏偏选奶茶当突破口?因为高频刚需、年轻人爱喝,是 ai 最容易接入的日常场景。更关键的是,这一杯奶茶背后,它是一整套的动作,你说出需求, ai 帮你挑选、淘 下单、支付宝付款、高德茶配送、外卖小哥送上门。这一套流程下来,阿里的整个生态全被激活了。当你习惯了动动嘴,就能喝上奶茶,买上年货,拿你以后订机票、买电影票,甚至是置办家居,第一反应可能都是去找千万。这就好比啊,你已经用惯了某个外卖品 牌,换别家就觉得别扭。这才是阿里真正的野心,让千万成为你生活的超级入口。再看看其他大厂都在干啥,腾讯元宝发红包 自己保春晚,百度温馨搞全家福,大家都在抢 ai 时代的入口,这个春节 ai 大 战的硝烟,那真的比鞭炮声还要响。 说到底,这场春节 ai 大 战的本质是什么?不是拼谁的技术更强,而是拼谁更懂生活,更懂中国人过年的心思。用户,他不关心你的模型有多少参, 只关心你能不能帮我省钱,帮我省事,让我过一个舒心年。所以啊, ai 的 胜利,它不在于谁撒的钱多,而在于谁能让用户在红包散尽年过完之后,依然愿意开口说那句帮我。

结合二零二六年一月十五日发布的最新技术动态,特别是任务助理一点零和多模态交互开发套件,千万能够实现。一句话调动多个力的背后,其实是一套非常精密的 大脑思考加手脚执行的闭环逻辑,正在技术上被称为 ajax 物搜智能体工作流。为了让你能看懂,我把这套复杂的技术逻辑拆解为一下 四个核心,不周地一,不听懂意图感知与拆解技术核心全三麦子大模型讲意图识别。当你学出一句帮我定周末客桂林的机票,并定个离景区近的酒店时, 千万首先要做的不是客查票,而是理解一朵模态感知。无论你是打字、语音, 还是上传了一张写有行程的图片,千万都能通过多模态模型,如同一千万微 l, 将其转化为文字信息。两、任务拆解 tiffany 证券化包含两个独立任务,买机票嘉定酒店。 前文会利用其强大的逻辑推理能力,趁 sammas 将这个复合指令拆解为两个独立的子任务,并抢定执行顺序,通常先买票再订房。 第二步,规划路径工具调用与调度技术核心,复刻库加 h 调度引擎阵是最关键的一步,决定了 它能办事而不是只会聊天。一、匹配工具符合 kui 千万内部维护着一个巨大的工具箱清单,它会根据拆解后的子任务 匹配对应的工具。子任务查机票来 to 匹配飞猪飞的的查询接口。子任务定酒店来 to 匹配高德 m 或飞猪的酒店接口。二,生成指令千万会将自然语言 周末可归零转化为机器能读懂的代码参数,如出发地等于当前定位,目的地等于归零,日期等于本周六。这一步生成的通常是一个标准的这数据包 d 三步,执行与反馈生态协同与 m c p 技术核心, m c p 模型上下文协议加深度系统集成。这一步是阿里区别于其他 aureka 的 最大护城河,它真的能操作你的账号移后台过桥。千万通过 m c p 协议, 将上一步生成的指令直接发送给非猪和高德的后台服务。二、无需跳转以前的 ai 可能给你一个链接,让你点进去现在的前文,因为与淘宝、支付宝等 f 是 同一套底层账号体系, 它可以直接代表你在获得授权的前提下调用这些服务的数据。三、多步骤循环第一轮,千问调用非猪查票或托飞猪返回航班列表,挖透千问,把列表翻译成自然语言给你看。第二轮, 以求任某个航班拉头签问,记录下航班信息来投调用高德根据航班时间规划、接送及路线拉头返回结果。第 四步,呈现与闭环,全双工交互技术核心,低时延交互加全双工语音。最后,千万要把执行结果变成你能听懂、能看懂的样子,结构化呈现,它不会给你一堆乱码, 而是把机票信息、酒店位置、路线规划整合成一张精美的卡片或行程单持续对话。如果在执行过程中发现桂林周末没票了,他会立刻反馈给你,并询问是否改期或改课阳朔,然后 重新开始上述的拆解和执行流程。这种思考行动观察在思考的循环就是所谓的智能体 a 证逻辑 技术架构一览表,为了让你更直观的理解,我整理了支撑正义逻辑的核心技术组建基数层级核心组建作用,你的体验。 大脑推理层, try sumax, 负责理解你的意图,拆解任务,做决策。感觉他很聪明,能听懂复杂的人话神经调度层, a 帧引擎加 m c p, 负责把人话翻译成机器指令 并调用工具。感觉他动作很快,不用你点来点去。手脚执行层,阿里生态, 淘宝、 飞猪、高德等,提供真实的商品服务和交易能力,感觉它真的能办事,能下单,能支付。感官交互层,多模态模型处理语音、图片、文档等输入, 以及生成 ppt 图标等输出,支持语音聊天、拍照识别,生成报告。总结,简单来说, 前文现在的技术逻辑就是,用大模型做大脑,负责思考和指挥。用 scp 协议做神经,负责传递指令。 用阿里生态里的 a 做手脚,负责干活。这就像是你雇了一个超级秘书,他手里有你所有的账号密码,你只要把需求告诉他,他就会帮你把所有繁琐的操作都做完。

不得不说,时代是真的变好了,以前过年就盼着长辈的红包,直到长大之后就再也没领过了。直到今年遇到了这个搭载了阿里闭元模型的千万 app, 没想到今年连 ai 都来给大家发红包了! 从二月六号起,阿里千万直接狂撒三十亿福利上线就能领一张二十五元免单卡,拉上新人朋友一起玩,还能再多薅一张。而且春节期间进入相应的活动页 还能拆红包!最后压轴的来啦!除夕夜十九点到二十四点,整点红包雨轮番下,大额红包抢到手软,这个春节就让千万 app 给你解锁新年好彩头,红包拿到爽!