还没做春节计划,再拖真的就来不及了,毕竟订票订酒店、做攻略这种事情有一大堆。那今年春节呢?我只用一句话就搞定了我们全家五天的行程,你敢信吗?不只有路线规划,还可以直接在上面进行买车票, 酒店点击呢,也能直接在非洲平台进行一个预定。这就是千问新发布的能办事的 ai agent ai 从对话框进入到了办事时代。今天就来聊一聊千问上新出现的这个任务助理模式到底能做什么?可以向他输入我们的出行计划,比如说帮我规划一个安徽到北海的五千加电油预算,五千以内, 他就可以立即开始干活了。从他的生成过程上来看啊,并没有简单回答我的问题,而是真的去帮我查车次,比酒店 还经典练美食,最后生成了这样一份完整的行程文档,还补充了出游建议、注意事项、必备物品建议等等,直接照着他的规划去执行,再也不用因为去哪吃怎么走而吵架了。那同样的需求呢?我也是给到了 minnes, 他 只能给我纯文本的规划方案, 对比一下 miniso 能回答片段信息,比如只给车次或者是指定景点,具体怎么买票,定什么酒店,都需要自己去查。行程预算呀,也稍显概括。而千万呢,不仅有清晰的每日路线规划,行程里还附有能够票的高铁链接,只需要点一下就能直接跳转到高德,还有飞猪 一键订票推荐的景点,还有酒店,都可以点进去直接下单,这样给到的行程预算就相当准确了。相比较于之前 ai 只能回答碎片信息,千万的任务 提问到执行,一步到位。不知道有没有跟我一样特别喜欢在酒店就点外卖的朋友,那你现在就可以直接在千万上发送,我要点三杯奶茶,请帮我推荐附近评分高、配送快的外卖,他就会调动闪购服务区帮你筛选。 如果你中途想要换口味或者是调整预算,就直接告诉他,调整选电之后就可以直接下单支付。同样的需求在 minnes 上啊,只有建议,也没有大招的反馈,要不然说以前怎么特别容易踩雷呢?像旅途的路上,如果你看到不认识的动物或者是植物,也可以拍照发过去,他能够马上识别讲解,是我目前用过最准的识图功能了。 就算你是屁人,临时改主意,明天准备在酒店修整一天,他也能够随时更新行程。像新能源车主自驾,还能让他帮忙规划充电路线, 提前做好规划再出发,假期才能更愉快。之前用 minnes 去规划,只能规划一个笼统的行程,路上遇到一个需要充电加油的,还要半路停下来,特别的不方便。多模态加智能体加阿里生态的打通,千万的新功能,不光是知道,还能够动手办。 除了这些生活场景,千万还有着很多解决复杂工作的能力, ai 终于成了普通人真正能够用得上的生活助手。现在就去试一试用,千万别让琐事偷走团圆!
粉丝4296获赞3.1万

不得不说,阿里的生态优势加上 a r 简直就是无敌的存在。你现在看到的是我刚刚拿到内测资格的千万任务助理。不同于大部分 angel 只会聊天给建议,千万将将做到了在现实世界里帮你办事, 比如像点外卖、规划行程。就像以前你需要大概好几个 app 分 别操作的事,现在只需要一句话,他会自己思考规划,调用闪购、支付宝等工具帮你完成任务,而且是真的能送上门的那种。正如吴家在千万 app 产品发布会上所说, ar 在 拥有超强大脑之后,开始长出了能够触达真实世界的手和脚,在生活中实实在在的替用户干活。 而这一次,四大场景, ai 做应用、 ai 办公、 ai 调研、 ai 生活助手,全都不是掩饰,而是真实可用的功能。比如啊,你可以让他一句话帮你找到最便宜的机票,得益于阿里飞猪生态,他能够智能识别低价区间,一件购票链路全打通, 还可以帮你一键完成图文并茂的全网渔情分析,并且所有内容都可以精准追溯。另外还有打工人头疼的数据分析,一句话丢给切文,一次全处理,自动清洗核表算数结果可追溯、可汇报。 当然,像应用开发,输出一份精美的 ppt 也都是一句话的事儿。所以你可以看到一托强大的千万大模型和一整套阿里身材。在通过 m c p 和 a to i 协议, 千万已经不是接 api, 而是直接接入了真实的业务系统,这也让千万成为了全球首个能完成真实生活复杂任务的 ai 助手。 而这一步,正是 agent 应用爆发的真正分水岭,不是模型参数有多大,而是谁能把 ar 塞进真实世界的生产系统里。而阿里的优势恰恰就在这里。电商、支付、物流、出行、办公、企业服务这些年,看似重的东西正在成为 agent 的 时代最硬的护城河。

设想一下这个场景啊,你正在计划一个周末的短途旅行,嗯,你可能得订机票、找酒店、规划路线,还得预定个评价不错的餐厅,对吧?甚至可能还要买一点旅行装备。没错, 通常这得打开四五个不同的 app 来回切换。是的,但如果现在你只需要说一句话,比如说帮我规划一个周末去杭州的旅行,要住在西湖边儿,周五晚上吃本帮菜,然后刷一下,所有事情都自动办好了。 这听起来像是科幻电影里的场景,但它可能比我们想象的要近得多。没错,今天我们就来深入聊聊一个正在彻底改变我们与技术交互方式的概念。 ai agent, 也就是人工智能智能体。是的, 你发过来的这些行业报告、财务分析,还有新闻文章都指向了同一个方向。我觉得这不仅仅是对现有聊天机器人的一个升级,它更像是一场呃, 潜在的革命。嗯,所以我们今天的任务就是一起梳理这些资料,搞清楚 ai ai 阵的到底是个什么东西。 它真的有能力颠覆我们过去十几年习惯的那个超级 up 模式,成为科技巨头们争夺的下一个终极入口吗?尤其是在中国市场,像阿里巴巴这样的公司,它又是怎么在这场新战争里布局的?好,那我们就从最基本的问题开始吧。 ai agent 这个词儿现在到处都是,但它和我们以及很熟悉的聊天机器人,比如说叉 gpt, 到底有什么本质上的区别?嗯,这是个很好的切入点。 那个核心区别,我觉得用一个词儿来概括,行动。行动。对,传统的聊天机器人主要停留在对话这个层面, 他能理解你的问题,然后给你信息,就像一个知识很渊博的图书馆员。嗯,而 ai agent 的 核心是执行, 他更像一个能干的私人助理,他不光能理解你的意图,还具备自主规划决策,然后去执行任务的能力。就是说,他可以独立完成跨系统多步骤的复杂流程。啊,我明白了,就是他能办事了,哎,对,完全正确,就是这个意思。 比如说一份行业报告里就提到,一家商业银行引入了金融智能体之后,那个贷款审批居然可以实现全流程自动化,效率提升很大吗?非常大。 过去啊,需要人工处理的 kyc 审核,也就是了解你的客户,这个流程效率直接提升了百分之六十。这就是从回答关于贷款的问题到实际去处理贷款申请的飞跃。我明白了,这听起来确实是一次人际交互的代际飞跃。 有份券商报告里有个提反让我印象特别深,他说,我们正在从 g u i, 也就是我们熟悉的图形用户界面,嗯,点击图标那种。对,进化到 i u i 意图交互界面。 换句话说,我们过去那种在屏幕上点击跳转的操作模式,正在变成一种全新的对话执行的范式。是的,而且这里最有意思的一点是,这种范式的转变正在引发商业模式的根本性变化, 我们正在从注意力经济转向意图经济。注意力经济到意图经济。对,这么说吧, 过去 app 的 设计目标是尽可能多地占用你的时间,让你不停地刷,这样它才能展示更多广告,对吧?对,没错,但在 ai agent 模式下,目标完全是反过来的。 它要在最短的时间内最高效地完成你的需求,然后通过收取服务费或者佣金来盈利。 这几乎是完全颠覆了过去二十年互联网的流量逻辑。等一下,这个逻辑我能理解,但我也有点怀疑, 你觉得那些靠着注意力经济赚的盆满钵满的公司,真的会心甘愿意的放弃这个利润丰厚的模式吗?嗯,我感觉他们更有可能会两头都占,一边帮你办事收服务费,一边在办事的过程里继续想办法向你推销你没要求的东西。你 分享的这些报告里有提到这种矛盾吗?问的非常敏感,这也正是目前行业面临的一个核心张力。 报告里确实没有给明确的答案,但普遍的分析是,这将是一个长期的由用户选择驱动的转变。用户选择对, 短期内混合模式肯定会存在,但长期来看,哪个 ai agent 能最干净利落地完成任务,不打扰用户,哪个就能赢得最终的信任。 未来的商业竞争可能不再是谁能抢占你的屏幕时间,而是谁能成为你最信任的任务管家。信任会成为新的护城河。没错,有道理。 那么这个新的意图经济需要一个全新的平台来承载。这场战争具体是在哪里打响的?我们先从大家口袋里的设备手机说起吧。的确,手机是主战场之一, 一个关键的趋势是端侧智能直接部署在手机上,而不是完全依赖云端。比如说,它们正在推动三十亿参数规模的模型上机三十亿参数,这个规模有什么特别的讲究吗? 为什么是三十亿?不是十亿或者一百亿?这背后有什么权衡?问到点子上了,这其实是一个在能力和能耗之间寻找最佳平衡点的结果。啊哈,模型太大,手机的处理器带不动,电池也扛不住。 模型太小呢,又不够聪明,没法处理复杂任务。所以三十亿参数被认为是目前能在手机端实现比较强的能力,同时工号又可控的一个填点区。 明白这样做的好处很明显,很多任务可以在本地完成,不需要联网,既保护了你的隐私,也大大提高了响应速度。 微,我就声称,它们的三 b 模型在文本摘药这类任务上,已经能达到云端大模型百分之九十七到九十八的能力,用户几乎感觉不到差别。好的,所以把 ai 放在手机上,能让它变得更快、更私密。 但这感觉更像是一次体验升级,还算不上颠覆。不过我注意到,其中一份报告里提到了一个叫记忆的概念, 这会不会才是让端测 ai 真正变得强到的关键?没错,这才是真正的游戏规则改变者。 oppo 推出了一个叫做 persona x 记忆共生隐形的东西 persona x 对, 它的目标是通过深度感知和理解你在不同场景下的行为,为你的 ai 助手建立起深度用户记忆。比如, 比如他知道你习惯在早上通勤路上听播课,下午三点会想点杯咖啡,经常和某几位家人联系。 有了这些记忆, ai agent 才真正变得个性化,因为他越来越了解你的习惯,甚至能预测你的需求。从一个被动的工具变成一个主动的伙伴。正是等等。如果 ai agent 本身就成了我们交互的界面,而且他有了关于我的记忆,能主动为我服务, 那这是否意味着,未来征战的焦点不再是让用户打开哪个 app, 而是成为用户手机操作系统里那个默认的 agent? 嗯,这听起来我们正在从一场应用商店之战走向一场智能体商店之战。 这个总结非常到位。有分析报告明确指出,未来的超级入口将不再是某个 app, 而是 ai agent 本身。嗯, 就像浏览器定义了 pc 互联网时代,超级 app 定义了移动互联网时代一样,现在所有巨头都在争夺这个通往数字世界的新大门。 国外是什么情况?在全球范围内,我们看到 openai 正在努力把 chat、 gpt 变成一个可以调用 canva、 spotify 这些第三方服务的超级平台。 而谷歌呢,则直接在搜索中加入了 ai agent 功能,让你一句话就能预定餐厅。那在中国呢?而在中国,市场情况就更有意思了。 摩根斯丹利的报告里说,我们能看到两条完全不同的路子在同时发展,形成一种双轨并行的景象。双轨并行, 对,一方面是像微信这样的存量超级 app 的 进化,你想想,它有超过十一亿的越火用户和极高的用户粘性,这简直是植入 ai agent 最肥沃的土壤。嗯,基础太好了。是的, 但另一方面就是字节跳动的豆包、百度的文心一言这类 ai 原生应用的快速崛起,它们从零开始,没有任何历史包袱,就是为了成为 agent 而生的。谈到这个双轨并行的市场,我们不妨聚焦一个案例。 你提供的资料里反复提到了阿里巴巴的千问 app。 对, 它似乎完美地体现了那种存量巨头如何利用自身优势来参与这场战争,它们到底想做什么? 阿里的战略非常清晰,甚至被摩根斯丹力称为中国 ai 竞赛的最佳赋能者,评价很高啊。是的,他们的核心打法就是通过千问这个统一的入口,将阿里自身庞大而丰富的生态系统全部串联起来, 给 ai 装上能触达真实世界的手和脚。我看到文章里那个点咖啡的故事,感觉就很能说明问题。 对,那个例子非常经典。在一个发布会现场,演示者只说了一句话,帮我点四十杯霸王茶几的薄雅爵衔,四十杯不少。然后千论 app 就 自主完成了选店,找到并使用优惠券,最后通过内置的 ai 付完成支付, 全程无需照断任何其他 app, 完全不用跳出去。对这个过程完美全释了。从聊天到办事的转变,我都能想象到,如果我让我们公司的助理去完成这个任务,可能中间还得打好几个电话跟我确认细节。 不过说实话,这种发布会上的掩饰总是看起来天衣无缝。嗯,但在现实世界里,如果我说的稍微模糊一点,比如给我来袋好喝的,他会不会就直接瘫痪了? 这些报告有提到它的实际容错率吗?你的担心很合理,演示环境肯定是高度优化的。报告里也承认目前 agent 的 辱棒性,也就是应对模糊指令和意外情况的能力还有待提高,所以还不完美。但这并非关键。 那个演示的关键不在于它百分之百完美,而在于它证明了阿里已经把内部的管道全部打通了。啊,是底层逻辑没错, 支付、外卖、优惠券这些过去独立的系统,现在可以被一个统一的 ai 大 脑调度,技术上的容错率会随着魔情迭代而提升,但这种底层生态的整合能力,才是其他竞争对手短期内难以复制的。我明白了,他打通了过去相对独立的各个业务。 有篇文章用了一个很形象的比喻,千问就像一根线,把阿里胜败中散落的珍珠,高德的脑党、淘宝、天猫的购物、非洲的旅行、支付宝的支付、饿了么的外卖全都串联了起来。正是如此, 斯廖志还特别提到了一个概念,说千问通过接入高德某图,获得了空间智能。空间智能,这个词听起来很酷。 对你来说,这个意味着什么?这意味着 ai 开始实时的理解物理世界了。这点非常关键。嗯,他不再仅仅依赖于一个静态的、基于历史数据的知识库,而是能知道此刻哪里在堵车, 哪家店刚刚关门,甚至天气变化对你出行的影响,基于此时此刻的真实情况。对,所以当你让他推荐一家餐厅时,他给出的建议是基于真实情况的,而不仅仅是三个月前的用户评论。 这一点让他相比那些缺少线下履约体系的纯默型公司,构注了非常深的护城河。他不仅有大脑,更有遍布现实世界的感官和四肢。说得太好了,这一切听起来能力非常强大, 但反过来说也让人有点不含而离离。他知道的太多了,这必然会面临巨大的挑战吧?挑战确实很多,而且都非常棘手。首先就是你提到的安全和隐私问题。 一份报告就详细复盘了微软 copilot 曾经出现过的一个零点击漏洞,黑客可以在用户不知情的情况下窃取数据, 这个很可感。是的。其次是理论问题, ai 决策过程不透明的黑箱问题,在医疗、法律这些高风险领域的应用会受到很大限制,我们很难完全信任一个我们不理解其决策逻辑的系统。 除了这些,技术和商业层面最大的障碍是什么?目前来看,最大的障碍可能是,呃,协调。 有手机厂商的业务负责人就在采访中谈言,要实现跨 app 的 数据互通,让 agent 能自由调用不同公司的服务,实在是太困难了。利益壁垒? 对,这背后涉及到商业利益、用户隐私、数据标准等等一系列复杂问题,不同公司之间如何建立互信,是一个巨大的技术和商业难题。嗯,这也反过来解释了为什么像阿里这样拥有完整生态的企业,在县级党的优势会如此明显, 因为它可以先在内部把所有环节都跑通,形成一个闭环。那么把一切都综合起来看,对我们普通用户来说,在不久的将来,有哪些值得密切关注的趋势?一份行业报告为我们指出了未来十二到二十四个月的三大趋势,我觉得非常精准。 第一是端端测渗透,就像我们前面提到的,会有更多更强的 ai 模型,直接在你的手机甚至汽车上运行。嗯,第二是多模态融合, agent 将不仅能理解文字,还能理解图像和视频。能给个例子吗?当然,比如你拍一张朋友婚礼请柬的照片发给他,他就能自动识别地址和时间,帮你规划路线,并在日历上创建提醒。 这将在医疗诊断、广告设计这些领域带来真正的革新。哇哦!第三就是商业模式的创新。未来会从目前单一的订阅制向更灵活地按任务收费、企业解决方案定制等等多样化模式发展。好了,我们今天深入探讨了很多内容。 总结一下, ai agent 原不只是更聪明的聊天人,它代表着一场人机交互的根本性革命。嗯,我们正在从过去那个需要我们去适应机器 点击 app 的 时代,迈向一个机器来适应我们说出意图的时代。而在这场变格中,全球的科技巨头们都在激烈争夺那个全新的超级入口。 像阿里巴巴这样的公司,正凭借其庞大的自有生态系统,打造一个不仅能说,更能深入真实世界去做的 ai agent。 嗯嗯,这种生态整合能力构成了他们在当前阶段最核心的壁垒。我们也看到了商业模式从注意力经济到意图经济的根本转变,当然,也清楚地认识到,在安全论语和跨公司协调方面依然存在着巨大的挑战。 是的,最后,这给我留下了一个这些资料没有直接回答,但却非常值得思考的问题。 当这些 ai agent 真的 成熟起来,越来越高效地帮我们捯饬掉日常的琐事,订餐、购物、规划行程, 我们每个人的时间将被大量的释放出来。嗯,一个很有意思的设想,那么我们该如何利用这些被节省下来的时间?又会有哪些全新的产业?比如报告中提到的生成式互动剧会应运而生来填补这个巨大的时间真空。

我已经不期待有 gemini 的 siri 了,我的手机现在就是 agent 下需求到确认闪购方案并支付一气呵成。都不用来回切换软件,只要打开千问 app, 点击任务助理,全新的强大功能就一览无遗。 它现在就是一个能调动阿里全家桶的超级入口,你看,我想喝奶茶点生活办事,批量闪购下需求给千问模糊指令,也能识别并提供外卖方案。 千问先调高德,看你在哪,再帮你选最近的店,然后接入闪购并下单,再接入支付宝功能确认付款,过一会外卖就送过来了。 千万 app 还接入了支付宝 a f 和政务服务,只要我们输入一句话,就能够查询签证、户口、公积金等五十项民生服务事项,而且能够直达办理入口。之前要办事 总是需要在不同部门网站间反复查找,现在在千万 app 下指令如何给新生儿办医保,千万就能够帮你判断能不能办,需要准备什么。除了生活中能用上千万 app 的 新功能,工作中千万 app 还能够化身效率神器,外部端最多能同时处理一百个文件 财务。做梦都想要的功能来了,只要点到生活办事,选择 office 办公,就能够批量处理表格复杂的报表和数据。终于有救了! 还在上学的朋友更是能用千问 app 讲解题目的时候,千问能像真人老师一样边画图边推导你还能够随时说话打断 ai, 让他重新讲一遍你没有听清楚的地方这几件事。说实话,在 ai 如此强大的今天,放眼全球也只有阿里能全干 open ai 模型强, 没有外卖,没有地图,没有支付,只能在聊天框里跟你聊聊咖啡豆的历史。 google 呢,什么都有,但大厂并严重,各业务线各为其正,谁也不听谁的。再看阿里 高德,有时是地图数据,淘宝闪购有商家库存和配送网络,淘宝有商品供给,支付宝有支付能力。这些本来都是独立的 app, 现在被千万打通了,变成了随时可以调用的技能模块。你看某包的那个工程机,用着用着就被弹窗,被报错,被卡脖子。毕竟用的是别人家的服务,人家不让你用, 你就没辙。阿里这套都是自家的生态,就没有那些问题。任务处理功能,支持四百多项办事能力,从点外卖、买东西,到订机票、酒店、写报告、做网页,甚至打电话订餐厅,都能够一句话完成。而我们用户,终于也不用在几个 app 里来回接了,终于不用担心报错了,这才是 a 件该有的样。

被全网博主吹捧上天的千万 ai agent, 一定要慎用了啊!既然没有人愿意来说破,那我来当这恶人!这段时间,是不是突然有很多博主都在疯狂的去宣传这个千万的 ai 智能体有多牛? 教你一间买咖啡,一间定酒店,甚至教你把整个生活都可以去自动的去托管给这个 ai 听起来是不是觉得,哇,太牛了吧! 他们只会告诉你这种一键直达有多少,但是绝对不会告诉你,这种极致便利的背后,是资本为你量身定制的消费陷阱。如果你不想在不知不觉中被算法掏空的口袋, 那么请认真听完我接下来说的话。为什么我们要去警惕这种智能体能?因为它的底层逻辑就是在杀掉我们的决策痛苦。 过去我们花钱,我们是要对比价格,要确定金额,要输入密码。这些看似麻烦的操作,其实是你的大脑最珍贵的理智防御机制,它在反复提醒你,你的钱要被花走了,你要保持清醒。但千问 a i a 制呢?它追求的是什么? 是零摩擦,当操作简化到只需要说一句话,甚至它能帮你自动下单的时候,你的防御机制就会彻底失效。这叫无感化收割。资本在利用 ai 抹掉我们的支付感知,让你在没有任何思考余地的情况下,你就把辛苦攒下来的钱 给无意识的花掉了。最可怕的是,这种依赖会让你陷入决策盲区。 ai 给你的推荐,它真的是最合适你的吗? no! no! no! no! 不是 的,他给你的不是基于你的需求,而是基于背后谁给的佣金更高,谁买的流量更凶?所谓的智能分析,所谓的优选,本质上 这是一套利润最大化的算法。你以为你在享受便利,其实你是在被定向投喂,你以为你在节省时间,其实 ai 正在把你塑化成一个只会按按钮的消费机器。那么我说这么多,并不是要让我们去杜绝使用这个前文的 ai 啊。 在智能时代,懂得和 ai 合作,这是生存的本能,但真正的聪明人会给他划一道红线,我们要利用 ai 的 高效爬虫能力来帮自己省钱。那么我们在什么样的情况下可以用到这个切问的 ai agent 呢?什么样的情况下不要去使用它呢? 记住这套决策权的分配标准就可以了。如果是在确定性比价的场景下,你要疯狂过去用它。比如说我们要去买一个具体的型号的吹风机,或者你去订一张飞往上海北京的机票,那么这种价格是透明的, 所以你就让 ai 去给你全网,去扫货,去各大平台去给你抓数据,比价格,抢优惠。那么这个时候 ai 就是 你的兵,你在利用它的算力在帮你去省钱,打破这个信息差。但是如果是在模糊性的推荐的场景下, 你必须要亲自动手,比如你想找一家好吃的餐厅,或者你想去选一款适合自己的护肤品,这个时候呢,我的建议是你要慎用了,因为这种需求没有标准答案,而 ai agent 的 背后介入的是 谁给的广告费,他就会把它推给你面前。所以一旦你把喜好跟审美交给算法,你就成了被喂养的宠物,推给你的就不是性价比,而是它的利润点。 真正的顶级思维呢,是我们把 ai 当成手脚去延展效率,而不是把它当成大脑去托管。人生 回归 ai 的 实用价值,拿回你对金钱跟生活的手动控制权。我们不要让技术解放了你的双手,但是在无形中去掖割了你的思考。如果你现在还是一直被算法牵着鼻子走,那真的是时候要重新审视你自己了。

入口即权力,权力即分发。朋友们,我直接说结论,千问这次更新,本质上是阿里在抢夺 ai 时代的意图入口,谁能在用户开口的第一秒接住需求,谁就能吃掉后面整条价值链。这事得从信息论的角度聊。信息论创始人香农老爷子告诉我们, 通信的核心问题是如何在噪声中精准传递意图。过去十年, app 就是 噪声,你想点背擦背,得先解锁手机、找到外卖软件、搜索店铺、选规格、填地址、发优惠券、确认支付七个步骤,每一步都是信息损耗。现在千问说,主人,你 只要说,帮我点杯奶茶,剩下的我来。一月十一日, google 和沃尔玛官宣 ai 购物合作,沃尔玛新 ceo 放了句狠话,从传统搜索到 a, 这次主导的购物,这是零售业的下一次伟大进化。听着很唬人,但千万已经在国内把这事做成了,还顺便接了高德飞猪、 支付宝。一月十二日 andropica follow cloud co work, 主打帮你处理工作上的事,整理文件夹、收据、转表格、笔记,生成初稿,说白了就是不用写代码的 cloud code。 一 月十五日,千问微度测试办公助理直接把淘宝闪购、高德飞猪、支付宝全塞进去了,你品你细品, cloud 帮你处理工作,千问帮你处理生活。工作是虚的,生活是实的,能帮你花钱的 ai 才是真正的超级入口。阿里的商业场景太丰富了,淘宝、天猫、钉钉、 高德花客。如果千万能打通这些区块 gbt 根本没法比,因为区块 gbt 只是一个产品变成模型。千万背后是一个生态。说实话,已经很多年没见过阿里这么多业务单元形 成合力了。淘宝给 api, 闪购给履约,高德给 lbs, 飞猪给 ota, 支付宝给支付币,还这叫什么?这叫组织商检。对比一下 bat 三家的打法,字节做豆包,手机助手走 gui agent 路线,让 ai 像真人一样操作屏幕, 想象力很足,技术力满满。但实操下来,现在最大问题是慢且失败率高。更主要的是现在动了太多公司的蛋糕,被各大 app 一 一封禁。阿里自己的生态自己打通, api 级对接,稳定可靠,支付闭环端内完成,不需要跟任何第三方谈判。腾讯还没动静,但基本可以预判,基于微信的超级 agent 大 概率会是腾 全村的希望,毕竟微信才是真正的国民级入口。有一说一,阿里这波属于是模型能打加生态能用的双 buff 叠加,千万在多个榜单全球前三,跟 g p、 d、 cloud 一个齐对。模型能力是做 a 政策的地基,地基不行,上面盖再多服务也是危房。 openai 模型强,但没有本土生态,很多国内厂商有生态,但模型差一截,两者兼备的确实不多。除了机票,更让人意外的是千万接入了支付宝的政务服务, 支持五十项民生服务查询和办理。你问杭州户口怎么办护照或者如何给新生儿办医保,他会告诉你能不能办,需要什么材料直达办理入口。 以前办这种事,你得先搜一堆信息,搞清楚,归哪个部门管,去哪个网站办,不同城市政策还不一样。现在一句话搞定 本质,谁站在意图的第一句,谁就拿走后续的一切。朋友们,如果把互联网三十年压缩成一句话,那就是谁掌握了把用户意图变成结果的路径,谁就是最终的王。很多人把大模型当成更聪明的搜索引擎,这是对 ai 的 严重低估。大模型的终极形态是意图 实现器,你说一句话,他帮你执行完整流程,找按钮、找路径、找服务,完成支付。过去 app 是 入口,用户学习成本由人承担, ai 入口把学习成本交给系统承担, 你只需要说人话,入口开始吞掉 app 的 表层 ui, 只把 app 当成后台能力模块分发权,重新洗牌的时刻到了。当然,千万的办公助理目前还在邀请测试阶段,体验上肯定有优化空间,但方向是对的。点咖啡、订机票、查政务,听起来都是小事, 但小事办的顺,才叫真正的能办事。整个阿里被折叠进了小小的千问。二零二六年,超级 ai 应用的第一战开打了。信息时代的权力法则从未改变,控制入口者,控制一切。至于谁能笑到最后,就看谁能在用户开口的那一秒,第一个接住他的意图了。

淘宝外卖、高德、飞猪全面 a g 的 话接入千万 app, 阿里用手九九归一,告诉全世界国际友人 minus, 方向错了。不得不说啊,大模型这个东西的进化速度真的是太快了, 一年前大家还在卷机做模型的跑分成绩,现在呢,从 j u i agent 到 ai 手机帮你办事,成了大模型产品落地的必答题。 前段时间有位公司出售又火上热搜的 minus, 我 们也去试了一下,成功率啊,确实很高。但是回到现实生活中呢, 就只能还是说外企味太重了,门槛高,费用贵,适配的全都是海外的工具,跟国内的工作流语言不通,要想让他帮你解决办公甚至是生活上的问题,用起来还是太不接地气了。那刚好,前文在新版本里就上线了新能力任务助理, 进入了包括淘宝闪购、飞猪、高德等等国内常用的生活服务,一句话就能帮你把事办了。那这期节目,我们就分别让千问和 minnes 来当一天 ai 助理,看看有了办事能力的 ai 到底有什么不一样 体验。打工的一天,早上八点,年关岁尾,正是年会团建的高发季节,新人实习生小婉所在的公司也不例外, 每年团建公司都会订一套文化衫。今年统计尺码这个活就落到了我们实习生小婉的身上。根据前一天发出来的模板,群里已经有四十多个同事已经分别填好了自己的尺码信息,但每个人提交的都是一个单独的文件。 所以我们实习生小婉的任务就是把这四十多个表格里的信息给统计出来。这种重复性的工作,肯定第一时间想要交给 ai, 但是紧接着问题来了, 附件上传数量是 minnes 设计的付费点之一,免费用户只能上传一个附件,这个活他能干,但是得花钱解锁,一个月一百多块钱,快比咖啡钱还贵了。实际上,市面上很多的免费 ai 工具,附件支持数量也没有很大, 因为附件多了以后上下文很长,对于服务商来说,推理成本过于爆炸,所以综合看下来,最高可以上传一百个附件的海量支持。目前在免费模型里面,应该也只有千万的任务助理才可以这样干。然后千万最终统计出来的结果啊,也完美的符合我们提示词的要求。 没有明确的需求,千万还会通过追问的形式主动请求你来补充,不会自己瞎猜。给出结果以后,还会主动的提示你可以调用工具来检查作业,这个执行效果只能说是非常的歹态。虽说开年会终究是小概率事件, 但是他这个能力啊,其实尤其适合老师统计班级学生情况,或者是财务收报表统计数据这一种自己动手干,要干到猴年马月的场景。以前这种需求的自动化,要么你得精通 excel, 要么呢,你得说动领导全公司换钉钉。现在啊,直接扔给千,问出来的结果准确又漂亮。 上午十点,数据统计完毕,实习生小婉顺利闯过了今天的第一关,正准备下楼透透气的他,突然接到了领导的新任务,这次团建不如由你来负责到底。小李喜欢台球,小刘唱歌好听。 张杰每天下了班得先去接孩子,一直念叨着想找一个清吧静一静。而你被领导选中的团建侠, 你的任务是给这次团建策划一个让大伙都开心的活动项目,别太无聊,别太贵,地点也别离公司太远。 别的 ai 也能给你一堆回复,但是需要你一个一个的复制粘贴,去其他网站里再做对比核实,感觉更累了。在这个任务上, maynes 和千万的表现都不错。千万的任务助理根据我给出的信息,反手伸出了一份洋洋洒洒的活动策划文档,充分照顾了三个同事的各自爱好和诉求。 而 minnes 的 反应会更快一些,跳过了小作文的环节,很快从我给出的条件里面综合判断出了轰趴管这个方向。但是千万的优势在于,它可以直接调用高德数据给你准确的地址和预定信息,对于不支持线上预定的店,甚至可以帮你打电话去问。而 minnes 完全不具备帮你预定的能力, 可以和真实事件主动发生交互。这也是千万和 minnes 最不一样的地方。周五十二点, 方案交上去,等领导拍板给 ai 当了一上午的监工。此时此刻,实习生小婉有点饿了, 现在她将面临一个十分艰难的抉择,今天中午吃什么?最近爆痘有点严重,不想吃太油的,但是特别清淡的清食白日饭又实在是提不起胃口。 外卖软件一个一个刷,实在太累。今天这顿饭,他决定也让 ai 来做主。 minas 在 这个问题上又是卡在了最后一公里,他可以帮你搜索店铺,查看菜单和价格,但就是没有办法帮你直接下单, 而千万 app 这一边,可以直接绑定你的个人账户,从淘宝闪购里面按照我的要求给出推荐,直接跳转下单,甚至还可以用券。很快,实习生小婉每每吃上了一顿千万家的饭。下午两点, 实习生小婉提交的团建方案喜获全票通过。但是领导看了看场地条件,发现现场有投影大屏, 于是临时决定这次团建要增加一个抽奖环节,而这需要一个抽奖小程序。现在 问题来了,小碗自己不会写,网上的程序代做也不便宜,主要是一年就有一次领导不批这个预算,网上有人说 excel 就 能做。于是他找到了教程, 发现学不会一点啊,别的 ai 只会吐代码,小婉看不懂。小婉只是个实习生, 公司的程序大哥也看不懂,因为它不是程序,它只是个路过的 it 运维。其实这种一次性小程序在日常工作里面真的会经常遇到, 找人开发太贵,自己先学太慢。所以一个 ai 如果能直接做出这种带交互界面的小程序,那真的是能帮大忙。 minis 和千万在这个任务上完成的都很顺利,但是免费版的 minis 会在生成的小程序上带一个水印,而千万这边啊,就很方便, 真正好的小程序在卡片的右下角可以直接复制链接,不管到时候是用电脑还是用手机投屏,点开就能用。团建需求顺利完成,实习生小婉也离自己的理想工作更近了一步。 那这几个任务体验下来呢?我感觉千万和 minas 最大的不同就是,千万的任务助理啊,更接地气,依靠阿里本身的平台能力,它可以原生接入淘宝闪购、高德地图这些服务,没有用电脑扫码上号导致的隐私和封禁风险。国内的使用场景下, minas 经常需要依赖浏览器, 等待的时间比较长,甚至呢个别需要登录才能使用的网页服务是登不上去的。而千万的任务助理是让大模型直接对接外部工具,原生沟通,用起来更顺畅。总之就是一句话,其他 ai 干不了的,千万能干!当然还有一个很重要的区别就是千万基本上是零门槛, 国内网络就能用。而且啊,目前是完全免费。任务助理的内测资格获取呢,也不算太难,好多朋友在刚发布的时候就马上申请测试,基本上当天就玩起来了。我相信啊,千万这一波上线的新能力,一定会引领大漠星下一步的计划方向, 从动嘴出主意的狗头军事进化成帮你办事的云端助理。好了,那么以上呢,就是本期的全部内容了,如果你喜欢我们的视频,不要忘了点赞、投币收藏,万万爱你呦!

继上篇介绍后,很多小伙伴问这款 cloud code 开源平替 open code 到底怎么用?它不仅能全自动编程,更是拥有读写文件、执行命令权限的超级 agents。 今天直接上实操干货,手把手教你配置下载与安装。官网下载下来后,你会看到三个执行文件壁垒提醒, 目前的 g u i 桌面版我试用后发现有些 bug, 比如无法更改,模型提供商不够稳定,强烈推荐直接使用 c l i 版本,稳定高效,这才是程序员喜欢的。 界面与模型切换,打开后是超酷的终端 ui 界面,按滑动鼠标滚轮可以看到所有选项,点击 connect 可以 选择模型提供商,支持各大主流厂商,如果你有 keep, 直接粘贴即可起飞。重点解析, open code then 到底值不值?这是官方的托管服务, 亮点与槽点并存。首先是亮点,零差价,按模型原价扣费,不赚中间商差价。极速响应,针对 a 级模式优化了上下文速度,免费羊毛自带一些免费模型,零门槛直接用。 但是使用付费模型需预充二十到是预付余额,不是订阅费。支付痛点,国内卡支付可能存在风控风险。试用体验报告,我实测了免费的 grootcodefast 模型速度,写代码确实快到飞起,真的是极速响应,不愧是专门为 a 证模式专门优化过的模型池。但是 让他写个前端,直接给了我 react 的 默认页面,建议复杂任务还是上 cloud 或者 gpt。 后端倒是写了,但是使用了非常简单的实现方式,有些情况没有考虑到。看来 open code zen 里面的免费模型并不能满足日常使用,国内用户怎么玩儿?就没有国外卡, 担心 zen 充值麻烦?别慌,除了 zen, 它支持配置国内大模型或自定义 a p i, 如 deepsea, 阿里同意等,完全适应国内网络环境,想折腾本地模型的也能玩儿。 当然,你如果有顶尖模型的 api key, 可以 直接使用。总结,想白嫖先试免费模型,追求极致体验,建议自备 key 或寻找国内聚合渠道。

你可以想象一下,如果你的 ai 助手,他不光是陪你聊天,还能直接帮你把外卖点好,机票定好,这种体验你会用吗?这听起来有点科幻啊,但好像,嗯,已经有公司在做了。 阿里巴巴那个千问 app 最近不是有个大升级吗?就号称自己是全球第一个能帮你办事的 ai 助手。没错, 所以我们今天就来好好聊聊这个事。我们手头有几份材料,一份是科创版日报做的实测报道,还有一份呢,揭秘了他背后那种特种兵式的开发故事, 我们就一起来看看,这到底是一场真正的电商革命呢?还是?呃,又一个宣传噱头?好,那我们先看最吸引人的部分,他到底能办什么事。嗯, 报道里有个例子我印象特别深,就是点咖啡,你只要对千问说帮我点一杯咖啡,然后呢?然后他就直接呃调出你附近的店铺,帮你选好,确认地址,甚至你没错过那个起送费,他都会提醒你,哇,对,最后直接就支付了, 整个过程你都不用跳出这个 app, 这个体验就很流畅了。其实订机票那个更有意思哦。怎么说?你跟他说要去北京,他不是说嗯直接给你甩一堆航班列表,而是会给你几个方案,就是比如说,一个是性价比最高的, 另一个呢,可能是出发机场离你最近的。哇,那这个就聪明多了,他是在帮你做决策,不只是在执行一个搜索命令。对,就是这个意思。我记得发布会上还有个更夸张的演示,说是一句话,让 ai 下单了四十杯霸王茶几。对对对,有这个事儿。 这个听起来是有点疯狂,但他其实精准的展示了一种能力,嗯,处理复杂定难。没错,就是批量处理。这已经不只是个助理了,快成一个秘书团了。其实这里最核心的一点就是千问那个负责人吴佳,他说的一句话。 他说 ai 在 拥有超强大脑之后,开始长出了能够触打真实世界的手和脚。是的, 这不只是技术展示,说白了是阿里把它最核心的家当就是淘宝、支付宝、飞猪、高德这些全都接进来了。 所以 ai 不 再是一个孤立的聊天框了,它成了一个能调动整个阿里商业生态的。呃,一个总指挥。这个生态优势确实是别家很难比的,不过这种一句话搞定的体验, 他是不是所有场景都适用的?我看报道里记者好像就碰壁了。对,记者试了下,让他买一件羽绒服,结果呢?结果千问就没能直接下单,而是给了一份选购攻略。哎,这个就有意思了, 点咖啡能一步到位,买羽绒服就不行?这背后的技术红沟是在哪?这恰好就点出了整个行业都面临的难题。你想,咖啡、机票这种算是标品?需求很明确对吧?对,但一件好看的羽绒服,这个需求就太模糊,太个性化了, ai 很 难处理,它不只要懂你的审美,还要在那么多商品里做出一个让你幸福的推荐。所以大家现在都在抢这个赛道。是的,你看阿玛宗有它的 rufus, 然后谷歌和蚂蚁国际甚至在搞一个叫通用商务协议的东西。通用商务协议?这听起来很专业啊,是什么意思?你可以把它简单理解成, 呃,电商领域的普通话。普通话对,大家想建立一套标准,让不同国家、不同平台的 ai 和商家能互相听懂对方的指令,这样就能实现无缝的跨平台交易了。我明白了, 所以谁能先解决这种非标品的推线和交易问题,谁就可能抢占下一个电商的入口,就是这个道理。这种压力看来也直接传到开发团队身上了。报道里提到,千问的一带速度 上线不到两个月,更新了十几次。嗯,背后是一种特种兵式的开发模式。是的,你可以想象一下那个画面,上千个工程师在阿里园区里封闭开发, 然后每周一和周五,门禁旁边都堆满了从全国各地飞来的员工的行李箱。这听着就很呃,很拼。是啊,这种模式听起来就像是在一个大公司内部硬生生造出了一个创业公司。这不只是一种管理风格了,你想, ai 竞争的窗口期非常短, 传统那种按部门汇报的开发模式根本跟不像。嗯,所以这种特种兵模式,其实是在用组织上的变化去对冲技术路线不确定的巨大风险。报道里还提到一个细节,说他们的负责人吴佳很少坐着听 ppt, 那 他怎么听回报? 他更喜欢跟团队一起站着,在白板前面推演逻辑。哇,这就说明,在 ai 时代,组织能力和文化正变得和技术本身一样重要。 这么看下来,阿里的千问 app 通过整合自己这个庞大的商业生态,确实是在让 ai 为你办事这条路上迈出了一大步。 我们算是看到了一个一站式消费助理的出行,但同时呢,在处理更复杂的需求时,技术也还有很长的路要走。没错,而且它背后那种特种兵式的内部创业文化和技术本身一样值得我们关注。 最后,留给你一个思考题吧,报道里还提到千问未来甚至能接入政务服务,或者帮你打电话预定餐厅。 当 ai 助手能同时处理你的数字生活和物理世界里的各种琐事时,你最希望他帮你解决的那个最耗费你精力的日常任务会是什么呢?

嗯,上班路上讨论一个商业问题,昨天其实看到千问发布了最新的能力,就是可以通过千问直接去点外卖啊,或者是去看地图啊,目前看这阿里的生态其实相对来说是比较完整的, 那么我呢,其实也第一时间尝试了一下,在办公室用千问给大家点了几杯奶茶啊,其实整体的交互上来说还是非常流畅的 啊,其实在昨天早上的时候,就那会刚起床,其实我就在看关于豆包里面去啊查询一些相关购买商品啊,能够怎样的路径。其实豆包目前的话应该也是可以和抖音商城去打通的,但是其实比如说我在搜索一双 呃篮球鞋,他帮我推荐了一些具体的型号时,我点开呃抖音的结果是它其实是一个列表,就是当中可能是同一款鞋,不同的商家在卖相关的产品。那么这让我们想到未来的话,其实呃关于大模型它如何厂商自己会进行啊,商业化的变现 如何?在搜索的时候啊,排在前面啊,排到比较靠前的位置,比如说啊,从对话里面直接进入到某一个具体商品的这个链接, 其实就会是一个非常重要的交互。那么如果大模型的厂商呢,他自己下场去把这一部分的流量啊变现成相关的这个收入呢?那可能对模型回答确实有失公允性,那么这个时候呢,其实商家还是有必要去进行一些激优的行为的。 那么还有一点呢,就是在机油拿到排名以后,比如我从这个商品点进去,那如果未来他还仍然是一个列表的话,那么列表中的排序其实排在前面的几个 啊?商家呢?那么可能就决定了他能不能完成商业化的这个变现,所以这是啊关于最近的一些思考,那么大家怎么看待这个问题呢?

别再把 ai 当成聊天工具了,让他替你干活。以前的 ai 是 君子动口不动手,但千万这次上线的全能任务 agent, 直接打通了整个阿里生活,他不再是给你建议,而是直接帮你执行。想喝咖啡不需要打开外卖软件,搜半天,一句话他就能自动定位、选品、下单、支付。 这就是生态级别的较为打击。想查社保、公积金,过去各种弯弯绕绕,像是在走迷宫,现在一句话就能直达支付宝的底层服务,效率提升十倍不止。除此之外, 全新的任务 agent 功能,还能帮你打电话、订机票、订酒店等等。看懂了吗?未来的 ai 软件可能只有一个兑换框,你说需求他去执行?交互革命已经开始了。

一到会场就看到阿里动物园都开到千问家里了。事出必有因,原来是千问 app 放大招,直接把淘宝、支付宝、飞猪全打通,从此点外卖、买东西、订机票,说一句就行。看吴家这操作,一句话点四十杯奶茶,千问直接调用淘宝闪购下单端,内用支付宝 ai 付,一键付款,不用跳转,这效率,绝了! 不管是要去高原徒步选装备,还是给爸妈挑带猫家庭能用的扫地机器人,哪怕只说清需求和预算,千万都能精准匹配,直接推荐优选商品,点击就能下单,再也不用疯狂查攻略, 不止购物先问上线四百多项新功能,签证、公积金这些民生服务,一句指令就能解读政策、梳理材料。春节出游、订机票酒店、规划行程、订年夜饭,先问全帮你搞定,还能直接帮你打电话订餐厅。你好,我要定个位置,明天晚上七点半五个人,有位置吗?有位置,需要留个预定电话。 好的,那我这边就定了,客户姓李,您记一下,电话千万这波升级,直接把 ai 从聊天时代拉进办事时代,看起来简单,实际上做 agent 不 容易。 千万大模型抠进能力的大幅提升,使其能实时构建工具。全模态理解能力的突破,让千万能够看懂界面、听懂声音,同时读懂图文报表。最后是超长上下文的处理能力大幅提升,复杂上下文的交付上限。 目前,千万任务助理功能在 a p p 和 web 端开始定向邀测。有了这能实打实干活的 ai 助手,你最想让他帮你办什么事?

我发现很多人竟然搞不清楚 ai 和 ai agent 到底有什么区别呢?一分钟来给你解释清楚。 ai 实际是一个博学的大脑,他擅长理解意图,回答问题并且生成内容。但是他通常是被动的,也就是说你推他一下,你给他一个指令,他才会动一下。 可是 ai agent 呢,是一个能干的员工,他在大脑的基础上长出了手脚,他有一定的调用工具的能力, 能够主动为了一个目标去规划路径并且完成。所以说,我们可以看到 ai 和 ai ai 制最大的区别是自主执行力。 ai 呢,负责提供知识和想法, ai ai 制的负责执行和交付结果。 那你是不是听到这还是觉得一头雾水?那我来举一个非常简单的例子,那么 ai 就 像一本顶级的食谱,如果你问他,我想吃披萨怎么办?他会告诉你面水鸡蛋的比例,也会告诉你烤箱的温度,烤制的时间, 甚至能帮你生成一张看起来非常美味的披萨的图片。但是如果你不动手,这个披萨你永远也吃不到嘴里 啊。 ok, 那 么这个时候 ai agent 就 出现了,你只需要对他说,我饿了,我想吃一个披萨,披萨里面不要洋葱,多放点番茄酱,并且我希望肉可以多一点。 那么 ai agents 呢?就会自己打开外卖软件,它会自动对比几家店的评分以及价格,以及上述你提的要求,店家是否能够满足。避开你不爱吃的配料, 进行下单支付,并且关注配送的速度。最后它会告诉你,披萨已经帮你点好了,现在你可以享用了。

ai 应用有救了呀!重磅!两个好消息来了,一就是文新 app 内测多人多, a 阵的群聊将于一月下旬逐步开放。二就是阿里巴巴对千万的最新更新巩固超级应用战略无敌了! ai 应用这波他就是被商业航天带下去的,他是被错杀的!在里面的兄弟们,咱们坚持住了啊,下周肯定有肉吃,你千万不敢乱动,这个时候你乱动的话很容易两头吃面的啊,坚持啊。