粉丝495获赞5351

被 meta 二十亿美元收购的 madison, 全网都在吹,结果我点开一看,普通人想用还用不了,难道通用 agent 根本轮不到普通人? 国内就没有一个每个人都能使用,并且在很多方面甚至不输 madison 的 通用 agent 的 产品吗?经过多轮测试,我发现新版的千问已经走到了这一步。比如我给千问一个很日常的需求,预算两千到三千, 选一个安全好用的智能门锁,它不是直接甩参数,而是直接拆成预算、技术细节、安全性、上门安装等痛点,再结合全网搜索、真实用户评价、全网比价交叉验证,最终给到国补后的最低价格以及最佳的购买渠道。 反观 manas, 它没有电商数据的加持,给出的都是出厂定价,没有办法考虑优惠和国补价格。然后我直接让他帮我点份清淡不辣、适合养胃的外卖, 千万 a p p 里推荐下单支付是一条完整链路,甚至还能语音点外卖、复杂条件、点餐等。这一步他已经不是 ai 回答,而是堪比真人的 ai 助理。而 manna 这边,连我的位置都获取不到,第一步就走不下去。我再给他一个典型连续任务, 明天下午六点,我要去体育中心看演唱会,帮我规划一条路线,找个便宜的停车场看,千万会把路线、时间、 p o i 导航创成一个完整方案, 真的找到了便宜的停车场。这一步很关键, ai 真正走进了物理世界。 max 这边我给了他位置,但他没有整合高德等地图资源, 只是给了我一个单一的价格表,略显敷衍到办公场景。千万也很奢华,我一次性上传了十二个月的电商精英表格,让他做统计,可量化,千万能批量处理,自动校验,甚至三十多种可用图表。接着一句话,帮 我把这套数据直接做成一份能汇报的 ppt 看,这不是草稿,是结构完整可直接下载的 ppt 版本。再让他来开发一个三 d 版的 boss 小 鸟游戏,刚好久坐来活动一下筋骨,用摄像头做救援的视觉识别我手的摆动,让小鸟以第一人称在三 d 空间里飞行。 可以看到 madison 这边代码太结构化了,导致很多问题,试了多次还没有完全跑通。而千问三 call 的 模型的加持下,他具备更长上下文的强大编程能力。 比如通过 ai 手势识别为一跟踪构建物理感知的三 d 游戏场景,我还让它加了互动感的三 d 大 宴,可见它对系统多模块实时的整合能力。可以说,千万已经是一个把感知、决策、行为完全跑通的高级智能体。 如果说 magus 代表的是通用 agent 的 探索上线,那拥有阿里全生态的千万就是一个能把通用 agent 变得免费、人人可用,还能真实办事的 ai 助理。关注我,了解更多前沿 ai 知识!

淘宝外卖、高德、飞猪全面 a g 的 话接入千万 app, 阿里用手九九归一,告诉全世界国际友人 minus, 方向错了。不得不说啊,大模型这个东西的进化速度真的是太快了, 一年前大家还在卷机做模型的跑分成绩,现在呢,从 j u i agent 到 ai 手机帮你办事,成了大模型产品落地的必答题。 前段时间有位公司出售又火上热搜的 minus, 我 们也去试了一下,成功率啊,确实很高。但是回到现实生活中呢, 就只能还是说外企味太重了,门槛高,费用贵,适配的全都是海外的工具,跟国内的工作流语言不通,要想让他帮你解决办公甚至是生活上的问题,用起来还是太不接地气了。那刚好,前文在新版本里就上线了新能力任务助理, 进入了包括淘宝闪购、飞猪、高德等等国内常用的生活服务,一句话就能帮你把事办了。那这期节目,我们就分别让千问和 minnes 来当一天 ai 助理,看看有了办事能力的 ai 到底有什么不一样 体验。打工的一天,早上八点,年关岁尾,正是年会团建的高发季节,新人实习生小婉所在的公司也不例外, 每年团建公司都会订一套文化衫。今年统计尺码这个活就落到了我们实习生小婉的身上。根据前一天发出来的模板,群里已经有四十多个同事已经分别填好了自己的尺码信息,但每个人提交的都是一个单独的文件。 所以我们实习生小婉的任务就是把这四十多个表格里的信息给统计出来。这种重复性的工作,肯定第一时间想要交给 ai, 但是紧接着问题来了, 附件上传数量是 minnes 设计的付费点之一,免费用户只能上传一个附件,这个活他能干,但是得花钱解锁,一个月一百多块钱,快比咖啡钱还贵了。实际上,市面上很多的免费 ai 工具,附件支持数量也没有很大, 因为附件多了以后上下文很长,对于服务商来说,推理成本过于爆炸,所以综合看下来,最高可以上传一百个附件的海量支持。目前在免费模型里面,应该也只有千万的任务助理才可以这样干。然后千万最终统计出来的结果啊,也完美的符合我们提示词的要求。 没有明确的需求,千万还会通过追问的形式主动请求你来补充,不会自己瞎猜。给出结果以后,还会主动的提示你可以调用工具来检查作业,这个执行效果只能说是非常的歹态。虽说开年会终究是小概率事件, 但是他这个能力啊,其实尤其适合老师统计班级学生情况,或者是财务收报表统计数据这一种自己动手干,要干到猴年马月的场景。以前这种需求的自动化,要么你得精通 excel, 要么呢,你得说动领导全公司换钉钉。现在啊,直接扔给千,问出来的结果准确又漂亮。 上午十点,数据统计完毕,实习生小婉顺利闯过了今天的第一关,正准备下楼透透气的他,突然接到了领导的新任务,这次团建不如由你来负责到底。小李喜欢台球,小刘唱歌好听。 张杰每天下了班得先去接孩子,一直念叨着想找一个清吧静一静。而你被领导选中的团建侠, 你的任务是给这次团建策划一个让大伙都开心的活动项目,别太无聊,别太贵,地点也别离公司太远。 别的 ai 也能给你一堆回复,但是需要你一个一个的复制粘贴,去其他网站里再做对比核实,感觉更累了。在这个任务上, maynes 和千万的表现都不错。千万的任务助理根据我给出的信息,反手伸出了一份洋洋洒洒的活动策划文档,充分照顾了三个同事的各自爱好和诉求。 而 minnes 的 反应会更快一些,跳过了小作文的环节,很快从我给出的条件里面综合判断出了轰趴管这个方向。但是千万的优势在于,它可以直接调用高德数据给你准确的地址和预定信息,对于不支持线上预定的店,甚至可以帮你打电话去问。而 minnes 完全不具备帮你预定的能力, 可以和真实事件主动发生交互。这也是千万和 minnes 最不一样的地方。周五十二点, 方案交上去,等领导拍板给 ai 当了一上午的监工。此时此刻,实习生小婉有点饿了, 现在她将面临一个十分艰难的抉择,今天中午吃什么?最近爆痘有点严重,不想吃太油的,但是特别清淡的清食白日饭又实在是提不起胃口。 外卖软件一个一个刷,实在太累。今天这顿饭,他决定也让 ai 来做主。 minas 在 这个问题上又是卡在了最后一公里,他可以帮你搜索店铺,查看菜单和价格,但就是没有办法帮你直接下单, 而千万 app 这一边,可以直接绑定你的个人账户,从淘宝闪购里面按照我的要求给出推荐,直接跳转下单,甚至还可以用券。很快,实习生小婉每每吃上了一顿千万家的饭。下午两点, 实习生小婉提交的团建方案喜获全票通过。但是领导看了看场地条件,发现现场有投影大屏, 于是临时决定这次团建要增加一个抽奖环节,而这需要一个抽奖小程序。现在 问题来了,小碗自己不会写,网上的程序代做也不便宜,主要是一年就有一次领导不批这个预算,网上有人说 excel 就 能做。于是他找到了教程, 发现学不会一点啊,别的 ai 只会吐代码,小婉看不懂。小婉只是个实习生, 公司的程序大哥也看不懂,因为它不是程序,它只是个路过的 it 运维。其实这种一次性小程序在日常工作里面真的会经常遇到, 找人开发太贵,自己先学太慢。所以一个 ai 如果能直接做出这种带交互界面的小程序,那真的是能帮大忙。 minis 和千万在这个任务上完成的都很顺利,但是免费版的 minis 会在生成的小程序上带一个水印,而千万这边啊,就很方便, 真正好的小程序在卡片的右下角可以直接复制链接,不管到时候是用电脑还是用手机投屏,点开就能用。团建需求顺利完成,实习生小婉也离自己的理想工作更近了一步。 那这几个任务体验下来呢?我感觉千万和 minas 最大的不同就是,千万的任务助理啊,更接地气,依靠阿里本身的平台能力,它可以原生接入淘宝闪购、高德地图这些服务,没有用电脑扫码上号导致的隐私和封禁风险。国内的使用场景下, minas 经常需要依赖浏览器, 等待的时间比较长,甚至呢个别需要登录才能使用的网页服务是登不上去的。而千万的任务助理是让大模型直接对接外部工具,原生沟通,用起来更顺畅。总之就是一句话,其他 ai 干不了的,千万能干!当然还有一个很重要的区别就是千万基本上是零门槛, 国内网络就能用。而且啊,目前是完全免费。任务助理的内测资格获取呢,也不算太难,好多朋友在刚发布的时候就马上申请测试,基本上当天就玩起来了。我相信啊,千万这一波上线的新能力,一定会引领大漠星下一步的计划方向, 从动嘴出主意的狗头军事进化成帮你办事的云端助理。好了,那么以上呢,就是本期的全部内容了,如果你喜欢我们的视频,不要忘了点赞、投币收藏,万万爱你呦!

manus 比 manus 收购啊,很多人我看在网上评论说,妈的,中国好不容易搞一家顶级的 ai 智能机公司,被你们美国人搞走了,他妈太不要脸了。对,我们从三月份开始评论,你看最早 manus 出来的时候,它其实就是国外版,国内版其实一直就没有开放。 大家还记得最早它有和阿里巴巴说是签问啊,有一个合作协议,说是未来会推出国内版,但其实国内版好像一直就没有出来啊,因为这个模型的这个原因,海外模型不能在国内运营啊。 那么后来曼纳斯队又搬到新加坡去了,这事大家应该也知道,当时团队不愿意去新加坡的,就直接抛弃掉了啊,这个当时也上了热搜。其实在中美这个竞争下面,其实曼纳斯早就站对了啊,他已经放弃了中国内的融资啊,国内的资本 那么全面选择了去美元,也有很多人说也说他们团队销红比较有魄力啊,这次选择你看现在是不是很快就有结果了? 对,所以对中美 ai 精神的格局来说。呃,前谷歌的 ceo 啊,史史密斯还说了一个观点,他说最早我也认为中国 ai 一定会赢,因为中国他妈太牛逼了,效率太高了。 后来他说可能不是这样的,美国的资本可能效率是更牛逼的,因为他说美国你看可以筹集几千上万亿美金的钱来支持这些 open ai、 cloud 的 这些公司, 你看中国,哎,其实有个观点就说了,中国所有这些 ai 大 中型公司加应用公司的估值也就才几千亿人民币,而且是你看 美国这些 cloud、 open ai 一 家公司就好几千亿美金,哎,算下来就是几万亿人民币了。所以美国的资本市场的这个支持是中国大概一 一百倍吧。但后来也有观点说不对。嗯,中国呢,可能 ai 的 这个效率是更高的,我们可以用十分之一甚至百分之一的钱可以解决问题。这个 deepsea 其实也做了一个证明啊。哎呀,这个事呢,我觉得也不好说,这个资本我不太懂。

为什么科技巨头这么着急收购 minis 呢?我做了一个实验啊,做的让我头皮发麻,我让 minis 攻击一个,我部署在谷歌的系统里面,设计了一个超级复杂的密码,并且呢,我做了安全防护,然后你看啊,我给了指令之后,他会自己不断地尝试各种办法去攻破。 第一个办法,你看他失败了,然后他马上再会换第二个办法继续试,没有人指挥他,他就自己在这迭代优化,然后突破。你要知道,大模型本身就掌握这个世界几乎所有的加密和解密方式,他什么都懂。 但以前呢,他只是个顾问,你问他怎么做,他只能告诉你办法。但是现在呢, minus 给了他一双手,他不再只是告诉你怎么开锁那个人,他可以自己拿起工具自己去撬锁。 那最后结果呢?三分钟就攻破了我这个密码,然后他还能给我一份完整的报告。以前搞网络攻击需要顶尖黑客大量的时间,然后专业技能,现在呢,一条指令, ai 就 能二十四小时帮你不断的去尝试, 他不会累,也不会烦,而且比任何人类懂的都多。所以回到开头的问题啊,为什么这些公司这么着急呢?他们不是在抢一个 ai 工具,他们是在抢一个能把 ai 的 大脑和双手连接起来的开关。