粉丝5.6万获赞10.0万

今天教你用上豆包手机同款的智能体,不需要买新手机,全程本地运行,没有隐私问题。腾讯阿里联手封杀豆包手机之后,昨晚熬夜把这台 redmi k 八零直接改造成为了全自动特工。看好了,我只需要动动嘴,你看,我只需要运行这样一行命令。 ok, 它会自动跳过广告和弹窗搜索对应的机票,然后还会增加限制条件, 会选择默认的乘机源完成提交。到最后一步支付的时候,他会把控制权交给你,所以不需要担心支付错误的情况。 用的就是智普刚刚掀桌子也要开源的 open a do g i m。 底层是风九 b 的 模型,通过 a d b 连接手机,而视觉模型去看屏幕,模拟人的手去滑动手机,全程本地部署数据,部署手机, 你的隐私全在自己的手里。说实话,这个效果巨头们当然会害怕了,只需要输入这个指令,马上就已经在执行了,会自动向下滑动,查看各种咖啡店的咖啡价格信息。 ok, 他 已经选好了一本标准美式最终的结算步骤了,我只需要结算就可以完成。以前的我是流量韭菜,得到 app 里面来回去切换,给各大互联网商付过路费。但现在, ai 让巨头们成为了纯粹的工具人,失去了入口,失去了用户的时长,这不就是在砸他们的饭碗吗? 但是大事是挡不住的,我们不想做重复的动作,不想看广告,不想被反复去折腾。真正的结局应该是 app 们去适应新的规则,跟 agent 共生质朴, 我们每个人一颗种子。而豆 open gm 让我们可以拥有一台只在本地设备运行,只为我服务的智能机。所以要不要把自己闲置的手机也变成跟我一样同款二十四小时在线的手机? a 整呢?保姆级的部署教程已经整理好了,想要的拿走。主页更多 ai 技巧,我是卡,我们下期见。

来了来了,全网都在找的豆包手机同款 ai 工具,智谱开源 autobot 膜给你们找到了,操作简单而且免费,小白也会试用,同时支持安卓、苹果、鸿蒙。 下面我速分享给大家。首先点视频右下角分享键分享复制链接,然后打开这个工具包, 没有的去下载一个就会弹出资源包,没有弹出的去首页输入鱼饼大全,然后打开这个文件包,右下角去保存就可以了。

没有想到都跑手机的朋友们,恭喜你省了三千五,因为就在昨天的时候,支付把它的 autgrm 开圆了,它可以直接机关你的手机屏幕,替你思考点击输入场景,覆盖了五十多个高频的中文 app, 比如说微信、淘宝、抖音、美团这些核心的场景,它都是可以跑的。 我拿它做了两个小测试,有亮点,当然也有吐槽点。首先第一个点外卖,它是真的可以跑通,比如说你想在美团上去下单,然后到加购,下单路径是很顺畅,你会产生一种错觉, 好像手机里面住了一个非常懂你小助手一样。第二,他的一个跨平台笔架是很实用的,我可以让他对比淘宝和京东同款拖鞋,他能够自己搜,自己去对比,最终给出你的一个结论,这就不是什么聊天机器人了,这相当于一个端侧 a 阵的他真真正正的上桌了。更关键的是什么?他居然很克制, 比如说他碰到了支付或者验证码之类的敏感操作呢?它会自动停止让你接管,很聪明,不会约借。但有一点很值得吐槽,就是现在的形态对普通人是不够友好的,你要用电脑通过 a、 d、 b 去控制手机体验,实际上更像是你在电脑面前远程控制着你自己的手机,就很奇怪。大家如果想要试试,可以找我拿下开源地址 和它的一个部署教程。智普啊, autolm 开源,我想说的是,它的价值不是在完美的体验,而是说它释放了三个信号。第一, ai 手机的异件可能要被打下来了, 以后的 ai 体验不一定要靠很贵的硬件,说不定就是靠的一个开源框架加它的一个端侧的能。第二就是大厂的 for a 阵固城河开始变浅了,开发者和极客们可以直接拆改做出来自己的版 本。第三呢,无障碍和轻量自动化领域绝对是要爆了。对于一些操作是很方便的人群来说,语音加 ai 操作就等于手机自由。欢迎大家评论区留下你的想法。

我已经很久没有在中国的 ai 圈里面看到这么精彩的剧情了,今天呢,我们把这十天里面发生的事完整的给它捋一遍,不完全是为了吃瓜。所以我真的觉得这件事情的背后藏了一些很重要的东西, 关于 ai 的 未来,关于入口之争,关于开源跟闭源,甚至关于我们每个人接下来会用什么样的手机。二零零一年,微软的 ceo 斯蒂夫波尔默,他在接受媒体采访的时候说了一句后来被载入史册的话, lex 是 一种癌症。他还说, linux 在 知识产权上像癌细胞一样,它会附着于它所碰到的一切。 那个时候的微软如日中天, windows 垄断了全球百分之九十以上的电脑操作市场,而 linux 只是一群程序员在业余时间捣鼓出来的一个开源项目, 微软的高管们觉得这玩意儿就是一个玩具。于是微软开始了长达十几年的围脚 linux 的 行动。 专利诉讼有自主 s c u 起诉, ibm 有 散布恐惧、不确定怀疑,有能用的手段全都用上了。结果呢? linux 不 但没有死,反而成了服务器市场的主流。 安卓基于 linux 统治的移动端,云计算的底层几乎都在跑 linux。 二零一四年,微软换了 ceo, 新任的 ceo 上台以后,说了一句让整个科技圈都震惊的话, microsoft loves linux, 微软爱 linux。 更绝的是,二零二零年,微软总裁布拉德公开承认,当开源在本世纪初爆发的时候,微软站在了历史的错误的一边。兄弟们,这句话太狠了, 为什么要讲这个人,讲这个故事?因为我觉得历史总是惊人的相似的。这几天啊,中国的 ai 圈发生了一件很有意思的事, 不,应该说是一系列很有意思的事。十二月一号,字节,跳动发布了豆包手机助手,二号微信开始封号,三号豆包被迫下线微信操作, 九号智普 ai 宣布公开开源 alt g r m。 短短的十天时间,从一款产品的发布,到大厂的围角,再到另一家公司的掀桌子的那种反击。 说实话啊,我已经很久没有在中国的 ai 圈里面看到这么精彩的剧情了。今天呢,我们把这十天里面发生的事完整的给它捋一遍,不完全是为了吃瓜。所以我真的觉得这件事情的背后藏了一些很重要的东西, 关于 ai 的 未来,关于入口之争,关于开源跟闭源,甚至关于我们每个人接下来会用什么样的手机。 故事正式开始。十二月一号,字节跳动旗下的豆包团队发布了豆包手机助手, 配合中信通讯的那个 m 幺五三的工程样机一起面向开发商发售。说实话啊,刚看到这个消息的时候,没有太当回事, 手机助手这个东西,华为有小 e, 小 米有小爱, oppo 有 小布,自己有豆包很正常啊。但是当我真正看到豆包手机助手的演示视频的时候,我整个人就不好了。 他不只是能帮你定闹钟,他能帮你点外卖,他能帮你订机票,他能帮你在淘宝、京东、拼多多上面去比价, 他能帮你回复微信的信息,他甚至能帮你玩游戏,打升级,你只要说一句话,他就可以自己打开 app, 自己点击,自己滑动,自己操作。这个就跟你花钱雇了一个助理一样,这玩意已经进化成手机界的自动驾驶了。 三六零的那个周教主看完之后发了一条视频,原话是这样说的啊,美团淘宝的高管们可能要连夜开会了啊, 我觉得他说的挺对的,你想想看啊,过去你买件衣服,你得打开淘宝,看首页的推荐,刷信息流,看广告,然后搜索比价,看看哪款更适合你,然后再加购物车,然后再去下单。 现在呢,你只要跟那个手机说一声,帮我找一件两百块钱左右的黑色的内衣,在淘宝京东、拼多多上面比个价格最便宜的那个,帮我加购物车,然后你就可以去干别的了, ai 会帮你搞定一切,你甚至都不需要打开淘宝的首页。淘宝首页的广告位,不好意思,没人看了,美团首页的推荐位,不好意思,也没人看了。所有的超级 app 花了十几年时间精心设计的流量漏洞,被 ai 直接绕过去了, 这个才是让大肠们睡不着觉的一个最根本的原因。大肠反击率先出手,豆包手机发布以后,资本市场先沸腾了, 十二月二号,中信通讯直接涨停,成交额超过一百三十七个亿。那台三千四百九十九的工程样机在闲鱼上被炒到六千多块钱。但是就是在同一天晚上,有用户发现自己的微信被封了,提示是登录环境异常。 而这些被封的用户有一个共同点,他们都是在豆包手机助手上在操作微信 消息传出去以后,社区里面一片哗然,有人说这是定点打击,有人说这是大场围殴的开始。 中国企业家杂志去问回应时没有什么特别动作,但行业里面的人都懂,这次封号只是第一枪。果然,紧接着淘宝也出手了, 用户发现用豆包手机助手在淘宝上比价的时候,会频繁的跳出人机验证,有的是直接闪退,有的被强制登出。再然后,农行、建行的 app 也开始出现针对性的封控措施,在录屏状态下,银行 app 直接不让用了。你看啊,这就是大肠的反应速度。七十二小时之内,微信、淘宝、银行三道防线全部加起来了。 周鸿祎预测的没错,大厂绝对不会坐视不管的,接下来会展开技术攻防战。 三日的晚上,豆包手机助手团队发了一条公告,原话是豆包手机助手 pro 模式已经下线操作微信的能力了,在 m 幺三五样机上被禁止登录的微信账号正陆续解封,请大家耐心等待。说实话,看了这条公告的时候,我是有点失望了, 但是我也理解,毕竟啊,微信是什么?是十多个亿人的社交基础设施啊,很多人的数字生命线啊。豆包,你再牛逼也不能让用户的微信被封吧,这个锅字节他背不起。 更何况,豆包手机注册本来就是一个技术预览版,是给开发者玩的一个工程级字节,从一开始就说了,这不是面向普通消费者的产品, 所以退让是意料中的选择。但问题是,退让之后呢? ai 手机助手这个方向还能不能走下去呢?如果每一个超级 app 都像微信一样,一言不合就封号,那 ai 助手不就成了一个孤岛了吗? 说白了,你就只能在自己的 app 里面玩,出了门你就寸步难行了呀。那这还叫什么智能助手? 我当时觉得啊, ai 手机可能要凉一凉了,但是我没有想到啊,真正的高潮还在后面。十二月九号,就在我以为这个事件要告一段落的时候,智普 ai 投下了一个重磅炸弹, 他们宣布开源 autgrm。 autgrm 是 什么?简单说,它就是智普版的豆包手机助手,一个能像真人一样操作手机的 ai engine, 能点外卖,能订机票,能刷抖音,能发微信, 而且质朴的。这次开源不是一个阉割版啊,是完整的核心模型封 use 的 能力框架工具链,还有覆盖五十多个高频中文 app 的 可跑通的代号。 换句话说,只要你愿意,你现在就可以自己搭建一个豆包手机助手,不需要自己的许可,不需要中信的手机,不需要任何人授权,技术完全公开,代码随便拿。智普在公告里面说了这么一句话,我印象特别深刻,这件事只在一家公司做是不够的, o 的 g r m 开源的第一层初衷是把这一层能力变成整个行业可以共同拥有的,共同打磨的共同底座。 说实话说啊,我看到这句话的时候,我的鸡皮疙瘩都起来了,这什么意思啊?大厂可以围角斗宝,但是大厂没有办法围角整个开源社区。你可以封杀一家公司,但是你封杀不了千千万万个基于开源框架自己搭建的引擎。 这个就叫先做着这场攻防战到底在做什么呢?说到这里,我想聊一个更本质的问题, 表面上看啊,这是一个隐私安全。微信说,你独取我的聊天记录不安全。淘宝说,你抓我的商品数据不合规,银行说,你在录屏状态之下操作有风险,这些理由对不对?当然对,但真正的原因显然不至于此, 真正的原因是流量入口之争。其实你想想看啊,过去十几年,互联网大厂是怎么挣钱的? 答案就是流量。你打开淘宝首页,有广告位,你刷信息流,有广告位,你收商品,还有进价排名,每一次点击,每一次浏览都是满。微信也一样啊,朋友圈广告,小程序广告,公众号广告,视频号广告, 十多亿用户的注意力就是腾讯最大的情况。但现在 ai 手机助手来了,他可以绕过首页,绕过广告,绕过信息流,直接帮你完成任务。 用户的注意力被 ai 截胡了,你说他们能不急吗?这不是什么隐私问题,这是断人财路的生死存亡的问题。 所以封号、封控、限制,本质上啊,都是在保护自己的流量入口。但问题是保护的了吗? 技术的潮水不是一两道防线能挡得住的,开源才是真正的核武器。说实话啊,自古这次开源,让我想起了一句话,最好的防守就是进攻, 不对,应该是最好的反围脚,就是让技术成为公共屏。其实你想想看啊,历史上那些改变世界的技术,最后都走向了什么? linux 开源了,所以我们今天有了安卓,有了云计算, stable future 开源了,所以 ai 绘画才能遍地开。 每一次开源都是一次技术民主化,每一次开源都是对封闭生态的一次冲击。是否这次开源 autgrm 一 是一样的,他把 ai 手机助手的这个能力,从大厂核武器变成了人人可用的工具。 以后不只是自己能有 ai 手机,华为能做,小米能做, oppo 能做,甚至你自己也能做。大厂可以围角一家公司,但是大厂没有办法围角整个开源社区。说到这里,我突然想起了一个故事, 这就是视频刚刚开始,我跟大家讲的微软 ceo 说 linux 是 癌细胞的这么一个故事。为什么要讲这个故事?因为我觉得历史是惊人的相似的。 二十四年以前,微软微教 linux 二十四年以后,大厂微教 ai engine 二十四年以前,微软说 linux 是 癌症。二十四年以后,大厂说 ai 手机助手侵犯隐私。 二十四年以前,莉莉克斯选择了开源。二十四年以后,智普也选择了开源。二十四年以前,微软以为自己能消灭莉莉克斯二十四年以后,大厂以为自己能封杀 ai engine, 结果呢? lexus 没有被消灭,反而成了整个互联网的基石。 ai engine 的 会被封杀吗?我不知道答案,但我知道一件事情,大厂可以消灭一个产品,但大厂消灭不了一个想法。技术的眼睛从来不是某一家公司能阻挡的。 当年的微软挡不住利克斯,今天的大厂一定也挡不住 ai n g t。 那 这跟我们有什么关系呢?说了这么多,你可能会问哦,这些大厂之间的攻防战跟我有什么关系呢?其实关系很大, 因为这件事情的本质是在决定未来我们用什么样的手机。你想想看啊,过去十几年,我们用手机的方式是什么?打开 app, 想买什么东西?打开淘宝,想点外卖?打开美团,想聊天?打开微信,每一个需求都对应着一个 app。 未来呢?如果 ai 手机助手真的普及了,我们用手机的方式可能就会变成,说一句话,你只需要告诉 ai, 你 想要什么,想干嘛, ai 就 帮你搞定了。你甚至不需要知道淘宝跟京东有什么区别,你甚至不需要知道美团跟饿了么哪个更便宜, a i 会帮你比较,帮你选择,帮你下单。这意味着什么?意味着 app 的 界面不再重要了,意味着用户注意力的分配方式要彻底改变了, 意味着过去十几年建立的互联网的商业模式可能要被重写了。这不是危言耸听啊,这是正在发生的事。 ai 手机助手能帮我们做的,是那些重复的、机械的、没有创造性的操作,比价、下单、订机票、查天气、设闹钟等等,这些事交给 ai 就 好了呀。 而我们自己呢,应该把时间跟精力留给那些更难也更值得的事,比如去读一本更难的书,比如去跟朋友聊一场更长的天,比如去想清楚自己到底想要什么。 ai 越来越强大,不是为了让我们变得更懒,而是为了让我们有更多的时间跟空间去做那些只有人类才能做的事情。 这十天啊,我看到了大厂的围角,也看到了开源的反击,我看到了技术的力量,也看到了商业的博弈,我看到了二十四年以前的历史,也看到他在今天的重演。 但最让我感慨的是,还是那句话,技术的潮水终究是阻挡不住的,而我们能做的,就是要学会在潮水中游泳。 二十年以前,卫人说尼克斯是癌症。二十年以后,卫人说,我爱尼克斯。历史总是惊人的相似,而站在历史正确的一边,从来都不歪。如果你觉得我的这条视频还不错,随手帮我点赞、关注、转发,谢谢!

大家好,我刚刚实测完这个豆包手机助手,他这个就这款手机啊,然后呢有一些感慨,这个不得不说跟大家分享一下。第一点是他这个豆包的这个手机助手是可以在后台运行的,他默认是在后台运行, 这意味着什么?这意味着你的手机可以双开了。我给你举个例子啊,比如说你现在看这个是我的台本啊,然后我就直接跟他说话好了,豆包豆包帮我打开网易云音乐,放一首歌,什么歌都行, 你看他会在这个,对,他会在上面最小化,然后一会他都会放歌了,你知道吧?我们先等着 暂停,我们还是手,我们还是我们还是手动关闭吧。 就是你完全可以在一边写台本的时候,一边跟人聊天的时候,一边直接让他去放歌,这是一个双开。然后我觉得这一点是一个非常丝滑的用户体验。还有一个点我们就不演示了,我直接说啊,因为他演示的会比较慢,他能跳广告, 它能跳弹窗,你知道这意味着什么吗?就是你不管打开哪个 app, 我 们有一个 经常的体验是它会出来很多弹窗,有的时候这个弹窗的关闭键还搞得很隐蔽,比如说你以为点这是关,实际上是进入,然后它那关呢?是一个很浅,基本上看不见的一个叉叉在右上角。就我遇到过很多次这样的情况, 我让他再帮我去开那个 app, 他 会跳过弹窗,然后我把我测试的截个图放这就这就是他那个等弹窗的的那个样子, 就是这种体验让我感觉真的就是你就不用再受这个弹窗的折磨了, 他甚至还能帮我跳一些陷阱的一些选项,比如说我很喜欢用他们家去买机票,他们家哪都好, 就是他会在买机票的最后总是会弹出来一个说,哎,先生或者说女士啊,就是说请你 去那个,呃,就是说是否购买我们的商业航天保,呃,这个商业保险产品,对吧?航天保险啊,然后呢,他很激贼,他会把这个是以深色为代替,然后然后否以浅色, 它那个界面也是浅色,所以你就是等着买啊,你输入信息,买买买,到了最后一步啪嚓出来一个深色,你下一身手点上去了,就导致我有几次就买错了。 然后呢,我在使用豆包进行这个实测的时候,它就会给我提示说,啊,你这个 因为他到因为他买机票,他到最后一步的时候他是会让你去支付的嘛,但是他在支付的上一步买保险,那他也提醒我了,说问我要不要买保险,他这个提醒可比那个弹窗要要清晰多了呀,所以说就是这一点让我觉得也是非常的有实用性。 还有一点是他有主见,就是他可以处理一些比较模糊的这个任务,比较模糊的这个要求这里我就不演示了,因为比较慢,我就直接说了。就是我给你举个例子,比如说我们经常有那样的一个场景,是说我不知道晚饭吃什么, 然后呢,我就问他,我说你给我点个晚饭吃啥都行。他问我,呃,你有什么样的这个爱好之类的?我就说啊,离得近的,然后你看着点,这样 他首先他给我生成了四个,比如说猪脚饭,然后这个沙县小吃,然后还有这个麻辣香锅,我觉得都还不错啊,就是他这个选项,然后这个静海的来了, 他给我点沙县小吃,他说你的这个你需要凑单,那你凑单你凑一下吧,我说你随便凑,你就是说说随便凑,然后他就真的随便给我凑了一下,后来我就去回看了一下,他那个凑单的商品有很多,比如说有丸子,有这个鸡蛋 啊,还有这个,比如说这个,呃,这个荷包蛋,还有香肠,他就给我选了卤蛋,还有这个豆皮之类的一个选项,就他是有这个主观的,这个有主见的, 知道吧?这一点就免去了很多这个日常的选择,你知道吧?比如说你跟你对象说上了吃啥,他不知道,你也不知道,对吧?然后这时候哎,还说了,我知道,我知道,我给点建议,对吧?这点他就显示他有点情商在里面,而且更可怕的是他还有记忆, 我第一次选的是猪脚饭,然后我第二次测的时候,我就跟他说,我说啊,第一次我在这个便签里我写了一个说我想吃猪脚饭,然后我第二次再打开这个手机,我跟他说,我说你想吃啥,他说 他就给我点了个猪脚饭,你知道吧?就他还有记忆功能,就这一点显示的他有一定的智能存在,而且这个智能是很丝滑的,能够切住他的这个功能的,所以说我觉得这点是一个非常好的一个进步。 还有一个点是他可以,就是说他可以去做一个,嗯,尝试不同的流程去解决一个问题, 他解决还解决的还很快,我举个例子啊,呃,比如说我跟他说呢,我让他在 b 站上,因为我看这个华农兄弟的视频,我说你在这个华农兄弟最新的视频上,你给我评论说一句很,说一句很棒, 还有去了这个是我昨天做的测试啊,然后一会我把这个结果我贴到这里,然后呢?他在测的时候呢,我就发现一个问题,是什么? 我当时不知道,因为我很久没有玩 b 站了,就是你这个小号是没有办法去发评论的,你得先经过测试,我那个号就这个小号才二级,才,才那二级不到吗?然后, 然后他就跟我说他的这个任务执行流程中出现了问题,他说你需要答题,我就在底下这个他的这个右下角啊,我,我这个左下角,我补充一下,我说那你帮我答题吧, 他就真的吭哧吭哧点开了那个答题,他在帮我答题,我同事跟我说,你上咸鱼上找别人帮答题,你还得一块八呢,哎,他就真帮我答了,然后他帮我整整花了八分钟答了六十道题,只错了一道, 然后成功通过了 b 站的答题考试,给我在华农兄弟的那个视频上发了一条很棒。就那一刻我的内心是很震撼的,就是我想跟华农兄弟说,我说你们这个评论区的这个评论是 ai 发的 啊,所以说它的这个诸如此类的功能确实是给我带来了很大的这个震撼。 当然了,他有一定的 bug, 比如说我让他去买这个明天从天津到北京的这个火车票的时候呢,他的方式是他要先进那个软件,然后去挨个的去搜明天有哪些车次是从天津到北京的, 因为天到北京的车次实在是太多了。然后他截图,我看着他一个一个截图,他从上午五点钟开始,一直截到晚上八点多,然后他说这个因为这个好像是任务量太高,他就自动终止了,然后就跟我说抱歉,我没有完成这个任务 啊。还有一个是我让他去上这个音乐的这个软件,上去帮我去搜集某个歌手的传唱度最高的歌曲,然后他搜了一个那个歌单,第一个,但并不是点赞量最高的,也不是流量最高的,就他这点也还翻车了,但是呢,总体来讲吧,我觉得是瑕不掩瑜 的。嗯,然后呢,我想再简单的说一下,就是他存在的一些问题吧, 大家发现没有,就是刚刚我的这个演示出现了什么问题?有两点。第一点呢,就是最近大家很多人都在说的他在他这个手机啊,是一号推出的,在三号遭遇了第一个危机,就是说呢,微信先退出了, 然后呢,可能说官方说法是可能触发了这个,呃,这个就是风控的机制,对吧?然后后来很多的 a p p 也都呃,可以说是没有办法用 ai 使用了。然后呢,在五号的时候,豆包也是主动地限制了一些 a p p 的 使用, 比如说像银行的,比如说像这游戏刷分的,它会限制这些的使用,对吧?这一切的背后呢,可能是存在了一个就是说隐私安全的问题,比如说因为豆包,它包括豆包也好,实际上所有的手机 i 助手不止豆包一家啊,只要你是手机 i 的 助手,那么你的核心能力其实独屏 他的所有操作是通过读取用户的手机屏幕来进行分析的。然后为什么豆包的体验这么的丝滑?是因为他用到了里面的一个叫做 inject events 的 一个权限, 这个权限让他可以在后台使用来进行读屏,那我就很丝滑了。但是呢,在他之前,其实呢这个智普也推出过这个类似的手机助手,他是用了这个无障碍权限,当时他第一版的时候,我记得是他只能在前台我看着他帮我进行点, 这个时候我手机没有办法双开了,对吧?然后呢,可是豆包他解决这个问题,实际上的华为手机可能是也有这样的一些功能,就是这个有这个权限在, 但是呢确实这个权限,那你要说他安不安全,他是存在疑问的。豆包他是已经公开的说了,说我们是首先向用户去进行了这个, 呃,这个公式说我们会用你这个权限,而且我们承诺我们所有的屏幕,独屏的这些功能我们不会储存在云端。 豆包已经做好了这些承诺了,但是呢,像这些你首先就引出了啊,这个其次呢就引出了我们第二个问题, 就是商业问题,对吧?就算是你的这个隐私问题解决了,那么商业问题怎么办法解决, 对吧?比如说我在微信上,或者说我在一些这个金融的 app 上的这些操作,可能涉及到我这个用户他的个人喜好,我喜欢做什么, 然后以及甚至说可能说用户有多少资产,这些本来是只有那个 app 本身他才知道的,他和用户才知道没有第三个人的,这时候如果说一个手机助手出现来了,他通过读屏知道了用户的一些喜好,用户的一些信息,那么 会发生什么样的一些后果?那你的数据对于那个 app 来讲是泄露了是吧?虽然说他你可能说我没有办法,就说我我是不泄露的,但是他不信呢,对吧?卧榻之侧,岂容他人鼾睡?那我的卧榻旁边问鼾睡了个大场,是吧?那他可能会有这个商业上的考虑。 所以说呢,我也问了很多专家,实际上他目前目前面临了两大问题,一个是安全,一个是隐私。呃,一个是安全, 一个是安全,一个是这个商业的这个护城河的问题。其中前一个或许好解决,比如说我可以通过观测模型的方式,我这个功能,未来随着我技术的发展,我的手机这个算力,手机的算力就可以支撑这么丝滑的手机助手体验了, 不用上传云端了,那么就可以保护用户的隐私了,那么隐私的问,隐私问题或许就可以解决了,但是你怎么样解决这个商业互生合的问题呢? 是吧?所以这就是豆包目前面临的问题。我呢也写了一篇稿子,然后呢,这个稿子二维码可以放在这,我们做了一个测试,我测了这个二十三个主流的 app, 然后发现呢,有十五个是可以用的, 然后八个呢是不能用的,哪八个呢?我们看文章就知道了啊。好吧,嗯,总体来说呢,我认为这个豆瓣首届助手吧,他还是瞎不眼余的,他指明了一个未来的方向,现在也许我们有安全问题,有隐私问题,然后也有这个 呃,商业互成和的问题,我们没有办法调和这个利益。但是未来可能随着 ai 技术的发展,随着用户真的想更方便一点,那么这个趋势是谁也挡不住的。 再加上我今天的测评,我真觉得他怎么说呢?他等于是做出了一个手机助手落地的一个看法。豆包豆包, 给我播放呃,歌曲奇迹在线。 我现在还没法直接播放歌曲呢。不过你可以去网易云、 qq 音乐或者酷狗这些音乐平台搜奇迹在线,能找到毛华峰原唱或者各种翻唱版。 好吧,那我们自己放歌吧。去吧,我是认为未来新的风暴已经出现。

ok, 哈喽,大家好,那么今天呢,想给大家分享两大这个科技热点,那么第一就是近期完成的一个豆包手机,也就在十二月初推出的一个豆包手机,可以说是横空出世啊,那么它,哎实现了一个什么功能呢?系统级的 ai 助手,它能够跨应用的操作, 也就不再像原本的一些智障的 ai 啊,比如说,哎,像华为的小艺,你只能说是,比如说啊,帮我定一个闹钟啊,这种啊,正常的一些简单的任务操作 啊,比如说 siri 啊,帮我定一个啊闹钟啊,或者说是,哎,怎么样的?包括现在啊,对接 chgbt 的 这种啊,哎,苹果智能也不是特别的能够智能,能够真正的操作手机跨应用操作, 所以那么豆包手机推出来的它是真正的能够实现一句话搞定的复杂任务,比如说你跟说豆包帮我去 点一杯味性咖啡,今天下午我要喝,那么呢,它就会实现一个什么操作呢?它会去在美团或说是淘宝闪购上呢,帮你真正的点一杯咖啡,然后呢把支付界面留给你,让你确定, 所以这引来了一个什么问题呢?也就是他被各大厂商所这个制裁了,为什么呢? 啊?为什么呢?因为他可以在后台操作这些音乐,也就说你看不到各大厂商啊的给你推出的广告,比如说他们广告收益会没有会消失,你说动了大厂蛋糕, 所以啊,他们就会以什么以什么名义呢?也就说以一些啊,用户隐私啊,一些 啊,比如啊,淘宝的这些隐私啊啊,微信的一些隐私啊,啊,你无法访问,所以呢,再推出来没几天呢啊,这个手机就无法登录微信,无法访问淘宝,无法打开各大银行的 app, 所以啊,所以智普 ai 啊,决定直接先说他们开源了一个凹凸 g l l 的 模型 啊,可以看到它在 app 里写的是啊,非常的可以说是霸气啊, unlocking 的 ai 风 for everyone, ok, everyone, 注意每一个人啊,解锁这个 ai 手机为每一个人, ok, 所以现在呢,我也是来尝试在 google collabs 上呢,搭建了这个啊, g l m 给大家测试一下这个效果,具体效果怎么样啊?我已经提前测试了一波 啊,现在就可以给大家看一下。这一个呢,是我的手机的一个投屏,利用这个 screencopy 的 一个投屏啊,所以啊,现在给大家看下这个效果。那么我利用了在 哎 grog 上的一个 token 啊,去远程访问,再使用了这个 google lab 来跑它这个模型,因为它需要相当于是非常大的这个 gpu 的 二 i am 啊,所以正常一般电脑是跑不带太,呃,带不动,所以, ok, 所以 我们现在来 撞一下这个摩停, ok, 我 们回车。好,他现在 checking a p s ok, checking 啊,没有问题,所以我们现在来输入一下我们的任务,我们要做一个什么任务呢啊,就比如 打开支付宝的蚂蚁森林页面,帮我收取一下所有能够收取的能量,你现在看它会做些什么操作 好,他现在在思考,我们可以给大家看一下这个就是 google 这个 collab 的 页面的这个输出,他现在他现在 pos 的 一个 message 到啊,他的一个网页端 好,现在点开了,他现在在找系统应用,他现在在寻找支付宝,他现在在寻找支付宝, 他现在要尝试使用浪取来启动支付宝,他启动了一个钱包,哎,就是他无法,他相当于是读了呃 app 的 这种 activity 的 这种启动应用,来啊,用 adb 的 一个命令去启动这种 啊,怎么说?系统啊?这个这个这个 app, 但是它它无法这个启动支付宝的,可能是支付宝有一些啊防护措施,所以呢我们现在决定啊,给它手动启动一下。 ok, 现在我们现在手动呢启动了这个支付宝。 ok, 它现在你可以看到是因为它还留在上一个页面,它点击了一些啊,一些其他的这些东西啊,它是点击的上一个页面的内容, 也就是它实际上是有一些延时,它并没有那么快,因为毕竟要经过一个 grog 的 一个 talk 的 一个内容。然后呢还需要在啊 google 再跑再进行一个中转。好,现在它相当于是通过了各方面找到了这个蚂蚁森林的这个页面。啊, 那他现在在进行一个什么操作呢? duration 是 一,是应该是一秒吧,你带一秒。 好,他现在五克和三克。好,他现在把我这个五克能量给收收掉了啊。 ok, 没有问题,现在他在搜索这个呃,页面发生了变化。 ok, 看我怎么没有看到什么,走过路过不会白费,可能刚刚出现。哦,好,他刚刚把十二克能量应该也点点击掉了,这里消失了,这里这个十二克能量消失了 啊,它相当于是,哎总能量啊,它没有,它总能量也增加了一四九八啊,从四八一增加到四九八, 但是他并没有去找能量啊,去啊,别人的那里去偷。不过呢,这已经其实非常不错了。这已经非常不错了。好,那么我们现在,哎,让他来干什么呢? 帮我, ok, 帮我去 web 上点一杯咖啡。然后呢?要什么呢?要加冰,呃,不加糖。 看一下呢,它会给我们选什么? coffee, ok, 它现在会做一个什么操作?它能否识别这些国外的应用呢?因为这毕竟是一个国内的厂商做的这个内容。 ok, 而且他现在在退出啊,他,现在,他现他应该并不知道这个 grab 是 什么东西啊?他应该并不知道,因为这毕竟不是一个主流的,其实并不是一个非常主流的一个 app。 ok, 所以 我们现在决定啊,给他这个。好吧,他,哦,也行吧,也行啊,虽然说,呃并没有达到我们真正的这个目的。在真正正确的 app 上去搜索这个 咖啡。 ok, 而且它是以中文的形式啊,他应该无法访问这个。哎,国外的 app。 好,他现在给我打开这个美团外卖。 ok, 现在他会点击什么呢?他会点击什么呢? 好,点击允许,他现在应该还会点击叉,点击一个拒绝关闭这个弹窗搜索咖啡,点击叉的按钮来关闭。它非常聪明啊非常聪明啊, 就是并不是非常完全的像系统级应用那样,像豆包 ai 那 样。呃,那么丝滑的去运转,所以现在还需要让我登录。 哦,它现在还出了一些问题,据说它,呃识别屏幕的速度呢?它并没有特别的快。 好,他直接搜索咖啡,现在来到这个需要登录这个页面。好,未登录也需要登录账号已继续任务。好,他点击了自动登录 搜索美食。好,它搜索了美食,好吧,它其实还还是有一个这种延时在里面的。延时在里面啊,但是它已经正常的搜索了啊,搜索咖啡 啊,还是能搜出来的,还是能搜出来的? 还是能搜出来。 ok, 但是它并没有,就是说点单的这些选项啊,它并没有点单的这些选项, 所以它做什么呢?好,它已经停止了这个操作它已经停止了操作。 ok, 我 们现在打开这个,手动给它打开这个 grant, 给它看一下能否去。哎, sorry, which my grant。 core 七,帮我搜索 red, 看下它能不能真正的搜索。 它确实是有一点小延迟啊,一点小延迟速度并不是特别的快。我现在输入 red, ok, 然后呢?它会帮我打开它吗?它会,比如说它会记住我们的上一个任务吗? 应该是两者之间,我觉得应该是应该隔隔开的。 ok, 它,它确实打开了。 ok, 啊,还是比较聪明的还是比较聪明的。 ok, 它直接识别到了英文,那么川就是给大家转换到了这个英文页面。 ok, 看一下它会帮我们选什么?它想要的 coffee, ok, dismiss 的 demo。 好 吧,它现在并没有。就是说啊,点击其他区域去啊,去跳过这个页面啊,所以呢,我需要手动地去 locking 一下,或者说,是 啊,筛选一下这个页面。 ok, 所以 我点击 log in, 看一下它会怎么做呢?我利用这个指纹去 log in, ok, 我 帮它 log in 之后,帮它来到这个界面,它会做什么呢?我们给它这个页面 all right, 你 点击了 ben, 它实际上还是在上一个页面。哦,它其实实际上还在上一个页面,也就是说它这个识别页面的速度啊,它识别屏幕的速度啊,并没有特别的快。 ok, 它现在来搜索了,这个搜索框。 ok, 搜索 coffee, 好, 它现在,哎,你你,你想干什么? ok, 你想干什么 好?它其实上它市场并没有,就是能够完全的去搜索,这个实际上还是有一些啊,这个困难的。 ok, 你 可不要真给我打上车了哦。 ok, 所以 的话呢,它还是需要有一些适配,或者说是进步的一些空间啊,它并没有像豆包那么智能,那么系统级的应用。 ok, 那 么所以这期测测试品的话呢,就先到这里。

从豆包手机被封杀到智谱开源先桌,仅仅十天,中国 ai 圈最精彩的攻防大战来了。先给大家列一下时间线。十二月一日,字节跳动发布了豆包手机助手。十二月二日,绿泡泡开始封号。 十二月三日,豆包被迫下线绿泡泡操作功能。十二月九日,智谱 ai 宣布开源 auto g o m。 整个事件流程呢?在十二月一日开始,字节跳动,豆包团队联合中青推出了一款豆包手机助手。你一听可能觉得不就是手机助手吗?可能各家都有对不对, 但是一看完演示,很多人睡不着觉,他能帮你点外卖、订机票、比价格、回消息,甚至可以替你玩小程序的小游戏,你动动嘴,它就可以自动帮你操作 app, 就 像给手机装上了自动驾驶。这意味着什么呢?过去我买东西需要打开淘宝刷首页,看广告比价。现在呢,你只需要对 ai 说,找件两百块以内的黑色卫衣,淘宝、京东、拼多多比上价格, 然后最便宜的价格就没事了。 ai 呢,它绕过了所有的首页广告以及信息流平台,花费了十几年搭建的流量漏洞瞬间就被穿透, 这才是大厂真正的危机。果然,反击来了,十二月二日,有用户用豆包操作绿泡泡时,账户被封。随后呢,淘宝频繁的跳出人机验证,银行贷在录屏的状态下也被限制登录。七十二小时内,微信、淘宝、银行三道防线全部筑齐。 十二月三日晚上,豆包手机助手团队发布了一条公告,原话是豆包手机助手 pro 模式已经下线,操作,微信等在 m 幺三五上被禁止登录的微信账号正在陆续解封, 请大家等待一段时间,并尝试重新登录。这一步退让呢?其实呢,在很多人意料之中,毕竟豆包 ai 再牛,微信被封,这黑锅也不能背啊,这可是十二亿人的社交基础。所以当时我认为 ai 助手这件事情可能要凉了,但真正的高潮发生在后面。十二月九日,智普 ai 突然宣布 开源 auto g o m。 简单的给大家说一下,这就是一个智普版的豆包手机助手,可以操作各种 app, 而且开源的是完整的 app, 用他们的话说,就是要把这一层能力变成行业通用的底座。 什么意思?大厂可以封一家公司,但是他封不了整个开源社区。技术一旦公开,谁都可以做自己的 ai 助手,华为、小米、 oppo, 甚至是你自己,不需要字节的许可, 不需要中心的手机,更不需要任何人授权。这哪是反击啊,这是直接掀桌子。那么问题啊,有人会问,大厂到底在争什么?表面上是隐私安全,但实际上呢,就是流量入口过去啊,互联网生意的本质是什么呢?注意力经济、 首页广告、信息流广告、搜索排名,每次的点击都是真金白银。 ai 助手呢,直接帮用户完成任务,注意力被截胡了,所以商业模式也被动摇。但开源呢,就像一场技术的民主化, 原来只有大公司能掌握的核心核武器,现在是人人可用,技术的潮水终究是难以抵挡。但是这场攻防战和我们有什么关系呢?因为对于普通人来说,他可能直接决定未来我们要怎么样使用手机。 过去十几年,我们是打开 i、 找淘宝、点美团、刷微信。未来可能变成说一句话, ai 可以 帮你搞定笔架、下单、订票,把那些重复的操作可以交给 ai, 而我们或许能够腾出时间去做更多需要创造力,需要人情味的事。 ai 呢,不是为了让人变懒,而是让人更有时间聚焦于人该做的事情上。 这十天呢,我们看到了围角,也看到开源的反击,看到商业的博弈,更看到了技术的不可能。但唯一可以确定的是,技术的浪潮是真的要来了。我们呢,要学会在潮水中游泳,这比筑墙更重要。我是 x, 更多 ai 相关资讯关注我!

就在豆包手机爆火的当下,智浦开源了 auto g l m 手机智能助理项目,让每一台安卓手机都能成为 ai 手机。 auto g l m 通过 a d b 来控制设备,以视觉语言模型进行屏幕感知,再结合智能规划能力生成并执行操作。我用它帮我在小红书上搜索豆包手机话题, 并且收集点赞超过一百的笔记。可以看到,配合一并开源的九 b 小 模型,全程无需人工干预完成了任务。不过目前智能能力还不够,计划后续换成 gemini 三 pro 再试试,看效果能不能更好。