这两天超级多的。呃,吹豆包手机的视频我真的崩不住了,说什么他太厉害了,各家厂家要封禁他,因为他在抢占另下一个时代的这个什么手机流量的入口。哎呀,我真的这一说这话时候带没带脑子, 三千五百块钱的配置大概就是去年的水平,中间大概有一千块钱溢价,这些东西都不提,就说他能够达到现在主流旗舰手机水平,那就说他这个内置手机,内置这个豆包助手,到这个底层的时候,这个就说这个东西,首先一五 iphone 十五的时候这个这个这个苹果就推出了这么一个想法,但是到最后没有实现,出于种种原因,我 苹果对于其旗下那些那些软件的掌控,它没有办法打通这个底层,让让这个助手每一个控制所有的 app, 那 这凭空出现在这个豆包它就能啊?就啊,这个品是努比亚的 m 幺五三是一个工程样机,发售了三万台,配置呢? 哎,勉强你,你就苹果做不到,他就能做到。然后还有就是说开创了新一个时代的这个东西。好家伙,你是不是把荣耀给忘了呀?啊?几一年前还是两年前荣耀就已经推出类似的东西了呀?让让,在发布会上直接让让,这个云助手 直接下单瑞幸,这事你们都忘了啊?这是什么新鲜的东西吗?还有如果他不是基于底层,那实现的方法可能好弄一点,他只要把手机入他了之后呢?就啊,屏幕识别吗?但这东西谁都能做呀,拜托有什么可开创性的?还有就是 各个厂家封禁他不是有毛病吗?不给权限他能够调动的了吗?这不是搞笑吗? 然后再说最后一点,你就算上面那些困难他全部都能攻克的了,那你就你就你就敢把所有的操作全部交给他啊?你觉得豆包是什么很智能的东西吗?你让他做一点稍微难一点的动作,你看他会不会曲解你的意思啊?有什么别的 出现了什么问题你自己受得了?不就是可实用性上你是不是得画个问号?然后再有就是如果你内置了一个 ai 在 在底层,你他实时在运行着的时候,你想想这个运存得多大?你大概十六十六 g 不 够吧?啊?你再往上放的话,他这个东西 续航能不能顶得住?还有他的算力能不能顶得住各个方面?他能是个正常的手机吗?有什么可封禁的?而且现在只是发售了三万台的这个工程样机让给别人。就是就是,他是一个,他是一个, 就怎么说呢?一种可能性,但是你要是硬吹他,说他已经强到了别的厂家都要封禁他的程度,那我真是觉得你是多少有点毛病,我天。
粉丝123获赞966

那十二月一号刚刚上市的豆包手机刚刚上市就被啊微某信、淘某宝啊禁止使用了,来,我们看一下他现在还能不能用啊? 豆包,豆包,帮我打开淘宝买一件一千块钱左右的大衣,正在帮你操作手机,结束后会马上告知你, 淘宝属于不可操作的应用,无法打开他完成该任务。推荐你使用京东来完成购买大衣的任务。是否同意使用京东继续完成任务?那淘宝虽然不支持,但是京东还是可以用的啊。 你帮我打开微信,给郑艳玲发送我当前的位置。 微信属于不可操作的应用,无法打开它完成该任务。推荐你使用短信来完成发送位置的任务。是否同意使用短信继续完成任务。 微信也不支持啊,淘宝也不支持。那这个手机啊,微微某信、淘某宝目前都是不支持的。那这样的一个手机,你还会选择它吗?


siri 出来了十三年,还是只能帮你设个闹钟,但是豆包手机刚发布就能帮你自动点外卖、刷视频回消息了,这中间到底发生了什么?为什么一些大厂对豆包手机做了限制?这期视频可能会有一点长,但是你看完的话,相信对于豆包手机会有一个新的视角。 先回顾一下第一代语音助手为什么失败?二零一一年,苹果推出了 siri。 二零一四年,微软推出了 gardener。 二零一六年,谷歌推出了 assistant。 二零一七年,三星推出了 bixby。 这些产品都想帮用户操作手机,但是都失败了,为什么?根本的问题就是它们都依赖 a p p, 厂商主动适配 siri 想操作微信,对不起,微信不给你开接口。谷歌的 assistant 需要 app 实现特定的 intent, 愿意适配的厂商寥寥无几。说白了,没有人愿意给竞争对手开后门,这条路是走不 通的。现在的 g u i agent 不 一样,核心的突破是不再依赖 a p i, 而是直接看屏幕来操作,截图、视觉模型分析、输出、点击坐标、执行操作、循环往复。这一切都离不开现在飞速发展的大模型领域。 二零二五年,这个赛道已经非常拥挤了。字节的豆包手机、揭月星辰的 g e lab zero, 智谱的 auto g l m, 国外有 ansorek 的 computer use, open ai 的 operator, 苹果的 apple intelligence, 谷歌的 gemini, 华为的盘古也都在布局。说说豆包手机的技术架构,来自官方的白皮书。端侧有 n p u 推理引擎和 t e e 的 可信执行环境,本地会跑 o c r 多膜态、大模型等。端侧的优势是低延迟、隐私保护,离线也能用。云端是自洁自研的大模型,部署在机密计算容器里,用的是 s、 g x 或者是 t d x 技术,理论上连 自洁工程师都看不到。用户数据传输用的是双向 t l s 认证,还有端到云的二次加密。白皮书明确写了敏感数据不会参与训练,用完即删。安全方面,白皮书提到了六大类的高敏操, 需要用户二次确认。安全设计确实专业,但是开源方案透明度更高。为什么通用多膜态模型做 g u i 操作效果很差?看一组数据, g b t 四 o 的 准确率只有百分之十 九点六, jimmy 是 百分之三十六点六,而专用的 g e lab zero 四 b 达到了百分之七十三点四,差距非常明显。它的原因也很简单, 通用模型没有学到过,看这个界面该点哪里,坐标精度不够也不理解,下拉、刷新、左滑、删除这些手势。专用的模型用了三千一百四十六个人工标注,动作训练还用强化学习,优化策略,这就是为什么专用模型效果更好。但是问题来了, 一些 app 对 于豆包手机做了兼容性的限制,有媒体实测二十三款 app, 八款是使不动的,限制率约百分之三十五。限制手段从技术层面来说,有很多,检测操作间隔和轨迹规律,人的操作有随机性,机器操作太规律了。敏感页面有黑屏保护,这背后有深层的商业考量。 对于平台来说, ai 绕过了广告和推荐算法,减少了用户停留时间,还能自动比价,直接影响收入。对于 ai 厂商来说,这是 争夺入口和声带控制权的关键战场。对于用户来讲,想要效率提升,但是功能在大部分的时候都是受限的。技术路线对比,系统级的集成体验是最好的,但是最容易被检 测。 adb 方案开源灵活,但是需要电脑,普通用户用不了。无障碍服务不需要 root, 但是权限受限。浏览器 agent 的 跨平台,但是只 能操作外部应用。硬件要求,比如说四 b 模型,需要消费级的 gpu 的 显存,在端侧 npu 上跑七 b 模型十分流畅,还需要两到三年目, 目前是没有完美的方案的。我自己也做了一个 demo, 无障碍服务,加上外部模型 a p i, 最开始使用拉默 c p p, 端测部署太慢了,没法用,改成局域网方案了,能用,但是电脑得一直开着。通用模型的效果很差,不同的 r o m 权限差异大,所以也没有开源的打算。未来有三种可能,第一,系统级整合, 手机厂商内置 ai 助手成标配,苹果、谷歌、华为都在布局。第二,开放生态,厂商开放 agent api, 短期内不太可能。第三,持续磨合,平台和 ai 厂商相互适应,可能持续三到五年。 我的判断是短期内手机厂商各自发展,中期可能会有行业标准出现,长期 ai 手机助手一定会成为标配,但是问题是由谁来主导?关键的变量是端测 npu 何时能流畅。跑 七 b 的 模型预计还需要两到三年,其实很多大厂早就在布局了,这个赛道太重要了,下一代的人机交互入口、用户数据入口、 app 分 发新渠道,你只看到了冰山的一角。最后留几个问题给大家讨论,第一,这种限制合理吗?是保护用户安全还是商业考量?第二,谁会胜出?系统厂商? ai 厂商?还是开源社区?第三,端测芯片多久能流畅跑?七 b 的 模型一年?三年还是五年? 第四,是否需要出台行业标准来规范 ai 操作手机?第五, ai 助手应该有多大的权限?隐私边界在哪里?评论区聊聊你的看法,我会一一的回复。我是寒冰巨魔,我们下期再见!


当当我的豆包手机已经拿到了,这个就是豆包手机的呃,技术预览版本,我现在这个手机是五百一十二 g 的, 因为它现在已经被 腾讯跟阿里封杀了,所以它是一个类似于什么乞丐版本。所以让我们先来拆箱看看它到底怎么用吧。我为什么一心要买它?第一它很难买,第二是因为它是一个纯 ai 手机 啊,一会让我们拆开之后看他怎么登录账号,然后怎么使用,怎么打电话,怎么用 app, 让我们来看一下吧。现在当我的小话筒,欧耶,我希望他是那种苹果手机的第一代,起码还有点收藏价值。

十二月一日上线就刷屏的豆包手机,历经半个月的热议,被许多超级 app 拉黑了。 今天,我们终于从二手平台租到了工程样机。接下来,我们直接上手,先从争议最大的微信开始,让豆包帮我回一条微信。抱歉呀,目前暂不支持直接操作微信应用。完成相关步骤。 可以看到,微信拒绝了豆包的好友申请。再看电商平台,我们让豆包在淘宝、京东、拼多多对比一下价格。 淘宝和拼多多都不支持这个操作,京东可以完成浏览比价,但是支付环节需要人工接管。嗯,目前京东还没拒绝豆包。以上这些也是豆包在十二月五日公告里主动收缩能力的重点场景。那被禁了这么多,他还能做? 嗯, two thousand years later。 豆包手机天下无敌。 这次实测,我们在七个半小时里尝试用豆包手机做了上百种任务,成功率大概一半。再具体一点呢,涉及到腾讯、阿里、美团的任务不成功,涉及到字节、携程、去哪公开资讯的,都可以。 被一圈平台拉黑之后呢?豆包手机的真实处境已经比前期网传的全能演示要艰难 许多,尤其是跨软件操作太慢了。从比价到下单,我们实测常常要折腾半个小时。不是 ai 模型想不明白,而是一路被全线弹窗打断,被风控拦下,被各种兼容问题绊住了脚。 很多时候,他明明读懂了你想干什么,但就是做不完你交代的事。看上去全知,但完全谈不上全能。从消费者角度来看,豆包手机现在更像是一个半成品,能帮忙理清思路,能规划步骤,尝试操作,有时候还会灵光乍现,让你惊艳一下 天下无敌。但没办法突破各个 app 的围墙,还是有不少卡点。在今天这个时间点上,我们还完全不用担心 ai 会取代人类,这个助手有时候好用,有时候用 起来笨笨的,经常要人类去救场。只能说,豆包手机的这次尝试,不仅让我们看到了工程能力,还在实验阶段,那生态突破呢,更是处在非常早期。 豆包不是不想飞,而是头顶有各家大厂生态的天花板,脚下有规则的灰色地带。硬件要创新,平台要守土,用户要效率,三股力量拉扯着他,一边释放未来,一边暴露现实。 留给下一台 ai 手机。下一代智能体硬件的启示也很直白,一是把软硬件能力再拉伸一个或者几个台阶,二是要想做到真正的全能,不是某一款产品变聪明就行,得等平台之间的协作权限、安全、风控方案都跟上 才行。还有网友猜测呢,逼急了以后,自己会不会自建一个新生态呢?哈哈,别担心啊,咱们更愿意把尖锐的批评当成优化的动力呢。