快手研发发现打开壳子啪,直接闪退,壳子也打不开,那想继续用,得走层层审批,真有特殊需求才行。没错,又一家大厂推 ai 神器壳子下手了。这回是快手研发发现直接全面封杀,估计还是合规,安全问题无可厚非。当然快手自己也出了 ai d codeflic, 有 用过的,但我们说说好用不? 那其实快手不是第一个下手的大厂,那早在五月,志杰就发内部邮件分批禁用壳子,微软 suffer 官方理由,安全合规。当然志杰当时也已经出了窍。 不止这些,百度、美团等大厂也在传出类似的动作,国产化正在加速,那自研 ai ide 正全面崛起。那我也希望国产的 ai 越做越好,不然指不定哪天又出现了之前的 cloud 的 断供事件。那你们呢?你是死忠 cos 还是直接换国产 ide? 那 大家现在哪个 ide 用的最多又最好用?赶紧评论区安利一下。
粉丝3.9万获赞38.7万

siri 出来了十三年,还是只能帮你设个闹钟,但是豆包手机刚发布就能帮你自动点外卖、刷视频回消息了,这中间到底发生了什么?为什么一些大厂对豆包手机做了限制?这期视频可能会有一点长,但是你看完的话,相信对于豆包手机会有一个新的视角。 先回顾一下第一代语音助手为什么失败?二零一一年,苹果推出了 siri。 二零一四年,微软推出了 gardener。 二零一六年,谷歌推出了 assistant。 二零一七年,三星推出了 bixby。 这些产品都想帮用户操作手机,但是都失败了,为什么?根本的问题就是它们都依赖 a p p, 厂商主动适配 siri 想操作微信,对不起,微信不给你开接口。谷歌的 assistant 需要 app 实现特定的 intent, 愿意适配的厂商寥寥无几。说白了,没有人愿意给竞争对手开后门,这条路是走不 通的。现在的 g u i agent 不 一样,核心的突破是不再依赖 a p i, 而是直接看屏幕来操作,截图、视觉模型分析、输出、点击坐标、执行操作、循环往复。这一切都离不开现在飞速发展的大模型领域。 二零二五年,这个赛道已经非常拥挤了。字节的豆包手机、揭月星辰的 g e lab zero, 智谱的 auto g l m, 国外有 ansorek 的 computer use, open ai 的 operator, 苹果的 apple intelligence, 谷歌的 gemini, 华为的盘古也都在布局。说说豆包手机的技术架构,来自官方的白皮书。端侧有 n p u 推理引擎和 t e e 的 可信执行环境,本地会跑 o c r 多膜态、大模型等。端侧的优势是低延迟、隐私保护,离线也能用。云端是自洁自研的大模型,部署在机密计算容器里,用的是 s、 g x 或者是 t d x 技术,理论上连 自洁工程师都看不到。用户数据传输用的是双向 t l s 认证,还有端到云的二次加密。白皮书明确写了敏感数据不会参与训练,用完即删。安全方面,白皮书提到了六大类的高敏操, 需要用户二次确认。安全设计确实专业,但是开源方案透明度更高。为什么通用多膜态模型做 g u i 操作效果很差?看一组数据, g b t 四 o 的 准确率只有百分之十 九点六, jimmy 是 百分之三十六点六,而专用的 g e lab zero 四 b 达到了百分之七十三点四,差距非常明显。它的原因也很简单, 通用模型没有学到过,看这个界面该点哪里,坐标精度不够也不理解,下拉、刷新、左滑、删除这些手势。专用的模型用了三千一百四十六个人工标注,动作训练还用强化学习,优化策略,这就是为什么专用模型效果更好。但是问题来了, 一些 app 对 于豆包手机做了兼容性的限制,有媒体实测二十三款 app, 八款是使不动的,限制率约百分之三十五。限制手段从技术层面来说,有很多,检测操作间隔和轨迹规律,人的操作有随机性,机器操作太规律了。敏感页面有黑屏保护,这背后有深层的商业考量。 对于平台来说, ai 绕过了广告和推荐算法,减少了用户停留时间,还能自动比价,直接影响收入。对于 ai 厂商来说,这是 争夺入口和声带控制权的关键战场。对于用户来讲,想要效率提升,但是功能在大部分的时候都是受限的。技术路线对比,系统级的集成体验是最好的,但是最容易被检 测。 adb 方案开源灵活,但是需要电脑,普通用户用不了。无障碍服务不需要 root, 但是权限受限。浏览器 agent 的 跨平台,但是只 能操作外部应用。硬件要求,比如说四 b 模型,需要消费级的 gpu 的 显存,在端侧 npu 上跑七 b 模型十分流畅,还需要两到三年目, 目前是没有完美的方案的。我自己也做了一个 demo, 无障碍服务,加上外部模型 a p i, 最开始使用拉默 c p p, 端测部署太慢了,没法用,改成局域网方案了,能用,但是电脑得一直开着。通用模型的效果很差,不同的 r o m 权限差异大,所以也没有开源的打算。未来有三种可能,第一,系统级整合, 手机厂商内置 ai 助手成标配,苹果、谷歌、华为都在布局。第二,开放生态,厂商开放 agent api, 短期内不太可能。第三,持续磨合,平台和 ai 厂商相互适应,可能持续三到五年。 我的判断是短期内手机厂商各自发展,中期可能会有行业标准出现,长期 ai 手机助手一定会成为标配,但是问题是由谁来主导?关键的变量是端测 npu 何时能流畅。跑 七 b 的 模型预计还需要两到三年,其实很多大厂早就在布局了,这个赛道太重要了,下一代的人机交互入口、用户数据入口、 app 分 发新渠道,你只看到了冰山的一角。最后留几个问题给大家讨论,第一,这种限制合理吗?是保护用户安全还是商业考量?第二,谁会胜出?系统厂商? ai 厂商?还是开源社区?第三,端测芯片多久能流畅跑?七 b 的 模型一年?三年还是五年? 第四,是否需要出台行业标准来规范 ai 操作手机?第五, ai 助手应该有多大的权限?隐私边界在哪里?评论区聊聊你的看法,我会一一的回复。我是寒冰巨魔,我们下期再见!