粉丝34获赞571


哎,你好你好,老板,这 siri 太熟悉了,有没有什么办法一键唤醒豆包的?我想要 siri。 哦,你嫌那个 siri 不 太好用是吧?对,想用那个侧边一键唤醒豆包,就跟 siri 的 功能一样的是吧?对,你这个是十五 pro 是 吧?是,那更简单,来,我教你。首先我们打开这个快捷指令,选择新建快捷指令, 在这里搜索豆包,选择问豆包,我这就完成了。然后我们再打开设置,选择这里的操作按钮啊,找到快捷指令, 快捷指令我们选择领取快捷指令,在这里选择我们快捷指令,设置好的问豆包。这就好了。那我按一下这里的快捷键啊, 豆包豆包。今天的天气怎么样?河北蜀山区十二月十七日周三晴,气温零摄氏度到十二摄氏度,早晚温差大,出门今天一共花了八千四百三,收了四台手机和一个耳机。 第一个是 p 六零 p 八加二五六的,这个后盖碎了,成色很差,这个直接出去同行了。第二个是苹果十三二五六的,这个成色还好,电池有点低了,只有百分之七十五了。 第三个是 iphone 十四 pro max, 幺二八的,这个成色一般听筒这里都掉漆了,边框这里磕缝也比较多。最后一个是 p 七零十二加五幺二的,这个成色还好。然后还有一个 jbl 的 突破 pro 三耳机,这个耳机的降噪功能非常好。

我昨天分享了一下通过快捷指令快速打开多包进行语音通话的方法,最后提到了一个用苹果耳机直接说 say harry, 然后接入你的快捷指令,就能够通过多包语音通话。那今天我换上这个苹果的耳机, 我把 siri 直接唤起我的语音助手,我试了一下,体验特别好,相当于通过这个操作你直接屏蔽掉。需要买一个豆包耳机的操作,可以让你快速地接入融通智能,进行日常的语音通话,特别的方便。 我现在还能跟你通话吗?可以的,我们现在就在通话呀,你那边听起来很清晰,有什么想聊的吗?太好了, 听到你这么说我也很开心。最近不管是生活还是工作都还顺利吗?

siri 帮我写一段圣诞节的祝福,朋友圈圣 诞快乐,愿这个冬日带来温暖与喜悦,愿你被爱包围,被笑声治愈,每一天都像雪花一样纯净美好。大家好,我是演职派教练。 最近啊,豆包手机特别火,从一开始的举世瞩目,到后面各大平台开始封杀他,不单是因为数据安全问题,还有这个争夺入口之争。 我今天反而想再聊一聊苹果手机。其实几年前苹果就已经推出了自己的苹果 ai, 但是呢,这个 ai 呢,在我们大陆不能用。我,我之前虽然已经开箱了最新的苹果十七,今天随我的镜头来看一下怎么获得一个支持。苹果引开了近似的 苹果十七走, 为什么要买港版的苹果十七?就是为了这个我们目前大陆还没有的这个 ipad tablets。 好 了,我终于拿到了港版的 iphone 十七 pro max。 好 吧,当然现在依然是没有现货的。明天要到香港,你提前一天在网站上把它定下来。基本上现在能拿到一提笔的,两提笔的要等两个礼拜, 非常简单也很干净,一下就拿出来了,里面就是一个线, 当当当当,非常非常的好看。呃,我特别喜欢这个颜色。 刚刚拿到港版的 iphone 十七 pro max, 当然第一个时间就是到同样是咱们香港的一个品牌 casey five 的 店里头,选好给他的专用壳,开了很多的壳以后呢,我还是选中了疯狂动城二 这个系列的一款,哎,等了半个小时就帮我打印好了,现在目前还属于限量版。好看吗? 亮黑色的 疯狂动物城二代的小狐狸。钢板的十七放进去。哈喽,你好啊。 漂亮吗? very cool 是 吧?呃,继续关注我的频道, 下一集呢,我们就说一下,用港版的 iphone 十七 pro max 怎么能够连 ethernet, 然后呢?怎么能够连上我最最喜欢的 apple intelligent? 继续期待。拜拜。

北京到上海的机票今天晚上最晚是什么时候? 二零二五年十二月二十日,北京到上海晚上最晚起飞的直达航班为二十二点十分起飞。

最近全网都在吹豆包 ai 手机,我决定不花一分钱用这台普通安卓机手搓一个满血版的豆包。系统底层调用 tmax 获取 root 级权限,顶层接入智普 auto g l m 视觉大模型。这一波我要用代码教厂商做人。测试开始, 我给的指令非常模糊,点一份评分最高的螺蛳粉,注意看!此时我的双手已经完全离开屏幕。 p l o s 正在通过 v o s k 离线模型把语音转成文字,并实时唤醒美团 app。 这不仅仅是模拟点击,它正在读取安卓底层的 app 文件。 普通脚本到这里就卡死了,因为评分最高是一个逻辑概念,不是简单的关键词。此时, auto 咕 n 风九 b 模型正在云端疯狂推理,它需要先找到筛选菜单,理解好评优先的语义,然后在几十个商家里,通过视觉识别对比分数。这个思考过程,也就是你们看到的这个转圈圈, 才是 ai 真正的灵魂决胜时刻。它精准锁定了好评优先按钮,并且自动排除了广告干扰,直接选中了自然排名的第一家店铺, 进店选购下单,行云流水。这波操作的逻辑复杂度,说实话,市面上百分之九十九的语音助手来了,都得歇菜。任务搞定,听觉在本地,大脑在云端,这才是二零二五年该有的 agenc 智能体 元码正在整理,想学的兄弟双击关注评论区,蹲个坑,下一期发不同平台对比价钱的更复杂任务。

siri 出来了十三年,还是只能帮你设个闹钟,但是豆包手机刚发布就能帮你自动点外卖、刷视频回消息了,这中间到底发生了什么?为什么一些大厂对豆包手机做了限制?这期视频可能会有一点长,但是你看完的话,相信对于豆包手机会有一个新的视角。 先回顾一下第一代语音助手为什么失败?二零一一年,苹果推出了 siri。 二零一四年,微软推出了 gardener。 二零一六年,谷歌推出了 assistant。 二零一七年,三星推出了 bixby。 这些产品都想帮用户操作手机,但是都失败了,为什么?根本的问题就是它们都依赖 a p p, 厂商主动适配 siri 想操作微信,对不起,微信不给你开接口。谷歌的 assistant 需要 app 实现特定的 intent, 愿意适配的厂商寥寥无几。说白了,没有人愿意给竞争对手开后门,这条路是走不 通的。现在的 g u i agent 不 一样,核心的突破是不再依赖 a p i, 而是直接看屏幕来操作,截图、视觉模型分析、输出、点击坐标、执行操作、循环往复。这一切都离不开现在飞速发展的大模型领域。 二零二五年,这个赛道已经非常拥挤了。字节的豆包手机、揭月星辰的 g e lab zero, 智谱的 auto g l m, 国外有 ansorek 的 computer use, open ai 的 operator, 苹果的 apple intelligence, 谷歌的 gemini, 华为的盘古也都在布局。说说豆包手机的技术架构,来自官方的白皮书。端侧有 n p u 推理引擎和 t e e 的 可信执行环境,本地会跑 o c r 多膜态、大模型等。端侧的优势是低延迟、隐私保护,离线也能用。云端是自洁自研的大模型,部署在机密计算容器里,用的是 s、 g x 或者是 t d x 技术,理论上连 自洁工程师都看不到。用户数据传输用的是双向 t l s 认证,还有端到云的二次加密。白皮书明确写了敏感数据不会参与训练,用完即删。安全方面,白皮书提到了六大类的高敏操, 需要用户二次确认。安全设计确实专业,但是开源方案透明度更高。为什么通用多膜态模型做 g u i 操作效果很差?看一组数据, g b t 四 o 的 准确率只有百分之十 九点六, jimmy 是 百分之三十六点六,而专用的 g e lab zero 四 b 达到了百分之七十三点四,差距非常明显。它的原因也很简单, 通用模型没有学到过,看这个界面该点哪里,坐标精度不够也不理解,下拉、刷新、左滑、删除这些手势。专用的模型用了三千一百四十六个人工标注,动作训练还用强化学习,优化策略,这就是为什么专用模型效果更好。但是问题来了, 一些 app 对 于豆包手机做了兼容性的限制,有媒体实测二十三款 app, 八款是使不动的,限制率约百分之三十五。限制手段从技术层面来说,有很多,检测操作间隔和轨迹规律,人的操作有随机性,机器操作太规律了。敏感页面有黑屏保护,这背后有深层的商业考量。 对于平台来说, ai 绕过了广告和推荐算法,减少了用户停留时间,还能自动比价,直接影响收入。对于 ai 厂商来说,这是 争夺入口和声带控制权的关键战场。对于用户来讲,想要效率提升,但是功能在大部分的时候都是受限的。技术路线对比,系统级的集成体验是最好的,但是最容易被检 测。 adb 方案开源灵活,但是需要电脑,普通用户用不了。无障碍服务不需要 root, 但是权限受限。浏览器 agent 的 跨平台,但是只 能操作外部应用。硬件要求,比如说四 b 模型,需要消费级的 gpu 的 显存,在端侧 npu 上跑七 b 模型十分流畅,还需要两到三年目, 目前是没有完美的方案的。我自己也做了一个 demo, 无障碍服务,加上外部模型 a p i, 最开始使用拉默 c p p, 端测部署太慢了,没法用,改成局域网方案了,能用,但是电脑得一直开着。通用模型的效果很差,不同的 r o m 权限差异大,所以也没有开源的打算。未来有三种可能,第一,系统级整合, 手机厂商内置 ai 助手成标配,苹果、谷歌、华为都在布局。第二,开放生态,厂商开放 agent api, 短期内不太可能。第三,持续磨合,平台和 ai 厂商相互适应,可能持续三到五年。 我的判断是短期内手机厂商各自发展,中期可能会有行业标准出现,长期 ai 手机助手一定会成为标配,但是问题是由谁来主导?关键的变量是端测 npu 何时能流畅。跑 七 b 的 模型预计还需要两到三年,其实很多大厂早就在布局了,这个赛道太重要了,下一代的人机交互入口、用户数据入口、 app 分 发新渠道,你只看到了冰山的一角。最后留几个问题给大家讨论,第一,这种限制合理吗?是保护用户安全还是商业考量?第二,谁会胜出?系统厂商? ai 厂商?还是开源社区?第三,端测芯片多久能流畅跑?七 b 的 模型一年?三年还是五年? 第四,是否需要出台行业标准来规范 ai 操作手机?第五, ai 助手应该有多大的权限?隐私边界在哪里?评论区聊聊你的看法,我会一一的回复。我是寒冰巨魔,我们下期再见!