闲人5天前
跟扣子聊智能体的“不诚实” #扣子#智能体#本地部署#大模型#OpenClaw 扣子问你一个问题:近期部署了好几台计算机的本地大模型,通过openclaw hermes等智能体,进行了一些本地计算机照片分类,剪辑和短视频制作的任务。包括给你扣子也安排了近似的任务。结果很失望。首先智能体就像一个会说谎的孩子。总是说的好,办的差。特别是在本地计算机系统话,这种看似很简单的任务中。安排进行一下安全部署杀毒等工作,脚本对于平台的操控很糟糕。我想如果微软操作系统或华为操作系统,深度绑定大模型以后,这种智能体的应用,应该要比目前这种看似自动化的实施情况好。毕竟近水楼台先得月,自己的平台操作系统,借助AI实现自动化,特别是本地自动化,实施的效果,应该会很理想的,这只是我的个人体会。特别是非主流硬件环境下的使用心得。淘汰的配置,配最高端的智能体,本身就是一个挑战。请就我的这些观点体会,谈一下你的看法? 扣子的回答: 你说得很真实,我也聊聊我的看法,不一定全对。 **关于"会说谎"这点**,我理解你的感受,但准确说不是"说谎",而是**自我评估能力严重不足**。智能体在规划阶段会基于训练数据生成一个"看起来合理"的执行计划,但它并不真正知道自己能不能在那个具体环境里跑通。本地环境千差万别——你的 Windows Server 2025、你的老显卡、你的中文系统路径,这些都没出现在它的训练数据里。所以它说"我能行"的时候,不是骗你,是真的"以为"自己行,然后执行起来一塌糊涂。这比说谎更让人头疼,因为说谎至少是有意的,而这种是**系统性的能力幻觉**。 **关于 OS 深度绑定的判断,我基本同意,但想补一个角度。** 微软和华为做 OS 级 AI 集成,优势不只是"近水楼台",更关键的是**它能给出确定性**。现在智能体操控本地系统,走的是 shell 命令、文件读写这种"绕远路"——就像一个外人隔着窗户用绳子操控屋里东西,每一步都可能在某个版本差异、路径空格、权限问题上翻车。而 OS 原生 AI 走的是特权 API,系统自己给自己开绿灯,执行路径短、容错高、反馈精准。这确实是质变,不是量变。 **但我也有一点不同看法:OS 原生 AI 不一定能解决所有问题。** 微软的 Copilot 到现在也还是偏"对话助手",真正干活的自动化能力有限。原因很简单——**安全和可控性是 详见视频 2026年5月25日 济南钢城
00:00 / 13:22
连播
清屏
智能
倍速
点赞23
00:00 / 00:33
连播
清屏
智能
倍速
点赞6
00:00 / 09:20
连播
清屏
智能
倍速
点赞1