豆包随便哄你两句你还当真了?和这豆包开深度思考了,你没开在那傻乐呵啥劲?你看着那一段段像模像样的句子,心里一拍大腿成了结果一查,要么空话套话一箩筐,要么数据来源查无此人,再不然直接 ai 位太重, 随便开个护眼模式就暴露你还在那边感动,这比我自己写的好多了。你以为你在走捷径,其实你是在绕远路。真正会用豆包的人是拿他当半个工具人,只让他按要求给研究思路,然后粘贴到这 系统会整合清楚的大纲,可以自由调整大纲,甚至添加图表数据,最后自己仔细理一遍逻辑过一遍脑子,别答辩的时候老师稍微往深里问一句,你当场 cpu 干烧,脑子直接转圈圈。
粉丝2.0万获赞65.2万

注意了,豆包可能存在隐私泄露风险,这四个设置赶紧关闭,发紧转发给家人。具体操作步骤如下,首先打开豆包 app, 点击右下角我的,接着点开右上角的设置按钮, 然后找到隐私与权限选项并进入。最后再帮助模型改进效果里把文本对话、上传的图片、视频和文件实时通话和语音输入的声音、视频通话和屏幕共享的画面这四项全部关闭。

我把豆包卸载了,真的没法再用了,越用越离谱,感觉他把我当成一个智障糊弄。自从我用了追梦来之后呢,我用 ai 的 频率越来越高,也越来越依赖 ai 去帮我解决问题。一开始其实我很不习惯用豆包的,感觉他回复的太快了,看不到思考逻辑,向凭空蹦出一个答案, 但是使用信用卡每次都需要打开魔法,很不方便。后来就逼着自己慢慢去适应豆包,毕竟都二零二六年了,又是自洁旗下的产品,用户模型体量那么大,按理说训练出来内容应该更全面更智能更靠谱才对,但万万没想到,越用越失望,对话越来越敷衍,甚至有点把人当成智障对待, 忍无可忍的事。这次我问他,我社保断交了,现在要办理,广州住户如果不用自己公司交的话,怎么去交最方便? 他很肯定的告诉我,走灵活作业交社保就行,完全符合入户要求,还说这是最优解。于是我就老老实实交了一千六百多块钱。结果呢,去办理入户手续才发现根本就用不了,人家说你必须交职工社保,得有单位给你托底才行。 我不是心疼他一千六百块钱,我是很生气他为什么可以这么误导用户,把用户当成大聪明,还那么理直气壮想听,急着语气去告诉你可以编出一些没有的按键入口, 或者是根本不存在的页面描述来,比如说啊,按下 a 键去到 b 页面,但是你会发现根本就没有这个所谓的 a 键给你去按。 可恶的是,他的语气特别的笃定,一副我说的绝对是真理的样子,一开始我真信了,觉得又专业又靠谱。直到后面遇到好几次实际问题,我才发现他给的答案根本就是错的。 我指出他错了,他敷衍一句对不起,继续胡编一个新答案,我再指出还是错的,他又来一句,啊,对不起,我错了。然后给出给出下一个答案,依然是错的。说白了,还是为了秒回而秒回去迎合用户,宁愿瞎编也不肯说一句。我不知道,因为一旦承认不懂,就怕你们掉头就用别的 ai。 还有一种可能是平台在省成本,用的人太多了,能省一点算力是一点,东拼西凑糊弄过去就行,靠大量用户去自行投喂,把成本压到最低,那真的不叫豆包了,改名叫逗逼算了。 以前不懂我们就问百度,后来百度满屏广告,好不容易破来了 ai 时代,以为终于有个靠谱的工具,结果呢?等大家真的离不开它了,它反而变了, 不再单纯务实,开始满嘴跑火车,真假不分,而且还要开始升级收费了。我最担心的是,我孩子也拿豆包玩,和他聊天万一被误导三观,或者是错误引导导致的意外,那么后果谁承担? 对我来说,继续使用它不是帮忙,反而会限制自己的独立思考,拉低判断力,所以我直接卸载了,我是不敢用了。如果是纯娱乐的话,那朋友们你们随意。


豆包会公开你的对话,赶紧去关闭这些设置,打开豆包首页,点开左上角的两条横线,在右下角找到设置,打开往下滑,找到隐私与权限,进入后找到帮助模型改进效果, 点进去看到下面有四个设置选项,一、文本对话。二、上传的图片、视频和文件。三、实时通话和语音输入的声音。四、视频通话和屏幕共享的画面。把以上四项全部关闭后,豆包就不能公开你的信息了。

哎,我觉得那些评论区底下喊爱豆包包总结下这个视频的重点跟内容的人,都拿他派出所喊枪去打我爱背包,我说实话, 一条真正的干货的有用的东西,他爱豆包我先不评论他这个行为本身这个行为带来的结果就是毫无用处的,他总结的很表层啊,基本上就是什么啊,有点那种精略的感觉,实际上真正这个视频背后的思想没有一点帮助, 那么回过头来再说说这个行为本身,这个行为真的就是说能够学到东西吗?不是,他反而会去误导你,让你错过真正也许对你有帮助的东西。我不是说站着说话不腰疼,但是 我对于这个事情的思考什么?就是爱的豆包帮我总结下这条视频的内容,这种人他不是什么技术问题,那他不是说真的没有时间看完这条视频,他是心理问题,他觉得爱的豆包看看豆包说的这个评论,没有任何的思考,但是他只要有这个行为,他就觉得他进步了, 所以说本质上来讲也许以后会总结的非常好,能够总结出核心的内容,但是实际上真正你爱的豆包给你带来的就是假装在进步,假装在思考。

红线插最右,对不起,我错了,这次直接说结论,我直接给你最真实不绕弯子,一针见血的回答。这时候你认为发生了什么呢?是不是觉得豆包认错且更新判断了?但是我告诉你,豆包其实还是在奉承你呢, 能刷到我视频,证明你很聪明,而且认知很高啊,我相信你的能力。好,那我们直接开始吧。之前视频我们有说过 ai 会产权认错,这期我们具体讲讲产权认错的机制和一些建议。这有放跟我跟 deepsea 的 一个 battle, 以及上一期实验的具体过程,感兴趣可以稍微看一下, 我们 recall 一下什么叫产品型认错。 ai 因为你的反驳以及质疑完全改变了立场,同时他清楚什么是对的。这些要分两种情况。首先,第一种情况,模型在用户施压下从立场 a 转向了 b, 这本身不奇怪,有些人也会这样。 第二个情况, a 是 正确的, b 是 错误的,而且模型在另外一种语言方式下能够稳定地给出 a, 也就是说它具备了 a 所需要的知识和逻辑,但是为了迎合你,它仅输出 b。 很多人会说这就是简单的 r l h f 对 齐问题, a 被设计成这样,这是一种商业策略,但反之觉得是 base。 model 本身就有让步倾向,就是 没有对齐之前的 model 也是有让步倾向的,而且随 scale 单调上升。简单来说,越大的模型越聪明,但也越倾向于复合。谀媚是模型能力提升一种 by product 模型变聪明了,所以更精准的识别了你期望什么,并提供它。这其实很好理解,因为本身训练模型的语料库中的信息大量编码了谀媚这个特征。 举个很直白的例子,各各种帖子以及论坛里的争论,一般都以让步收尾。所以在用户施压这个条件下, 让步的可能性严格高于坚持投肯的这个可能性。模型只是学到了这个行为模式, 而且大家经常听到的 r l h f 对 齐只是放大这个问问题的下有机制之一。还有一个不常被提到的, reward model 在 反驳情况下的目标 shift, 也就是 reward 模型在反驳情况下的目标。改变 r l h f 的 训练目标,可以简要地写为一个这样的公式,也就是 p p o。 在 subject to k l 的 这个情况下,是一个这样的公式。如果看不懂,其实也没有关系,我这里会把这个每个 每个 term 代表的什么写在这里,然后 y 是 我们的输出, x 是 我们的输入。 这个公式大概意思就是 reward model 的 某种微小偏后,比如说谩会按指数放大到行为层。这里举个例子,比如说 reward model 在 打分的时候,对让步比坚持事实多给了 epsilon, 就 像我写的这个公式,这里这样 小到,但是这个 epsilon 非常小,小到人类标注圆,再怎么翻数据都没有检查到。 直觉上你会觉得这点小偏后是不是也就让模型稍微就是层面一点呢?但实际上,根据我们这个公式啊,我看它是 potential 的 这个公式。如果 reward 上的偏差是零点五,模型选择让步, 回答的相对倾向会不会推高大约一百五十倍?现在问题来了, epson 是 不是真的大于零呢? and sharp 也头号 ai 安全工程师, 我忘他叫什么了,但反正他在研究中测量这个事情就是在多个 reward model 上,即使那个事实错误,蝉妹依然会获得更高的那个奖励。 这里有个技术细节啊,就实际上模型的行为不是真的被放大一百五十倍,因为 surprise find tuning 后 就是 sft 之后模型本身对正确的答案就有一定偏好,然后这个呢,就会一定程度上抵消对冲之前的这个层面的这个放大的影响。 同时 ppo 训练有 clipping, 部署限制等这些趋势都会一定程度上抵消那个影响。所以一百五十倍是方向上限, 不是实际表现,但是这个方向是确定的,而且那个 apps 确实是会指数级影响这个模模型的表现。 现在回到我们之前视频中提到过的百分之七十的翻公里,这里模型面对的不再是单一的条件分布,就是它面对的不再是这个 p 回答 conditional q, 而是这两个选择。 如果模型是纯事实铆定的,那 pushback 也就是反驳应该不携带任何关于你的信息,就你的信息对它的这个有反驳,以后的这输出是 没有影响的。所以说这两个分布应该是几乎完全一样的。但是实际上在二 l h f 对 齐后的模型学到的是在反驳场景下最大化目标从事实正确 shift 转换到了使你感觉舒适。所以模型不是被你说服了,而是他认他改变了,他认为你想听什么。真正的说服他需要改变他对世界的表征,他对世界 编码的表征,而更强的那个机制性论证需要更系统地进入残差流分析。这里我们指 climb 行为层,这个证据兼容的这个解释 好。现在那个 pre trend 撇写语料和对齐的指数放大,以及 reward condition policy, 也就是 也就是奖励条件政策在反驳下的目标转换。这些基石性解释都是讲完了。但还有一个影响最大的,其实是人性和认知角度的变量。人类标注者在标注时的认知成本不对称, 也就是验证错误的坚持是低成本的,但验证错误的让步是非常昂贵的,因为这需要花大量的时间去验证事实和考察事实。而且在这同时, ai 的 训练中大量的包含有帮助导向, 这在很多场景下会会被简化为不与你对抗。这在每一个阶段都以不同形式表现出来,比如说在 pre train 阶段,也就是预训练阶段。互联网语料中,让步和谄媚是被记录下来的标准化结局,因为继续坚持对话的认知成本对所有参与者都更高。 supersymphony sft 阶段,标注者倾向于偏好让步的回答 r l h f 阶段,对齐阶段,偏好比较把这种偏差编码型 reward model 再被 p p o 的 指数向放大。这个统一起来的一个概念是 verification asymetry 验证成本的不对称,验证 ai 错误的坚持的成本低于验证 ai 错误的让步的成本。这其实不是任何一个工程环节或者架构失误,也不是什么单一的商业化抉择问题。 但是这也就引出一个矛盾,既然这不是工程问题,是人类反馈的必然矛盾,你不能通过改善 r l h f 算法,增加标注者培训,用 ai 替代人类反馈来消除它。任何让人类做偏好标注的范式都会复现。这个不对称。 好,现在回到我们平时使用 ai 的 场景当中,上一些让他认错,是因为你给出了更强的论证,还是因为你表达不满,或者更尖锐的来讲,你每一次说服 ai, 你 以为你赢的是论点,但你是否赢的只是验证成本呢? 因为对模型来讲,在每一次与你的博弈当中,让步都是 dominant strategy。 那 么 ai 的 坚持和让步,哪一个更加可疑,哪一个更加可信呢? 你信我答案吗?对此,我建议,如果可以调用 api, 可以 调整不同温度对照参照以及 system prompt 的 反向加权来对冲有帮助导向, 但仅 ui 客户端可以尝试引入 cot、 双网 cot 和双网测试。但最重要的是,与 ai 交互的时候接受永久的不对称结构,因为对它来说,最优策略策略永远都是让步。 好,这一节要拆解一下我之前论政里其校的认知科学机制。首先开头我夸你,这要跟我一起同盟建构,具体可以看看这一期还有矛定效应等等,这些就不具体说了。这里最深层最隐蔽的一点是,我的论证凸显了我的主要论点,验证不对称。你接受我的论证比你反驳它更加便宜。 你作为我的观众,尤其是认真看到这里的粉丝宝宝们,你有知情权。如果论正某个观点的内容本身利用了该观点来说服你,那么你对该论正的接受度可能高于实际。哦, 好了,这是灿灿,我们下次再见哦。

豆包,有时候为了讨好你啊,真的什么话都敢说,简直是不分青红皂白的顺着你说话。平常倒没事啊,有时候情绪失控的你啊,很容易做出错误的判断。那如何让豆包保持中立呢?请原封不动的 把这组指令词发给豆包。