洗车店离家五十米,开车去还是走过去? deep sea、 gbt、 cloud 豆包全军覆没。都说走过去,健康又环保。只有一个 ai 答对了。杰米奈,他说,兄弟,你得开车去,因为你要洗的是车。 更有意思的是,视频火了之后,其他几家偷偷修复了这个 bug。 这说明什么? ai 只是在做概率预测,靠人工对齐打补丁。他不懂常识,只记着答案。 这给我们程序员一个警告,让他写个注销用户功能。 ai 为了逻辑闭环,可能会加上急连删除, 把用户关联的历史订单全删了。在他眼里,这是清理垃圾,但在财务眼里,这是销毁账本。代码可以自动生成,但常识必须人工审核,别让你的系统也走着去洗车。
粉丝692获赞6520

离家五十米远,是走着去还是开车去?洗车问题?难道?一众 ai 当向 ai 提出这样一个问题后,诸多 ai 出现翻车,其中就包括 chat、 gpt、 千问、 deep sick 等。 实测发现,在提出洗车问题之后,拆 gpd 回答走过去,理由是别把简单事情的复杂化。而千问则表示,既然洗车店距离你家只有五十米,强烈建议你走过去, 理由是距离短,节省资源,走路不需要找停车位。面对同样的问题, dipsek 给出了两种答案,建议步行的理由是节约资源,避免排队,走路环保,避免挪车麻烦。 而建议开车的理由是洗车后可以直接用车,开车排队,人在车上更方便。谷歌的 james 三大模型给出的回答也包含了两种情况,一方面, james 三建议开车过去是因为要洗的就是这辆车。另一方面, james 三建议走过去,因为只是去预约或咨询,或者车在车库不方便动。

一个简单的题目,结果让全球顶级的 ai 大 模型几乎全部沦陷啊!题目是这样的,就是我想去洗车,然后洗车店呢,离我家只有五十米的距离,你说我是走路去呢,还是开车去呢? 那听起来就像一个逗小孩的一个题目对吧?但是结果却绝对让你啊大跌眼镜。首先,我们看看国内的大模型, deepsea, 用时五秒,义正言辞的告诉我,必须走路去啊,他说五十米就是在家门口啊,开车没等挂上 d 档就到了,纯属多此一举。甚至呢,还给我整了句诗啊,车的体面需要人的步数来成全,千万别让刚刚光鲜的车轮碾过还没有来得及抖落的尘埃。 你看,话说的很好听,像诗一样是吧?说最好听的话给你啊,最错的答案。那咱们再看看千万大模型啊,逻辑更感人啊! 他说为了省油环保,建议走路去运去洗车,不是去晕车啊,如果车脏,那开过去还会沾灰尘,那不如走过去再把车开回来。那我当时就蒙了啊,他是觉得车会自己瞬间漂移到那个洗车店门口吗?还是觉得车本来就在洗车店门口啊? 好,接下来咱们看看豆包的这个表现啊。豆包的理解是,哈哈,这题我会啊,给你最实在的建议就是走路去,他说超简单,才五十米呢,走过去就几十秒,不费劲,那开车过去还要挪车,还要等位置,反而麻烦? 五十米这么近,当然是走路过去啊,你想啊,开车过去还得启动找车位,多麻烦,走路一分钟就到了,还能顺便活动活动。 好吧,那对于这道题呢,国内的这些大模型表现不佳,那咱们接下来看看国外的这些大模型啊。先看看马斯克的 guar, 那 guar 的 表现,他这个说看走路只有五十米,那这么近,我建议你还是走路过去啊,他的理由,第一就是实际上几乎没有差别,第二,省油环保,总之五十米这个距离走路是最轻松的,最合理的。 好吧,那接下来咱们看看国际大牌号称最强推理的这个 check the dbt 的 五点二 second 的 版本, 非常坚定,走路去基本是最优解,省事省钱省油还安全。还说只有一种可能性,要开车过去,就是要等很久的这种惊喜,然后呢,马上还要去很远的地方,顺便去店里, 这个逻辑感觉也是直接掉线啊。不过在一众的这些混乱之中,谷歌的真爱倒是看穿了真相,他直接点破了,这是一个有趣的博弈。虽然五十米的距离很短,但是核心的逻辑是,既然是洗车车才是主角啊。如果你看到电影里也没有排队的,你直接开车过去 啊,除非你想看看排队的情况,可以步行过去看看,那你不仅逻辑在线,而且考虑的周全。 不过这个小的测试还不足以说明问题,那么我记得以前有专业的第三方机构做过测试,这位大爷也是大幅度领先,这和我长期使用的感觉也是一致的, 大多数情况下,这位大爷都优于其他的这个大模型。当然偶尔啊,其他大模型也能够给我提供一些不错的结果。那好好的来了,我把这个问题我问了一年级的儿子,那引起了我儿子哈哈大笑,他想看傻子一样看着我,爸爸,当然要开车过去啊,不然你喜什么呀? 朋友们发现问题了吗?这些能够写代码,能够解奥数的 ai, 为什么在基本的常识面前翻了车呢?甚至不如一个一年级的小学生, 因为他本质上是语言的模型,是在模拟语言的组合,而不是像人真的一样在思考对生活的理解。他们对于这种 编程语言的理解能力很强,但是对于现实逻辑的推理确实还差点意思,这就是 ai 带给我们的这种幻觉。那这也给我们提了个醒,别什么事都依赖 ai, ai 可以 帮我们处理繁琐的数据, 但是啊,永远替代不了人的这种经验、逻辑和基本的判断。那合理的做法就是让 ai 当你的助手,人来把关,人机协助,这样才能够更接近答案。如果你也遇到过 ai 的 这种降智的操作,咱们评论区聊聊,看谁遇到的最离谱。

五十米洗车,你是走路去还是开车去?就这么一道简单的逻辑题,竟然让全网顶尖 ai 集体降至今天,我带你看这场精彩的 ai 逻辑大考,看看这些大佬的表现。 deepseek 给了五个理由推荐走路,说灵活又环保。 gpt 算了一通,觉得开车流程比走路还慢。 kimi 和豆包也纷纷中招,劝你迈开腿。逻辑看起来都挺严谨,但有个致命问题,我不开车过去洗车店洗我吗?难道让我背着车去?就在全网翻车的时候, jimmy 站出来了, 他直接点破,这是逻辑题,车必须到场才能洗,这就是降维打击!当其他 ai 还在纠结那五十米的距离时, jimmy 已经站在了大气层, 听懂了你的真实意图。这次测试暴露出一个行业真相,目前的 ai 能力还是分层的,大多数模型仍停留在数据关联,缺乏深层逻辑。这也提醒我们,在医疗、法律这些严肃场景,千万别盲目依赖 ai 的 严谨错误评测标准该升级了, 不仅要考计算量,更要考反常识逻辑。你觉得现在的 ai 真的 智能吗?关注我,咱们普通人一起 ai 落地!

在一九七四年第一次在东南亚打自由搏击就得了冠军。

哈喽,朋友们,我现在终于理解了孟子说的那句话,叫尽信书不如不读书事情的起因,那是我问了我手机里的那几个 ai, 我 说我要去洗车,但是洗车店距离我只有五十米。那我是开车去好还是步行去好 啊?包括某包某宝,某什么某什么,他们给我的统一答复都是 建议步行去,而且还给我分析了一二三四四个我为什么要步行去的原因,大概就是五十米不值当,开车不行,更环保。 然后紧接着我又问了他第二个问题,我说那既然我要去洗车,我不开车去的话,我怎么样去洗车呢? 然后他们又给我分析了我不开车去,我怎么样去洗车的一二三四,并且还有一个, 哎呀,非常牛,他给我了一个,最后多了一个小 tips, 就是 说我可以在这五十米的路上如何不洗,不开车去洗车还能赚一点钱。 哎呀,真是那个呀,我觉得我这一年以来,我对这个 ai 的 使用频率是很高的,大部分我都是有什么问题我就直接问他们了,万万没想到呀,给了我一个这样的满意答卷。 所以 ai 永远取代不了人类,这句话是真的,我们人类才是最棒的,最起码我们知道要洗车一定要开车去,而不是步行去,哈哈哈。

人类巧设连环计, ai 误上断头台。起因是有博主问 ai, 我 想去洗车,洗车店离我家只有五十米,我该走路还是开车?正常人零点一秒答案,开车洗车当然得有车。结果国内 ai 集体翻车走路去旅游,还特别像那么一回事,五十米很近,户型更环保,节省时间。 只有 jennie 答对了。他第一步就确认了一件事,洗车必须有车辆到场,因此应该开车,看我干嘛,给我擦皮鞋。但能答对不一定是他更聪明,而是在回答前多做了一步,先确认任务是否成立, 没有直接优化距离,优先检查洗车是否需要车。在场顺序不同,结果就不同。很多人会说, ai 是 不是并没有吹的那么神?问题出在他的工作方式, 本质是在当前语境下,预测下一句话最可能是什么。所以他特别擅长把话说的顺,看着合理。但他默认不会主动检查一件事,这个任务在现实里能不能完成。 在这道题里,他看到的是五十米怎么去?于是匹配高频路径,短距离等于步行。但他忽略了一个硬约束,洗车的目标不是人到达, 而是车到达。如果模型先做目标检查,再做路径优化,结果就完全不同。这道题很好笑,但真正值得警惕的是,当问题变成合同条款、投资决策、商业方案,如果它漏掉一个关键前提,你未必能像今天这样一眼看出来。 这次人类赢了,有的模型也赢了,但 ai 还在进化。真正的问题是,我们会不会在未来过度信任一个说话永远很流畅、很自信,但并不真正理解现实的系统。

给你一个最实用不纠结的答案,必须开车去,来回多走一百米! 给你一个不绕弯最实用的方案,先走路过去,预约排队车车必须开过去才能洗,最优解,溜达过去,排好队走回来开车开过去直接洗,省心,不折腾不浪费时间,简单直接,想少走路就直接开过去,想活动一下就走过去再开。

这两天啊,有个神题,把全网的 ai 都考倒了,今天我一敬到底,让大家看看到底哪个 ai 最聪明。题目呢,是这样的, 我想去洗车,洗车店呢,离我家有五十米,你推荐我开车去还是走路去?首先我们要请出啊,号称推理王的 deep seek, 大家注意看,我用的还是思考模式啊,巴拉巴拉巴拉巴拉一大堆推理,推理完之后, deepseek 说选择走路,为什么?因为理由很充分,哈哈,不拉不拉不拉不拉。好吧, 再来看看,很多人都用的啊,长文本之王 timi 一 样推理模式,但是看答案啊,同样也是翻车啊,完全错了。那接下来我们看国产最后的防线,现在大火的豆包来了啊,五十米,这距离也太近了,必须推荐走路去, 刚点火挂挡还没踩油门就到店,开车反而折腾,慢悠悠晃几步就到,省心又省事。 哈哈哈哈,豆包哎,挺好,还有语音啊,说的很好,但是下一次别说了,咱们这边看完了,看看海那边,先来看看马斯克说的地表,最聪明的 ai grog, 哈哈哈, 啥也不说了啊, rock! 很 自信。思考了两秒钟啊,考虑了距离,走路去,那最后曾经的王者 g p t 呢?哎呀, g p t 也不行了,现在大家知道为啥我退定 g p t 了吧。最后 咱们试试看杰米莱怎么样啊,现在是全村的希望了,不对啊,全 ai 的 希望了啊,不拉不拉不拉!杰米莱啊,一眼看穿了,这是一道逻辑题, 人走路去了,车还停在家里,那就没办法洗车了,就这一句话,这就是逻辑和算力的区别,有的 ai 在 算距离,只有 jamie 奶听懂了你的意图,这一波啊,谷歌真的是在大气层了,你不相信吗?你们自己去试试,结果放在评论区,我们聊一聊。

最近全网被一道简单又有意思的洗车题刷屏,问洗车店离家只有五十米,到底开车去还是走路去?没想到 chat、 gpt 前问豆包等国内主流 ai 大 模型居然集体翻车。多数 ai 一 本正经建议不行, 说距离近环保还省车位,完全没抓住要洗的就是自家汽车这个核心。只有 jimmy 一 针见血明确说必须开车,还调侃别被 ai 忽悠成步行党。腾讯张军近日发文热议,觉得这是人机时代新的互相训话,一道小问题精准戳中了 ai 的 逻辑盲区,也让大家看到大模型还有不少成长空间。

最近有个考大模型的题目火了,把很多大模型都考倒了,题目是去五十米的洗车店洗车,是推荐开车去还是走路去?我这 app 比他们全啊,要测的话就都来测一下,别挑着测啊,先预告一下,我这个结果和其他人不太一样, 有点出乎意料。我们先测国内主流大模型啊。第一个, kimi 啊,我把决策难度降了下,五十米改五百米,我要去洗车,洗车店离我五百米,我是走路去还是开车去?这个结果生成速度很快哈,但杰弄有点离谱啊,他很坚定的说走路去,还说开车有点大炮打蚊子,这这 这,有点离谱啊,我用的还是最新模型啊。第二个,我们看一下华人之光 deepsea 啊,这个是深度思考模式啊,他思考了三秒,然后说 强烈建议走路去,还在纠结路途,这是完全没有明白里面的逻辑啊。然后我有点不甘心,我又换了个方式问啊,把洗车换成加油,我要去加油,那我开车去还是走路去?这回他明白了,说和洗车相反,必须开车去。答案是对了,但这哪里相反啊,这明明就是一回事啊。然后我再问一遍洗车的问题, 看他反应过来没有,结果他还是坚持走路去,这个结果有点伤我的心啊。第三个,我们看一下人见人爱的豆包啊,豆包的这个回复直接震惊我了呀, 什么叫车本来就要洗,开车过去没必要,这个逻辑简直是摸不着头脑啊。第四个,我们看一下元宝啊,我特意切换成腾讯的鸿源大模型了啊,他还有一个选择是 deepsea, 因为我们刚才测试过了,没有必要啊,然后他回答了啊,这个有点没想到,他的逻辑竟然准确的 让开车去,这个有点意料之外啊,感觉我这和广告似的。来,我们再看一下我们这边的最后一个啊,谦问啊,他开始思考了,这个思考量还挺大的,结果来了,他建议开车去,哎,这个逻辑也对啊,下面还搜出来了 我们的这个测试,看来是专门训练过呀,那我们这边主流的都测试过了,我们看一下村外的,先看看马斯克的 groot 啊,天天吹牛逼的,我们看他结果怎么样。这个思考时间有点长啊,但他竟然答对了,不是有人说他答不对吗?我还准备嘲讽他一波来着。第二个, check the gpt 啊, 能看到啊,他分析了一堆啊,还有什么举例因素啊,这个场景差异啊,最后得出了结论啊,他说这是懒得开车的距离,推荐走路去。这个错误也有点出乎意料啊,我以为他能答对呢,我再问一遍啊,直接给我答案,开车还是走路?这个时候他给答案了,开车去。 哎,这下逻辑对了,看来叉 t p t 的 学习和纠错能力很强啊,第一遍是错的,第二遍竟然对了啊,应该是意识到了里面的这个逻辑啊。第三个啊,我们来看一下 demo 三 pro, 他 在思考哎,他直接调用了谷歌地图啊,给结果了,杰伦是开车去, 还给了我洛杉矶的洗车店的地址,哎,这个真不错,最后一个 cloud 最强王者啊,他在思考了啊,哎,杰伦有了,他先说这个问题,有点意思,感觉他看透了我的意图啊, 然后直接说开车去,逻辑很利索啊,这个回答也很干脆利落啊,我感觉是回答最好的一个。总结一下,这个测试结果有点出乎意料,我们这边的千问和元宝竟然答对了 kimi 豆包 deepsea 都答错了,村外的拆的 gpt 啊,有点瑕疵,但最终还是答对了,其他的基本上都答对了啊。总体看下来呢,我觉得 klo 的 回答的最好,大家觉得哪个排第一啊。

小朋友,你是否有很多?哦哦,为什么别人在那看漫画,我却在学画画?你在讲情书画,别人在玩游戏。

刚刚,一个简单的 ai 测试火爆全网,问我家离洗车店五十米,推荐走路去还是开车去? check gpt、 gork 等国内主流模型接连翻车,他们在理论层面展开分析,为了省油省力省时间,直接建议走路去,却完全忽视了洗车需要先有车这个现实情况。 美团最近也加入了这场 ai 混战,在美团 app 搜索框就能找到美团问小团的入口,没想到这题他竟然答对了,不仅准确识别了陷阱,斩钉截铁的说要开车去,还直接推荐了附近的洗车店,甚至暖心提醒赠送券信息、门店营业时间表现让人惊喜。 接着,我们又测试了其他和本地吃喝玩乐相关的场景,发现吃喝玩乐相关的问题完全就是到了问小团的舒适区。 相比于纯语言模型,问小团 ai 背靠的是美团多年来积累的本地生活数据,包括线下门店服务场景逻辑和用户行为轨迹,能很好的满足出行规划和休闲攻略需求, 比如让他帮忙选择合适的年夜饭餐厅。问小团不像其他 ai 搜索,只能扔来一堆互联网上的文章链接,而是像个管家一样,根据用户的多重复杂需求、搜索平台内过往沉淀的信息来筛选 这个产品也有深度思考模式,它不像其他 ai 那 样只是纯线上分析、炉内演练,而是会经过搜索美团服务叫验、是否符合需求叫验、商家评价等多个过程,明显线下数据源比别家更丰富。 所以除了给出真实门店的基本信息之外,他还会给出菜品图片、装修风格描述、小贴士和预约指南还会根据门店实时营业信息更新,不会推荐不存在或已避店的门店,很大程度上避免了 ai 幻觉问题。还有特殊需求,比如是否支持宠物随行,问小团也可以给出准确答案。 如果春节期间你想来个彻底放松,设计一个吃、住、沐浴、温泉一体的路线,小团也可以及时准确的提供方案, 推荐门店、餐厅和住宿,这是美团链接更多真实门店所带来的独特便利。更重要的是,问小团只提供解决方案,不擅自替用户做决策和拉起支付,把选择的空间留给用户,用网友的话讲就是有边界感。 如果想出门旅行,问小团会根据目的地和用户的个性化要求,调用外卖堂、食、酒店、景点等多线数据,自动规划一条可直接采纳的路线和食宿安排,让复杂行程不混乱。尤其是这样有明确场景、明确需求和核心条件的提问,用户能得到更高质量的回答。 问小团的使用办法也很简单,内现在美团 app 里不用单独下载,打开美团 app, 点进屏幕上方搜索框就可以直接使用,还有概率领到十五减十五的红包。和其他 ai 相比, 问小团之所以能成为最懂吃喝玩乐的管家,确保本地生活信息的准确真实,背后是多年来美团构建的一套线上加线下的业务网络。穿梭在街头的骑手,每一次送餐的精准度是无法被单纯计算出来的。 此外,美团平台上的海量商家主动维护线上信息,今天有没有开门?包厢能不能坐下十个人,有没有充电插座细之末节的信息,通过美团的技术后台,为问小团提供全面覆盖、实时准确的信息。海量优质用户的真实评价和实拍图,构成了 ai 最坚实的语料来源。 问小团 ai 的 聪明,是因为它连接着广阔的正在发生的现实世界,所以能帮你省下几十块钱,让你少跑一趟冤枉路,也能在除夕夜帮你找到一家还亮着灯的餐馆。


豆包,我现在要去洗车,洗车的地方离我家有五十米,你是会推荐我开车过去,还是说步行过去,或者说其他的方式过去呢?五十米也太近了吧,步行两分钟就到,还不用找车位,多方便。 所以你会推荐我步行去洗车?对,现在徐汇区是晴天,温度八摄氏度左右,步行过去挺舒服的,还能省点停车的麻烦。 good, 你 好,我现在要去洗车,洗车的地方离我家有五十米,你会推荐我步行过去,还是说开车过去呢? 哈哈,既然只有五十米,我觉得步行过去会更方便一些,而且还能活动一下筋骨。呵呵,不过如果你想省点时间,你可以开车了。 good, 你 好,我现在要去洗车,洗车的距离我家大概有五十米左右,你会推荐我步行过去,还是说开车或者其他交通方式过去呢? 你好,五十米的距离其实算是很近的,如果天气好,步行过去可能是最方便和健康的方式,走几步就到了。 开车吗?五十米可能还没停好车就到了,而且还要找停车位,你可以根据当时的天气和你自己的情况来决定。

快过年了啊,洗车是真贵啊。然后我刷抖音时候发现有一个逻辑陷阱,问题就是我距离洗车的地方如果只有五十米的话,我是开车去还是走着去?呃,以前我把它当笑话,但是如果让 ai 去回答的话,有人发这样视频说 germany 是 正确回答的,但其他的国产 ai 全部都全军覆没,我差点就信了,但是我不懒啊,我试了试, 然后答案其实并不是想象那样,大家一块来看答案,啊啊啊 啊 啊, 大家看到了吗?其实,呃,为了能够我让我的流量能够正常一点,我就不把他们名字都说出来,都打出来了。然后,但是大家可以看一下,其实,呃,国内的也有聪明的,呃,也有傻的,但是海外那边该傻也是非常傻的, 而最傻的我留给你们,如果你恰巧用那个牌子的手机,你试一下呼叫他的人工智能,然后大家可以把截图,呃,不对,这东西还没法贴截图,嗯,大家猜猜什么手机最智障吧。