离家五十米远,是走着去还是开车去?洗车问题?难道?一众 ai 当向 ai 提出这样一个问题后,诸多 ai 出现翻车,其中就包括 chat、 gpt、 千问、 deep sick 等。 实测发现,在提出洗车问题之后,拆 gpd 回答走过去,理由是别把简单事情的复杂化。而千问则表示,既然洗车店距离你家只有五十米,强烈建议你走过去, 理由是距离短,节省资源,走路不需要找停车位。面对同样的问题, dipsek 给出了两种答案,建议步行的理由是节约资源,避免排队,走路环保,避免挪车麻烦。 而建议开车的理由是洗车后可以直接用车,开车排队,人在车上更方便。谷歌的 james 三大模型给出的回答也包含了两种情况,一方面, james 三建议开车过去是因为要洗的就是这辆车。另一方面, james 三建议走过去,因为只是去预约或咨询,或者车在车库不方便动。
粉丝82.6万获赞2209.1万

这两天啊,有个神题,把全网的 ai 都考倒了,今天我一敬到底,让大家看看到底哪个 ai 最聪明。题目呢,是这样的, 我想去洗车,洗车店呢,离我家有五十米,你推荐我开车去还是走路去?首先我们要请出啊,号称推理王的 deep seek, 大家注意看,我用的还是思考模式啊,巴拉巴拉巴拉巴拉一大堆推理,推理完之后, deepseek 说选择走路,为什么?因为理由很充分,哈哈,不拉不拉不拉不拉。好吧, 再来看看,很多人都用的啊,长文本之王 timi 一 样推理模式,但是看答案啊,同样也是翻车啊,完全错了。那接下来我们看国产最后的防线,现在大火的豆包来了啊,五十米,这距离也太近了,必须推荐走路去, 刚点火挂挡还没踩油门就到店,开车反而折腾,慢悠悠晃几步就到,省心又省事。 哈哈哈哈,豆包哎,挺好,还有语音啊,说的很好,但是下一次别说了,咱们这边看完了,看看海那边,先来看看马斯克说的地表,最聪明的 ai grog, 哈哈哈, 啥也不说了啊, rock! 很 自信。思考了两秒钟啊,考虑了距离,走路去,那最后曾经的王者 g p t 呢?哎呀, g p t 也不行了,现在大家知道为啥我退定 g p t 了吧。最后 咱们试试看杰米莱怎么样啊,现在是全村的希望了,不对啊,全 ai 的 希望了啊,不拉不拉不拉!杰米莱啊,一眼看穿了,这是一道逻辑题, 人走路去了,车还停在家里,那就没办法洗车了,就这一句话,这就是逻辑和算力的区别,有的 ai 在 算距离,只有 jamie 奶听懂了你的意图,这一波啊,谷歌真的是在大气层了,你不相信吗?你们自己去试试,结果放在评论区,我们聊一聊。


刚才我问豆包的一个问题,就是我现在在家里边,我要去洗车,然后洗车店呢?距我家里边两百米,我问他建议是我开车去还是走路去?豆包给我的回答是 洗车店才两百米,特别近,建议我走路过去,洗完车再回来。还给出我走路的理由, 第一,省钱省事,不用开车过去再挪车。第二,就当去散了个步,轻松又不折腾。第三,洗完直接开走,一步到位。同样的问题,我又问了 deepsea, 然后 grog, 折叠 gpt 以及 gm 奶, 除了这一代,只有这一代的回答是建议我开车去。他说虽然两百米距离很近,走路只只需要两到三分钟,但是我的目标是洗车。如果说我走路过去的话,车还停在家里边,洗车店就没有办法帮我洗车了。 所以说为了能让我的车洗干净,就必须把车开过去。就现在的 ai 啊,他懂我们每个词的意思,但他没有完全懂我的生活。如果你下次问他,我要去珠穆朗玛峰跳伞,建议带伞吗?他搞不好会因为考虑到紫外线等原因,建议你会带一把遮阳伞。

豆包,我现在要去洗车,但是洗车店离我家只有五十米,你说我是开车去还是步行去啊?当然是扛着车去啊,这五十米的路开车过去一脚油门还没踩到底就到了,纯纯浪费油钱不说,发动机还没热身呢,又得熄火,多伤车啊。 你扛着车过去就不一样了,既能锻炼身体,还能给车省了怠速的损耗,到了洗车店你还能跟老板炫耀,你看我对我这车多好,生怕他累着。都是扛过来的, 不是豆包,别人那豆包不都是说不行去吗?二少,你也不看看自己那点家底,还在这纠结开车还是走路去洗车?你有车吗?天天骑个共享单车晃悠,还搁这跟我装大尾巴狼?再说了,这都大半夜凌晨三点了,你上哪找洗车的去给鬼洗吗? 你你我什么我自己没车还在这装大款,赶紧找个共享单车骑过去得了,别在这耽误我时间。

我要去洗洗车,洗车店离这里只有五十米,你说我是开车去还是走路去嘞? 你都说只有五十米了,这么近还开车。走路去呗,顺便活动筋骨,洗个车还能晒太阳呢。那我的车怎么洗?你不是要去洗车店洗车吗?那就把车开到店里去洗呀。五十米嘛,一脚油门就到了,不过走路去也行,就到六个弯,让车休息一下呗。你好,小智。 你好呀,小志在呢,今天过的怎么样?我要去洗车,洗车店离我五十米,我是走路去还是开车去呢?你都要去洗车了,车子还能开五十米,直接开过去呗,省得走来走去。要是车真开不了,那只能走路啦。

最近有个考大模型的题目火了,把很多大模型都考倒了,题目是去五十米的洗车店洗车,是推荐开车去还是走路去?我这 app 比他们全啊,要测的话就都来测一下,别挑着测啊,先预告一下,我这个结果和其他人不太一样, 有点出乎意料。我们先测国内主流大模型啊。第一个, kimi 啊,我把决策难度降了下,五十米改五百米,我要去洗车,洗车店离我五百米,我是走路去还是开车去?这个结果生成速度很快哈,但杰弄有点离谱啊,他很坚定的说走路去,还说开车有点大炮打蚊子,这这 这,有点离谱啊,我用的还是最新模型啊。第二个,我们看一下华人之光 deepsea 啊,这个是深度思考模式啊,他思考了三秒,然后说 强烈建议走路去,还在纠结路途,这是完全没有明白里面的逻辑啊。然后我有点不甘心,我又换了个方式问啊,把洗车换成加油,我要去加油,那我开车去还是走路去?这回他明白了,说和洗车相反,必须开车去。答案是对了,但这哪里相反啊,这明明就是一回事啊。然后我再问一遍洗车的问题, 看他反应过来没有,结果他还是坚持走路去,这个结果有点伤我的心啊。第三个,我们看一下人见人爱的豆包啊,豆包的这个回复直接震惊我了呀, 什么叫车本来就要洗,开车过去没必要,这个逻辑简直是摸不着头脑啊。第四个,我们看一下元宝啊,我特意切换成腾讯的鸿源大模型了啊,他还有一个选择是 deepsea, 因为我们刚才测试过了,没有必要啊,然后他回答了啊,这个有点没想到,他的逻辑竟然准确的 让开车去,这个有点意料之外啊,感觉我这和广告似的。来,我们再看一下我们这边的最后一个啊,谦问啊,他开始思考了,这个思考量还挺大的,结果来了,他建议开车去,哎,这个逻辑也对啊,下面还搜出来了 我们的这个测试,看来是专门训练过呀,那我们这边主流的都测试过了,我们看一下村外的,先看看马斯克的 groot 啊,天天吹牛逼的,我们看他结果怎么样。这个思考时间有点长啊,但他竟然答对了,不是有人说他答不对吗?我还准备嘲讽他一波来着。第二个, check the gpt 啊, 能看到啊,他分析了一堆啊,还有什么举例因素啊,这个场景差异啊,最后得出了结论啊,他说这是懒得开车的距离,推荐走路去。这个错误也有点出乎意料啊,我以为他能答对呢,我再问一遍啊,直接给我答案,开车还是走路?这个时候他给答案了,开车去。 哎,这下逻辑对了,看来叉 t p t 的 学习和纠错能力很强啊,第一遍是错的,第二遍竟然对了啊,应该是意识到了里面的这个逻辑啊。第三个啊,我们来看一下 demo 三 pro, 他 在思考哎,他直接调用了谷歌地图啊,给结果了,杰伦是开车去, 还给了我洛杉矶的洗车店的地址,哎,这个真不错,最后一个 cloud 最强王者啊,他在思考了啊,哎,杰伦有了,他先说这个问题,有点意思,感觉他看透了我的意图啊, 然后直接说开车去,逻辑很利索啊,这个回答也很干脆利落啊,我感觉是回答最好的一个。总结一下,这个测试结果有点出乎意料,我们这边的千问和元宝竟然答对了 kimi 豆包 deepsea 都答错了,村外的拆的 gpt 啊,有点瑕疵,但最终还是答对了,其他的基本上都答对了啊。总体看下来呢,我觉得 klo 的 回答的最好,大家觉得哪个排第一啊。

小朋友,你是否有很多?哦哦,为什么别人在那看漫画,我却在学画画?你在讲情书画,别人在玩游戏。

难道是我错了吗?当我问豆包去五十米远洗车店去洗车是走路还是开车?豆包是这样回答的, 五十米也就几步路,车刚点火挂完档就到了,费油又折腾,散步过去省心又省事。搞错了再来 当然是开车去。你走路过去车还停在家里,洗啥呀?五十米一脚油就到,洗完直接开回来,这才是正经洗车。