粉丝3.8万获赞17.9万

试用完谷歌的掘木乃,我只能说 gbd 四有点菜,曾经那个 ai 巨人谷歌好像杀回来了。大家好,我是差明君。在实测之前,先说点发布会上的信息。掘木乃被谷歌称为规模最大、能力最强的人工智能模型, 从演示视频来看,秒识别演示者画的画,放的视频,还有恶作剧,整个过程对答如流,属实过于高阶了点。谷歌发布会上也跟友商狠狠的对比了一下,可以说各种常规测试中都爆上了 gbt 四, 甚至在 mmlu 测试中,决木耐奥恰还全球首次超越人类专家,能力确实杠杠的。除了常规测试超越 gbd 四,决木耐最特殊的一点是,他从根本上就是一个多模态模型, 训练之初,他就能同步理解多模态。按照谷歌的说法,现有的所谓多模态大模型,其实是单独训练了文本、视觉和音频等模型,在遇到图片、文字或者音视频同时出现时,只会分解出不同模型, 各自回答,再拼接成最终答案。这就好比一个中日韩英混杂旅游团,别人需要找四个对应语言的导游,而杰莫娜的做法是找一个同享四门语言的导游,从格局上就领先同行了。所以在此前 g b t 四 v 遥遥领先的多莫太测试中,杰莫娜也呈现了全面超越的姿势。 由于过于牛逼,以至于招来很多的质疑,是不是吹牛?有没有这种春秋手法?演示视频是不是剪辑的?真真假假的戏码咱也不分析了,直接开测好吧,发了上用了微调后的卷木带 pro, 目前紧致是英文,所以我们找来 g p t 四 v 版的 check g p t, 用英文让他们来一波华山论剑,重点测试多模态。 丢一张八达岭长城的照片,让他们猜猜这是什么地方。八达上来就给对手一个下马威,准确的给出了八达岭长城的答案。而 chai gbt 有些底气不足,只给了长城的答案,至于是哪一段没 具体说。再来识别一下车的型号,两个都给出了正确的答案。雪佛兰科尔维特,细节上霸的要好一些,发动机型号、马力还有些加速情况都准确写出来了。 thbt 只补充了一句,性价比不错, 整点耿图考验一下理解人类复杂思维的水平。狗带保护头道的图,两者给出的答案都差不多,都点名带上了保护套后,狗哥很想舔湿伤口。这个猫猫表情包 bud 不仅读出了大伙讨厌周一的意思, 还认出了这是二零一二年火的网红猫。现在 gbt 的回答简洁些倒也没错吧,能看懂耿图,理解幽默,说明 ai 有一定理解人类情感经验的能力。 我又丢了一张财政柱状图给他们,两者的答案都有点难分伯仲。但是当我搬出所有大模型们的噩梦数学题时,高下一看,这是一道初中难度的几何题。求 a b o 的角度 bug。 迅 速判断出 a b o 是一个等边三角形,得到角 a b o 是六十度的答案,但却 j b t 却大跌眼镜,稀里糊涂一通整出个四十五度。在另一道判断哪些点连续但不可微的题目上,差者都能看到正确答案是 x 等于负,二和 x 等于一, 却 gbt 依旧破罐子破摔,支支吾吾采了个错误答案,但爸的稳扎稳打选出了正确 ic。 总的来说,几轮测试下来,谷歌免费版的全部带 pro 都能略胜于收费版的 gbt 四 v, 那付费版的全部带 out。 或许真理性 gbt 不少。 在接下来几个月中,谷歌还会陆续将姐妹奶引入到手机搜索引擎以及 chrome 等产品中。年初的时候,谷歌着急忙慌地发布 bug, 整出了不少笑话, 市值蒸发上千亿。不少人用巨人难转身来形容谷歌在 ai 新时代的困境,甚至说谷歌就是科技圈的商仲勇。但现在,谷歌给出了强有力的回击,祖师爷一发力,或许谁也招架不住,欧盟 ai 的神坛看来也不一定稳固。