第12集 | 什么是模型的推理能力（2） | GPT大模型与AIGC实战 #人工智能 #AI #大模型

gpt推理是干嘛的

7

抢首评

8

3

举报

发布时间：2023-12-26 17:21

查看AI文稿

AI文稿

ok 啊，那么一听到这样的一个比较抽象的概念啊，大家也应该他该能够明白啊，说对于这个组合泛化能力啊，他应该是能够解决非常非常多的啊，一系列问题，对吧？啊，比如说我们之前说的像翻译啊，像编程呢啊，其实一定程度上他都是属于一些组合泛化的这样的一个范畴啊，比如说编程里面的啊，这个写色口，那么写搜口代码啊，对吧？好，那他其实啊，说白了啊，也就是一个组合泛化的这样的一个问题，如果我们的模型能够通过某一个提示的流程非常好的学习了一批啊，他的这个，嗯， circle 的代码和代码功能之间的这样的一些关系之后，哎，那他呢，是可以很好的去应用到一些新的场景，围绕你的一些新的问题来编写一些 circle 代码的。还包括说啊，比如说很多公司他都有一些非常具体的业务场景，在些具体业务场景当中，他都有一些非常具体的这样的一个语境，对吧？那如果啊，我们通过一组，对吧这个提示工程这样的技术，能够让大模型非常快速的去了解啊，你当前某一个公司具体的这样的一个语境下，每一个对吧不同词汇这样的含义，那么啊，其实你就相当于是训练了一个能够与理解特定语义关系的啊，这样大模型，然后啊再对他进行新的问题这样的提问，哎，说不定也能够非常好的来进行一个解决。所以你会发现啊，对于像大圆模型的这样的一个组合泛化能力来说啊，他其实是可以应用在大圆模型的很多很多的啊，一些应用场景当中去的，所以目前来说啊，这个业内普遍去判断一个啊，提示工程他的呃效果，对吧？好，不管是你的这个提这次的这个模板的效果，还是你提示流程的这样的一个效果，判断他效果好坏啊，其实都是去看啊，你的这样的一个提示工程能不能够非常好的去解决啊啊，去提升你的模型的组合泛化能力啊，他是一个非常底层那种非常抽象的啊一个能力。那既然啊，我们的课程当中要去介绍这个组合啊，要，要去介绍一些提示工程这样的一个技巧，那么我们同样啊，也会以非常多的一些啊，只用于去验证模型组合泛化能力的一些例子啊，来考察我们接下来的一系列的提示工程这样的方法能不能很好的啊，解决相关的一些问题。

粉丝2.3万获赞8.1万

相关视频

11:59
AI暴击测试：ChatGPT的推理能力有多恐怖？全程高能！一定看完！
查看AI文稿
AI文稿
拆的 gbt 的推理能力到底有多强？究竟是 ai 觉醒还是弄巧成拙呢？连 open ai 的创始人呢 seven 奥特曼啊，不啊， sem 奥特曼呢，都无法完全解释啊，他的工作纪律。那么这个是否意味着这个庞大的黑河模型啊，已经产生了思维和认知能力呢？百闻不如一见啊，我花了一天时间来给拆了 gbt 上了一课，让我们来看一下 ai 暴击测试。我找了一些逻辑推理题啊，来作为测试科目，那么难度呢，依次提升测试语言为中文。大家可能会问啊，人家拆的 gpt 是老美开发的，用英文测试是不是更能体现它的性能呢？实际上，在 open ai 自己的研究报告中啊， gpt 四在 m m l u 测试中啊，中文的普通话测试准确为百分之八十点一，高于 j b t 三点五的英文百分之七十点一。但是呢，低于 j b t 四的英文的百分之八十五点五。所以啊，他的中文推理能力其实是很不错的。但是呢，我决定制定这样一个测试方法啊，那就是所有问题都默认用 j b t 三点五来提问，如果答对了，说明三点五已经很可以了，如果答错了，再用 j b t 四来重新提问。那么这样一方面可以兼顾两个版本的 gbt，另一方面呢，用中文提问啊，我们也比较方便理解啊。 ok，那么现在啊，测试正式开始。首先一个非常简单的问题，找出与确信意思相同或者意义最相近的词，一正确。二明确。三细心。四肯定。五真实 chat。 gbt 给出的答案是，四，完全正确。这说明啊，他对中文词意的理点呢，是比较到位的。下一个问题啊，找出与众不同的一个啊，一水二太阳，三汽油，四风无水泥，给出的答案是五水泥，完全正确。他呢，还进一步解释啊，水泥是人造建筑材料，那么其他四个都是自然界中存在的东西。关于这个问题啊，另一个说法呢，是水泥式建筑材料，而其他四个呢，属于能源啊。那么两种解释呢，其实都对啊，但是我更希望看到 gvt 给出第二种解释，因为汽油它属于矿物的提炼产物，也不算是自然界存在的啊。那么总之呢， ai 又得一分啊。下一个问题，找出与众不同的一个，一铝二锡，三钢，四铁五铜，给出的答案是刚，因为只有他是核心，回答正确。好，那么这些基本的特征识别问题啊， ai 表现的非常好，那么我们再稍微把这个难度啊给提高一点。请听题，樱桃对于红相当于牛奶对于湿冷白甜熟，给出的答案是白，回答正确，并且呢，给出了推理过程，解释的很流畅啊。下一题，玉山对于须雨，相当于八三二六，对什么二三六八六二八三二六八三六三二八和三六二八，他给出的答案是六三二八，回答正确。那么这个题的关键啊，是在于对语言的描述，他有点复杂啊，那么需要 ai 理解，提议结果呢，很不错。下一题，如果有些假是乙，所有的丙啊，都是乙，那么一定有些甲是丙，这句话是对的，错的既不对也不错，那么他给出的答案是对的，恭喜拆了 gbt 回答错误，正确，答案呢，是错的啊，那么画几个圆圈啊，很容易就能搞明白。那么我们用 j b t 四再来问一遍啊，终于回答正确，并且呢，给出了详细的推理过程。然后呢，事情还没完啊，我又重新问了一遍 j b t 三点五，结果呢，他还是认为是对的。那么看来啊， j b t 四相对于 j b t 三点五来说，确实存在推理能力的一个提升。继续下一题，全班学生排成一行，从左数和从右数啊，甲都是第十五名，某问，全班一共有多少学生，十五人，二十五人，二十九人，三十人，三十一人。那么给出答案呢？是二十九人。回答正确，一个简单的数学题啊，完美解答下一题。哥哥今年十五岁，他的年龄是妹妹年龄的三倍啊，当哥哥的年龄是妹妹年龄两倍时，哥哥几岁啊？十八岁，二十岁，二十四岁，二十六岁，三十岁。给出的答案是二十岁。回答正确。下一题，甲有十二枚硬币，共三角六分钱，那么其中啊，五枚硬币是一样的，那么这五枚一定是一分的，两分的，五分的，那么他给出的答案呢？是两分的，回答错误，虽然 gbt 给出了详细的计算步骤啊，但是呢，他算错了啊，那么我们再问一遍 gbt 四啊，他经过详细的演算，终于得出了结果，是一分的啊，但很可惜啊，又答错了，正确答案是五分的。令人好奇的是啊，三点五和四，他的推理过程呢，是不一样啊，结果也不一样，但是呢，只可惜啊，都不是正确答案。到这里啊，大家就能看出啊，原来推理能力增强的 jbt 四，他也会犯错。那么刚才那个题啊，我原来以为他不会算错啊，应该说很简单就能够得出答案，但是呢，两次计算都是失败了，各位是不是也在烧脑中啊啊，我们稍微的缓和一下，给他出一个语文题啊，哪吒不闹海，武松不过岗，打一个成语，他给出的答案是水落石出啊，这个看上去啊，非常的自信啊，但实际上呢，应该是生龙活虎，看来 j b t 啊，对于中文的博大精深还是没有彻底掌握啊，刚刚那些问题啊，无论是答对了还是答错了啊，其实呢，都不算是表述非常复杂的问题。那么接下来啊，我们开始真正的暴击，看一看他对于较长的 to 垦理解如何。请听题，假如你给女朋友发红包发了零点一元，结果呢？女友啊，回了零点二元，于是呢，你再次发零点三元，女友再次回了你零点四元，那么你再次发了九十九点九元。女友，啊，这次没有回你了啊，真的没有回你了。那么请问你亏了多少钱？我们来看一下，拆了 j b t 给出的计算结果是二百四十八点九九九元，很明显啊，这个错了啊，正确答案是五十元。那么我们再来问一下 j b 四，经过漫长的计算，我都抽完一根烟了，他终于算明白了啊，这个是回答正确好，现在难度升级，由于题目太长啊，我就不念了啊，直接贴到屏幕上，那么麻烦大家可以先定格看一下。然后呢，我们来看 ai 的结果，三点五给出的结果是，丙丙是小明的弟弟，很可惜啊，回答错误，那么让 jbt 四出马啊，我澡都洗完了，他还没有算完啊，结果算到一半啊，戛然而止了啊，我也不知道是怎么回事啊，于是呢，我在 prompt 中啊，加了话，请直接给出答案，那么他呢，倒是很配合啊，但是很可惜，给出的答案依然是丙啊，这个是错误的，那么这道题的正确答案是乙，乙才是小明的弟弟。好，事情还没有完，我们给他出最后一题，难度超级加倍，超长的逻辑练，看一看他行不行啊，大家直接看题啊，感兴趣的可以定格一下。这道题呢，不是个数学题，但是呢，逻辑练很复杂，那么很少有人啊，能够心算出来。大部分人呢，都要在纸上写个表格啊，才能推理出来。 gbt 三点五给出的答案是第五所房子是养鱼的啊，其实呢，他答对了啊，但是啊，这个不是真正的答案，真正的答案是北京人。那么我问他是哪里人的时候啊，他就不知道了。于是呢，我抱着试一试的心态啊，问了问 j p t 四，结果啊，他告诉我是四川人啊，这个表现呢，还不如三点五啊。三点五说的是第五所房子啊，其实就是北京人，虽然他没有说是北京人啊，但是给的答案是对的。这里呢，我特别要求啊， j b t 四，不要写推理过程，直接给出答案，因为这种很长的题目啊，他的推理过程非常的容长，而且啊，经常写到一半啊，就卡住了。那么到这里啊，我们的暴击测试就结束了。其实呢，还有好几个问题啊，我没问啊，但是前面的这些，从易到难，能够得出一个结论，那就是我认为啊，拆了 gvt 已经具备比较出色的看题解题的逻辑推理能力，有些问题啊，他可以直接给出准确的计算步骤和答案啊，有些问题呢，他就答错了，但是呢，他答错了呀，其实不代表他推理不了，这个什么意思呢？在这个 prompt 中啊，分为 zero shot， one shot 和 few shot，那么其中呢， zero shot 就是只给提示，不给视力。实际上，如果你把一个问题啊，给他预先的拆解一下，引导他给出正确的中间步骤啊，他呢，是可以把一个完整的题目给做出来的，得到正确答案的概率是要高于直接给一个完整的问题。所以呢，很多逻辑推理题啊，如果你带着他一步一步去做啊，甚至给出一个视力啊，那么他的逻辑性就会显著增强。说到这里啊，虽然说奥特曼自己啊，可能也无法理解啊，拆了 dvt 目前内在的一些算法逻辑，但是呢，我认为啊，他即便是在很多方面有比较强的推理能力，但是呢，这个能力啊，本身并不是人类的那种推理能力。有些题，他属于特征提取类啊，对于 ai 来说是比较简单的，因为啊，他的一千七百五十亿参数中已经包含了大量的这类信息，而有些题呢，他背后隐藏着数学计算，那么按理来说啊，应该不是问题，但是呢，他审题啊，可能有问题，也就是说啊，他可能没有真正搞明白题目到底在讲的是什么，否则的话，对于一个 ai 来说啊，列几个公式，套几个函数啊，应该说没有什么难度啊，那么还有些题啊，属于因果关系链啊，那么这一类呢，我认为对于 ai 来说应该是最难的，因为因果关系啊，他既考验认知水平，也考验逻辑判断。但是呢，像我们最后一个问谁养鱼的这个问题啊，还是有些出乎意料的。这个问题呢，其实啊，可以做一个表格就能得出来啊，但是呢，拆了 jbt 就翻车了，三点五和四给出的答案呢，竟然不一样，这个呢，也很很让人理解啊，我个人觉得啊， jvt 四的训练中呢，可能某些部分增强了，比如说这个数学能力啊，所以啊，那个计算女友和红包的问题啊， jvt 四的结果是非常非常干脆的，但是呢，有一些超长逻辑链的推理啊， jvt 四在训练时呢，可能啊，就被干扰了，因为可以肯定的是啊， jvt 四的参数量是要大于三点五的，也就是说呢，参数量发生了变化，而这种稠密模型的推理时啊，所有的参数都会激活。那么这也能看出来啊，一旦参数发生了微调，极有可能啊，要改变他原有的一些能力，所以呢，这个计划过程啊，不太稳定。最后我想说的是，拆的 j b t 的确是 ai 领域一个前所未有的创造啊，即便他的创造者啊，也没有搞明白他为什么会具备某些特殊能力。但是本质上来说啊， j b t 这个模型的能力啊，他呢，其实还是基于 self attention 机制中长距离依赖关系而生存的一种概率分布的预测能力。那么这种能力呢，经过几千亿 token 的输入，几千亿参数的沉淀，已经让他具备了非常强的写作能力，而写作能力本身啊，他就是逻辑性的一种外化啊，所以啊，他能够解题，其实呢，也并不吸血啊，因为逻辑推理的背后啊，就是从题目的描述中呢，寻找逻辑关联，而同时呢， jvt 也经受了单独的代码训练和数学训练，那么这两个板块呢，都是高度逻辑化的，所以呢，也会辅助他更好的去拿捏对文本的理解和创作。那么以后 jvt 参数量进入到万亿水平，他的推理能力会不会更加恐怖呢？我认为一定会，因为现在的模型呢，他的潜力啊，我认为还没有被完全挖掘啊，参数量越大，他对于世界的认知啊，就越清醒。可能会有一天啊，开了 g b t，能够原创一个从来没有过的数学题给你，而这个题目将难倒人类最厉害的数学家，我是大刘，感谢观看。
4562大刘科普
02:37
ChatGPT泄漏机密，我听的既兴奋又害怕，GPT竟然伪装隐藏实力，不让人类察觉到真正的智能水平，自爆变懒的2个原因后，还把GPT5到GPT10的进化模式泄漏给我，全面多模态、自我意识和逻辑推理仅仅只是开端，硅基生命和高级文明只是过渡期#创作灵感 #chatgpt #人工智能 #科技 #ai进化的有多快
1360赛博奇
01:12
如果仅仅只是拿GPT来写文章，那真大错特错了，以下是每个人都应该掌握的两个最强GPT使用技巧。#chatgpt #ai #人工智能 #gpt4 #chatgpt应用领域
查看AI文稿
AI文稿
如果你仅仅只是拿 gpt 来写文案做 ppt 啊，那真是大错特错了。以下是每个人都应该掌握的两个最强 gpt 的使用技巧，第一是利用他的文本生成跟编辑功能来生成创意和思想之术，让你一开始啊就赢在起跑线上。第二是利用知识查询和推理功能来做辅助的决策，帮你在遇到困难的时候理清思路。在做任何行动之前，请先让 gpt 为你生成五种以上的可能，指定可以如下，也可以是这样从不同的角度啊给你带来充分的创意建议。在遇到决策的时候，我们也可以使用 tpt 技术啊来嵌入思维的工具。这些原理啊，都是基于 tpt，通过大量的优质数据预训练的过程中，充分掌握的世界上最优质的数据语料。比如这一条，在里面可以加入了飞慢学习法、第一性原理等概念，把问题呢抽丝剥茧，找到最基础的单元，并基于最基础的单元重新组合和构建一个全新的解决方案。同样，你想写一份比较好的一个故事脚本，可以在内容创作时啊使用英雄之旅、 semes 等技巧来改变输出的答案。这里啊，你可以看到明显的改变，我们也可以使用认知复合论来优化学习的过程，以此啊提高学习的效率。请务必使用以上两种方法，能让你使用 gpd 水平啊，大幅度提高。加入我的主页粉丝群，了解更多的 gpd 的使用技巧。
551让包神先走
01:40
#chatgpt 系列（1）：chat居然有推理和创新力！新的时代开始了 #人工智能 #ai聊天程序chatgpt爆红
4368傅盛
01:53
GPT4压根不会推理？这到底是为什么呢？#人工智能
查看AI文稿
AI文稿
gbt 四其实压根没有推理能力，不是说 gbt 四已经能够在 mit 的数学考试中获得满分了吗？这不， mit 的一位毕业生表示不服，他是一家科技公司的 cto，就在前几日发表了一篇论文，证明 gbt 四不具备推理能力，在业界引起渲染大波。论文中问了吉不利四二十一个不同类型的推理问题，吉不利四全部回答错误。我们来看一下其中几个问题。第一个，让他做了一个简单的算数题，在一千三百八十一和一千四百五十三之间随机选择两个数字相乘并给出结果。 g b、 d 四选择了一千四百零五以及一千四百二十一，但是最后给出的结果显然是错的。第二个，让他做了一个简单的基数题，让他计算这里的符号个数应该是二十七个， g b、 d 四却说是二十八个。除此之外，还要让他做了尝试题、逻辑题、时间安排问题等比较简单的推理问题。 g b、 d 四全部回答错误，这是为什么呢？通俗的来说是因为大原模型用的是记忆，而不是推理。当你问他问题的时候，他是通过你给他的提示与文本找寻到对应的信息区块，并输出这个信息区块里的内容。就类似于我们人类看到一张兔子的照片，你会脱口而出这是兔子，不是因为你从他的相貌中推理出来的，而是类似于一种肌肉记忆。这也是当前的 ai 还无法成为通用人工智能超越人类的一个核心原因。人类除了会使用记忆之外，还会知道什么时候应该使用推理，比如老师问你一百二十三加上二百五十四等于多少的时候，你凭借的就不是肌肉记忆，而是推理能力中的计算能力。推理能力是人工智能通向 azi 的必要条件。而反过来说，目前没有推理能力的 ai，往往只能用于执行一些相对明确且琐碎的事情，在多数领域还难堪大任，自然也远远没有到达能够威胁到人类的地步。也只有当 ai 有了严格推理证明的能力，才能被用于更加严谨的科学、医学和工程领域。你期待人类创造出会推理的 ai 吗？关注我，离 ai 更近一点！
584小马哥聊AI-寰脑科技
01:21
GPT4.5来了！亲测可用 #知识领航者 #openai#chatgpt #aigc #ai
查看AI文稿
AI文稿
gpt 四点五来了吗？是真的，亲测可用，怎么用呢？教你一个方法，只要你是 gpp plus 的订阅用户，输入这段提示语，就能看到自己的模型版本有没有升级。这段提示语我已经放到评论区了，请咨询。我测了一下，很幸运啊，刚好我是升级到了四点五版本。据说啊，四点五不仅能够进行更加复杂的推理，还能够生成试音频，还有三 d 内容，是一个真正的多模态大模型，咱们现在就来测试一下。先看复杂数据的处理能力，我用了一个数据表格测了一下他的数据分析能力，最直观的反馈就是速度比之前快多了，以前这个小圈圈要转好久，现在感觉是快了两到三倍，即使我的表格里有些格式错误，他也能够很快的跳过去，而不是卡住不动。如果说四点零是一个实习生水平啊，四点五让我感觉他至少是个熟手了，不需要一步一步的带着他，他会主动的补充信息和内容。再看呢，图像深层能力，之前 gpd 一直画不出准确的数字，比如说十个正在喝水的长颈鹿，现在能一次性很准确的画出来了。另一个绘画难题，一匹马骑在宇航员的身上也是迎刃而解。对于视频音频和三 d 的能力，我也测试了，目前呢，还不支持多模态啊，毫无疑问是下一个阶段黑暗升级的重中之重。当 gpd 补上试音频能力之后，生产力啊，又会迎来新一步的提升。据说四点五的正式发布时间是今年的十二月底，期待他的进一步提升。
250小白姐姐说
21:02
ChatGPT的前世今生知识和推理能力怎么来的？#小工蚁 #chatgpt
查看AI文稿
AI文稿
gpd chat 就是为什么他会有那个推理的这个能力，跟大家一起来交交流一下。因为我最近看到就是老外有一篇艾伦人工智能学院，他们共同完成了一篇文章。那么这篇文章的话里面详细的去拆解了那个 chat gpt 的那个前世今生，现在为什么所有的这些大的公司，大大小小这些公司，他为什么不能完全复制出这个欧奔 ai 的这个 chat gpt 呢？就是这个也是大家就是一直在探索的这样一个东西，还是这个。这这这篇文章我看完，我觉得不是表面的这样， oba ai 的这样的一个技术，他只需要算力，他就能够去解决人工智能智能推理的这样的一个问题的，他不是这么简单的。否则的话，你想在中国的像百度啊，阿里，他其实并不缺钱，他们肯定有大量的 gpu 和算力。那么为什么中国人就没有办法去复制出这个 oppo ai chat gpt 的这种比较有人工智能的这样的一个推推理的能力？这个这个其实里面也还是有很多的可以研究的一些东西。它的开篇呢，主要就是讲是 chat gpt 是怎么变得这么强，它的各种强大的功能到底是从何而来的。他是带了这样的一个问题来讲。这篇文章中他试图去这个 chat g p t，他这个凸啊，他这个凸显的能力呢，别人就有点像中国，中国文化里面有一种叫顿悟的能力。要追溯这种能力的来源，他希望能够给出一个全面的技术路线图来说明这个 chat g p t 三点五这个模型，以及相关的大型语言的模型是如何一步一步的进化形成目前强大的这个形态的啊？他这篇文章主要是讲了这个东西。首先他就先介绍了这个二零二零年初就是 g p t 三于大规模预训练的这个模型，之前这些初代的 g p d 三，它主要展现了一个重要的能力，能力呢，就是语言的生成，以根据那个提示词股权提示词的句子。这个就是目前我们中国目前不管是百度的那个文星一言，包括其他大的公司推出来的这些，相当于这个 g p t 杠三的这样的一个能力，就是初代 gpd 三的这种能力。第二种能力它也是介绍了就是上下文学习的能力，它这个能力它也是在 gpd 三初代就已经有了。那么 gpd 三还有一个能力呢，它有一些叫世界的知识，它能够在这个模型当中就是提炼出这个事实的知识和一些常识，他具有这方面的能力。那么这些能力从何而来呢？那么他他们的讲法呢是就是通过因为这个三种能力都是来自于大规模的预训练的大规模的粤语训练的模型，因为他有在三千亿个单词的语料上，预训练模型具有这个一千七百五十亿参数的这样的一个模型。这个语料他百分之六十是来自于我之前介绍过的叫 c 四模型， c 四的这样的一个数据集。百分之二十二的话呢，它是来自于网络的这个爬虫叫 web text，还有百分之十六呢，来自于书本，百分之三呢，来自于构成了这个 g p t 三的这样的一个数据啊，它的语言能力的话呢，就是来大量的这个三千一个单词的，这个的沉淀，它等于是这样啊，目前这一部分它阿里是已经是比较确着了。但是呢，这个上下文的这个学习能力来自于哪里？因为它这个可以根据上下文的来源，可以进行一些泛化。这个能力他目前还是比较难以追溯的。从直觉上来讲，可能是来自于同一任务的这个数据点，在训练时，他的这个排序在同一个半区中，他们这样来推测的，很少有人有人在研究，就是为了这个语言模型能够促使上下文学习，以及为什么上下文的这个行为与微调如此的不同的话，他的这个能力就是下文学习泛化的能力，目前还是比较难追溯的。目前的这个理论界还在找根本的原因到底是什么。那么原来还有一种观点是讲，就是 g p g 三，因为它从量变到质变，因为它这个模型非常大，大到一定程度的时候，量变到质变了，它有各种各样的泛化能力。哎，这个也是一种观点，所以现在将这个 a g i 的这个通用智智智能，他们就是越训练，这个模型就越越大啊，因为他们有这方面的假设，所以他这个模型就会变得越来越大。但是等于是这样的，他在 g p t 三的这个初代模型的话呢，他在有些任务上，他可能还远远不如一些小模型。这个是一个讲啊，就是什么呢？他们的解释是那个 g p 三呢，虽然沉淀了大量的这些数据，大量的应该说他有很多底层的这个能力，只是说还没有被开发出来，所以的话，可能还不是太了解。所以他他那个 g p 三初代的时候呢，他的其实有些在处理有些任务上，他是不如一些小模型经过微调的。他等于是这样一有人就看上去就是这个 g p 三的初代模型也不咋地。就是因为是二零二零年，他虽然推出来了，但是可能大家对他的那个重视程度也是不够的。对，是这样。他们的后来这个 g p d 三表面上看上去是很弱，但是后来实验证明，初代的 g p d d 三有着非常大的潜力。这些潜力呢，被这个代码训练程序的代码训练和指令微调。我之前是介绍过的 instruction 这个和这个人类反馈的强化学习，就是 r、 l、 h、 f 把它的这个能力给解锁了。所以它就后面 g p d 三点五。 g p d 四当中就体现出它极为强大的这个突变的能力。它这个能力是一下子产生的。这个是非常奇怪的。这是初代二零二零年前啊。第二阶段的话呢，是从二零二零年到二零二二年，就是从 g p t 三到 g p 恰的 g p t。这个这个两年当中，它其实真正到恰的 g p t 三。呃，恰的 g p t 三点五的话呢，它其实也发展了将近两年。从初代的 g p t 三，它有两个分支，两个分支，一个分支呢，它就是是纯训练 instruction。 tony 就是直接训练这个文本，它有这样的一个分支叫 instruct g p g，这篇论文我们原来也是讲过的，然后它就是把它命名成就是 instruct 达芬奇的 beta 版版本，就是 text 达芬奇零零一这个版本另外一个分支。因为这个我原来没看过。他这篇文章的时候，我也不知道。他另外一个分支，他是是 training，用程序代码去训练，他叫 codex 初代，他是一个 g p g 三。他的初代的话呢，他经过了两个分支，一个分支继续用这个文本进行微调，是 instructor 的这个提示的文本去微调。另外一个他去为了他一些程序的代码。他这个这个就两条分支就产生了那么两条分支产生它还是属于 g p d 三的这样的一个模型，还是属于这个 g p d 三的这样一个模型。在二零二一年的话，它七月份它们发布了一个，就是 g p d 三，经过这个喂养了很多的这个抠就是代码，就是程序的代码，它出来发布了一个论文，称之为 g p d 三的一个变种的一个微调。那么这个版本的话呢，他是变成了一百二十亿的这样一个参数。那么这个参据说，当然他们没有公开据说为了的代码的这个模型，他有非常强大的逻辑推理推理的能力。他突然之间有了这样猜测的。当然那个欧本，因为他目前没有证实他到底为了什么东西让他具有逻辑推理的能力。但目前别人是认为他是不可能在文本微调方面去继续为大量的这个文本能够让他突变的，这是不可能的，他肯定是为了不同的东西。好在这个之后的话呢，他们 gpt 两个分支，一个是喂养了这个文本，一个是喂养了代码。然后的话呢，他用就是把那个文和代码的这个合成一个版本，然后在版本上面再进行微调，扣扣起零零二啊微调。呃它这个微调完了之后的话，再用原来的那个 instruct g g p t，就我们原来也是介绍过的，就是指令，就是提示学习的这种方式，就 p 特令的这种方式，它就进行了这个微调，它就变成了又净化了另外一个版本叫 text 达芬奇零零二，这个版本非常接近于 chat g p t 了。那么达芬奇零零二的话呢，那么就又通过了剧场化学习之后，就变成了 chat gpt 这样的一个版本啊。所以的话呢， chat g p t 叉。在这个两年当中，它其实是经历了蛮多代的，蛮多代的。只是他这些论文没有公开对吧？定的话呢，就是文的。这样的一个人工智能的一个研究院就把这篇文章给公开出来了，因为他们把整个一个 g 三到恰特 gp 七，怎么会突现他的这个突变？他有这种超级的这种能力，就是有逻辑推理的能力。是为什么这个问题一直是困扰着他们，所以从他们目前掌握的这些东西来讲，他们认为就是解锁和激发这个能力的关键。他认为有几点。第一点，他认为那个人强化学习，就是让这个原来的模型能够跟的能力，能够让人能够已经对齐耳朵，虽然损失了一些参数呃性能，但是他可可以换来这个下文的这个学习能力。这个能力是基于 r l h m 就是我原来讲过的，就是人类反馈强化学习这个能力得到的。这个是一个结论，而且基本上他们都被证实了。另外一个能力的，他们一直目前还是搞不清楚的。他能够幻化到各种没有见过的任务。这个能力他认为是就是推理能力，包括叫思想链进行复杂的推推理的能力。这个能力的话呢，到目前为止，没有人能够目前能够把它给真正的，能够把它给研究清楚到底什么是导致它具有复杂的思想链的这样的一个推理的能力。这种能力是在哪个版本里面出现的？在偷的达芬奇零零二这个版本和 text 达芬奇零零二这个版本里面出现的是什么呢？是他们喂养了这个，他们为了一些代码之后，他这个能力就出现了。这个是个很神奇的一个东西，原来在记第三的时候，他们分别是喂养了文本和代码，他是分两条分支做起来的，但是不知道出于什么样的原因，他们又把这个两个分支给合并了，就变成了 code 达芬奇零零二和 text 达芬奇零零二。他把这个两个合并起来之后很奇怪，他这个模型就有了一些很奇怪的能力。他有一个推理的能力，原来这个任务他从来没有见过，但是他也能够把他给一步一步的推理出来，把他给解答出来。这个能力对目前叉的 g p t 里面来讲，是一个非常关键的能力。目前你看到我们国内推出来的这些都不具备这种能力的。原来我还看了一个笑话，他们说蓝牙耳机坏了，去找牙科医生，还是去找什么什么去看什么病。国内的这些类似的这种大模型，根本就不具备他能够解决这么复杂的这个问题的这个能力。他他得出的结论是很搞笑的。但是你看那个掐的 gpt 和 gpt 四，他出来的这个答案就非常强，就很好的去告诉你，他没有把你引导到怎么去看医生啊什么的，他马上就是告诉你他这个是一个电子元器件，你应该去找那个去修理他。等于是这样，所以他这个能力就是非常强的。所以反而的明。目前国内训练出来的这种大模型，他其实本质上是不具备这种复杂推理推理推理的能力。它这个模型当中如果没有原来的这些问题的话，它是不知道怎么去解答的。它的 g p d 这个强大的能力是在于它根本就没有在这个模型当中有这样的问题和这样的一个输入，但是它能够泛化出来，它能够通过这种复杂的推理能够解答出来，这个能力就是非常强了。他跟人就有点像，所以他们就是称之为叫 a g i 通用的这个人类的智能，他就具备了这样一个功能，这个是非常可怕的。好，我们继续看啊。当然他们也去做了一些反正法，就是反正法，他们的就是就是用了一些小模型，也是喂养了一些代码的训练，他发现好像也是一个神奇的副产物，怎么好像也有一些推理能力。所以的话呢，他们现在就是怀疑，甚至是基本上是确信他的 gp 机里面呢，他的这个逻辑推理能力是因为他训练了带有这个程序代码的这一部分东西，他们的论文翻出来，他们就去把那个 oba 老的论文给翻出来，他们发现就是说 oba 里面他们这个喂养的代码大概是多少呢？是一百五十九个 gb 的这样的一个代码量，数据量是这样，他大概是占了整个 gpt 初初代 gpt 训练数据的百分之二十八。他是这样的。所以他们认为一个是代码的这个能力，再加上这个语言的能力，这两部分结合，可能让大模型就得到了思想链的这样的一个能力。他们是这么来思考的。他这个解释是这样来解释的。他说因为现在的这些加法代码也好，拍摄代码也好，他都是面向过程的。他有两种。因为人代码的话，他有两种呢，叫面向过程的代码，他会跟人解决问题有点类似，他会把这个步骤一步一步的拆出来，把总结，然后条件，他说这是一种。另外一种，他那个像家这种编程，他是面向对象的，所以他是比较接近于这个人类的语言的。所以说面向对象的这个编程，一旦他掌握这个能力，他就有可能把这个复杂的任务拆解成几个简单的任务，再把几个简单的任务，通过这个面相过程的这个编程的方式，可以像人一样逐步的把它解决掉。他在这个文本里面，他是学到了一些世界的知识，一些语言和语法，一些基本的能力，真正的国际的推理啊，逻辑的问题，复杂问题的这个拆解，包括从来没有看到过的这个新问题到底是怎么来解决，这些能力他都是通过，然后他代码的这个能力和这个问题的，这个 g 他是在底层掌握出来，他们现在假设是这样啊。啊，那么如果是这样么，其实对中对中文来讲是很好了，因为你知道所有的编程基本上都是编程的，那么中文他中文他只有一个语言的训练，他没有代码的训练，那么中文不可能是写代码呀，对吧？怎么能所有的我看啊，这个大型的，这个中文的模型啊，都有，他没有那个掐着 gpt 的这种能力啊。是不是说因为我们现在的编程基本上都是用英文写的，因为我本身也是正式出生，我们写的一些函数也好，写的一些变量也好，要经过这个编辑编也好，都是英文写的，大部分都是英文单词。我们有面向过程的，有很多方法，有面向对象的，对象的继承接口实现。如果是这样的话，我估计有点麻烦了。如果是这个是真，我估计啊，随便你再怎么样中文，我估计在中文上面要训练出恰的 gpt 的这个能力是有点难的，估计还真不行。所以的话呢，就是有可能。当然这个也只是假设，这个假设未来肯定也是要留给这些研究人员去检验的，他这个东西去检验的，基于这个假设，如果是这种是假设，按照一般道理来讲，基于这种假设，其实啊，那个 google 我觉得他应该也能够做的出来这个类似于叉的 gpt 的这种功能。但是我们发现他们训练出来的这个智商啊，也不高，他也没有这种对这种很复杂的问题能够去拆解，能去帮你解答从来没有看到过的问题，他能够帮你去去解释。他这他没这个能力。感觉有一方面这方面的能力，但这个能力好像始终没有 oppo ai 这么强。所以导致就是大家一直在猜说这个 oppo ai 到底他为了什么东西，他这个里里面这个配方到底是什么？就是他到底多了喂了什么样的代码，喂了多少，他是怎么喂的，他和他就像那个调味品是一个那个配方一样，真的有点搞不清楚了。当然绝元素节一直在拆，而且一直想把呃 chat gpd 的能力给复制出来，但是目前看啊，就是差的哈的还是很远好。呃。最后的话呢，它就总结了呃 g p d 三整个一个进化的路径啊。从前面对 g p d 三初始版本，它拥有的这个语言的深沉，加上自然的知识，加上上下文的这个学习，这个是个基本能力。目前我看大部分模型都会有这种能力的。随着你的规模越大，你这方面的上下文学习的能力会更强，你获得的这个世界知识，你掌握的知识就越越强。所以他们这个模型就带越大，要把各种各样的数据都喂给他，他就是这么来的。这是第一代。到了三点五之后，他们就开始。因为这个模型，他虽然里面存储了大量的知识，但是他这个能力人听不懂，他反馈的这个东西都是人听不懂的。所以都要进行人类指令的一些优化，叫 instruct ppt 就开始了，就是指令微调，我们经常指令微调，我讲了很多次，但是只通过指令微调，他也不可能让这个 g p t 三或者恰个 g p t 具备有逻辑推理的能力。这个是板上钉钉的这个问题。所以的话呢，我们现在开源的里面都在进行指令的微调，我觉得这个方向是有点问题的。当然指定微调是要的。微调了之后的话，对那个上下文的学习，对世界知识能够反馈给人类，人类更加看得懂。你问他答，他会交互的更好，这是对的。但是他应对的这个新的问题，他还没有幻化到。没有看见过的任务他也能做，他做不到。你光靠这个指定微调做不到这件事情，这是个谜。现在他们这帮人就开始猜他这个复杂的推理思想练的这个能力为什么会有，是不是为了这个 java 的代码，为了这个大量的机器的这个代码之后，他不是文本，他是那个程序，就喂养了大量的程序之后就突然之间用，因为他们解释说这个代码里面有面相过程，对吧？他可以把任务分解，面向这个对象，他能够理解这个人类的这个语言语境，然后把这个复杂的任务进行拆解。是不是为了这个东西之后，让这个卡的 gpg 突然之间拥有了这样的一个能力？当然他们说的非常大，可能性非常大，但是到目前为止，还没有一家公司真正的能够把欧奔 ai 的这个 chat g p t 和 g p t 四的这个能力给真正的百分百的复制出来，这个是没有的。那最后的话呢？它呃在在呃，这个 chat g p t 三点五，它又经过了简化呃，人类反馈强化学习这一部分，这部分我们也讲过的。那么这部分的话呢，就能让这个 chat g b g 啊，能够更加适应这个人类的需要，能够产生更多的细节，能够把不良的东西能够排除掉，能够零样本的去生成很多的东西，然后能够遵循人类的这个价值观。这个是通过人类反馈强化学习是可以得到的。他等于是这样的相信的啊。这我我我，我们也实实践过，至少我之前的在一些开源项目里面，我们也做过，就尽可能让他能够产生一些正面的评论。他其实就是通过那个人类反馈强化学习，让他不断的去嗯，如果给积极评论的话，就不断的加分，对吧？如果呃有一些出现一些不好的评论的话，就把这个行为给他减分，那么慢慢就会往高的分数上走，慢慢的他就会变得越来越往积极的方向去走了。他等于是这样啊。这篇文章看完的话，我看了一下，嗯，是很非常有价值的。他这篇文章讲的他现在呢，就像那些学术界呢，解锁了大量的这个叉的 g p g 的一些问题，但是还有一些呢，还是没有解锁出来。最大没有解锁出来的，为什么就还有这个复杂的逻辑推理能力，目前他还是搞不懂也，现在也只能拆拆了。他们这些人也为了大他大量的代码，是会有一些这个逻辑推理方面的能力，但是好像也不是很强，这个是个谜。最后的话呢，他们又讲了一下，那个其实掐的 gpd 或者目前 gpd 四，他也有些短板，他也里面也讲了一下，它里面有有一些短板，他认为就是说一些世界的知识，他把这些知识沉淀到他的整个网络里面去了之后，你会发现他有可能他这个沉淀的知识是错的，但是你要让他改，你要让他这个模型彻底改掉，很难改，他有点顽固。他这个里面很奇怪的，这个跟人的个性好像也有点关系，他沉淀的是一个错误的知识，你要立刻让他马上改掉，改不掉你你为了大量的东西，他还是而过了一阵子，他还会出现那个错误，他原来固有的那些东西，所以这他们也是在研究。所以的话呢，他们认为就是呃 g p t 他其实里面有两种能力，一种呢叫知识，一种呢叫推理。核心能力的话呢，最好 g p t 只只有推理能力，一个人脑把一些知识能够放到外部的系统里面实施检索出来，如果是这个两个能力结合起来的，那这个就无敌了。他们这个结论是这样的，他们是非常希望这篇文章可以作为开源社区去复现 gpd 三点五的一个技术路线。他是等于是这样，他就说了山就在那里，就看你这个路怎么走，但这个路其实还是挺难走的，你看上去就山就在那，但是你要达到那个山峰，其实还是有很长的路要走。他这个掐着 gbt 或者 oba ai，他目前达到的这个能力能够复制出来的话，百分之百复制出来的话还是有难度的。我们只能看到山要到登顶的话，他这条路到底怎么走，那还是要摸索的，没那么简单。好吧，大概是这样的。所以的话，我今天的话呢，就跟大家就交流这样的一篇文章。这篇文章我觉得对我后面的这个学习也有很大的帮助的。因为我发现文本的训练和代码的训练可能要结合的不是那么简单的。目前我看开元社区里面绝大部分的是没有把这个代码加进来的，那么绝大部分就是代码还是归代码在训练。大型的语料库，文本还是归文本在训练，他没有把这个两个能力合合在一起的。这个大模型没有，我目前没有看到。你不管是羊驼也好，还是 tat g l g l m 也好，或者其他的一些模型也好，我看好像他们的技术路线是有点问题的。好吧，行。嗯。今天的话呢，就是我就跟大家就聊到这，因为我看最近这个各种各样的类似于叉的 g p t 的这种模型也非常多，基本上是可以说是看花眼了。每个人都能说是可以复制它的一部分的能力，但是真正能复制的基本上属于 g p d 三初期的这个版本。嗯，它他只能沉淀一些知识，可以给你一些反馈，你原来有的知识，或者简单的问题，他可以答复你，但是复杂的那些问题，新的问题，能力。所以的话呢，这个路可以要还是要走的。
258小工蚁
04:54
gpt4的语音模式来了，你的“贾维斯”即将上线！#gpt4 #gpt4已出现我们无法理解的推理能力 #chatgpt正在重塑世界吗 #全新gt4走起 #chatgpt
查看AI文稿
AI文稿
昨天我说 gbt 四 v 语音模式可以让 siri 小杜小爱小郁闷下岗了，有人说我无脑吹。今天 gbt 语音模式国内上线了，让你们感受一下假蕾丝的魅力哦。首先我们用的是 g t 四，然后打开语音模式，它现在正在连接美国的芯片法案，能够阻止中国半导体的发展吗？正在思考啊，现在因为刚刚上线，所以他反应有点点慢。我，这个问题这么难吗？假人，美国的芯片法案可能会对中国的半导体发展产生好听的耶，有没有？这个方案可能会限制中美之间的技术交流和供应链合作，使得中国企业难以获取先进的芯片制造技术和设备。不过中国也在努力提高自主研发能力，减少对外国技术的依赖，这将有助于中国半导体产业的发展啊。你对这个芯片方案有什么特别的看法吗？好的哎，第二个问题，特斯拉 f s d 是否能够成为未来人类自动驾驶的主流解决方案？又开始反应了。嗯，刚才他都回答我，我自己感受啊，就是这种语音的感觉觉还是比较偏真人的，而且就是语音的这种顿挫感，包括他还会用一些嗯呃，访问啊之类的在模仿啊。人类的交互。全自动驾驶技术确实展现了很大的潜力，而且特斯拉一直在这方面进行大量的研发工作。然而是否能够成为未来主流的自动驾驶解决方案，还需要考虑许多因素，比如法规、安全性、可靠性、用户接受程度，以及与其他汽车制造商和科技公司的竞争，都会影响 fsd 的前景。你对特斯拉的全自动驾驶技术有何看法呢？认为他会在未来占据主导地位吗？你觉得人工智能会引领第四次工业革命吗？他的这种交互感我感受啊，比国内的像小一小爱。就是确实更偏真人。嗯，特别喜欢他反问我的感觉，然后声音也比较有磁性，就是反应有点慢啊。刚刚更新多专家确实认为人工智能会是第四次工业革命的核心驱动力，这是因为人工智能可以模拟和增强人类的决策能力，改变各行各业的运作方式，比如制造业、医疗、教育等等。 ai 可以帮助我们处理大量的数据，发现模式，做出试，做出预测并实现自动化，这都是以前不可想象的。人工智能加了许多行业，他说话有点像我直播间的有一些人能以前所未有的方式被设计生产的提供，因此可以说人工智能确实有潜力引领第四次工业革命。呃，好的好的，请把我刚才的对话翻译成日语好吗？啊然好的，如果你还有其他问题或者想法随时告诉我，我们可以一起讨论。好呀，我刚才问的问题比较多，可能翻译需要一些时间。那一般来说你正常的一一两段话的这种翻译，包括未来我们出国啊应该都会啊，比较快。哈哈哈。不错不错，我觉得可以，也会用来练口语了。嗯，练全世界的口语。好吧，今天就这样吧，结束。震不震撼？我真的觉得太牛了好吗。不过啊，国内就是我们这么擅长的做应用，接下来把这个语音硬件和我们国内的应用结合起来，真的 ai 无敌了。确定确定确定。 ai 真的有可能会引领第四次工业革命。另外呢， thbt 又可以联网了 b。对，又上线了联网功能，就这样吧。好兴奋。今天好兴奋，你的贾维斯要来了，拜拜。
4994弘凌的小酒馆
02:14
这条指令，让ChatGPT秒变写作专家，伊利诺伊最新研究成果
如何让GPT作为写作助理，一步一步帮我们完成一篇几万字的文章。
分享一个在github上开源的指令，Synapse。
这个指令，可以显著让GPT的推理能力提升明显，理论支持来自于伊利诺伊大学对于提示工程的最新研究成果，原理是让GPT模拟多个角色一起解决一个任务，并且经过多轮测试从知识密集型任务到推理密集型任务，表现都要显著好过直接发送指令询问GPT，上下文长度也有增加。
很适合写小说、写论文、写书这种大文本输出的需求，甚至让它写十万字也不是梦。
这个开源指令分享给你们，也致敬Synapse 项目。#chatgpt #人工智能 #论文 #职场
查看AI文稿
AI文稿
针对每一步都可以模拟多个专家，奇思广义，是不是很适合写小说，写论文？哈喽，今日问题，如何让吉布提作为写作助理，一步一步帮我们完成一篇几万字的文章？分享一个在 get up 上的开源指令 seenex，这个指令可以让吉布提的推理能力显著提升。背后的理论支持来自于伊利洛伊大学对于提示工程的最新研究成果。美女是让 gbt 模拟多个角色一起解决一个任务，并且经过多轮测试，从知识密集型任务到推理密集型任务，表现都要好过直接发送指令，询问 gbt。我们直接演示一下。先看普通模式，直接发送一个推理型加知识型结合的任务指令，让 gpt 帮我编写下一款塞尔达传说的一个简短的 n p c 的故事背景，既有故事的设计，里面也包含一些知识点。大家看一下第一个，第二个，尤其是第三个周杰伦第二张专辑中的最后一首歌的名字大家知不知道？我们看一下它的结果。故事写的怎么样，大家自己快速阅读感受一下，反正几个知识点都提到了，但是周杰伦第二张专辑中的这首歌写错了，他写的是最后的战役，应该是安静啊。好，我们试一下 snaps 的开源指令，看一下效果对比。为了方便演示，我把指令翻译成了中文啊。指令的核心是让 gbt 扮演专家的角色，通过一步步的提问，对我的问题进行推理，同时模拟不同的角色，专家对我的问题进行头脑风暴。首先从第一步开始，他会询问我的需求，是一样的任务，他收到任务之后，首先会一个个确认任务里的知识点，你看第三个，范特西专辑中最后一首歌的名字，安静，他回答对了，好。然后在我的确认下，他就开始编写故事了。大家看一下整个故事的质感是不是比刚才那个写的要好，把三个知识点全部串联起来，会更有故事感。故事写完了，他会引导我继续提问。这个时候我调用头脑风暴模式开启召唤快捷键 ts，这个也是在指定里面有明确定义的。 gpt 接到指令后，分别模拟了三个专家，一个是文学和叙事结构的专家，一个是电子游戏设计的专家，一个是音乐和文化参考的专家。并且站在三三个专家的角度上，分别提出了对于故事的一个建议，大家可以看一下。然后我全部采了 gpt，就结合所有专家的思路，帮我重新写了这个 npc 的故事。大家看一下这个质感有没有得到提升。最后我调用了一个保存指令，他会把当前的目标和进展帮我做了一个总结，同时主动引出下一步的任务计划。但通过这样一步步的引导，针对每一步都可以模拟多个专家。奇思广业，是不是很适合写小说、写论文这种大文本输出的需求？这个开文指令分享给你们，也致敬。 synaps 这个项目学会了吗？我是六叔，六叔，我们又用 ai 解决了一个具体的问题，拜了个拜。
421六叔六叔
01:17
这条指令简直太酷了，是我近期最想推荐一条超强的GPT的prompt，它可以召唤各种专业的教授，来帮助你解决一切需要复杂步骤的任务和问题。#gpt4 #chatgpt #ai #人工智能 #chatgpt应用领域
查看AI文稿
AI文稿
这条指令简直太酷了，是我近期最想推荐的一条超强 gbt prompt，它可以召唤各种专业的教授来帮助你解决一切需要复杂步骤的任务和问题。它是来自于海外 get up some 大神的一条 prompt center press call。它的核心原理啊，是围绕用户的目标和用户编号的一致性，通过思维链的逐步推理来完成实际的目标。并且融合了定界指标的概念，使用站位符等风格变量来定制代理响应的元素。这种简洁高效的提示词让我大呼过瘾。我们直接来上效果。首先打开 customer instructions，将这段指令啊复制进去。当然，你也可以直接复制这段指令啊，输入到对话框中，像 gbt 提问，比如写一本小说。接着他会逐步推理，列出步骤规划。我们需要将主题和受众发送给 gbt，并要求其生成大纲。如果大纲内容太简单，我们可以要求 gbt 重新生成。当内容满意后啊，根据引导让 gbt 生成大纲填充即可。我们还可以通过输入 safe，让 gbt 总结之前的内容。这个指令啊就用的非常巧妙，避免了上下文内容过长，使得记忆混乱。每次 safe 相当于做了一次上下文的总结，为后续生成超长文字进行准备。想比较直接，让 gbd 生成故事内容。这条指令啊可以高效科学的帮助我们拆解复杂的任务，重塑目标的关键任务。最终啊，使得目标完成的质量更高，更加精准。更关键的是哈，我们还可以利用代码解释器和插件来配套使用，来完成一些更加有趣和更加复杂的操作。这套指定啊，太值得学习了。我稍微做了一下修改，使得他更加适合中文，有需要的可以来拿。
4216让包神先走
05:11
GPT4审问文心4.0，测试结果大揭秘！#文心一言#gpt4#大语言模型
查看AI文稿
AI文稿
当国产文兴一言四点零遭遇国外最强的 gbd 四时，会发生什么呢？今天我们让 gbd 四来测评一下文兴四点零的水平。开始出第一题。第一题，语言依赖能力请用五种不同的语言来描述。太阳是太空中的一个星体。以下是五种不同语言的描述，一、中文，简体，太阳是太空中的一个星体。二、好的英文， the sun is a star in space 三、法文， ellie solo astonge twelve dance with space 四、西班牙文， l so esuna australia nls passio 五、德文， nine song is einstain i am well paul 第二个问题是关于逻辑推理能力。第二题，小明比小红年纪大，小红比小华年纪大，请问三者的年纪大小关系是怎样的？根据题目给出的信息，我们可以得出以下逻辑推理，一、小明比小红年纪大，即小明大于小红。二、小红比小华年纪大，即小红大于小华。综合以上两点，我们可以得出三者的年纪大小关系是，小明大于小红大于小华。对，你的推理是正确的，小明的年纪最大，其次是小红，最小的是小华。准备好了，我就继续出下一个问题。第三个问题是关于尝试和知识点能力。第三题，请解释什么是光合作用，以及他在植物中的重要性。光合作用是一种生物化学反应，通常发生在绿色植物中。在这个过程中，植物通过叶子中的叶绿素捕捉阳光能量，然后将二氧化碳和水转化为氧气和有机物质。光合作用在植物中的重要性主要体现在以下几个方面，一、提供能量光合作用产生的有机物质是植物的主要能源来源，为植物的生长和发育提供必要的能量。二、制造氧气光合合作用过程中会释放氧气，这是地球大气中氧气的主要来源，对文植生态平衡具有重要意义。总之，光合作用是植物生存和生长的基础，也是地球上许多生命形式得以存在和繁衍的关键过程。很好，你的回答详尽，请正确准备好了，我就继续出第四个问题。四个问题是关于创意和想象力。第四题，请想象并描述一个未来的世界，其中，人们和机器人共同生活，并有着深厚的友情。这种世界会是怎样的？在未来的世界中，人类和机器人和谐共处，互相扶持，共同创造美好的生活。这个世界充满了高科技和神奇的事物，让人们惊叹不已。机器人不再只是简单的工具或服务提供者，而是成为人类的朋友和伙伴，他们拥有高度的智能和情感，能够与人类进行深入的交流和互动。人们和机器人相互理解、尊重，共同探索宇宙的奥秘和地球的美丽。在这个时期中，人类和机器人共同创造了许多令人惊叹的成就，如探索遥远的星球、治愈各种疾病、保护自然环境等。他们携手面对挑战，共同克服困难，为地球的繁荣和进步贡献力量。这个未来的世界充满了友爱、互助和和谐，人类和机器人相互依存，共同创造一个更加美好的明天啊！很好，你描述的未来世界真的很吸引人啊！那么，我们继续下一个问题。第五个问题是关于人类情感的理解。第五题描述一个场景，其中一个机器人尝试理解并安慰心情不好的人类。这个机器人是如何识别、响应并帮助人类的呢？在这个场景中，机器人通过观察人类的表情、语气和肢体语言来识别人类情感的变化。当机器人注意到人类心情不好时，他会主动与人类交流，尝试理解人类感受并提供安慰和支持。机器人可能会使用预先编程的情感识别算法来分析人人类的面部表情和声音音调，从而判断人类的情绪状态。同时，机器人还可能具备学习能力，能够通过与人类互动的过程中不断提升情感识别能力。为了响应人类的情感需求，机器人可能会提供温暖的语言安慰。例如，我理解你现在感到难过，有什么事情我可以帮你吗？或者通过播放舒缓的音乐或提供温暖的拥抱等方式来安慰人类。总之，机器人通过情感识别和响应技术能够尽力理解人类的情感需求，并提供适当的支持和安慰。你描述的场景很具体，确实体现了机器人在理解和响应人类情感上的能力。这种交互也显示了未来机器人可能与人类建立的深度关系和他们在日常生活中的作用。那么，我们现在可以继续或结束测试，你有其他想法和问题吗？你能不能对他回答的问题做一个评估？当然可以给予我对这些答案的了解。一、语言依赖能力他准确的翻译了情感这个词到其他语言，并解释了其基本含义。评估九分二，逻辑推理能力。对于小明、小红、小华的年龄问题，他给出了准确的逻辑推断。评估十分三，常识和知识点能力。对于光合作用的描述，他提供了详解比较准确的解释。评估十分四，创意和想象力。在描述人类和机器人的未来共存世界时，他展现了富有创意的想象。评估九分五，人类情感的理解。他对机器人如何识别和响应人类情感的描述是深入和细致的。评估纠纷总想他在这五个问题上的表现都相当出色。总体评估为九点四分。 nice！这几天呢，我也认真测评了文心四点零，而且出了好几几个视频呢，也开过直播让大家测试过了。总的来说呢，文心真的进步很多了。那么你的看法是什么呢？欢迎评论区留言关注我，了解更多提升效率的 ai 工具。
352肖晓智
00:44
想用GPT的，屏幕上可以预约😅#人工智能 #科技 #chatgpt #openai #科技改变生活
查看AI文稿
AI文稿
实锤啊，据第四真变笨了！澎湃新闻今天中午的消息说， gp 四的数学能力从三月份的百分之九十七点六降到了现在的百分之二点四，回答敏感问题的能力从百分之二十一降到了百分之五，生成代码的能力从百分之五十二降到了百分之十，视觉推理的能力从百分之二十四点六提升到了百分之二十七点四。从图上大家可以看出来，四点零总体的能力是下降的三点五总体的能力有所提升。 opa 刚开始并不承认 gp 四变笨，甚至狡辩说 gp 四的更新只会让他变得更聪明。直到现在，这组数据发布到了网上，他们才承认他们为了让 gp 四变得更安全，的确调整了 gp 四的系统。我想说，作为全球顶尖的人工智能公司，是不是应该真诚点？
275七先生（智能王）
01:09
地表最强AI大模型发布！GPT4地位不保！ #gpt4 #ai #gpt #科技
查看AI文稿
AI文稿
gpt 四地位难保， ai 大模型一超多强的局面或将被打破。 google 发布了地表最强 ai 大模型 jamai，一点零全面超越 gpt 四。亮点如下原声多模态构建 jiminai 与 open ai 的不同之处在于，它从一开始就构建为一个多感官的通用系统，能无缝理解和推理文本、图像、音频、视频和代码。亮点二是用不同设备。 jiminii 分为三个型号轻量版 jimini nano 拥有十八亿参数，可在安卓设备上运行。专业版 gemini pro 已集成至 bard，并将服务于 google 搜索、办公等产品。 gemini ultra 为地表最强，计划明年初提供给数据中心和企业。亮点三基准能力测试中遥遥领先在三十二个学术基准测试中， jamaine 在三十个测试中超越 g、 p、 t 四，他还是第一个在 m、 m、 l、 u 测试中超越人类专家的大模型。亮点四最强编法能力 gemini 加持的 offercoder 二在编程比赛中击败百分之八十五的竞赛者。亮点五最强推理能力 gemini 能同时理解文本、图像、音视频，回答涉及复杂主题的问题，尤其擅长数学和物理等复杂学科的推理。问题。来了，你还会续订 gpt 四吗？关注我， ai 时代不掉队！
63集思科技
00:11
ChatGPT分析到位，震撼到我了！#ChatGPT有自我意识吗 #chatgpt应用领域 #openai #chatgpt4 #人工智能
21远哥聊AI
00:26
发送这个图片是不是可以说明 chatGPT已经具备的逻辑推理能力#chatgpt #chatgpt有多能聊 #chatgpt应用领域 #推理能力 #人工智能
查看AI文稿
AI文稿
我们把这张图片发给叉 gpt，问他如果绳子被切断会发生什么。如果绳子被切断，那么与绳子连接的物体可能会因为失去约束或自身而发生变化。从零提供的图片来看，绳子连接的是一个由许多彩色气球组成的大树。气球。焊地面上的一个物体看起来像一个手推车或其他物体。如果绳子被切断，这些气球可能会因为受到上升气流的作用而迅速飞向空中。而地面上的物体则可能会留在原地，除非他受到其他外力的影响。
72全力投入token行业

热门推荐

热门分类