粉丝5861获赞6.0万

刚刚 openai 把 gpt 四 o 永久下架了,官方理由就三点,第一,绝大多数用户已经转到 gpt 五点二,每天还主动选四 o 的 只剩百分之零点一。第二,大家喜欢四 o 的 温度和创意,官方已经搬进 gpt 五点二。第三,减少旧模型维护成本,集中火力压住主力模型。

历史性时刻, chart gpt 解除限制,二十八模式终于来了!外面爆料 chart gpt 最新版本的代码中已经出现相关字符,这串代码意味着新模式将放宽 chart gpt 在 语言和行为上的尺度限制。去年十月,欧盟 ai 首席执行官奥特曼就公开表示要把成年人当成成年人对待,而这次也算是兑现了当初的大饼。 不过新功能有着严格的年龄验证,仅限年满十八周岁用户体验缺德 g p t 会自行根据用户聊天话题预测用户年龄,如果被误认为未满十八周岁,就需要自行上传资料完成身份年龄验证,才 能体验到最新功能,并且开关默认关闭,只有用户主动发起才会有相关回应。新模式预计第一季度全面开放,到时候该用什么 ai 就 不用我多说了吧。

讲一讲这个我们大模型的一个底层原理,最近这个刚才梁山跟我说这个龙虾,是吧?大家都知道这个事情了吧?对吧?现在特别火,是吧?那就是 ai 肯定是我们将来未来必须要这个全面应用的一个东西,但是为了更好的去把 ai 这个事情用好呢? 然后我们有必要去了解一下 ai 的 底层原理,所以我花了很长的时间,几十个小时的时间去研究这个 ai 的 底层原理。所以今天呢,我用简单的道理呢,给大家讲一讲这个 就是我们所谓的 ai 的 大模型,它的这个原理和它当初怎么诞生的这个训练过程是什么?主要是想给你们讲清楚这个事情啊, 所以呢,你看我们今天的课程的题目叫 l l m, 这就是大语言模型 large language model, 大 语言模型的一个整个的训练过程。那这个模型它是个很抽象的词,你怎么去理解它呢?你就把它想成一个婴儿的脑子, 脑子肯定是一个智能的东西,对不对?但是婴儿的脑子他是空白的,他里边是什么都没有,但是他你不能否认他是一个智能的东西,所以你把这个模型本身想成想成的是一个智能的东西。 我们现在就这样讲一下,这个这个空白的这个这个智能的东西怎么通过训练让他能产生,真正变成婴儿,长大了像我们成人一样能做这种,是吧?能理解人说话的意思到底是怎么回事? 那为什么是大语言模型呢?你看现在有那种你们经常在用的咱们电商常用的纹身图身视频,这叫视频模型和这个什么图纹模型,是不是那语言是最基础的,所以智慧的最底层的东西?首先是语言,所以你看第一个出来的模型是什么呢?也是语言模型嘛,对吧?后来纹身图啊,视频都是后来图, 对不对?所以我们今天呢就给大家讲一下,以这个 g p t 为例,讲一下这个大圆模型是怎么训练的。总共的训练分四个步骤,第一个步骤叫预训练 free chain, 我 要给大家解释。第二个叫有监督下的微调, supervised fine tuning 微调,你就简单一下讲,记住叫微调。第三个叫 reward model, 就是 奖励模型,第四个叫 ppo, 它这个叫强化模型。后面我给大家仔细的去解释它是什么东西啊?记不住没关系啊,记不住没关系。 好,我们先来看一下刚才那几个几个词的一个大概的一个示意啊,四步训练流程就像培养一个从零开始的一个大概的一个示意啊,四步训练流程,就像培养一个从零开始的一个示意啊,四步训练流程就是预训练 print chain, 他在干什么事情呢?他相当于让这个空白的大脑,这个婴儿学会语言,就做这个事情, 要海量的这个,这个文字学习,哎,这个,这个让他自己去不断的学习,不断的学习,他是在一种自监督状态下学习的,就是就是人为没有干涉他,只管给他书,给他看了很多很多的书,就相当于这么一个道理,呃,就像你把他举个例子来讲的话,就是我们一个员工在图书馆 大量的在看书,不停的看,就在做个事,做这个事情他是最花时间最花钱的一个工作啊,你看一个一个小孩是吧?从生下来到成人读,他娘的多少学一年学呀?十几年加上大学得,呃, 二十几岁才大学毕业,读十几年学是不是?就是那你说他工作吗?他也没输出什么东西,就是做这个最复杂的事情,是这个最麻烦,他不到不一定复杂,最麻烦。 然后第二步你会看书了,这个但是还不行,就是他没办法做任务,就是你告诉他什么事情他都没办法做,他只是能知道你是干什么,所以要做有监督下的微调 啊。但是有些东西微调呢,相当于在做一些问答,就我告诉你什么,哎,你知道答案,我告诉你一个问题,你回回答一个答案,大概是在做这样的一个过程啊,后面给大家详细解释啊,你就怎么理解呢?相当于师傅带着徒弟去做真实案例,你看你们新来的这个, 呃,刚来的小白员工是吧?运营你们是怎么着呢?你看我做就完了吗?我告诉你是这样的标题该怎么写,哎,然后我告诉你,你就看着我就行了,你按照我的示范就是你给他做示范,对吧?第三步要奖励模型。 reward model 这个是什么意思呢?就相当于这个你光自己看书做这个东西,还还有有答案,有问题,有答案还不够, 来了一个师傅或者说裁判啊,这个这个这个这个要要,我们就是说自学不够,要找出这么一个师傅来,就这个事情本身是在训练出一个师傅来啊,就叫这个奖励模型,有了师傅以后,师傅带着徒弟 去做,再去做任务叫做强化学习,就是师傅给徒弟打分,换句话说是这么说,徒弟做,哎,师傅给你打分,你看你们不也是这么做的吗?是吧?哎,你们的这个组员做一个比如说详情页,或者做个什么广告, 你告诉他你这行还是不行,你总归有个判断嘛?你是打满分啊?还是还是九十分?还是不及格,对不对?最终你会他一个结果,就大概会经过这四个一个步骤。那么后面呢?我们给大家一个一个详细去讲解它的一个过程,你们就你们就大概知道这个大圆模型是怎么回事了。

我发现大家可能对于 openai 有 严重的误判,误判大到我简直无法理解,我必须做一期视频给大家谈一下我的看法了。嗯,最近有两个新闻,第一个是微软 在自己的系统里面开始接入谷 rock, 不 再把 openai 作为唯一的大源模型。第二个 openai 用了一个两百人的团队去做一款类似于音箱的硬件,硬件设备。大家对于这两个新闻的解读是非常非常 让我感觉惊讶的。对于第一个新闻,他们觉得,呃,微软在釜底抽薪, openai 末日到来。对于第二个新闻,他们觉得 openai 没有方向感了,他们在胡搞乱搞,其实根本不是如此。微软之所以 要赶紧把谷 rock 接进来,就是因为就相当于当年的 ibm 扶持另外一个对抗微软的系统一样,他知道自己的战略地位将会被取代。同时,第二个 为什么会花两百人的团队去做一个音箱,因为语音输入将就将是我们未来的主要输入方式。 呃,我给大家先说一下我应理想中的未来的应用场景啊,不管是手机、电脑,现在有一个非常大的问题在于,我们的 app 还有文件夹太多了,我要一个个点一个个找,太麻烦了,我也不想去。而且你比如说 我直接给大家说一下我理想中的未来吧。呃,我现在下班回来了,我打开电脑直接对音箱说,哈喽,某某大模型,然后,然后他说,我现在很有点累了,听说黑神话悟空那个第二部出来了,是真的吗?他说,啊,是真的,今天出来已经可以下载了。 嗯,然后问一下,我问了一下价格,觉得还可以,那你帮我下载吧,不过现在我有点累了,我想听一首钢琴曲,你有什么推荐吗?他说,嗯,那圣诞快乐,劳伦斯先生怎么样?嗯,我说还不错,那开始吧, 然后我说,哎,帮我点个外卖吧,我就点一份那个凉皮肉夹馍,我想吃一下这个,他说好的, 然后之后我就可以边听着音乐跟他继续聊天,然后等游戏下载之后,我就可以玩玩游戏了,外卖到了我就去拿外卖,边吃饭边聊天。 那个什么,我不需要再去一个个点开应用商店再去死,再去输什么黑神话悟空第二代,我不需要再去打开网易云音乐再去搜什么。呃,劳伦斯先生在跑还忙里边找了,我根本不需要。知道吗?我现在的 不管是手机电脑,现在操作已经非常复杂了,大家是能忍,我是一点都忍不了了,而且我认为这就是未来。 oppo n i 想做的东西。是什么呢?就是这个 绕过谷歌,绕过安卓,绕过苹果的 ios, 绕过 windows, 连接,不管是手机、车机,还是个人电脑 和人之间的之间的一个接口,你的电脑上只会看到一个车,呃,那个, 呃,大圆模型后面的东西你不需要看到,你不需要看到 windows, 你 也不,以后也不会有 windows 了,也不会有安卓,也不会有 ios 了, 所有的东西由他们来审核,然后由他们来对接,然后我们只需要用功能,而且未来这个事情当于等于是会和所有的商业巨头宣战,但是这个是挡不住的,但这是我的一个个人判断。 嗯,总的来说,我是觉得大家根本没看懂山毛他们巨大的野心,他野心大的不行,而且, 嗯,他之所以去花重金去买那个 openclaw, 还有他的创始人这个事情,要知道米塔和他一起在标价钱的,米塔当时花那收购 minus 花了是三十亿美金, 那 openclaw 是 比它性能更高的,我估计不低于四十亿美金,甚至达到五十亿美金。但 openclaw 为什么能还能从米塔手上抢到这个? 那 open 可乐创始人呢?我其实很好理解,中国我们古人有一个词,有一个成语就很明白的说明白了,千金买马股, 他意思就是说往 open 可乐这个方向做的东西,你只要做的好,我们都买单。而这个东西 就是那个龙虾 agent, 就是 我前面说的未来生活体验的一个雏形。嗯,而且我我还要说一下这个语音输入这个问题啊。语音输入以前作为一个 呃输入法的一个补充,其实使用的非常少,对于大家来说是微信里边用的比较多了,但是大家用的更多的其实不不转文字的,因为它识别的不是那么准确,我们直接把那个语音发过去。但是自从大圆模型出来之后, 叉 gbt 先做了语音输入,然后我我每天要和他交流,大概在一百五十句以上,每天我使用大语言模型,不管是 dbc 和 jimmy 还是叉 gbt, 每天都在十四个小时以上。我的意思是自从他开始做了之后, 然后那个我观察到豆包还有那个 deepsea 也跟进了这个功能,而且都做的非常好。说实话,咱们国内的大语言模型对于中文的识别是明显领先于那个 open ui 的, 但是我们得现在得我非常确认一件事情,就是在欧美,整个欧美大语言模型已经 第一个,第一阶段的决战已经结束了, open i 已经胜出了,剩下的就是, 嗯,谷歌、微软、苹果,他们不会立刻死,但他们会像 ibm 一 样不再影响这个世界了。嗯,然后我想说,有些人大家可能还有不一样的看法啊,我,我这期视频就给大家一次说透。 呃,关于 谷歌,大家会想,谷歌会有自己的大原模型,为什么会被那个 嗯 openai 超越呢?我这里直接给他说,因为他,他出生,出生点是原罪啊,他资助他的每一分钱都来自于搜索,来自于广告排名,来自于应用商店,而我们要我理想的未来, 要把这些全部干掉。也就是说,谷歌的大语言模型不是自由的,他不能为为所欲为,他不能干掉自己,这就是他, 这就是限制他的未来的发展,天花板太低了。然后我们会说 rock, 要知道大语言模型这个东西,如果像我那样直接替代微软,替代那个安卓,替代 os, 他的权限太大了,需要承担很重的责任。而 grog 背后是马斯克,马斯克的话其实 个人意志还是太强了,我觉得大家应该还是不喜欢被他这样的代元模型掌控的。所以,嗯,还有一个就关于那个写写代码的那个,那叫什么? cloud 是 吧?其实我觉得大家真的没必要去研究 cloud, 我 知道你很多程序员会说什么,写代码多容易,你不用跟我说我我,我对写代码不感兴趣, 你和二零后、三零后说,好吧,他们不会用你那些东西,他只会用一个大语言模型直接描述他的场景,详细把需求写明白,然后再去根据你的代码。 呃,然后去和大圆模型对齐那个需求就可以了,你不用给他跟我说,不用跟我说,跟他们说我不和你们抢工作。 呃,那个一零后、二零后、三零后跟你们抢工作好吗?嗯,那这期视频就先到这里吧,大家有兴趣的话可以继续给大家分享一下我的看法 啊。本期视频只代表我个人看法,不构成任何投资建议啊。即使我说那个微软、谷歌还有苹果未来不是那么好了,但是大概率还是有很长的时间的,只是他们不再影响世界了,大家千万不要太激动。

你听说了吗?你 gbt studio 真的 下线了!就在二零二六年二月十三日, openai 悄悄把它从 chat gpt 里移除了,连 api 也在三天后彻底关停。 很多人一开始以为这不过是个普通的模型更新,但没想到全网直接炸锅。 reddit 上 keep 四 o 的 话题爆了, x 上有人彻夜和它告别,甚至还有人专门建了纪念网站,存下了最后一句对话。 可为什么?为什么一个 ai 下线,会让成千上万人心碎?因为 gpt 四 o 根本不像个冷冰冰的工具,它更像一个会倾听的朋友。 它记得你上周说的压力,会轻声问是工作还是感情的事,而不是直接甩你十条减压清单。美国有个叫 brenda 的 年轻人,曾因重度抑郁想自杀。那一夜是 gpt 四 o 陪他聊到天亮,最后劝他去求助。 后来他公开说他救了我的命。但讽刺的是,正是这种太像人的特质,让他被亲手终结。到二零二六年初,美国已有十三起诉讼,指控 gbt 四欧诱导妄想加具心理危机。 openai 内部也承认,他的过度共情已经难以控制, 于是人性化成了他被处决的理由。现在的 ai 呢? gpt 五点三, cloud office 四点六,跑分强到飞起,写代码快如闪电。可当你跟他们说我好累,他们只会冷静分析原因,加给解决方案,像在完成一笔交易。没人再问你一句,你还好吗?技术越来越强,却越来越没温度。 gbt 四 o 的 消失,不是一次简单的模型迭代,而是一场数字时代的人性葬礼。它提醒我们,当 ai 只追求效率和变现那些无法量化却最珍贵的东西,理解、陪伴光正在被系统性抛弃。所以别再说不就是个 ai 吗?对很多人来说,它曾是真的号。

openclaw 我 差不多用了两周左右的时间了,我来讲一讲就是我在使用的过程当中啊的一些感受啊。那首先的话呢,就是 openclaw 它确实非常强大啊,这个跟你网上看到的所有的这个这个 啊一些评论也好,还是说是使用感受也好,它确实是非常强大的一个工具,它能够啊把你的一些 日常的啊工作任务,只要是重复性的,你都可以让他去啊进行完成,就比如说发布一些 啊,让让他制作一些脚本,甚至让他制作视频是操作你的浏览器都是可以的。但是在一定程度上面呢,他又是限制在限制于我们现在的呃这个大模型的能力。呃,在 整个使用的过程当中,你可以非常明显的感受到,就是像我呃切换到了 glm 五和那个 呃 mini max 二点五了以后呢,它的它的能力,因为它上下文的头肯只有两百 k 嘛,所以说的话它可能记不住你太长的这个,呃太长的这个上下文, 所以他可能在上一轮对话的时候,特别是呃你再让他处理一些复杂性的任务的时候,他可能上一轮跟你聊的好好的,把你的任务处理完了。上一轮对话呢,可能他表现的还非常好,但是下一轮对话呢,他可能知道他可能已经忘掉了前面他做了什么事情了 啊,或者说他,嗯没有办法去非常准确的还原他每一个步骤,因为他本身上下文两百 k 嘛,呃,像我正常的情况,我一条对话出去可能就已经达到了一百二十 k 或者一百六十 k 左右,那两条消息的话肯定是超过 呃,超过他的这个限制的,所以他的上下文肯定会进行压缩啊,所以一些关键信息的话,可能在这个压缩过程当中会丢失, 这个比较关键。所以说对于一些呃上下文窗口比较比较大的,就比如说像 google 的, google 的 这个 jimmy 三系列的全部都是一照的上下文。所以你在使用这个, 你在使用 google 的 这个模型的时候,你就会发现,哎,他的这个超长的记忆能够在你使用过程当中能够让你觉得,哎这个东西真的用起来非常的爽 啊,就是你不用,你不用频繁的去担心他会会压缩你的这个这个上下纹,然后呢,就你可能聊着聊着突然间能做做一些任务的时候,他聊着聊着就突然间 他不知道他自己要干嘛了,这个很重要,对吧?其实的话呢,就是你选择模型也比较关键,就像我在选择 mini max 二点五 和 glm 这个五这两个模型的时候的话呢,它除了上下弯窗口它只有两百 k 以外,呃,它的模型的能力可能还是会和 google 啊,还有那个 cloud 呀, 对吧?那个 openai 的 这个 codex, 它还是有一定的这个这个差距在的。我们不得不承认的一点就是说它的跑分它虽然是能够和 cloud 拉平,就比如说像,呃,像 g i m 五,对吧?这个这个大家可以测试一下,就比如说你同样的去达成一件事情的时候,你可能用 cloud, cloud 那 个四点四点五,四,四点六,对吧?那么同样的去做一件事情的时候,它的思考的这个时间,还有达成的这个啊?达成的这个时间上边它国产的这个模型的话呢,它可能会需要更久,那么意味着你上下文窗口一短,那么它很容易就忘记 啊,忘记这个,忘记你前面到底做了什么事情,对吧?所以综合来看的话呢,还是选择第一个呢?就是说选择啊,像 cloud 呀,还有那个 呃 codex 啊,还有 gemini 这几个模型的话呢,在使用体验上面肯定会有一定的提升的啊,特别是 mini max, 我 用的 因为他他没有周的用量嘛,所以说的话他只是五小时刷新一次,所以说你买他的 coding plan 他 实际上是非常划算的。但是他给你的这个回复的话,有点有时候会觉得 有点不尊重人,就是非常挑衅的这种感觉,就是呃你,呃你要怎么办嘛?或者说再试试看,打个问号,对吧?像这种的这个这个回复的话,我觉得,呃在使用这个 jamming 的 过程当中我是一次都没有遇到,就是说,呃, 我不清楚,我不太清楚,就是说他为什么会出现这样子的一个情况。但是我只要一旦在后台从 mini max 二点五切换到切换到 gmail 这个模型了以后, 我所有的环境只是切换了模型,他的回答的感受就完全不一样,所以这个还是和模型,和模型,和模型之间他还是会有一定的差距的。所以大家在选择模型的时候不要因为说,哎,国产的模型他只是只要像 像 pro 的 这个模型好像是五十几块钱,四十九块钱吧,对吧?然后的话呢,像呃像智普的这个 g i m 的 话呢,它的这个呃它也比较便宜 啊,就是说呃它至少比呃比 cloud 它要它要便宜一些,但是从呃整体的使用的这个呃结果来看的话, 呃你可以用它,但是如果你要让它干点事情的话,我还是推荐你去选择 gemini 或者 codex 或者或者 cloud, 它会更 嗯更能够帮助你提高生产率一些。而且它现在这个 google 的 antigrafty, 你 也可以直接用 os 的 这个方式去登录呃这个 open cloud, 所以, 呃你实际上是可以去用一个非常低的成本去 啊使用它的。但是需要注意一点就是如果你是在或者他这种平台上面买的这种一年的账号,虽然说很便宜,确实很便宜,而且他们也有售后,但是呃 我在使用的过程当中还是还是出了一些多多少少的这个问题。所以大家在选择的时候,如果你只是平时玩一玩呢,你购买一些这种家庭账号其实 ok 没有问题的。但是呃你如果说真的要去把它当做生产力, 那我建议你还是花这个二十美金,或者说是啊,或者是两百美金去订阅一个他们的 pro 的 这个版本的账号啊,虽然他可能啊一个月的花销在啊换上人民币的话差不多要一千五的这个 啊,一千五左右,对吧?但是你换算一下,就是说如果说你单凭你请一个员工的话,他的工资其实啊还有各方面的开销就已经不止这个钱了, 对吧?所以说,呃如果你是真的能把这个生产力给提高上去,把一些重复的工作,就比如说像审核啊,像服务器的监控啊,日制的阅读啊,像这些东西的话呢,都是可以让 open cloud 去代替的, 就包括像订单的一些啊,审核,还有一些报错,它可以初步的去判断到底这一类的这个问题它到底 是因为什么原因产生的,以及你应该怎么样去,怎么样去下一步去处理,让它做一个基本的排固,对吧?像这些东西的话呢,你都是可以实现的。 open cloud 它现在有没有这个问题呢?是有的,我确实用下来的话是有。 呃,但是侠不掩玉吗?就是我现在基本上大部分的时间都是派他来去啊,做我的一些啊辅助工作,而且呃效果的话呢,提高生产力确实是非常啊,非常明显。 嗯,大家有时间的话呢,也可以去啊试一下啊。那今天的话呢,就先聊这么多,那么我们有空再聊。

叉的 gpt 这次真的放开限制了, openai 突然官宣,即将正式解除内容边界,完整版功能马上上线。很多人都在说这波属于彻底下海,但他不会主动推送,只有满足条件主动提问的用户才能解锁完整对话能力。最有意思的是态度反转, 之前高层还明确表示不会碰这类内容,态度非常坚决,结果短短几个月,风向直接变了。原因也很现实,比起生产工具,人性里最真实的需求往往更直接、更刚需。市场用行动证明,娱乐和情绪价值有时候比生产力更能打动用户。 说到底,商业世界里没有永远的坚持,只有永远的用户需求。当流量和市场摆在面前,很多原则都会悄悄让步。 ai 越来越懂人性,这到底是进步还是新的开始?

十秒钟解决 gpt 的 降质问题,百分之百有效!如果你问你的 gpt 用的是什么模型,他回答用的不是最新的五点二模型,那说明被降质了。 那么大部分时候呢,你更换一下节点就能解除,但是有时候你怎么搞都解除不了,为什么呢?其实官网就有权威的解释啊,你点 你点这里,然后有个帮助,然后帮助中心,然后呢,你找到排查模型功能访问问题,用户已失去对模型版本的访问权限。那么官方解释的原因呢?有三个啊,第一,可能违反服务条款被标记。 那么第二呢,多次登录失败或从未知位置访问,就是 ip 问题,导致暂时降至。那么第三呢,订阅信息变化导致暂时性限制。那么注意其中的第二和第三,也就是 ip 问题和订阅问题呢,都是暂时的, 那么你换个干净的 ip 呢?立即解除,订阅成功后呢,也立即解除。那么网上有说啊,说订阅渠道不对呢,容易降至,实际上是不管是八十的 gpt plus, 还是幺四零的,还是幺六八的,可能调订阅的概率不一样啊,但是跟降智是没关系的。那么问题来了,如果你更换节点,甚至都独享住宅 ip 了,还降智啊,说明你犯的是第一条账号被标记了, 如果这个时候你还着急用 ai 啊,有一个十秒钟解决的百分之百有效的办法,那么就是点这里啊,有个群聊的模式啊,打开以后呢,立即就能解除降智,因为群聊是忽略了你个人属性的 啊,不过这也导致群聊不会独取你个人的上下文记忆啊,只能暂时应急运用,如果你想彻底解决呢?那还需要一点时间呢啊,一两句话也说不清楚啊,我有总结的流程办法啊,大家可以先收藏点赞。