oh oh oh oh oh oh 啊啊啊啊 啊啊啊啊 啊啊啊啊啊啊 啊啊啊啊。
粉丝8421获赞10.0万


大家好呀,今天咱们来聊聊科技圈的一个大新闻。最近 openai 的 ceo sam 奥特曼在员工会议上宣布,他们要逐步关停基于视频模型的产品了,这意味着什么呢?简单说,不只是咱们普通用户能用的那些视频应用,连给开发者用的 sorry 版本也要停了,以后叉 gpt 里也不会再有视频功能了。 这可真是 sora 项目来了个大转弯啊。可能有朋友会问, sora 不是 刚出来的时候特别火吗?能生成那么逼真的视频,怎么说停就停了呢?其实啊,科技公司调整产品方向是常有的事,就像咱们平时做计划, 可能一开始觉得某个方向不错,但走着走着发现资源不够,或者市场反馈和预期不太一样,就需要及时调整。 openai 这次可能也是基于各种考虑,比如技术成熟度、商业化路径,或者想把精力集中在其他更重要的项目上。不过话说回来,虽然 sora 相关的产品停了, 但这并不代表 ai 视频生成技术就不发展了,说不定这只是暂时的调整。未来等技术更成熟,各方面条件更到位了,我们还能看到更厉害的视频 ai 呢。你们觉得 open ai 这次官停 sara 相关产品,背后最主要的原因会是什么呢?评论区可以一起讨论讨论喽!


从濒临倒闭到颠覆,谷歌 chat gpt 是 怎么炼成的?从今天开始,我将给我的零位粉丝朋友们花一百期视频来系统讲解大模型的原理、技术和应用。二零一五年,几个人在旧金山的一间公寓里搞了一个不赚钱的研究实验室。八年后,他差点把酷狗掀翻。这期视频,我们聊聊 chat gpt 背后那场豪赌。 先问你一个问题,二零一五年,你在干什么?刷朋友圈?还是在逼战追番?与此同时,有一个人正在策划一场豪赌。这个人叫 sam oman, 那时候他刚刚接手 ycommodator, 硅谷最牛的创业孵化器。他联合了 almausk、 peter、 ceo 这些大佬,凑了将近十亿美金,成立了一个组织,名字叫 open ai。 注意,他的全称是 openart 的 社构 antilages, 翻译过来就是 开放的人工智能。他的目标听起来像天方夜谭,开发出对全人类有益的通用人工智能等等。这个目标靠谱吗?当时 google、 facebook、 微软都在搞 ai, 一个刚起步的小作坊,凭什么?说实话,几乎没人看好他?但这帮人有一个关键的信念, transom 还没有出现深度学习,还在用 r n n 和 l s t m 训练一个语言模型,慢得跟便秘一样,一个一个词往里塞。想记住前面说过什么,全靠那个巴掌大的记忆窗口。二零一七年,转折来了, 姑姑的八个人发表了一篇论文,标题叫 attention is all 于 lead。 这篇论文提出了一个全新的架构, trans small。 它的核心思想是什么?就是让每个词都能同时看到整句话里的所有词,不用排队,不用一个个往前翻,这就是 self attention, 自注意力机制。打个比方,以前的 r n n, 就 像你在教室里传纸条, 从第一排传到最后一排,信息一路衰减。 transform 呢?直接把纸条投影到大屏幕上,所有人都同时看到,信息零损耗。 这篇论文后来成了 ai 领域的原子弹,几乎所有大模型的根基都在这里,包括 open ai。 二零一八年, open ai 发布了 gpt 一, 全名 generative pretrictransform, 一 翻译成中文就是生成式预训练。 transom 参数量有多大?一点?一千亿个参数,今天听起来像开玩笑,但在当时已经很猛了。 gpt 一 提出了一个关键范式, 先在海量文本上作预训练,让他自己学语言的规律,然后再针对具体任务做微调。这就好比你先上完九年义务教育, 再去学编程,或者学画画,底层同时打好了,学什么都快。二零一九年, op a r 又扔了一颗炸弹, g p t。 二 参数量直接拉到十五亿,翻了十几倍。而且他做了一件当时非常反直觉的事,如果微调什么意思?以前大家都觉得大模型上单独微调翻译的。微调翻译。 g p t 二说, 我光靠预训练就能干所有的活。这篇论文的标题更狂, language models are unsupervised, model size learners。 翻译过来就是语言模型,是无监督的多任务学习者。 open ai 用实验证明了一件事, 模型够大,数据够多,它自己就能学会做各种事情,不需要你手把手教。但 g p t。 二最初圈的原因不是它多厉害,而是 open ai 当时说,这个模型太危险了,我们不敢开源,万一被拿去批量生成假新闻怎么办?互联网上直接炸锅了。有人嘲讽说是营销血统,也有人真的担心 ai 作恶。不管怎样, gbt 二成功让全世界注意到了 openai 这波操作,堪称教科书级别的 pr。 二零二零年, openai 放大招了, gbt 三这次餐数量是多少?一千七百五十亿。你没有听错,一千七百五十亿个参数,从十五亿直接跳到一千七百五十亿。这就好比你原来骑自行车, 突然换成了高铁,还不是绿皮车。 g b t 三最震撼的能力是少样的学习。什么意思呢?你给他看几个例子,他就能照着做。比如你告诉他把英文翻译成法文,然后举两三个例子,他就能自己翻一新的句子,根本不需要额外训练。这就是大力出奇迹的典型案例。 模型大了之后,涌现出了你没教过他的能力。就像你孩子看了大量课外书之后,突然会写诗了,你也没教过他写实了,但他就是会了。 g b t 三发布之后,整个科技圈都坐不住了。 但 open ai 心里很清楚, gbt 三是个猛兽,它会按照训练数据里的偏见和有害内容来输出,你问它怎么造炸弹,它可能真的告诉你,这玩意儿直接开放给公众用,那还得了。所以,接下来的两年, open ai 没有急着推产品,而是专心解决一个问题,怎么让 ai 听人话?二零二二年初, instruction gpt 来了, 它引入了一个关键技术, r l h f, 全称 reinforcement learning for instance。 翻译成人话,就是让人类来调教 ai, 具体怎么做的呢? 首先,人类标注员给 ai 的 回答打分,好回答给高分,烂回答给低分,然后用这些评分数据训练一个奖励模型,最后让 ai 自己跟这个奖励模型博弈,不断优化自己的回答质量。这就好比你写了一篇文章, 先让老师批改打分,然后你自己学会了老师的标准,下次写文章就知道往哪个方向写。你 struck gpt, 虽然餐数量比 gpt 三小的多, 只有十三亿,但因为经过了 r m h s。 的 调教,他的实际表现反而更好。而且最重要的是,他学会了说人话,不再动不动输出有毒内容。二零二二年十一月三十日这一天会被写进科技史。 openai 发布了 chat p p 基于 g p t 三点五微调,配合 r l h i 对 其训练,做成了一个聊天界面,直接开放给所有人用。结果呢?五天一百万用户注册,什么概念? instagram 花了两个半月, facebook 花了十个月, netflix 用了三年半, chatkey 补天就破百万。但这还不是最狠的,两个日后,它的月活用户突破了一亿, 这个数字比微信小程序爆发时还要恐怖。全球科技媒体集体高潮,标题清一色都是 google 要完了。为什么说 google 要完了?因为叉着 b p 做的事情,恰恰是 google 搜索最核心的业务,你问一个问题,给你一个答案,而且是以对话的方式, 比你翻十条搜索结果效率高太多了。 google 内部据说拉了红色警报,连夜召回两个创人大佬出山,紧急整合所有 ai 资源,生怕被这一波浪潮掀翻。二零二三年三月, open ai 又推了一把, gbt 四来了,这次直接从纯文本升级到多模态,什么意思呢? 它能同时理解文字、图片,甚至手绘草图。你画一个网页的草图,它能帮你写出前段代码。更夸张的是它的考试成绩,律师资格考试 gbt 四考到了前百分之十, s a t 数学接近满分,美国研究生入学考试 gre 阅读和写作也接近满分。 这还是 ai 吗?这就是一个全科状元。而且它不需要吃饭,不需要睡觉,不需要你给他发年终奖。从 g p t 三到 g p t 四残,数量到底涨了多少? o p e a 死活不肯说, 但有传闻说超过了万亿级别。不管具体多少,这个模型的能力、进化速度已经超出了大多数人的想象。 二零二四年, opai 继续加码,先发布了 gpt 四 o, 这里的 o 代表 omni, 全固态的意思。它最大的突破是什么?时时多模态交互,你可以直接用语音跟它对话,它能时时听到你的语气和情绪。你给它拍照,它能立刻分析图片, 整个过程几乎没有延迟,就像跟一个真人面对面聊天。同年年底, o e 模型横空出世。这次的重点不是更大、更快,而是推理能力。 o e 引入了思维链。推理 什么意思呢?以前的模型是看到问题直接给答案,就像学霸秒答选择题,但遇到复杂的推理题就歇菜了。 o e 不 一样,它会像你一样,一步一步想,先分析问题,再拆解步骤,最后给出答案。 打个比方,以前的模型是背题库的硬式选手。 o 一 是真正会做题的学霸,遇到没见过的题型也能推出来,这就是推理能力的本质区别。到了二零二五年,节奏更快了。 open ai 先后推出了 o 三和 g p t 四点五, o 三继续强化推理能力,在数学竞赛和编程比赛上的表现已经碾压了大多数人类。 g p t 四点五则在知识广度和对话自然度上继续进化。现在的 open ai 估值已经超过了一千亿美元。八 年前那个公寓里的小作坊,现在是硅谷最值钱的科技公司之一。而那个差点被他掀翻的孤,也全力以赴 all in gemini 系列,整个 ai 赛道变成了全球最卷的战场。说到这里,我们来梳理一下,从二零一五年到二零二五年 这十年发生了什么。二零一五年, open ai 成立。二零一七年, chris mo 架构诞生。二零一八年, gpt 一, 验证了预训练加微调的范式。二零一九年, gpt 二,证明了规模及智能。二零二零年, gpt 三,又一千七百五十亿参数,实现了少样本学习。 二零二二年, exchart gpt 有 rlss, 让 ai 学会了说人话。同年底, chk t 引爆了全民 ai 时代。二零二三年, gpt 四带来了多模态革命。 二零二四年, g p t 四 o 和 o e 分 别突破了实时交互和推理能力。二零二五年,推理模型时代正式到来,你 会发现一条非常清晰的主线,每一次突破都建立在上一次的基础之上,但每一次又做了一个关键性的范式转换方,从纯理论到产品化,从无监督到人类对齐,从单一文本到多模态,从快问快答到深度推理,而这其中最底层的基石就是二零一七年那篇 transman 的 文,没有 a ten 机制, 后面的一切都无从谈起。下一期我们会深入拆解 transport 的 内部结构,搞清楚 suffer 贪婪到底是怎么算的,它为什么比 r n n 和 l s t m 强这么多?多头注意力又是怎么回事儿?还有位置编码、残差连接这些核心概念 全部给你掰开揉碎讲清楚。这个系列叫大模型的原理技术课应用,一共一百期,我们会从底层架构讲到上层应用,从训练方法讲到部署优化,帮你建立一套完整的大模型知识体系。如果你觉得这期内容有用,别忘了点赞、投币、收藏,这对我们真的很重要。我们下期见,常回基地看看,谢!

这个世界上最魔幻的事情之一,就是当年苦心积虑设计 iphone 的 那个人啊,现在每天想的就是怎么把 iphone 扔进历史垃圾堆。 这个人呢,叫做 jony iphone 呀, imac 呀, iphone, ipad, apple watch, 在 苹果这二十年最重要的一些产品啊,外观设计全部都是他主导的。而二零一九年呢,他就离开了苹果,外界呢,都以为他已经退休了,没想到啊,他在秘密地做一件事,就是和 sam 奥特曼一起啊, 从零开始设计人和 ai 交互的方式。那为了这件事情啊, open ai 花了六十五亿美元买了一家成立才刚刚一年的公司。萨 摩特曼去年十一月亲口说看到原型机的时候,他简直不敢相信这个东西到底有多惊艳。那这个东西到底是什么呢?根据目前泄露的信息,至少有两款产品在同步开发。第一款产品叫 sweetpad, 它的大小呢,和 ipod 差不多,可以直接挂到你的脖子上面,或者放到口袋里面, 完全没有。屏幕以语音为主,内置一个摄像头,它能够感知你周围的环境,在你需要的时候主动给你信息。而第二款呢,内部代号叫做 goomdrop, 它的形态的像一支笔,能够把手写的内容实时转移成文字,而且支持双向的语音交互。那这两款产品都有一个共同的逻辑,就是没有屏幕 教你 app 的 判断就是屏幕本身就是一个大的问题,因为它让人变成了一个低头族,让注意力永远困在一块玻璃的后面。而它想做的是一个让你抬起头来的设备, ai 在 你的耳边,在你的手边,但是不在你的眼前, 而这个顺序听起来确实很美,但是我有一个非常大的疑问,那就是没有屏幕真的是答案吗?你现在用手机和 ai 交互,打开 app, 点进对话框,用键盘打字等回复,这套流程听起来确实很笨,但是它有一个非常核心的优势,就是精确, ai 能看到你输入什么,你也能看到 ai 回复的什么,能回溯,能截图,能复制,能修改,而屏幕给了你对信息的完整的控制权。但是如果说我们变成一个纯语音呢?你说句话 ai 呢?理解错了,那你该怎么去纠正呢? 你在嘈杂的地铁上,在开会的间隙,在任何不方便开口说话的场景里,那这个设备怎么用呢?这不是挑剔啊,这就是真实的使用场景。 那之前有个产品叫 aip 呢,就是直接死掉的,他没有屏幕,用户对信息的掌控力几乎为零。最后呢,公司以五千万美元贱卖收场,而在融资的时候,它的估值还是八点五亿美元。 所以 jony 艾弗他当然知道这个问题,因为他在做苹果 ipod 的 时候,他的市面上其实已经有 mp 三播放器了,所以他就说他想做的根本就不是一个更好的 mp 三,而是把一千首歌放进口袋,用一个完全不同的趋势来重新定义产品。 这次他能不能再做到这一点呢?我确实不太确定,但是有一件事我是确定的,就是这个赛道现在真的是兵家必争之地。 苹果的 iphone 十八会在二零二六年发布,据说呢,会大幅的强化 ai 能力。而 mate 的 这个智能眼镜呢,已经卖出了数百万伏,正在悄悄占领无屏 ai 入口这个位置, 而这款设备呢,预计到二零二六年底,二零二七年初才能够亮相。所以呢,留给 open ai 的 时间窗口说实话已经不多了。而我个人的判断是,无屏这个方向其实在短期内很难成为大众的主流, 因为操作精确性的问题不解决,它就只能是一个补充设备,而不是一个替代品。但如果有人能解决这个问题,那这个人我想很可能就是 jony f。 那 你觉得没有屏幕的 ai 设备真的能够取代手机吗?评论区聊聊,我是 c 哥,点赞关注,咱们下期见!

医生说我活不久,但我却活得比谁都开心。我只有五十斤,却背着四十斤的鼓上场。 大家好,我叫 sam, 今年十七岁。我患有一种全球只有几百人的罕见病早衰症。几年前,我有个特别执着的梦想,加入学校行进乐队打小军鼓。但现实很残酷, 一套鼓接近四十斤,而我整个人才五十斤,老师直接把我安排去旁边打伴奏。不用行进,说实话,那一刻我真的很崩,但我不认。我和家人找工程师,一点点改,一点点试,最后做出了一套只有六斤的鼓架。 后来,我真的走进了队伍,打着小军鼓完成了我的梦想。所以你会发现, 很多事情不是你不行,是你还没找到方法。我想跟你说,我快乐的三个底层逻辑,第一,接受你做不到的,但死磕你能做到的。我跑不了长跑,也做不了刺激项目,但我可以打鼓,玩音乐,看漫画、追比赛。 人生不是比谁没有短板,是看你怎么用优势活。第二,一定要待在对的人身边,家人、朋友、队友, 他们让我觉得我不是有问题的人,我只是一个普通人,情绪稳定的圈子比什么都重要。第三,无论发生什么,都继续往前走,给自己留点盼头, 下一本漫画,下一场比赛,下一次见面,只要你还有期待,你就不会被困住,我也会难受,也会低落。但我不会一直待在那里,因为我知道, 勇敢从来都不轻松,但他能带你走出去。最后送你一句话,别一直问为什么是我, 多问一句,接下来我还能做什么。哦对了,再说一句,如果可以,千万别错过任何一场聚会,明天学校舞会我一定会去。你的人生也别缺席。

现在全世界 ai 圈最红的人啊,不是马刺克,更不是三猫奥特曼,而是刚刚被 o a i。 给挖走的龙虾之父 peter stamburger。 这 peter 火到了什么程度呢?他一句话就让欧洲科技圈集体破防了,他上了个访谈,就把欧洲 ai 技术落后的真正原因给撕开了。 就在这两天,他上了奥地利最重要的一个新闻节目,叫 zeit einbeld, 不知道这发音对不对啊,因为这 peter 是 奥地利人,后来他去的美国,等于是回祖国上节目去了。 结果呢,这节目全程不是讨论怎么实现 agi, 也不是讨论模型能力,更不是讨论技术突破。而是这记者就追着问他说,我们要不要害怕 ai 啊?我们的数据隐私会不会被侵犯呀?欧盟克劳到底会不会毁灭全世界呀?就问了一系列这样弱智的问题。 我靠,现在全世界都在朝着 agi 猛冲呢。以这记者为代表的这些欧洲人,却还在担心自己会不会被吓到,这不是落后,这是主动放弃未来。 所以这披萨当场就说了,他说的也很直白,他说,在美国呀,人们兴奋好奇想做事,在中国呢,人们也在努力。 但是在欧洲,人们上来就骂你监管责任,禁止他,甚至是说说,如果我要在欧洲创业呀,我得面对投资保护法、员工共同角色和瘫痪的劳动法规。在 o a i。 一 周工作七天,那是常态。在欧洲违法, 你想做 agi? 不好意思,先填十七份表格,你想加班?嘿嘿,那欧盟劳动法会告诉你, no way, 这么着是违法地。 美国呢,是先干再说,中国呢,是边干边调,欧洲呢,是先禁止再讨论,你说那他这样怎么可能不落后呢? 更讽刺的是,就在这节目播出之后,就有人在网上开始骂这 peter 了,说你被美国公司雇佣了,你就非要抨击祖国,抨击欧洲吗?那可是生你养你的地方啊。结果这 peter 回的更狠,我说这些是因为我看到了问题,而这些问题可能会引起改变。 其实他不是在背叛欧洲,而是在警告欧洲现在正在亲手把最聪明的人给送走。欧洲 ai 落后的真正原因不是算力,不是人才,也不是技术,而是把未来当威胁,把创新当犯罪,把监管当信仰。 一句话,欧洲不是被美国和中国甩开的,而是被自己的恐惧和制度所死的。过度的监管其实就是枷锁,就会扼杀公众的创新能力。所以欧洲想要在 ai 技术上有所发展,那就必须得先要解决这个问题,保守的欧洲不能再这么保守下去了。

vivo 手机无法唤醒周围怎么办?首先打开设置,选择赵薇,选择赵薇能力设置,选择语音助手,将播报设置拉最大,选择语音唤醒,打开亮屏唤醒,打开自动开启,这就完成了。