粉丝3.9万获赞8.9万

杨立坤又发新论文了,这一次,他用一条数学定律加上一台计算机主行验证,干了一件整个 ai 行业几乎没有人干的事。 他证明了 ai 能不能看懂这个世界,跟你喂他多少数据,堆多大算力根本没有关系。他只跟你用什么方法去训练他有关。而能成功的那种方法, 被他证明啊,几乎是唯一的一种。这话听着平常啊,但他捅破的是现在这一波啊,大模型最核心的那个信仰,就是大力出奇迹。所有人都在比谁的数据更多,算力更猛,猜出更大 啊。杨立坤的这篇论文呢,等于当着所有人的面说了一句,你们堆错方向了。这条视频可能比较抽象啊,但大家有必要了解一下最新的技术方向。我尽可能的用大白话先说他这个验证到底是什么分量。他们把整套证明丢进了一个教练的 定力证明器,这是数学家专门用来检验证明对不对的工具,连陶正轩正大定力啊,都在用它。你逻辑练里少退一步,他当场报错,但这篇论文里的五个定力零报错,那他到底证明了个啥?得先说清楚一个词,世界模型。你去看论文里的地藏图啊,特别直观,最左边是真实世界本来的样子, 一堆干干净净互不打架的变量,你去想成物体的位置,速度啊,颜色、光照,每一个,管一件事清清楚楚,那中间的那个,是我们眼睛实际看到的数据。这些变量被一个复杂的过程搅成了一团乱麻,图上就是一个花花绿绿缠在一起的螺旋,那 ai 要干的活,就是从中间这张乱麻图把它重新解开, 还原成最左边的那个干净的样子。如果它能解开,而且解开的方式特别简单,那就说明这个 ai 真学到了世界模型。 论文里管这个叫线性可识别性大白话,就是你脑子里的那张世界地图,跟真实世界之间只差一个朝向啊,没有任何的扭曲。那它的这套方法叫 l e g e p a 怎么做到的?说穿了就两个动作,第一个动作叫对齐,把同一个东西的两个视角硬拉在一起。比如一段视频里,相邻的两针, 告诉模型啊,这俩是一回事。第二个是逼着模型吐出来的两针,告诉模型是啥,就是大名鼎鼎的正态分布嘛, 那条中型曲线就是大多数情况都挤在中间的平均值附近啊,越极端,越往两边的情况就越少。就比如全班同学的身高,一群人的体重啊,考试成绩画出来,基本都是这么个中间高两边低的中型。 它是自然界里面最常见也最没有偏见的一种分布。而杨立坤这篇论文最炸的一点就在这里啊,能保证 ai 把世界完整还原的分布,只有高斯独此一家啊,别无分号, 把它换成别的形状,比如两头翘或者是平的,那还原立马就崩了。实验里,他们把分布从一头扫到另一头,还原的准确率就是高斯那个点上尖尖的冒出的那个分啊, 两边都塌下去。至于他怎么正出,必须限性,必须。高斯那思路其实特别朴素。他们把 ai 学到的任何一个函数,拆成直的部分,弯一次的部分,弯两次的部分,一层层拆开,然后发现一条铁律模型,每往里面多加一点弯,分数就被严格的扣掉一点,直到也就是限性的扣的最少, 于是最优解被死死的逼成了现行。这里还有一个特别讽刺的点,就是在经典的信号分离理论里,高斯是唯一一个让分离失败的分布,是所有人都躲着走的倒霉蛋。可在杨立坤的这套 呃新架构里,高斯恰恰是唯一一个让分离成功的。同一个高斯在旧理论是,呃,这个绝症啊,在新理论成了解药啊,光在纸上证还不够,他们还拿真家伙验了一个机械臂两个关节。他们在 ai 学到的那张地图里,画一条最直的线, 从起点连到目标,然后让机械臂照着走,结果解码回真实世界。机械臂走的也是一条漂亮的直线,换一个没学好世界模型的编码器呢? 同样一条直线的指令,机械臂就走的弯弯扭扭,那是不是吹的没边了啊?也没有。那我们自己很老实的交代了一个坎,就是如果数据来自 一个有目的的策略,比如机械臂被专门训练成去够某一个固定的目标,那它的分布就不再是高斯了,这套保证就当场失效。所以想让理论失效, ai 在 自学的时候,探索得 尽量随机,尽量散开,别太有目的性。所以绕回最开始的那句话,大模型这一派信的是大力出奇迹,数据越多,算力越猛啊,越接近智能。而杨立坤用这篇论文提出的态度是,方向比力气 重要啊。诺文利有一句话我印象特别深,大意就是 ai 能不能学到真实的世界啊,永远是世界长什么样和你 用什么样的方法去学,这两件事说了算啊,跟你堆多少料没关系。那这次呢,他不再是那个只会喊大模型是死路的人,他第一次能甩出一行计算机验过啊,零漏洞的。这个数学告诉你,世界模型这条路不是信仰,是定力啊。当然了,这也只证明了一半, 他正的是,如果世界是高斯的, ai 就 一定学得会。可真实世界到底是不是高斯的,那我们自己也承认,光在外面看永远没法知道。所以这把锁呢,他用数学撬开了一道缝啊,门后面是什么?还得骑驴看账本走着瞧了啊。那我说完了,关注我,下期见。

机器学习听起来很复杂,但它其实就在你身边。今天我们用最简单的方式,带你认识十大经典机器学习算法,不用数学公式,只用生活类比,保证你一遍就能听懂。第一个算法,限性回归,想象你是一个房产中介, 看房面积越大,价格就越高,把一堆数据画在纸上。限性回归就是画一条最合适的直线, 穿过这些点,有了这条线,看到新面积,就能预测价格天气,预测股票走势,本质上都是限性回归在帮你划线找规律。第二个算法,逻辑回归,别被名字骗了,它虽然叫回归, 干的却是分类的活。就像垃圾邮件过滤器,看到一封邮件,他会判断这是垃圾邮件吗?是还是不是?逻辑回归就是计算一个概率超过百分之五十就归为是, 不到就归为否,银行信用评估、医院疾病筛查都用它做二选一的判断。第三个算法,决策术。玩过一个游戏吗?心里想一个动物,对方用一系列问题来猜,会飞吗?有羽毛吗? 会游泳吗?一层一层问下去,答案就出来了。决策树就是一个流程图,每个节点问一个问题, 根据答案走向不同分支,最终到达叶子节点,得到结论。银行审批贷款,就是在走一棵决策树。第四个算法,随机森林。一棵决策树可能会判断错误, 但如果种一百棵树呢?让每棵树都投票,少数服从多数。随机森林就是多棵树一起做判断,每一棵看问题的不同侧面,最后投票决定结果。就像找一百个专家分别诊断, 然后综合他们的意见,准确率大幅提升,是机器学习比赛的常客。第五个算法,支持向量机想象。桌上有红豆和绿豆混在一起,你要画一条线,把它们分开。 svm 的 目标就是画一条最宽的马路, 让两边的豆子离这条路越远越好。这样新来的豆子掉在哪一边就分到哪一类就分到哪一类。 svm 擅长处理边界清晰的分类问题,人脸识别、手写数字识别都曾经靠它称霸。 第六个算法, k 近邻。俗话说,物以类聚,人以群分享。知道一个新同学什么性格,就看他身边最近的 k 个朋友。三个邻居里两个是学霸,那他大概率也是学霸。 k 近邻不需要任何训练过程,新数据来了,直接比距离 少数服从,多数推荐系统,异常检测都爱用它,简单又有效。第七个算法, k 均值聚类。把一群陌生人自动分成 k 个小组,怎么分?先随意选 k 个队长, 大家各自加入离自己最近的队长,然后队长移动到队伍的中心位置,大家重新归队,反复几次,队伍就稳定下来了。 k 均值不需要预先知晓答案,是典型的无监督学习。 用户分群、客户画像、图片压缩都在用它。第八个算法表述维叶斯,它是基于概率的分类器,好比医生看病看到发烧、咳嗽、流鼻涕这几个症状,结合过往经验,推断出最可能是感冒而不是肺炎。 朴素贝叶斯假设每个特征之间互相独立,虽然这个假设很朴素,但效果出奇的好。 垃圾邮件过滤、文本分类、情感分析都离不开它。第九个算法,神经网络,它的灵感来自人类大脑,数据从书 入层进入,经过一层层隐藏层的计算和传递,最终从输出层得到结果。每一层就像流水线上的工人,每个人只做简单的加工,但一层层传下去,就能完成复杂的任务。深度学习就是加了很多层的神经网络, 今天的拆 gpt、 自动驾驶都靠它驱动。第十个算法组成份分析,它的绝活是降维。假设你从一百个角度给一个人拍照,其实前三个角度就抓住了主要特征。 pca, 找出数据中最重要的几个方向,扔掉噪声和扰语,保留关键信息。 一百维数据压到二维还能画出图来看数据格式化、特征、工程、图像压缩都是它的用武之地。十大算法讲完了,从现行回归到神经网络, 从分类到具类,机器学习的世界精彩纷呈。记住算法不难,难地是开始收藏这个视频,下次想复习随时回来看!关注我,下期带你动手写第一个机器学习代码!

数学与编程是人工智能算法,我们是总需要掌握的两大基本能力,今天我就给大家详细的介绍一下人工智能中的数学到底包含哪些知识点。 呃,总的来说有四种课程,一个是现金,单数,概率统计,微积分以及自由化这四本课。然后我们详细的来介绍一下具体的知识点有哪些。首先那个现行代数方面,包括销量与标量,它的那个概念是什么?然后项链的空间性质,几何意义以及高于度与地位度的特征, 下面的转转向,移动拉伸,他就是线性函数。什么是线性函数?他有什么样的性质?呃,矩阵和剧烈的预算 区,任何销量的预算区,任何一个持住的预算。呃,特殊矩阵,然后包括方阵,十对称矩阵,正义矩阵以及负定矩阵,他的各自的预感性性质,特征与以及特征值和特征较量,然后他们的定义性质以及特征值的求解的过程。然后还说的正焦部分,包括 包括正交还是正交,下联正交,已经超平面正交,他们是如何表达的,以及他们的物理意义哪一些?在概率统计部分,同样需要对基本的概念去要一个理解,然后包括个数最大尺寸,小值,中尾数,均值,方差,它的概念和物理意义。这个都非常简单,包括随机和矩阵的概念,频率和概率。 呃,他们的体积,他们的区别和联系,常见的概率分布以及他们的公式是什么,不过平均分布,二层分布,状态分布等。然后参数的估计,这一块最重要的就是极大的自然估计了。 还有就是中间极限定理,毕业施工室,普错毕业施工室,这个在新学期里面是一个很重要的概念,还有回归分析状态转移网络,他的概念,尼尔尼玛尔克福魔邪小学,随机场,他具体有什么样的概念,还有什么样的物理,这个都需要弄清楚的。在微信分析方面有极限可谓与可导签到,属于偏导数。 这些基本的概念以及函数的求导,它是七度的一个基础,七度又是人家算法优化的基础,所以说函数的求导是比较重要的。呃,对一些特定函数的求导的公式, 除了法则还得都应该掌握,一定是法则,反,他练是法则,是那个。呃, ai 算法里面反向传播算法的理论基础,太阳公式,分满引领,呃微分发成以及他的促进过程,还有拉布朗日撑死法和队伍崛起,他有知识下降机的理论基础,在计算器里边也是比较一个重要的概念。这句话 这一部分包括还突然处于机制,同样包括他们概念关系。呃,最优化这方面有什么?无条件,无限制,有限制条件下的最优化方法以及基本原理以及他们之间的关系,然后记录下调法,这个下法是一个被压算法优化的一个重要的概念, 然后包括其他的自由化方法,油润法,限定做做法,模拟推广效法已经已重上来的,这个就是整个上工程师学员掌握的数学基础。

这本 mit 经典教材把宪性代数的本质讲明白了。作为麻省理工学院官方指定用书,吉尔伯特斯特朗教授的宪性代数第六版中文版堪称全球学生公认的现代顶级学习资料。全书目录结构合理,从第一章向量与矩阵、第二章宪性方程组求解, 到第六章特征值与特征向量,知识点由浅入深,循序渐进,完整覆盖高校课程与考研数学全部考点。它摆脱了传统教材枯燥难懂的问题,讲解清晰直白,极易理解。 由清华大学专业团队翻译,阅读体验流畅。第六版在内容上全面优化升级,还配有专属题型题库,刷题、总结补漏,一站式搞定,期末突击与考研复习,一本够用。无论你数学基础一般,还是想冲刺更高分数, 跟着 m i t 教授的思路学习,都能快速掌握宪性代数核心。告别低效刷题,大学生考研党直接入手,让备考少走大量弯路。

一天学一个变态的人工智能知识第一百三十五期,这节课要讲的是学习人工智能数学要学到什么水平了? 最近啊,很多同学说啊,就是我学这个 ai, 我 到底需要把数学学到什么水平呢?嗯,我给大家简单分析一下。首先关于数学这个东西啊,如果说你不是为了解决自己领域多大难题,不是为了解决科研上,就是现在历史一个问题, 咱们只是为了去做一些论文的实验,或者说呢,只是为了我们后续工作当中能去读懂一些论文。我建议大家不要去死磕这个数学,数学我建议咱们这样就是去通俗的去理解,比如说跟你啊说,我说一个公式以上是干什么的, 我说一个数学符号,你知道它表达什么含义就行了。哎,至于这个公式怎么来的,至于这个公式怎么去求解,千万不要去学, 尤其我现在发现很多同学习惯一件事,就是咔咔干什么咔咔做公式推导,甚至呢还买了一些练习册,再去刷题,再去求解题。我觉得这件事吧,以后咱们是用不上的,因为到目前为止很少有机会说 轮到你自己去求解,自己推导一个公式,因为现在框架是现成的,原码是现成的,很多底层逻辑啊,都是已经固定了,很难说现在深度学习,再提出一些什么新的架构,再有一些颠覆的思想,我觉得这件事可能性很低了, 而且这件事即便是有可能也不会乱你头上,是不是咱们更多时候干什么去用而已?既然去用,我们就是两个目的,第一件事,我读论文的时候,我能看懂论文在说什么好,能去理解别人的思想,当做我积累的,当做我知识的一个积累。 还有就是看原码的时候啊,我知道这个原码要去实现什么东西,要实现个公式,那这个公式用来做什么的,仅此而已,就足够了。为了读论文,为了看原码做准备。所以说数学啊,咱们前期能去了解这些符号,能知道这些公式表达什么含义就行,不用去深究,不要去推导,也 不要去干什么,拿个笔,拿个本,再去做任何求解的操作了。为方便大家快速入门 ai, 我 给大家准备好了自己录制好的数学视频。

学习人工智能都需要一定的数学基础和 python 编程基础,那数学基础这块应该更针对性,具体补充哪些?有什么好书推荐?今天 future 也不排什么从夯到拉了, 直接全行排名,把学习人工智能数学基础的好书都告诉大家,有适合不同阶段的,大家按需选择学习即可。在开始之前,如果大家需要这些书的电子版本,以及我前段时间给粉丝制作的人工智能零基础入门到进阶的详细版。学习路线,学习顺序,要学什么看什么,教程要注意什么。 每个阶段的学习周期,包括用不同颜色的引导线,来告诉不同学习目的的同学应该按照什么顺序学,非常详细。 首先是第一本憨爆了的书,白话机器学习的数学。这是数学界的幼儿园,阿姨拿着甜甜圈和奶茶哄你学那些本来能把人逼到脱发的公式, 适合那些看到数学符号就想把书扔出窗外的人。他用两个二次元女生的全程对话的形式,把机器学习最最核心的数学知识拆成了初中生都能听懂的人话。先讲基础工具包, 商量矩阵是什么,怎么算,导数和梯度是什么等等,然后直接落地到算法,用前面学的数学从零推导,并实现了宪信回归、逻辑回归和感知机这三个机器学习最基础的算法。 最后手把手写代码,所有公式都对应了纯单派实现的 python 代码,让你亲眼看到数学公式是怎么变成能跑的程序的。当然缺点就是讲的不够全面深入,但非常适合数学基础很排斥的同学先入门。 接着是第二本憨爆了的书,机器学习的数学。这本书和上一本书完全不同,没有什么为了铺垫和展现,通俗易懂而产生的多余描述,非常直接有逻辑深度,也刚刚好, 学完就能无压力学习西瓜书和花书。这本书的每一个数学知识点都明确标注了在哪个算法里会用到,全面讲解限性代数、微积分、概率论与数学统计最优化方法、信息论等等等等。它也是目前国内唯一一本刚刚好的机器学习数学书。如果你是有一定数学基础的同学, 喜欢看中文书,我首推这本。再就是第三本憨爆了的书,人工智能必备数学这虽然是一本英文书,但网上有人做了非常 精细的翻译博文,大家搜一搜就可以看到,这本书完全跳出了先讲数学再讲算法的传统套路,而是反过来,从 ai 的 核心问题出发,到 推你需要掌握哪些数学工具,我觉得是很像是专门为 ai 系统工程师写的书,或者说是为想从事人工智能相关工作的人写的书。主要讲解人工智能的底层逻辑、经典模型的数学本质、前沿模型的数学拆解、人工智能系统的数学优化。从 工程角度来看,写的确实很好。然后是第四本憨爆了的书,深度学习的数学。它是全世界唯一一本能让你不用写一行代码,只用 excel 就 能亲手算出神经网络每一个参数梯度的书也是,它是一本极度聚焦、极度偏执的书,所有内容都只为了一个目标, 让你彻底搞懂神经网络到底是怎么学习的?全书没有任何多余的数学工具,只讲导数、偏导数、验式法则和矩阵乘法,多 一个字都不说,因为作者认为对于理解最基础的神经网络来说已经够了。然后从零搭建神经网络反向传播的 excel 及拆解,这是他的灵魂所在。最后用 excel 实现手写数字识别,是和和白话机器学习的数学一样的人群。 最后一本机器学习数学也是一本英文书,但同样有大神做了这本书的精细翻译和学习笔记,薄文一搜就有。这本书当中最系统、内容最完整的,你 可以理解为像是人工智能所需数学的全面字典,被业内称为 m l 数学圣经。全书分为三大块,完全按照数学学科的逻辑组织,而不是跟着算法走,非常详细系统地讲解了这些所需的数学基础知识。这次的分享就到这里了,希望对大家有帮助。我是 future, 我 们下次再见,拜拜!