呃,请问使用 sapo 算法 policy 的 安全性一直上升啊,单测试数据不稳定,我该如何调整正负样本的温度参数?呃,这个是一个很好的问题啊。呃, 嗯,就是我们在使用 sapo 的 过程中,我觉得我就是我调餐的一个经验,或者说,呃可以分享给大家。嗯嗯, 因为我们所遵循的一个基本原则就是说我的 neck temperature 是 大于我的 positive temperature, 对 吧?呃,我一般,比如说我们现在我调整的话,一般会固定那个 positive temperature 是 一点零不变的,我只会调整那个 negative temperature。 呃,一般来说呢,如果你把 negative temperature 调大,它的 entropy 是 倾向于上涨或者下降的更慢, 那如果调小呢?它是倾向于下降的更快或者上涨的更慢的。所以大家我觉得可以去调一下这个 temperature 你, 你会有一些可能比较有意思的发现,然后去想一下, 对吧?这个为什么会导致这样的一个现象?我如何利用这个性子来去呃稳定我的一个算法的训练过程以及拿到更高的争议?因为我觉得所谓的呃稳定就是说你的梯度方差比较小,然后你的整个的 exploration, 呃是维持的比较好的,这可能从外界的表现上来说 就是你的安全性可能是相对一个稳定的状态,那你最后的这个算法的所能达到的效果可能也是最好的。
粉丝1324获赞5568

今天和大家分享的是商增定律。根据热力学第二定律,商作为衡量系统无序程度的物理量,在孤立系统中其数值始终呈自发增加趋势。 这一规律及商增定律,该定律皆是孤立系统的演化方向,具有单向性,只会从有序状态向无序状态过渡,直至达到商值最大的平衡态,此时系统混乱程度达到峰值。 我的意思是,爱情也是如此。爱情关系同样遵循这一底层逻辑。初始阶段,两人通过情感投入、沟通协调等外力干预,维系着情感系统的有序性,默契的互动,一致的目标如同精心维持的低相状态。但当外力减弱或消失,爱情系统逐渐趋近孤立, 观念差异引发的矛盾难以化解,情感需求的错位无法调和,曾经的亲密连接会随无序度增加而逐渐断裂,就像孤立系统终将走向混乱。 爱情若失去持续的滋养与经营分开便成为符合商增规律的常态。不必为这份常态过度伤感,毕竟在无序递增的世界里,那段彼此奔赴、共同构建的有序时光本就是珍贵的例外。

有一个概念在化学和物理学中直观重要,他能解释为什么物理过程总是朝着某个方向进行,而不会反向发生。比如,冰块为什么会融化,奶油为什么会在咖啡中散开?被扎破的轮胎为什么会漏气?这个概念就是伤,而他也同样以难以理解。而文明 伤常常被形容为衡量无序程度的指标。这个比喻虽然直观,却容易引人误解。举个例子,你觉得哪一杯更无序?装满碎冰的杯子,还是一杯常温的水? 很多人会认为碎冰更乱,但实际上他的伤反而更低。因此,我们不妨换一个角度来理解,从概率的视角看待伤。这或许一开始不那么直观,可一旦真正理解,你对伤的认识就会清晰得多。假设有两个小块固体,每块都由六个原子键构成。在这个模型中,固体的能量储存在这些键里。 你可以把每个键想象成一个小容器,里面可以装入一些不可再分的能量单位,称为能量量子。固体含有的能量越多,温度就越高。有意思的是,即使两块固体的总能量保持不变,能量在它们之间的分配方式却有很多种可能 每一种具体的分配方式就称为一个微观态。比如,当固体有六个能量量子,固体必有两个时,对应的微观态共有九千七百零二种。 当然,八个能量量子也可以有其他分配方式,比如全部集中在 a 中,或者在与 b 之间平均分配。如果我们假设每一个微观态出现的可能性都相同,就会明显发现某些能量分布情况出现的概率更高,正是因为他们对应着更多数量的微观态, 而伤就是用来直接衡量每一种能量分布出现的可能性的。我们可以观察到,能量在两个固体之间分布的越均匀,对应的伤就越高。 因此,伤在一般意义上可以被理解为能量分散程度的度量。低伤代表能量集中,高伤则意味着能量分散。要理解伤如何解释自发过程,比如一个热物体为什么会冷却?我们需要考虑一个能量可以流动的动态系统。 现实中能量并不会静止不动,他持续在相邻的键之间迁移,能量分布的状态也随之变化。由于微观态的分布特点,系统之后有百分之二十一的概率进入能量最分散的状态,有百分之十三的概率回到初始状态,还有百分之八的概率出现反而获得更多能量的情况。 这里再次看出,因为能量分散的高伤状态比能量集中的低伤状态拥有更多实现方式,所以能量天然倾向于扩散。这就是为什么当你把一个热物体与冷物体放在一起时,冷的会变暖,热的会变凉。 但即使在这个粒子里,仍有百分之八的概率让热物体变得更热。那为什么现实中几乎看不到这种情况呢?关键在于系统的规模。我们刚才假设的固体只有六个键,现在把固体扩大到六千个键,并分配八千个能量量子,同时仍然让系统从拥有四分之三能量并拥有四分之一的初始状态开始。 此时我们会发现, a 自发获得更多能量的概率变得微乎其微,而现实中的日常物体所含的粒子数量更是远远超出这个尺度。因此, 一个热物体在真实世界中自发变得更热的概率低到几乎不可能,所以我们几乎从未见过它发生。冰块融化、奶油在咖啡中扩散、轮胎漏气,都是因为这些状态的能量分布更加分散,而并非某种神秘力量在推动系统走向更高的伤, 一切只是因为更高的伤在统计学上总是更可能实现。正因如此,伤也被称为时间之箭。只要能量有机会扩散,它就一定会扩散开来。

上周,我花了整整一个下午收拾书房,书架上的书按颜色分类,桌面上的文件按项目规章,那种秩序感带来的愉悦就像站在刚铺好的雪地中央,不忍心踩下第一脚。三天后,我找不到那份刚打印的合同, 书桌上堆满了快递盒、咖啡杯和随手记下的便签。我坐在混乱中间,突然意识到这不是我的问题, 这是宇宙的基本法则在起作用,这条法则叫做商增定律。一八六五年,德国物理学家鲁道夫克劳修斯在研究蒸汽机效率时,提出了一个奇怪的概念,商 energy。 这个词来自希腊宇宙,意思是转变。 克劳修斯发现,在任何能量转换过程中,总有一部分能量耗散,他用商来度量 热力学第二定律由子诞生。在一个孤立系统中,伤总是趋向增加。换句话说,系统会自发的从有序走向无序,从集中走向分散,从可利用走向不可利用。 混乱才是自然的终点,秩序需要额外的能量来维持。一九四三年,埃尔温薛定勒站在杜布林三一学院的讲台上,提出了一个看似简单却颠覆性的问题,生命是什么? 这个问题困扰了人类数千年,但在薛定鳌看来,他首先是一个物理学问题。根据热理学第二定律,孤立系统的商总是增加,趋向于无序和平衡,也就是死亡。 但生命却表现出完全相反的特征,他维持着高度的有序性,能够自我复制,还能进化出更复杂的结构。生命似乎违背了物理学的基本法则。薛定鳌的解答简单而深刻,生命以富商为食, 这里的负伤并不是伤的负值,那在物理伤时不可能的。薛定厄指的是秩序生命通过从外界摄入有序的物质、低伤的食物、氧气,排除无序的废物、高伤的二氧化碳代谢废物,从而在局部维持自身的低伤状态。 伤增定律的影响远不止于物理学实验室,它渗透在我们生活的每一个角落。房间会变乱,刚收拾好的屋子如果不持续整理,总会趋向混乱。 从概率上讲,房间自发变乱的可能性比自发变整洁的可能性高出无数个数量级。企业会衰败,德鲁克曾说,管理要做的只有一件事情,就是如何对抗商增。 在这个过程中,企业的生命力才会增加,而不是默默走向死亡。关系会淡漠。一段亲密关系如果不持续投入时间和精力维护,会自然走向平淡和疏离。爱情需要仪式感,友情需要联络,这些都是向关系系统中注入负伤的努力。 伤增定律不仅描述了物理现象,更结实了宇宙演化的终极方向,从有序到无序,从存在到热季。 既然商鞅是宇宙的宿命,我们还能做什么?答案是,成为开放系统,持续输入富商。一个人如果封闭自己,停止学习,停止与外界交流,就会像孤立系统一样迅速走向精神的热剂。思维僵化,视野狭隘,生命力枯竭。 对抗个人商增有两个关键策略,第一,保持开放,主动打破舒适区,接触新的知识、新的人、新的经验,旅行、阅读、学习新技能,都是向个人系统输入富商的方式。 第二,主动做功。商增的逆过程需要能量,整理房间需要体力,维护关系需要心力,保持健康需要自律。没有免费的秩序,一切美好的状态都需要持续的投入来维持。在这个走向无序的宇宙中,生命创造了秩序, 从单细胞生物到人类文明的复杂系统,从 dna 的 精确复制到莎士比亚的十四行诗,在混乱中建立起一座座有序的高塔。 薛定格在生命是什么结尾说,意识之光不会照亮所有的黑暗,他只照亮自己前方的一小块区域,但就在这小小的区域内,他创造了秩序,对抗着升增的洪流。 书房又乱了,但这次我知道这不是失败,这只是提醒我该向系统中注入新的负伤了。

我的视频号名字叫万物皆伤,你知道是什么含义吗?这条视频就让我来介绍一下我的研究无所不在的考皮拉伤理论,带你领会伤为什么是万物之真理,人类数学文明的源头。希腊认为宇宙万物的终极真理是数学,称为万物皆数。 我的视频号名字就是来自于这句话,认为现代科学的商是无所不在的数学真理商是现代物理学的基本概念之一。爱因斯坦曾称热力学第二定律,即商增定律,是科学定律之最,认为在所有科学定律中它是最重要的, 因为这一定律结识了宇宙的终极命运,即在商不可逆增加过程中达到热平衡的热即状态。 商概念起源于工业革命对内燃机热效率的提升。波尔兹曼提出了刻在他墓碑上永恒的波尔兹曼商公式。受热力学商概念启发,香农提出了信息商概念,开启了人类信息时代的新纪元。 二零零八年,在清华大学计算机系人工智能实验室攻读博士的我与导师孙增奇教授提出了 copy 类商的概念。 最近十几年来,我继续博士论文的研究,最终研究形成了考菲拉商理论体系。考菲拉商理论的学术意义有四点,一是发展了概率论中的考菲拉理论,提出了一个基于考菲拉的统计相关信度量。 二是重塑了信息论最基本的互信息、条件互信息等概念体系框架。三是在 copy 理论和信息论之间建立了理论联系,使数学大厦更加的浑然一体。四是构建了基于 copy 商的数理统计学方法论体系。 经过十几年的发展,考皮拉商理论已经得到了国际学界的认可。俄罗斯科学院在顶级国际会议上发文认为考皮拉商是最好的统计相关性度量,还给出了一个同类度量的对比视意图。 斯坦福大学的 alfa 四网站在对考皮拉商学术专注的书评中指出,考皮拉商是统计方法论的根本性进步,具有巨大的理论和实践意义,为各领域的统计分析提供了极其重要的工具。 copla 商具有广泛的国际影响。剑桥大学等英国顶尖科研机构扩展本理论提出了 vector copla 商理论。国际量子科技研究的中心尤金大学提出了量子 copla 商的概念,得到了量子计算支付戴维多伊奇教授的建议。 国际理论物理研究的中心 i c t p 利用考培拉商方法研究了电力层特性变化。哈佛大学和戈廷根大学基于考培拉商理论设计神经科学数据分析算法。考培拉商理论更是在我国国家建设的各个关键领域发挥了理论支撑作用。 比如南水北调工程公司和长江水利委员会利用它构建吊水用的净流预报模型。 我国的核潜艇动力研究骨干单位利用它开发了核电站安全技术。北京交通大学的国家重点实验室利用它开发了高铁动车组关键部件的健康监测技术。南京航空航天大学基于 kaplan 商方法开发了浦东机场的航班到达时间预测技术。 中国医学院、北京理工大学和西南科技大学利用它设计国防用特殊材料的分子。国防。科技大学利用它开发了卫星健康监测技术。清华大学、国家电网等机构利用它开发了各种电网智能化技术。 中国医学院和武汉大学的国家重点实验室利用它预测长江的洪水。中国石油大学和西南石油大学利用它提高油气田的油气产量。 解放军总医院利用它开发手术效果评估技术。江西财经大学利用它评估我国各地的扶贫政策。 西北农林科技大学利用它研究气候变化对我国南方水稻产量的影响。其他的应用如黄河流域干旱分析、森林土壤生态研究、医院建筑抗震性能评估等还有很多时间关系就不一一叙述。 考古类商的应用遍布各个学科领域,深入到经济、社会、生活的各个方面,真正体现了万物皆商的含义。 我已经将考古类商理论体系的方方面面整理成一部学术专注,题为考古类商理论和应用,目前已在 airforteen 上发布。 书的内容包括了 copy 商理论、十二个理论应用、六个典型 copy 商方法论的评估、十个国际数学界对 copy 商的数学推广,以及 copy 类商在六十七个学科领域的二百七十多个实际应用。 书的副路还给出了 copy 类商的软件实践信息,包括了五个常用编程语言,方便读者使用。 由作者本人实现的 copilot 商算法软件。 copilot 算法包有二和 python 两种语言版本,大家可以直接安装使用。 copilot 商算法的源码可以到作者的 getsup 网站下载, 最后给出作者的个人网站网址,上面包含了最丰富最权威的 copilot 商相关信息,欢迎浏览访问。

我们今天想要跟大家聊一聊,为什么我们的生活总是会越来越混乱,越来越难以掌控,以及我们可以用什么样的方法去对抗这种趋势,让我们的生活变得更有秩序,更有意义。 是啊,这个其实跟每个人都息息相关。对,那我们就直接开始吧。首先咱们来聊一聊,就是什么是商增定律,它为什么会让我们的生活变得这么疲惫,这么难以掌控?商增定律就是 在一个封闭系统里面,他的混乱程度一定会不断的增加。嗯,就是所有的一切都是会从有序慢慢变到无序, 那这个其实就是宇宙的一个基本规律,也是让我们觉得好像生活总是会失控的一个根本原因。哎,这么说的话,其实我们很多的焦虑和压力,根本就不是因为我们自己无能, 而是这个宇宙的规则在推着我们走。对,就是这样。所以理解了商增,你就会明白很多人生难题的底层逻辑。没错,而学会去对抗商增,则是我们掌握自身命运的开始。既然如此,商这个概念到底是怎么来的? 他在物理学里面是怎么被定义的?商这个概念其实是在呃,一八六五年的时候,由德国的物理学家克劳修斯第一次提出来的, 它就是用商来表示一个系统的混乱程度。原来商是可以用数学公式来表达的,那它背后的这个物理意义是什么呢?在统计力学里面,商是有一个非常著名的公式,就是 s 等于 kb 乘以 l n 欧米伽, 嗯,那这里面的 s 就是 商,然后 kb 是 波尔兹曼常数,欧姆是微观状态数,它其实就是衡量一个系统有多少种不同的排列方式。 对,所以 omega 越大就代表这个系统越混乱,然后商 s 也就越大。了解了商,那什么是商增定律?他在日常生活中有哪些具体的体现?商增定律就是热力学第二定律,他的一个核心内容 就是说在一个孤立系统里面,任何的自然过程他都是朝着商增加的方向进行的。 哦,也就是从有序到无序。比如说你把一滴墨水滴到清水里面,他肯定会慢慢的散开, 最后整杯水都会变成一个均匀的颜色。嗯,那这个过程他是不会自发的倒回去的。这个例子真的很形象,就是你确实没有见过一杯浑浊的水,他自己会把墨水再聚回来。没错没错,还有就是一座大楼,他会慢慢的风化, 然后倒塌变成废墟,但是废墟他不会自己再重新组装成一个大楼,包括你这个玻璃杯掉到地上,他会摔碎,但是这些碎片不会自己再拼成一个完整的杯子。 对,这其实都说明了,宇宙里面的这个破坏要比建设容易的多,无序要比有序容易的多。顺着这个思路,咱们来思考一下生活中那些让我们头疼的伤僧惨案。嗯哼, 为什么我们的房间,我们的身体,我们的人际关系,总是特别容易变得乱糟糟的?其实这都是伤僧在作祟,你刚收拾好的房间是处于一个低伤的状态。对,但是你只要在里面生活, 衣服肯定会被随手一扔,然后灰肯定会落下来,就算你什么都不做,这个房间也会越来越乱。嗯,他会自发的向高尚的状态发展。确实啊,就是你永远都在跟这个乱糟糟作斗争,真的是挺心累的。没错没错,其实我们的身体也是一样的道理,就是你要维持一个健康的状态, 你得科学饮食,坚持锻炼,规律作息,这都需要你自律。嗯,那你一旦放任自己 天天吃垃圾食品,然后又不运动,你的身体肯定很快就会发福,然后机能就会下降。对,这就是商增在你身上的一个体现。包括你的感情,也是, 你不去主动的沟通,主动的制造一些惊喜,感情也会慢慢的变淡,然后团队如果没有管理,没有创新,肯定也会变得效率低下,人浮于世。对, 其实这些都是商增的结果。那为什么说自律和坚持会让人这么疲惫而懒散,反而会让人觉得很轻松呢?这是因为自然万物它的趋势都是从有序到无序,最终走向一种沉寂。就像物理学家艾尔温薛定勒说的, 自然万物都趋向于从有序到无序,最终走向死亡。对,所以说你懒散和放弃其实是顺应了这个趋势,他是不费劲的。嗯,但是你要自律,要坚持,你就是在逆着这个宇宙的方向在走, 没错,你就是在用你自己的血肉之躯在对抗这个伤增。所以你会觉得累,其实是因为你活着本身就在对抗伤增。既然如此,我们该如何对抗伤增? 为什么?生命他可以在这个不断走向混乱的宇宙当中维持自己的秩序,甚至还可以不断的进化。其实生命对抗商鞅的这个秘密,薛定谰在他的那本书生命是什么里面已经讲的非常清楚,他说生命以富商为生,嗯,就是 生命这个系统,他不会让自己变得越来越混乱,他是会不断的从外界吸收有序的能量,然后把无序的能量排出去,从而让自己维持在一个有序的状态。听起来就好像生命是在跟这个宇宙玩一个逆流而上的游戏。对,就是这样,其实这个游戏的关键就在于 打破封闭,你只要变成一个开放系统,你不断的去跟外界交换物质和能量,那你就可以对抗上增哦。比如说你这个身体 通过吃喝呼吸,把低伤的资源拿进来,然后把高伤的废物排出去,那你就可以维持健康,嗯,甚至进化。 具体来说,在日常生活中,我们有哪些方法可以主动的打破封闭,引入腹胀,让自己远离混乱和僵化呢?这个方法其实特别简单,就是你要让自己成为一个开放系统 哦,你不能每天就是两点一线,你要主动的去接触新的东西,比如说你去读一本跟你专业完全无关的书,嗯,你去旅行,去陌生的地方,或者说你去尝试跟不同圈层的人聊天, 这些都可以让你的思维保持活力,然后远离那种封闭的混乱的状态。我懂我懂,就是你只有不断的去吸收这些新的信息,新的能量,你才能够让自己一直保持在一个有序的有活力的状态。是的是的,其实不光是你的思维,你的环境也是一样的, 你房间乱了,你要消耗你的体力去打扫,你身体变差了,你要逼自己去运动,你大脑迟钝了,你要静下心来学习。对,所有这些让你变好的事情, 一开始都是很痛苦,因为你要逆流而上。没错,你要给自己注入负伤,你要把混乱重新梳理成有序。聊到这,我们就可以说说节语了,做宇宙中最浪漫的逆行者。 嗯,就是当我们明白了商增是一个不可抗拒的趋势之后,我们该怎么去看待每天那些看似很普通的自律的行为?其实当你真正的理解了商增,你就不会再为生活中的那些乱七八糟而感到那么焦虑了,因为混乱是常态, 你要想让什么东西保持有序,反而是要消耗很多精力。对,就像我们每天坚持读书,坚持健身,认真工作,然后用心去爱一个人, 这些事情看似很平凡,但其实都有着非常宏大的意义。听你这么一说,好像这些很普通的日常一下子就变得很有重量了。对,因为我们在这个注定会走向无序的宇宙里面, 每一次自律,每一次创造,其实都是在反抗这个宇宙的惯性。对,这是一场非常勇敢的逆行。 嗯,然后直面商增,主动的去引入富商,这才是我们能够真正的掌控自己人生的那个终极的方法。 所以我们今天其实就是帮大家揭开了生活中那些混乱和疲惫的本质,然后也聊了一些用自律和开放的心态去跟这个伤增死磕的一些小技巧。好了,那么这一期节目咱们就到这里了,然后感谢大家的收听,咱们下期再见,拜拜!拜拜!

大家看看很多视频都知道有个东西叫伤,叫伤真定律,伤真定律讲的就是说呢,当有一个苹果放在这里的时候,你不管它,你也不保护它,它很快很快的就会腐烂掉,就会 消失掉了。那为了要保护它呢?我们会给它包上一个保鲜膜,放到冰箱里面去,它就可以放的时间非常非常的长,那这就是一个 商真,讲的就是事物都会倾向于毁灭混乱去发展,但是他的这种混乱和毁灭并不是说这个世界都是黑暗的了,并不是他是为了让这个事物能够 化解分解,然后流转起来,然后流转起来,流转才是世界的本质,并并不是毁灭啊。大家有时候看到这个视频没看完就会就会误解,那我们就要回过头来看我们的事情的时候呢,我们就要做好维持秩序和保护自我的一个事情。 你说你现在有情绪了,那你的空性就是不好的,那你就会开始影响身边不好的事情了,那你苹果你也不好想好好保存了,你甚至想把所有一切都丢到垃圾桶里面去,那身边的一切就会开始更快速的 毁灭和消失,包括看不见的情感,包括一切的东西都会加快速度,还有我们的气运和 生命一样的。那理解三层定律,我们就要反过来去制衡他,用我们的,用我们的善良,用我们的智慧内核去制衡他,让他能够不要腐败和毁灭的那么快。

今天我们来聊一聊商增定律啊,就是这个被爱因斯坦称为科学第一定律的东西。对,他其实揭示了宇宙万物从有序到无序的一个必然的趋势,以及我们生命本身为什么要不断的跟这种混乱做抗争。没错,这个话题确实非常的有意思, 那我们现在就开始吧。好的,咱们先来说说商增定律为什么会被称为是宇宙最底层的定律, 就是他到底是如何在我们日常生活当中,在人际关系当中,甚至在我们个人成长当中无形的产生影响的。 其实这个定律在生活当中特别常见,比如说你刚刚收拾好的房间,过不了多久就会变乱。对,或者说一段关系,如果你不去用心经营的话,慢慢的就会冷淡疏远, 包括你自己拼尽全力取得了一个成就,但是你想要去保持住这个成就,是要不断的去努力的,不然的话就很容易会滑回舒适区。其实这些背后的原因都是商增定律在起作用。既然商增定律在生活中这么常见,为什么说他是科学第一定律, 然后他又和我们人生的秩序和混乱有什么关系?是因为这个商纣定律被爱因斯坦称为科学第一定律,他揭释了宇宙最终都会走向一个混乱无序的状态。对,那其实我们人生也是在这种有序和无序之间不断的挣扎。嗯,当你理解了这个商纣定律之后, 你就相当于拿到了一个理解自己和理解世界的一个底层的钥匙。好的,我想知道商增定律的科学本质,以及他在物理学里面到底是怎么被定义的?在物理学里面,商增定律也叫热力学第二定律, 他的定义就是说一个孤立系统的总商,他一定会随着时间的流逝不断的增加,直到最大值,那这里面的商其实就是代表这个系统的无序程度。原来商是用来衡量无序程度的呀? 那能不能举个例子说一下,商增到底是怎么在现实生活中体现的?当然可以,比如说你把一杯热水放在那,他会慢慢的变凉,这个过程就是热量从高温的水 自动的流向了低温的环境,最后达到一个平衡。那这个过程就是商增的过程,就是他从有序变成了无序。对,包括一栋大楼,他慢慢的风化崩塌,最后变成一堆尘土。那这个也是商增的过程, 甚至包括我们的宇宙,他最后也会走向热季,就是所有的能量都均匀的分布,再也没有办法产生任何变化,这就是商增,他是一个不可逆转的趋势,就是所有的一切最终都会走向衰败,走向消散。我还有一个疑问啊,既然说商增会让一切都从有序走向无序, 那为什么生命看起来反而变得越来越有序了呢?你这个问题问的很好,生命确实看起来好像是一个返利,比如说一个受精卵,它会发育成一个非常复杂的多细胞生物, 嗯,或者说一个单细胞生物,它会演化成各种复杂的生命体。对,那这个过程看起来确实是从无序走向有序的,好像是跟商鞅是背道而驰的。对,对, 生命现象看起来确实是一个谜团。那这个谜团到底怎么解释呢?这个其实薛定谔在他的那本书生命是什么里面就解释了,就是他说生命他是一个开放系统, 嗯,他会不断的从外界吸收负伤,比如说阳光啊、食物啊,那这些都是负伤,然后他会利用这些负伤来维持自己的有序结构,同时把体内产生的伤,也就是代谢废物和热量排出去。 对,所以生命其实就是一场和伤增的持久战,一旦你停止进食或者停止呼吸,这场战争就输了,那你这个有序的结构就会瓦解,然后你就会回归到无序的状态。 所以我们今天其实就是从一杯水的冷却聊到了宇宙的热季,然后又聊到了生命为什么能够在这个伤增的世界里面逆流而上。是的,这就是伤增定律, 它几乎包含了我们整个世界的过去和未来。好的,那我们今天的节目就到这里了,然后感谢大家的收听,我们下期再见,拜拜。拜拜。

嘿,大家好,今天我们来聊一个特别有意思的新概念。这个概念呀,可能会解开现在人工智能领域里头一些最让人想不通的谜题,准备好了吗?咱们可能得重新刷新一下对信息这两个字的认识了。 好,我们就从这个问题开始。你想想看 alpha zero 这个 ai, 他 下棋一开始什么都不会,没看过任何人类棋谱,给他的就只有最基本的死板的游戏规则,结果呢,他自己跟自己下,最后下成了超人水平, 这事是不是有点反直觉?咱们经典的信息论就说了,信息不能凭空产生,那他学到的那些高超的策略,那些新信息,到底是从哪来的呢?这就让我们不得不怀疑,我们以前对信息的理解可能有点问题。 其实啊, alpha zero 这事啊,还只是个开始,只要我们拿着老的信息论这把尺子去量现在的 ai, 就 会发现,哎呀,到处都是对不上的地方,全是各种看起来自相矛盾的现象,我们就管它们叫三大辩论。在这些辩论里头, ai 好 像完全不按套路出牌,把信息学的老规矩都给打破了。 这第一个悖论就是创造信息。你看啊,不管是相同信息论,还是那个听起来很厉害的科尔莫格洛夫复杂性理论,他们的核心观点都一样,一个确定的过程是没法创造新信息的。什么意思呢?就是说输入是傻,输出早就定好了,中间不会有任何新的东西冒出来。 但是你在看 alpha zero, 他 自落对一,这过程一步一步都是定死的吧,可他偏偏就从这里面学到了海量的我们人类以前都不知道的全新战略,这就奇怪了,这新信息到底是从哪个石头缝里蹦出来了呢? 好,第二个辩论,关于数据顺序。老规矩是这么说的,你先看到 a, 再看到 b, 和你先看到 b, 再看到 a, 你 获得的总信息应该是一模一样的,对吧?顺序不重要, 但在 ai 这就完全不是这么回事了。你让大模型去学猫坐在垫子上,这句话他学的又快又好,可你要是把词打乱,变成垫子上在做猫,他学起来就费劲多了,效果也差远了。这不就明摆着说顺序很重要吗?可为什么重要呢?经典理论解释不了。 再来看第三个辩论,这个叫分布匹配。一般我们都觉得训练一个模型,不就是让他去模仿产生这些数据的那个过程吗?如果这个过程规则很简单,那模型学出来的也应该是个简单的东西。但你看,有个叫康威生命游戏的东西,他的规则简单到不行,就那么几条。 可就是这么简单的规则跑起来之后呢,能自己冒出来各种特别复杂的结构,比如那个会飞的滑翔机这种复杂结构,而不是仅仅记住那几条最简单的底层规则,这又是为什么呢? 那好,这三个谜团摆在这,到底怎么解呢?其实啊,答案的关键藏在一个我们一直以来都忽略掉的因素里。现在咱们就来看看,解开所有这些谜题的核心线索,那就是这个观察者呀,他的时间是有限的。对,这就是问题的核心。 你想,不管是经典的信息论,还是算法信息论,它们其实都有一个隐藏的大前提,一个特别理想化的假设就是观察者是神,他有无限的时间,无限的算力。 可现实世界哪有这种事?别说 ai 模型了,就是我们人类自己处理信息的能力都是有限的,我们都得受时间,受计算能力的限制,我们是计算受限的。 密码学里有个东西叫单项函数,这个例子简直太形象了,你想啊,给你两个很大的值数,让你把它俩乘起来,这很简单,计算机一秒钟就搞定了。但是我反过来给你那个乘起来的结果,让你把它分解回原来那两个值数,这就难立登天了。 你看,对于我们这种计算能力有限的观察者来说,正着算和反着算难度完全不一样,这种不对称性恰恰就是经典理论没考虑到的地方。 好,为了解决理论和现实之间的这个矛盾,我们就需要一个全新的工具了。那么现在主角登场,让我们隆重介绍一个能把一切都说通的新概念,它叫 i b plexity。 i b plexity 这个词咱们可以把它理解成认知复杂度,它的定义其实特别好懂,它衡量的是什么呢?就是说,对于一个像我们这样计算能力有限的家伙,能从一堆数据里头到底能学到多少有用的有结构的东西? 关键点来了哈,他关心的不是数据有多乱、多水机,而是这里面有多少是能被我们学会,并且还能举一反三用起来的模式。 咱们举几个例子一下就明白了。你先看一个特别简单的序列,比如零幺零幺零幺,一直重复下去,这太好预测了,对吧? ai 模型看一眼就学会了,但是这里没有啥真正有价值的结构信息吗?基本没有。所以我们就说这种东西的 apcomlexity 非常低。 好,现在在想一个复杂点儿的东西,比如一张动物的照片,或者是一段写的很复杂的代码,这些东西里面可就不只是简单的重复了,它内部有各种复杂的结构,各个部分之间都有联系, ar 模型得花好大力气才能学会理解这里面的门道, 但是它一旦学会了,那可就厉害了,等于掌握了一大堆能到处用的知识和模式。这种数据我们就说它的 x p p l c, d 非常高。 iplexity 这个概念最妙的地方就在于它能帮我们分清楚两种复杂,一种是有结构的复杂,另一种是纯粹的瞎乱。你看一张狐狸的照片,它就很复杂,但这种复杂是有结构的对吧?眼睛、鼻子、毛发都有自己的规律,所以它的 iplexity 就 很高。 但是如果我们把这张照片的所有像素点全都打乱,变成一堆杂乱无章的雪花点,你看它看起来也挺复杂的,商值很高,但这种复杂是纯粹的随机,里面一丁点能学的东西都没有,模型对着这堆乱码什么有用的模式也提不出来。那问题来了,这个 eplex 体听起来挺玄乎的,我们怎么去亮化它呢? 其实有个挺直观的方法,咱们就去看 ai 模型训练的时候那个损失曲线。你想啊,如果一个模型在数据里学到了很多真东西,那它的错误率,也就是那个损失就会不断的很明显的下降,对吧? 那么从开始训练到最后稳定下来,这个损失曲线画出来的线跟底下那条水平线之间围出来的面积,这个面积越大,就说明模型从数据里稀疏的结构化信息越多,这个面积就大概是 e p z t 的 量了。 好,现在我们手里有了 applex 这个新式武器,是时候杀个回马枪了。让我们回到开头那三个让人头疼的辩论,看看用这个新概念能不能把它们一个个都给解决了。 先看第一个限息能不能被创造。用 applex 的 眼光看答案就有了。计算过程本身确实没法创造相等信息,但是它完全可以创造。 applex 里 你看 alpha zero, 它就是通过大量的计算,硬生生的从简单的游戏规则里算出来了那些复杂的能被学习的策略结构好。再看第二个数据顺序为啥重要,这就更好解释了,因为我们是计算受限的呀。对我们来说,正着读一句话和倒着读,处理起来的难度天差叠别, 难度不一样,能从中提取出的可学习的结构,也就是 applex 里自然也就不一样了。最后那个分布匹配的备论模型,真的只是在学最简单的规则吗?根本不是! 就像康威生命游戏那样一个受计算能力限制的模型,他才不会傻乎乎地去磨砺底腾规则呢,他会偷懒,会找捷径,他会学习那些像滑翔机一样的高级模式来预测结果,而这些捷径本身就是一种更复杂的程序,他们的 applexity 可比原始那几条规则高多了。 所以你看,理解了 iplexy, 这可不只是一个理论上好玩的东西,他对我们现实中怎么去开发,怎么去训练 ai 有 着非常非常实际的指导意义。 关键就在这一批,普拉斯基给了我们一个全新的视角。比如说,他能解释为什么让模型先去读海量的文字,也就是在自然语言上作域训练效果会那么好,能学到那么多通用的能力。 再比如,他能指导我们怎么从像山一样多的数据里挑出那些最有营养、最值得学的数据,这甚至给数据选择这么一个新兴的研究方向打下了一个特别扎实的理论基础。 这里有个特别直观的对比,研究人员就去估算了不同类型数据的 ipplus 里,结果你猜怎么着?他们发现语言数据就是我们平时说的话写的文章,它里面包含的 ipplus 里,也就是那些能学的结构化信息,要远远高于下棋的数据,甚至比图像数据还要高得多。 你想想,一张图片原始文件可能很大,但它里面能被反复利用的结构模式可能还不如一段文字多。这就一下子解释了为什么现在那些最厉害的大模型都是靠海量文本预训练出来的,因为文本的营养价值实在是太高了。好,这就把我们带到了最后一个问题,一个值得我们所有人思考的问题。 也许未来想要做出更聪明的 ai, 关键已经不在于盲目的去堆更多的数据了,关键在于我们是不是应该开始去主动的寻找,甚至是去创造那些 ipad 四 d 里最高的数据?这会不会才是打开下一代人工智能大门的那把真正的钥匙呢。

在神经网络训练的时候呢,不同的这种任务,我们需要用不同的这种损失函数去决定,因为不同的损失函数,他对于任务的这种刻画呢,是不一样的。 你像常见的这种回归任务,你比如说我要清晰的让他逼进某个东西,我可能军方差好一些。如果说是分类任务呢,那我可能就是用交叉商的形式,如果说我有一些更加细节化的东西,你像 早期有一个经典的一个损失函数,叫推拉损失函数,它其实就是在做语音分割的时候,尽可能把不同类的给它推开, 把同类的呢给它拉到一块推拉损失。那么对于不同的任务呢,我们需要去去取不同的这种损失函数。今天呢,我主要讲一下这个交叉商损失函数,那么交叉商损失函数呢?如果是二分类的交叉商 annry cross 一 乘 这个 y i 呢?我通常指的就是它这个标签为一的情况下,就是 就是我们认定它有不同的类别,每一个类别呢,我可以取零取一嘛,对吧?这个 y i 通常是指的是它为一的情况下,所以它的概率我要尽可能的让它为一,然后这个地方呢,就是它标签为零,一减零它是一,然后 那标签为零的情况下呢?我的概率就是在这个情况下呢,我就要尽尽量让它趋近于一,那么由于这个是取负了,那么通常情况下呢,我们可以看到, 对于交叉商来说,它分别代表了这个叫 log 一 减屁屁, 就是为什么在分类任务的时候,我用交叉上的效果会更好一些呢?因为对于对数来说呢,他在这里面呢,他可能是相对平滑一点,他在这里呢就是他会急剧的类似于道障碍一样,他会急速的上升,就是当你的这个概率, 当我当前的这个任务,当我当前的这个任务呢,他取,我要强行让他就是这个概率要趋于零,就是说他不是这个东西的时候,我要让他趋于零, 就是一减七,我要趋于零,因为这个地方只要很小,那么当你模型输出的时候,当他不为零的时候呢,就会给他一个不为零,尤其是越趋近于一的地方给他一个乘法呢,会非常大,就像一道防火墙一样,这个在托优化里面,或者是这个在托优化里面有一个叫乘法函数法,就是 我我不想让函数取到离这个地方最近的情况呢,我就要接住梯度,那么接住梯度的时候呢,我就要让这个函数再趋近于这个值的时候呢,我要无限给它趋近于正无穷,就相当于道防火墙,你必须要尽可能的远离它, 是吧?那你看这个地方呢,我就要尽可能的让,当它标签为一的时候,我就要尽可能让它屁趋近于零,你看哦,屁尽可能的要趋近于一,因为只有趋近于一的时候,它的损失才能趋向于零,当它不为零的时候,这个地方也是这个地方会趋于无穷,就会是 只有当他趋向正向的时候,我给他给的值呢,会相对就是趋于零。如果说他在训练的过程中,当他的值如果跟我们实际的这种标签不一致或者啥的时候,这个概率就是说这个地方的惩罚是非常严重, 所以说呢,在这种高严肃的这种高严重的这种惩罚的情况下呢,函数就能够就是这个损失函数就能尽快的指导神经网络往这的方向上去引导 这个在拓优化,优化理论里面,他跟那个乘法函数法是很像的,就是我有一个约束, 我有一个约束一加 x 平方,我的约束等于零,那我在原函数里面,我就让这个值呢,我前面成一个非常大的系数,那么当 x 在 整整个函数让他去某一个极值的时候,那么当 x 在 这里面有值的时候,因为我本身让他为零的话,他后面向就不会干扰到前面取值的过程。 当他不为零的时候,整个狮子不为零的时候,前面有一个非常强大的一个惩罚项,就会让这狮子陡然增长,他就会把这个惩罚加的非常严重,就是火龙法则。那么在损失交叉上,对于对数的这种形态,他就严格满足这种类似于这种,当你错的时候,我给你的惩罚是非常严重,学吧,你就。

为何无人居住的房屋在短短三年间便会呈现破败之态?老一辈人常言,房屋缺了人气便会败落?此言背后实则蕴涵着宇宙间最为严酷的终极法则升增定律。爱因斯坦曾明确指出, 升增定律是宇宙中唯一不可动摇的法则,其地位超越了相对论与量子力学。此定律不仅左右着空置房屋的衰败进程, 更掌控着生命、地球乃至整个宇宙的终极演化方向。一八六五年,德国物理学家克劳修斯首次引入了伤的概念,用以量化能量的分散程度以及系统的混乱程度,并据此确定了伤增定律。 宇宙的本质乃是一个不断趋向无序的浩瀚进程,譬如烧开的水会逐渐冷却,摔碎的玻璃杯无法自行复原,揉皱的纸张亦不会自动恢复平整。 在无外界干预的封闭系统内,一切事物均会由有序状态向无序状态转变,此即商增现象。 而我们日常进行的打扫房间、修补屋顶、关窗挡雨等行为,本质上都是在向系统输入能量,以抵御这种与生俱来的无序趋势。或许有人会质疑,既然商增不可逆转, 那么空调何以能使房间变得凉爽?地球又为何能够孕育出复杂的生命体系?其实答案颇明了,这些看似违背商增定律的现象,实则从未真正打破该定律的框架。空调在制冷过程中需消耗大量电能, 即在实现房间局部商减的同时,会向外界释放更多热量,从而加速了整个城市的商增进程。 而地球之所以能够孕育生命,乃因其并非孤立系统,太阳持续向地球输送低商能量,地球吸收这些有序能量后,再向宇宙空间散发高商能量,正是这些留存的滴了地球上的生命。自然与文明 物理大师薛定厄曾言,生命以负伤为生。此言一语道破了生命的本质。我们每日进食、呼吸,本质上都是在从外界获取有序能量,以修补自身细胞的衰败,维持身体的低伤状态。 然而,与此同时,我们也会通过排泄等方式向环境释放高伤废物,这相当于以借贷的方式维持自身的有序状态,但最终却会加速整个宇宙的升增进程。 可以说,生命的诞生,本身就是宇宙为了加速其向终极无序状态演变而创造的高效催化剂。即便是宇宙中最为神秘莫测的黑洞,亦无法挣脱商曾定律的制谷。 往昔人们普遍认为黑洞具有吞食万物的特性,且被吞食的物质所携带的信息会随之消逝。这一观点显然与商曾定律相冲突。一九七二年, 贝肯斯坦勇于突破传统认知,大胆提出黑洞易具讹伤,且其伤的大小与黑洞的事件世界表面基成正比。 一九七四年,霍金进一步通过研究证实了贝肯斯坦的这一观点,并指出黑洞会通过热辐射的方式逐渐蒸发, 最终完全消散。而黑洞所蕴涵的伤,早已在宇宙总伤中占据主导地位,成为推动伤增进程的核心因素。依据伤增定律,宇宙的终极命运似乎早已注定,那便是走向热季。再过数万亿年,所有恒星都将耗尽其燃料,熄灭光芒, 黑洞也将蒸发殆尽,直至衰变消散。计时,整个宇宙将达到热平衡状态,热量不再流动,任何事件都不再发生,时间也将失去其原有的意义,一切终将回归虚无。 这听起来或许令人感到绝望,然而真正的意义恰恰蕴藏于这条不可逆转的衰败之路之中。波尔斯曼曾指出, 商增仅仅是宏观世界的一种统计趋势,在微观世界中,商减并非完全不可能实现,只是其发生的概率极低而已。而我们的宇宙乃至我们自身的存在,本身就是一个不可思议的奇迹。宇宙初始状态的低商概率之低令人难以置信。 我们之于宇宙,就如同一杯热奶倒入咖啡时所绽放出的美丽云纹,虽短暂却绚烂。低商是宇宙初始的简洁与纯粹,是终极的永恒之境。 而在这低商与高商之间的转瞬即逝的复杂有序状态,以及每一个对抗商增的瞬间,共同构成了生命与宇宙最为壮丽的意义所在。

你信不信我们的世界正被一双无形的手操纵着,两千年前的老子将这双手称之为天道, 两千年后的科学家将这双手命名为商曾定律。那么商曾定律是什么呢? 为何很多人理解他后就顿悟了呢?下面我举个例子来理解商曾定律。例如一杯开水,放着放着就会变凉,水只能从高处往低处流, 我们的手机会越用越卡,电池会越用越弱,衣服会越来越旧。 之所以如此,就是因为商增在不断的增加,在没有外界输送能量的情况下,总混乱度就会越来越大。 商增定律的出现,让我们看到了万物的结局,不管是地球、宇宙还是人类这样的智慧生命,从宏观角度来看,商增是一个不可逆的过程。那么如何才能对抗商增定律呢? 举个例子,中国有句话叫家和万事兴,就是因为一个家庭和睦的时候,就是商最小的时候。因为和就意味着城隍之间的默契,甚至是无摩擦的。 以和为贵,天时地利人和也是这个道理,和就意味着商值最小。 伤是指一个系统的无序度,人的身体要么养护,要么死亡。人的一生要么管控,要么荒芜。 社会行为要么规范,要么混乱。用伤僧定律来理解人生,化解情绪,把无序的事情变成有序的事情,也可以理解为遵循道的规律。

你是否总在科普视频里听到商增,却一直没真正搞懂它到底是什么意思?今天我们用一种最直观的方式把它讲明白。商增这个概念对化学和物理学来说特别关键,它能解释为什么物理过程总是朝一个方向走,而不是反过来。 为什么冰块会融化?为什么奶油会在咖啡里散开?为什么轮胎被扎破后空气会漏出去?这个概念是出了名的,让人难以一下子搞明白。 伤往往被说成是衡量无序程度的指标。这个比喻听起来很方便,但其实有点误导人。比如一杯碎冰和一杯室温的水,哪个更乱呢?大多数人会觉得是碎冰,但实际上碎冰的伤反而更低。 因此,今天我们换个角度,可以尝试用概率来理解它。虽然这个思路有点烧脑,可是只要你好好琢磨一下,对伤的理解就会清楚多了。想象两个小固体,这两个固体都有六个化学键组成。 在这个模型里,固体的能量都储存在这些化学键里。我们可以把化学键看成一个个小容器,里面装着不可分割的能量单位,我们把它称作量子。能量越多,固体就越热。能量在两个固体中分布的方式有无数种, 并且这些分布方式都够保证两个固体加起来所拥有的总能量相等。每一种分布方式都称作一种微观状态。 比方说,分布有六个量子的能量在固体 a 中,两个量子的能量在固体 b 中,这就有九千七百零二种微观状态。当然,八个量子还有其他分法,比如能量全部在固体 a 中,或者两个固体的能量平均分布, 如果假设每种微观状态出现的概率都一样,我们就能看到有些能量分配方式出现的概率会高于其他情况。这是因为这样的能量分布包含更多的数量的微观状态。伤,其实就是直接衡量每种能量分配概率的东西。 我们所观察到的是,当能量在两个固体之间最均匀分散开时,伤值最高。所以广义上讲,伤可以理解为能量扩散程度的测量。低的伤值表明能量是集中的,而高的伤值则代表能量是分散的。 为了搞清楚为什么伤的概念,可以解释自然发生的过程,比如说热的物体会冷却,我们需要理解能量流动的动态系统。 实际上,在现实中,能量从来不会老老实实待着,他会不断在相邻的化学键之间跳来跳去,随着能量移动,分配方式就会改变。因为微观状态的分布,有百分之二十一的概率能量会进入最分散的状态, 有百分之十三的概率能量分布会回到起点,还有百分之八的概率 a 反而获得更多能量。别忘了,我们看到这种现象是因为能量分散的分布方式更多,所以我们有更高概率观察到高商值,而不是能量集中的低商值状态。 这就是为什么把热东西放在冷东西旁边,冷东西会变热,而热东西会变冷。但即使这样,也还有百分之八的概率热东西反而变得更热。可是为什么现实里从来没发生过呢?这完全取决于系统的大小造成的。 我们刚才假设的每个固体只有六个化学键,现在把它们放大到六千个化学键和八千个能量单位,而初始状态依旧是四分之三的能量在固体 a, 而四分之一的能量在固体 b, 那 么现在固体 a 自发获得更多能量的概率 已经小到几乎可以忽略不计了。我们在日常生活中常见的物体中,粒子数量比这还要多出好几倍,这就导致热物体自己变热的概率小的离谱,根本就不可能发生。所以冰会融化,奶油会散开,轮胎会漏气,因为这些最终状态的能量分布比初时状态要分散的多。 实际上这只是高商值,在统计上更可能出现罢了。这就是为什么商增被称作时间之箭的原因,只要能量有机会散开,他就一定会散开。那么你经历过哪些商增的瞬间呢?是永远整理不好的桌面,还是手机里越删越多的照片?在评论区聊聊你的观察吧!