粉丝57获赞240

哈喽,大家好,今天呢我来给大家介绍一下这个 my life 它的这个优化算法的这个整个工具箱的一个工具的情况,那么我们可以看到就是它这个工具箱呢,它有特别多的这种就是方法和算法,但是我之前从来不知道它是干嘛用的。今天呢我来给大家 一个一个介绍一下。那么首先呢是他的这个多目多目标就是多目标小姐就是这里呢是你的那个目标函数,然后呢他可以就是求一个多目标的优化,他求的是 就是这里呢你可以就是固定你的目标值,比如说你的目标值是二十、五十、三十,那这样的话你就可以就是把这几个目标值全部写在这里,然后呢这里呢可以给你的那个目标值付一个权重,那也就是说相当于是给给他做一个加权,然后他优化的时候呢会优先去优 画哪个,然后呢这里呢他可以有那个线性线性物等式,线性等式,然后还有边界还有非线性的一些条件,大家可以去进行设置。嗯,那么第二个呢是一个单变量非线性最小值最小值的一个球结,这个呢就非常简单,如果说你有一个非常非常复杂的一个 非线性的一个函数,你想求他最小值在一定的区域上,那他是一个单变量的,那这个时候呢你就可以来用这个函数这个工具箱来进行求解,那这里呢就是他的最小值和最大值,然后这里呢就是这个函数啊,那么第三个呢是一个限制条件下的非线性, 非线性最小,其实这个就是那个呃非线性,非线性的一个规划求解,这里呢就是我们的目标函数,然后这里呢是起始点,然后这里是线 线性不等式,线性等式,然后编辑条件,嗯,这里呢是非线非线性限制,还也就是说那个非线性的条件,这里呢之前在遗传算法里面都有说啊,这里呢他有好几种的这个求解算法啊。好,下一个呢是 直接求最大最小最大最小优化的这样一个函数,那他呢就是跟刚才的其实是差不多的, 就是这里是目标函数,这里起始点,然后这里是限制条件,然后呢这里呢我们可以选择就是不同的那个计算方法, 然后去对他进行求解。再一个呢是搜索算法,这个这个算法呢是非限制的,就是没有限制条件的这个非限,没有限制条件的非限性求助调制,也就是说你这个目标函数呢?是啊,一个非限,非常复杂的非限性的一个 呃函数,但是呢他没有任何的限制条件,那这个时候呢你就可以用这个呢来进行求他的最小值啊,下一个呢是非限没有限制条件的非限性最小值啊,这个呢和刚才的那个呢基本上是 类似的,但是,但是这里呢他有好几种,就是就是那个优化的算法来供我们选择,刚才那个呢就是只有一种啊,兄弟们,这个这个半无线最小化这个东西呢,我也没有搞明白,等我搞明白了我再给大家说啊,下一个呢是非线性等式求解。 就是说你有一个,嗯,有一个那个什么非线性的等式,或者说非线性的这个方程组,那你都可以来就是通过这个呢,我们来进行一个求解,这里呢是他的那个初始点啊, 下一个呢是这个单变量非线性等式求解,也就是说求一个非线性等式的一个单单变量非线性等式的一个方程组,求他零点啊,那这里呢我们可以设置他的左边界,右边界值, 然后呢也可以让这个算法呢自动来进行选选择,你可以就是直接给他一个 x, 然后让他自动在某个区间内进行选择。下面这个呢就是基因算法,基因算法也就是遗传算法,上次呢我已经介绍过了,大家可以看我上期的视频 啊。另外呢这里呢我道个歉,这个呢确实是有这个多目标优化,就是遗传算法的多目标优化的这样一个工具工具。然后这里呢适应度函数,然后这个呢是变量的个数啊线线性条件,然后 边界非线性条件,然后就对他进行求解。但是具体的计算原理呢,就是大家可以去了解,这个呢我也没有做具体的案例,如果大家需要的话我也可以做一个。下面是是线性规划求解。线性规划的话也很简单,就是说我们有一个线性, 就是线性限制条件,然后线性的目标,然后这个时候呢我们可以用这个来进行求解,这里呢啊线线性不等式,线性等式,然后还有这个边界,这里呢有几种不同的这个求解的方法。 好,下一个是这个限制限制条件下的线性,嗯,其实就是那个最小二,最小二乘法就是,对,就是他就是最小二乘法,这里呢我们可以看一下他这个很不是很多很多个的线性方程组成的一个线性方程组,然后我们 对他进行一个求解,正确的就是设置一下边界,嗯,就可以了。然后我们这个点呢,也可以让系统自己进行选择啊。下一个呢是非线性的一个最小而成,其实就是,嗯,类似于线性的最小而成。但这里的这个 啊,函数呢,需要我们自己来写,因为非线性的形式是不固定的,有可能有 san 考 san x 平方, x 三次方这样的。然后这里呢是一个起始点,这里呢是最最小最大的一个范围,就是最变量的一个范围,下一个呢是非负的线性, 非负的线性最小二乘。这两句意思就是很明显就是说那个变量他不能取负的,只能取正的这样一个情况,然后跟刚才的那个线性最小二乘是一样的。下一个呢是这个部分搜索 算法,这个呢我不知道他的原理是什么,但是他其实跟那个一般的优化算法也是一样的,这里写目标函数起始点,然后哦线性条件边界,非线性条件,然后给他写上去,然后他就可以自动求解了。具体的原理呢,大家可以去看 my life 的说明。下一个呢是 二次规划,对,二次规划,二次二次规划呢,意思就是说他这里面有二次的那个 啊, x 有 x 平方向,然后有 x 向, x 平方向呢,我们就用矩阵 h 来表示出来,哎,然后这个 x 向呢,就用 f 来表示出来 这样一个情况,然后对他进行求那个最小制,这呢就是先先性的限制条件,最后一个呢是这个退火算法,他其实 其实呢也用的话也很简单,但原理的话大家需要自己看哈。这里呢就是也是就是设置一个模样函数,设置一个起始点,然后设置一个就是变量的最小范围和最大,嗯,最大方最小值和最大值,然后他就可以进行求解了。 然后呢,以上就是 mylive 他的这个优化工具箱的一个具体的情况,如果大家对哪个感兴趣的话,就可以在评论区告诉我,然后我可以给大家讲一下具体他是怎么用的。本期视频到此结束,非常感谢观看,拜拜。

啊,还有呢这个就是模型的导入、导出以及自定义,就是定制化,自定义以及这个就是在数据处理,包括代码生成转换成 cc 代码、 cc 代码等等。好,这个就是深度学习然后他现在支持的这些情况 啊,那么对于目前主流的然后深度学习的一些模型的话,比如说卷记神奇网络模型啊,循环神奇网络里面的长短时机 lstm, 我们后面都会讲到,然后呢一会,呃,可能会会今天啊 举的例子当中没啊,没有他啊,但是我们这个就是后面专题当中会详细的讲讲这个例子,建议学习我们以后会给大家然后去展示一个案例,然后的话还有生产是对抗网络,这是二零一九毕业刚刚支持的,然后这样 的一个工具箱。还有这个就是啊可视画质这一块的功能,也就是基本上他可以满足我们对于一个常规的这个深度学习的一个研究的需要了,我个人觉得是这个样子。 好啊,那么接下来的话,我给大家然后简单的然后来介绍一下他这个几个很好用的工具。第一个呢这个就是可视化的工具,就是店铺内头我可得砸一个这样的一个工具,然后的话你打开这界面就是这个样子,在这个里面你可以去新建一个模型, 打任意的打你想要的层,你放一百层都可以。然后的话你还可以导入,就是别人的模型,你可以直接导入进来,你可以去直接用或者去修改他,都可以修改你们参数。 这里面有一个重要的按钮,就是这个阿拉拉,意思就是分析,就是,呃,能深度神经网络的这个模型突破结构他是有 要求的,他的前一层和后一层在连接的时候得到接口必须要严格一致才能接,否则接不上。所以说你自己在做的时候的话,可能这个就会出一些错误,那么他会帮助你分析说你哪一层有问题,哪一层没问题,他全部会告诉你,以及你模型设计好了,这个托付结构搭好了之后,你导出 然后的话,这个这个并且可以把它转换成代码,然后这些都是可以的啊啊,那么我们可以来看一下,然后这个就是其中的分析的那个功能,比如说这个模型有二十五层,哎,没有错误,也没有任何的警告, 他的每一层分别是什么?是卷基层还是计划函数层还是归于化层这些内容我们后面讲卷卷基成绩网络那个专题都会详细的去讲每一层是什么功能,什么含义,包括,哎,嗯,你说, 喂 喂 喂,有人在说,嗯, 我这边没有问题,我这边没有卡呀,是现在说你什么情况?对, 有有点卡,现在可以吗?现在大家听我说话清楚吗? 如果说是啊,不卡的话,可以,对,好好,没,没有问题,好好,那么的话,这个就是我们可以在这个表格当中可以看到每一次 层,然后他的输出,也就是从输入信号进来之后到这一层他的输出变成什么样子,以及这一层当中的话,然后他的参数,然后这个是多少个, 然后以及这些参数,然后这个是怎么去影响他这个结果的?这个的话呢?这个是啊,很重要的一个,因为如果说有老师同学参加过我之前的那个线下课程的话,讲到这部分的时候啊,如果说没有这个工具的时候确实是你很难理解,而且是你很难验证, 他是需要你自己去算的,然后如果说你能够自己算清楚,而且根据这个结果比对上的话,那么就说明你真的能理解这个问题 啊。所以说我个人觉得这是呃,应该这个功能是二零一八毕业之后才推出来的一个功能啊,为什么群里面有好多人问我说二零一六,二零一七行不行啊?不是我非得让大家去安装这个新的版本,而是这个 这些功能可能老的版本那就没有啊,所以说的话这个是这样的一个问题啊,当然这个模型导出的时候,达伟也会告诉你好几个选项,就是你可以这个就是把它导入导出到工作空间当中, 然后你也可以把它生成代码,而且生成代码的时候呢,你可以把原来的那个模型的这个参数也一起导出出来,然后这个这也是也可以具体的话我们这个后面,然后这个就是会给大家,然后来啊介绍一下。 好,接下来的话我给大家然后这个去来演示一个案例。但是演示这个案例的话呢,大家可能呃没有办法跟着我这个去来进一步的操作了,因为这需要那个去让大家去安装一个啊包,那么我一会会给大家去说, 那么我们的话这个就是正常的,如果说你的这个就是程序来跟着我去敲的话,然后你的程 就会出错的这个地方, 好,我们稍等一下,因为我的计算机现在是视频会议系统开着,马踏那边开着,然后呃,安的 note 开着,我把这些都给关掉吧,没用的都给关掉啊,把这个就是浏览器都关掉, 我的话筒就是我的味道也关掉。好,我们都关掉。 好,那么接下来的话呢?这个就是我们这是一个已经训练好,在百万张数量级的图片库上训练好的一个模型,我们把这个模型训练好了之后呢,把它导入进来,然后我们这个就调用这个可视化的这样的一个窗口, 好对付, 来到我的第三个。好,那么的话我们这个完之后,等一下他会弹出一个窗口出来。 好,我们耐心的等待一下。 好,呃,他会弹出来这样的一个窗口, 有时的话我们把刚刚的那个模型,然后我们把它导入进来,就是在工作空间当中就这一个变量,所以说就默认了,然后我们把它导入进来。

所以说就啊默认了,然后我们把它倒入进来, 好,我们把它倒入进来之后呢,这个就是我们可以放大一下,因为他二十五层,然后这个就太太大了。好,我们放大了之后的话,我们就能够看得到他每一层, 你点击每一层的时候呢,比如说输入层,这就是一个二百二十七乘,二百二十七乘三的这个图像,对吧?然后的话呢有个卷基层,这里面这些参数你都可以去调去等等,都可以去调 好,那么的话呢这个如果说你的网络,然后这个头部结构设计好了,你可以点击一下这个分析,比如我们分析一下这个网络,看看这个网络有没有错误,当然这个网络 是没有问题的,对吧?我们这个自己在设计的时候的话,这个设计完了,需要这个用这个工具去检查一下, 这就现在是一个诊断的一个工具。 好,我们可以来看一下这个就是刚才幻灯片里面那个截图,对吧? 好,那么你可以这个点,你可以就点击到每一个点上,那么他就知道就是这一层对应的呢是哪一层,这个很方方便的,这个你去分析,然后包括你去观察他每一层他的这些参数啊,这是这样的一个这个功能,如果说你模型设计好了之后, 你把它导出,我们可以把它导出到这个就是红色空间当中来, 比如说他已经导出成功了,导出成功的话,这个就是,那么我们在工作空间当中这个来 yes 意义就是了,对吧?好,那么的话你就可以去用它了,那么的话呢这个就是你还可以把它生成代码, 因为在没有这个可视化工具之前的话,我们要来设计一个深度神经网络,在模特料管里面你有二十五层,那么你就要去敲至少是二十五行的代码,然后把每一层,然后这个他的参数类型都给给的很非常清楚,然后这个 科普结构才能创建起来。但是有了这个东西的话,大家可以很方便的从左侧他分装了一些库,对吧?每一层,每一层,然后这 是什么?你往里面搭积木一样把它搭起来就好了啊,那么的话我们可以来看一下,他这个时候的话就给我们这个就是产生了这么一个,这个就是代码文件 啊,我可以了看一下,那就是这一串,好,我们可以看到然后刚才的那个核心的代码部分就是在这个地方就这么多,我们可以啊, 大家可以仔细的来看一下的,如果说你没有这个工具的话,你要把每一层他的参数然后都给设定好了,这才能行的话,我觉得这是一个很麻烦的一件事情。 所以说我觉得这个可视化工具,这是马特莱伯这个深度学习工具箱里面背出的一个非常强大的一个工具啊。我们后面的话,这个就是可能有一些案例当中,然后会 设计的到会用这种方法,然后来这个就是结合案例,然后帮助我们去设计他。好,所以说大家可以这个去感兴趣,可以自己去摸索一下,去试一下。 好,那么我们回来这个就是我们的这个就是内容。那么接下来的话呢?这个就是我给大家再介绍一个 matel 本支持的一个功能, 就是我们知道,然后这个经常大家在呃朋友圈里面或者是新闻当中会看到某一个学校,某一个团队,然后又开发了一个生路神经网络的模型,拿了这个国际上的某一个比赛的冠军亚军之类的 啊,这里这些模型的话呢,都被视为是经典的模型,而在这些经典的模型的话,都是在百万张甚至是几百万的上千万张的图片过上了训练出来这些模型的训练,然后这个需要花好几十个小时甚至好几百个小时的时 才能把模型训练出来,很辛苦。把这些模型训练出来之后的话,那么我们很多时候就可以直接去用它了,而不是说我们拿到再重新训练去,那个就太费时间了。 所以说的话呢,这个就深度学习里面的话,有一个基本的概念,就是我们可以在别人已经先训练好的模型上,然后去做我们的工作 啊。所以这就涉及到这个马特莱伯,然后支持一些经典的模型的话,这个他的这个嵌入导入进来,比如这里面变出来了,这个就是阿蕾斯奈特,这是一个非常非常经典的一个模型,二零一二年提出来的,刚才我给大家然后导入了 啊,还有一些比如说牛津大学的 vgg, 然后谷歌团队的这个就是勾勾并赛事等等,还有一些其他的啊, 但是需要说明一点的事情是呢,这些包的话,然后这个马特莱文你安装的二零一九毕业里面,这是没有的,就像阿莱斯奈特刚才 如果你要去运行的话是会出错的,需要我们手动的这个去安装,他需要联网的情况下,然后去安装他啊,有时候我这地方截图了一下我目前我安装的一些东西啊,大家这个可以去啊, 记住我一下这些名字,大概他都很像前面的都是地方人顶托 boos, 然后 mbot 或者是 model, 然后这样的 fow, 巴拉巴拉。什么东西在什么地方然后去安装呢?就是在刚才的那个阿德昂这个地方,就是刚才的这个,就是附加功能的那个地方,我们在摩托环境下就找代码的那个地方,你去搜就好。 好比如说的话,我们来看一下。好,我们可以去来看一下啊的昂这个里面,然后我们来去啊。安装阿莱克斯奈特的时候是怎么回事啊? 这个东西的话在前两个,呃,神经网络这个 bp, 神经网络这个专题里面的话,专题三和专题四的时候用不到,但是在专题五的时候就要用的到了,所以说大家可能我稍后我会拉一个清单,哪些东西是大家是需要装的,然后这个大家可以提前去装一下。 好比如阿莱克斯奈特的话,你可以先找一找这个名字,店铺靓丽、托马克斯毛豆,然后复瓦莱克斯奈特奈特,我然后的话你点开他 在右侧这个地方的话,你会看到有一个意思到安装的按键,我的电话已经装上了,所以说他状态就变成了吗?你是管理啊,然后你可以点击安装,然后的话,那么他会让你去同意一个 协议,接受一个协议,然后的话呢,你再往下一步,下一步安装就好了,但是这个是有一个前提条件的,就是你必须得要有一个嘛他那边的一个账号。 所以说大家需要提前去马斯沃克斯公司的官方网站上面拿着你的一个个人的邮箱,不管哪个幺六三还什么的邮箱,都可以这个去注册一个邮箱去。好,那么的话呢,这个你就可以去呃用这个账号,然后这个去啊,下载啊。 那么接下来的话呢,这个就是我再给大家然后简单的来介绍一下在 motelaber 里面深度学习工具箱里面,截止目前为止他支持哪些 呃层,不同类型的层,帮助我们去设计这些拖布结,不同的拖布结构我们看到有输入层, 然后还有转机层,还有全连接层, 然后还有计划函数层,不同的计划函数层还有输出层,输出层里面有如果你是分类识别的问题,有专门的克拉斯的,可以胜败也,如果是回归的预测,你和的话,有准归胜败也。 然后这边还有涉及到这个就是呃拳击升级网络里面的这个就是他是调三的这样的一些,这个就是技巧性的这样的一些层,比如说皈依化层,然后胶报的随机丢弃层,然后包括等等这样的一些层。然后的话呢还有这个就是磁化层, 不同的磁化操作平均最大,然后这个就是磁化层等等。然后还有一些呢,这个就是曾帮助我们实现更复杂的托布结构,就是我们刚才然后给大家演示的看到的这个阿莱克斯奈特的话,他就是从上至下串着的二十五层,他没有别的这个复杂的结构,而在这个地方 抗斑内省这些层的话,他就可以啊,让我们实现一些复杂的头部结构。比如说的话我从第八层 直接跳到十二层,然后不是从八、九、十、十一,然后才到十二层,我可以直接跨转过去。这还有这个地方你就需要用到这些连接层,然后直接这个设计方法好,那么的话这个是啊,目前截止目前,然后对。

让机器人学会走路,一直就是人工智能研究的核心问题之一。只有走的又快又准又稳,适应各种地形,才能催生出未来的机器人。保姆、保洁、保安、保镖, 从波士顿动力到特斯拉,从小米到智慧君,通用人形机器人离我们越来越近了。 今天就带大家使用 matlab 的深度学习和强化学习工具箱,还有仿真工具 semial link, 玩一个特别有趣的强化学习案例,训练双足智能体,学会走路, 你将亲眼见证他从蹒跚学步的人工智障升级修炼成健步如飞的人工智能全过程。这个可爱的小机器人由一个躯干和两条腿组成,每条腿由脚踝、膝盖、胯 三个自由度,两条腿总共六个自由度,都可以施加扭距转动。智能体可以观测自己的位置、姿态、速度、扭距和地面给他的接触力和摩擦力,总共三十一个环境观测值。 智能体的行走效果有奖励函数衡量,走的越快越稳,越久越远越优雅,奖励函数值就越大。 而智能体的任务就是从一轮轮的仿真模拟中观测环境给他的各种反馈,不断试错,优化奖励函数,探索和学习出最优的走路动作和策略。 整个过程呢,不需要人为去指导干涉,智能体自己就能适应环境,学会走路。这就是神奇的强化学习。在 在打游戏、下围棋、做决策、自动驾驶、药物设计等领域已经达到甚至超越了人类的水平。最近大火的 chat gpt 背后也是强化学习。 今天的代码教程在 get up 上免费开源,我用的版本是 matlab r 二零二二 b 打开代码,首先运行 start up working robot 的 m 文件, 把这些目录全部加入到 matlab 的工作目录中,然后进入 reinforcement learning 目录,点击点 m l x 的代码教程。这是 live editor 交互式编辑器,非常类似 python 中的珠 pater notebook, 可以逐代码块儿的运行调试,非常方便 选择六自由度还是十自由度的环境?十自由度呢,是在刚刚六自由度的基础上,脚踝 和胯又各加了一个自由度,关节变得更加灵活。但是两个效果其实是差不多的,我这里就用六自由度做演示,设置全局参数,如果你的电脑有 gpu, 可以开启 gpu 加速和病情运算的加速。 好,接下来获取智能体采取的动作值和环境给他的观测值。 观测值 observation info 呢,总共有三十一个观测值,而动作值呢,有六个电机的扭距值,六个电机在六个关节上,智能体可以对每个电机施加扭距,这就是他采取的动作 设置各种各样的物理参数,腿脚尺寸,关节的阻尼系数,初始机器人的姿态和强化学习的时间参数,每一轮 仿真的最长时间和每一个时刻的时间。好,接下来就是强大的 semilink, 在 cmo link 中可以仿真出真实的物理世界,地球有重力,地面有摩擦。这几个试播器一样的窗口就是观测我们想追踪的任何值,比如说奖励函数值,扭矩,动作值,我们先把它关掉。 右边这个方块呢,就是机器人的物理环境,点开可以看到机器人的左腿、右腿、躯干,地面和各种各样的传感器,就像给他浑身贴满了传感器。 左边这个方块是强化学习智能体,它采取 action 动作,再获取环境反 反馈给他的 observation 观测值和 reward 的奖励函数值。那观测值呢?刚刚也说了,有三十一个。而奖励函数呢,由五项组成,分别是奖励前进子速度、惩罚横向的偏移、 惩罚跳的太高、惩罚用力过大,奖励存活时长。智能题走的越快越稳,越久,越远越优雅,奖励函数就越大。每一项奖励函数的权重都可以手动修改, 不同的权重组合可以催生出不同的智能体走路行为。我专门做了另一个短视频,可以看一看。那这个方块呢,是环境判定这一轮仿真是否失败?如果智能体跌倒,仰面朝天,或者 横向偏移过大,就判定本轮仿真失败,重启新一轮的仿真。 那智能体到底是如何做出决策的呢?他的脑回路是怎么样的呢?他的大脑其实是 d d p g。 强化学习算法由 actor 神经网络和 critic 神经网络两个神经网络共同组成。 actor 神经网络输入从环境观测到的三十一个观测值,输出采取的动作相当于一个考生。 而 critic 神经网络呢,输入从环境观测到的三十一个观测值,以及 actor 采取的动作输出 q 值, q 值就相当于 critic 对 actor 决策的评分。所以 critic 神经网络相当于考官,一个考生,一个考官。两个神经网络教学相 长,彼此促进共同进步,协同进化,共同组成了智能体的大脑。那可以使用 meta lab 的深度学习工具箱 deep network designer 工具可视化神经网络结构, 从工作区导入,先看 actor network, 输入三十一个 observation 观测值,输出六个自由度的扭矩。 再看 critic network, 输入三十一个 observation 观测值和 actor 做出的六个动作,输出这个动作的评分。这里边每一个模块儿都可以可视化 的拖拽点击修改,非常的方便。好指定智能体的超参数,比如未来时刻的奖励函数,折扣系数。创建智能体 agent 刚创建的时候,这个 agent 是完全随机初始化的,他还没有经过训练和仿真,他是一个纯纯的人工智障。我们可以仿真一轮跑一跑试试看。 就打开了 meta lab 的 mechanics explorer, 那他确实不会走路,刚出生还没站稳就被判定为失败了。 那训练之后是什么样的呢?可以调用我预先训练好的一个模型文件来跑一跑,可以看到走的非常丝滑流畅。你也可以从头开始训练自己 己的智能体,指定更多的训练超参数,包括训练轮次、日制、可视化和模型保存。然后呢,就开始漫长的训练了,两千五百轮大概要花十个小时, 你可以看到训练过程中每一轮的仿真动画和日志图表。如果你有时间的话,可以坐下来慢慢欣赏智能体学习过程中的各种有趣行为。 有迈大步,小碎步,踮着脚,蹲着走,垫步,像醉汉一样东倒西歪,像放学一样蹦蹦跳跳,从蹒跚学步到走出六亲不认的步伐。 在折线图里,浅蓝色是每一轮仿真的奖励值,深蓝色是滑动平均的奖励值都在不断升高,表示走的越来越好。橙色线呢,是初始状态的。 q 物质逐渐稳定收敛,训练完成之后,先把训练过程中的日志保存成 csv 文件,再把智能体模型保存到本地, 你就可以把上面推理预测的模型文件换成你自己训练得到的模型文件, 看看跑出来是什么样的效果。打开训练得到的日志 csv 文件,也可以看到,在训练过程中,奖励函数值越来越高,智能体存活的时间也越来越长。 q 零逐渐收敛, 就证明我们学习的越来越好。今天呢,我们使用 matlab 的深度学习和强化学习工具箱,还有仿真工具 cmink, 实现了双足智能体行走的 ddpg 强化学习算法。我们只需要像上帝一样设 治好物理环境智能体和奖励函数,让智能体自己在环境中摸爬滚打,从错误中不断学习进步,最终适应环境,完成任务。 我们每一个人又何尝不是一个智能体呢?跌倒三千次之后,发现了一个更好更强大的自己,凡是杀不死你的,都将使你更强大。

那个爱是一种高级的数学计算软件,广泛应用于科学、工程和技术领域。 他的使用范围包括数据分析、信号处理、机器学习控制、系统设计等诸多领域。那他具有丰富的库函数和工具箱,支持各种矩阵运算、统计分析、图像处理、数值优化等常见操作。 同时,他也可以与其他编程语言如戏加加、 python 等进行集成开发,应满足不同领域的需求。 除此之外, mate ipad 具有友好的界面和交互手环境,使得用户可以快速进行实验和数据可视化。其强大的绘图功能也使得数据的分析和呈现更加直观。在学术界和工业界中, mate 已经成为了重要 的工具之一。许多学校和公司都使用迈特爱进行教学和研究,而迈特爱的社区也非常活跃,提供了丰富的教程和资源,公用户参考。 总之,玛特爱是一个功能强大、易于学习和使用的数学计算软件,在科技领域中扮演着重要的角色。

大家好,欢迎来到我的迈特步课程,下面我们介绍不安装迈特步就能够使用迈特步的方法, 那他不可以算是一款非常大型的软件,为什么说他大呢?他占的硬盘空间会比较大, 我们来先来看一下我硬盘上安装的,那他不二零一八 b 他所占用的空间,我们在这里面点右键选择属性,然后我们就可以看到这个软件的占的空间是二十二个 g, 包含了六十八万多个文件,包含了五万多个文件夹,那么一个软件占用二十二个 gb 啊,这是不多见的,所以我们可以说这是一款大型的软件, 因此他占用硬盘空间很多,那么很多人就不愿意安装这款软件了,那如果不安装这款软件,我们又要使用,没成本,那怎么办呢?下面我告诉大家一个方法, 有些同学说你用别人的电脑不就得了,好,如果你有别人的电脑可用,那我们课就讲完了,谢谢大家 好,当然这是说笑了,不安装麦特本如何使用麦特本的方法是,如果你以前安装过,但是现在重装了系统, 但是安装的目录没有删除,那么恭喜大家,你可以直接使用白头偕老。使用的方法就是说, 比如我这个软件是按照地盘来开播,现在我重新装过系统,我把税盘都格式化, 那么这个软件不用安装人量可以直接使用,可以说买淘宝可以算是某种绿色软件了。 所以建议大家,如果你要安装迈特步啊,不要安装在税盘,尽量按照别的盘,那么以后只要重装系统,这款软件永久都可以使用了,那怎么使用呢?我们进入这个目录,打开啊,打开这个 b i n 这个文件夹,并 那么在这里面找到特步,你双击就可以运行了,或者说你喜欢以管理员身份运行,那么建议大家以管理员身份运行,或者说你点属性直接 在监控器里面设置与管理员身份运行,那么这样就啊就以管理员身份运行了,他就可以操作所有 的系统文件呢。好,那如果说你以前没有安装过麦克,现在我也不想装这个大型软件,但我要使偶尔使用一下,或者说即使你安装过,或者你现在电脑上也有,但是我用麦克跑程序可能又运行很长很长的时间, 我不想在自己电脑上跑程序,那怎么办呢?比如我现在有四百多个文件要处理他,我每个文件我都要用麦克去处理他,每个文件都要几分钟拿四百多文件就四百多个几分钟拿着很长很长时间,那我们可以, 嗯,可以说如果不想用自己电脑跑的话,那这就没有任何办法了,那我们教大家几个方法,第一个方法就是用他们的电脑,你可以用同学的,用机房的, 用网吧的啊,我们说了半天,你还是用别人的,那有什么意思呢?如果以上方案都行不通,怎么办呢?下面我们告诉大家方法。这个方法其实很简单,你只需要知道一个网站优优质点啊,点密就可以了, 注意这个不是 usc uz 点蜜,只要知道这个网站,我们就可以使用 vivo 了,而且不需要安装了。下面,好,我们打开这个网页,打开网这个网页, 那么如果你要使用网页,这个网页干什么?它里面可以让你免费使用啊,很多很多的软件,并且你不需要安装这个软件,这个原软件都安装在他们的超级电脑上安装,安装到云端上,当然你要使用 这个网站,你首先要注册,要注册好,我这里已经注册好了,下面我们直接点登录,点登录 好,我们已经登录进来了,那么在这个软,呃,在这个网页里面,在这个网页里面, 那他就进入了他的界面,他不啊,提供了很多软件给你使用,那么在这里我们可以看到有迈特步,还有一个是还有啊 pdf, 否则效果啊等等。这也告诉我们,如果你有要使用这些软件的情况下,你又不想安装,那你可以 啊,登录这个网站注册,然后用用户名进去,你就可以用使用了。好,下面我们来使用他的麦克风。怎么使用?我们始终要记住他的麦克风是安装在云端里面,相当安装在超级电脑上使用,是他的 服务器,是他来给你计算,我们只是在这边提交我们的命定,但是这个操作啊,整个就像在自己电脑上,而且你可以看到他装的是啊,二零幺五倍啊,是三十二位的,当然说我们一般自己装 张这个,我们现在是张啊,二零一八, b 是六十四位的。好,你可以看到打开这个网页,我们就会看到他已经打开了麦克风,对吧?比自己电脑上打开麦克快多了。好,现在接下来你的使用啊,就和自己电脑一样的,比如我们在这运行 a 加上 二加上三,敲回车啊,你看确实等于五,我们来看 clc 啊, cl e a r 好飞车。确实啊,车钥匙清掉了,清掉了,那这里操作和自己电脑上是一模一样的, 只是说你需要在这个网页下的界面处理就可以了。比如我们来新建一个脚本,那你会发现这里写脚本和自己一样的,我们可以把这个这个窗口拖出来,在这里,在这里编写自己的代码啊,在这代码,比如我这里写上啊 二,呃,加上六,加上七啊,加上七,那我们选定右键运行,你发现和自己电脑上的右键一样的,只需选择的部分是可以的。好,那我们再来测试一下,我敲两个百分号,接下来我们画一个啊正下含着的图形 啊, x 等于零到啊,派出一百啊,一百个点到,派啊,到二派,然后是 y, 等于上演 x, plt 开始外啊,我们发出正确安全的图形,我们按 ctrl 加灰车。好,你看这弹出了一个窗口,就是我们所要的这个,那么只要你注册了这个网站,你就可以使用他的软件啊,这个和自己的软件是一样的, 那我们就可以操作很多事情,我们只要把这代码复制粘贴过来就可以了,或者我们把代码传到这个网上去,然后打开就可以了。 你要注意他提供了一个 g 的空间给你使用,所以你的文件夹都放在这里,你可以新建一个文件,新建一个脚本,然后保存 啊,保存他就会提示你保存到哪里去,那么你点点保存就可以了啊,那么就保存好了啊,那么你看,我们在这里面就已经可以看到我们的文件了,可以看到我们文件,是吧? 好,这就是说。呃,我们所有的都和自己电脑上操作,当然也有稍微细微的区别,当然这个区别不大, 区别就是说我现在这个软件是在网页界面上,如果你是网页的快捷键呢?那么核对软件的快捷键呢?就有可能充电。 好,如果你使用完 mate, 你想不想使用的,那么你点这个关闭 mate 就可以了,退出就可以了,你也可以使用我们常见的 matele, 退出面点 exit 啊,退出一个。是啊, mate, 那么关掉一个是。 好,我们就回到了原始的这个界面。安宁,我们也可以使用佛斗笑普,我们来试一下啊。你看这里打开佛斗笑普比自己电脑上快多了,所以你唯一需要的就是你的网速,如果你的网速足够快,那么你的这个软件也 打开图个快,我们可以认为背后是一台超级电脑供我们使用。好,那我们在这里佛的效果也是可以使用的。嗯,可以,我们点开始使用先见, 那么和自己电脑上是一样的,默认的都可以使用。好,如果我们不使用了,我们点这个退出就可以退出这个软件,我们点这个退出就可以了,那么这就是说不使用,那他不我们 我们这个啊,不按照麦克使用麦克的软件啊,或者说我按照呢,但是我不想使用自己的,我们就可以使用云端上的软件。 好,这是云端上的一个网站,我相信以后这类网站会越来越多,提供的服务会越来越好。那如果 以后这个网站不,呃,没有了,我估计也会有其他的网站可用,所以大家只要啊网上是寻找类似的,这样如果国内没有,国外估计也会有。这我估计是以后的发展趋势。好,今天的课讲到这里,谢谢大家。

哈喽,小伙伴们大家好,之前我们讲了如何用 wifi 烂度,用代码以及蜂蜜箱的形式拧头取现,那么我们今天来讲一下如何拧合三维的曲面,我们来看这个代码已经写好了,首先呢我们生成一列项链,我们运行一下, ok, 先生成长度为四十的项链。 由于我们待会生成的是一个曲面而不是一条曲线,所以呢我们需要把这个 x 给网格化,也就是用 mastery 的这个命令。 由于外呢和 x 一样的,所以 x 的外值是这里是相等的,我们运行一下,然后内的值我这里是随机的函数,当然你可以还剩,其他的都可以,这里有挣钱余钱以及 log 对手函数, 这个比较复杂,我们首先运行一下它是关于 x 和 y 的个函数。然后上层之后呢,我们这里需要用 shape 的命令对这个生成后的胃以及原来的 xy 给他重新调整一下他的维度,调整到恩航离裂的这样的一个维度,以便用我们待会儿你和的时候使用。因为我们待会儿你和的话必须要改成单列的这样的一个形式,所以我们在这里进行一个举证为证的调整,用 we shape 这种命令。 好了,这里 x 一万一内页都调整成一千六百行和一列,然后我们把初始的图呢得先绘制一下。 好的,这就是出事的这样一个三维图。接下来我们分两种情况来进行曲面的礼盒。第一种情况是我们知道原来韩束类型只是我们的系数不知道,也就是我们知道它包括哪些韩束类型,比如说这么些余些倍数 之类的,但是我们不知道他前面的系数,这个系数六点七十五六,这种系数我们是不知道的,我们需要去 啊用拟合的方式来求解出这些关键的技术啊,这是第一种情况,我们看来如何编写程序,这里首先要定义函数的类型,用菲太夫这个命令,也就是把我们原来这个函数 给写下来,不过是一些系数的话,用 abcd 这样的字母去代替,我们把它给写下来,然后这个低喷子的话,相当于是一个音变量,用的是类关于 s 和外的函数,那么 sy 呢,就是自变量,用音低喷等词这个名称来连接起来, 然后 abcd 呢都是扣一分神次,也就是一个系数,我们这里给停一下来,这样的话系统就能知道你每个字母代表什么意思。 然后接下来用 face 这个命令带入我们原来的数据, s 一外一以及小硬的函数值内衣。最后 后是我们的寒暑类型,这里已经提前写好了,命名为 fp, 然后呢得到细除矩阵以及该模型表现好坏的这样的一个变量。 然后最后呢我们进行绘图,绘出原始图像以及我们礼盒后的这样一个曲面,我们把这一小节给运行一下, 这个图我们先放一边,我们先看这个计算的情况,这里我们可以看到 abcb 这个系数值呢是已经计算出来的,和我们原来函数其实都是一样的,都是在很好的对应起来, 然后这个是你和的表现,可以看到这个啊, m 四一基本上就是零的,然后二方也是一,当然是我们已经知道这函数的类型的情况下,我们只是去求数,这些系数模型的表现当然会很好看这个图 图形的话,这个蓝色点呢,是原来我们生成的这些项链在空间的这样一个绘图,然后这个曲面呢,是我们根据这些点用这个函数取拟和出来的一个效果,基本上是完全对应的。 这里我要提到有第二种情况,比如说我们想要人为的固定某些参数,不让系统去求解,这个系数什么意思呢?就是说比如说六这个位置,我们不让系统去求解,你就是把这个的这个位置给经营成一个问题参量, 然后把这个细数这一块地呢给去除,定义为一个问题参量。同样呢我们在 face 这一块把这个 problem 边量给增加进去, 我们先把它写好,然后预警一下,什么意思呢?就是在这一块地,我们可以人为的去放置我们 想要的数值,这里比如说是二,当然原来含数是六,我们不知道他这个是多少,需要去进行尝试调试一下,再运行一下, 可以看到这个表现,二方是零点八二,然后二面四,一是四点三,最后呢我们再进行调节这个参数,一块调节成十, 可以看到这个值是变小的,二方呢也是增加的这个性能是变好的,可以不断的进行尝试,比如说八, 然后这个值更小,然后二方更大,这个说明我们的地值呢是在二和十之间,在某一个位置,这里需要我们不断进行尝试,才能达到一个比较优化的程度。是否需要将 某些餐住视为问题餐量需要根据你的情况而定,有些时候你需要把你的某些系数让系统求解,某些系数是你自己去设定的。然后我们再来看第二种情况,就是我们对原来的 函数是完全不知道的,我们仅通过一种平滑礼盒的方式来把原来函数的这个曲面给礼盒出来。这里第一种方法我们用到的是一个局部加权回归,直接在这个费函数的末尾加上一个 loser 名称就可以了。那我们先来运行一下吧, 得到是这样的一个效果,我们看到大部分区域你和的效果是比较好的,某些区域没有你和到,比如说,比如说这一块和这一块固然是没有在我们知道原来函数类型的情况下去求解某些系数,这样的情况得到了某些效果好的,不过他有零点九六的二方以及 二点零的二 mse 还是比较好的。那我们这里呢,对这个局部加权回归做一个简单的绘图,加深大家的理解。局部加权回归是这样的,我们先来随便绘制一个曲面吧,这是随便绘制的一条曲线哈,比如说我们在某个位置,我们 即为 x 一,在这个位置的前面和后面分别截取一段长度,当然这个长度是很短的,我们这里为了延时效果,我们把它给放大一点,实际的时候肯定是非常短的一段长度。我们用某种家群回归的方法 算出 x 一前后这两段的数据,对他做一个线性回归,你和我们,比如说你和后的是这样一个效果,然后我们找出 x 一位置对应的这样的一个外置,这位置外置大概是在这个位置, 也就是外一,然后呢我们在途中就能找出很多的 x, 比如说 x 二对应的外二, x 三 对应的外三,最后呢我们把这个 x e, x r, x 三给连接起来,最终达到一条 比较礼盒的曲线,这就是这局部加权回归的一个思想,我们这里只做一个简单的介绍,有兴趣的可以去 网上做一个了解。除了局部加群回归,可以做取乐礼盒呢,我们还可以把这个 lowis 变成其他的变量,比如说是多项式礼盒,之前我们也讲过,因为这里是 x 和外两个变量,所以我们这里的参数名称是 polar 三四,我们分别讲一下这个什么意思,还有就是多元性性回归的意思,然后这个三和四分别指的是 x, 在 这个你和函数中,他最高四项是三次,四代表外,在你和时他最高项是四次。我们先运行一下吧,待会直接看的函数表达是,大家就有一个基本的了解,这个是我们用多元回归这种方法,你和数的效果,我们看一下函数类型,点一下来费此二,这里是多元回归他的函数表。 答是我们可以看到在这个地方 s 最高像是三次,然后在这个地方最高像是四次,这也就是这个函数的名字的意思。但是这里我们可以进行一个更改,比如说改成三五,然后再运行一下里面的每一项对应的系数值,下面都会有一个求解,之后呢,我们用 这个命令加上我们你和好的这个函数,就可以求解出在每一个点,每个 s 和外对应的点, 他的拧合出来的这个曲面上的值,用的时候要注意他的这个指数项呢,最高只能是五次和五次,也就是说不能超过这个数值。 在做曲面礼盒时,用多元回归以及局部加权回归这两种方式都是可以的,具体要看你的实际的数据分布来选择用哪一种来你和曲面。好了,今天是我讲的全部内容, 大概就是这两种常见的问题类型,一个是原知道原函数类型求解系数,另一个是完全不知道原函数对我们的曲面数据做一个平滑礼盒,进而进行新数据的预测,所以你们学会了吗?

大家好,欢迎收看技术人的工具箱第五期,这期主题是用马特代表来解决简单的数学问题。不知道大家有没有碰到过亲戚,小孩初高中要辅导数学作业 干,我数学是早就还给老师了,现在小孩作业还是有点难的,你要说不会吗?小屁孩看到心里肯定会讲,这个人比我还笨,哼哼,很丢面子。 这个时候就需要我们马特莱布大哥来纠缠了,我可以简单介绍一下马特莱布。马特莱布全称是 matrix neburatory 绝症实验室, 是这 master 公司推出的数学软件,主要的功能有数字计算,图形绘制,他有一套 的脚本与扩展的,像电路设计上用到的信号仿真和一些人工智能上的应用功能有很多, 我平时可能还是取些礼盒方面用的多一点,大多数时候是当一个方便的计算器的用好。我们实际看用玛莎的表来解一些简单的数学题, 我随便找了点题目,方程,方程组,导数和极限, 用玛特莱本来解,这种应该是杀鸡用的。第一题解一个一元二次方程, ok, 先先进脚本保存有一个未知数 single x, 从减符号变量 x, 然后表述一下方程式字, aqn 等于 x 方,加上四乘以 x 减去八九六等于零, 然后进行求解。 下面输出的答案,嗯, x 有两个解,一个解是负三十二,一个解是二十八, 这个应该是正确的解, ok, 我们看下一题解方程组,这方程 组是二元二次,他应该有两组九,看我看这怎么改。他有两个变量 xy 方程组, 三 x 方加上五 x 减去八 等于等于三十六,二 x 方减去三 x 减四,二等于等于三。 嗯,检查一下, 对,没错。 so, 求解 返回的结果是两个 x 的结和两个 y 的结,没有显示具体的值。嗯, 这里将求解的结果保存在一个变量里,然后分别输出 x 的解。 display, 我爱的解 运行,可是你可以看到具体的痣 一足解是 x 等于五, y 等于八。另外一组解是 x 等于六, y 等于四分之五十一。 我不确定这个答案对不对,其实可以写程序验证一下,没必要啊,我们先看下一题。求导数 函数, y 等于 x 方乘以口算 x 的导数为 okay, 未知数只有一个, x 是指变成 x 方乘以扩散 x, 然后球打第五, 运行下面输出的结果,二 x 乘以口,三 x 减去 x 方乘以三 x。 这道题答案是 a。 嗯,我看下一题。求极限,柿子里只有一个变两 n 新宝恩表述 n 次方跟可以表述 库存 n 分之一次方。 根号里面是一加三的 n 次方,加上五的 n 次方, 然后用 limit 求极限,第一个参数是试纸,第二个参数是极限边量,第三个是到达的值 community 护城, ok, 运行, 说出的结果是五。嗯, 按区域无线的时候,根号里面一盒三单次方可以忽略 用马自达。本来解决简单的数学题目还是相当方便的,但是它的功能不止这么一点, 这只能算是起个头。 ok, 这视频就到这里,谢谢您的收看,我们下次再见。