粉丝2393获赞8445

好,各位同学,我们今天来讲那个课本的可视化部分啊,可视化部分呢?嗯,因为很多都是概念什么之类的,我就尽量挑着挑着讲吧, 因为概念还是以要以那个教材的里面的为准啊。那么数据可说话呢?其实简单来讲啊,那就是利用图表来探索 分析数据的一种直观方法,就是你看到这个图像你就知道大概,哎,嗯,比如说折卸图,你就知道今年是增长了还是降低了, 或者是两个相比,看谁增长的快,就是他的那个这些的幅度啊,哪个快?这些就是说一眼看上去大家就知道了,基本上不需要那个去文字描述,达到那个以图说明的问题说明的效果。那么概念呢? 还是以教材的为准啊,因为教材考试什么的肯定是按教材的说法来定的,那么他,嗯,他以前是没有的,是互联网兴起之后才有的,他是用图表来对数据展示, 那么好,什么好处呢?就是一个是,其实最终就是刚才讲的,就是能一眼看见,就大家就知道你要想说什么, 所以他就是容易的确定的数据分类啊,确实数据啊,离群值啊,就是说有哪些值是超异常的, 那么流程呢?基本上大概是这么个流程啊,一个是确定主题,就是说你可是话,呃,这些数据拿到手,你想用表达一个什么主题,是想说这些数据是增长的还是 下降呢?还是什么呢?那么第二个是提列数据,因为数据肯定有很多嘛,然后你肯定是选跟你有关的,比如说一些指标啊,嗯,环比这,嗯,环比 之类的,那么嗯,还有一些就是说想跟你沟通,比如说你通过这个数据想表达 直接有什么关系,那么然后最后确定好,这你定的所有指标里面呢?你的用户啊,关注哪些重点指标,那么这些东西都定好了之后呢?那第三步就是确定图表,你是用要用折页图、柱状图、丙状图, 还是用什么雷达图啊,三圣图啊什么之类的?那最后才是展示,就是说 要突出哪个,所以要突出,嗯,数据是往上涨呢,还是突出突出数据之间的一个关系。 那剩下,嗯,还有个就是制作嘛,制作就是美光了,美光的话主要是体现在一个是颜色啊,背景色啊啊之类的。第二个呢就是,呃数据,比如说从零零零开始呢,还是从什么?还是要体现几大指,七号指之类的。 那么场景呢,主要用这些,一个是企业领域,就说通过来展示就是让企业的决策者啊,能够快速的决策到底是,嗯,简单点,比如说这个价格是要 往下升还是往下降,还是说要加大某一个产品的,就是那个,嗯销量 什么的。然后销售领域就是说用在电商比较多啊,就是看一下大家买的哪些东西比较多,哪些应该搞促销什么之类的。股票预测吗?股票预测呢,就是说可能判断一下哪些股票会涨,哪些股票会跌。 那么销量预测呢?一个就是企业销售人员都在用吗?就是说能预测着哪个产品的销量,嗯,后面会比较高,那么就可以多生产吧,或者说多搞一些促销活动, 但是这些都是需要对以前的数据做大量的分析,有数据越大越准,嗯,那么谈谈完这些呢,那肯定需要有一些工具,那课本上的 matalabe 这个这个工具呢 是拍摄的,一个是有,可是包拍摄有好多其他的包啊,包括 py chat 啊,什么之类的。那么曼特 pla 的 live 呢?这个是比较流行的一个包, 那他是通过一些那个数组啊,什么什么来进行绘制图像的,那他绘制图像可能都是一些什么柱状图,这么图下面会讲到,那么它里面主要用的一个 napple, napple 就是一种,嗯,一个软件包吧,里面也可以支持大批量的数据项链化的数据。 那么这个这个包呢是,嗯,二零零二年编写的,那么零三年发布了第一个版本,而且加入的开元组织,就说这个可以免费开元给大家使用。然后呢?嗯,他从三 就是二,一点四之后呢就不支持,呃,就是说不怎么支持拍成二啊,因为主要主流就拍成三嘛。 那这就是 mate plot lab 的一个图标啊,这个大家了解一下就好了,安装的话其实很简单,就 pip install manda prode lab, 那他就会来装了。那他图表呢?基本结构基本是这样的,就这块是 y 轴区,那么这一块是 x 轴区域,那么其实在需要的时候这里也可以的, y 二的区域会写在这里啊, 那么这个这一块蓝色框框框起来呢,叫 ixs, 就是绘图区,图表都显示在这里,那那么图列呢?一般是显示在这个位置, 那这就是图表吗?这个就是一个折卸图。 然后我们来看一下一个简单的例子啊,首先呢是导入相应的模块, 这个就是用 input 麦特拉把点,我们主要就用麦特拉把里面的这个模块叫 py pro, 那么因为这个很长嘛,你每次用太繁琐,所以我取了个别名叫 plat, 而且那个绘图呢,基本上要用 napro 这个来支撑,所以我也把它倒进来了。 那现在我们做一个简单例子呢,就是创建两个数据,然后用 naple nebuse, 要 space 呢,这个来生成一些数据,就范围是负三到三, 然后个数是五十个,那他其实来安排就是泄性,泄性的一个分布啊,就比较均匀,就什么叫比较均匀均匀分布呢?其实就是说两个数之间间隔是一样的, 那么总共要升成五十个数, x y 一呢表示取些一, x y 二呢表示取些二。 那我们看一下,就是能把生成这个就范围是负三到三,然后五十个, 然后 y 呢就是三正弦对 x 直行正弦数,然后 y 二呢对 x 的密的平方直行 正确横竖晒,然后这个就是我们取到的 x 的竖直是一个嗯,竖组, 那么我们通过这个来生成一个桌布,桌布呢,其实大家可以看到啊,差不差不多是呃,分辨率是五百七十六乘以二八八,就这么范围像素范围的大小。 然后呢我们绘制了 x 跟 y 一,那么默认呢就是折卸图,那 plot 就秀就显示这个图,那么基本上效果就是这个样子了。这个其实是很简单的, 这个相当于告诉系统我要生成多大一个,一个画布,然后我就画布,有了我就开始画了,画了之后呢,最后我会显示出来那类似于照相吗?嗯,这个底片的话,然后我就把它显示出来,需要,没有需要的话这个图是不会出现的。 然后呢,我还可以给这个标签呢,定一个名字, 然后定义他的颜色,标签的颜色,然后他的宽度,这些都可以来做的。 比如说这个我定的是叫三三的平方函数,然后颜色是绿色 g, 那我当然也可以改成红色啊,红色是二,嗯,蓝色是 b blue, 然后宽度就是这个线的看起来宽度, 然后我这里还可以定那个,嗯,我爱着的范围 fold 二,对吧? fold 二那个, 然后呢还可以定义 x 的范围,复制到四,复制到四, 然后我还是定好了之后呢,我又把它打显示出来了,然后这里呢?我是想,嗯,显示闪点图,那么教材里面这也是闪点吗?那么我取的是 y 是平方的这种胜正确函数, 然后颜色还是绿色,然后我这里是要把图列显示出来,你看图列显示人现在的平凡数,对吧?因为我在这里没有去说高速系统要把图列显示出来,所以这个这个纸并没有在这里显示,然后打印出来。 然后呢就是,嗯,有些时候那个大家可能看到这里会有些方框啊,什么之类的中文显示的问题,那还是跟之前讲的那个一样,就是把这一段 放进去,他就显示正常了。好了,那基本的介绍呢,就讲这里,嗯,这边讲的就是教材里的内容, 那么这块呢,大家反正知道就好了。然后咱问一下教材里面列的那几个,嗯, made pro love 的,那么函数啊, 比如说那个刚才提也提到了 pro 的绘制信形图把啊,绘制巨,嗯,柱状图,这个后面会讲啊,那么 bla 群呢?是水瓶柱状,水瓶柱状就是横过来那种啊, 然后是刚才呢,就是会闪点图,闪点图呢,就是我们看到的这个,然后抬抬头呢,就是设置标题图标。哦,我这里没有展示,大家可以自己试一下, 然后设定取置范围,刚才也弄了。嗯,也给大家看过效果了,就是这个, 然后设置 x y 轴的标签呢。啊,这个倒没有,大家可以自己试一下啊,这个就是展示的问题, 然后写字图链呢?这个这两个可以对比一下看,这个也是这样定的,但是没有写字图链,这个呢是写字图链了,所以这个就读,呃,这个就写字出来了。好吧,绣绣的话其实就是 这个嘛,就是把它展示出来。好,那,那这节课就在这里。好,谢谢大家。

学拍摄这么语言,你一定得重点学习潘大子这个库,我为什么这么说呢?今天这个视频重点给大家解释一下,其实潘大的这个库它本身为什么重要,是因为它是三个方向的一个非常基础必用的库, 判断的本身是一个数据处理分析的库,大家想一下,任何应用领域都是需要做数据处理分析的, 这三大领域分别是办公自动化,比如说你需要处理 excel, word、 pdf, 对数据的处理需要用到 pandas。 第二个很大一个方向,人工智能,尤其是基于学习库 santa land, 深度学习 tensor flow, 他们都是基于 pandas 本身处理好的数据来进行预估和预测的。最后一个量化投资领域,他用的 pandas 更多,但 他知道这个库是怎么来的吗?拍上的这个库本身就来自于金融领域的时间的总结,他的作者本来就是搞金融的, 总而言之,很多种领域都需要用于数据处理分析,潘纳斯是咱们基础必备的一个库,如果你学完了判断技术,这个库,你需要花很长很长时间,长时间的去学习他,掌握他。 而对于学习潘纳斯这本书是国人写的,我没想到这本书写的这么好,我自己非常的推荐这本书,我自己看了一遍,然后现在经常的翻看,里面真的是很多干货推荐给大家。

师妹说她写论文时没有用 spac 分析,直接说商品销售量和经济增长成显著正相关。我真的会晕死。无论是什么专业,通过 spac 分析来计算出相关性是非常有必要的,通过统计学来得出的相关性才具有说服力。 今天我分享给大家一个非常简单的基础相关性分析,在文实 box note x 二上面做笔记,就好像在纸上书写,手感很好。偏相关分析是一种排除其他变量影响的分析, 比如天气变冷了,影响了我们的穿衣健数和外出活动次数。但当控制了天气变冷这个变量,那剩下的两个变量之间是不是就不存在相关性了呢? 我们再用 spac 举个例子。首先我们有三组数据,饭量、体重指数、健康指数。我们点击分析中的相关,点击偏相关,将饭量导入控制,将两种指数导入变量,选中双尾和勾选显著性, 再点击选项勾选两个统计,点击继续后就可以分析了。我们看到结果,样本数都是二十六,说明没有数据被剔除,显示了平均值和标准偏差。下表中显示,在不控制饭量的时候,体重指数和健康指数呈负相关,但批值大于零点零五,不具有显著性,但体重指数和饭量呈显著正相关, 一直小于零点零零一。但在控制了饭量这个变量后,体重指数和健康指数的负相关值变成了负零点一二一,说明饭量在一定程度上影响了两者的相关性。快去试试吧!这里是正在读博的大雨,学长,关注我,带你轻松写论文!

大家好,从这个开始呢,我们讲解 pandas, pandas 呢,它是最重的一个数据分析库,它能够极大的减化我们的数据分析工作。我们在实际的数据分析的过程中,应用的最多的就是 pandas, 当然了, pandas 它的基础是囊排, 他是为了解决这种数据分析任务而创建的。喷得似的纳入了大量的库,包括囊排,包括我们前面讲过的 madameper 内部,以及一些标准的数据模型。它提供了高效的操作大型数据自己所需要的工具。 潘特斯呢,提供了大量能够使我们快速便捷的处理数据的函数和方法。很快我们会发现啊,他是使拍损成为强大而高效的数据分析环境的重要因素之一。那么潘特斯呢,他有 一个非常高的目标,他希望能够成为在各个语言里面在数据处理方面的首选,这就是他一个非常宏大的目标,事实上,他正在做到这一点。喷的词呢,在处理数据的时候非常非常的方便, 那么它可以使这种数据分析工作更快更简单,它具有如下的几点,第一呢,它是数学运算,按轴对起,有时候喷的时呢,他会自当我们处理大型数据的时候,他会自动的按轴对起。 另外呢,它继承了数据这种时间序列的功能,他还可以非常灵活的处理缺失数据,这一点非常重要。当有缺失数据的时候呢,喷子子能够非常灵活的来处理他,他还可以啊,非常简单的来 合并厂家的数据库,比如说你可以汇总啊,你的下面几个分公司的数据,使用喷的词呢,我们可以非常简洁的把他们合并在一起。 pandas 的安装呢,我们不需要来考虑,因为在我们安装安能康达的时候呢,他会一并帮我们安装好 pendas, 以及其对应的依赖的这些库囊 paid 啊,买的 polite 吧等等。所以我们不需要,我们只要安装好了安能康的 pandas 呢,我们直接引入就可以,一般的引入方式就是引入 inpot pandasspd, 那么这就是他一个灌肠的引入方式,当我们以后看到 pd 的时候就应该想到这就是 pandas。 好的,我们喷的时候呢,他有两种数据结构啊,我们一会用栗子来演示,我们来看一下 他的两种数学机构,分别呢是 ciris 和 data freesiris 呢,他就像一个数组一样,一为的数组,我们说他就是相当于一一个很长的一为数组, 但是呢,他和一维数组还不同,他伴有一个 index 啊,他伴有一个这种的叫做缩影这么一个东西, 这一点他是与囊排不同的。 data free 呢,他相当于我们日常生活中所应用的这些表格啊,这就是表格,他呢,这种表格有很多行,有很多列,那么每一行就相当于一个观测,每一列呢,相当于一个特征。 对待 frame 呢,他有行所引,也有列所引啊,他在外面增加了这种行的,所以 还有列的缩影。那么这个 crays 呢,就是他有了这种一个缩影啊,他有缩影 index。 好的,对于这两种数学结构啊,以及他们的这种方法函数,我们会用例子在 appaces 中为大家做演示。 首先让我们来看一下 siris, 我们在 ipadsplute 中为大家做演示。好的,在这里呢,我首先进入这个,嗯, ipadsplutbook, 我们来看一次,直接进入一下啊。好的,然后呢,我们在这个文件夹下面新建一个派特三, 我们引入囊,我给你们引入这个 pandas 啊,我们引入 pandas 引入方式就是刚才们说的 input pandas spd, 这就是引入囊盘的灌肠的方 方式。以后你看到霹雳,你首先应该想到的他就是 panders, 那么我们来新建一个 sirissiris, 他就是一个一维的数组,一维的序列,但是呢他有他有缩影, 所以我们来建一个这种的 siris。 我们假如说叫 s 吧,怎么来建立呢?就是用 pd 点 ciris 这个方法,注意这个 ciris, 这个 s 是要大写的,那我们我们说了 ciris 是一个一位的数字,所以我们在这里面可以添加你的数字 啊,比如说这样的话,就是我们的数字,我们的内容就使用一个啊这种的因利斯特来新建这么个 s。 好的,我们来看一下这个 s, 大家发现这个 s 它自动的为我们添加了从零开始的这种 用 index, 这就是它的一个特点。这种 siris 它是有 index, 它是有缩影的,那它的值是一三六二,所以我们看到是一三六二对应的,它给我们添加了从零开始的这些缩影,这就叫 index, 我们可以看到他的一个低态度,默认的是根据你的数据来推算出的 index 是 inter 六十四,其实呢这个跟囊排是一样的, 那么我们也可以把它的 index 取出来,它的 index 取出来怎么取呢? sd index, 使用 index 这个属性了,就能够看到它的 index, 我们看到它的 index 是一个 range index, 很容易理解,就是一个啊,润指序列的 index, 从零开始到四结束, staple 为一啊,这就是一个 index, 那么它的值呢?它对应的 这种值是什么?是一三六二,所以我们看一下它的值,使用 sd values, 这的话,我们可以看到他的值呢是一三六二。怎么取出他的值?他的值是什么?是一个 are, 所以我们说 pandas, 它是一个,它的内核是囊派,它在囊派的基础上添加了很多函数方法,以及这套 index 和 columns 系统,又说这套缩影的系统,这它本质它的 values 就是一个 arry。 那么我们这刚才在建立这个 siris 的时候啊,没有人为的去添加他的口音 dex, 然后呢他为我们添加了这种润之音 dex, 从零开始的这种数字,其实我们可以人为的去指定他的 他的这种啊 index, 我们指定一下,比如说我们 s 呢,等于 pd 的 crs, 然后它的值是一三六二,然后我们可以使用 index 这个参数指定它的一个啊,它的一个 index, 比如说我们使用 abcd 啊,你可以直接写类似的 apc 点,我们在这里为大家为大家看清楚,我这样单独写开。 好的,我们这样的话就指定他的 index 为 abcd, 那我们来看一下。 好的,我们这样的话得到我们的 s, 大家看到现在它的 index 是 abcd, 它的值呢就是一三二六了,我们看一下它的 index, s index 啊, sd index 啊,它的 index 就是 index, 我们看到这个 index 呢,在他 他是一个专门的类型 abcd, 好的,这就是我们所说的啊 index, 对于 ceos, 我们可以很方便的使用这种不玩去职,很方便使用,不玩去职,就是我们前面囊牌的那些技术知识,什么意思呢?现在 s 长这样,假如说我们说 s 打于三, 那么 s 大于三记这么一个运算啊,我们用这种啊, s 大于三,他会直接返回这么个步而值。你比如说这里呢, a 是 fossb 是 foss, c 是大于三呢?他返回了处,如说没有把这个值取出来怎么办? 就把这个 s 大于三这个布尔痣作为缩影,所以我们取 s 大于三的痣,所以呢,我们就这样来取,使用它作为缩影,这样的话,我们就直接把 大于三的这个 siris 那部分纸给取出来了,那么小于三,很显然我们又能够直接取出这些小于三的纸 啊,这里面有一个等于三啊,所以他这里小于三的,这是两个啊。这里,那我们再来复习一下广播的功能,那么在安排中,他有广播的功能,那么 s 这个 ceos, 他也有这种广播的功能,他继承了这种广播功能, s 乘以四, 他这里面所有的这种这种外流的值呢,都会乘以四。另外呢,我们可以在这种 crass 上,或者说后面我们讲的对的夫人们上直接使用安排的函数, 我们来一次演示一下,比如说我们演奏安排还是 snp 啊,那么我们知道安排的方法,比如说安排的命啊,安排的命 求君子,所以呢,比如说把 s 放进去这段话,就能够直接取出他的一个君子,其实呢, siris 他是有这种方法的,他的对象方法就是 s 点蜜,我们来看一下 s 点蜜也是三,这个求君子,那他还可以 啊,进行这些其他的预算,比如说 s 点 max 啊,这些最大只, mini 啊,最小只等等都是可以的,包括男 p 点 max, 男 p 点 max 啊,男拍点 max, 男拍点 mix, 都是可以的。另外呢,我们还可以使用硬方法来判断某一个, 某一个纸是否在他的 index 里面,或者说啊,这一点是否在他的 index 里面,你比如说他的 index 是什么?是这样子的,那我们想 想知道 b 是否在他的 index 中,怎么来判断?我们就用这个 in 方法啊, e 方法来判断 b in 这个 s 点 index, 那这样的话返回是处,那如果是 e 呢? 返回 boss, 比如说我们可以用印来判断啊,某一个纸是否在他的阴袋当中啊,这就是他的一个特点。 刚才我们介绍的这种构造 pds siris, 这种方法是直接把一个历史的填进去,然后呢对应的填他的音,指定他的 index, 其实我们还可以用另外一种方法来构造一个这样的,呃, ciris, 就是这种直接输入一个字典是什么意思呢?我们用这样来例子来看一下,就是 pd 点 c serious serious, 然后我们可以写一个字典,这样的话字典的 k 就是对应的 index, 字典的 y 六就是对应他的纸,你比如说 a, 他的猫,好啊一,然后呢我们去指定 b 他的冒号,比如说九,然后我们再指定一个 c 冒号啊四,这样的话就是一个 dict 在里面,我们使用 dict 来构造 siris, 这个时候呢,他的 k 会被设置为, 嗯,这种的叫做啊 index, 然后它的值会是这个五百六,我们来看一下现在的 s 就变成了 abc 对应的 index, 然后呢它对应的值一九四,这就是我们介绍的构造这种 ciris 的方法。 好的,这节课呢,我们先讲到这里。这节课呢,我们只是先简单的介绍一下 pandas, 然后呢我们也介绍一下如何去构造 这个潘则斯的 ceos 这种数据结构。我们下一节课再继续讲 ceos 他的一些方法。好的,我们这节课先讲到这里,谢谢大家,再见。

拍森配合潘纳斯数据分析练习一百例。第一集本次题目对于这样的一个拍森类似的,咱们使用潘纳斯把这个数据类似的变成潘纳斯的 siris 对象,然后输出到命令行,首先引入潘纳斯这个包, 然后处置化这个对象。地摊等于 pd 点 siris, siris 本身有个参数,低头等于 cos, 直接可以穿一个列表。另外因为咱们的低头,我点进去他是第一个参数, 所以一般情况下地摊可以不写。这里我就写上更加明确一点,要输出的话, plus 地摊 写完了运行,我们看到他输出了一个潘达斯的 siris, 默认情况下他是数字缩音。下次见。拜拜。


parts 配合潘大师进行数据分析编程练习一百例第十二集本次题目对于某个年份,比如说二零二一年,咱们怎么得到这个年里面所有周一的日期列表, 下方是一个结构的展示,他是一个呆呆探明大,从二零二零年的一月四号到最后一天十二月二十七号, 这里面的日期全是一年中的周一,咱们看到他 dtf 是 dtm 六十四。另外有一点 flank c 就是这个数据的频率,他是 word, 意思是说按周的频率,但是去周的第一天, 这个数据该怎么生成呢? airpout plus pd, 本次应该有两种参数的方法, 对头软几,第一种等于 pd 点对头软几撒子等于二零二零年的第一天,第一杠第一,然后摁的咱们写一个最后一天。 十二月三十一号, 咱们需要指定的是 flank c 等于 w 是 v 格, iman 就是周一第一天。 polantdatprange, 咱们来看一下挖这个参数,回一下,行 右键 rao, 咱们看到他生成了一个对,他名代 x。 二零二一年的一月四号开始,到最后的十二月二十 七号,这些日期都是周一,因为咱们的福人馈赛是未可盲对。当然这个福人馈赛呢,大家可以参照官方文档,他有很多种取法答案,能想到的是有周一,那肯定周二到周日, 并且他还有月份的频率等等,这是第一种参数,咱们可以改一个参数,把这个注释掉。 一个年中,他的周数是确定的,就是五十二个周,所以说摁的可以不写,写成配瑞字等于五十二,他效果是一样的,从一月一号开始循环五十二个周, 频率依然是未可盲袋去周一右键运行,咱们看到他是冷烟的效果,一月四号开始到最后的十二月二十七号他也是按周的,咱们下次见,拜拜。

潘的伞是做数据分析最常用的窟窿,需要派化安装,使用 an, excel 三个作用是类似的,通常可以用来准备数据。它的数据节挂通常是有两种, davri 和 sarace。 david frame 呢,是以表格的形式存放二位数据,类似于表,有行和力。而 siris 可以认为是 dave frame 的一列数据。我们在使用的时候啊,通常呃是 input, pandaspd 导入, passport 导入以后,里面啊就有很多的方法可以共同使用了。 当使用 pandas 读取数据后啊,我们就可以使用 info 查看一些数据的基本信息。当然,如果你想对行列进行切片或者过滤操作呢,也可以使用 loc 和 ilc, 也是非常方便的。

哈喽,大家好,我们进入拍森使用潘纳斯进行数据分析系列课的第三节,潘纳斯的数据结构,也就是 dit frim 和 siris。 在上一节,我们学习了怎样把纯文明文件 excel 和 max 的数据表加载到一个判断词对象,而那个对象其实就是判断词的数据结构对他 fmim。 如果我们开始使用判断词,那么几乎都是跟这个对象在打交道,因此在后面的实战之前,我们有必要了解一下他的数据结构,就是对 tafrim 以及 siris。 我简单的通过一个图示来说明一下这个数据结构。第三,弗里姆,他就是代表整个表格对象,他是一个二维的数据,有多行和多列。 上一节我们也看到这个数据表格呢,有很多列,也就是 df 点 coloms, 他也有很多行,而这些行呢,都有一个锁引列,叫 df 点 inx。 我们如果要对判断词进行 数据的查询的话,其实就是对克拉姆斯查询列,对 endx 查询行,这是第一个数据结构 ddfrim, 而第二个数据结构 siri 是什么意思呢?我们看一下。在这个 ddform 中,他有很多列,每一列都是一个 siris 对象, 每一行也是一个 sirice 对象。而 sirise 的含义也是一样的,就是他是一个一维数据,代表一行或者一列,这两个 对象怎么搭配使用呢?如果我们从对象复印中查询出了一个区块,这个区块仍然是一个二维表格的话,那么查询出来的仍然是个对象复印。但是如果我们查询的结果是一列或者一行的话,他的结构对象变成了一个 siris。 为什么要这样做呢?是因为对于一维数据,他非常类似于拍摄的字典,我们对这个一维的字典数据处理起来要比二维的 d fm 会更加的快速和便捷。因此判断 整体就两个结构,这个菲姆是二维的或者多维的,而 siri 死就是一维的数据。打开交叉,我们来进行实力的演示。本 本次的演示呢,我演示三个部分,第一个是 siris, 第二个是 d fm。 第三步我演示从第二 fm 中怎么查出 siris。 首先引入我们的两个包拍那次蓝牌,我们进入 siris, 这里 解释一下 siris, 他是一种类似一位数字的对象,他一组数据,这个数据呢,他可以包含不同的数据类型,以及 及一组与之相关的数据标签,也就是缩影组成。大家注意,和定点弗里米一样, siris 也有缩影,而这个缩影其实跟定点 fmim 的缩影是一样的。接下来我介绍三种可以创建 siris 的方法, 熟悉一下这个结构。第一种我可以使用个类似的,也就是数据列表,可以产生一个简单的思维思,如果我们打印这个思维思的话,会发现他是两个, 左侧是数字缩影,这个跟 fmime 是一样的,而右侧就是我们的数据。然后我们可以使用点击代词来获取这个 siris 的缩影,可以看到这里是一个软底数字序列的缩影,我们也可以得到这个 siris 的直序列,通过他的 ys 属性来获取, 他就打印了我们的元素值得列表,这是第一种方法。第二种方法,我们创建一个 cviss 的时候,可以指定他的 exx, 也就是说我们不使用默认的数字序列作为缩影,我 我们点运行再次查看。第一列就是我们指定的值的缩影,而不是数字缩影。这个时候我们访问 s 二点一代词的话,返回的也是我们指定的一代词。 而第三种,其实刚才我提到 siris, 他的表现跟拍摄的字典是非常相像的,我们可以使用拍摄的字典来创建个 siris, 对于这个字典来说,把这个字典传给 siri 的方法就创建了个 sirise, 我们点 圆形,大家看到字典的 k 的序列呢,变成了这个 siri 的缩影,字典的 y 的序列变成了这个 siris 的 w, 这是一种比较直观创建 siris 的方法。而当我们创建了 siris 了以后,我们怎么查询 siris 的数据呢?使用的方法跟拍摄的字典真的是很类似, 我们首先看一下这个思维思,然后我们可以使用这个的方式来访问 aj 行的数据,典型他是一个数字,五点二,他就是一个拍摄的弗洛特类型,也就是说我们取到了这个值, 然后如果我们想获取多值的话,使用这样的语法,一个中框号里面还是一个中框号,传入了一个英代词的列表, 大家注意这个语法跟第三分音的语法是一样的,在思瑞思中,我们可以传入多个标签来获取他的值。在第三分音语中,这样的语法会返回多列的数据。这里我们看一下思瑞思的返回,他就返回了两个 所应的数据,而这个时候他的态补是什么呢?我们看一下,这说明如果我们查清两个值的话,他返回的还是个 siris, 而我们查清一个值的话,他就得到了拍摄原声的变量的值。这是第一部分 siris 的介绍,我们进入第二部分。第三 解释一下第二分母,他是一个表格性的数据结构,他的每一列可以是不同的值的类型,比如说竖直字母串或者波尔直。和 siris 不同,他不只有行索引擎带克斯,这里的含索引带克斯和 siris 是对应的,他也有列索引 colomes, 也就是说把一维变成了二维,方法就是加了一个克拉姆斯的,所以而他可以被看作是 siri 组织的字典,字典的 k 就是每一列字典的 yl, 就是每个 siris。 其实创建个地摊肥姆最长的方法是我们上年介绍的读取成本文件,以赛尔和百思路数据库直接从数据源得到了一个地摊肥姆。 而在这里我介绍一种可以给你多个字典序列来创建得人 fame。 比如说这里有准备了一个字典,他有三个 k, 每个 y 六呢,都是一个数据的列表,将他传给的第二位的对象,我们来看一下,就得到了一个二维的的, 而字典的 k 呢,就是每个列,每个 y 六对应的直系列就是这一列的直,而每个列表他的下标呢,就变成了每一行,所以这是这种方法来创建一个 d 字飞。我们 看一下对于这个列的字母,他的类型是什么呢?他就会列出每一列他的类型三个列,分别是奥布加吉他印特弗洛塔类型。然后我们就可以看一下他的列索印和行索印克拉姆斯 ex, 这里因为没有指定行当 ex, 所以说他是一个数字学历的缩影。这是第二个滴答弗雷姆对象的介绍,当然在后期的课程我们都是围绕滴答弗莱姆来进行展开的。第三步我们来看一下从滴答 freme 中怎么查询。初次 通过这种方法给大家仔细的了解一下这两个数据结构是怎么进行交互的。这里我写一下说明,如果只查询出了一行或者说一列的话,他反馈的是个 siri 对象,方便我们进行意味的数据的快速操作。如果查询的是多行或者多列的话,他反馈的依然是个地点反应。 首先我们看一下这个 dnform 他里面的数据,然后三点一,我们使用中科二的方法传入一个字符串,可以查询出 dnform 的一列。我们来看一下这就是我们一二这一列。然后我们看一下他的泰普呢,他就是个 siri, 但是如果我们查询多列的话,他的结果呢?是个 dnform。 我们来看一下这里的语法跟 siris 是类似的,外面一个中国号里面传入一个类似,他对于 siris 可以选出多个直,而对于 dtfrim 可以选出多个列。我们点运行,他返回了两列的一个 dnform, 我们看一下 to 运行, 这里就说明这是一个 dnform 的对象。然后刚才我们是查询列,我们怎么查询行呢?首先我们看一下怎么查询一行,他使用的方法跟查询列是不一样的,我们需要使用 dform 的一个 logo 这么一个方法,比如说 df 点 log 一,也就是筛选出了一个 x 等于一,这一行 我们点运行,这个时候他的 ninex 是我们的列名,而他的泰普我们看一下依然是个 siris。 到这里大家可以进行一个简单总结,就是说如果查询是一列的话,他返回是一个 siri。 四,他的英 x 是我们的行所引, 如果查询一行的话,他返回也是个 siris, 但他的 ex 变成我们的列名。最后如果我们查询多行的话,怎么做呢?就是点 logo, 我们可以使用列表这种切片的操作来返回多行。我们来看一下,就把一二三这三行所用的数 数据给返回了。大家注意一点,在拍摄中一百的切片是不包含墨鱼元素的,但是这里的 logo 返回的时候把墨鱼元素也给包含了,这是 dj 的肥母跟拍摄语法的一个区别。然后我们看一下这个太部,也就是多行数据的太部,他也是个 dj 肥母。 以上就是本节内容演示,我们说明并演示了 siris 这个数据结构,然后解释并说明了 ddform 这个数据结构,这两个就是潘纳斯的两大数据对象。第三个,我们从 ddform 中查询出了 siris, 演示了这两个数据结构之间的关系。 ok, 本集的内容到此结束。

这一节我们讲一下数据分析里面的三剑客,就是我们的 nampy, pandas 以及 matter pro 这三个包,这三个包可以用来做数据分析,数据可视化。这一节我们先介绍一下这三个包的安装, 首先我们安装一下 numpy 这个包,我们首先需要用 windows 加 r 组合键调出我们的 windows 面内行。 然后这里因为我这里我是装了双版本的 passion, 就进入了 ps 二的环境,如果输入 ps 三就进入了 ps 三的环境,所以 我这边我每次执行的时候,我都需要指定指定 pass 的版本,如果同学们只安装了一个版本的 pass 的话,可以直接输入 pass 就行了, 这个没什么关系,我这里先用用 pip 命令来安装这个 ice 的那样皮包。 这里因为因为拍摄他的很多第三包网站都是在国外的,所以我们这里需要用一些国内的加速的一些 cban, 比如说可以用什么清华的源,中国科学技术大学的源,我这里用的是阿里云的源,用国力的源的话,他会下载,下载速度会快一些, 这个速度是很快的,如果你不加这个障碍参数指定国内的圆的话,他就会下载的很慢, 这个速度还是很快的,十三到几秒钟就下完了。然后我们怎么证明这个包已经下载成功了呢? 我们还是在还是在命令行输入我们的导入这个高的命令。 首先这里是需要进入派送环境的,有 pot n, u, m, p y 可以看到已经导入成功,表明我们这个拉皮包确实安装成功了。 接下来我们安装这个 pandas 吧,这个大熊猫包还是用于刚才类似的命令,我这是一个 cmd, 我是一个马克档的一个编辑器哈,这个是拍叉母自带的,左边可以编写,右边可以预览, 还是用类似于刚才的命令执行回车都可以。按理这个云这个下载速度还是很快的。 正在安装 style, 这个包的下载他要慢一些。 安装完成了,然后我们还是要验证一下,我再开个窗口,不然的话老是切来切去的,感觉还是有点麻烦。 导入成功啊,表面这个潘达斯把我们已安装成功了,然后接下来我们再安装这个第三个包,就是这个可视化的一个包, mac pro 的这个包来安装, 我这里先把这三个包安装好,后面再详细的去讲解每个包的具体用法。当然如果后面因为这个课程,我是会不断的更新的, 后面如果我要再安装,再讲解其他的包的话,这个包的安装我也会在这个页面去更 新的。同时这个文件,这个文档我也会同步到网上的,就是这个文档都是免费的,免费放开的,但是这个视频呢, 是不公开的,是这样的,比如说后面可能我想啊拓展一下知识,呃,给大家讲解一下另外的数据分析包的话,我可以在后面继续去编写,比如说第四个包,什么什么包, 这个大家不用担心,这里我们再继续安装最后一个包,银行清理一下, 还是用类似的命令回车, 这个下载还是很快的, 安装完成了,我们还是来验证一下。 进入拍摄的面临床 啊,这样的话就导入成功了啊。到这里为止,这三个最基本的 ps 数据分析三剑客这三个包已经安装完成了啊,接下来的章节里面我会详细的介绍每个包的使用方法, 然后各后面这个课程也会不断的更新,也会去讲解一些其他的牌子数据分析的包和用法。

拍摄,使用拍打词进行数据分析编程,练习一百例本视频。对于一个股票数据,咱们怎么筛选出其中的部分数据列?右方是一个股票数据 csv 文件的截图, 它里面包含多列代特日期、 oppo i love、 clos worm 等几列。 如果咱们想筛选出只关心的其中几列,比如说对称 oppo x vlogm, 不需要其中的嗨和漏两列。该怎么做呢?打开排查母,上方是引入了潘纳斯以及读取了股票数据。咱们先来打印一下, 右键并行,咱们看到他返回了总共有六列的数据。如果咱们想筛选其中的几 列,可以这样进行,第 f 中国号,再写一个中国号,然后传一个列表,这个列表就是咱们需要的列的名字对称,然后第二个 oppo, 咱们不需要嗨和 low, 就不写他,然后克罗斯, 这就是剩下列的一种方法,咱们可以给一个新的变量, d f 六等于,然后咱们 perng d f 六,每个都改成打印前三行, ok, 右键运行。咱们看一下,这是原始的数据,包含六列, 而新的 df 只包含了其中的四列,咱们就完成了数据列的筛选,下次见,拜拜!