粉丝734获赞5719

由于 pandas 是在 nampai 基础上开发的程序库,因此在安装 pandas 之前, 要确保我们的操作系统中要有 number。 如果读者是按照我们前面建议的安装的 anaconda, 那么 pandas 就已经安装好了。我们可以使用编一中的代码尝试导入并查看 pandas 版本号来确认 pandas 是否安装好。 根据奥特一的输出结果,我们可以判断演示代码环境中 pandas 的版本号是一点二点四。 和之前导入 number pi 并使用别名 m p 一样,我们通常习惯将导入的 pandas 包使用别名 p d。 并且通常情况下,我们会把 numpy 和 pandas 两个包一起导入 如音二中的代码所示。如果我们想要离线查看 pandas 的内置文档,可以使用前面我们介绍的方法进行查看如音三所示。 如果联网,可以访问官网查看详细的文档,里面除了有基础教程,还有许多有用的资源。

哈喽,大家好,今天将带大家一起学习如何零基础入门 python 数据分析课程开始,我先解释四个问题。首先,第一个问题, 这个课程适用于谁呢?一、你需要做数据分析。二、你需要掌握一门特别强大的数据分析工具。三、你想要提升自己的 pandas 水平, 如果你满足上述任何一点,都可以学习。第二个问题,什么是潘达斯?潘达斯他是一个开源的拍成内裤就是别人提前写好的工具包,用于数据分析、数据处理和数据可视化。 它有几个特点,第一个是高性能,它比你自己写货循环便利,数据要快非常多。第二个, pandas 提供了容易使用的数据结构和强大的数据分析工具,而且它很方便的能够跟其他 他内裤一起使用,比如 number。 第三个问题,如何下载安装 pods? 我推荐直接安装 podconder, 因为他已经安装了数据分析需要的几乎所有的内裤,直接解决了你的环境问题。 关于如何安装的 com 我将单独开视频讲解。最后一个问题,本课程的演示方式 使用丘比特 notebook 来进行演示,因为丘比特是一个交互性、探索性的开发神器,使用这类迭代式的开发方法非常适合学习语法和数据分析。 另一个非常强大的拍层开发工具叫拍唱,他是大而全的集成开发环境,他非常适合复杂的项目开发。如果我们是自己学习或者说是做一些数据分析探索型 的工作的话,非常推荐使用值比他到的 book。 另外,本课程的代码以及数据集在 d table 仓库提供大家进行下载。以上就是今天的课程内容了,如果您还有什么问题,欢迎评论区留言。

学拍摄这么语言,你一定得重点学习潘大子这个库,我为什么这么说呢?今天这个视频重点给大家解释一下,其实潘大的这个库它本身为什么重要,是因为它是三个方向的一个非常基础必用的库, 判断的本身是一个数据处理分析的库,大家想一下,任何应用领域都是需要做数据处理分析的, 这三大领域分别是办公自动化,比如说你需要处理 excel, word、 pdf, 对数据的处理需要用到 pandas。 第二个很大一个方向,人工智能,尤其是基于学习库 santa land, 深度学习 tensor flow, 他们都是基于 pandas 本身处理好的数据来进行预估和预测的。最后一个量化投资领域,他用的 pandas 更多,但 他知道这个库是怎么来的吗?拍上的这个库本身就来自于金融领域的时间的总结,他的作者本来就是搞金融的, 总而言之,很多种领域都需要用于数据处理分析,潘纳斯是咱们基础必备的一个库,如果你学完了判断技术,这个库,你需要花很长很长时间,长时间的去学习他,掌握他。 而对于学习潘纳斯这本书是国人写的,我没想到这本书写的这么好,我自己非常的推荐这本书,我自己看了一遍,然后现在经常的翻看,里面真的是很多干货推荐给大家。

搞不定 pandas 拍上学费哦!这个结合 chat gpt 的可对话 pandas ai 工具,可以把 pandas 转换成一个极其容易上手的绘画工具,只要你问他和数据相关的问题,他就会自动以 panda state friend 的形式进行回答。 需要这个工具的小伙伴在评论区自取即可。有数据分析经验的小伙伴应该都知道, pandas 是使用拍摄的分析数据,是一款非常强大的数据分析库。 然而, pandas 的使用有一定的门槛,对于没有代码基础的小伙伴来说不太友好。而这款将 pandas 和 ai 结合,让叉 gbt 帮你使用 pandas 分析数据的工具。 pandas ai 能够极大地帮助你提升分析数据的效率,降低数据分析的门槛。比如,你可以要求 pandas ai 返回一个 data frame 中列值大于五的所有行,他将会直接返回一个只包含这些行的 data frame。 你也可以向他提问一些更复杂的问题, 比如世界上幸福指数最低的两个国家的 gdp 总和是多少。甚至可以让他帮你调用 pants 画图,生成图表。基本上百分之九十的数据分析问题,这个工具都可以帮你解决了。工具我已经整理好了,需要的小伙伴在评论区自取即可。记得一键三连加关注,我们下期见,拜拜!

用 python 提升你的能力进阶片一点四,使用 pandas 模块操作 excel 工作部 在前面的课程中,我们学习的是用 open p y x l 模块操作 excel 工作部的方法。 我们也学习了使用 x l wings 模块操作 excel 工作部的方法。这节课我们学习一下使用 pandas 模块操作 excel 工作部的方法。 由于 pandas 这个模块儿是第三方模块儿,所以我们要安装 pandas 模块儿。安装这个模块儿的方法是,在 windows 的命令行窗口中输入 pipe install pandas, 然后按 inter 键就可以进行安装。如果安装的 速度比较慢,则可以在这段语句后面加上国内的软件镜像地址,然后再按 inter 键,这样安装的速度就比较快。我们可以使用 panda 模块创建 series 对象,用来表示依维数据。 它的语法格式如下,首先呢,我们要引入 pandas 模块,并将它重命名为 p d。 然后我们使用该模块下的 series 这个函数呢,创建 series 对象,并复制给变量 series 一, 其中参数 data 呃,用于输入的数据可以是各种类型的数据。 index, 这是一个可选参数,表示 数据的所引值。 detype, 这也是一个可选参数,表示数据类型。参数 copy, 这也是一个可选参数,表示是否复制数据默认值为 force。 下面我们做一个例题演示实践一下。使用 pandas 模块创建一个包含五个元素 series 对象,一个包含一个元素的 series 对象。打印这两个 series 对象, 我们演示实践一下。 打开 seven text 编辑器,点击 file new file, 按 controls 保存, 我们将它保存在地盘的 practice 文件夹下,将它命名为一杠九点 p, y, 按一个键。首先呢,我们要引入 pandas 模块,将它命名为 p, d。 然后呢,我们创建数据 data 一,是个列表,然后我们列表它的有五个元素,分别为 a, b, c, d, e。 然后呢,我们再创建呃一个数据辅值给变量 data 二。嗯,我们创建一个字符串 data 二, 我们使用大写的 a, b, c, d, e, 这是一个元素。然后我们这个地方呢,将它复制给变量 data 一,然后五个元素的列表 data 一。 然后呢,我们使用 pendles 模块下的 series 这个函数,创建 series 对象,并复制给变量 series it 我们这个地方使用 pd 点 series。 然后 data 一, 然后呢,我们再创建 series 对象,并复制给变量 series 二。 然后呢,我们打印呃这两个 series 对象,使用 print series 呃一,然后呢,我们再打印第二个对象 series。 按 control button, 我们运行一下这段代码,打开 windows 的命令行窗口,我们在其中输入 python 一杠九点 p, y, 然后按命可键, 爱你,再见。 大家可以看一下。呃,第一个 series 对象呢,它是五个元素。第二个 series 对象呢,它是一个元素,也就是零, a, b, c, d, e。 然后 detype 为 object, d, type 为 object。 我们可以使用 pandas 毛孔下的方法创建 date frame 对象, 它的语法格式如下,首先呢,我们要引入 pandas 模块,并将它重命名为 p, d。 然后我们使用这个模块下的 data frame 这个函数,创建 data frame 对象,并复制给变量 d, f, e data frame 这个函数的参数比较多,其中 data 表示用于输入的数据,可以是各种类型的 数据参数, index 是可选参数,表示行标签儿参数 columns, 这也是一个可选参数,表示列标签参数 detype, 这也是一个可选参数。表示每一列的数据类型参数 copy, 这也是一个可选参数。表示是否复制数据默认值为 force。 下面我们做一个例题演示,实践一下,使用 pandas 模块创建包含一列元素的 data frame 对象,一个包含两列, 一个包含两行三列元素的 data frame 对象。打印这两个 data frame 对象,我们演示时 实践一下。打开 sublime text 编辑器,点击 file new file, 按 ctrl s 保存, 我们将它保存在地盘的 practice 文件加一下,将它命名为一杠十点 p y, 按一个特键。首先呢,我们要引入 panda 这个模块,将它重面名为 p d。 然后我们创建包含一列元素的 date frame 对象。首先呢,我们创建一个一行呃列表,并将它复制给变量 date 一,我们这个 d 方式使用 a, b, c, d, e, 然后呢,我们创建呃二维列表,然后复制给变量 data 二是 列表中箭头列表是 c, 大写的 c, 然后是 我们这个地方使用小写的吧 c, 然后是加瓦, 然后是 passes。 然后呢,是再创建一个列表 十一,十二,十三, 然后呢,我们使用该模块下的 data frame 这个函数创建 data frame 对象,并辅值给变量 d f, e, data frame data 一,然后呢,我们再创建两行三列的这个 data 服用对象,并将它复制给变量 d f 二, 然后呢,我们打印这个对象, 再打印这个对象,按 ctrl s 保存。 我们运行一下这段代码,打开 windows 的密码窗口,我们再去 中输入 python 一杠十点 p y, 按一个键, 大家可以看一下,这是包含一列元素的 data free 对象。这是包含两行三列元素的 data free 对象。 我们可以使用 pandas 模块读取 excel 工作部中的数据,它的方法比较多。 首先 呢,我们可以使用 pandas 下的 red 下划线 excel 读取 excel 文件,并返回一个 data from 对象。我们也可以使用 read 下划线 csv 读取 csv 格式的文件,并返回一个 data from 对象。 我们也可以使用该模块下的 red 下颌线 jason 这个方法读取 jason 格式的文件,并返回一个 date free 对象。我们也可以使用该模块下的 red 下颌线 h t m l 这个方法呢,读取 h t m h t m l 格式的文件,并返回一个 data frame 对象。我们重点介绍一下这个 red 下划线 excel 这个函数,其实这个 函数的参数非常多,有兴趣的读者可以看一下书中的介绍。 下面我们做一个例题演示实践一下,在地盘 test 文件夹下有一个 excel 文档销售数据。第二, x l s x 使用 pandas 模块读取该工作表中的数据, 然后跳过第一行读取工作表中的数据,打印读取的数据,我们演示实践一下。 打开 sublime text 编辑器,点击 file new file, 按 ctrl s 保存, 我们将它保存在地盘的 practice 文件夹下,将它命名为一杠十一点 py 按一个键,首先呢,我们要引入 pandas 这个模块,并将它重命名为 p d。 然后呢,我们创建一个路径,用来表示这个 excel 表格的路径,它是在地盘 销售 test 文件加下,然后它是销售数据。呃点 x l x s x 然后呢,我们使用该模块下的 read 下号线 excel 来读取。呃,这个表格中的数据, 然后呢,并返回 data frame, 对下复制给变量 data。 一,它是 p d 点 data frame。 首先呢,第一个参数就是它的入境。 嗯,第二个参数呢,我们将它的 shit name 设置为 shit。 二,按 ctrl s 保存。我们再查看一下这个题目的要求, 他是读取工作表中的数据啊,我们可以读取 c 特二这个工作表中的数据。 然后呢,我们打印这个数据,然后 后呢,我们使用 date frame 这个啊,这个打错了,这个地方应该是 read 下滑线 to excel, 这个地方的函数是 read 下滑线 excel 读取 excel 表格中的数据,按 ctrl s 保存。 然后呢,我们再使用这个 read excel 这个方法呢,在读取 excel 中的数据,然后辅值给变量 did hard 二, p d 点 red excel s r c pass, 然后 shit name 等于 s h h 二, 然后呢,我们这个地方呢呢,它的题目呢,要求是要隔过第一行,我们要使用这个参数 skip rose 等于一,按 control s 保存。 嗯,最后我们再打印一下这个 data 二,这个 data 服用对象按 ctrl s 保存。 我们关闭一下这个窗口,我们运行一下这段代码,打开 windowsmi 行窗口, 我们在其中输入 python 一杠十一点 p u i 按这键。 啊,这个地方呢,我们 打错了,这个地方应该是使用下滑线 shift name 参数有错,我们输入下划线,输入下划线,按 condrise 保存。 然后我们再运行一下这段 dem 在 windows 的命令横穿口红,输入 python 一杠十一点 p y 按一个键, 我们将这个窗口拉长一些,大家可以看一下,它是 表格,是一共是七行,这个呢,一共是六行, 第一行呢就是为贾宝玉,然后洗衣机时代。然后呢,我们打印的 data 二呢,它就它就是呃,越过第一行,直接是从第二行,也就是这个林黛玉电饭煲开始的。 我们可以使用 pandas 模块中的方法创建并写入 excel 工作部,它的语法格式如下,首先呢,我们要引入 pandas 模块,并将它重命名为 p d。 然后呢,我们使用该模块下的 data frame 这个函数,创建包含数据 data 的 data frame 对象,并复制给变量 data f。 然后呢,我们使用该模块下的 excel writer 这个函数呢,创建带有目标文件名的 excel writer 对象,然后并复制给变量 writer。 然后呢,我们使用 data frame 对象 data f 下的 to excel 将数据写入 excel 文档。最后呢,我们要保存数据, 呃,使用 excel writer 的 save 这个方法保存数据,然后再关闭 excel writer 对象, 其中参数 pass 表示目标文件的路径。然后我们再将数据写入 excel 文档的时候呢, 其中有一个参数 sheet 下划线内容,它表示 excel 工作表的名称。下面我们做一个例题演示,实践一下, 使用 pandas 模块,在 d 盘 test 文件夹下创建一个 excel 文档,文学名著点 x, l, s x 然后创建一组包含文学名著名字和人物的 date frame 对象,最后写入 excel 文档,我们演示实解一下, 打开 sublime text 编辑器,点击 file new file, 按 controls button, 我们将它保存在地盘的 practice 文件加一下,将它命名为一杠十二点 p y p y 然后按 inter 键。首先呢,我们要引入 pandas 模块,并将它重命名为 p d。 然后呢,我们创建这个 excel 表格的路径,辅值给变量 s, r, c 然后 pass 地盘 test 文件夹下的文学名著。 第二, x l s x。 然后呢, 我们要创建这个 data free 对象,并辅值给变量 i n f o。 我们这个地方是 p d, 点 data frame。 然后呢,我们是创建这个文学名著。 嗯,首先呢是西游记, 然后呢,它是一个列表,它的人物有 唐僧, 还有孙悟空, 然后是猪八戒, 然后是沙僧, 然后是白龙马, 五个豆, 然后呢是红楼梦, 然后呢,他是贾宝玉, 林黛玉, 然后是雪宝台,然后是史香云, 然后是晴文。 然后呢,我们再创建一个是三国演义, 是分别是曹操,孙权, 孙权,然后是刘备,诸葛亮, 然后是司马懿。 然后呢,我们创建这个 excel write 对象,并复制 给变量 writer, 使用 pd 点 excel writer。 然后呢,我们是在地盘 test 文件加下的文学名著点 x l, s, l, s x 然后呢,我们使用 infor 对向下的 to excel 这个函数。 to excel, 然后是 writer, 你们 shit name, 它为 shit 一。 嗯,最后呢,我们要保存数据, 然后呢,我们要关闭这个 excel right 对象, 按 ctrl s 保存。我们运行一下这段代码, 打开 windows 的明量窗口,我们在其中输入 python 一杠十二点 p y, 按个键, 程序运行完毕。嗯,他打印出的这段代码就是给我们一个提示信息,也就是说在未来的 pandas 版本中,这个 sale 这个方法可能会被移出。我们查看一下它运行的结果。 在 d 盘的 test 文件夹下,我们创进了一个 excel 表格。文学名著。点 x, l, s, x。 我们打开看一下。 单机室门关闭一下, 大家可以看一下他已经创建了这个文学名著的 excel 表格,然后他是 data free 对象创建的西游记,然后是红楼梦,然后是 三国演义, 然后呢一共是一二三四五六,一共是六号。 我们再看一下这个代码啊,我们呢主要是使用了 date frame 对象的 to excel 这个方法来向 excel 表格中写入数据。当然我们使用 to excel 这个方法呢,它其中有个 writer, 这是 pandas 模块中的 excel writer。 这个对象 写入数据之后呢,我们再通过 sale 这个方法和 close 这个方法呢,保存我们写入的数据,我们最终就可以看到我们创建的 excel 表格以及写入的数据。

在熟悉了潘德斯是什么之后,现在我们再来看一下潘德斯的一个安装,那么在我们的 annacoder 当中是自带潘德斯库的,我们在使用的时候是无需安装的。那我们先来看一下怎样去使用它。那首先呢,我在我的地盘 去新建了一个文件夹,这个文件夹的名字叫做 date p r o。 在这个里面啊,我又创建一个文件夹,叫做第二章。那么在第二章当中呢,我放了一个 excel 文件,这个 excel 文件叫中超赛事表,我们把它看一下, 打开之后你看一下呢,它是一个二维表格的这样的数据,那这样的数价潘德斯是可以进行 操作的。那现在呢,我们就使用 jpote notebook 来去使用 pandas, 把刚才的那个中超赛事表的数据导入到 tiptoen notebook 当中。那我们现在来给大家演示一下。在这儿的时候呢,我去找这个 and called, 找到之后你点击它,那么当它看到前面出现一个贝字啊,说明你现在用的是这个 annacota 的一个基础的环境,那我们在这个当中输入 g u p y t r g p u ter notebook, 它是在地盘, 是在一个叫 deta pro 的目录下,在这个目录下有个叫做第二章。那好了,我们现在回撤,那这样的话,我们就会把咱们所 创建的文件保存到第二张那个文件夹下,那么当他去打开这样的一个网页的程序,那现在呢,我们就可以去写咱们的代码了,看一下这个叫做中超赛事表,那这有个 new, 我们去创建一个叫做拍真三, 那这个叫什么呀?这叫 panda 字的使用,所以我在这 rename 初步使用,那我们说了 on the colder, 它是不需要安装 pandas 的,是直接可以使用的,所以我们在这儿直接导入就可以了,叫 i m p r t pandas, 给它起个别名叫 p d, 那这个叫导入 pandas 模块, 然后第二步,哎,我们要把这个数据读取过来,对吧?所以呢,它叫 p d, 点 read excel, 因为你读取的是 excel 数据,那这块我们写上叫中超赛 视表一个下文件,然后我们去把它复制给一个对象两句代码了,对吧?然后第三句代码我们输出就可以了,然后点击运行, 你看一下,那么这个数据啊,就被读取到我们的拍子当中了,你看一下是不是使用潘德斯去操作一个效,非常简单,我们使用了两句代码导入进来,第三句代码显示就可以了。那这个是 使用 anna call 的使用解 put notebook 去编写代码。那现在我们再来看一下, 那么如果我想使用我自己安装的拍森解释器怎么办?你自己安装的拍森解释器是没有安装潘德思库的,你需要自己去安装一下,那么安装第三方库的语法就是 pip 一照潘德思,那么我们把它打开,在这, 在这的时候呢,我们去点击 windows 加 r 键,然后去输入 c, m d, 打开这个 dos 窗口,你在这个 dos 窗口这儿直接去写 pip insor pandas 就可以了。 d a s 回出啊,那他们将去触 在一个安装的过程当中,那么老师的这个计算机啊,你看他现在是正在进行一个安装的。 好了, 那我现在暂停一下,等它安装完成之后,我再继续。当它出现一个单词叫 search satisford, 说明我们安装是成功的。 但是啊,这个潘德斯他有一些依赖库,也就是说你在自己安装的拍森解释器上去安装潘德斯库的时候,你还要去安装两个依赖库,一个叫做 x, l, r, d, 那这个是什么?实际上这是 excel read, 你读取一个笑的时候,你需要依赖到这个模块,那我要是把数据存储到一个笑当中呢? 你需要依赖一个叫 x, l, w, t, 那么你只需要在这上面句句写就行了。比如说 pip install a, 这样去安装 x, l, r, d, 然后呢,安装完这个库之后呢?你再写,我先回车安装。然后呢,暂停一下,当你安装完成功之后,你再写上 pip, 在这儿 pip in store x, l, w, t, 再去安装我们另外的一个去写入的库。那么这三个都安装完成之后啊,我们就可以去使用 pandas 了。 那么当然,如果你在安装的过程当中出现问题,或者说你的网络不好的情况下,那 你可能需要使用国内的一个镜像员。那什么叫做使用国内的镜像员呢?就是你在安装的时候,你除了写上 pip instle, timed 之外,你还需要写上后面这一串。 所以如果你安装失败的话,你就把老师的这串 ctrl 加 c 复制到这面,单击右键粘贴回车就可以了, 你看一下。哎,我回车之后,他现在又是在告诉我安装,实际上他不是安装,因为他这块写的什么 already, 就说你已经安装存在了 好了。那这样的话呢,我们在自带的啊,不是自带的,我们在自己安装的开心节气当中就安装了潘德斯库以及他的依赖库,当我们安装完成之后,你就可以进行使用它,那我怎样去使用呢? 我在这的时候去找到我的安装的 python 解释器,我呢这有个叫三点八,这不是有一个叫做 id l e 吗?对吧?它是一个自带的连接器。那然后呢,我把它打开,选择文件新建, 然后呢这个文件我去把它 save 保存一下,就存储到咱们的地盘,就刚才的那个位置上, 在这个地盘当中有一个叫做 daytpro, 这不有个第二张吗?是吧?然后我在这写上这叫什么?这个叫测试潘的, 因为我安装完了,我是不是想要测试,然后代码很简单。为什么说代码很简单?因为代码是相同的,你只需要把它复制,然后粘贴 保存,然后我们在这的时候选择 run, run 就是运行模块嘛,然后现在我们在这稍等一下, 看一下数据是不是也读取出来了。那这个就是在我们的自己安装的拍森解释器上去安装 pandes 模块以及来测试它。
