粉丝2198获赞7141

今天要跟大家分享的是在 pocary 中最常用的八个数据清晰功能,那接下来我们用一个模拟数据带大家认识这八个功能。首先我们第一步要做的就是将第一行的数据提升为标题行,那在转换下我们找到将第一行用做标题,那接下来呢,我们发现数据当中有数值,那有两种方式可以设置数据类型的,第 一种是在转换下找到数据类型,点开后面的下三角,在这里选择你需要设置的格式进行设置就可以了。第二种方式呢是在数字列的标题前,鼠标放在这里会出现一个小方框,我们点开它就可以进行设置了。那进行了一些简单的设置之后,我们检查数据,发现出现了一些空值。 no, 那我们只需要在出现空值的列标题这里点开后面的下三角吧。 no, 去选掉,那在城市这一列是因为我们在 x 二中用了合并单元格,所以才出现了空值。 在转换下找到填充,点开后面下三角,选择向下。那我们把所有的控制处理好之后呢,发现有一些重复项,选中需要删除重复项的列,然后右键选择删除重复项,那根据不同的数据处理需求,比如我们需要把城市和门店进行一个合并,只需要按住 ctrl 键,然后选择你要合并的列之后再转换下找到合并列。那拆分呢?也可以在转换下找到,那我们按字复数把刚才合并的列再进行拆分。 那最后呢,我们要把数据的行和列互相进行转换,将第一行用做标题,点开下三角之后,可以看到将标题作为第一行,标题下降之后呢我们再进行转制就可以了。那以上呢,就是在 part cory 中最简单实用的八个功能。

一般来说你在做这个事情先点这个转换数据,点转换数据之后呢,你点一下这个,他就能看到这个工作部的这个数据了。然后你会发现有一个特点,就是说店铺名称他不是上面的那个自断名,对不对?你要去把它点一下转换,把第一行作为标题,把它先处理一下。 你如果直接点加载的话,他可能就会变成这个过了迷了,因为他虽然智能,可能有时候也没那么智能,就还是会有一些小问题。所以的话就是说我们剪这个转换不要点加载,加载的话就直接就导进去了。

各位小朋友大家好,我是托尔比亚检验派的杨老师,我们这期录制最后三个,呃,常用的数据清洗方法。第一个自定义力,自定义力就是我们如果说这个表格里面有一例是你需要添加的,那么你添加的内容是什么?比如说我这里是授课, 授课老师, 那就统一文本,下面 需要双引号,就是杨杨老师,你如果本名是杨昭君,认识的人都都应该知道我名字,那么就是杨杨老师。那所有这个表,每一例每一行都会有杨老师, 那么我们也可以去添加一个数字,比如说我们杨老师的年龄是三十一岁,点击一个确定,这里因为是数字, 这个是你不需要添加创意号,直接点击确定输入数字就可以了。那么就是第一个添加自定义链, 我这里不建,不建议你添加太太复杂的,比如说你在这里面写什么衣服模式,呃,我们图尔标里面有一个自带的条件力,就是我们店的那种条件力,比如说我们以 啊课程为例,直接写个定价,我们不去,不去做和平查询的话,我知道定价,那我就课程名称等于托儿 bai 入门课程,那么就是四十九元,那我还可以以课程定价一二三。另外一个以课程名称 包含进阶,你可以不用把它输全,你只输一部分,就是有一个包含,它包含某个字, 你就可以确定还是你就可以说出对应的内容了。那么你确定可以看到现在我们的这个进阶?我们筛一下 三十拳过后,我们的音节全部都是九十九元,另外一部分就全部是四十九元,所以这个啊里面的这个包含是非常好用的一个东西,就是你只需要包含一个字, 他都可以去做。比如进阶我只需要有一个字,那也可以是九十九元,其他的就是啊,零元我们没有了,就是零元,那就可以看到这九十九零就做出来了。 好,第三个我们的逆头石头,哈,我们需要添加一个新表,这个情况的特殊哇,我看准备一个逆头石的表格, 我们先看一下这个绿透视的表格,他加载进来其实是有三点信息,课程、境界课程啊、课程名称啊,我们的境界课程、入门课程。这个其实就像我非常类似我们平常做的透视表, 那么现在我们需要把它转换成一维表,因为一维表是什么?就是他都是一列一列去做的数据。但是这里虽然是一列,但是其实他是列列标题跟行标题去做的检索。就比如说是艾系, 他在进阶课程里面没有买,在入门课程买了一课就是一,他其实是其实是透视表的,行跟列都有数据,这这就不是异味表。同时这里还有一个,呃,我们我觉得应该有个总计,对,做一个总计,那我们不要最后一行,不要最后一行,把最后一行总计 删除了啊,就没有没有总计了,那我这里就不去再呃详细展示,那现在我需要把它转换成意味表,意味表还有逻辑,就是每一列自断的信息尽量不要重复,其实这后面两个内容他们是有重复的,他们可以把它归为一类, 是什么课程,课程分类,那么就会说课程名称,课程名称是进阶课程,入门课程,那其实是可以作为一列的,然后再有一列就是你对应课程是否购买了就比较积极,没有买完就是控制。那现在我们把它转换成一个 啊,一维表就是选中这两例,在转换当中会有一个,这个一头是你们的。嗯,图案标打开的话,大的情况下是有这个文字的,但是我这里为了方便展示, 我们就把它说起来是这样的,一个图标叫一头十,直接点击一头十粒,大家可以看到我的所有表格全部就改成五幺的东西,这一类是分类,课程 分类,然后这这一个是是否购买,我只要是有意的就是更买他的,那这就是我想要的东西。好,这里就就已经完成了这一步,那我还可以反着过来把泥头石删除了,我们不选这两列,选一列直接可以 逆透是其他力,这跟我们删除保留行,保留行是一个意思,那么就是课程分类, 这也是是否购买,然后为什么要这样做?就是后续你如果说做带个自动式的话,你不去这样做,你要 退回到前面这一步,你是有两列数据需要进行一个求和,然后你还要把这两里加在一起,如果说是五列数据,五个门,五门可是都这样展示,那你要把五门课程分别先做个萨姆,然后再去用萨姆,加 啊加啊,在求和,单个公司在求和,然后总和公司在求和,这个效率就会非常低。但是如果你按照你头饰的方式去把它调成一律,下面我五门客只能分类在这里,五门客车适合购买,对一个一定价,有一个区, 那你只需要写一个公式就可以完成了,你十轮课、一百分课都可以这样快速的完成。所以这个也叫结构化的数据,我们看似前面这个是结构化,但实际并不是结构化。结构化的数据有要求就是每一列的数据是唯一的,还是尽量 进行一个最低的分啊,最低的维度,而且不重复的啊?那这是我们十种常见的一个数据清洗的方法啊。那如果需要对应的资料的话,也可以关注我们的公众号去啊,搜索对应的一个评论,完成这样的过程。

做完数据合并后,就要开始对数据进行清洗,其中去除重复数据是必须要做的。为了演示去重操作,先来创建一些重复数据, 进入到保存原数据表的文件夹下,复制一张表就有了重复数据修改名称,方便在后续查看。 进入到 power query 中,准备去重操作,还没有点击刷新时,新增加的数据没有加载进来,现在的结果中是没有新数据的,只有三个文件的数据,点击刷新 就可以看到第四个文件的数据加载进来了。数据驱虫的依据有两种情况,一种是单列具有唯一值,或者多个列组合后具有唯一值。 当前表中日期是需要具备唯一性的,所以选中日期列,点击选择删除行删除重复项, 以单列为参考的去重就完成了。这里可以看到,删除的是第四个文件中的重复值, 也就是说后出现的重复值会被删除。所以要想保留第四个文件的值,就要对类目列进行一个排序,让第四个文件的数据出现在第三个 前面,这也是为什么要保留文件名以及对文件名规范命名的原因。如果去重的情况是多列组合才有唯一值,那么只需要选择这几列,然后使用相同的操作删除重复值即可。 excel 进入 power query 工具界面和操作是一样的,所以这个视频对 excel 操作一样可用。

哈喽,大家好,这个是我之前做的一个效果图,说那个他都是具有一些筛选功能的,当然可是画软件呢,他不仅体现在图标的动态现象,他另外还有一个最大的特点就是当你的数据在不断的增加或者是减少的时候,你做好了这样的一个报表,下一次你再打开它,只需要更新一下你的数据就可以,它是连接上的。 首先我们把他的一个擦掉软件, 因为泡面是一个免费的环节,所以说他的速度是相当的慢,这里我们从不需要导入视频, 我之前用到的是一个代码里面的一个数据,其实这一个是不含不含代码的都可以用, 因为他店里的操作的话,他不仅可以对数据进行合适的操作,他还可以做一些清洗加工的 操作,就在他 q 的里面,我们来看一下数据库的文件,这是我们之前的一个原始的文件,我们就选他,你选择完了之后,你会看到他第一行,按照我们学生的说法的话,他应该叫做标题,在那个合适化软件里面他叫做判断,应该是从第三行开始才是。第二,因为我们前面空了两行嘛,所以说在这里面要进行一下数据的清洗工作, 还有就是数据的一些其他的设置。那在 ktv 的软件里面,你只能就说先把你的数据整理好,不要像这样才可以去做可视化的操作,不然的话你的数据是有问题的。 这里我们点转换数据去进到他 q 位里面去,把它调一下,把它变成一个标准的数据格式。首先我们第三行开始才是我们的标题,所以说我们将标题提升再提升, 再提升一下,然后看一下我们的列列是没问题的。然后紧接着要检查一下我们的数据格式,日期格式他是否都是日期型的,然后下面的地区、商品名这一这些的话,他应该都是文本格式,文本格式的话就是在这段名左边有一个什么 abc, 大概是文本型的数据单价、销售数量和销售总价 应该是个小数或者是整数型的数据,那这样已经没问题了。对于数据的清洗的话,他不仅仅是说可以像刚才那样去把数据做一个简单的提升标题啊,这样的操作,他其实上面还有很多很多很多的内容,添加力啊,添加辅助力啊,添加条条线判断啊之类的,还可以做一些 其他的。比如我们现在来,比如说这个日期,我们想要进行一个月份的筛选的话,我们肯定要提提取一个就是我表示月份的,表示月份的一个列,我们来把它添加列。 你如果说要在他周围里面去做一些公式的话,他用到的是个 m 函数。 m 函数,呃,学起来有难度, 因为他有很多很多的一些编程思维在里面,你如果没有的话就溶解起来非常的困难。但是他也有一些快捷操作,比如上面的上面的,呃,要工具栏里面,导航栏里面还有一些已经设置好的一些,就不需要你去写任函数,只需要点一下,然后操作一下就可以。现在写的就是一个 m 函数的一个公式, 我要主要提取一些里面的月份,再加上一个几月几月, 除了那个单眼霜以后之间的可以用中文标,其他的全部都在英文状态下,英文输入法的状态下写这些,包括标点符号。哎,错了,我们可以看一下我们的错误到底在哪。哦,这里错了,没关系, 回到我们之前呢,他的仪式是无法将运算符这个按的符号应用于一个 log a text, 因为 m 函数呢,他对数数据的格式设置的非常的严谨, 所以呢,我这里从日期里面提出了一个提取了一个月份数据出来,他的数据类型是一个数字型的数据,然后后面我连接了一个制服型的数据,这是不行的,我得先把前面的这个数字型数据,把它变成一个制服型的数据,要转换一下, 像这样他就没有错误了,刚刚的错误已经没有了,我们把它提到这里面,往前挪一下, 数据量比较多的时候,你用公式函数,因为这个数据我之前承认一下,大概有接近三万行的数据,你如果用公式写,写完之后你得下单对不对?然后公式你写的越多,列添加的越多,你的电脑反应速度就会越慢。但是大家有没有发现,就是我刚刚用嗯,延长出去做这些事情的时候,他带劲越快, 这就是他 q 的一个最大的好处,他就是专门用来处理百万级别的数据,在预告里面,因为我们大多数的公司的话,可能数据能够拿来算的一些数据的话,或者是拿来做一些分析的数据化,要么就是上千上万,或者是十几万,二十多万,三十多万,这种数据已经非常大了, 那高度他是可以形成一个快速的处理的过程的,这就是他的一些优势。然后我们看一下我们的表,这是一个一系的表格,相当于来说的话比较原始。然后然后我们还可以对我们的表格进行一个快速的聚合操作。这是一张表 改一个名字,我们对他进行一些深加工,我们要月份必须需要,月份需要,那我们要对他进行一个分组 了解一下。我们要按照月份地区对销售和合计 求和,当然还可以求平均啊,求中值啊,最大极具小值,或者是一些激素都可以。然后我们要求和的列是销售的总价 啊,他很快就求出来了。这里我们把地区给他练一下,上海的四月、五月,北京,北京。 到时候我们可以把这张表拿来做一个呃切片,就展示每个月他销售销售量,销售额是什么什么样子。这里的话我还可以求一下他每个月的销量在所有用我们这张表里面所有总销量里面的一个占比。因为这里我就是用一些 m 函数去对他进行操作,所以说可能会写一些 m 函数。 现在你看的话可能就不知道到底我在干嘛,因为我想啊,就是每一个我想要求总总金额,对不对?总的销售额,所以说我每添加的每一页后面的话,应该是这个销售额合计的所有数据,那它产生了一个类似特,这类似特的数据呢?就是销售 合计的这些,我现在要对他进行一个相加,就把里面的所有的数字全部加起来, 然后这个别的函数他是分大小写的,如果你大小写没有写对的话,他也是会出错的, 这样的得出来的一个技能,他就是一个不变的技能。还有这里要把它改一下,改成一个小数,或者是一个整数都可以的,还是整数吧,他有一些经部上的,刚刚有一些肩部上的问题,紧接着我们来做一个暂停仪,再添加仪, 那这个教程上笔的话就直接除法。 在 popipi 里面也可以做这些操作。 polodime 的话, polobi 里面的话要用到的就是大可函数,它更接近于我们 excel 工作表里面的公式函数可能接受程度要高一点,但是里面有一个非常不好理解的概念,就是那个上下文的概念,现场比较 要简单的一些操作,比如说一些柱状涂鸦,比涂鸦该怎么去做。那其他的一些复杂一点的计算的话,我们可以留到后面再慢慢讲。回到我们的数据, 他在这里转圈圈,他就是没有登录软件快,他是免费的嘛。好了,他这里提示我们可以把字段,字段在这边,我们可以把相应的字段拖拽到画布上面,比如说我们刚刚的那个地区,然后销售额,销售占比我们把先试一下啊, 这里的话他有一个视图,我们选一个比较深深色的一个视图啊,你你可以看见他的字非常非常的小, 在这里我们要对他进行下设置,一般一开始你做一个报表的时候,你要去调调整他的字体大小,但是当你做完这个报表之后,你在以后的工作当中的话,你就不用去重复的调他了的,只要你使用同一个数据源,里面的字段没有发生 改变,只是数量发生了一些。贞洁那他就这张报表就可以一直一直用。然后我们再把那个销售额的合计拖进来,应该是拖在这,应该是在这里把它放进去,哇,拖一个占比, 再来一个占比,我们换一个矩阵,然后矩阵你看现在格式又发生变化,我又得去改一改。他比较比较麻烦的就是你每一次做这些,第一次做报表的时候需要你花一些时间把它设置好,那做做好了之后呢?下一次你就没有这么麻烦。然后他的行上面是 地区,这叫行一行一行,然后值上面就是一些什么,这里的行的话我还可以加一个月份, 然后就可以对他进行一个下下砖,说四月、五月,我们再向上说,我们点到广州,广州地区,看他的四月的五月的销售情况,再往上回到前面,然后我们来把它换成一个 条形图,这里面有很多图可以选择啊,那条形图的话我们就先不要这个销售的占比,我们也不要月份,我们待会用月份来做一个三,那个切片器换一个条形图, 然后把数据标签加上数据标签打开,打开了数据标签之后,他这个外轴我们就可以把外轴的标题给他关上,因为这里有了那个标题关上,关上了之后那个外轴也可以不要了。然后我们看一下 x 轴, x 轴就是地区, 这两个下面有个地区,然后我们北京、上海、广东、深圳之类的,这个地区就叫做标题,然后北上广这些信息的话是一个整个的歪轴,然后这里我们可以调调整一下那个哎,开始走的那个字体大小太大了。 然后我们同样因为这个标题,他的也是很清楚,饮料没有什么其他的一些。 然后还有一个就是你看上面的这个这个数据标签他非常的小,然后可以我们可以在这里给他做一些颜色上的改变,给他换成红色,然后单位的话他自动显示为十亿,我们不骗他。然后这个给大家看一下大小, 后面的话什么一些呃,字体颜色啊,显示背景啊,这些无关重要啊。然后还有这个方向是在水平方向还是在锤子方向,然后位位置的话端外端内 装烂,或者是中心或者是什么什么之类的,你看他现在在专卖吧,这样一个简单的条形图我们就做好了,然后这个图可以去缩放他,然后这里还有一个 还有一个标题,这个标题是可以改的,这个标题在这呢,我们把它改一下销售额,然后把 因为我用了黑色的背景,所以说白色的字体也就是稍微比较好的,然后这个数据调的颜色也是可以改变的, 就这个颜色他可以每一个地区他都可以单独的设计,也可以设设置一个统一的颜色,我们为了就说反差大一点,选一个比较夸张的颜色,那这样一个简简单单的 条形图就已经做好了,我们把它放在这里。

好,各位小伙伴们,大家好,我是波尔比亚锦云团的杨老师,我们这期讲一下超级优惠六块,用合并插群 其他 ppt 我就会去一个想想想讲解了,我们不去做 ppt, 我们直接花三分钟时间具体操作,我们可以拿到我的新单,一个个一个步骤去点击破壁,而更多是实操。那么我们进入今天的内容, 一个普洱标的和超级合并的话,我们需要合并查询,那同样他合并查询其实是查询了两个表,我现在只有一个表,我们还需要再导入一个工具部,我们这一以两做两份的一个记录吧,我们导入一个定价, 因为我们的表格里边除了课程要注意他销售销售记录以外,但是他没有定价,那我可以把定价加载到我们的皮肤 中,然后我们还可以去加载一个日期表,因为我们的支付时间,下单时间都是都是以日期自断去做的,我想把它分成年月日,就可以以这种方式去做 啊。你如果说日期表,你想用其他的那个啊代改词公式去做那个日期表,你可以,但是我这里只是为了展示一个效果,所以我们在啊皮肤当中以日期表合并的方式去做一个展示。那现在我们就可以点击到我工具栏当中有一个合并查询, 合并查询我们这个功能就可以类比为 vocal, 而且不需要你携带吗?这里我们需要先把课程名称选中,选择定价当中的课程名称,那么现在下面打个, 你可以进行一个匹配,点击确定后边我们就会多一列出来,只需要打开向左向右的一个按钮,把我们的你需要的自动选择进来就可以了,我只需要 定价,而且我不使用原力作为前缀,这个我如果说作为的话就是卸的一定价,那我现在不要就是把 再来一遍,我们把前面的勾去掉,直流定价,那么就不会有些的一点定价,那么这是第一种。第二种我们还有一个日期,但日期我们需要先把这个表里面的这两个下单日记支付日期,支付时间 改成日期格式,那我就可以通过第二个表 去做合并的做合并查询啊靓仔。在组合当中点击合并查询, 选择你需要合并哪一列的做标签,现在以下单时间选择第二个日期,点击确定,那我现在就可以展开选择年月日,那如果说你这样做的话,避免重复,我就可以直接写下单,下单的年, 下单的月,下单的日,这双击就可以抽明明了,那么我还可以去去合并我的一个支付时间, 同样一样的,我们选择支付时间,在主表当中选支付时间,在匹配的上选择日期,点击确定一样深深一列展开 选择年月日,这里就是支付。好,我边写边说,这里大家可以看一下,我们是有一,其实是有一万七千行的一个啊,记录的,你 不需要人写任何代码,不需要写 vocabo, 而且同时可以做到三例同时展开,三例同时展开同时的一个啊,呃,查询做 vocoa, 所以叫超级 vocoop, 你 不管是多少哈,你上百万行或者上上百列去合并查阅,你都可以用这个方式去做,也不需要写任何的一个公式代码,但是可能量大的话,他的运行效率不会 这么快就一秒钟完成,但是基本上会是在几分钟之内就可以完成了,这个最后还要取决于电脑 啊,那这一期的一个内容就啊完成了。同样的,你需要相应的资料清单的话,可以关注我的视频号公众号,去在公众号当中获取我们的一个呃网盘地址去下载。

小伙伴大家好,我是波尔 bi 简约派的杨老师,我们今天花三分钟时间讲一下波尔 bi 三大板块,第一个板块数据清洗,我们以数据清洗类比成我们通用的话,数据清洗就是我们的一个洗菜跟切菜环节, 我们是在那个菜市场把菜买回来去洗菜,切菜,去做一个结构化的干净数据。这里还有一个比较重要的,就是 把二维,二维表或者多维表转为成绩为表,那么我可以看一下他的那个数据清晰到底是在哪里看下。 首先打开一个 popopolipi, 我们 popi 主界面打开过,其实是没有任何东西的,那就相当于一个空白人,他去菜市场做做菜的话啊,烹饪的话首先是需要先买菜,那买菜的话就会在这个数据界面当中,因为我的那个格式经营的一个啊页面大小已经调整, 所以都是在这个数据界面,大家可以去配对。主要点击的就是获取数据,我们以获取数据当中的尼克斯尔工具部去做第一个基础的一个获取。 那么一个四二工具部其他的什么文件夹数据库,你其实可以类比成我一个四二是在他那个小小超市,那文件夹可能是在菜市场,那数据库有可能就是在我们的批发市场,有呃送货的人专门给你送送货,所以有些实施加载, 那么现在主要以 excel 工具部去做数据加载,这里加载一个我们第一期的呃课程的清单以及我们的销售记录, 这是我们课程的销售记录,这里不是入门课程,所以说我们模拟有两种课程,一种是入门课,一种是境界课程,那直接 就可以点击转换,点击转换过后就可以看到我们会打开一个专门的数据清洗界面, 数据信息建议我放同等大小,那么这里就是我们导入的一个数据信息的内容,好,这里就是数据信息的内容,那我们现在简单做一个清洗的话,就其实就可以看到下单时间跟支付时间,其实就 已经啊时间是格式是有问题,那我们可以点击右键在内标题上点击右键转换成我们的,我们在前面点击吧, 这样大家看得见更改类型变成我们的日期时间, 日期时间,或者说在更改内心变成我们的一个日期,这里 因为我刚才已经添加了一部,如果你再改格式的话,你你尽量不要以替换当前转换,要以添加新步骤,那这样才会保证数据格式不会出错,那这就是最简单的一个数据清洗。好。第二个还有一种我们如果说不不要退货时间,不要退货时间,可以删除这一列。 好,那我们的数据清洗其实就是做的这个事情,我们把它加准了数据揭膜,就其实就已经算完成了所有的数据清洗完成,那回过头来我们再说一下数据清洗到 起的是什么作用,其实作用就是其实我们在或者说眼泪比通的形式的话,就是把我们呃那个买买回来菜上的残渣,一些脏的东西,把它洗掉,洗干净,同时按照我们想要的格式去,比如说以土豆为例,我要做 炒土豆丝,那你肯定是切成丝,那我们加土豆片就是土豆片,那如果我做土豆泥,那就全部打成啊,泥匠的打成一个碎末型的,那这个其实就是你啊要的一个结构化的干净数据,结构化就是统一的一个格式, 那么我们这样去做一个干净数据。好,那其实这就已经完成了一个加载,可以看到我们数据节目就有了,那这就是我们数据清洗的主了内容,我主要的一个返还内容。最后再给大家提示一下,一共有三个地方可以打开,一个是刚才我们在加载数据的时候 点转换数据,第二个可以在转换数据工具栏上面有个转换数据,直接点击打开 好。然后第三个部分就是在我们的表格上点击右键点击编辑查询,就可以打开我们的 编辑器,编辑器跟数据界模式两个不同的界面啊。那这第一个我们的数据清晰的板块主要的一个分工就给大家简单讲到这里。

那么我们前面提到的说空数据的一个处理,那么提到空数据的处理的话,那一定需要去了解到一个点是什么?我们对于空数据的容忍的原则是什么? 那比如说我允许空数据存在还是不允许空数据存在?而且这时候的话,如果说不允许空数据存在,我们填充的原则是什么? 我们按照重数填充,按照平均数填充还是按照零禁止填充这样的方式,那么实际上在我们的填充的过程当中,百分之八十的应用场景的话,我们都不会通过 我们提到的君子填充,那么更多的可能是采用是零禁止填充,因为他不会影响到我们其他的数据的准确性,因为我们在进 君子填充的话,有可能影响到我们的中位数和,这是需要去注意的问题。接下来我们给大家分享是 excel 和 pow bi 的空数据处理,那么注意一下啊,这面话我如果说我们的标题的话是 excel 和 power bi 的话是放在一起,那意味着的话我们在 excel 里面的操作 和我们的 powbi 的操作是完全一模一样,那么这个小节会给大家讲的是我们空数据的一个处理,那么空数据的话,其实在我们的业务的过程当中有非常多的一种场景,我们会碰到空子数据, 那么大家之前提到过这么多几种空数据处理方式,那么第一种就是我们的前数据处理,什么叫前置数据处理啊?就是说我们依据我们的前 原子来进行填充我们的下面的数据,那么后数据填充就是我们的后面当前的空格,空的单元格的后面的数据来填充,另外的话涉及到所重数、平均数以及我们提到的中位数的填充方式,但是他都带来非常大的一些问题的结果。 那么我们在进行这些空数据处理的方式,还有一些填充处理的方式。什么就我们把这空数据直接删除,我们在不管当前的数据的这种情况下,我们直接把空的数据删除, 那么可不可以呢?当然也是没有问题的,那我们在这里面话可以看到我们当前的一个空数据的话,处理方式有两种不同的处理的方式啊。那么在我们当前的 powerpry 当中啊,针对我们的数据 删除的话有两种不同的场景,那么有一些朋友的话,就不理解他,你删除空的数据还有两种不同的方式,怎么回事呢?大家来看一下我们是处理了两哪两种不同的方式, 那么第一种方式呢,就是删除掉我们的具体一列的空数据,具体某一行的数据当中全部都是空的,那这边话我们有一个删除空行的这个数据的话,他就在这里面话是删除我们这里面 所有的每一行都是空的这个数据,那我们可以通过点击我们的删除行,然后删除删除空行的方式来删除。那在这样的一种场景下的话,我们会发现所有的这个数据啊,当前的内容当 当中并没有什么都存在这样的空子,那么就被我们删除,那么只要有一店的数据不是空子,那么他就不会在这里面删除。 另外一种删除方式是删除我们的某一列的数据,大家会发现啊,这面画有一个删除空的这个操作,那这里面画的删除空指的是在我们当前的数据当中将我们的空数据删除, 那这里面话也是提到说我们提到的一个删除空的这个操作,那么通过点击删除空的操作来实现说我们的数据的一个隔离,那这里面的话也是我们提到的删除的空数据。 那么首先来看一下这个是什么样的一种场景啊?那大家可以看一下,我们在 新建远,然后再导入我们的这个数据,大家就会发现我们在这里面的话先造一个数据吧,我们在这里面的话在桌面上去创建一个这样的一个数据,然后把这里面中间定一个空,我们就叫 ab, 那这面和我们在这里面可以定义说姓名、性别、年龄,然后这面张三, 性别是呃,男,年龄是十,李四,然后十一岁, 然后这边话如果说你假设说我们就是空子,然后王五,然后呢我们这里面的话可能说性别这一点我是空的,然后在这边的话就是十二,然后赵六,性别的这个是女,然后呢 我们在这面是留下一个空的,那这样的一个值,我们得到这样的一个值之后的话,我们有时候就会发现这个数据看起来的话会有比较多的一些空值,那真的是这样吗?我们通过这个数据,然后把它导入进来看一下新建一个 csv, 因为我们本身来说就是一个 csv 文件啊,我们在这里面的话选择桌面,那么这时候的话,我们把这个数据啊相当于是导入进来, 那么他会正常一个进行正常的一个解析,大家就会发现啊,这边的话就是会有一些纸在这里,然后我们点击完成,看一下 导入现在的结果是什么样子,但这里面的话我们会发现啊,就是好像第二列他不会显示闹值啊,就是他直接是一个空还是什么?这里面也是有空, 看到没有空的话占了百分之二十。那如果说我们在这样的一个场景下,我们去删除我们提到的一个空,那么结果会怎么样子呢?然后这边百分之二十,百分之四十,然后这边的话百分之四,但是这里面显示的是 note 值, 让我们在这边尝试去删除我们的一个行,然后删除空行。那么我们这时候我们会得到什么样的结果啊? 大家会发现一个问题,就是说所有的全部都是空行的那一行的数据就被删除掉了,那么大家没有发现啊,对比一下我们这里面的话有 一共多少?一二三四五,然后这边的话删除了这个空行就被删除了。注意一下,我们这里面删除行的话,他不是删除某一列的这样的一个字带的空行,那么如果说我们希望删除某一列带的 空号怎么办呢?这里面话有一个性别的这样列,他有个删除空,那么他就把这一列当中的有空行的列删除掉了。注意一下这个操作和这个 列中的删除空行的操作是完全不一样的,那这里面删除空行是删除我们每一个数据都是为空的,这这样的一个数据,那么列中的删除的话空是基于我们当前的数据空子进行了一个筛选, 说这是不一样的,大家注意一下这样的一个问题。 ok, 那这里面后我们就给大家分享完毕有关删除处理掉我们的空值的相关的一些内容, 那这个内容我们希望大家呢能够熟悉一下他们的一个差别。 ok, 这节课程就到这里,我们下节课再见。拜拜。

大家好,我是研发教育的上学老师,今天我们正式进入 powercurry in 函数专题的学习。 在进入 m 函数专题之前,有必要给大家介绍一下 m 函数他所在的操作环境,也就是 power care。 在前面的课程我们都知道 powerba desktop, 它分为三个组成部分,分别是数据的整理、数据建模、数据的可视化。数据整理就是 powercurry 这个界面里进行操作的啊。数据建模是在 powerparty 的,数据可视化是他的报表仕途里进行操作的。在前面的基础入门以及进阶课你都有详细的讲解。 powercurry 他的中文名是作为查询编辑器,它主要是用于数据的处理,主要的功能就是获取数据,转换数据以及处理数据。 打开一个 power ei 之后就会出现这个界面,由主页插入建模仕途帮助, 在主页这里有获取数据,它可以获取各种数据库的来源,包括我们常见的 excel。 获取数据之后就会将导入的数据显示在这里, 比如说这里导入的是一个一个 sell 的工作部,就会出现这样,然后加载转换数据取消。如果我们点 机加载数据,就表示导入的数据不经过 power q 的处理,直接进入建模层面,也就是说把数据 完全导入 powerba 当中来了。如果我们单击这个转换数据,就要表示 数据进入了 powercurry 的操作环境。由此下一步我们就可以对数据导入的数据进行数据的获取转换处理,也就是数据清洗的一个过程。 在我们的二零一一,二零一九年,我们的版本,哈尔滨的版本 进入 parquie 的界面是编辑查询,那么在这里呢,变成了转换数据, 所以我们如果看到有的课程是二零一九年出现了编辑查询,其实他是等同于转换数据是一样的,这是版本的更新带来的。 parkq 的界面和我们的 excel 里面的有那么一点点相似,就是菜单啊,菜单式的有主页有转换添加力,仕途工具。 我们首先来一一看看一下主页的选项卡,主页的选项卡主要是 对我们的数据进行行列的一些变化,主页这里新建员其实就是导入数据,导入数据,导入数据之后, 我们可以对数据进行再添加数据,这个数据源设置就是导入数据,它是绝对路径, 如果下次再打开,你把原数据表的位置导入的那个原原数据文件的位置变了,那么他就会报错, 路径变了,怎么改呢?在这里改数据元设置,这里改,把它修正为以文件挪动的那个位置的路径就可以了。 刷新预览,选择列、删除列,对行列的操作,还有分组依据。拆分列啊,这个在基础入门的课程里面啊,都要详细的讲到。主页主要是对数据的行列 路径,数据的导入,对数据的拆分,分组统计以及数据类型的处理,包括数据的合并, 数据的合并主要是通过合并查询和追加查询来实现的,这是主页转换呢,转换, 转换主要是对数据的透视处理,比如说最核心的一个功能其实就是力透视和透视力,然后还要拆分力,对数据的转制等等。 添加力,添加力主要的用的比较多的就是条件力,所引力,重复力以及自定义力,大家注意这个自定义力 就是我们 m 函数经常要使用的一个地方,自定义后面是对他的一个格式,时间格式进行一个拆分或者是转换,试图试图主要是 对他的显示,比如显示空白,显示编辑栏等等,还有高级编辑器,高级编辑器就是我们后面讲到的英文语言的编辑的地方, 打开这个选择编辑栏就会出现这个,这是高级编辑器 运用的步骤,主要是对我们每一步的操作都有相应的一个展示,如果要退回上一步,把这个叉叉勾 就可以了,如果代码太长的话,我们单击这个就是扩展箭头 数据的预览,数据的预览可以通过点击右键啊,也可以看到对数据进行一些操作,那么这些操作在菜单栏当中都会有的,这只是做一个一种快捷键点右键, harkqueev 导入的数据点右键,这里他有一些复制,如果把这些表复制到一个赛道当中去,就在这里复制整个表,然后下面的这些操作其实都在菜单栏里, 这里都有啊,这个跟一个笑比较像,一个笑猜猜难,他也有的功能在我们 单机右键的时候也会同样出现,它是一种快捷的功能,数据上载啊,这个概念大家一定要理解,我们对数据进行处理之后有几种选项,第一个是应用,就表示这个数据 在 parquie 这个茶型变形器当中被保存下来了,关闭了就直接关闭了, 点击关闭并运用就表示这个数据保存,并且直接进入了数据建模的层面。我们一般情况下 parkq 处理之后,一般情况下都是选择关闭并应用,为什么呢?因为我们数据清洗之后,我们接着要数据建模,所以要 单机关闭并应用。表示数据完完整整的进入到 powerba 当中来了,他已经脱离到和原数据的一个关系了,也就是说这个数据完全就加载到 poasba 软件当中来了, 当我们把它保存列成为的时候,就会列成为 pdix 文件,它已经脱离了和原数据人的关系。 数据刷刷新,刷新有两种,一种是刷新预览,另外一种是全部刷新。 刷新预览主要是刷新当前显示在数据区域当中的数据,而其他的没有在这里显示的就不会刷新。 比如说我导入的表如果是多个,那这里只有一个世界一,如果有世界一,世界二、世界三,导入了三张表,我选择世界一的时候点刷新预览,他只是刷新你在世界一当中的一个 数据清洗的一个操作,他不会刷新四点二、四点三。如果我们选择全部刷新,就表示将所有的表进行的数据都进行了一些刷新。 在这里需要注意的是, park carry 他本身是不能存手数据的,他其实就是一个虚拟的查询,仕途查询。所谓的虚拟的仕途查询是什么意思呢?就是我 park carry 导入了很 很多的数据的时候,我其实不是占用内存,是占用的是四 p u。 我在 powercre 当中处理了大数据,这些数据处理完之后,只有将数据关闭并上载之后, 那么这个数据就完全的进入了哈尔 bi s 套当中来了,和原数据已经脱离了关系。我们原数据 如果刷新了,那么帕尔菲亚你打开之后他不会跟着去刷新,因为他和原数据表之间已经没有没有关系了。 所以说 powercurry 当中的所有的操作都不会影响到原文件。如果玩原来的文件有修改,只要路径不改变,那么就需要手动的刷新查询,手动 手动的刷新查询,他会默认的严重原来的绝对路径进行刷新。 如果原来的原文件路径变了,你本来是原来是放在 c 盘,现在你放在 d 盘了,那么怎么更改呢?刚才讲到了数据源设置这里啊,把它的路径选择你文件所放所放的那个 d 盘的位置就可以了, 这是数据的刷新。那么这节课啊,作为一个对前面的内容做一个简单的回顾。好,谢谢大家。

大家好,我是云发教育和上西课堂的上西老师,今天我们继续学习数据清洗,今天要分享的是数据清洗的五大招。 首先是合并列和拆分列,合并就是将表中的多列数据合并在一起,组成一个新列,而拆分列刚好相反, 是将合并的列或者是多种信息的列,按照特定的规则分割成多个列, 我们以案例的形式来展示。打开 powerbi desktop, 导入数据,导入数据我们都是在 获取数据,这里,比如说我要导入一个 excel 文件,好导入发货明细表, 选择数据点转换数据。注意转换数据和加载数据是不一样的,转换数据他会进入 part b i query 界面,也就是 power query 编辑界面, 我这里要选择转换数据,转换数据他和加载是不一样的。转换数据就会进入 power query 编辑查询界面,也就是对原数据进行处理,所以是转换数据进入。 看一下这个标题,就是 power cury 变解器,在这里呢,对进行数据清洗,我们所有的数据清洗都是在 power curi 变解器这里 合并列,比如说我要将省份城市合并在一起,命命名为省份城市, 条件是选择省份,按下 ctrl 键再选择城市。 ok, 两个选中的情况下,我们要合并, 在转换菜单栏转换有一个合并列,合并他的分格符是什么呢?冒 号,可以通过冒号来分割,逗号等号自定义好,如果我们选择自定义,自定义是什么呢?一个特质号,新立明,如果不选的话,他显示与合并,我这里命名为省份城市。 合并省份城市合并就省,省份城市确定, ok, 就出现了省份城市。省份城市,这个是合并,那么拆分界呢? 相反的操作,单击这一列,选中省份城市,在转换这里找到拆分裂。拆分, 他主要是按照某种规律来拆分,比如说这里面如果有分格符,有冒号,有逗号等等,根据他的规律来选择。是分格符吗?我们这里一个地方是破折号,他应该就是什么分格符 好,分个符是什么嘞?是自定义啊,没有冒号的自定义,是这个破者号啊,破者号。那么下面的拆分的位置每次出现分个符的时候就需要去拆分。好,这下面还有高级选项,拆分,默认为拆分为列,拆分为列, 要拆分的列数是两列。好,这个下面呢,保持默认,我们确定, ok, 他拆分出来了,省份城市,省份城市拆分出来了,这个是合并列和拆分列。好,下面我们来看条件列,条件列是什么?是什么呢?当我们对列的处理 有进一步的,这个条件列是什么呢?就类似于一幅函数判断 这条件列,也就是说根据指定的条件,从某些列中获取数据并计算生成系列, 它类似于一个赛尔当中的依法函数。添加力,我们来看添加力, 条件列,选中条件列, 先利民,比如说运费,运费, 我们看一下商品数量吧,商品, 商品数量 啊,这个地方啊,商品数量分级,这个利民不能和我们现有的利民重复。商品数量分级,商品数量,比如说商品数量大于或等于 一千的时候, 也是五百吧, 二等于五百的时候,我把它命名为 u 大客户啊,大客户 还可以添加子具,比如商品数量 大于等于一百的时候, 中等客户在,否则的话呢, 还可以再添加。啊,还可以再添加我这里,否则的话呢,也就是说小于一百的就是小客户, 这个是义父的判断,五百以上这个是五百,一百到五百, 否则的话呢,就是一百以下小客户确定。 ok, 商品数量分级,这个就是对他进行分级,这叫条件列。 还有锁引列,锁引列是对表添加一个锁引,那么添加锁引的作用是什么呢?大家如果学了我后面的进阶课程,就知道这个锁引列其实作用是非常大的, 他会通过表的关联来引用数据,所以呢,我们来看一下,所以呢, 你看是从零开始的,零开始的还可以从一开始,如果第一行一般设为一,那就是从一开始。 ok, 这个锁引链也就是将它编号,将它编号 可以把它放在开头,把它放在放在, 可以把它移动。啊,移动的什么移动到开头啊?像我这个列数就比较多,鼠标直接拖动也是可以,但是列列比较多的话,一到开头就可以了。 ok, 我们可以把它命名序号序号。 ok, 这个是锁引链,这个锁引链其实做 非常的大,这个在后面的 ppi 季节课里面有讲到要添加,所以列 好。最后一个是自定义列,自定义列,也就是说当我们在实际工作当中,前面的添加列的方法不能满足实际的工作需求,可以使用自定义,自定义列的功能, 通过设置公式来添加新列,我们来添加列, 好,添加列,自定义,自定义列, 我这个表里面有干线运费,配送运费,现在需要求他的总运费,添加一列是总 运费。好,新列名总运费,我取名为总运费,那么自定义列的公式是什么呢?是干线运费插入加上配送运费, 两个运费相加就是总运费了。好,确定确定,如果有语法的错误啊,这个地方会显示检测,检测出了错误,这里未检测到语法错误,我这个公式是对的,确定 ok, 这个就是总运费,他们两个在相加, ok, 对列的处理啊,一般是在转换和添加列,这里转换,这里有转至返转行, 这前面讲到了包括力透视,还有拆分裂,添加裂来,主要是条件裂、所有裂,重复裂以及自定义裂。 ok, 那么关于对于列的处理五大技巧啊,今天就讲讲到这里,谢谢大家。

各位小伙伴大家好,我是普华比亚检验派的杨老师,这期我花三分钟时间讲解一下多列的合并查询,我这边准备了两份清单,一份是总人数,近二十年总人数, 总人口数,那么还有第二分,那是人均可支配收入,那我们现在去需要分地区跟分年份,分别把人均可支配收入的这三类数据匹配到总人口数量这里面去 这个表当中,但我们怎么做?同样的是点击我们的合并查询,点击合并查询,但是我们现在就不同了,之前我们只点一列,现在需要点两列, 按住抗九可以多选你的力,但是必须按照顺序,你可以看到后边生成的一和二,他是按照顺序进行匹配的,那现在我选择另外一张表,人均可支配收入, 选择地区,选择年份,按住 ctrl 我们多选,选择过后就会看到下面已经完成一个匹配了,点击确定,就在右边深深的一个表,那么把这个表展开 前缀,不要不要我们地区跟年份,只要我们的数据点击确定这个导入对应的一个情况,我们照应一下安徽省二零二零年他的全体人均可支配收入是二万二万二万八 二八幺三幺零三二八幺零三,那么这个数据就是正确的,那这点就可以完成一个匹配了,如果说你是用的三粒四粒,你都可以用这种方式去按照顺序选择多个列,然后第二个表按照多个顺序选择,啊 啊,多个力,那么这样你就可以匹配了,但是这里我们选择的数目不相同,以及匹配的不相同,他就会是零行,就没办法匹配出来,所以这个自己要提前啊,确定好我们的一个自断, 好,这就是我们这期的内容。那如果需要课程当中的一个清单的话,可以在我们公众号里面搜索对应的一个信息,或获取我们的一个自然的功效文件,加。

嗨,大家好,我是寇比晨,这一节课呢,我们给大家分享的是 powerpi 中啊数据结构的一个转化处理, 那我通过使用 popbi 啊,或者说是我们这个 office 三六五里面带的这个 popary 这个工具,帮我们去实现这样一个数据结构的转换处理。好,我们先看一下我们今天给大家准备的这个实力。 好,这个视力呢,是一个会员朋友提出的一个疑问啊,提出个疑问就是他想做数据分析的时候呢,哎,他把是他目前的一个数据结构呢,是我们左边这种形式, 那这几个 matrix, alt 和 forecast, 那这个订单和这个预测,呃,在我们的行上面,然后呢上面呢是时间,然后中间是直,然后他最终使 实现的一个需求是希望,是啊,这个上面啊列上面是有伊尔 month 啊,然后呢是奥德有多少金额,福克斯就多少金额。然后通过把这样的一个二维的一个结构的数据转化成我们这种一维的这种表格的形式,然后呢实现这样的一个 数据的透视,那这样去做分析就很方便了,对吧?好,稍微放大一点。那我们这样一个数据转换的一个结构呢?在 excel 或者在 powerba 里面呢,我们都是用抛 cara 来实现这样一个简单的数据清理 好。呃,而且呢,我们在 poco 里面有很多数据清洗的工作呢,都是能够通过图形化界面去点击我们这里面的一些按按钮,就可以去实现这样一个复杂的需求。 ok, 那我们一起来看一下我们准备的视力。好,这个呢就是我们的数据源,那数据源呢?我们把这个数据源呢插入到我们这个呃泡块里面去,那来自于我们表哥里面的区域,我之前呢已经有插入过一次了哈, 嗯,我们已经进入到了我们 pocry 的这个后台这个编辑器里面去了啊,之前呢是我们已经超过了一次,超出过了一遍,然后呢我们就用这个表格再给大家去演示一下。 首先呢我们拿了这个数据以后,我们第一步就想到了是要去给他做一个啊力透视,把它全部转换成我们这样的一个啊转,把这个日期转转换到我们的 上面去,那我们选择我们这一个 metrics, 然后呢在这个转换的地方 选择,我们这里面有一个立透式,我们选择呃立透式其他列。好,这样子的我们就形成了三个列,三个列的第一个就是我们的 mattress, 第二个就是我们每一个月份所对应的它的一个值。 啊,这个时候呢啊,我们还没有结束,我们希望是把这一个地方呢啊做一个拆分,因为我们看他的需求是要转成 有年有月,对吧?那首先呢我们在这个地方把它改成日期的这种方面这种格式,然后呢我们在这个添加练的地方重复练好,这样的操作呢就是为了我们把这里面提取出 他的年份,这里面提出月份形成一个年月他这样的两个列,我们选择这个属性以后呢在这个转添加内这个地方有一个日期,对吧?那我们选择这个年,那这样子我们就啊得到一个年份了,其实其实我们这个地方就可以删掉了啊, 好,这个地方其实我们可以不用复制一点啊,不用复制点,我们试一下啊,年份啊,年 啊出来连,那就是我们在在这个基础上直接可以生成连,对吧?然后呢再选择一个属性,然后这个地方选择越, 哎,那就联合月都有了,对吧?那我们这个,呃,可以是把这个属性就不要了啊,过河拆桥,那我们就把这一列给它删除掉啊,删除,那这样子我们就得到了我们所 需要这些裂缝,这些裂,其实我们可以把这些裂的给他再调整一下顺序,比如说我们把这个纸,我们按住孔处键,可以把它拖到最后面去,对吧?然后这样子呢,我们就看到比较符合我们这样的需求, matrix, 年和月份。 然后这个时候呢啊,我们需要做一个数据的透视,数据透视呢,其实很简单,我们就需要把 matrix 放在我们的列上面去,然后呢?呃,行,上面呢就是我们的年和月份就不变。然后呢值呢?就按照这一个年份和月份,还有上面的列上面的 matrix 他做一个汇总。 那实际他的一个形式啊,就就像我们的数据透视表里面啊,把这个字段拖到我们列上面去就可以了。好,怎么来做呢?我们首先呢是选择我们的 matrix, 好,这里面有一个转换,选择我们的透视, 嗯,直的列呢,我们是选择了 值,就这个值就可以了。 ok, 点击确定。那这样子呢,我们就把呃年份和月份作为我们的行。然后呢这一个 oder 和 forces 呢,就做到我们的列放在我们这样的一个列上面,就相当于是我们的一个数据透视了,一个透视, ok, 这就是我们的透视链,然后呢这里面就形成了我们年份月份,然后这个是我们的 order, 这个是我们的 forecast, 然后我们再需要去做一些计算的话,我们就直接可以去拖拉拽去做数据的透视 啊。做完了之后呢,我们选择这里的关关闭并啊上载,他会把我们的数 给大家加载到我们 excel 里面来,那这个的操作呢,也可以在我们的 powerba 中去做啊,因为啊这个会员呢提供的是一个 excel 的数据源,那所以呢,我们在 excel 里面去给大家去做这个演示。好,咱们这节课呢先到这感谢大家的聆听,谢谢。

各位小伙伴大家好,我是波尔逼来检研派的杨老师,我们这期讲五到第八,二到第七个的一个功功能,因为后面三个比较多,然后我们讲一下,首先第一个删除力,嗯,那么跟我们删除行,保留行是一个意思,我不要客户名称,直接删除这一行。 那如果说我管理力选择哪一列,选择哪一列去做 啊?选择哪一列?直播流看应该是客户号啊,直播流的客户号,那么这个其实也是也也是一个逻辑,我也可以反着过来, 他在这里边叫做保留行,选择保留哪行,那其实也可以点击右键删除其他列啊,保,保留哪一哪一列,那么现在就是删除其他列,一样的,我就只保留了我选 动力,那么这是这是第一个我们的一个删除力跟和删除其他力或者保留力,就是这样的一个逻辑。那么现在还有一个填充力,填充力的意思呢?我们就就我们按照我们用,我看我们用哪一个表 来一个记录,我们比如说你这个退货时间,退货时间部分有,数据部分没有,那我们怎么做把它填充起来?比如说我这一列数据都要填充上,都要填充这个数据, 或者填充升,填充升下面有的这个数据,那我就可以点选中这一列转换里边有一个填充,他展开是一个填充的字样,因为我现在格式比较小,所以他没办法展开显示文本就是这个按 按钮向下这个箭头,如果说是向下就可以看到刚才最上边只有一个是这样的,那么下边是这个数字,那我现在还可以向上 上升的话,上边就是所有都是四万三,四万二千三百五带这个数据,那么过于四就是上上下下填充,你要到什么数据就要填充,这个其实是在我们的啊,有一些表格上他要用 和平单元格,我们人工做的是和平单元格,那你导入 prvi, 就顺应上向向下填充去把数据填充起来, 那么这是第啊,这是第二个,第三个转换格式,转换格式其实还是以我们的这个日呃时间为例,我们可以把它转换成年,就是你不需要月跟日,你也可以用这种方 方式去完成。那么提取年,提取日还可以提取日,这个跟刚才是一样的,那么这里还可以提取一个周,每某一年的某一周或者说是日, 一个月某周,或者说我们这应该是有个星期开始之啊,这个星期开始是哪一天,然后结束是哪一天,这些 啊都是可以的。那还有一种,你如果说不想在这一列进行变化,我可以在啊这个这个添加里面啊,选择这个日期添加一个新率,他就会在后面添加一个作为年的年的数据。那么我们的一个下单时间我 再去选择,再去选择日期,日期当中的一个月你就可以添加一个月份啊,那么这就是第二种。第四啊,第二种那个方式我们还可以添加周, 我们遇到周,那这个你不用写什么沃沃克的一个沃克队啊,公司啊,你去去做一个周的一个计算啊,你可以直接选择点击按钮就可以解决这个问题。那这三个内容就是本期的一个啊清洗功能。

这样我们就实现了通过使用 power b i 来达成了一个对完成率的深入分析的过程。 这节课我们以任务完成率的分解殊途为例,来介绍如何使用 power b i 在几分钟之内实现从原始数据到可视化图表的制作过程。我们首先来看一下数据源, 数据员,包括有一张销售表,他记录的是每家门店在每天的这个销售额, 然后是一张任务表,他记录的是每家门店占每天的任务额。然后是一张日期维度表,还有一张是门店的信息表以及一个区域的信息表。 然后我们来打开一张空白的 parabell desktop 文件,首先是获取出去,我们点击 excel 工作部,然 然后点击安利数据,打开,然后选择我们需要加载的数据员,包括有 t b 门店,然后 t b 区域, t b 任务,还有 t b 日期及这个销售。然后我们这边选择是转换数据, 我们进入到盘玩块位的界面,在这里对数据来进行一个必要的清洗。我们首先来看一下 tp 销售,这里面的数据都是规范和干净的,我们重点来看一下每一列的它的一个数据类型。首先是这个吊牌价,数量和金额,这三列他们都是整数型的,然后 是这个日期列,它是日期型的,也都没有问题。然后再看一下这个日期表, 日期表的日期列他现在是一个整数型的,我们需要把它改成是日期型的。我们在这边来选择日 七来替换当前的转换,然后其他的字段它都是一个整数型的, 然后月份名称是文本,这边是没有问题,然后再看一下这个任务表,这里面日期列是日期型的,然后任务列是整数型的,没有问题,然后区域表当中 这个序号是整数型的,其他的都是文本。然后再看一下门店表,他的开业日期和车店日期都是一个日期型的,然后 这边的门店面积和店员的标配人数都是整数型的,也没有问题。然后我们现在是关闭并应用把数据源来加载到 power b i 当中。 数据源加载到 power b i 以后,第一步需要建立保健关系,我们在这边选择这个模型视图, 然后在表间来建立关系。我们这边这个 power b i 已经自动的为我们建立了一些关系,我们来看一下他所建立的关系是否正确。首先是这个销售表和门店表,他们是通过这个门店的 id 来建立的关系, 然后这个任务表和门店表也通过门店 id 来建立的关系,然后这个门店表和这个区域表是通过这个城市的字段来建立的关系。然后我们还需要这个日期表和 这个销售表及应用表来建立关系。我们这边简单的对他做一个排布, 把这个事实表放在中间,然后把维度表放在四周, 然后我们在日期表和这个 qq 表之间来建立关系,是通过这个日期列, 同样这个日期表和业务表也通过日期列来建立关系, 这样我们关系就建立完成了。然后我们返回这个报表视图, 我们首先来新建度量值,我们先建立一个销售额的度量值,点击新建度量值, 然后是销售额, 等于 sam 对这个销售表当中的金额字段来求和, 然后再建立一个任务的度量值,再点击新建度量值 任务等于 sum 使任务表当中的这个任务值, 然后有了销售额和任务以后,我们再建立一个任务的完成率,我们再点击新建度量值,使销 完成率等于是 diy 的是一个安全的除法函数,然后分子是销售额,分母是任务额, 那这样我们就建立了一个完成率的度量值,然后把这个度量值改一下它的一个数据类型,它应该是这个百分比的类型, 然后我们就可以对这个完成率来进行一个深入的分析,我们在这里来点击这个分解数图, 首先在这个分析的这个框下面,我们拖入这个完成率是我们要分析的一个指标,然后 这个解释依据,我们需要拖入一些分析的维度,我们首先可以在时间维度上来进行一个分析,我们把这个日期表当中的这个月份名称啊拖入到这个解释依据里面,然后我们才可以通过这个 从区域来分析,我们把这个区域还有省份还有城市都推入到这个解释依据里面,然后我们在这边 就可以点击这个加号,我们首先可以选择第一层分歧的维度是这个月份的名称,我们点击月份名称, 这样我们可以看到我们这四个月的完成率一共是百分之一百零三,然后完成最好的是三月份是一百一十一,然后最差的是四月份 是百分之九十七点八二。然后我们再可以进一步的分析,比如说可以看一下四月份里面到底是哪个区域他完成的比较差,我们这边来选择区域, 这样我们可以看到在四月份里面主要是营销二区他的完成率会比较低一些,然后我们可以再进一步的看一下这个营销二区里面他是哪些省份是做的比较差。我们再点击这个省份, 这样我们可以看到二区里面完成最好的省份是福建省,然后最差的省份是广东省,是百分之七十七点一七。然后我们再可以继续的看一下广东省下面是哪一个城市他完成的比较差。 我们点击城市可以看到这里面主要是深圳市,它的完成率 比较低,只有百分之六十点八八,然后珠海市还是不错的,他的完成率是百分之一百零一点零三,这样我们就实现了通过使用 power bi 来达成的一个对完成率的深入分析的过程。