当业务数据完成合并和去重之后,大多数数据就可以直接分析了。不过在分析之前还需要完成列数据类型设置,以便在分析计算中得到准确的结果。先看数据类型的设置, 在右侧选择任何一个表,点击鼠标右键选择编辑查询。进入 power query 工具,选择宝贝报表,看到其中的数据,注意列名前面的英文字符 a、 b、 c 表示的就是文本格式。 power query 中的数据格式可以分为三类,数字类、日期时间类。文本类。 不稳值,偶尔会用到二进制值,基本用不到了。修改列数据类型也非常简单,订单创建时间是文本格式,但其实是日期时间格式,所以点击列名称前面的字符图标, 从下拉的类型中选取即可。价格一般来说会有小数,这里可以用小数格式,也可以使用定点小数,规范的显示金额。 现在列的数据格式已经修改完成,点击关闭应用就可以到分析界面了。 创建一个矩阵用来显示数据结果。使用宝贝报表中的数据, 将订单创建时间拖到行,可以看到日期被自动细分为季度、月份、日, 再将要分析的商品类别拖到列,最后将购买数量拖入值,就可以得到按年、季度、月、日每个商品类别的销量数据。 如果数据类型没有设定准确,那么你可能得不到预期结 结果。在这里也可以修改数据类型,可以不进入 powerprint 工具中修改。将订单创建时间修改回文本格式,矩阵中就看不到汇总的结果了。 将订单创建时间改回日期时间格式 重新拖入行汇总的数据,结果又出来了, 如果将购买数量修改为文本格式,那么结果就不准确了。数据类型改变后, 重新将购买数量放入值,就可以完成错误修复。可以看到的是,购买数量没有实现正确的计算。 将购买数量的类型修改为整数,重新拖入值,结果就显示正确了。 设定了数据类型,还可以设定数据显示的格式, 就在修改数据类型的旁边位置,需要时可以选择指定显示格式,设置数据格式的操作就结束了。如果视频内容对你有参考价值,还请点赞和关注哦!
粉丝672获赞3588

你会不会也想做出这样这样,还有这样的可视化图表呢?那今天就让我们一起来看一下,数据分析师的 poverb i 应该长得到什么程度?哈喽,大家好,我是你们的冷凡社长。我们先回答一个非常重要的问题,学习 bi 工具的必要性是什么? 首先, b i 工具是数据分析师必会的一个技能,目前市面上比较普及的 b i 工具并不多,一只手就可以数的过来, 那 powerbe 后来者居上,成为了目前行业里面的老大哥。就算你不是数据分析师,如果日常工作中你和数据打交道比较多,那会一个 bi 工具也是非常有利的竞争力。虽然我们这代人精通一个赛奥的并不多,但是会一个赛奥的却不少, 那 bi 工具就可以成为你的一个杀手锏。有些同学可能没有听过帕尔 bi, 那在哪些场景下他可以发挥他的价值呢?他是专业 做可视化看板的工具,就像我们开头展示的图表那样,他也非常擅长进行探索性的数据分析,也可以将可视化进行自动化。你可能会想,这些内容以下也可以做的到呀!但是 popi 更简单,更高效,更强大,专业的事情就要交给专业的工具, 而且 powerba 的建模能力非常强,非常适合做一些复杂的数据分析。当然, powerba 的核心人是商业智能分析,提供业务价值。下面讲一下我们具体要学的内容,可以分为三个部分, 分别是 part core 可视化 dx 语言。第一部分 part core, 它是用来连接和处理数据的,可以理解为数据分析的清洗工具, 他的清洗操作通过工具栏中的图形化操作就可以完成,非常简单。而且你清洗数据的每一步他都会自动帮你记录下来,这也是实现自动化非常关键的一步。他支持连接 excel、 csv 和买 ceco 以及市面上绝大部分的数据库,而且他和一个赛道中的 pro q z 基本是一样的,相当于说你学一个工具就可以在两个地方使用。听起来是不是相当的棒, 那它使用频率非常高的几个功能有三处,重复值、提取、替换、清除、修整、添加、制定一列将第一行运作标题以及逆透式。在遇到比较复杂的清洗动作时,花儿科瑞也支持 m 语言来进行清洗,但是社长不推荐大家早期学习 m 语言,因为绝大部分的时候我们是用不到它的, 所以在早期他的头产出比是不高的。然后就是可视化,如果你是使用多张表进行数据分析的话,你首先需要使用关系来建设好数据模型。 在学习初期的时候,这一步并不复杂,然后就可以使用官方自带的图表或者第三方图表来进行可视化。常用的可视化图表有卡片图、柱状图、折线图、气泡图、 图、地图和句型数图,还有子弹图、象形图、文字云等。第三块就是 dix 语言的学习, dix 语言看起来和 excel 的函数差不多,但是它的能量却是非常巨大的。使用 powervi 做数据分析,他最厉害的就是度量值,而度量值就是使用 dx 语言来创建的。 d x 语言并不复杂,在早期入门的时候比较简单,但是随着学习的深入,它的难度也是阶梯式上升的。关于 d x, 我们需要重点学习的有开 q, let e f filter, sumred on divide 以及几个常用的聚合函数等具体的函数。 另外还需要理解几个概念和机制,比如筛选上下纹、含上下纹、迭代气表函数等,再复杂的就是变量调节器、计算组、高级关系等。当你学到一定程度,需要深入学习 dnx 的时候,社长推荐你看这本 dx, 全为指南指示,讲 dx 语言就 已经有接近七百页的体量。关于其他方面的话,就还有一点点细节,比如如何发布到服务器,让同事可以在浏览器上就可以查看和操作数据。比如如何使用网关来实现真正意义上的自动化。再比如如何调整格式和配色,让作品不仅好用而且好看。 和之前 excel、 cico、 潘胜应该学到什么程度来比, part 边好像学的内容会比较多一些,但即使你是新手的话,也不需要太担心,其实你只需要掌握 part 边很少一部分内容, 就可以用它来开始工作了。当然想要非常出色的使用的话,要学的内容还是比较多一些的,但是这些投入都是值得的,因为是我们核心竞争力之一, 出色的工具可以让我们的数据分析工作如虎添翼。好的,以上就是这期视频的全部内容了,关于下集的话,我准备讲一下数据分析师的 tm 六应该掌握到什么程度,非常感谢!你可以看到这里,社长会把卡 都展示着可视化图表的链接放在置顶评论里,感兴趣的小伙伴可以去查看并体验一下这个作品,如果你觉得这期视频内容有用的话,欢迎给收藏点赞,收藏加转发,谢谢大家,那我们话不啰嗦,下期视频见。



哎,今天大家给大给大家分享一个如何在我们这个 pobe i 里面去。呃,插入啊,这是在 ppt 里面插入我们 pobe 的这个嗯,数据,然后给他展示出来。那我们现在已经是实现了这个功能啊,我们把它 拉起啊,对齐到我们的皮筋里面去啊,把它拉开,你铺下来这一个呢,在我们的皮皮筋里面呢,这样可以去动态的去展示,非常的方便啊。 好,怎么去做呢?呃,因为这里面涉及到一个功能,就是说要把你这个做好了,抛抛别人的这个文件呢,要上传到,上传到他那个服务上面去,也就说你需要 需要。呃,把你的文件做好了之后呢?嗯,你要把它发布发布啊,这里有个发布发布到 popi, 这就是他的抛标发布那个抛标就是发布到微软那个公有名的上面去啊,把那个处存储啊,这里面需要你用你的一个邮箱,你要去注册一个啊,如果你没有账户的话,你去注册一个,注册完了之后你登录,登录 之后呢,你就把你的报表上传,上传之后呢就是生成一个这样的一个链接啊,这样一个链接, 那我现在是有一个链接,这就是我之前做的一个报表。 ok, 那你就把这个报表呢这个链接复制下来,复制下来之后呢,我们到我们的 ppt 里面来,到我们 ppt 来呢,我们一起看一下啊,这是我之前已经做好了一个啊,我们再插入一个 ppt 啊,插入一个幻灯片, 然后呢?嗯,在我们这个 ppt 里面有一个插入,插入这里面有一个, 呃,我的加载项,我的加载项这里面呢有一个,如果你没有的话,你在应用商店里面去搜一下,叫 wifi pur, 好,收了之后呢,就把它添加就可以了,因为我已经添加了,所以我就不重复添加了,我就不重复添加了啊,然后呢你在这里面点击,他点击无奈比尔点击 添加,然后在那个界面就会出现一个 wifi 这个窗口。好,在这个窗口里面呢,我们把我们刚才复制的 url 这个这个链接靠近过来,后面那个前面那个 hpps 两个 很大啊,我就不需要了啊,这个两个三号线我就不需要了。然后呢点 praby 啊,因为我的这样网速比较慢啊,如果你 网速比较正常的话,就会快速加载出来,像我这样啊就很快的加载出来啊,可以在里面去做动态的展示和分析,这都是没问题的啊。啊,我这里面有点慢,还在加载 这里面呢啊,我就不给大家去展示这个加载过程了啊,这个加载出来就是这样子啊,因为我这边已经加载好了,然后这个过程呢就非常的简单,只需要把你最主要是把你的一个呃分析的结果上传到我们这个微软的这个公共云上面去 这个云服务上面去啊,把你的账户啊,你需要申请一个账号啊,申请账号,然后把你的报表上传上去,然后那个报表申请一个链接,然后呢就到我们的这个 wordury 把我的身把它 wordury 里面把我们哎,好像 是一块生成的啊啊,考虑到这个链接就可以啊,在我们的 ppt 里面展示了,非常简单。

各位小朋友大家好,我是托尔比亚检验派的杨老师,我们这期录制最后三个,呃,常用的数据清洗方法。第一个自定义力,自定义力就是我们如果说这个表格里面有一例是你需要添加的,那么你添加的内容是什么?比如说我这里是授课, 授课老师, 那就统一文本,下面 需要双引号,就是杨杨老师,你如果本名是杨昭君,认识的人都都应该知道我名字,那么就是杨杨老师。那所有这个表,每一例每一行都会有杨老师, 那么我们也可以去添加一个数字,比如说我们杨老师的年龄是三十一岁,点击一个确定,这里因为是数字, 这个是你不需要添加创意号,直接点击确定输入数字就可以了。那么就是第一个添加自定义链, 我这里不建,不建议你添加太太复杂的,比如说你在这里面写什么衣服模式,呃,我们图尔标里面有一个自带的条件力,就是我们店的那种条件力,比如说我们以 啊课程为例,直接写个定价,我们不去,不去做和平查询的话,我知道定价,那我就课程名称等于托儿 bai 入门课程,那么就是四十九元,那我还可以以课程定价一二三。另外一个以课程名称 包含进阶,你可以不用把它输全,你只输一部分,就是有一个包含,它包含某个字, 你就可以确定还是你就可以说出对应的内容了。那么你确定可以看到现在我们的这个进阶?我们筛一下 三十拳过后,我们的音节全部都是九十九元,另外一部分就全部是四十九元,所以这个啊里面的这个包含是非常好用的一个东西,就是你只需要包含一个字, 他都可以去做。比如进阶我只需要有一个字,那也可以是九十九元,其他的就是啊,零元我们没有了,就是零元,那就可以看到这九十九零就做出来了。 好,第三个我们的逆头石头,哈,我们需要添加一个新表,这个情况的特殊哇,我看准备一个逆头石的表格, 我们先看一下这个绿透视的表格,他加载进来其实是有三点信息,课程、境界课程啊、课程名称啊,我们的境界课程、入门课程。这个其实就像我非常类似我们平常做的透视表, 那么现在我们需要把它转换成一维表,因为一维表是什么?就是他都是一列一列去做的数据。但是这里虽然是一列,但是其实他是列列标题跟行标题去做的检索。就比如说是艾系, 他在进阶课程里面没有买,在入门课程买了一课就是一,他其实是其实是透视表的,行跟列都有数据,这这就不是异味表。同时这里还有一个,呃,我们我觉得应该有个总计,对,做一个总计,那我们不要最后一行,不要最后一行,把最后一行总计 删除了啊,就没有没有总计了,那我这里就不去再呃详细展示,那现在我需要把它转换成意味表,意味表还有逻辑,就是每一列自断的信息尽量不要重复,其实这后面两个内容他们是有重复的,他们可以把它归为一类, 是什么课程,课程分类,那么就会说课程名称,课程名称是进阶课程,入门课程,那其实是可以作为一列的,然后再有一列就是你对应课程是否购买了就比较积极,没有买完就是控制。那现在我们把它转换成一个 啊,一维表就是选中这两例,在转换当中会有一个,这个一头是你们的。嗯,图案标打开的话,大的情况下是有这个文字的,但是我这里为了方便展示, 我们就把它说起来是这样的,一个图标叫一头十,直接点击一头十粒,大家可以看到我的所有表格全部就改成五幺的东西,这一类是分类,课程 分类,然后这这一个是是否购买,我只要是有意的就是更买他的,那这就是我想要的东西。好,这里就就已经完成了这一步,那我还可以反着过来把泥头石删除了,我们不选这两列,选一列直接可以 逆透是其他力,这跟我们删除保留行,保留行是一个意思,那么就是课程分类, 这也是是否购买,然后为什么要这样做?就是后续你如果说做带个自动式的话,你不去这样做,你要 退回到前面这一步,你是有两列数据需要进行一个求和,然后你还要把这两里加在一起,如果说是五列数据,五个门,五门可是都这样展示,那你要把五门课程分别先做个萨姆,然后再去用萨姆,加 啊加啊,在求和,单个公司在求和,然后总和公司在求和,这个效率就会非常低。但是如果你按照你头饰的方式去把它调成一律,下面我五门客只能分类在这里,五门客车适合购买,对一个一定价,有一个区, 那你只需要写一个公式就可以完成了,你十轮课、一百分课都可以这样快速的完成。所以这个也叫结构化的数据,我们看似前面这个是结构化,但实际并不是结构化。结构化的数据有要求就是每一列的数据是唯一的,还是尽量 进行一个最低的分啊,最低的维度,而且不重复的啊?那这是我们十种常见的一个数据清洗的方法啊。那如果需要对应的资料的话,也可以关注我们的公众号去啊,搜索对应的一个评论,完成这样的过程。

想做数据分析的同学基本了解我们是需要会议门 bi 工具的,那 pover bi 和汤姆柳作为两个经常看到和听到的工具,我们应该选择哪个来学习呢?哈喽,大家好,我是你们的冷凡社长。 这期视频是让从七个方面来对比 party 和 table, 从而帮助大家来判断你更需要的是 party 还是 table。 这里提醒大家一点,下面所有的内容呢,仅代表我个人的学习和使用体验,如果和你的观点有所不同,欢迎到评论区客观的讨论交流建议。有些同学的时间比较紧张,那我这里先直接抛出结论, 通过对比打分, powerbi 得三点五分, time6 得二点五分。如果你是一名数据分析师的话,那社长推荐你先学 parobi, 然后再学 time6。 如果你是运营等业务同学,社长推荐先学 time6, 当 time 六不够用的时候再考虑 partibei。 那我们下面进行一些细节的对比。第一个是连接数据员 方面,这两个工具都支持一个 clcsv 和众多数据库的连接,在这个环节打成平手都不得分。第二个方向是数据清洗, poverbi 的清洗工具叫 poverq, 他的功能强大,上手简单,与 bi 的集成性高。 w 的清洗工具叫 wprow, 它的功能也相对完善,就是和 w 的继承性不够高,在使用的时候有种割裂的感觉,在数据清洗方面抛而不爱,得一分。第三个方面就是关系建模,当我们想对多张表进行数据分析的时候,需要首先将它们关联起来才可以。 porby 通过关系可以将多张表关联,也可以额外建立辅助表,唯独遗憾的就是他不支持多个字段相互连接,他不留也可以连接多张表,而且他支持多字档连接,但表遗憾的就是他没有办法很好的建立辅助表,所以在关系建模方向, porby 得零点五分。第四个方面是可视化图表, 在这点上他们就支持行和列分别的分组,也支持多层次的分组,而且他的图表元素都是相对自由的,可玩性很高,那 powerbi 在这方面就没有什么优势了。鉴于可视化分析的重要性,这里他们就可以得到两分。但是 powerbi 支持大量的第三方图表类型 w 由于组建模块化了,就没有第三方图表这么一说了。那在这个角度上, polerbe 还可以得零点五分。第五个方面就是度量值建模。 哈尔 bi 由于 dix 的存在,基本上我们能想到的他都是可以实现的,能力是相当的出众,但他的学习难度也是比较高的。他们留也有表计算和唠的表达式,一些比较复杂的分析也是可以实现的,就比如 rfm 模型, 这两个 b i 工具都可以实现,不过相比之下还是 part b i d x 更强大一些,所以这部分 part b i 得一分。第六个方面是数据看版, b i 工具本身就是专业做 可说话看版的嘛,所以他们俩在这方面都没有什么问题,无论是制作的自由度,还是图表的交互筛选,他们都是没有问题的。那我个人更喜欢的呢,是用 poloby 做可说话看版,但他们俩本身是没有什么太大差别的。另外他们还有个模块叫故事,在一些场景下他可以发挥一定的作用, 所以在这方面我们给他们六零点五分,那 power 边的免费账户就可以把图表上传到服务器,并通过链接发给你的同事们,而且这个过程也是可以做成自动化的, 只是每天有八次的更新上线,那他们六在这方面就会弱一点。他们六本身就是收费的,虽然说在某宝上可以以每年几十块钱的价格拿下,但是上传服务器这个动作还是不好实现,所以在这方面可以给 parabel 点五分。 为什么开头市场建议数据分析先学 popp i, 再学 tw, 而对于业务同学却是相反的呢?首先可以明确的一点是,他们的上述难度都比较低, 对于小白来说都是比较友好的。 prbi 对于数据分析师来讲,最大的优点在于全面,作为数据分析师来讲,我们所使用的 bi 工具应该可以承接更全面的需求,而不是说我工具实现不了, 那这个需求我就不接了。那对于业务同学来说,最重要的是数据可视化的分析能力,以辅助他做出更好的决策。而且业务同学处理的数据表一般都不复杂,基本上也不需要做太多的清洗和整理,那在这个时候他们就是更具有优势的,这里讲究的是 适合的才是最好的。在上上期 part 边应该学习到什么程度的视频中上上忘记讲了一个点,在这里补充一下,如果你在工作中有将数据做成可视化看板,并分发给你的同事使用的场景, 那社长推荐大家使用 poverby pro 的国内版,这个只能付费,一年大概不到八百块钱的样子,但是国内版连接打开的速度大 大概在一到二秒,而国际版打开的速度一般在三十秒到一分钟之间,那为了更舒服和更高效的工作体验,花一点钱也是值得的。以上就是这期视频的全部内容了,如果觉得社长的内容有用的话, 欢迎给市长来一个点赞、收藏加转发,谢谢大家!大家有问题可以在评论区留言,那废话就不多讲了,我们下期视频见。

各位小伙伴大家好,我是波尔逼来检研派的杨老师,我们这期讲五到第八,二到第七个的一个功功能,因为后面三个比较多,然后我们讲一下,首先第一个删除力,嗯,那么跟我们删除行,保留行是一个意思,我不要客户名称,直接删除这一行。 那如果说我管理力选择哪一列,选择哪一列去做 啊?选择哪一列?直播流看应该是客户号啊,直播流的客户号,那么这个其实也是也也是一个逻辑,我也可以反着过来, 他在这里边叫做保留行,选择保留哪行,那其实也可以点击右键删除其他列啊,保,保留哪一哪一列,那么现在就是删除其他列,一样的,我就只保留了我选 动力,那么这是这是第一个我们的一个删除力跟和删除其他力或者保留力,就是这样的一个逻辑。那么现在还有一个填充力,填充力的意思呢?我们就就我们按照我们用,我看我们用哪一个表 来一个记录,我们比如说你这个退货时间,退货时间部分有,数据部分没有,那我们怎么做把它填充起来?比如说我这一列数据都要填充上,都要填充这个数据, 或者填充升,填充升下面有的这个数据,那我就可以点选中这一列转换里边有一个填充,他展开是一个填充的字样,因为我现在格式比较小,所以他没办法展开显示文本就是这个按 按钮向下这个箭头,如果说是向下就可以看到刚才最上边只有一个是这样的,那么下边是这个数字,那我现在还可以向上 上升的话,上边就是所有都是四万三,四万二千三百五带这个数据,那么过于四就是上上下下填充,你要到什么数据就要填充,这个其实是在我们的啊,有一些表格上他要用 和平单元格,我们人工做的是和平单元格,那你导入 prvi, 就顺应上向向下填充去把数据填充起来, 那么这是第啊,这是第二个,第三个转换格式,转换格式其实还是以我们的这个日呃时间为例,我们可以把它转换成年,就是你不需要月跟日,你也可以用这种方 方式去完成。那么提取年,提取日还可以提取日,这个跟刚才是一样的,那么这里还可以提取一个周,每某一年的某一周或者说是日, 一个月某周,或者说我们这应该是有个星期开始之啊,这个星期开始是哪一天,然后结束是哪一天,这些 啊都是可以的。那还有一种,你如果说不想在这一列进行变化,我可以在啊这个这个添加里面啊,选择这个日期添加一个新率,他就会在后面添加一个作为年的年的数据。那么我们的一个下单时间我 再去选择,再去选择日期,日期当中的一个月你就可以添加一个月份啊,那么这就是第二种。第四啊,第二种那个方式我们还可以添加周, 我们遇到周,那这个你不用写什么沃沃克的一个沃克队啊,公司啊,你去去做一个周的一个计算啊,你可以直接选择点击按钮就可以解决这个问题。那这三个内容就是本期的一个啊清洗功能。

这就是无氧泡泡边官网下载泡泡边的一个网页,我们可以通过这个网页简单的了解一下泡泡边,然后我们一直往下拉,一直拉到最下方页面的最下方,我们会看到有下载 啊,我们在此呢,可以下载威远的 powerbead destop, 我们前面说过 visonpowerpie destop 是完全免费的一款软件啊,然后我们单击 powerbeat destop, 然后选择免费下载。当我们选择免费下载的时候呢,他可能会提示你啊,需要 尝试打开啊, max off 的十套,如果我点击打开,他就会通过微软的应用商店来去安装这一款软件啊,应用商店安装的 po 边呢,他支持更新功能啊,这个安装呢就比较简介,我们就不在此讲解了,因为你直接点击打开,他就会自动下一步,下一步完成安装。 power 边,那我们可以啊,通过查看啊,选择性的安装我们的三十二位或者六十四位,我们可以查看 下载和语言选项。点击啊,你可以翻译你的页面,也可以不用翻译,然后我们就可以从这个地方选择简体中文版点击下载,然后我们可以选择刚才我们通过查看你的系统是三十二位还是六十四位的啊,我呢就选择 我的系统六四位的,然后点击下一步啊,如果你的电脑有安装一些下载软件,像我, 我的有迅雷软件,我们可以通过迅雷安装选择我们桌面,点击 立即下载。好,我还是呃使用这个迅雷安装,然后我们重新下载。 完成抛边的下载之后呢啊,稍等一会,在我们的桌面上就有抛边带,靠谱,如果你没有安安装这些下载工具呢啊,他可能用浏览器自带的下载,然后下载完了之后呢,就在我们的浏览器,不同的浏览器他不一样,在下载的这个框里面可以找到你的 哈尔滨 stop 啊,我现在使用迅雷下载呢,就比较快一点,我的已经下载成功,在我们的 桌面上就有抛边带 stop 六四位的双击这个下载的安装包,然后 我们双击之后呢啊接受协议啊,选择简体中文呃,现在新的跑别版本,他支持 中英文直接呼唤的,我们启动抛边之后,如果你是外企,可以直接通过我们抛边软件进行中英文啊转换。我们现在呢选择中文简体,然后点击四 稍等一会我们下一步,下一步就可以实现炮憋的安装, 然后我接受协议一直啊创建桌面快捷图标啊,直到我们安装完成之后呢啊,在我们的桌面上就有 powerbead desktop, 这个由于你电脑的配置高低不同,安装的速度有快有慢啊,我们需要少等片 啊,直接让我们的精度条完成好,我们会发现我们的桌面上已经生成了 party ttop, 等到他们啊整个精度完成之后呢,就可以自动选择 party 进行启动 啊 polo 边新的版本他占用的空间还是比较大的,他要占用两个 g 以上的空间,我们安装完成之后也可以选择启动 polo。

我觉得 powerbi 就是最好最容易的分析工具,这样的动态互动可视化报表一星期就能学会,一小时就能做出来。我的七十节入门到精通已经发布了,老师手把手包教包会,像这种网红 gdp 条形图简直无脑即可制作。我在世界五百强 公司推的就是帕尔 b i 学不会你来打我吧。谢谢老铁们一如既往的支持,记得加学习群哦。