粉丝3539获赞2261

好,本节呢为大家介绍在 power view, power map 以及 excel 表格界面制作分析展示界面的方法。其实我们前边呢已经将数据整理出来了,有了数据呢,那做展示一界面呢,就非常方便了。好,那咱们来一一看一下这些展示界面是如何被制作出来的。 首先呢,咱们先来了解 power 六界面的制作方法,那我们通过 power 六呢来制作这么一个界面。前面呢也介绍过这边呢是不同产品的别下不同产品此类别的销售金额占比和销量占比的数据透视表。那这边呢是一个不同国家的销售金额的趋势图,那下边呢是一个不同时间的 销售金额的趋势图。好,那咱们就在 pro 六中呢来制作这样的界面。那咱们还是使用之前用 pro query 和 propro 的加工好了的数据文件在这个文件里呢,接下来我们要启动 pro 六, pro 六怎么启动呢?咱们需要先加载, 等一下,加载方法是文件选项,加载项,咱们选 com 加载项,点击转到这里边有 power for excel, 咱们把它打上勾,点击确定就可以了。但是 excel 二零一六呢,有个小 bug 就是有的二零一六版本的 excel 中呢,你点完确定啊,本营在参观栏上有 power 选卡出现才对, 但是呢,因为这个 bug 它显示不出来,那这种情况怎么解决呢?咱们可以通过这样的操作来解决,在文件下选项,然后再增进功能区,增进功能区大家会发现,其实咱们跑加载 pop 六已经被打上勾了,但是显示不出来。没关系,咱们新建一个选项卡,将这个选项卡的名称呢啊,起一个咱们需要的名称啊,比方说 p v 啊, 点击确定,建好了这个新的选项卡之后呢,咱们把 powerview 里边所有的功能呢,一拖拽到 p v 下就行,因为我前面已经拖拽过一次了,拖拽结果是 power p o w v i e 啊,这个选项卡下, 现在这里边就是 pow 里边的功能啊,那我的这里边就是大家的 pow 的里边的功能啊,操作方法都一样,我为大家演示一下,就是把 p o w v i e 啊大家,我的 p o w v i e, 大家的 pow 啊,里边的每一个功能都点击选中,然后拖拽到 pv 下啊,这么一个一个的拖拽回去就可以了。 好,那这 pro real 呢,就没用了啊,你可以删掉他,也可以留着无所谓。好,然后点击确定,那这样呢,咱们的 pv 里边就有了 power real 的功能。 pro real 呢,就是这块儿啊,咱们点 power real 这个按钮,他就可以启动 power real 的执行界面了。那 pral real 呢,他是一个在有三要界面中去快速创建交互式界面的展示工具, 进入 pow 界面之后呢,他会自动默认生成一个自断列表,那我们通过改变自断列表的可视化效果,就可以将它转换成不同的图表或者是卡之类的展示效果了。那大家看一下这个自断列表里的自动 段呢,其实没有一个是我们需要的,所以呢,我们可以先把他们全部删掉,删掉之后呢,咱们再从上边的表中去选择咱们所真正需要的字段。那上面有两个表,两个表什么意思呢?一个是 procredit 表,还有一个呢是 powerpire 的最终加工完了的表,那咱们要用 powerpire 的表,是上边的这个, 咱们展开它就行了,然后将咱们所需要的字段呢拖拽进来,咱们需要什么字段呢?产品类别与产品子类别嵌套维度下的 子类别销售金额占比和子类别销量占比的汇总规则的表。那这样创建好之后呢,它还是一个资料列表,我们需要把它转换成卡才行啊,卡呢,是在这表下点击它,然后选卡。 好,这样呢,就转换成了咱们 ppt 中显示的样式的,呃,展示效果了好,做完左侧呢,接下来还要做右侧的两个图。 上面的图呢是空间维度下的销售金额的趋势图,下边呢是时间维度下的销售金额的趋势图。那咱们就可以使用到之前在 pop 的中创建的层次结构了。空间的层次结构在这区域,那咱们把区域里边的国家拖拽过来,然后再把地区也拖拽过来, 形成维度。然后呢,咱们要看销售金额,所以把销售金额这个字段呢拖拽到里边来啊。再接下来呢,就是改变它的展示效果。展示效果呢,在切换可视化效果里,选柱形图,选粗长柱形图, 这样呢就转换成了图的样式,但是图的样式呢?呃,他现在的层次结构呢,被分开了,国家呢放在了轴,而地区呢,放在了 legend 的这下边。那咱们接下来呢,要把地区拖拽到国家下边来,同时放在轴上,就形成了这样的 ppt 中的效果。 那,那这个图呢,是国家层次上的汇总图。如果咱们想看国家下边地区的趋势怎么办呢?咱们可以双击这样的柱状啊,比方说我现在双击中国,那显示的就是中国下边的不同地区的对比趋势了啊,那咱们如果想返回国家呢,就点击这个 箭头啊,他就回来了。好,这是咱们空间维度上接下来的创建时间维度上的时间维度上也很好创建,我们选择订单时间层次结构下的订单年份拖着过来,然后再把订单月份也拖着过来啊,最后呢把还是把销售金额 也拖拽过来,那这样呢,就生成了咱们所要的自断列表,把它也转换成柱形图,组装柱形图, 然后把订单月份拖出来,到订单年份的下边来就创建好了,那一共有四年,双击某一年就会展开这一年不同月份的局势情况,点击上箭头就退回来了。好,做到这呢,咱们的 powerw 的展示区域内容就全部做 完了,然后最后呢我们还可以为他起个名字,比方说叫零售业销售情况分析仪啊,制作者谁谁谁啊,走到这呢就做完了,那 power 呢?就为大家介绍到这里,接下来呢为大家介绍 powermap 中制作数据地图的方法,接。

各位小伙伴大家好,我是对考证有执念的读者王老师,今天我就和大家聊聊 cd 数据分析师这个证书。从事大数据工作的小伙伴对这个证书一定不陌生,他只在培育面向国际范围全行业的数据分析人才。 在信息大暴涨时代,数据分析可以为我们拨开云雾,找到真正有用的信息或趋势。互联网商业里面,数据分析会显得越来越重要,所以学好数据分析可以找到一份体面的工作。 cd 认证分为三个等级, 拉五一、拉五二和拉五三,考生需要逐级报考。 cd 认证考试与 p 二三六一合作,在全国七十多个城市有两百多个考点,让考生更方便的参加考试。 莱维一和莱维二支持随报随考,考过一级即可持证。莱维三是一年四届三月、六月、九月和十二月的最后一个周六。

各位小伙伴大家好,我是对考证有执念的读者王老师,今天来和大家聊一聊 cda 数据分析师,这个证书只在培育面向国际范围全行业的数据分析师专业人才,这个证书根据规定目前并没有专业的限制,也就是这个证书数据分析 相关专业和非相关专业都可以报考。 cda 证书目前分为三个等级分, 也是 cd love 一、 love 二和 love 三。 love 一包括科目有职业道德与操守、数据库与 sao 口、基础 统计学、初级业务数据分析、数据可视化。莱文二包含以下科目,数据采集与数据处理、统计分析、商业策略分析和数据治理。

经常有小伙伴问我想转行,但学历不高,会不会不好找工作?以王老师接触的学员经历来说,如果想报考天天数据分师的话,并不所有岗位都要求是本科以上,也不是必须九八五和二幺幺。 当然学历只会占一部分的优势,只是数据分析岗位更看重的是你的实战经验以及业务能力,而且有很多数据分析师是大专出身,但是依然做到了数据分析管理的岗位, 你觉得自己学历不占优势,用数据分析师技能提升自己就好。还有哪些问题不清楚可以留言给我。

大家好,接下来呢给大家来介绍一下这个描述性统计风险内容,也就说我们通过一份模拟数据来看一下关于连续型数据和关于离散型数据,它常见的一些度量指标有哪些好?首先呢我们把这个库来给它导入进来, 然后我们本次使用的这个数据呢是 s k 呢给我们提供的一个鸢尾花的嗯数据机,它呢是一个这个嗯 s k two 里面的内置的数据集,然后现在呢我们把它直接的导入进来就可以了,导入进来之后呢就是大家现在看到的这个数据,然后为了方便大家后续去进行查看的话呢,这儿给数据去做一个重新的命名,也就是它的列名 去做一个重新的命名,然后这个数据集呢它主要包括了花瓣的长度,花瓣的宽度,花鄂的长度和这个呃花鄂的 宽度。然后最后呢有一个关于这个鸢尾花种类的一个标记,然后总共的这个鸢尾花的种类的话呢是有三个种类,然后呢他是标记成了这个零一和二,然后现在我们也是把这个零一和二呢重新给他, 嗯转化成了这个山边尾,打错边尾等等,然后方便大家后续去进行嗯计算和查看。好,接下来呢就给大家针对这份数据集去进行相应的一些描述性指标的输出。首先呢是关于连续型的这个数据, 因为连续性的数据的话呢,涉及到的就是这大家看到的这个呃恶骗的长度,恶骗的宽度,花瓣的长度,花瓣的宽度等等,这些都是连续性的这个数据。然后最后这个的话呢是一个种类,种类的话呢他很显然是一个这个呃理想型的这个数据,所以呢我们就通过这回数据来 给大家一起去梳理一下啊关于这个描述性统计分析里面常常见到的一些啊栋梁的指标。首先呢如果说是大家想要去对数据去做一个整体的描述的话,那么直接可以通过 discree 去进行描述,输出的内容的话呢就是下面大家看到的, 嗯,这些内容。好,我们可以一起来看一下刚刚读取进来的数据是一个 data, 然后 data 呢可以通过点 describe, describe 去进行一个呃描述, 描述完了之后呢,那就可以看到帮助大家去输出出来了每一个列他下面对应的一些啊描述指标,包括了这一个列里面呢他总共是有多少条的数据,然后他这个均值是多少,他这个标准差是多少, 然后最大值是多少,最小值是多少,以及中间的这些啊分位数的结果,百分之五十的这个分位数的话呢,就是大家常见的那个中位数,然后这个的话呢就包括了这个上次分位数和下次分位数,也就百分之二十五的分位数和百分之七十五的这个分位数, 并且呢是对于每一列都去进行了相应的一个描述。好,这个呢就是对于数据去进行整体的这个描述的时候呢,大家直接可以通过 discript 呢做一个整体的一个输出,然后那么如果说 我们现在需要对啊单个子段去进行相应的一些啊这个概括性指标的话,那么应该怎么去啊?进行相应内容的一个输出呢?或者说是我们希望呢啊只对其中的某一列去进行相应指标进行输出的时候,那么也是可以单独的拿到啊,最最终对应的 个取值的。就比如说,嗯,在这我们可以去查看单个字段对应的一个中值,那么这个单个字段的话呢,首先就要把它给选选取出来,就比如说我们随机的去选择一个 deta, 里面呢,它包含了这么几个字段,这么几个字段,然后比如说我们可以随便的选一个 恶片的长度,然后呢选择出来之后,通过这个点逆可以去查看对应的均值的一个结果,而这的计算出来的这个均值的结果的话呢,其实和上面大家直接通过这个 disk 去查看出来的这个均值的结果呢是一样的, 它是原本也就是这个值,只不过是下面呢大家可以单独的去拿出来。那如果说是我们只只是想要去计算一下整体的 这一列,就比如说这一列,这一列整体的这一列它的一个均值的话呢,或者说是我们想要去计算一下所有的这些列它对应的这个均值的话呢,那就是也可以直接通过通过 data 点密去进行相应的查看。好,这个是 data 点密, 我们可以通过 data 点密呢去查看每一列它对应的一个九指的结果,也就是说这儿查看出来的这个结果呢,和上面大家看到的这一行的结果是一致的, 这个是关于均值的这个计算,那么同样的大家也可以计算出来,也可以计算出来这个单个字段他的一个中位数的结果,以及对应的每一个字段的中位数的结果,也就是把上面的这个中位数的结果呢给他单拎出来。好,同样的大家也是,如果说是我们要 去计算单个字段的时候呢,那就要先把这个单个字段呢给他选择出来。好,选择出来之后呢,去计算对应的这个周围数, 这个是一个这个 red, 我们也可以计算出来单个字段下面它对应的中位数的一个结果,那么同样的大家也可以计算出来每一个字段对应的中位数的结果, 这个时候呢,大家就拿到了每一个字段对应的中文数的结果了,也就是说这个结果呢,其实和上面大家看到的这个结果 是一致的哦,只不过上面最开始的时候呢,是给大家一起给输出出来了。好,这个是啊,周围数他也是大家常见的这个去描述连续型数据,他的一个集中趋势的时候的一个常用的一个指标,包括上面这个均值,他也是一样的描述的是连续型数据他的一个 集中去世的啊,最终的一个描述的指标。好,那么除了这些之外呢,大家还可以去计算中数, 比如说我们仍然是选择出来一个字段的时候,选择出来一个字段的时候呢,大家可以去计算出来对应的重数的结果, 大家可以记得出来这个对你的祝福的结果,但如果说是要去得到所有的这个 啊,这段他的一个重复的结果的话呢,上面的方法是一样的,和上面这个方法呢是一样的,那么除了啊中位数种数均值之外呢,大家还可以去计算的就是这这的这个分位数。 对于分位数来讲的话呢,其实上面整体给大家呈现出来这个结果里面呈现出来的比较常见的也就是这个百分之二十五的啊分数和这个百分之七十五的一个分位数,那么大家在计算的时候呢,当然也可以去进行相应的啊,单独的一个计算, 也就是说我们这儿呢可以直接对 data 去计算它的一个分位数,嗯,通过 ctr 去进行一个计算,然后在计算的时候呢,通过 q, 然后里面这个参数这个 q 呢去指定大家要去计算的是什么样的一个这个凤尾数,比如说百分之二十五的这个凤尾数,或者是百分之七十五的这个凤尾数,就是这就是这个 点七五的时候呢,那么计算出来的就是百分之七十五的一个分位数,零点二五的话呢,那计算出来的就是百分之二十五的一个分位数所在的一个结果,也就是说刚刚计算出来百分之七十五这个分位数呢,是和这的这个结果是一致的, 那大家也可以去选择出来对应的一个字段,那么对应的呢,再去计算它的一个分位数的计算结果 也是可以的。除了这些啊之外呢,大家还可以去啊描述这个数据的离散程度, 在理想程度描述的时候,对于连续性数据来讲呢,我们常见的就是有这个方差,标准差或者是极差等等。那么当然在计算这个方差,标准差或者说是极差的时候呢,可以去计算啊,单个字段的,也可以去直接输出每一个字段的计算的结果。那么如果说要去计算单个字段 的方叉或者说是标准叉的时候呢,同样的需要先把这个字段呢选取出来,好,选取出来之后就说通过这个 v a 啊去输出方叉的一个对应的结果,好,这儿是这个对应的方叉, 嗯,那么同样的呢,大家也可以得到标准差的计算的结果,标准差的话呢,是一个 s t d, 嗯,好,这个是关于标准差的,也就是说我们也可以计算出来单个字段的啊,方差和标准差。那么同样的呢,大家也可以去计算每一个字段对应的方差和标准差的结果,通过这个 方叉和标准叉的结果呢,大家可以去呃了解每一个字段它的一个这个离散程度,比如说这儿是 data 点 v r, 直接通过这个 data 点 v r 的话呢,那么是可以计算出来每一个字段对应的方差的结果的, 那么同样的通过 data 点 s、 t、 d 呢,大家也可以计算出来每一个字段对应的这个标准差的一个计算的结果。 方叉和标准叉的话呢,那就是在方叉计算的基础上,就是这个呢,是一个这个 s 方,再取开一个根号之后,根号下面 s 方呢,就可以得到对应的一个标准叉了, 这就是一个这个 s 啊,这个呢是,嗯,对应的这个分叉 和标准差的一个计算好,那么对应的方差,这样我们就可以选择这个了。对应的方差和标准差计算结果完了之后呢,那么大家也可以去呃计算对应的这个呃极差,也就说极差呢,他表示的是一组数据里面的最大值和最小值之间的差距, 那么大家在计算的时候呢,我们也是可以去进行相应的结果的一个输出,它呢是一个这个 p p。 好在计算计算这个呃几差的时候呢,我们也是给它去选定一列数据,那仍然是这个恶骗的长度, 大家可以输出对应的这个极差的结果了,也就是说最大值去减去最小值的时候,那么他对应的结果是一个三点六多啊,当然是针对于这个恶骗的啊长度这个字段来 说的。那么最后的话呢,对于风度形态来讲呢,大家还可以去啊计算这个偏度和风度,也可以去计算对应的这个偏度和偏度和这个风度。那么对于偏度来讲呢,比如说 它其实是相对于这个正态分布来说的,相对于正态分布来说,那么它到底是左偏的呢还是右偏的呢?大家可以去查看对应这组数据它的一个偏度的结果,偏度的话呢,那就是通过这个嗯, s、 k e 的,通过这样的这个啊方式去进行相应的结果的这个输出,那么也就是说这儿呢,计算出了对于恶片长这个字段它的 偏度的一个结果,那么根据偏度大于零的话呢,那就说是啊整个的这个边长呢,他应该是一个右偏的腹部,那如果是小于零的话呢,他就是一个左偏的腹部了, 那么这个风度的话呢,它是仍然是相对于这个正态分布来说的啊,它到底是这个尖峰的呢?还是这个后尾的?那么大家也可以呃通过计算对应数据的风度的结果来得到相应的记录。 好,这个就是关于风度结果的一个输出。好,也就是说以上的这些 以上的这些计算指标呢,那其实就是针对于连续型的这个数据来讲,那么大家常见的一些啊度量的这个指标,包括了这个均值、中位数、分为数、方差、标准差、极差等等, 然后里面呢也是涉及到了关于啊连续数据他的一个集中趋势的啊分布,然后集中趋势他的一个离散程度,以及他整 这个呃腹部形态的一些描述。好,接下来这个呢就是对于理想型数据的,理想型数据的话呢,对于当前大家看到的这个数据来讲,其实就是这个种类,因为只有他这一边呢是一个理想型的这个数据。 好,那么在进行理想型数据的描述的时候,比如说我们同样的也是可以啊,先来输出一下整体的这个描述的结果,好,选择出来这个种类,选择出来种类之后呢,通过点 仍然是通过这个点 discribe 去进行一个描述,那么描述的几 结果的话呢啊,就会告诉我们说当前这个字段呢,他总共有多少条数据,那么他里面的这个种类是有多少个呢?也就是说不同的这个曲值有多少种,那么其实这个种类呢,大家只会取到零一和二,所以呢不同的这个曲值呢,就是有三种结果, 他就是有这个三个结果,那么还告诉我们说是啊取值比较不多的啊,那么他是哪一个种类呢?那么他这个平数是多少? 对于当前的这个种类这个数据呢,去进行了整体的一个描述,当然大家也可以去计算出来每一个种类他的一个评述的统计的结果,那就是仍然是选择出来 这个种类,然后呢通过点 去输出对应的啊类别下面他的一个评数统计的结果,对应的呢有这么几类啊,那么这么几类的话,对应的这个评数是多少呢?也给出了相应的一个统计,那么如果说要去得到对应的频率的结果呢,也是可以的,就是用 不同种类它的一个评述的信息去除以总的,要么用量,就是我们这仍然是选择出来种类,然后呢去统计一下这个种类呢,它总共有多少条数据? 统计完它有多少条数据之后呢?然后用刚刚大家计算出来的这些每一个不同的类别它的一个呃评数呢,去 除以总的数据量,那么就会得到每一条呃,这个每一个种类下面 他所占的一个频率的结果了。好,这个呢就是关于理想型数据大家再去进行描述的时候的一些啊描述的方法。 好,以上呢就是大家针对于 ziphone 模拟数据,然后,呃所看到的关于连续型的数据的一些基本的描述和关于 decent 型数据的一些啊基本的描述。好,本次的介绍呢,就先给大家分享到这里了。

从事数据分析有必要考证吗?首先,王老师不反对大家考证书,但你要对得起自己的时间和金钱。当你拿到这份证书的时候,能不能对你的就业和薪资收入 带来变化?目前市场上比较火的数据分析师从业证书可以分为这几类,第一是 cda 数据分析师认证,第二是阿里云大数据分析师 acp 认证, 还有工信部大数据分析师认证。所以,无论你考哪一种,都会为你的简历添加一份色彩。