数据分析与可视化-03:数据建模 Modeling 一、数据建模 数据建模(Data Modeling)是指将来自不同数据源的表通过关联关系(Relationships)组织成一个逻辑化的关系模型,以便支持高效的数据分析和可视化。 1. 基数是两个关联表之间的匹配关系,常用的基数有以下几种。 多对一(*:1):A表的多行可关联B表的一行,B表的一行关联A表的多行。 这是最常见的类型。 例如“销售明细”表中,同一商品编码会重复出现多条销售记录,而在“商品信息”表中同一商品编码只会出现一次。所以“销售明细”表 和“商品信息”表就是“多对一”的关系。 一对多(1:*):A表的一行可关联B表的多行,B表的多行关联A表的一行; 一对多是多对一的反向。 例如“商品信息”表中的商品编码对于“销售明细”表中的商品编码是“一对多”的关系。 一对一(1:1):A表的一行对应B表的一行,反之也成立。 例如,在“员工信息”表和“员工考核”表中,每个员工的数据只出现一次,两个表按“员工编号”列建立 的关系就是“一对一”的关系。 2. 交叉筛选器方向则是指在一个表中如何根据关联列来匹配另一个表中的行,即匹配方向。 在创建关系时,交叉筛选器方向可设置为“单一”(单向) 和“两个”(双向)。 单一:意味着只能从一个 表根据关联列查找另一个表中的匹配行,而不能反向。 两个:意味着从关联的两个表中的任意一个表,均可根据关联列查找另一个表中的匹配行。 二、度量值(Measure)是动态计算的DAX公式,用于在报表交互时“实时聚合”和“分析数据”, 例如:餐费总金额 = SUM(trans[transvalue]) 它是Power BI数据分析的核心工具之一,具有以下关键特点: 1. 适用于聚合计算 汇总数据:专为聚合操作(如求和、平均、计数)设计。 对比:计算列(Calculated Column)逐行计算并存储结果,适用于行级逻辑。 2. 动态计算(上下文感知) 响应筛选器:度量值的结果会根据用户交互(如切片器、筛选器、行/列上下文)动态变化。 支持行上下文和筛选上下文:可与CALCULATE等函数结合,灵活调整计算逻辑。 3. 不占用存储空间 非物理存储:度量值仅在运行时计算,不会增加数据模型大小。 节省资源:适合处理大规模数据,避免冗余存储。 最
00:00 / 20:06
连播
清屏
智能
倍速
点赞7
00:00 / 05:00
连播
清屏
智能
倍速
点赞15