00:00 / 04:48
连播
清屏
智能
倍速
点赞18
大家好,今天咱们聊数据仓库架构。它是数据管理和分析的核心基础 数据仓库架构在数据管理和分析中扮演什么角色 核心基础设施 其设计为何重要 关系到企业能否将数据转化为有用的决策信息 行业常用的架构有哪四类 数据集市架构 集中式架构 Lambda 架构 Kappa 架构 数据集市架构如何构建 按单一业务系统建小型数据仓库 举例 财务 销售各建一个 数据集市架构有哪些优势 小而快 规模小 建设周期短 维护方便 查询效率高 数据集市架构存在什么弊端 企业规模扩大后 各数据集市数据不通 形成数据孤岛 无法进行全局业务分析 集中式架构能解决什么问题 数据孤岛问题 集中式架构是怎样的 将所有业务系统数据集中到统一仓库 集中式架构有哪些优点 数据统一管理 口径一致 方便治理 支持企业级决策 管理层可直接调取全公司数据做综合分析 可通过加服务器和存储设备扩展容量和处理能力 集中式架构有什么缺点 初期投入大 集中式架构长期有何价值 对数据统一和全局决策的支持不可替代 Lambda 架构适用于哪些企业 既需历史数据准确性又要实时数据及时性的企业 Lambda 架构分为哪三层 批处理层 速度层 服务层 批处理层的功能是什么 存全量历史数据保证结果准确 速度层的功能是什么 处理实时数据保证及时 服务层的功能是什么 合并前两层结果返回完整数据视图 Lambda 架构有哪些优点 容错性好 查询灵活 易扩展 Lambda 架构存在哪些不足 要同时维护两套代码 开发维护复杂 数据口径可能不一致 Kappa 架构与 Lambda 架构有何关系 是 Lambda 架构改进版 Kappa 架构的核心是什么 一套代码搞定所有数据处理 Kappa 架构如何处理数据 所有数据按流处理 消息传输层存数据 处理层用流计算引擎实时算 结果直接给业务用 Kappa 架构有哪些优点 代码维护简单 数据口径统一 Kappa 架构有什么缺点 处理大规模历史数据时响应速度可能跟不上 依赖实时计算系统能力 数据流关联顺序错易丢数据 企业选择架构时关键考虑哪些因素 数据规模 增长速度 是否需实时处理 团队技术能力和成本预算 对多数发展中企业 哪些架构更实用 传统集中式架构或离线大数据架构 传统集中式架构或离线大#数据架构 #数据源 #数据中心 #数据仓库 #数据管理 @DOU+小助手
00:00 / 02:15
连播
清屏
智能
倍速
点赞1
00:00 / 02:58
连播
清屏
智能
倍速
点赞57
00:00 / 04:51
连播
清屏
智能
倍速
点赞0
00:00 / 00:22
连播
清屏
智能
倍速
点赞0
00:00 / 02:37
连播
清屏
智能
倍速
点赞309