1.ER模型

    实体关系模型描述业务,站在企业角度面向主题的抽象,而不是针对某个业务流程的实体对象关系的抽象

要求:

* 全面了解业务数据
* 实施周期长
* 建模能力要求高
ER模型的出发点是整合企业数据,将各个系统中的数据按主题合并,并进行一致性处理,为数据分析决策服务,但不直接用于决策

建模步骤:

* 高层模型 高度抽象的模型,用于描述主要主题及主题间的关系,企业业务的总体概括
* 中层模型 高层模型的基础上细化数据
* 底层模型 基于性能存储等做物理表设计,表合并分区设计
ER模型代表

    FS-LDM

2.维度模型

维度建模从分析决策触发构建数据仓库模型,为分析服务,为用户快速的完成数据分析,支持复杂的查询及相应性能,代表为星型模型

建模步骤:

* 选择业务过程
业务过程可以为单个业务事件,比如交易,退款等,也可以是某个事件的状态,比如当前账户的余额等;也可以是一系列相关业务事件组成的业务流程,具体需要看我们分析的是某些事件发生情况,还是当前状态,或是事件流转效率
* 选择粒度
* 识别维表
* 识别事实
3.Data Vault 模型

为了数据整合,建立可审计的数据层,强调数据的历史性,可追溯,原子性

组成:

* Hub 业务实体
* Link Hub之间的关系
* satellite Hub详细描述内容,一个Hub可以有多个Satellite
4.Anchor 模型

 

维度建模

维度设计基础

维度设计方法

* 选择维度或者新建维度
* 确定主维表
* 确定相关维表
* 确定维度属性
1)尽可生成丰富的维度属性

2)尽可能多的给出有意义的字段描述

3)区分属性和事实

4)尽量沉淀出通用的维度属性

维度层次结构

规范化与反规范化

* 反规范化方便、易用性、性能好
一致性维度

1)共享维表

2)一致性上卷,一个维度的维度属性是另一个维度维度属性的子集

3)交叉属性,两个维度具有相同部分的维度属性

 

维度设计高级主题

维度整合

集成体现

* 字段名统一
* 字段类型统一
* 代码及代码值统计
* 业务含义相同的表统一 (高内聚,低耦合)
水平拆分

原则

* 扩展性
* 易用性
* 性能
依据

* 业务关联程度
* 属性差异情况
垂直拆分

* 主从维度
历史归档

维度变化

缓慢变化维

处理

* 重写维度值 不保留历史
* 插入新的维度行
* 添加维度列
快照维表

极限存储

特殊维度

递归层次

* 扁平化
* 层次桥接
行为维度

多值维度

多值属性

杂项维度

 

技术
©2019-2020 Toolsou All rights reserved,
BugkuCTF-Web-计算器(随机数字运算验证码)MySql语句 递归寻找某输入部门的所有下级部门(精华)2020年8月15日 redis数据库 StackExchange.Redis中Set类型(C#版)Keras训练数据加载实现小结央视:Tiktok打官司表明了维权的态度和决心华为鸿蒙操作系统有哪些特点和优势?余承东《全场景时代 新体验与新生态》演讲全文11-5 指定位置输出字符串Golang数组平分,数组拆分,数组分组vue 获取el-select选中项的label值JAVA 把字符串转换成数字类型