1.ER模型

    实体关系模型描述业务,站在企业角度面向主题的抽象,而不是针对某个业务流程的实体对象关系的抽象

要求:

* 全面了解业务数据
* 实施周期长
* 建模能力要求高
ER模型的出发点是整合企业数据,将各个系统中的数据按主题合并,并进行一致性处理,为数据分析决策服务,但不直接用于决策

建模步骤:

* 高层模型 高度抽象的模型,用于描述主要主题及主题间的关系,企业业务的总体概括
* 中层模型 高层模型的基础上细化数据
* 底层模型 基于性能存储等做物理表设计,表合并分区设计
ER模型代表

    FS-LDM

2.维度模型

维度建模从分析决策触发构建数据仓库模型,为分析服务,为用户快速的完成数据分析,支持复杂的查询及相应性能,代表为星型模型

建模步骤:

* 选择业务过程
业务过程可以为单个业务事件,比如交易,退款等,也可以是某个事件的状态,比如当前账户的余额等;也可以是一系列相关业务事件组成的业务流程,具体需要看我们分析的是某些事件发生情况,还是当前状态,或是事件流转效率
* 选择粒度
* 识别维表
* 识别事实
3.Data Vault 模型

为了数据整合,建立可审计的数据层,强调数据的历史性,可追溯,原子性

组成:

* Hub 业务实体
* Link Hub之间的关系
* satellite Hub详细描述内容,一个Hub可以有多个Satellite
4.Anchor 模型

 

维度建模

维度设计基础

维度设计方法

* 选择维度或者新建维度
* 确定主维表
* 确定相关维表
* 确定维度属性
1)尽可生成丰富的维度属性

2)尽可能多的给出有意义的字段描述

3)区分属性和事实

4)尽量沉淀出通用的维度属性

维度层次结构

规范化与反规范化

* 反规范化方便、易用性、性能好
一致性维度

1)共享维表

2)一致性上卷,一个维度的维度属性是另一个维度维度属性的子集

3)交叉属性,两个维度具有相同部分的维度属性

 

维度设计高级主题

维度整合

集成体现

* 字段名统一
* 字段类型统一
* 代码及代码值统计
* 业务含义相同的表统一 (高内聚,低耦合)
水平拆分

原则

* 扩展性
* 易用性
* 性能
依据

* 业务关联程度
* 属性差异情况
垂直拆分

* 主从维度
历史归档

维度变化

缓慢变化维

处理

* 重写维度值 不保留历史
* 插入新的维度行
* 添加维度列
快照维表

极限存储

特殊维度

递归层次

* 扁平化
* 层次桥接
行为维度

多值维度

多值属性

杂项维度

 

技术
©2019-2020 Toolsou All rights reserved,
【jvm学习】执行引擎python(基本介绍)用户管理和文件权限C++第五章多态性习题:(快大结局了)VHDL——含异步清零和同步使能的加法计数器源程序Windows网络服务渗透测试实战-跨网段攻击JavaScript百炼成仙 1.15 天秀找出游戏的获胜者(java)单片机能做什么,你有什么有单片机或开源硬件做的有意思的作品吗一份笔记让你从 15K 涨薪并跳槽到32K+16