数据仓库-四步维度设计法

DemisionDesign

什么是数据仓库四步维度设计法:

1 选取要建模的业务处理过程。
业务处理过程是机构中进行的一般都由源数据收集系统提供支持的自然业务活动。听取用户意见是选取业务处理过程的效率最高的方式。
2 定义业务处理的粒度。
粒度定义意味着对各事实表行实际代表的内容给出明确的说明。粒度传递同事实表度量值相联系的细节所达到的程度方面的信息。

例如:每个银行账号的月快照;个人登机通行证内容等等。
3 选定用于每个事实表行的维度。

4 确定用于形成每个事实表行的数字型事实。

建立数据仓库注意事项:

1. 数据仓库几乎总是要求在每个维度可能得到的最低粒度上对数据进行表示的原因,并不是因为查询想看到每个低层面的行,而是因为查询希望以很精确的方式时细节知识进行抽取。

2.  一个经过仔细考虑的粒度定义确定了事实表的基本维度特性。同时,经常也可能向事实表的基本粒度加入更多的维度,而这些附加的维度会在基本维度的每个组合值方面自然地取得唯一的值。如果附加的维度因为导致生成另外的事实行而违背了这个基本的粒度定义,那么必须对粒度定义进行修改以适应这个维度的情形。

3. 诸如百分比和比率这类毛利润率都是非加性的。分子与分母都应该存放在事实表中。可以用数据存取工具求出事实表任何数据形式的比率,只是要记住求取的是合计值得比率,而不是比率的求和。

4. 必须避免在事实表中出现关键字。在这方面显得比较合适的设计是在对应的维度表中包括一行来标识该维度对度量值不可用。

5. 数据仓库中维度和事实表之间的每个连接都应该用没有明确含义的整形代理关键字来建立。应该避免使用自然的操作型产品编码。没有一个数据仓库关键字应该是意义隐晦的,相反,只要看一下关键字就能直接指导它想表达的行方面的信息。

分享到: 更多
不允许评论