首页  ·  知识 ·  大数据
数据仓库设计原则
网友    实践应用  编辑:dezai   图片来源:网络
采取务实的态度部署一个完备的企业数据仓库 ― 我的意思是一个准确、有效、更具生产力的企业数据仓库 ― 涉及到一个完善的设计原则。这些原则具体到于每一个部门

信息仓库层被设计作为一种已在“上游”处理过的数据的标准数据存储器。它已经进行了清洗、转化和主数据处理,并在这里被合并成一个“记录系统”。数据标准化重构的原则是,将它从源系统单一视角中移出,放到整个企业的多角度中。数据建模是根据其“本质”而不是“使用”。

 

这个流程的设计对数据加上一种严格的秩序以提升数据的完整性,并且保持高度的灵活性。数据被分散到单独的表中的方式对查询是一种挑战,但这不是它的主要目的。数据完整性和灵活性是主要目标,而且性能调整主要是朝向加载的速度而不是数据的访问的速度。

 

1. 数据完整性

 

以积极的姿态来保护引用完整性和减少冗余实体或不一致的可能。

 

2.可扩展性

 

允许数据量的增加或已有信息的额外数据源,无论在主题区域 (例如:发行者、同行)还是在核心概念上(如发行者、供应商)。

 

3.灵活性

 

允许额外数据源或现有源的变更,使设计不拘泥于一个给定的源或源的镜相。设计将主要考虑到再利用,然后是扩展 ,最后是对现有结构的修正。

 

4.一致性

 

采用数据仓库设计标准以促进数据仓库和ETL设计的效率。决策过程将会和数据建模工作和ETL的开发一样加快。

 

5.效率

 

关注三个方面的效率

 

1.安装

 

可重复使用的数据设计的模式将最大限度地减少数据建模和ETL的工作量。

 

2.操作

 

保持最小的数据组和保持一致的标准以便维护易于进行,运用逻辑结构以方便导航和使用。

 

3.加载性能

 

优先考虑ETL加载流程的性能;包括那些使用记录系统作为一种源加载数据集市的部分。

 

6.从企业的角度

 

为所有的数据对象、保留和维持对各种实体间已有的和潜在的关系的开放,以确保数据反映了整个企业,而不是不限于任何特定的项目需求。

 

这些基本原则通过影响存储历史、层次结构、标准化程度、分类、代理键和许多其他方面的设计的策略进行实施。设计原则是判断在一个特定的情况中采取的最好方法的标准。它并不总是直截了当的,就算有适当的原则,有时候也会对多项原则有所侧重(例如, 侧重灵活性多于加载性能),但以上列项提供了对数据仓库设计方法的指导。

 

正如之前所建议的那样,我不提倡盲目符合一套规则,但是,在我的经验中,高效开发的一个最大的障碍是决策过程。用智慧设计原则来减少讨论的参数可使决策过程更快更正确。

本文作者:网友 来源:网络
CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读
也许感兴趣的
我们推荐的
主题最新
看看其它的