CSDN博客

img yangwl

什么是数据仓库

发表于2004/7/7 0:54:00  2321人阅读

     数据仓库概念创始人W.H.Inmon在《建立数据仓库》一书中对数据仓库的定义是:数据仓库就是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化的数据集合。所以一般认为数据仓库具有四个基本特征:数据仓库的数据是面向主题的;数据仓库的数据是集成的;数据仓库的数据是不可更新的;数据仓库的数据是随时间不断变化的。
    主题是对应某一分析领域的分析对象,主题的抽取应该是按照分析的要求确定的。举个例子来说明什么是面向主题:MIS系统中有采购子系统,库存子系统,销售子系统,那么在DSS中要分析的主要有采购的商品,供应商,销售的商品,顾客等基本信息,所以数据仓库中分别对应着商品,顾客,供应商等主题。
    集成是指数据仓库中的数据是从原有的分散的数据库中抽取出来的。在数据集成过程中有许多工作要做。比如去掉噪声数据,也就是明显不合理的数据;还有统一源数据中所有矛盾的地方,比如字段名称的统一,单位的统一等;还有数据综合,也就是在数据进入数据仓库之前进行综合,比如将原来每天的数据按月综合。
    不可更新的意思是不对数据进行更新操作。因为数据仓库的数据主要是供决策分析用的,所涉及的数据操作主要是数据查询。但是着里的不更新只是不进行UPDATE的操作,不是指数据的追加和删除。
    数据是随时间不断变化的。数据仓库随时间变化不断增加新的数据内容,也不断的删去旧的内容。数据仓库中包含大量与时间有关的综合数据,随着时间的变化,数据要进行重新综合。比如今年的数据周综合,到了明年要对数据按季度进行综合。   
0 0

相关博文

我的热门文章

img
取 消
img