数据仓库引入了新的术语,扩展了数据建模的术语表。为使本文的论述能够齐备,下面我介绍一下最常用的术语。
数据仓库
数据仓库是一个支撑管理决策的数据调集。数据是面向主题的、集成的、不易丢掉的而且是时刻变量。
数据仓库是一切操作环境和外部数据源的快照调集。它并不需求十分准确,由于它必须在特定的时刻基础上从操作环境中提取出来。
数据集市
数据仓库只限于单个主题的区域,例如顾客、部分、地址等。数据集市在从数据仓库获取数据时能够依赖于数据仓库,或许当它们从操作系统中获取数据时就不依赖于数据仓库。
现实
现实是数据仓库中的信息单元,也是多维空间中的一个单元,受剖析单元的约束。
现实存储于一张表中(当运用联系数据库时)或许是多维数据库中的一个单元。
每个现实包括关于现实(收入、价值、满足记载等)的基本信息,而且与维度相关。
在某些状况下,当一切的必要信息都存储于维度中时,单纯的现实呈现便是关于数据仓库满足的信息。咱们稍后评论有关缺无现实的状况。
维度
维度是绑定由坐标系界说的空间的坐标系的轴线。数据仓库中的坐标系界说了数据单元,其间包括现实。
坐标系的一个比如便是带有 x 维度和 y 维度的 Cartesian(笛卡尔)坐标系。
在数据仓库中,时刻总是维度之一。
数据发掘
在数据仓库的数据中发现新信息的进程被称为数据发掘,这些新信息不会从操作系统中取得。
剖析空间
剖析空间是数据仓库中一定量的数据,用于进行数据发掘以发现新信息一起支撑管理决策。
切片
一种用来在数据仓库中将一个维度中的剖析空间约束为数据子集的技能。
切块
一种用来在数据仓库中将多个维度中的剖析空间约束为数据子集的技能。
星型形式
一种运用联系数据库完成多维剖析空间的形式,称为星型形式。
星型形式将在本白皮书中稍后进行进一步评论。
雪花形式
不论什么原因,当星型形式的维度需求进行标准化时,星型形式就演进为雪花形式。