《数据虚拟化:商务智能系统的数据架构与管理》一 2.7 提取-转换-装载、提取-装载-转换和复制
2.7 提取-转换-装载、提取-装载-转换和复制
从生产数据库获取数据至多种数据存储,数据必然被复制。例如,数据需要从生产数据库复制到数据中转区或者ODS,从ODS到数据仓库,从数据仓库到数据集市,等等。然而,存储在生产数据库中的数据形式和内容与用户希望在报告和分析工具中看到的非常不同。例如,在生产系统中,客户的数据可能分散在多个数据库中,但是用户想要看到完整的信息;生产系统中的数据可能被多次编码过,然而用户希望看到其有意义的价值;历史数据可能会从源系统中丢失,但是用户恰好需要它做趋势分析;或者源系统中数据元素的值可能是不正确的(错误数据),但是用户需要正确的数据来工作。总之,源数据需要在使用之前被“处理”。这整个过程有时候被称为数据转换。所以,当数据从生产数据库经过数据中转区移动到数据仓库时,它一定会发生转换。
各个组织可以使用自己