論基於CWM的ETL元數據庫係統模型的設計(pdf 6頁)
論基於CWM的ETL元數據庫係統模型的設計(pdf 6頁)內容簡介
論基於CWM的ETL元數據庫係統模型的設計內容提要:
在工業領域,數據倉庫連同前端的數據挖掘工具向企業高層提供決策分析的平台體係機製被稱為商業智能
(BusinessIntelligence,BI)。BI項目的實施牽涉到企業各個事務處理係統之間海量數據的定向流動,這個數據流
動的過程被稱為數據抽取、轉換與裝載(Extraction、TransformationandLoading,ETL),是BI係統的心髒與靈魂[1]。
ETL過程的管理目標與其數據質量是密切相關的,高效的ETL過程管理可以在一定程度上預防和控製ETL過程
中出現的數據異常,是保障ETL數據有效性的重要手段。但是,在數據倉庫實施中,ETL過程的多個業務邏輯交
流環節都是基於人-人交流模式的,或者是通過人-文檔-人的形式進行信息傳遞。這樣的管理方式與數據倉
庫ETL過程的實際運行情況及結果是脫節的,使得ETL任務維護繁雜,返工代價大。鑒於此,本文提出基於公共
倉庫元模型(CommonWarehouseMetamodel,CWM)標準建立ETL元數據庫,它能描述ETL過程業務邏輯及數據變
換細節,以此來實現人機交流,從而實現對ETL過程具體細節的管理及分析。
..............................
在工業領域,數據倉庫連同前端的數據挖掘工具向企業高層提供決策分析的平台體係機製被稱為商業智能
(BusinessIntelligence,BI)。BI項目的實施牽涉到企業各個事務處理係統之間海量數據的定向流動,這個數據流
動的過程被稱為數據抽取、轉換與裝載(Extraction、TransformationandLoading,ETL),是BI係統的心髒與靈魂[1]。
ETL過程的管理目標與其數據質量是密切相關的,高效的ETL過程管理可以在一定程度上預防和控製ETL過程
中出現的數據異常,是保障ETL數據有效性的重要手段。但是,在數據倉庫實施中,ETL過程的多個業務邏輯交
流環節都是基於人-人交流模式的,或者是通過人-文檔-人的形式進行信息傳遞。這樣的管理方式與數據倉
庫ETL過程的實際運行情況及結果是脫節的,使得ETL任務維護繁雜,返工代價大。鑒於此,本文提出基於公共
倉庫元模型(CommonWarehouseMetamodel,CWM)標準建立ETL元數據庫,它能描述ETL過程業務邏輯及數據變
換細節,以此來實現人機交流,從而實現對ETL過程具體細節的管理及分析。
..............................
用戶登陸
數據倉熱門資料
數據倉相關下載