數據集成過程中需要處理的問題主要有

來源:趣味百科館 3.3W

數據集成過程中需要處理的問題主要有

數據集成過程中需要處理的問題主要有實體識別、冗餘與相關性分析、數據衝突和檢測。

數據集成是把不同來源、格式、特點性質的數據在邏輯上或物理上有機地集中,從而爲企業提供全面的數據共享。在企業數據集成領域,已經有了很多成熟的框架可以利用。通常採用聯邦式、基於中間件模型和數據倉庫等方法來構造集成的系統,這些技術在不同的着重點和應用上解決數據共享和爲企業提供決策支持。

數據倉庫是在企業管理和決策中面向主題的、集成的、與時間相關的和不可修改的數據集合。其中,數據被歸類爲廣義的、功能上獨立的、沒有重疊的主題。這幾種方法在一定程度上解決了應用之間的數據共享和互通的問題,但也存在以下的異同:聯邦數據庫系統主要面向多個數據庫系統的集成,其中數據源有可能要映射到每一個數據模式,當集成的系統很大時,對實際開發將帶來巨大的困難。


熱門標籤