教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

初始ETL:ETL的體系結(jié)構(gòu)

更新時間:2022年11月10日09時48分 來源:傳智教育 瀏覽次數(shù):

好口碑IT培訓(xùn)

  ETL主要是用來實(shí)現(xiàn)異構(gòu)數(shù)據(jù)源數(shù)據(jù)集成的。多種數(shù)據(jù)源的所有原始數(shù)據(jù)大部分未作修改就被載入ETL,因而,無論數(shù)據(jù)源在關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫,還是在外部文件,集成后的數(shù)據(jù)都將被置于數(shù)據(jù)庫的數(shù)據(jù)表或數(shù)據(jù)倉庫的維度表中,以便在數(shù)據(jù)庫內(nèi)或數(shù)據(jù)倉庫中作進(jìn)一步轉(zhuǎn)換(因此,一般會將最終的數(shù)據(jù)存儲到數(shù)據(jù)庫或者數(shù)據(jù)倉庫中)。ETL的體系結(jié)構(gòu)如圖2-1所示。

ETL的體系結(jié)構(gòu)

  圖2-1 ETL的體系結(jié)構(gòu)

  在圖2-1中,若數(shù)據(jù)源1和數(shù)據(jù)源2均為功能較強(qiáng)大的DBMS(數(shù)據(jù)庫管理系統(tǒng)),則可以使用SQL語句完成一部分?jǐn)?shù)據(jù)清洗工作。但是,如果數(shù)據(jù)源為外部文件,就無法使用SQL語句進(jìn)行數(shù)據(jù)清洗工作了,只能直接從數(shù)據(jù)源中抽取出來,然后在數(shù)據(jù)轉(zhuǎn)換的時候進(jìn)行數(shù)據(jù)清洗的工作。因此,數(shù)據(jù)倉庫中的數(shù)據(jù)清洗工作主要還是在數(shù)據(jù)轉(zhuǎn)換的時候進(jìn)行。清洗好的數(shù)據(jù)將保存到目標(biāo)數(shù)據(jù)庫中,用于后續(xù)的數(shù)據(jù)分析、數(shù)據(jù)挖掘以及商業(yè)智能。

0 分享到:
和我們在線交談!