數(shù)據(jù)倉庫教程
數(shù)據(jù)倉庫是一個用于集成來自多個來源的數(shù)據(jù)的存儲庫,可用于報告和分析。然后,該存儲庫將成為商業(yè)智能的來源。
DWH的輸入是從企業(yè)的不同系統(tǒng)中提取的,這些系統(tǒng)可以包括當前或歷史數(shù)據(jù)。DWH的主要目標是,能夠處理批量數(shù)據(jù),建立跨系統(tǒng)的關(guān)系,并使用最終產(chǎn)品進行分析和維護;報告目的。
通常,從輸入源收集數(shù)據(jù),進行清理以避免冗余和不準確的垃圾數(shù)據(jù),分階段、集成并加載到數(shù)據(jù)庫中,其中數(shù)據(jù)庫可以根據(jù)給定數(shù)據(jù)的類別組包含不同的模式。Schema是一種模型或特定格式,適用于DWH中的所有數(shù)據(jù),而不考慮其源格式。
為什么我們需要學習DWH
數(shù)據(jù)倉庫在商業(yè)智能中起著至關(guān)重要的作用。使用DWH,業(yè)務決策者可以從任何給定的角度創(chuàng)建分析或報告。DWH幫助他們整合從多個來源收集的大量數(shù)據(jù)。業(yè)務人員可以從DWH獲取所有必需的信息,以生成必需的統(tǒng)計數(shù)據(jù)或報告。
DWH使其在時間消耗方面變得簡單,因為所有數(shù)據(jù)都位于一個位置,而不是多個源。由于所有數(shù)據(jù)都轉(zhuǎn)換為一個模式,因此DWH具有定義良好且準確的數(shù)據(jù),冗余最少或為零。不斷需要做出商業(yè)決策的商業(yè)專業(yè)人士不必再費心研究和收集信息。數(shù)據(jù)倉庫可以用作一站式解決方案。
DWH的應用
數(shù)據(jù)倉庫可以在任何需要進行頻繁決策的領(lǐng)域?qū)嵤詫崿F(xiàn)業(yè)務的持續(xù)增長。
以下是可以實施DWH的幾個領(lǐng)域:
1.任何以員工為主要資源的行業(yè),如——
a.警察部門——每個地區(qū)的警察、擔任特定角色的警察、成功完成任務的警察、在給定時間內(nèi)完成的案件數(shù)量等信息,可用于生成關(guān)于特定特定特定部門記錄的報告。
b.軟件行業(yè)員工出勤率、薪酬、獲獎情況、前幾年的績效等信息可用于決定員工當前的績效
2.銀行業(yè)務——DWH在銀行業(yè)有多種應用,包括客戶服務、客戶交易、銀行通信系統(tǒng)、銀行員工等細分領(lǐng)域。
3.零售——在零售行業(yè),客戶關(guān)系管理、銷售、服務等可以完美地進行,因為DWH將數(shù)據(jù)準確性作為其關(guān)鍵功能。
范例
讓我們考慮一個例子:
一家名為“Complete Foods”的食品生產(chǎn)公司需要查看當前財年的銷售業(yè)績統(tǒng)計數(shù)據(jù)。“Complete Foods”擁有的數(shù)據(jù)倉庫可用于提取有關(guān)銷售區(qū)域、門店、利潤/損失、客戶的所有銷售記錄
反饋、員工記錄,以及包裝食品、新鮮農(nóng)產(chǎn)品、家禽、乳制品等不同部門的個人銷售流程。,
先決條件
對于任何能夠?qū)嵤〥WH的人,以下是基本要求:
1.數(shù)據(jù)倉庫流程知識
2.數(shù)據(jù)處理經(jīng)驗
3.熟練使用pl/SQL、mySQL、T-SQL等查詢語言。,
4.項目堆棧持有人的書面要求。
5.其他資源,如對來自所有必需來源的數(shù)據(jù)的訪問權(quán)限、所有必需的硬件和軟件設置等。
目標受眾
具有數(shù)據(jù)處理經(jīng)驗的軟件工程師,以及數(shù)據(jù)倉庫或一般數(shù)據(jù)科學方面的額外知識。