數據倉庫教程
數據倉庫是一個用于集成來自多個來源的數據的存儲庫,可用于報告和分析。然后,該存儲庫將成為商業智能的來源。
DWH的輸入是從企業的不同系統中提取的,這些系統可以包括當前或歷史數據。DWH的主要目標是,能夠處理批量數據,建立跨系統的關系,并使用最終產品進行分析和維護;報告目的。
通常,從輸入源收集數據,進行清理以避免冗余和不準確的垃圾數據,分階段、集成并加載到數據庫中,其中數據庫可以根據給定數據的類別組包含不同的模式。Schema是一種模型或特定格式,適用于DWH中的所有數據,而不考慮其源格式。
為什么我們需要學習DWH
數據倉庫在商業智能中起著至關重要的作用。使用DWH,業務決策者可以從任何給定的角度創建分析或報告。DWH幫助他們整合從多個來源收集的大量數據。業務人員可以從DWH獲取所有必需的信息,以生成必需的統計數據或報告。
DWH使其在時間消耗方面變得簡單,因為所有數據都位于一個位置,而不是多個源。由于所有數據都轉換為一個模式,因此DWH具有定義良好且準確的數據,冗余最少或為零。不斷需要做出商業決策的商業專業人士不必再費心研究和收集信息。數據倉庫可以用作一站式解決方案。
DWH的應用
數據倉庫可以在任何需要進行頻繁決策的領域實施,以實現業務的持續增長。
以下是可以實施DWH的幾個領域:
1.任何以員工為主要資源的行業,如——
a.警察部門——每個地區的警察、擔任特定角色的警察、成功完成任務的警察、在給定時間內完成的案件數量等信息,可用于生成關于特定特定特定部門記錄的報告。
b.軟件行業員工出勤率、薪酬、獲獎情況、前幾年的績效等信息可用于決定員工當前的績效
2.銀行業務——DWH在銀行業有多種應用,包括客戶服務、客戶交易、銀行通信系統、銀行員工等細分領域。
3.零售——在零售行業,客戶關系管理、銷售、服務等可以完美地進行,因為DWH將數據準確性作為其關鍵功能。
范例
讓我們考慮一個例子:
一家名為“Complete Foods”的食品生產公司需要查看當前財年的銷售業績統計數據。“Complete Foods”擁有的數據倉庫可用于提取有關銷售區域、門店、利潤/損失、客戶的所有銷售記錄
反饋、員工記錄,以及包裝食品、新鮮農產品、家禽、乳制品等不同部門的個人銷售流程。,
先決條件
對于任何能夠實施DWH的人,以下是基本要求:
1.數據倉庫流程知識
2.數據處理經驗
3.熟練使用pl/SQL、mySQL、T-SQL等查詢語言。,
4.項目堆棧持有人的書面要求。
5.其他資源,如對來自所有必需來源的數據的訪問權限、所有必需的硬件和軟件設置等。
目標受眾
具有數據處理經驗的軟件工程師,以及數據倉庫或一般數據科學方面的額外知識。