隨著企業業務的不斷發展,將持續產生大量數據存儲在相應的業務數據庫中,新的數據不斷生成,歷史數據不斷堆疊擠壓,很容易導致系統運行速度降低。為了避免數據積壓帶來的負面影響,企業需要定期將歷史數據從業務庫中移出去,將數據進行統一存儲和管理。
什么是數據倉庫?
數據倉庫,是為企業所有級別決策的制定過程提供全類型數據支持的戰略集合。它是一個面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,可用于支持管理決策,為需要業務智能的企業提供指導業務流程改進、監視時間、成本、質量以及控制。
在將業務數據移入數據倉庫的過程中,業務數據經過一系列的數據抽取、轉換、清洗,最終支持上層應用,數據倉庫里的數據作為分析用的數據源,可為后續的即席查詢、分析系統、數據集市、報表系統、數據挖掘系統等提供支持。
想要快速構建數倉,一個高效的工具必不可少!
Tempo DF+BI
一站式大數據開發與應用解決方案
Tempo數據工廠平臺(Tempo DF)是一款“流批一體”的大數據開發平臺,在數據倉庫建設過程中,Tempo DF支持全棧全域的數據接入、處理與輸出,包括關系數據庫、MPP、大數據查詢引擎、消息隊列、半結構化、時序數據庫、NOSQL等,能有效幫助企業降低數據融合成本,實現全鏈路數據開發。
數據倉庫的建設過程,往往比較關注數據分析層面(OLAP),而GreenPlum數據庫重計算,對大數據集進行統計分析的OLAP類型。Tempo DF支持GreenPlum數據的接入、處理與輸出,提高構建數倉能力,同時通過與Tempo BI的無縫融合,實現數據開發到應用的一站式服務,快速構建DF+BI一站式大數據解決方案。
GreenPlum數據庫是業界最快最高性價比的關系型分布式數據庫,它在開源的PostgreSQL的基礎上采用MPP架構(Massive Parallel Processing,海量并行處理),具有強大的大規模數據分析任務處理能力,幫助客戶創建數據倉庫。
基于GreenPlum數據庫的數據存儲優勢,Tempo DF能為用戶提供更高效的數倉構建服務:
?查詢速度快
支持大規模并行處理架構,高性能加載支持PB級別數據,快速進行查詢處理。
?響應及時性高
通過準確、實時的數據加載,實現更快的響應,保障數據倉庫實時更新。
?線性擴展強
在MPP架構中增加節點就可以線性提高系統的存儲容量和處理能力。
?運行性能強
支持50PB(1PB=1024TB)級海量數據的存儲和管理,并且在處理OLAP、BI和數據挖掘等任務時性能遠超通用數據庫系統。
用戶可以靈活使用Tempo DF進行數據開發與應用,無需代碼即可迅速完成各類流程構建,且支持多人同時在線協作,讓智能應用開發過程更加敏捷、高效。并且提供多源異構數據訪問、支持T級別計算能力,實現大規模數據加工計算需求,高效支持數據倉庫等場景建設。
Tempo DF為用戶提供一體化、自助式的大數據分析平臺,降低企業級數據分析門檻,幫助企業充分利用數據價值,助力企業實現“讓大數據盡在掌握”的數據文化建設,推動企業數字化轉型落地。