【大數據行業知識分享】什么是數據湖?
2023-03-02 17:29:52
次
今天給大家分享的是數據湖的概念
那相對于數據倉庫所面臨的兩大挑戰
數據湖呢凸顯了兩方面的能力
一方面呢
就是數據的快速匯集存儲能力
它不再提到寫時建模
和統一模型的這個概念
那第二點呢
其實就是說
數據價值快速釋放的能力
那它著重提出了
讀時模型的構建能力
那讀時模型的構建能力呢
我們可以理解為
從業務視角的這個角度
那如何快速地從集中存儲的數據中
獲取到我們想要的數據的
這個是數據湖所需要體現的兩大能力
同時呢數據湖也面臨著兩大挑戰
那第一個挑戰是什么
就是堰塞湖
堰塞湖其實在我們的讀時模型
無法快速構建的情況下
那它會發現呢
數據的價值無法進行釋放
非常像堰塞湖
數據都擠在里面了
就像在茶壺里面煮餃子
第二大挑戰呢
很容易形成數據沼澤
在數據質量沒有很好地監控的情況下
那大量的
數據質量非常低下的數據進入以后呢
那會形成數據沼澤
使得數據釋放的能力
也有所下降
那這是數據湖所面臨的兩大挑戰
那在下一節呢
那我們將進一步介紹云邊協同
在數字化轉型中所起到的作用
下期我們再來接著分享
關注視頻號【美林數據Tempotata】
查看視頻講解~