不斷進化的物件儲存,支援多層次的資料湖。
近年來,在數據應用領域中,「數據湖」是一個受到關注的關鍵詞。在構建數據湖的選擇中,對象存儲是首選之一。
AWS
隨著DX推進的需求增加,更高度的「數據活用」變得越來越重要。為了收集更多的數據,更快速、更仔細地進行分析,使用最新的工具和服務是必不可少的。本文將介紹用於數據活用的「新三種神器」,即「物件儲存」、「數據虛擬化工具」和「數據連係雲」,並解釋它們的功能和應用方法。本文將首先介紹物件儲存。
近年來,在數據活用領域,「數據湖」是一個關鍵詞。雖然對其解釋有很大的差異,但其概念是在內部和外部收集各種數據,並根據需求快速提供給用戶。
因此,需要一種可以更便宜地存儲大量數據的儲存方式。物件儲存是首選之一。
物件(數據)以對應唯一鍵的形式儲存,應用程式通過HTTP/HTTPS進行訪問。目前,大多數用戶使用由雲端提供的物件儲存服務。主要服務提供商包括Amazon Web Services(AWS)和Microsoft Azure等,這些服務可以根據數據容量和訪問次數等進行按量計費。
在這方面,AWS的「Amazon S3(Amazon Simple Storage Service)」是代表性的服務。自2006年推出以來,它一直在不斷發展,並且有很多用戶。例如,東京海上日動火災保險使用S3構建了數據湖,並建立了數據活用基礎設施。
本文將介紹以Amazon S3為中心的物件儲存的最新動向。
支持「強力的一致性」
AWS通過將多個「可用區(Availability Zone)」組合成「區域(Region)」來構建服務。可用區可以視為數據中心群。Amazon S3基本上是以跨越3個或更多可用區的形式構建的,以提高可用性。
最近的一項功能增強是支持「強力的一致性」。Amazon Web Services Japan技術總監小林正人表示:「以前,我們保證了一定時間後數據會更新的『結果一致性』,但現在我們保證了強力的一致性。」
在使用Amazon S3時,關鍵是如何使用7種儲存類別。不同的類別具有不同的存儲單價和訪問數據時的延遲(延遲)。由於Amazon S3的使用費用取決於數據容量、請求次數和數據傳輸量等因素,因此需要根據數據的使用特性來選擇最適合的類別進行配置。