數據虛擬化在實用期間內,解決了“複製基礎DWH”的問題。

「資料虛擬化」是一種虛擬整合資料的方式,不需要從資料來源複製資料。例如,轉職服務公司Persol Career已經開始在跨部門的資料收集中使用這種技術,進入了實際應用階段。現在,讓我們來看看這種技術的機制和使用上的注意事項。

數據虛擬化在實用期間內,解決了“複製基礎DWH”的問題。

在DX推進的需求不斷增加的情況下,需要更高級的「數據利用」。為了收集更多的數據,更快速、更仔細地進行分析,必須利用最新的工具和服務。本文將介紹「對於數據利用來說的新三種神器」,即「對象存儲」、「數據虛擬化工具」和「數據連係雲」的功能和應用方法。本次將介紹數據虛擬化工具。

在進行數據分析時,收集內外部數據並構建數據倉庫(DWH)的用戶很多。然而,隨著分析源數據的DWH或數據庫等「數據源」的種類和數量增加,其弊端也變得明顯。

Denodo Technologies的解決方案顧問菊池智功指出:「經常會整合無法使用的數據。」他解釋說:「從網站、交易、Web等方面的數據源中收集數據,但由於不知道哪裡有哪些數據,因此很難進行收集。」

解決這些問題的技術之一是「數據虛擬化」。在不複製數據的情況下,虛擬地整合數據。例如,轉職服務的Persol Career利用它來收集跨業務部門的數據,可以說已經進入實用期。讓我們看看其機制和使用上的注意事項。

在試驗和錯誤中收集有用的數據

Denodo Technologies(德諾多科技)的「Denodo Platform(Denodo)」和TIBCO Software(TIBCO軟體)的「TIBCO Data Virtualization(TDV)」等數據虛擬化工具的基本機制是相同的。在連接到數據源之前定義所需的數據。當訪問請求發生時,根據定義參考所有數據源的數據,將最新的數據作為虛擬表格(View,視圖)統合。

「従来型DWH」と「データ仮想化」の違い
「傳統型DWH」和「數據虛擬化」的區別

數據虛擬化有幾個優點。其中一個是可以輕鬆地並且在試驗和錯誤中收集分析對象的數據。由於可以看到數據源的內容,因此可以在查找數據和項目名稱等時進行有用數據的選擇和篩選。對於數據源如「銷售額」或「庫存」等,項目名稱和數據的意義可能不同,但更換或重新解讀等都很容易。

傳統的DWH通常會複製數據來收集,這樣做會有試驗和錯誤的困難。NTT Com Online Marketing Solution TIBCO部門的高級顧問池田義幸表示:「在以前的瀑布式方法中,需要調查數據,包括未來的要求,以決定分析對象的數據,並需要全面設計數據庫。」

為了連接各種數據源,TDV準備了大約350個適配器。除了CSV文件、RDBMS、NoSQL等之外,還有針對雲端服務的適配器,例如美國亞馬遜網路服務(Amazon Web Services,AWS)的對象存儲「Amazon S3(Amazon Simple Storage Service)」和美國谷歌(Google)的DWH「BigQuery」。

在連接到這些數據源的同時,在GUI(圖形用戶界面)上設置數據的結合、轉換和視圖的創建等。池田高級顧問表示:「只要有Excel的重度用戶程度的技能,即使不是工程師,也可以設置視圖。」

Telegram : @Alan5808

Line : @286fhkvy

Youtube : @kingcloud85

FB : https://www.facebook.com/kingcloud.tech/