數據孤島(Data Silos),指的是不同組織間的資訊只屬於私人所有,對外處於隱藏狀態,不可被他人取用。就如同每位農夫都將自己種植的農作物留在自家穀倉中,不跟其他人交換或買賣,除了造成資源的的浪費,也減少了自己的潛在利益。
在大數據時代,數據被視為是企業的重要資產,如果運用得宜甚至能成為企業的競爭優勢之一。然而要串接不同渠道的數據本身具一定難度,以下我們將列出目前台灣企業出現數據孤島的常見原因,並說明數據孤島會對企業會造成什麼樣的威脅。
近年來,Google、Amazon、Facebook 等數據巨獸幾乎壟斷數位廣告市場。根據統計,2018年,Facebook 與 Google 兩家公司佔全球除中國外84%的數位廣告業務,Facebook每年全球廣告營收更高達550億美元,如此誇張的市場占比讓人對他們操縱市場的能力有深刻的認知。
在台灣,數位廣告投放同樣集中在Facebook和Google兩大平台上。由於兩家媒體各自推出完整的廣告投遞系統,甚至還有GA和Facebook pixel 等網站流量分析工具,在幾乎滿足品牌所有數位需求的情況下,不少人也提出疑問,「一直使用Facebook、Google的服務有什麼不好嗎?」
短時間內或許不會對市場造成什麼問題,但長遠來看,假如我們對Google的流量計算機制提出質疑時,卻也沒有有效的驗證方式,如同美國百貨商店之父 John Wanamaker所說: “Half the money I spend on advertising is wasted; the trouble is, I don’t know which half.”即是因為大型電商早已形成數據圍牆花園(Data Walled Garden)了,品牌只能觀看由Facebook、Google所提供的成效報表,無法實際留存數據,球員兼裁判的行為讓使用者無法打破數據孤島的限制,只能在大型電商的花園中故步自封。
除了大型媒體壟斷外部數據源外,在缺乏有效數據治理的情況,企業內部也常因不同組織間數據不流通而出現數據孤島的狀況。例如每個團隊儲存資料的地方可能有所不同,有些可能會在部門的主機上,有些則在公司的server中,有些甚至存放於個人的雲端硬碟上。在這個情況下,各部門間無法得知彼此正在進行的業務,往往導致每個團隊都儲存了重複的資料,不僅浪費了公司的硬體資源,也讓團隊間的資訊無法流通。
我們再舉個例子,通常有一定規模的公司都會有一些數據工程師分散在不同的部門中。因為資源沒有整合,工程師們並沒有足夠的開發資源,這時如果企業對數據的需求不斷增長,要求每個部門都需要建立自己的數據庫,則會因為不同部門間的數據無法打通,每位工程師都需要從頭開始開發系統,建立相同的框架和處理相同的底層數據,高度重工的狀況不僅降低工程師的開發效率,也讓公司的人力無法做最妥善的運用。
從上述的案例中我們可以發現企業的數據串接之路有重重阻礙。對外,大型媒體壟斷廣告、流量數據的擁有權,品牌不論投資多少錢都無法拿到原始數據,這是廣告業長久以來的弊病,同時也是數據孤島所造成的劣勢,使企業無法認識到消費者全貌; 除此之外,在公司內部,部門間各自為政,內部資訊的不流通也形成所謂的數據斷層,管理階層無法透過內部資訊迅速檢視公司狀態,進而導致決策風險提升。
為解決台灣企業長久以來的數據痛點,麟數據 LnData 透過多方數據API串接的方式,試圖將企業內外的所有數據打通,並幫助客戶整理成可運用形式,最大化每一筆數據的價值。
延伸閱讀:企業數據中台,協助企業一站式管理組織數據
參考資料:
https://gvlf.gvm.com.tw/article.html?id=58952
https://status.net/articles/data-silos-information-silos/
https://www.alooma.com/blog/what-are-data-silos
https://medium.com/mediarithmics-what-is/what-is-a-walled-garden-and-why-it-is-the-strategy-of-google-facebook-and-amazon-ads-platform-296ddeb784b1
https://blog.openbridge.com/data-silo-de9a1dcfb1ac
http://www.vamsitalkstech.com/?p=4337
https://www.plixer.com/blog/data-silo-what-is-it-why-is-it-bad/