大數據與比方說,1950年代收集的數據有何不同?
其實不僅是數量,我們收集的數據類型也起了變化。
從前的數據是關係型(relational)的,內容要簡單得多,並且可以輕鬆地以圖表表達,好像把客戶放在一列,客戶訂購的產品放在另一列去進行比較。
反之,大數據都是非結構化(unstructured)的數據,內容非常混亂,不能以同等方式處理。
假設有人發推特短文(tweet),說正在考慮你的產品。該短文可以包含許多數據,包括他的年齡、愛好、家庭成員人數和教育程度等,加上發文的人有如恒河沙數,數據浩瀚而繁多,因此你無法把所有短文都化成圖表,這造成了數據的非結構化。
現在,80%以上的企業數據都屬於這種非結構化數據。如果我們能夠學懂管理非結構化數據,我們將能夠深入理解消費者的行為。
網飛(Netflix)就是一個好例子。他們追蹤用戶觀看電影的地點、時間和次數,以及他們所使用的設備,又監察用戶在面書和推特上對公司的評價。
2011年夏天,網飛有見流失80萬名用戶,便分析客戶在社交媒體上對它的評論,發現因為旗下的DVD郵寄服務Qwikster重新命名及更改定價,導致許多客戶解約。於是Netflix放棄了名聲欠佳的Qwikster,業務遂重上正軌。
《大數據應用》的內容要點:
©2021-2024 點點閱有限公司版權所有