別太相信大數據

網路新時代,我們的數位足跡已把整個世界變成一個龐大的數據庫,從出生到死亡的大小事,都可藉由資料的探索,發現新模型,解答以前未能解答的問題,並達到精準預測。 大數據影響每個人與企業,呈現每個人、每一刻鐘在網路上無意識的反射,它可能比你更了解自己,對企業而言,統計的樣本量越大,錯誤與不確定性越低,就越可靠。
儘管如此,大數據並不能取代嚴謹的研究設計,真正的問題不在大數據本身,而是對研究問題的思考、蒐集、調查與評估,數據詮釋的方式不同,呈現出來的結果,有時候反而造成誤導。
任何從觀察中所得到的知識,先天上都存在著陷阱,用大數據看世界同樣有這些缺點:


麥納馬拉謬誤
過度相信數據、依賴數據評估事情,會讓人專注於衡量可估算或只容易衡量的部分,忽略難以量化的事,或者賦予常數,而造成決策錯誤。
避免麥克納馬拉謬誤的唯一解方,是知道理性的極限,與敬畏那不可估算,有時無法計算的,往往比可以計算的重要多了,例如企業誠信與品牌價值比銷量重要多了。


為了數據而數據
過度著迷或關注數字的趨勢,可能會產生焦慮,養成毫無助益的行為模式,在工作上事倍功半,甚至影響到心理健康和人際關係,反受數字控制。
例如;為衝高粉絲團的人數或點閱數,漫無方向大量貼文,但無意義或不相關的點閱,不僅不能傳達品牌的意涵,反而為了美化數據,失去品牌應該堅持的方向,造成品牌稀釋的負面效果。


相關不等於因果
只要數據量夠大,幾乎可以在任何事情間發現相關性,甚至你想要的結論,都可以擬出偽相關。
例如,大數據可呈現名校畢業和賺很多錢有關,但這只是相關關係,而且是多元的相關關係,其它如長相、行業、冒險精神等都與賺錢多寡相關。
許多事情的發生,往往都是複雜系統中,多元因素共同作用的結果。


群聚錯覺
人類喜歡規律,討厭不確定,所以大腦往往會在隨機事件中尋求規律,並且只注意對自己有利的,想看到的事物,找不出模式規則時,大腦會自己發明。
數據中可能找到某種特定的規律,也許剛開始確實如此,但世間純屬巧合的事情比你想像得多,直到你投入越多,最終失去一切時,才會看到一個根本不存在的規則。
例如,主人每天都會餵食好飼料給火雞,因此火雞對主人越來越信任,直到有一天成為盤中飧,才發現主人根本不是對火雞友好。
我們總是傾向從個別的觀察作為代表性判斷的依據,但往往一個反例就足以推翻經過上千次證明的理論。


過度思考嚴重阻礙決策進程
數據可以改變我們的思維和行為,但過度依賴數據猶如迷信者作什麼事都要先求神問卜一樣,反而製礙難行,被數字牽著走。
在特定領域有大量經驗,大腦就會有更多的信息來比對當下的情況,讓直覺更可靠。情勢複雜,難做決策之時,應該兼顧直覺和分析兩種思維,認真權衡此時二者中哪一種更為可靠。


不要天真的完全靠大數據
理性會因為自身的經驗不足而產生漏洞,大數據背後的數學模型也並非完全公正客觀,有時是承載著研究機構的觀念和滿足自身利益的動機。
許多事情是人為努力的結果,無法預測和理性看待,人類心智的偏見,容易高估或低估而失靈,如果有人能預測未來,那都是騙人的,正確答案是未來無法預測,我們能做的不是放棄追尋或胡亂猜測,而是設法提高準確性,找出可能性較高的答案,也許不是正確答案,確是一個比較好的答案。


作者:飛盟廣告設計 印刷 經理/王焜台