數位馬克町

數據分析也可能騙人!統計圖表製作的秘密

本文摘錄自《數據的假象》,由天下雜誌出版授權刊登。
作者:卡爾‧伯格斯特姆、杰文‧威斯特;譯者: 穆思婕、沈聿德

編按:高度量化時代,統計數字與圖表製作絕對更會騙人,有統計圖表有照片不一定有真相,點讚、分享、演算法,更助長了這些「類事實」的瘋傳。因此,在現代,培養資訊批判思考力,是最強自我保護力。本書的兩位作者運用統計與生物學領域的專業,以生動幽默的方式,拆解混淆視聽的數據案例,檢視我們的生活是多麼容易受到各類數據假象的影響。只要善用本書的思考方式,人人都能察覺資料有問題,拆穿假象。

如何才能避免自己被圖表所騙呢?

我們要檢視圖表連同其他形式的數據資料視覺化,如何轉移讀者的焦點,混淆 視聽,同時誤導受眾。我們會教各位讀者如何揪出這些圖表類的鬼扯形式,並且說明如何呈現同樣的數據資料會更好。

雖然數據資料視覺化好像很客觀,但設計者對於圖表傳達的內容有相當大的掌控權。使用的數據資料就算正確無誤,設計者還是可能加以操弄,左右我們的感覺。這些人可以無中生有,創造出讓我們誤以為真的關聯性,或是放大各群體間的小差異。

我們必須給下圖的作者一些創意分數,但把圓餅圖扭成羊角,只會降低觀者靠眼睛比較量值的能力

數據分析-圖表

鬼扯就是公然罔顧實情與邏輯之一致性,藉著轉移焦點、疲勞轟炸、或以威脅恫嚇的手法達到說服受眾或使其印象深刻的目的。

數據資料視覺化或許不是百分百的鬼扯,但意圖相仿,就像吸引我們的思維的網路誘餌,它們要的並非點擊率,而是希望緊抓我們幾秒的注意力。柱狀圖或是折線圖或許看來無趣又複雜,但色彩繽紛的圖示可能讓人覺得有趣又具吸引力,足以請君入甕。

一張名為「從現在起只要靠這張就好的全球暖化圖表」就是惡名昭彰的例子。

該圖原為美國保守派作家、史蒂芬.海沃德(Steven Hayward)替保守派新聞評論網站PowerLine創作的表格,後來因為《國家評論》(National Review)雜誌在2015年下半年將其張貼於推特上,又被大家進一步轉載分享。

海沃德解釋自己的圖時如此寫道:

「這下讓人很難激動,可不是嗎?事實上,你幾乎看不出暖化。」

絕對溫度根本無關緊要。沒道理放大到如此程度導致無從觀察型樣。

假如我們想得出氣候是否改變的結論,需要的是像下圖這樣的比例。

(編按:請仔細看左方直列(縱軸)的溫度刻度,上圖的溫度間隔為華氏10度,下圖的溫度間隔為華氏1度;而暖化的溫度變化是些微的差距,因此上圖才會得到平緩的線條。)

Powerline那張圖表不坦誠的地方,是海沃德選擇一個跟自己要說的事情不一致的圖表呈現方式。

他聲稱自己提筆討論的是地球的溫度變化(或無變化),但卻不選擇可以顯露變化值的圖,倒採用模糊變化值而有利於絕對值的圖。

此外,也可能有人操弄橫軸誤導受眾。

簡單的方式大概就是挑出掩蓋部分實情的數據資料範圍。

2018年7月臉書公布一份叫人失望的季財報造成股價大跌。Business Insider的頭條如此大聲發難:「臉書財損,1,200億市值蒸發:美國股市有史以來的最大股災」旁邊附上以下這張臉書四天內的股價變化圖。

一方面,這是市值的重大損失,但這是因為臉書的初始估價太高。

整體而言,臉書的營運表現向來非常優秀,我們或許要將2018年7月的股價跌幅納入如此之背景脈絡,改採橫跨五年而不是四天的圖

用這種方式示意時,我們會看到臉書股價大跌的說法非常不一樣,同時也會看到先前股價大跌後便快速反升的狀況。

雖然我們對Business Insider的圖表是否誤導民眾一事感興趣,但更想指出,呈現的時間範圍會決定說法偏誤的嚴重程度。

閱讀折線圖和相關視覺化表格時要記住這點:確認描繪的時間範圍適用於圖表示意的重點。

本文摘錄自《數據的假象》,由天下雜誌出版授權刊登。
作者:卡爾‧伯格斯特姆、杰文‧威斯特;譯者: 穆思婕、沈聿德

看更多數據分析相關案例:

大數據應用案例:最會利用數據分析的4個企業
數據對行銷有多重要?一張發票隱藏的6大重要數據
10個關於數位行銷的事實與統計

看更多我們為你精選的好書摘錄:

柯達真正的失敗原因:不是太慢轉型,是轉錯方向了
學會就可以默默提升專業能力!教你 2 招練習培養「品味」
走過90年代童工危機,NIKE的循環商業模式
了解這個心理,你也可以改變消費者行為,讓他們照著你說的做!

Exit mobile version