別讓數字欺騙你:後真相時代的統計數據解讀指南


第一章 排名執念


頂尖之選

我在谷歌搜尋「年度最佳」,得到六千八百四十萬筆結果。年度最佳博物館、年度最佳商業分析、年度最佳國會議員、年度最佳年金計畫、年度最佳布道、年度最佳掘墓工、年度最佳棺材供應商,還有好幾種獎項的年度書籍、年度樂手、年度員工,甚至還有年度最佳廁所,以及年度最怪書名,1這個獎項在二○一七年的熱門競爭者有《我膝蓋上的乳頭》以及《雷尼克斯澳洲前十進制及十進制硬幣錯誤:澳洲前十進制及十進制硬幣錯誤的首要指南》。

為了爭奪一個有可能到手的頭銜,民眾競爭之激烈實在教人驚訝。報導時有所聞,有些園丁會在死寂的深夜破壞對手的獲獎園藝作品,2而隨著鳥類愛好者競逐稱霸排行榜的激戰,理論上應該相當溫和的賞鳥嗜好在英國變得「超級野蠻」,3《華盛頓郵報》特派員費奧拉是這麼形容的。在某些情況下,獎項會激勵民眾提供更好的服務或產品,而且可以替贏家帶來滿足和自豪感,不過為數眾多的落敗者共同產生的消沉和怨恨感受可能會抵消這樣的成效。

除了帶給競爭者的歡欣或悲傷之外,排名和獎項還可能對我們的決策產生重大影響。我們也許會選擇年度最佳大學就讀,購買入選年度最佳汽車的掀背車,根據年度最佳金融顧問的說法投資儲蓄,或者推廣贏得年度最佳期刊論文獎的學者。那麼,選擇「高居榜首」的選項,真的就代表我們做出了頂尖之選嗎?

有時候排名就是在拿蘋果比橘子,如果你無法分辨,那就丟個硬幣吧。既然獎項已經備妥,最後就是要有人勝出,不然場面就尷尬了。好幾年前,我有個親戚臨危授命,鄰居找他一起擔任一個青少女團體舞蹈競賽的裁判,因為其中一位常任裁判忽然身體不適。「但是我完全不懂舞蹈。」我的親戚抗議。「別擔心,他們會給你一個排名表格,隨便寫點什麼上去都行,我就是這麼做的。」鄰居咯咯笑著說。或許在某個地方,有一位中年婦女懷想起她們的隊伍贏得年度最佳舞團的那一天,還驕傲地拿出照片給孫子們看。

就算我們想要誠正信實地替參賽者排名,但如果爭奪首位的人選太多,我們還是很可能陷入困境。報紙和雜誌上有定期專欄告訴讀者倫敦的最佳用餐地點、年度最佳汽車,或者值得一讀的最佳新書。當然了,嚴格說起來,這些「最佳」的說法都不可能精確,除非每一個參選者都經過詳盡的評估和比較。這些專欄的作者吃過倫敦的每一家餐廳嗎(倫敦至少有一萬七千家餐廳)?他們開過每個廠牌去年推出的每一款新車嗎(光是二○一八年的前九個月,預期至少就有六十七款新車)?他們又讀過每一本新出版的書了嗎(英國在二○一五年的新書出版數字估計為十七萬三千本)?4

對美國心理學家施瓦茨所謂「最大化者」這類人來說,做出頂尖之選可能是特別重要的一件事。最大化者會把大部分時間用在不屈不撓地尋找更好的工作、更好的車子、更好的居住地。在施瓦茨的診斷問卷上,其中一個問題詢問受訪者是否同意以下說法:「我看待關係如同穿衣:我預期自己會試穿很多衣服,最後才能找到完美合身的那件。」另一個問題則詢問受訪者認為自己有多符合以下描述:「清單愛好者,傾向替事物排名(最佳電影、最佳歌手、最佳運動員、最佳小說等等)」。

你很可能會看見最大化者不停在切換電視頻道,因為別台可能有更好看的節目,或者在店鋪裡待上好幾個小時,煩惱什麼才是值得買的最好產品。他們對於寫電子郵件或傳簡訊也有障礙,因為語氣一定要恰到好處。他們的思緒常常被後悔和自責淹沒,因為他們發現,儘管自己做了那麼多努力,卻還是錯過了最好的選擇。

我記得有一次,我和一個朋友在安排西班牙的安達魯西亞假期,每次我覺得已經協調出某個決定了,我們就會忽然想到這個決定的缺點,也許價錢太貴,而且得坐在小型巴士上的時間太長了。於是我們查看了比較便宜的選項,但是感覺都比不上第一個選項吸引人,我們本來要入住的度假村風景如畫,坐落在群山裡,但現在卻改成落腳在繁忙城鎮的水泥旅館樓房。也許第一個選項終究還是最好的,但是又想想……人生對「滿足化者」來說可能輕鬆得多( 「滿足化者」是美國經濟學家暨諾貝爾獎得主司馬賀發明的術語),這一類的人願意接受「還行」的東西,不必然非得要是最好的,所以他們就沒有這種對於排名的執念。

決定過載

最大化者所承受的痛苦,有部分是來自比較各種選項的困難。當我們在選購車輛時,某個車款可能寬敞、有型、小功能齊全又可靠,但同時也可能很耗油,即使開在平坦的路面上還是很顛簸,隔音又很差。另一個車款也許安靜、節能又可靠,但或許外型相當老氣,空間也比第一款局促了些。如果你手上這份清單列出的各種待售車款全都有著像這樣的不同優缺點,你要怎麼排名?又要怎麼找出最好的選擇呢?

心理學家發現,在類似的情境裡,我們難以處理所有牽涉到的資訊。明確來說,我們面對的挑戰是要在腦中進行取捨。車內要有多大的腿部空間,才足以彌補每公升汽油少跑的里程數?更齊全的小功能能否彌補較顛簸的駕車體驗?為了避免想到頭痛,我們於是改採用簡化原則。消費者使用的策略之一,就是先根據你認為最重要的一項準則(或許是可靠度)對各種車款排名,並且忽略其他準則。5如果有兩個車款在這項標準上平分秋色,那就再根據第二重要的準則(比如說耗油量)排名,以此類推。這個簡單的方法有個不相稱的冗長名字,叫作「字典編序排名法」,因為運作過程類似字典對單字進行排序的方式。需要擔心的是,這種做法最後選出的車款雖然特別可靠,但有可能其他方面全都很糟糕。

另一個策略是替各項準則設定一個合理的限度,然後把清單上那些不符合條件的車款全部刪除。6所以我們或許能夠擺脫那些每公升汽油跑不到500公里的車款,接下來是那些腿部空間不足120公分的,再來是行李空間太小的,以此類推,希望最後會只剩下一款車。麻煩的是,如果有某個車款雖然每公升汽油只能跑498公里,但是其他所有面向都超棒,那麼這款車有可能會遭到排除。

這個方法叫作「逐步排除法」,有些雇主會用這招把大量的求職表格縮減成易於管理的短清單。試想,該有多少優秀的求職者從來沒能進入短清單,就因為考試成績略低於某個任意設定的標準,或者因為相關領域的工作經驗短少了一個月,沒有達到經理在苦惱之下隨便決定的年數標準。

在某些情況下,我們可以盡可能不費心力,只管選擇自己叫得出名字的車款,那些聽都沒聽過的就別管了。心理學家把這種做法稱作「辨識捷思」,7有些時候這一招還算有點道理,因為叫得出名字來的產品通常已經上市很長一段時間,所以早就有人試用、測試過了。但是如果我們每個牌子都認得,那麼這個辦法就沒用了;或者,也許沒看過的牌子其實比其他競爭產品更厲害,搞不好那就是一個又新又有創意的品牌。

訴諸直覺終究還是個很吸引人的做法。不如就選一款停在路邊會讓鄰居印象深刻的車吧,或者就選那個散發正能量、看起來最好相處的求職者好了。畢竟我們永遠都可以回頭替自己的選擇想出一個理由,讓這個決定看來彷彿經過深思熟慮,而且也是最合理的。

小組悖論

大多數的書籍、汽車、球員或員工的「年度最佳」獎項,都是由評選小組決定的,而不是出自個人判斷。舉例來說,二○一八年的布克小說獎有五位評審,英國年度汽車獎則有二十七位。我們常說三個臭皮匠勝過一個諸葛亮,那麼五個或二十七個臭皮匠照理來說應該更強大,可以產出一組真正值得信賴的排名。我們唯一需要的,就是要求專家小組替每個參賽者排名,然後讓每一位評審都對自己的最愛投下一票,吸引最多選票的那一個就是贏家。不幸的是,十八世紀的法國哲學家兼數學家孔多塞侯爵已經證明,在某些情境下,這種做法可能會造成非常奇怪的結果。

孔多塞出生於一七四三年,以他的時代來說,他的觀點非常進步。他贊成女性選舉權,譴責奴隸制度,他捍衛人權,並推動反死刑運動。他積極參與法國大革命,最終與當局發生衝突,躲藏一段時間之後遭到當局逮捕。被捕兩天後,他在獄中因為不明原因死亡,但是他的影響力至今猶存。作為民主的信徒,孔多塞很早就將數學應用在投票系統分析。一七八五年,他寫了一篇文章,說明我們現在所謂的「孔多塞悖論」。

假設一個由派克、昆蘭和羅傑斯三位裁判組成的小組,他們要選出年度胡言亂語獎,這個獎項是為了表彰在過去十二個月內說出最反智言論的名人(事實上並沒有這樣的獎項,但是白話英文運動組織有一個「語焉不詳獎」,選出公眾人物最令人困惑的言論,最近的得主包括國會議員芮斯莫格、喜劇演員布蘭德、美國總統川普、企業家馬斯克,和參議員羅姆尼)。三名參賽者已經進入短名單,但是為了避免他們尷尬,我們就簡單把他們稱作A、B和C。裁判群對這三位名人的排名如下(以派克為例,下方的表示法代表派克認為名人A是最佳人選,名人B和名人C依續排名在後):

派 克:A B C
昆 蘭:B C A
羅傑斯:C A B

為了簡化他們的決定,裁判群同意對所有人選捉對比較。有兩位裁判偏好名人A勝過名人B,所以A得到的票數多過B;也有兩位裁判偏好名人B勝過名人C,所以B得到的票數多過C。既然A打敗B,而B打敗C,看來最終結論已經出爐了。但就在我們準備宣布由A勝出的這一刻,忽然有人指出,如果我們比較A和C,那麼C拿到的票數還比較多。孔多塞讓我們發現自己陷入一個永無止盡的偏好迴圈,而這種特質叫作「非遞移性」。評選小組裡的多數意見偏好A勝過B、偏好B勝過C,但這下奇怪了,多數意見同時也偏好C勝過A。更糟糕的是,聰明的小組成員可以操弄投票過程,確保自己最不喜歡的人選不會勝出。他們可以藉由扭曲自己的真實偏好來達成這個目標,這就是所謂的策略性投票。

距此超過一百五十年後,就在第二次世界大戰剛結束之時,美國經濟學家阿羅以他的「阿羅悖論」擴展了孔多塞的發現,8讓他贏得了一九七二年的諾貝爾經濟學獎。阿羅證明,如果參與排名的競爭者超過兩個,沒有任何投票系統能夠保證絕對符合一系列的合理條件,包括避免非遞移性、團隊裡不能有獨裁者,還要確保如果評選小組中的每個成員都比較偏好其中一個競爭者,那麼投票結果就要能夠反映出這一點。第二次世界大戰後,世人都希望能建立一個美麗新世界,而阿羅的證明看似投下了陰影。阿羅悖論顯示,設計一個完美的民主系統不過是一場白日夢,同時也顯示,雖然個人能夠擁有一致的偏好,但群體是做不到的。如果一個小組裡的幾位專家偏好一款車,但其他專家偏好另一款,那麼宣稱這個團體偏好某個車款勝過另一款,就不成道理。我們常聽到政治人物說:「選民已經透過選舉結果表示,他們想要的是……」但這種說法有可能是真的嗎?在二○○七年威爾斯的一場選舉結束後,一位議員告訴媒體:「選民已經告訴我們,他們不想要一黨獨大,這是我們都得解決的問題。」9可是我在投票的時候,我可不記得選票上有「不要一黨獨大」這個選項。

如果投票不能保證產出完美的排名,那也許我們需要的,就只是聚集一群專家,坐下來一起好好思考誰(或什麼)應該贏得某個「年度最佳」獎。但是把一群人集合在一起商討事情,他們也可能會有非常奇怪的行事方式。武斷又多話的個人會主導討論程序,所以只有這些人的看法會反映在團體的最後決定裡。更糟的是,在一個高度從眾,而且沒有人想要製造爭端的團體裡,成員甚至可能會忽視現實,這種現象叫作「團體迷思」。10在這樣的團體裡,每個成員都覺得自己應該發言支持團體領導者提出的立場,即使這個立場顯然不明智、錯誤,或是魯莾。不同意的人會保持沉默,並且開始懷疑自己的看法。最後,團體可以很有信心地做出在任何外人眼中看來瘋狂的決定… 閱讀完整內容
別讓數字欺騙你:後真相時代的統計數據解讀指南

本文摘錄自‎

別讓數字欺騙你:後真相時代的統計數據解讀指南

保羅‧古德溫

由 貓頭鷹出版 提供