經濟學與賽局理論

賽局理論又被稱為博弈理論,是一種研究「互動決策」的理論。在經濟互動中,其中每一人的決策都相互影響——也就是說,在決策時,也必須將他人的決策納入自己的決策考慮中,當然也需要把別人對於自己的考慮,納入考慮中……如此重複斟酌後,最後選擇最有利的策略。
相互背叛的囚徒:囚徒困境

一九五〇年,數學家塔克任史丹佛大學客座教授時,為一些心理學家演講,說了兩個囚犯的故事——

有兩個小偷甲、乙聯合犯案,私入民宅被警察抓住,警方將兩人置於不同的房間內審訊,對每一個犯罪嫌疑人,警方給出的選擇是:

A:如果一個犯罪嫌疑人坦白罪行,交出了贓物,因證據確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也坦白,則兩人各被判刑八年。
B:如果另一個犯罪嫌疑人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑兩年,而坦白者有功被減刑八年,會被立即釋放。
C:如果兩人都抵賴,警方會因證據不足無法判兩人的偷竊罪,但可以私闖民宅的罪名各判入獄一年。

三種可能,三個選擇,足以讓身在其中的囚徒絞盡腦汁,寢食難安。

如同經濟學的其他例證,我們需要假設兩人都是理性的經濟人,他們都尋求自身最大的利益,而不關心另一個參與者的利益。

現在,這兩個囚犯該怎麼辦呢?是選擇相互合作還是相互背叛?從表面上看,他們應該相互合作,保持沉默,因為這樣他們將得到對雙方來說最好的結果——只判刑一年;但由於資訊被封閉,兩人無法交流,他們不得不考慮對方可能採取的選擇。由於甲、乙兩個人都尋求自身最大利益,所以他們都會優先考慮如何才能減少自己的刑期,至於同伙被判多少年,早已經顧不上。

甲會這樣推理:假如乙不招,我只要一招供,馬上就可以獲得自由,而不招卻要坐牢一年,顯然招比不招好;假如乙招了,我若不招,則要坐牢十年,他卻獲得了自由,而我招了也只坐八年,顯然還是招了好。可見無論乙招與不招,甲的最佳選擇都是招供。所以甲最終決定:還是招了吧。

甲知道該怎樣做了,而相同邏輯對另一個人同樣適用,因此乙也會毫不猶豫地選擇背叛——也就是招供。

這樣一來,甲、乙兩人都選擇招供,這對他們個人來說都是最佳的決定,即最符合他們個體理性的選擇。而他們各自最理性的選擇,給他們帶來的並非最佳結果(自由),也非較佳結果(一年刑期),而是比最壞結果(十年)要略好的結果(八年刑期)。
順便提一下,這兩人都選擇坦白的策略,因此被判八年的結局,被稱作是「納許均衡」(也叫非合作均衡)。所謂納許均衡,指的是參與人的一種策略組合,在該策略組合上,任何參與人單獨改變策略都不會得到好處;換句話說,如果在一個策略組合上,所有人都不會改變策略時,該策略組合就是一個納許均衡。納許均衡是賽局理論中一個重要的概念,以普林斯頓大學數學博士生約翰·納許命名。

並非要觸犯刑法,才會深陷極為被動的囚徒困境中;事實上,在我們工作與生活中,類似的囚徒困境並不少,人為製造囚徒困境(而自己充當警察)來保證自己利益也屢見不鮮。哈佛大學巴蘇教授著名的「旅行者困境」,可以提供一個視角——

兩個旅行者從一個以出產細瓷花瓶著稱的地方旅行返鄉,且他們都買了花瓶。但在提取行李時,他們卻發現花瓶被摔壞了,於是向航空公司索賠。航空公司知道花瓶的價格大概在八、九十元的價位浮動,但不知道兩位旅客購買的確切價格。於是,航空公司請兩位旅客在一百元內寫下花瓶的價格,如果兩人寫的一樣,航空公司就認為是實話,就按照他們寫的數額賠償;如果兩人寫的不一樣,航空公司就認定寫得低的旅客講的是真話,並原則上以這個低的價格賠償。同時,航空公司會對誠實的旅客獎勵兩元,對說謊的旅客罰款兩元。

就為了獲取最大賠償而言,本來甲乙雙方最好的策略,就是都寫一百元,這樣兩人都能夠獲賠一百元;可是,甲聰明的想:如果我少寫一元變成九十九元,乙會寫一百元,這樣我將得到一百〇一元,何樂而不為?所以他準備寫九十九元。

可是乙更加聰明,他算計到甲要寫九十九元,於是他準備寫九十八元;但想不到甲又更聰明,估計到乙要寫九十八元坑他,於是準備寫九十七元——就像下棋,都說要多「看」幾步,「看」得越遠,勝算越大。

你多看兩步,我比你更強,多看三步;你多看四步,我仍比你老謀深算,多看五步。在花瓶索賠的例子中,如果兩個人都「徹底理性」,都能看透十幾步,甚至幾十步、上百步,那麼「精明比賽」的結果,最後會落到每個人都只寫一兩元的地步。事實上,在徹底理性的假設之下,這個賽局的結果是:兩人都寫〇元。

是的,在賽局中,最好就是讓自己當制定規則的人;如果不幸淪為「囚徒」,就努力互通資訊,建立信任——唯有如此,才能讓自己利益最大化。比如三、四個扒手公然在巴士上行竊,一車人卻都不敢做聲。本來如果一車人群起攻之,就可以輕鬆制服幾個毛賊,但卻因為彼此不熟悉,擔心自己一出頭就挨打——最後雖然沒有挨打,但還是損失了財物。類比囚徒困境中的囚徒,等於大家都被判了「八年」,比挨打的「十年」略好,卻錯失了被「釋放」的機會。

最後,編者想要說的是:一個畫地為牢、只考慮自身利益的人,遲早會落入囚徒困境,左右為難。唯有加強合作與溝通,建立充分的信任,才能創造出雙贏乃至多贏的局面。

閱讀完整內容
佛系經濟學

本文摘錄自‎

佛系經濟學

肖勝平

由 行路 提供