AI棋力勝人類, 重回原點思考「我們為什麼下棋?」

圍棋的本質是遊戲,有趣好玩的是過程不是輸贏


拿出A4大小的紙版,旅日棋士王銘琬開始教現場記者下「純棋」。他讓記者3子,棋局不到10分鐘就結束。他笑嘻嘻反問:「是不是很簡單?」純棋是由王銘琬設計的「簡化版圍棋」,他宣稱3∼100歲的人都能懂。規則只有3條:棋子下在交點,包圍對方棋子就可提取,最後以棋盤上棋多者為勝。
在他耐心的解說下,純棋真的很簡單,但攤開這位九段職業棋士的經歷,一點也不簡單。

王銘琬4歲開始學棋,13歲前往東京,離台前,跟清大教授沈君山大戰7盤,以4比3獲勝,獲得「圍棋小神童」封號。赴日後,15歲成為職業棋士,38歲成為「本因坊」(日本圍棋7大頭銜中,歷史最久的頭銜),並在40歲獲得「王座」,生涯擁有20幾座冠軍。截至目前,累積勝局數達1100勝,在日本棋史排名第16。
一步棋可想8小時, 獨創「空壓法」近似AI下法

與棋為伍超過50年,對王銘琬來說,圍棋像家一樣,「你出去外面一整天,但終究會回家。」不過,王銘琬坦言,自己從小其實討厭下棋,看別的同學在外面玩得開心也會心生羨慕,甚至到拿頭銜前,他笑稱:「我本能上還是有衝動想做圍棋以外的事。」

相比於職業棋士不斷排棋譜、參加各式研究會,王銘琬自嘲不是用功的棋士。儘管如此,一到比賽,王銘琬總能全心投入,「我可以想一步棋就是8小時。」即使日本比賽最久會持續兩天,從一早下到晚上,隔天再繼續,王銘琬卻笑說進入比賽後,兩天完全不夠。

比賽勝負難免有起伏,王銘琬也曾碰到一連好幾盤下不贏的情況,問他如何克服瓶頸?他卻說:「一直想衝過去、卻無法衝過去才叫瓶頸,但我當時沒這樣的想法。」他自覺沒有包袱,採取跟當時棋手不同的布局,反而效果奇佳。變化多端的棋風讓他贏得「銘琬世界」「怪脘」等美譽,進而發展出自己獨特的「空壓法」。

所謂空壓法,是先「開創比對方大的有利空間」(空),再「從寬廣面來壓迫對方」(壓),概念上放眼全局,不只聚焦在局部。這點其實跟圍棋AI的邏輯相似,韓國棋王趙治勳曾說:「王銘琬下法最像AI下法。」
AlphaGo棋力遠超過人類, 重回原點思考「我們為什麼下棋?」

過去,電腦雖在西洋棋、將棋已能下贏人類,但獨獨圍棋始終未能攻克。Google旗下人工智慧公司DeepMind創始人暨執行長傑米斯・哈薩比斯(Demis Hassabis)解釋,由於一步棋背後還有200種下法,而每步棋又會影響下一步走法,故棋局總變化數目比全宇宙的原子總數還多,就算全世界電腦運作100萬年,也難以估算所有變化。
未料圍棋AI軟體加上「深度學習」(deep learning)技術後,能模擬人類神經思路,加上機器的運算力,能精確判斷每個局面的勝率。也就是說,軟體並不在意這一手「是否漂亮」,只在意能否實際提高勝率。「這是AI最珍貴的資產,因為多數棋士只能說出這手棋的好壞、大致的局勢,很難用勝率來思考下一手,」王銘琬說。

這套概率思維,讓圍棋AI如虎添翼。2016年,圍棋軟體「AlphaGo」以4比1擊敗韓國頂尖棋士李世石(乭);隔年,進階版本「Master」以3比0打敗當時世界排名第一的中國棋王柯潔。顯然,人類棋力完全在圍棋AI之下。這個看似悲傷的結論,王銘琬反而認為是一個很好的機會,讓所有棋士退回原點思考:「我們究竟為什麼下棋?」

王銘琬認為,輸贏是機制,目的是讓雙方拿出最好的表現下棋,他也曾經很在意勝負。但圍棋的本質是遊戲,一盤棋之所以印象深刻,往往不是最後的輸贏,而是下棋過程中的「故事」。「真相或許是『我們需要遊戲』。你跟朋友玩遊戲,多數不是因為想贏對方,而是因為有趣,玩的過程當中兩人都獲得獨一無二的經驗與回憶。」儘管遊戲無法讓人吃飽,人還是下了幾千年的棋,關鍵就在於每一手棋都反映個人的主張。

對他來說,印象最深刻的棋有兩場,一場是成為本因坊,讓他備受肯定;另一場是他國中時受邀去特教班跟同學下棋的經驗。當時,特教班學生常一臉陰沉,王銘琬說,沒想到在下棋時,他看到對方按照自己心意下棋、露出從沒見過的開心表情。「我第一次感受到圍棋可以讓人快樂的威力,棋盤上我們擺脫社會平常的框架,講同一種語言,我們都是平等的,」他說。

這兩年,王銘琬成為台灣純棋推廣第一人,致力奔走台、日兩地,跟超過5000人講解純棋。每次教完一盤純棋後,他還會親自詢問對方名字,慎重地寫在贈予對方的檢定狀上。「現在我希望讓圍棋這個家愈來愈熱鬧,」他笑得一臉燦爛。

閱讀完整內容
經理人月刊第184期

本文摘錄自‎

AI棋力勝人類, 重回原點思考「我們為什麼下棋?」

經理人月刊

2020/3月號第184期