誰讓回饋意見無效?

關於職場回饋意見的辯論,不是什麼新鮮事。最晚在上個世紀中期,「如何讓員工改進」這個問題,就已經引發許多看法和研究。但是近來,這個話題的討論又增添了新熱度。

在橋水投資(Bridgewater Associates)持續進行的「極度透明」(radical transparency)實驗,以及網飛(Netflix)的文化(最近被華爾街指為「鼓勵提出嚴厲的回饋意見」、讓工作者接受「密集而難堪」的即時360 度評量);這些只不過是堅信以下這個信念的兩個例子:嚴格、頻繁、坦誠、廣泛、通常屬批判性質的回饋意見,有助於企業提高績效。
我們思考:應該如何給予、接受回饋意見?應給予多少回饋意見?頻率如何?該使用哪個新的應用程式(app)?此外,既然橋水和網飛的做法引發了種種關注,那麼我們的坦誠態度應該尖銳、無畏到什麼程度?但這些問題背後還有另一個遭到忽視的問題,而且是關鍵問題。人們尋找一些方式來給予和接受更好的回饋意見,這背後是假設回饋意見一定是有用的。我們尋求回饋意見的唯一理由,是回饋意見有助於他人改善表現。但當我們檢視這一點時(也就是詢問:「如何協助每個人茁壯成長、表現優異?」),我們找到的答案卻指向不同的方向。

明確地說, 真正有用的是「指示」(instruction),也就是告訴別人應遵循哪些步驟,或是他們缺乏哪些有關事實的知識(factual knowledge);正因如此才會出現飛機駕駛艙檢核表,後來又出現手術室檢核表。確實有一套正確的方法,能讓護理師安全地打針,而新手護理師若是遺漏任何一個步驟,或是不知道關於病患狀況的重要事實,那麼就應該有人明白告訴他。但是,現在很少有工作能夠事先界定應採取哪些行動或知識,才能達成最低執行成效,而且這樣的工作會愈來愈罕見。我們所謂的「回饋意見」,完全是另外一回事。回饋意見是要告訴別人我們對他們的表現有何看法,以及他們應該怎麼做會更好,無論對方要做的是有效的簡報、領導團隊或制定策略。就這一點來說,研究清楚地顯示:告訴別人我們對他們的表現有何看法,這麼做無法協助他們茁壯成長、表現優異;而告訴別人該如何改進,其實會阻礙學習。

回饋意見百益無一害?三個自我中心理論,無法提升生產力

現在這種認為回饋意見是百益而無一害的想法,源自商業界普遍認為是真理的三個理論。第一個理論是「旁觀者清」,別人比你更能察覺你自己的弱點,因此幫助你的最佳方法,就是讓旁人指出你自己的盲點。我們稱此為「真相來源理論」(theory of the source of truth)。你不知道自己的套裝破舊寒酸、你的簡報沉悶無聊,或是你的聲音粗啞刺耳,因此要靠同事盡可能坦白告訴你「你的真實處境」。如果他們不說,你永遠不會知道,而這就糟了。

第二個信念是,學習的過程就像是填充空的容器:你缺乏某些必備能力,因此同事應該要教你。我們把它稱為「學習理論」(theory of learning)。如果你從事銷售工作,但沒有學會「鏡像模仿與配合」(mirroring and matching)潛在顧客的能力,你怎麼可能成交?如果你是教師,卻沒有學會並實際運用最新的團隊教學技巧或是「翻轉教室」教學形式,你怎麼會進步?根據這派理論的想法,上述問題的答案都是否定的,而你需要回饋意見,才能培養你欠缺的技能。

第三個信念是,優異的表現是普遍相同的,可以分析、描述出來,而且一旦定義清楚,就能從一個人身上轉移到另一個人身上,無論誰都可以套用。因此,你可以根據回饋意見所描述「表現卓越」該有的樣貌,了解你哪裡不符合這個理想樣貌,然後努力修補自己的不足。這種想法,我們稱之為「卓越理論」(theoryof excellence)。如果你是經理人,你的上司可能會告訴你公司的「主管行為模型」,根據這一點來評斷你,並告訴你必須怎麼做,才能更接近這個模型。如果你志在成為領導人,你的公司或許會運用360 度回饋意見工具,根據公司預先設定好的領導能力,來衡量你的表現,然後建議你應參加哪些課程、累積哪些經驗,以培養評量結果顯示你所缺乏的那些能力。

這三個理論的共同點是自我中心:它們把我們自身的專業水準,以及我們認定同事專業能力的欠缺之處,都當成既定事實;它們假設:我的卓越之道必然也是他人的卓越之道。但實際情況是,我們認為自己創造良好績效的因素,別人應該也可以用來創造良好績效,這樣的推論其實過度牽強。
研究顯示,前述三個理論都不對。我們愈是仰賴它們,愈是以它們為基礎來開發更多的技術,其他人的學習能力和生產力就愈低。為了理解其中原因,並找到改善表現的更有效途徑,讓我們逐一詳細檢視每個理論。

問題1 真相來源何在針對別人表現的評論,並不可靠

回饋意見的第一個問題,是人們在評論別人的表現時,那些評論並不可靠。過去四十年來,心理統計學家已在一項又一項的研究中證實,人類的心智不夠客觀,因此,無法對於抽象特質(例如「商業敏銳度」或「堅定自信」)設定穩固的定義,然後根據這個定義來正確地評量他人。有些因素會大幅影響我們的評量結果,這些因素包括我們本身對於評量標準的理解程度、我們對於某項能力如何才算表現優良的個人想法、我們評量別人時態度的苛刻或寬容程度,以及我們天生的偏見與未察覺的偏見。這個現象稱為「評估者特質效應」(idiosyncratic rater effect),這種現象不但普遍(你評量他人時,一半以上反映的是你的特質,而不是對方的特質),而且頑強(無法透過訓練而減緩)。換句話說,研究顯示,回饋意見比較像是一種扭曲,而非真相。

正因如此,儘管有這麼多現成的訓練,教人們如何接受回饋意見,但做起來還是很困難:接受回饋意見的人,必須在這個充滿扭曲的森林裡奮戰,尋找屬於自己的樣貌。

你給予他人的回饋意見,有更多部分反映的是你自己,多於反映對方的特質,因此會導致系統誤差(systematic error),而你匯總所有評量結果時,系統誤差也會被擴大。世界上只有兩種衡量錯誤:一是隨機誤差(random error),這個可以靠把許多數值加總,再平均,來降低誤差;二是系統誤差,這種誤差就無法降低。遺憾的是,我們上完數學課之後,似乎都只記得隨機誤差,忘了系統誤差。我們在打造那些績效和領導力回饋意見工具時,似乎把評量誤差全都當成隨機誤差,但其實那些是系統誤差。

以色盲為例。如果我們請色盲的人評量某種玫瑰的紅色程度,我們不會信任他提出的回饋意見,因為我們知道他看不出來,更別提「評等」了。他的誤差不是隨機誤差,而是可以預期、可以解釋說明的,原因就是他的評量系統有缺陷;因此,這是系統誤差。如果我們接著決定,再找七個色盲的人評量玫瑰的紅色程度,他們的誤差同樣屬於系統誤差,如果把他們的評分加總平均,無法得出更接近玫瑰真實紅色程度的答案。其實,情況會更糟。把所有不正確的紅色程度評等加起來,如「灰」、「深灰」、「白灰」、「泥棕」等等,再把它們平均,只會更偏離真相,無法呈現那些人對玫瑰的個人感官經驗的可靠資訊,也無法得知玫瑰的實際顏色究竟有多紅。

研究顯示,我們對於抽象特質都像是「色盲」,例如策略思考、潛能和政治敏銳度等。我們沒有能力評量他人在這些特質上的表現,這情況不但是可以預期的,也有原因可以解釋,這是系統性的問題。我們無法透過增加輸入的資料、求取平均值,而排除這個誤差,這麼做其實反而會擴大誤差。

更糟的是,雖然科學早就證明我們是色盲,但在商業世界裡,我們卻假設自己是明眼人。在內心深處,我們完全不認為自己會出現太多誤差。我們自認是評鑑別人的可靠裁判。我們自認是真相的來源。其實我們不是。我們是誤差源。

如果使用某項回饋意見工具,請八名同事針對你的商業敏銳度來評分,結果平均分數3.79 分,其實這個分數比只調查一個人對你的評分更為扭曲。這個數字3.79 絕對是百分之百的噪音,不是訊號。你應該要擔憂它的根本缺陷有多大,因為(1)這類以資料為基礎的回饋意見愈來愈多;(2)這項針對你的評鑑資料,很可能在你任職的公司裡保存很長一段時間;以及(3)這項評鑑會成為制定你的薪資、升遷、訓練、派任或開除的依據。

人類只有在一個領域是無可駁斥的真相來源,那就是對自己的感受和體驗。醫師很早就知道這一點。醫師對病患做術後檢查時會問:「疼痛程度從1 到10,10 分代表最高,你的痛有幾分?」如果你說「5 分」,醫師或許會開出各種治療方法,但不太可能會去挑戰你的「5 分」。不管他做過多少手術,若他說你的「5 分」是錯的,其實你今天早上的痛感應該是「3 分」,他這麼說是沒有意義的。試著去分析你所說的5 分是什麼意思,以及是否有任何文化差異可能顯示你的5 分其實不是真的5分,這種分析沒有意義。與其他醫師舉行調校會議,確定你的「5 分」和這一排其他病房病人的「5 分」是一樣的,這麼做也沒有意義。相反地,他相信你是你自己疼痛感的最佳裁判,他唯一能確定的是,當你的痛感評分降低,代表你覺得身體比較舒服。你的評等是你的,不是他的。

就像醫師不知道病患痛感的真相,我們也無法得知同事的真實情況,至少無法以任何客觀的方式得知。你可能讀過報導,今天的工作者(尤其是千禧世代)想要知道自己的表現如何。你或許偶爾會遇到團隊成員請你告訴他們,客觀而言,他們的表現如何。你可能覺得有義務要試著回答這些問題。但其實你無法回答,沒有人能回答。我們能做的,就是分享我們的感受和經驗、我們自己的反應,而這絕非無關緊要的小事。因此,我們可以告訴某人,他的聲音是不是讓我們聽了覺得很難受;他對我們是否有說服力;我們是否覺得他的報告沉悶無聊。我們或許無法說出他們的表現如何,但是我們可以告訴他,我們對於他的表現有何觀感。那些是我們感受的真相,不是他的。這樣說比較謙虛,但至少是正確的。
閱讀完整內容
哈佛商業評論全球中文版4月號

本文摘錄自‎

誰讓回饋意見無效?

哈佛商業評論全球中文版

2019/4月第151期