做對五件事,讓生成式AI解放團隊創造力

理論面〉錯誤運用新科技,無異緣木求魚

做對五件事,讓生成式AI解放團隊創造力


Don’t Let Gen AI Limit Your Team’s Creativity

ChatGPT之類的生成式AI雖然會生成許多構想,但研究發現,多數人並沒有適當使用這項威力強大的工具,以致生成結果不如人類自己想出的構想。一項研究提出5個步驟,有助於團隊運用生成式AI,發想出更實用、更具創意的構想。

插圖/賈斯蒂娜.斯塔西克(Justyna Stasik)


沒有人懷疑ChatGPT有產生許多構想的能力。但那些構想好用嗎?最近在現實世界所做的一項實驗,邀請一些團隊發揮創意解決問題,結果發現,在大部分情況下,人工智慧(AI)的協助只帶來為數不多的利益,在一些情況下甚至表現不佳。領導力開發公司Geolab的執行長,同時也是該研究的其中一位作者基恩.郭賀(Kian Gohar)表示,不要把這個現象歸咎於科技。對於生成式AI、問題解決和創意過程的常見誤解,使員工及其經理人不當使用這些工具,有時候比不使用AI建議的構想還糟。

與AI的互動不得要領

郭賀與共同研究員史丹福大學(Stanford University)的傑瑞米.厄特利(Jeremy Utley),和4家公司(歐洲及美國各兩家)合作進行這項實驗。每家公司有多達60名員工受邀組成小團隊,嘗試解決公司面臨的一項業務問題,例如如何開發內部培訓資源,或如何擴大某項產品的B2B銷售額。各家公司都有一些團隊(對照組)在沒有AI的任何協助下嘗試解決問題,其他團隊(實驗組)則會運用ChatGPT的一個開源版本。所有團隊都會觀看他們受邀解決的那個問題的簡報,並拿到說明相關細節的資訊報表。

每個團隊都有90分鐘的時間,按照研究人員指定的結構,產出潛在的解決方案。員工首先各自工作,然後在腦力激盪會議上和隊友分享自己的構想。實驗組團隊在這兩個發想階段都可以使用ChatGPT,也被鼓勵將資訊報表中的資料輸入ChatGPT來訓練它解決問題。在這項活動結束時,每個團隊都提交自己的構想。

每個問題的「負責人」,也就是每個組織裡負責執行最終解決方案的人,在不知道哪些構想是由人機合作產生的情況下,會評判這些構想,給予從A(「很有說服力」)到D(「不值得執行」)的評分。郭賀說,研究結果顛覆了研究人員的預期。他和共同研究員原本假設,使用ChatGPT的團隊將會產生遠比其他團隊更多也更好的構想。但平均來說,這些團隊的構想只比對照組多了8%。它們獲得D評分的數量少了7%,但B評分(「有趣但需要加強」)的數量也多了8%,C評分(「需要大力加強」)的數量兩組大致相同。最令人驚訝的是,它們得到A評分的數量比對照組少了2%。郭賀說:「生成式AI幫助員工避開糟糕的構想,但也帶來更多普通的構想。」在這項活動進行之前和之後所做的調查顯示,使用AI的團隊對自己解決問題的能力信心大增,比其他團隊高出21%。但是他們獲得的評分顯示,其中許多信心是錯誤的。


獲得AI好幫手

郭賀表示,當然,使用生成式AI來解決問題的潛力確實存在。以下是將潛力發揮到最大的一些步驟。

精確描述你要解決的問題。生成式AI聊天機器人背後所依賴的大型語言模型,是為了提供「普通的」答案而設計;它們的演算法經過訓練,以找出後續字詞的最高機率。如果你輸入「我汪汪叫,就像一隻……」並要求聊天機器人把意思補完,它幾乎肯定會提供「狗」這個詞。但如果團隊是要尋求跳出框架的解決方案,普通的答案幾乎毫無用處。

因此,經理人應該教導團隊在使用AI工具之前,先擬定高度具體的問題陳述,包括大量細節,愈多愈好。例如,團隊不要問:「我們要如何提升顧客滿意度?」而是:「我們的顧客旅程包括以下步驟……要怎麼改變我們協助顧客熟悉產品的步驟,才能把留客率提升10%?」郭賀評論道:「員工期待AI是一位行家:連上它,它就會給你解決方案。」採取這個做法的團隊(只用籠統的詞彙陳述問題,就要求ChatGPT解決問題),得到的是了無生氣的結果。

騰出時間進行個人腦力激盪,不使用聊天機器人。在團隊成員和AI互動之前,給他們一些時間(例如15分鐘到半小時)來個別提出一些構想。這有助於確保他們在團隊會議和運用AI之前,不會受到團體迷思或AI建議所影響。這個步驟對於蒐集各式各樣有創意的構想非常重要,而且能把最多別出心裁的構想帶到團隊中討論。

嚴格訓練AI。員工經年累月在組織和產業中工作,對情境十分了解,但生成式AI系統並沒有這些知識。在將ChatGPT(或類似工具)整合到發想過程之前,你需要協助它迎頭趕上。你要盡量輸入與你的特定問題相關的資料,可能包括某顧客群的思維方式,先前的成功案例和失敗的計畫,以及產業的標竿。

將AI視為持續的對話伙伴,而非行家。這項研究中的團隊和ChatGPT來回互動多次後,提出了更好的構想。郭賀表示:「解決問題大多需要進行一場對話。為了提出更好的方法來解決問題,你會和同事討論;如果其中一位同事是ChatGPT,也是如此。」

這項實驗中,有許多團隊直接接受ChatGPT提出的第一個建議。郭賀將這種情況歸因於「定勢效應」(Einstellung effect),也就是一種認知偏誤,使人們偏好以往熟悉的解決方案,而不會更廣泛探索各種可能性。這可能導致有AI協助的團隊提出高比例的B評分構想。郭賀說,無論AI最初提供的建議看起來多好,團隊都應該持續提出更多、更具體的問題。如此一來,模型就能改善自己的回答,並為使用者提供更多解決方案以供最後選擇。郭賀強調:「得到A評分的團隊會和AI進行互動對話。」

請團隊之外的人協助團隊做出最後決定。當團隊聚在一起分享可能的解決方案時,要指定一名成員整合這些建議,然後要求AI分析它們是否符合你的目標、提供評論、挑戰假設,並提出更多替代方案。這個步驟還可以做為訓練機制,改善該模型的未來表現。郭賀說,請一位外部協助者(沒有利害關係且最好嫺熟AI發想)來引導整個流程,協助排定構想的優先順序,並規畫下一步,這樣做可能會很有用。

「與生成式AI進行腦力激盪,需要重新思考你的發想工作流程,並學習新技能,」郭賀總結道:「但如果你把這件事當成一種結構化、持續進行的對話,你就能更快獲得令人驚嘆的能力,可以更快開發出更好、也更有創意的構想。」

關於這項研究
〈評估生成式AI對發想和團隊解決問題的實際影響〉(Evaluating the Practical Impact of Generative AI on Ideation and Team Problem Solving),作者為基恩.郭賀(Kian Gohar)、傑瑞米.厄特利(Jeremy Utley)。該論文為工作論文。
閱讀完整內容
哈佛商業評論全球繁體中文版2024/3月 第211期

本文摘錄自‎

做對五件事,讓生成式AI解放團隊創造力

哈佛商業評論全球繁體中文版

2024/3月 第211期