機器學習如何讓企業變聰明

每個月,淘寶手機應用程式的瀏覽次數都超過5000億,他們逛世界最大的虛擬購物商場,從一家店跳到另一家店,窺探世界上價格最漂亮的驚奇產品。不過,終端用戶看到的只是阿里巴巴市集的冰山一角,一般消費者根本不知道他(她)正從數百萬個賣家在阿里巴巴供應超過15 億種產品中仔細挑選出來的產品列表裡選購產品。(相較之下,2017 年時,沃爾瑪﹝ Walmart ﹞供應1700 萬種產品,亞馬
遜供應5 億種產品。)¹

¹. 數據探勘新創公司Scrapehero 指出,亞馬遜及沃爾瑪分別供應超過5億種產品和近1700 萬種產品,由於這是非官方統計,因此應該要理解為比較低的數字。

 

賣家的體驗也類似。一般賣家只需要知道阿里巴巴的工具和後台介面運作得夠好,可以找到必要的服務,以及優化賣家的生意。2017 年光棍節時,商家為了即時監控生意,在天貓的網路數據分析面板存取資料超過110 億次。(在那重要的24 小時裡,商家平均花93 分15 秒瀏覽及分析流量與銷售數據。)商家根本不知道,為了確保市集健全,阿里巴巴的安全性演算系統分秒不停地運作,在平台上徹底搜查垃圾郵件和詐欺行為。這個演算系統每天執行300 億次保護性掃描,精細地偵查侵入事件,為數兆的數據點執行預防工作。

在這龐大的零售網絡表面下,隱藏著我們另一半的策略方程式:數據智能,這是數據、演算法與可調適服務的結合。把所有買家與賣家的服務結合起來看,阿里巴巴的平台一天處理的數據量相當於2000 萬部高畫質電影,我們的這套技術(處理電腦或平台基礎建設的各種軟體)能夠在尖峰時段處理超過80 億筆的內部數據存取,確保這個內部數據流順利存取是浩大工程,這可以解釋何以阿里巴巴和亞馬遜之類的零售公司已經變成世界一流的雲端運算服務供應商。



我使用「數據智能」這個詞,旨在強調和用戶互動所產生的持續數據流可以被機器學習演算系統使用,把企業變得更聰明。Google 的網路搜尋、淘寶的產品推薦引擎,以及Uber 的乘車媒合,全都是數據智能的實例,這些公司用演算法去執行蒐集到的數據,把持續修正且高度重要的演算結果即時交給顧客。這些公司的營運,以及與顧客的互動,大多只需要極少人力介入,甚至不需要人力。Uber 派車給乘客,淘寶向顧客推薦一款衣服,這些全都不是員工在處理,而是演算系統在執行。雖然這些服務的創造涉及大量人員的努力與創意,但一旦服務創立後,事業就由電腦系統自行運作。

因此,這個模式具有驚人的槓桿效益及規模潛力。把零售流程自動化後,阿里巴巴3 萬多名員工可以達成相當於200 萬名沃爾瑪員工的銷售業績。(阿里巴巴在全球有超過5萬名員工,但不是所有員工都參與核心的電子商務業務。)檢視地圖,以及頻繁配對可能性,這是電腦比人類派車員做得更快速、更準確的事,因此,Uber 具有大大縮減等候時間的優勢。數據智能正逐漸成為競爭優勢最重要的來源。



但是,了解這項能力可以被推廣應用於幾乎所有經濟活動的企業家並不多,儘管現在的媒體已經相當關注機器學習技術。將雲端運算、行動運算與數據化(datafication,把一個活動或現象寫成電腦可以理解的程式)的進步,尤其是人工智慧的進步結合起來,可以創造出改變公司營運與競爭的全新能力,這是很合理的。本章要描述的就是,使用機器學習技術把數據智能整合到企業營運中,使企業變得更聰明的商業含義。

機器學習

嚴格地說,機器學習是人工智慧這個大領域中的一門技術,不過,機器學習的快速進展已經把創造人工智慧的許多途徑給淹沒了。機器學習使用的演算法描述意圖優化的參數或達成的目標,但沒有列出要嚴格遵循的一系列規則,這種不預設規則的方式,與電腦科學中許多由上而下的規則指令,告訴電腦如何做該做的事的方式不同。機器學習程式的運作更像天擇,可行的作法就發展擴大,不可行的作法就淘汰。這裡舉一個簡化的例子,想像你試圖解決的問題有個機器,就像驗光師用來決定度數來配出最能改善視力的機器一樣,眼科醫師放了一個有度數的鏡片,詢問你看遠方牆上的字母是否變得更清楚或更模糊。醫師重複這個程序好幾次,直到得出一個確切的度數。演算法的運作類似這樣,它每跑一筆新數據,就會問這是否產生更好的結果?

機械學習演算法藉由執行巨量數據來自我訓練與修正。2017 年時,名為AlphaGo 的機器學習程式引起世人的興奮,尤其是在中國,AlphaGo 擊敗中國圍棋界大師,這是非常了不起的事,因為圍棋的步法比西洋棋多了幾億種。程式設計師「訓練」AlphaGo 的方法是讓它和自己對弈數百場數位圍棋比賽,因此,它已經模擬無數的步法及反制的步法。這個程式「知道」無數情境下的棋局演變,但電腦其實對圍棋根本一竅不通,AlphaGo 的程式並沒有指示它在對手把棋子下到那裡時,就把棋子下到這裡,它只是看到對手下一步棋後,以它的數百次經驗計算在棋盤上下任何一步棋可能的結果,然後從中選出最好的一步。

數據科學家持續發掘新方式去模擬問題,然後執行機器學習演算法,使演算法變得更強而有力。他們也使用一套演算法,讓它們結合起來運作。Uber 的基本演算引擎追求儘快媒合乘客與車子,後來這個共乘公司又發展出動態區隔訂價的演算法,只要你付更多錢,就可以在市中心叫到車子。Google 每年藉由把競價模式建入演算法中,創造數百億美元的廣告收入,這種演算法使用績效數字(營收額或點擊率)自動訂價。淘寶的推薦引擎使用與個人及群體有關的知識,挑選出對每位消費者最具吸引力的產品。²


²把機器學習應用在商業問題上涉及電腦科學以外的更多技術及領域的知識。機器學習仰賴透過統計分析大數據來辨識隱藏的型態,這未必是解決商業問題時符合成本效益的方法。多數現代的機器學習方法對辨識型態上不應該設限太多,不設限可以讓電腦發覺出人類專家看不出的潛藏型態,不過也會擴大演算法的搜尋範圍,導致進行的運算及花費的數據成本大增。

因此,科技業對數據智能的最先進應用,包括本章談到的許多應用,不只使用機器學習,還會把電腦科學和經濟學及最佳化方法(optimization methods)這兩個學門結合起來。經濟學提供人類行為的基本數學模型,這大大限制隱藏型態的搜尋範圍,機器學習方法便可用來取得及清理重要數據,為研究的商業問題模型計算正確的參數。最佳化方法又稱為數學規劃(mathematical programming),可以被用來確保在一定的時間及預算限制下,使模型與計算方法最有效率。創業家必須記住,機器學習的機率法雖然代表戰術決策的革命性改變,但機器學習並非萬靈丹。

 

閱讀完整內容

智能商業模式

本文摘錄自‎

智能商業模式

曾鳴

由 天下雜誌 提供