從學術角度來看「校正回歸」是否合宜?
上週六(5/21)中央流行疫情指揮中心(CECC)公布新增確診人數的數字是321人(本土),但是出現了一個「校正回歸」400人,將過去一段時間公布的確診人數進行調整,是台灣第一次進行校正。
疫情數據校正回歸 令投資人疑惑
第一時間有許多投資朋友感到不解,對「校正回歸」的行為不知道要如何解讀,因此我在第一時間進行研究,並將研究結果寫成分析報告放在我的群組內,讓投資朋友參考。
從學術的角度來看,我認為調整數據有必要性,資料科學中有一句名言:「Garbage in, garbage out.」,為了得到正確的資料解讀,當然要有最正確的資料。
什麼是校正回歸
一開始聽到CECC的記者會發言,我以為校正回歸指的是統計學上的Regression calibration,這是一個常用在流行病學跟營養學的統計方法,用來校正模型的偏差。
後來研究發現C E C C 指的並不是Regression calibration,而是Retrospective adjustment,這是從會計學來的專有名詞,如果要翻譯的話,應該要稱為「追溯調整」。因此CECC其中一個問題,就是英文轉換成中文的「語意落差」,用了一個大家看不懂,有歧異的詞,才導致社會大眾困惑。
對過去數據進行調整並非台灣特有,美國、英國、德國,甚至是世界衛生組織(WHO)都有調整已公布病例數的經驗,因此要將CECC的做法解讀為「蓋牌」、「隱藏數據」,以學術的角度來說,我認為並不妥當,資料科學是嚴謹的、中立的,不應該被政治上的意識形態左右。
從其他國家的經驗中學習
觀察全球其他主要國家的疫情爆發狀況,新增確診人數在初期增加的速度並不快,但是後來看其實可以用「幾何級數」的狀況來描述,通俗一點來講就是指數式增加。
但其實幾何式的曲線在剛開始,跟「線性」非常像,舉個例子,線性的新增病例數字像是100、200、300、400、500,但如果是幾何級數的話會像是100、200、400、800、1600,巨大的差異會在後面才顯現出來,初期是很難觀察差異的。
再來,其他國家的新增病例數一旦到達了「高原期」以後,就迅速獲得控制,經濟能夠回到常軌。因此要判斷何時已經過了高原期,是一個很重要的政策考量點,如果太快解封,會導致疫情更加嚴重,如果太慢解封,經濟就會受到更大打擊。如果以經營公司作為舉例,一年工作日約240天,多封鎖一週,你的當月營收要少掉25%,全年營收要少掉2.1%,失之毫釐,差之千里。
所以如果不對數據做調整,取得最正確的數據,在政策決定上就會出現重大失誤。我們直接看真實數據,以五月二十二日CECC公布的圖一為例,如果不經過調整,大家會以為疫情越來越嚴重,甚至要失控。但如果經過調整後,其實疫情的趨勢是有受到控制的,因此有沒有經過調整,結論完全不同。
學會與疫情共存 而不是只會恐慌
COVID-19疫情爆發至今也已經將近一年半,台灣很幸運的爭取到更多時間準備,雖然這波疫情的爆發凸顯出了執政者並沒有好好利用這個時間,檢驗量能明顯不足,行政程序還有優化空間,但現階段究責不是最優先的工作,防堵疫情擴散,讓經濟重回軌道才是當務之急。
要記得,如果沒有方法比現在的爛方法更好,那這個爛方法就是最好的方法。校正回歸不是要蓋牌或欺騙社會大眾解讀資訊,而是要達成「判斷疫情發展」的重要目的。
病毒沒有意識形態,不會因為你支持或反對執政者就讓你獲得免疫力,股市也是一樣,想要在市場中獲利,就要排除一切主觀猜想,回歸到理性分析判斷才是王道。
閱讀完整內容