2020年8月22日 星期六

統計學上的辛普森悖論(Simpson's Paradox of Statistics)

昨晚留意到YouTube的一段視頻,是關於一個 "民意調查"中,數據的錯誤計算。
視頻中的女士說,因為數據計算中未進行加權,導到 "支持"與 "反對"的差異很少,甚至可能將結果反轉...
是的! 計算是未有加權。但更精確地說,是因為犯了統計學上的 "辛普森悖論"! 才出現差異少,甚至結果可能 "反轉"。
辛普森悖論是很常見的,亦是很多人易犯的錯誤,更小心的是易被人"誤導"了~

(利申:我對內容提及的政治問題沒有什何偏向及意見,純是統計學上的見解呵!)
計算方法:

總結果

                    支持:(21367*20%)+(1705*50%)+(1012*37%)
                                -------------------------------------------------- ~22.8%
                                           21367+1705+1012

                    反對:(21367*63%)+(1705*31%)+(1012*41%)
                                -------------------------------------------------- ~59.8%
                                           21367+1705+1012

單支持者結果

                    支持:(21367*20%)+(1705*50%)
                                ---------------------------------- ~22.2%
                                           21367+1705

                    反對:(21367*63%)+(1705*31%)
                                ---------------------------------- ~60.6%
                                           21367+1705
參考資料: