2020年12月12日 星期六

用Python及R進行基礎統計(Essential Statistics with Python and R)

假期放了3天,郤總是忙著忙著! 不是為孩子走來走去,就是為朋友的論文給予意見~

作為學林中人,總有著對學術的慊意! 畢竟已有一段時間沒寫文章或鑽研。學術是不斷地去追的,否則就是 "逆水行舟,不進則退"~而且心算自己的老本也不多呵...

想趁著雙12,買一本書給自己(給自己一份禮物吧!),但老男人,沒有嗜好,禮物自然就(又)喺書啦。想學學Python在數據科學的應用! 在網絡上找到一本很好的閱讀資料... 哎呀! 連雙12的零錢也省回。這本閱讀材料很好,因為

1.既有Python的操作方法,亦有R語言的操作方法。對於有R語言一定基礎的我,對照著R學Python,更易理解!
2.很新的資料,2019年撰寫的

3.它所說的統計也很容易呵!

希望對大家有用,互勉! 下載地址:https://escholarship.org/uc/item/03w0n5g3



2020年8月22日 星期六

統計學上的辛普森悖論(Simpson's Paradox of Statistics)

昨晚留意到YouTube的一段視頻,是關於一個 "民意調查"中,數據的錯誤計算。
視頻中的女士說,因為數據計算中未進行加權,導到 "支持"與 "反對"的差異很少,甚至可能將結果反轉...
是的! 計算是未有加權。但更精確地說,是因為犯了統計學上的 "辛普森悖論"! 才出現差異少,甚至結果可能 "反轉"。
辛普森悖論是很常見的,亦是很多人易犯的錯誤,更小心的是易被人"誤導"了~

(利申:我對內容提及的政治問題沒有什何偏向及意見,純是統計學上的見解呵!)
計算方法:

總結果

                    支持:(21367*20%)+(1705*50%)+(1012*37%)
                                -------------------------------------------------- ~22.8%
                                           21367+1705+1012

                    反對:(21367*63%)+(1705*31%)+(1012*41%)
                                -------------------------------------------------- ~59.8%
                                           21367+1705+1012

單支持者結果

                    支持:(21367*20%)+(1705*50%)
                                ---------------------------------- ~22.2%
                                           21367+1705

                    反對:(21367*63%)+(1705*31%)
                                ---------------------------------- ~60.6%
                                           21367+1705
參考資料: