2015年1月31日 星期六

樂在其中統計學 (The joy of Statistics!)

近日較多地上網找一些有關統計學內容的視頻看因為看書 文字多了雖有一定的理論但實踐還是比較薄弱呢... 例如近來學習R統計軟件書和文件都看了些但說到上機操作可心裡仍感到沒底.
加上近來老婆也要學統計心知如果我教她一來她會沒趣的二來我也會很躁啊... 所以也找了些有關統計學的視頻讓她自學就好了...
昨天在一個視頻的網站見到這個由BBC拍攝的有關統計的短片感到很不錯啊!  片長約57分鐘主要講述了統計學的歷史數據的公開統計學的應用以及統計數據結果的可視化等是初學者了瞭統計學性質資深者重新認識統計學的好材料...
 

若想要有中文字幕的, 可以點選以下:樂在其中統計學

2015年1月26日 星期一

如何選擇正確的統計分佈? (How to choose a corrected statistical distribution?)

    以前在我教衛生統計的時候, 我很著重統計分析的思路因為現在已有很多統計軟件的幫助, 所以不用去記公式, 也不要用手算; 但在面對一大堆不同的變量(變項, Variable), 面對著研究目標, 如何將數字玩弄成需要的結果這就是廣東人所講的功力
    再說統計分佈,在不同的數據性質(計數資料 / 計量資料?)、數據形態( / …)、不同的研究問題等, 選用的統計分佈是不同的.

    網上有人把它劃了出來, 於是將其整理成中文, 讓其他人學習吧!
(忘記了在網上哪裡找到的... 望見諒!)

2015年1月23日 星期五

各種統計分佈的關係 (The relationship of Statistical distributions)

    像我們經過正統的統計學訓練的人都知道, 統計學中有很多的統計分佈,當中最著名的當然是正態分佈(高斯分佈),因為它是大樣本(常將樣本量n30)計量資料作統計推斷的基礎;但後來的人發現,就算是計數資料,當樣本量夠大,也趨向正態分佈

    統計分佈在統計學中佔有很重要的地位呢!因為按統計分佈, 可計算出概率事件的P值,也是統計推斷的基礎呢

    以前學習統計時, 基本都是按每一種的統計推斷方法, 學習一種統計分佈的, 如學:正態標準化時, 之前就學正態分佈;t檢驗(學生檢驗)就學t分佈;χ2(卡方)驗檢就學Chi-square分佈;F(方差, 變異數)檢驗就學方差方佈以前認為是各種分佈是獨立的,但細心想想:標準正態分佈是由正態分佈來的, t分佈是標準正態分佈的小樣本下, 自由度df=n-1來的

近日終於找到了一份表, 可以很清晰地將各統計分佈描述出來當然也有更複雜.

其實主要及常用的統計分佈(概率分佈)有以下幾個
1.離散型概率分佈
        1.1二項分佈:
                在一次試驗中只有兩個可能結果:成功失敗
                一次試驗成功的概率為p, “失敗的概率為q=1-p, p對每次試驗都相同;
                只適合重覆抽樣;
        1.2泊松分佈:
一定時間段或一定空間區域或其他特定單位內某一事件出現的次數;
        1.3超幾何分佈:
採用不重覆抽樣, 各次試驗不獨立, 成功的概率也互不相等, 且當總體元素的數目很小或樣本量n相對於總體N來說較大時, 成功的次數則服從超幾何分佈
2.連續型概率分佈
        2.1正態分佈:它是計量資料統計分析及推斷的基礎呢
        2.2由正態分佈導出的幾個重要的分佈
                2.2.1 χ2分佈
                2.2.2 t分佈
                2.2.3 F分佈

2015年1月22日 星期四

列席旁聽林院長主講的院內研討會! (Listening to Prof. Lam’s presentation in a hospital seminar)

    早在約半個月前, 林院長給我一封電郵, 告知他將在其工作的醫院內進行一個病例學術研討會, 邀請我旁聽呢

    我當然後高興, 因為林院長與我亦師亦友, 在我的學術生涯中佔有一席; 而在我的職業生涯規劃中, 也給予了很多建議!況且他是一名典型的學者, 演示是有其風格與味道. 但是, 我也擔憂~ 因我已離開了該機構兩年了, 雖然仍有很多前同事, 但研討會是院內的, 以什麼名義回去呢?我又在值班當中,交Call機給其他同事是不太合禮儀的; 第三是因該研討會在中午1時至2:30, 加上車程一來一回, 我要向工作的中心借用2小時呢但昨早起來, 心裏仍盤算著, 忐忑著. 因為我與林院長的交情, 加上在澳門~~~是要互相支持的嘛!所以仍是堅持著要去.

    林院長說了3罕見病例:多發性骨髓瘤及本周氏蛋白、冷蛋白及POEMS症候群,演示中他引用了很多各種疾病的歷史事件, 使聽眾對這些病的來龍去脈有了更深的認識, 加上各部份都有總結及學習重點, 使人更易於掌握. 當然, 他也有展示他科研的成績, 列出了很多他發表的文章及演說經歷


    我一生中有好幾位良師, 知道一位良師是可遇而不可求, 所以都會好好珍惜. 感恩我能遇上林院長, 也冀望能繼續向他學習

2015年1月21日 星期三

旁聽于明暉教授及宋老師的流行病學課 (Listening to Epidemiology course of Prof. Yu and Miss Sung)

    我很幸運, 能有14個月的時間在某大學的健康科學學院工作, 離開該崗位後, 感恩學院仍能讓我旁聽他們優質的課程.

    其中流行病學課已是3年去旁聽~ 為什麼?
1.于明暉教授是台灣首屈一指流行病學教授, 尤其HBV與肝癌的研究更是國內外聲譽高昭;

2.據我所知, 她的博士導師是台灣有名的陳建仁教授 (這有待證實)! 陳教授在美國受教育及訓練, 所以于教授的教學方式及內容也很美式
    講起美式的流行病學, 誠然與中國的流行病學, 在教學內容與方法是很不一樣!
    在教學內容, 美式流行病學很著重實踐性, 而且也著重於Confounding, Interaction, Bias等的分析; 然而國內的流行病學, 則較理論性, 混雜因素, 偏倚等內容相對佔的時間不多吧!
    所以我最初旁聽的時候是很震撼辛苦, 震撼是原來歐美的流行病學是很著重於分析、思考及推理, 也講求動手的能力無疑就算在國內讀完博的我, 這些都是我的弱點!辛苦是在短時間內學會她的教學及實踐內容又何容易呢~

3.小宋在課程中教授流行病學中SAS統計軟件的應用, : 率的標準化、APC…
又是很實用的內容, 而且也可以學得SAS統計軟件的基本使用方法, 真是一舉兩得!(可知道, SAS暫時被公認是統計中最優的軟件; 而且在國內較難學到SAS, 因國內較時興SPSS; SAS也是較難學的, 因要編程耶~~~)
    也有個小秘密, 她們第一年來教學時, 小宋和我都是博士研究生, 所以有親切感, 我已於20136月畢業了, 而她仍在努力中!知道她是個很聰明和勤奮的女孩子, 所以從旁可知, 台灣對博士的要求不低的啊~ 而且一般要5年才完成呢!? 當然, 國內也不是易的, 又要做研究, 又要發SCI文章但有能力的, 可在3年內畢業努力!

4.每年于教授及小宋每年都對課程內容修訂, 而且教學認真呢
    每年旁聽, 每年也有所收獲, 也在享受啊~
    還有要感謝學院的恩典啊~

參考資料:
http://epm.cph.ntu.edu.tw/main.php?Page=SA4&KeyID=4506058724c6b8164209a7&Template=teacher01.php#p05

[更新2016-09-24]
今年得知, 因為于教學的工作忙, 而小宋也因生了BB, 以及她博士畢業了, 要到別的地方工作, 所以她們往後不再來澳教學了... 感到很是可惜!
但亦要感恩她們這數年的教學, 祝福你們...

2015年1月13日 星期二

在2014年曾讀過的文章… 哇! 都好勁! (Wow! I have read those articles / books 2014)

    從讀過的文章/書的分類可知, 花在統計學類的時間頗多, 其中又以R統計軟件看的軟多
當然, 看過, 甚至讀過, 並不代表已識或掌握啊

    好! 再計劃一上今年2015年的閱讀計劃

研究類
流行病學類
統計學類
其他/興趣
臨床流行病學數據的處理
哲學
CDC Epi Info
多向度量化方法 (MDS)
世界上最簡單的經濟學

對應分析


Rev Man 5
PASS樣本估計


Stata應用: 復旦



R Statistical packages



JMP



Essential R



馬克威分析系統



岭回歸









複雜數據統計方法---基於R的應用