2015年10月31日 星期六

兩個95%可信區間重疊就是無統計學意義嗎? (It is no statistical significance when 2 – 95% confident intervals are overlap ?)

    近日一位好友打電話來問功課, 兩個率是如何比較呢?
    我想了一想: 率的比較, 可以進行卡方檢驗!
    她說: 不行, 因為只有兩個率的數字~
    呵! 這樣的話, 可試計算這個率的95%可信區間, 然後看看它們有否重疊, 若有重疊, 則說明它們之間有共同部份, 可說是無統計學意義! 若無重疊, 它們沒共同部份, 則表示兩者有差距, 有統計學意義啦~
    後來她計算了, 便打電話來: 為可它們的95%可信區間重疊, 應是無統計學意義; 但做卡方檢驗之後, 郤有統計學意義!!!??? (我想... 又被她玩了...=.=)
這是率的可信區間計算公式, 計算95%時, z=1.96; 85%時, z=1.84即可
這是平均值的可信區間計算公式, 計算95%時, t=1.96; 85%時, t=1.84即可
    以往我們讀書時, 就是計算: 兩個率的95%可信區間是否重疊, 作為判斷兩個率有否統計學差異之一. 但很多時候就會出現上述: 95%可信區間與統計檢驗的統計顯著性結果相反的情況. 其實經過很多統計學者的研究及修正, 想要它們一致, 95%可信區間應修改為85%可信區間.
    因為95%可信區間, 率計算所得的區間較寬, 使兩率的範圍易重疊! 造成假陰性” (即應差異顯著時, 郤因重疊了而無差異…). 修改為85%以後, 區間窄了, 較不易重疊85%是較接近其他統計檢驗的結果呢!

2015年10月30日 星期五

向尊敬的生物統計學陳政友教授學習 (Study from Prof. Chen who is a Bio statistician)…



    原來認識陳教授已有約4年啦! 記得當年我在某大學健康科學學院任課程協調員時, 他長年被學院聘任為客座教授. 那時每當有客座教授來授課, 前一晚教授來澳後, 我們都會在學院旁的餐廳, 簡單地宴請教授; 除作地主之道外, 更重要的是能與教授溝通教學、學生、帶教研究生等問題

    對他的第一印象, 是一名土豪的學者, 身穿一套西服, 指上有大大的玉石戒指呢
2015年10月8日與陳政友教授(左)交流及請教
    旁聽過他的生物統計課, 其思路很清析, 總能用較簡單及即時的例子/數據, 說明些較難及抽象的統計概念; : 抽樣誤差當然, 我的統計學自國內, 在兩地用詞, 概念理解上是有所差異; 但高興地能學習著.

    在今月初, 收到一名朋友的微信, 相約吃飯. 那位朋友我已忘記在什麼情況下認識的, 但她就在那學院攻讀碩士研究生. 她論文的指導是陳教授, 期間她也曾諮詢我關於統計的問題. 作為朋友當然義不容辭, 但幫忙的不算多. 該朋友本身也是一個聰明人, 據聞最後的答辯是取得了不俗的成績啊!

    其實我知道那晚是"謝師宴也來了數位其他的友人~ 因我不善酒量, 而陳教授和另一友人則自飲自樂. 期間與陳教授寒暄時, 他對我說: 了解我的近況後, 為我高興. 我為之一傻---高興什麼? 原來是因我找到一份更好的工作! 我也向他訴說了現在工作上的一些事. 他告知我他的處事心得, 就是每天都要將所有事情做好!

    感謝陳教授的提點, 期望日後能有機會繼續向您學習呢~

2015年10月17日 星期六

我碩士導師的一次演示分享 (A persentation of my Master Instructor)

    近日不斷從手機的微信內收到祝賀我碩士生導師的祝賀, 原來他在剛過去的星期到廣東省疾控中心進行演說, 我不清楚他定的題目是什麼, 想大約是有關: 醫學科研人員的統計分析... 之類吧!
    後來他在微信內分享了他的PPT, 因為沒有聽他的演說, 所以我對他的內容不太理解呢~ 現將它分享...

    當然, 要提提他的研究興趣! 他用了很多年的時間 (據我知有10多年), 把一些統計方法編寫到Excel內... 目的是為了方便不懂統計軟件, 乃至不懂統計方法/思路的人, 能"簡易地"用上統計!
    有時我在想, 他的本意是非常好的, 因為方便了很多人; 但以下一些事情仍令我迷思:
1.在科研界, Excel仍未是被公認為標準的統計軟件, 若有心在醫學科研界做出好成績或鑽研, 為何不學些公認的統計軟件呢~
2.Excel本身也帶有基本的統計方法, 如: t test, ANOVA, Chi squre, Correlation...基本都能解決基礎的統計問題. 當然, 老師也加入了些其他的統計方法, 如: Ridit, Meta-analysis...
3.據知與公認的統計軟件, 如: SAS, SPSS, Excel的結果是有少許誤差... (具體的誤差有多大, 我沒有數據支持!)
4.若只是為解決燃眉之急, 又為何不找些"統計人"咨詢呢, 可能得到更好的結果! 因為統計更著重的是思路, 而不是處理手段 (我個人認為!!!)
5.對於老師研創的統計Excel, 在處理多變項及方法上, 乃未夠靈活性呢...

    當然, 在通用性(Excel在絕大多數電腦上都有), 方便性及wyswyg (what you see & what you get!)上, Excel是有優勢...
    也感恩老師的努力與教導!

分享鏈接: http://pan.baidu.com/s/1gdk7fsZ

2015年10月3日 星期六

一本很好並很特別的統計書! (A very good and special statistical book!)

    在7月上旬, 曾到台灣小遊數天.
    每次到外地, 我都盡量會花小許時間, 到當地的大學或書店逛逛, 感受一下當地的學術氛圍. 今次和以往一樣, 到台北後, 亦有到諸如: 誠品及書店街走走. 但因有小孩在身旁, 所以沒有去些大學參觀啦...
    記得臨走的那天, 吃過輕便的午餐後, 因在書店街附近, 所以又走了一趟呢! 忘記入到那家書店, 見到統計書欄內, 有一本細細的這本書, 心想: 本次來原本是想買一本當地的"流行病學"書, 以瞭解當地的流行病學情況; 同時, 也讀了很多統計的書... (爭扎著...) 還是買吧! 因為它似乎不是一本傳統的統計書, 也頗特別的...
   

    該書名是:「是誰將數字變得有意義了? - 談生物統計-」, 作者: 張念台先生...

 
    自9月開始, 約花了1個月的時間, 把這本書由頭到尾細讀了一遍, 很好啊! 果然是沒有買錯呢...
    雖然它內裏的統計方法是基礎的統計學方法, 但是一本適合已有統計基礎的讀者閱讀, 因為它的重點是補充了很多基本方法的原理, 糾正了很多錯誤的統計概念及觀念... 如:
 
1.卡方檢驗裏的Fisher檢驗, 是超幾何分佈, P值的計算是... 這樣的;
 
2. 頻率的檢驗還有一種叫G-test;
 
3. 以前教過, 若兩個95%可信區間重疊就是無統計學差異, 其實是錯的! 應是兩個83%CI或84%CI的重疊才無統計學差異;
 
4.方差檢驗後, Post-Hoc內的
    LSD法---事前比較, 不宜用於處理數較多的情況
   Duncan's新多變域檢定法---每個處理之重複數最好一樣; 其它因素與某特別的對照因素間比較之用
    Tukey法---樣本的觀測數應相同
    Scheeffee's S 法---事後比較
 
5.P值的"*"多少並不重要, 重要的是, 做研究的我們必需自行決定「統計量間的差異要有多大才是重要(或我們想要)的」;
 
6.即使檢定結果是「不顯著」,其實它也並不能證明H0是對的, 它只表示我們的數據沒有足夠的理由來拒絕H0...
 
    還有很多其它有益的內容呢...