2016年7月27日 星期三

有趣的圓分佈分析 (The funny circular distribution)

    早前日子, 在找其他資料時, 看到 "圓分佈分析", 便在網頁上找找相關的文章讀讀, 它不是一種新的統計方法, 早在80年代內地已有些學者用於分析傳染病的研究.

    它可以用於以下兩種情況, 而變量是 "角度" 數值:
1.分析真正圓周上的位置 (鐘點) 數據 (如腫物的發生位置分析...)
    將描述的位置 (鐘點) 數據轉變為角度, 可用: α = 每小時 * 30度 + 每分鐘 * 0.5度
2.處理周而復始的現象 (如傳染病的周期性暴發...)
    將時間轉換為角度,
1日內某時: α=每小時 *15度 + 每分鐘 * 0.25度
1年內某日: α=總日數 *0.9863度

分析方法:
1.計算cos αi及sin αi的均值, X = (Σ fi cos αi)/n , Y = (Σ fi sin αi)/n. fi為頻數, n為樣本量;
(Excel方法:  
將角度化為弧度:
=sin((已化為角度變項)*PI()/180) 或 =sin((ridians(已化為角度變項)))
=cos((已化為角度變項)*PI()/180) 或 =cos((ridians(已化為角度變項)))
計算X, Y
=sumproduct(弧度變項, 頻數項) /總樣本量項
)
2.計算角度離散程度指標, γ = (X^2+Y^2)^1/2
(Excel方法:  
=power((power(X變項,2)+power(Y變項,2)),0.5)
)
3.計算平均角的正弦及余弦, cos α = X/γ, sin α = Y/γ, 並推算α值
(Excel方法:  
cos α=X/角度離散程度變項
sin α=Y/角度離散程度變項
將弧度化為角度:
=atan(sin α/cos α)*180/PI()) 或 =degrees(atan(sin α/cos α))
再化為位置/時間!
)
4.計算角離差, S = 180/π*(-2lnγ)^1/2 或 S = 122.9548*(-lgγ)
(Excel方法:  
=122.9548*power(-log10(角度離散程度變項),0.5)
)
5.採用雷氏Z值檢驗, Z = n*(γ^2), 當Z>Z0.05=2.9957時, p<0.05.
(Excel方法:  
=總樣本量項*power(角度離散程度變項,2)
)

參考文獻:
王靜, 葉冬青. 圓分佈分析方法及實例應用. 疾病控制雜誌, 2004, 8(2), P160-161.
王慶昌, 李欣. 圓形分佈分析的EXCEL實現. 中國衛生統計, 2006, 23(5), P448-449.
https://www.researchgate.net/figure/281588341_fig2_Fig-2-Circular-distribution-of-the-time-of-day-24-h-for-entry-into-torpor-fi-lled 
金丕煥. 醫學統計方法. P208-214.
潘東霞, 陳玲琍, 謝開婿, 李秋月, 潘亞興, 張益丹. 應用圓形分布法探討腦卒中的發病季節和時間規律. 疾病監測, 2016, 31(1), P58-61.

[2016.08.08更新]
經過測試後, 我個人感到應用圓形分佈析時, 數據最好是單峰分佈的; 因為若是雙峰或多峰以上的分佈, 就它的平均值及離散值表達效果較差. 

2016年7月18日 星期一

很好的STATA 14.1的教材 (A very good reading material of Stata 14.1)



    Stata 是我除了R以外, 較喜歡的統計軟件! 但與R相比, 有如下優點:
1.      它既有下拉菜單式的操作界面, 亦有編程式操作;
2.      統計編程的更簡潔;
3.      它統計功能的擴展性, 可與R媲美;
4.      14版後, 據知變項名都較好地支持中文;
5.      它制作出來的圖也很美;
       但是缺點就是商業軟件, 價錢也不便宜! 雖然有破解方法, 而更新方法也不太麻煩. 但對於做學術的, 仍是不太好呢~

近日在某討論區見到有一份Stata 14.1的教材, 很精華地把它的基本功能總結出來:
Data Processing
Import, explore, summarize, and create new variables
Data Transformation
Selecting portions of datasets, replacing and labeling data, reshaping, merging, string manipulation, and saving
Creating Data Visualizations
Syntax and arguments for plotting functions
Customizing Data Visualizations
Data Analysis
Summarize data, declare data, conduct statistical tests, and estimate models
Programming

下載地址: https://geocenter.github.io/StataTraining/pdf/AllCheatSheets.pdf

2016年7月1日 星期五

一套很好的流行病學軟件應用視頻 (A good set of videos of Epidemiological softwares)

    忘記了何時何處下載這套流行病學軟件的教學視頻了! 只記得下載了已有一段的時間, 期間總是忙著忙著, 直到近期放大假, 才有空閒把它一次過看完...

    這套教學視頻相信是北京大學的, 拍攝的時間約在2014年5-6月份!? 主講的導師是著名的呂筠教授及余灿清先生. 這個壓縮文件包含了59個視頻和16個PDF文件, 整個文件大約380M吧...
主要的內容包括:

1. 樣本量的計算及PASS樣本量計算軟件操作 ...(4個視頻)
2. PPS抽樣及CSurvey軟件操作 ...(6個視頻)
     CSurvey軟件在我的電腦不能使用,  因為過程中說缺少了foxbase的某些控件!?而且這個軟件也較舊了...

3. Epidata軟件操作 ...(18個視頻)
    尤其介紹check文件的內容很詳細, 很實用!

4. 無紙化調查平台理論及goodata電腦平台 ...(10個視頻)
    我第一樣事想到的, 就是goodata網互平台是北京某家公司開發的, 若數據存儲在那公司的伺服器內, 是否安全呢!?
5. STATA統計軟件 ...(10個視頻)
    主要介紹了簡易的操作方法, 另外還介紹了 流行病學及PPS抽樣調查的處理技巧.
6. 統計編程的輔助軟件Sublime免安裝版 ...(11個視頻)
    很好用及功能很強大的編程軟件啊...

    整體而言, 這套片很好, 對流行病學專業人員及調查員來說很實用! 感恩她/他們的貢獻...

分享: https://yunpan.cn/cBfqfBZCfHWuZ  访问密码 3e49