2016年10月6日 星期四

資料的公開與使用 (The Using of Open data)

    近日, 從台灣的衛生福利部的網頁得悉: 為推廣傳染病開放資料更廣泛地使用, 他們辦了一個競賽, 而且是有獎金的.
    其實作為科研人, 我知道資料的時效性, 一般是5年為一期的!如:

1.參考的文獻, 最好在近5年發表的, 如果是5-10年內的文獻, 亦可參考. 但是超過10年的文獻, 就要考慮是否採用. 當然, 有些文獻是具有劃時代的、在該領域中具創新性的, 就另當別論!!! 如Doll & Hill 有關吸煙導致肺癌的病例對照研究 , Rathman等有關當代流行病學的研究... 這些"大牛"的文章都是很值得引用.
    另外, 個人建議, 文獻最好閱讀外國的, 因為若是經過翻譯的文獻, 大多已延遲數月之久, 而且有些人的翻譯, 實是不太好閱讀和理解!

2.如果是數據庫的話, 當然是盡早使用越好! 因為由數據處理及分析, 到發表文章, 在內地通常都要經過半年至一年之久, 1個數據庫, 要發表多些文章, 常要使用數年.
    但一般數據庫, 經過3數年, 已被稱為"陳舊"了! 超過5年的數據庫, 就很少用來發表文章, 只能常與新的數據庫作比較之用.

    與其將這些有用的資料束之高閣, 為何不把它釋放出來, 讓它仍在"保質期"中盡量發揮其價值所在!? 當然, 有些資料"可能"涉及到些敏感性內容, 如個人的人口學特徵. 但只要把它們去掉即可矣, 就如台灣現在開放的資料就是.
    我開啟過台灣疾病管制署的登革熱數據庫(csv文件), 基本已去除了人口學特徵的資料, 但仍可作一般的描述性統計, 時間及空間的分析.
   
    但我相信, 澳門離這個境界仍很遠! 不是在事, 而是在人...

參考資料:
1.疾病管制署. 「防疫Open Data應用高手過招競賽活動」正式開跑,歡迎箇中好手踴躍參加
http://www.mohw.gov.tw/news/572357190
2.http://data.gov.tw 

沒有留言:

張貼留言