在整理數(shù)據(jù)之前,首先對每一份原始資料進行查核,有無未填寫或填寫錯誤的表格,資料是否完整,將不合格的資料剔除,填寫不清楚或不詳?shù)馁Y料歸屬在“不詳”項,然后對可用的原始資料進行清點與分組。如采用計算機分析,則按設(shè)計和程序及相應(yīng)的編碼,由調(diào)查進行編碼,輸入電子計算機儲存,供分析用。
數(shù)據(jù)整理應(yīng)有層次,由粗至細(xì),層層深入,循序漸進。一般從整理描述性數(shù)據(jù)入手,可按種種不同的特性進行分組,例如人群可按性別、年齡、職業(yè)等分組;地區(qū)按城鄉(xiāng)等;時間按年、月、周等。分組的粗細(xì)按具體的需要而定,并計算率與均數(shù)來描繪它的分布及變動趨勢等,可初步發(fā)現(xiàn)各因素與疾病間的關(guān)系,存在何種差異。爾后對各單因素之間采用對比或相關(guān)的統(tǒng)計方法,分析各因素之間有無相關(guān)及相關(guān)的程度等。經(jīng)這樣處理后已能顯示出數(shù)據(jù)的主要特征及各數(shù)據(jù)間的關(guān)系,對研究結(jié)果可有初步的結(jié)論。在整理過程中如發(fā)現(xiàn)影響疾病的因素是復(fù)雜的,且可能是多因素的綜合作用,則需作多因素分析。
在整理資料時首先要擬整理表。例如整理吸煙習(xí)慣與肺癌死亡的關(guān)系時,需獲得吸煙與不吸煙的總?cè)藬?shù)及他們中死于肺癌的總?cè)藬?shù),這兩數(shù)據(jù)必須按表27-3形式獲得。
表27-3 吸煙習(xí)慣與肺癌死亡調(diào)查數(shù)據(jù)整理表
吸煙習(xí)慣 | 調(diào)查人數(shù) | 肺癌死亡人數(shù) | 死亡率(1/10萬) |
吸煙 | |||
不吸煙 |
表27-4 某人群吸煙量與肺癌死亡調(diào)查數(shù)據(jù)整理表
吸煙情況(支/日) | 調(diào)查人數(shù) | 因肺癌死亡人數(shù) | 死亡率(1/10萬) |
不吸 | |||
1~ | |||
11~ | |||
21~ |
如需分析吸煙量的多少與肺癌死亡關(guān)系時,可按表27-4的形式加以整理,即可獲得吸煙劑量與肺癌死亡的關(guān)系。醫(yī)學(xué).全在.線www.med126.com
在分析過程中如發(fā)現(xiàn)有兩種因素交織在一起,當(dāng)要確定以何者為主要因素時,可采用叉生法來排除非主要因素。例如1975年,某單位發(fā)生由冷飲引起的細(xì)菌性痢疾爆發(fā),經(jīng)初步調(diào)查可能為飲用豆?jié){或冰棍所致,但以何者為主呢?經(jīng)叉生法分析,從表27-5可見,單吃豆?jié){比單吃冰棍的罹患率要高得多,從而獲得飲用豆?jié){為這次細(xì)菌性痢疾爆發(fā)的主要因素。
表27-5 不同冷飲史與罹患率的關(guān)系
吃冷飲史 | 發(fā)病 | 不發(fā)病 | 合計 | 罹患率 | RR | |
豆?jié){ | 冰棍 | |||||
有 | 有 | 517 | 780 | 1297 | 39.86 | 46.3 |
有 | 無 | 59 | 108 | 167 | 35.33 | 41.1 |
無 | 有 | 66 | 665 | 731 | 9.03 | 10.05 |
無 | 無 | 13 | 1502 | 1515 | 0.86 | 1 |
X2=807.24自由度=3P<0.001
資料來源:錢宇平等,流行病學(xué)1987