一、暴露組選擇
暴露組應(yīng)已處在某種暴露因素中或已有某種特殊暴露史,并能提供可靠的暴露因素的歷史,且便于追蹤與觀察。
。ㄒ)特殊暴露的人群
選擇由于職業(yè)關(guān)系或其他原因暴露于某危險(xiǎn)因素特別嚴(yán)重的人作為定群研究對(duì)象,不但所需要的人數(shù)較少,而且較易發(fā)現(xiàn)暴露與患病之間是否存在聯(lián)系。如研究放射線與白血病的關(guān)系時(shí),選用接受放射線治療的患者;研究聯(lián)苯胺與膀胱癌的關(guān)系時(shí),選用染料工人;研究肺癌的危險(xiǎn)因素時(shí),選用石棉工人。
。ǘ)一個(gè)地區(qū)的全部人口或其樣本
有時(shí)可在一地區(qū)人群中進(jìn)行定群研究。選擇條件首先是便于研究。例如,在美國馬薩諸塞州的Framingham鎮(zhèn)已進(jìn)行多年的心臟病定群研究,在1948年開始時(shí)以當(dāng)時(shí)30~59歲人口的2/3的一個(gè)隨機(jī)樣本作為研究對(duì)象。因?yàn)楫?dāng)?shù)厝丝诹鲃?dòng)性小,居民配合,有一所高水平的醫(yī)院等,便于隨訪,能得到完整的資料。
一個(gè)可疑病歷必須有較高的人群暴露率,并且所研究的病又有較高的發(fā)病率或死亡率才適合于用全人群作定群研究。
(三)便于隨訪的人群
為了便于隨訪,往往選擇一個(gè)團(tuán)體,或以醫(yī)療就診和隨訪觀察結(jié)果方面特別方便的人群作為研究對(duì)象,可以節(jié)省人力、物力,并可提高隨訪質(zhì)量和結(jié)果判斷的可靠程度。例如Doll和Hill選擇了所有登記注冊(cè)的開業(yè)醫(yī)生。選擇屬于團(tuán)體的人群,樣本代表全人群的可能性稍差,但是能降低失訪率,同時(shí)提高調(diào)查結(jié)果的可靠性。
二、對(duì)照組的選擇
對(duì)照組的設(shè)立是為了與暴露組比較。對(duì)照組與暴露組應(yīng)具有可比性,即對(duì)照組人群除暴露因素的影響外,其他各種因素的影響或人群的特征,如年齡、性別、職業(yè)、民族等,都應(yīng)盡可能與暴露組相似。同時(shí)在資料收集完畢,進(jìn)行分析時(shí),還應(yīng)作一次均衡檢驗(yàn),以考核兩組資料的可比性。
對(duì)照組常用以下幾種形式:
。ㄒ)內(nèi)對(duì)照
若調(diào)查對(duì)象是一個(gè)整體人群,人群內(nèi)部暴露于某因素的便為暴露組,而非暴露或以暴露級(jí)別最低的一組便為對(duì)照組;不需另外設(shè)對(duì)照組或非暴露組。例如,調(diào)查人群中血脂水平,可以水平最低的組列為對(duì)照。
。ǘ)人群對(duì)照
不另設(shè)對(duì)照,而是以人群為對(duì)照。在職業(yè)流行病學(xué)研究中,常以某職業(yè)人群為暴露組,與該地區(qū)整個(gè)人群的發(fā)病(或死亡)率進(jìn)行比較分析。以人群為對(duì)照,應(yīng)注意對(duì)照組與暴露組人群在地理與時(shí)間的一致性。
特殊暴露人群人數(shù)一般不多,不能得到可靠的分年齡、性別和原因的專率供直接比較,一般須采用標(biāo)化死亡比或標(biāo)化發(fā)病比作間接比較,兩者均須計(jì)算標(biāo)準(zhǔn)誤并作顯著性檢驗(yàn)。
(三)另設(shè)對(duì)照組
選擇一個(gè)與暴露組在年齡、性別、民族、居住地區(qū)等方面相似的非暴露組作為對(duì)照組進(jìn)行隨訪,作為與暴露組比較的基準(zhǔn)。例如研究放射線對(duì)放射科醫(yī)師死亡率的影響時(shí),可以在同地區(qū)醫(yī)院內(nèi)眼科醫(yī)師作對(duì)照組。
。ㄋ)多種對(duì)照
為了增強(qiáng)判斷依據(jù),可將上述方法綜合起來,設(shè)立多種對(duì)照,進(jìn)行多重比較。如內(nèi)對(duì)照、人群對(duì)照、非暴露組對(duì)照等。這樣可以增加判斷的依據(jù)。
三、樣本大小的估計(jì)
定群研究樣本大小的估計(jì)應(yīng)根據(jù):
1.暴露組的事件發(fā)生率(P1)的估計(jì)值;
2.非暴露組的事件發(fā)生率(P0)的估計(jì)值;
3.第一類錯(cuò)誤概率α;
4.第二類錯(cuò)誤概率β。
在該4個(gè)數(shù)值確定后,可用下式估計(jì)暴露組與非暴露組需觀察的人數(shù)。
公式中N為每一組所需調(diào)查人數(shù)。
Q1=1-P1,Q0=1-P0
P=(P0+P1)/2,Q=1-P
Kα與Kβ分別為α及β值的正態(tài)分布分位數(shù),該數(shù)可從正態(tài)分布的分位數(shù)表中查出。
非暴露組的發(fā)病率P0可以根據(jù)人群一般發(fā)病水平來代替。而暴露組的發(fā)病率P1難以估計(jì),若能夠估計(jì)相對(duì)危險(xiǎn)度(RR),則P1=RR×P0,RR可從預(yù)調(diào)查或文獻(xiàn)資料中估計(jì),也可用OR來代替,P1=OR×P0,OR可從病例對(duì)照研究中得來。
例 擬用定群研究方法研究孕婦暴露于某種藥物與嬰兒先天性心臟病之間的聯(lián)系。假定已知非暴露組的發(fā)病概率P0=0.08,估計(jì)RR=2,當(dāng)α=0.05,β=0.10時(shí),估計(jì)需要的樣本含量。
Kα=1.960,Kβ=1.282
P0=0.008,RR=2,P1=2×0.008=0.016
P=(0.008+0.016) /2=0.012
Q=0.988,Q1=0.984,Q2=0.992
代入公式:
即每組需要樣本含量為3892人。
四、資料的來源與收集
確定暴露組與非暴露組后,需收集對(duì)疾病的發(fā)生或死亡頻率可能有影響的一般資料,如年齡、性別、婚姻、文化程度、經(jīng)濟(jì)收入、家庭人口、人口遷移等。
。ㄒ)從查閱現(xiàn)有的記錄收集
特殊暴露人群的職業(yè)史或醫(yī)療記錄常有暴露水平或個(gè)體暴露劑量的的資料,這是暴露史的唯一可靠來源。查閱現(xiàn)有記錄不僅可了解研究對(duì)象本人暴露的性質(zhì)和劑量,同時(shí)其主要優(yōu)點(diǎn)是具有較高的客觀性。
。ǘ)調(diào)查詢問收集
有時(shí)被研究對(duì)象的有些研究因素?zé)o現(xiàn)成記錄,例如煙、酒、飲食等生活習(xí)慣、體力活動(dòng)等,必須向被研究對(duì)象本人了解。通常采用調(diào)查表方式由調(diào)查員詢問時(shí)填寫或通信調(diào)查。
。ㄈ)通過醫(yī)學(xué)檢查或檢驗(yàn)收集
有些研究因素屬于被研究對(duì)象對(duì)生理特征或生化指標(biāo),必須通過檢查或檢驗(yàn)才能獲得數(shù)據(jù),例如血壓、身高、體重、血脂、血糖等。
。ㄋ)從環(huán)境資料收集
環(huán)境資料包括家庭環(huán)境、居住環(huán)境、工作環(huán)境、區(qū)域環(huán)境等。根據(jù)不同的研究假設(shè),可作不同暴露的測(cè)定。
。ㄎ)追蹤結(jié)局收集
追蹤確定各成員的結(jié)局,采用隨訪的方法進(jìn)行。隨訪的方法有直接方法,即通過函件調(diào)查、訪問調(diào)查、定期調(diào)查等。間接方法就是利用醫(yī)院病歷、死亡登記、疾病報(bào)告、勞保資料等,根據(jù)結(jié)局的性質(zhì)選用。判斷結(jié)局的標(biāo)準(zhǔn)必須在隨訪開始時(shí)規(guī)定,應(yīng)保持穩(wěn)定,以便前后比較。隨訪時(shí)間的長短,根據(jù)不同疾病的潛隱期、疾病的自然史及已暴露時(shí)間來確定。
五、定群研究資料分析
定群研究資料分析主要是計(jì)算各組發(fā)病率、發(fā)病密度或死亡率,其次對(duì)組間率的差異進(jìn)行統(tǒng)計(jì)學(xué)檢查,差異有統(tǒng)計(jì)學(xué)意義則進(jìn)一步確定因素與疾病聯(lián)系的強(qiáng)度。定群研究資料歸納見表30-2。
表30-2 定群研究資料歸納表
組別 |
病例 |
非病例 |
合計(jì) |
發(fā)病率 |
暴露組 |
a |
b |
a+b=N1 |
a/N1 |
非暴露組 |
c |
d |
c+d=N0 |
c/N0 |
a+c=m1 |
b+d=m0 |
定群研究所比較的是發(fā)病率或死亡率即a/N1,與c/N0,如a/N1>c/N0,則某因素與發(fā)病有聯(lián)系,甚至是因果聯(lián)系。
(一)率的計(jì)算
1.累積發(fā)病率(cumulative incidence)觀察期間人群比較固定,且能穩(wěn)定地維持在一個(gè)較長的觀察期,可用累積發(fā)病率(或死亡率)。計(jì)算公式為:
2.發(fā)病密度(ivcidence density)若暴露人口不固定,人群產(chǎn)生了較大的變動(dòng),例如由于工作調(diào)動(dòng)、死于其他疾病、中途加入等,應(yīng)將變動(dòng)著的人群轉(zhuǎn)變?yōu)槿藭r(shí)數(shù)代替人數(shù)業(yè)計(jì)算,此種發(fā)病率稱發(fā)病密度。人時(shí)就是將人與時(shí)間因素結(jié)合起來作為率分母的單位,常用的單位是人年,是一個(gè)觀察對(duì)象被觀察滿一年計(jì)為一人年。分子為觀察期間發(fā)病或死亡人數(shù)。
。ǘ)暴露人年計(jì)算
定群研究觀察時(shí)間較長,其間人口有動(dòng)態(tài)變化,應(yīng)采取一定方法計(jì)算“暴露人年數(shù)”,才能計(jì)算發(fā)病率;否則,兩組成員由于進(jìn)入開始觀察的時(shí)間不同,或因死亡、遷出及其他原因或早或晚地退出該組,而造成觀察時(shí)間的不同,即各組成員的暴露時(shí)間不同,可使發(fā)病率出現(xiàn)誤差。
1.大樣本中暴露人年的計(jì)算計(jì)算原則為:從觀察對(duì)象中剔除死亡、遷移及失去聯(lián)系的人數(shù),補(bǔ)充新加入的人數(shù)來折算人年。
可以年末12月31日的人數(shù)為終點(diǎn)及起點(diǎn)計(jì)算。上年12月31日觀察人數(shù)減去次年內(nèi)所有死亡、遷移、失去聯(lián)系及新加入人數(shù)的總和,得到次年末12月31日的觀察人數(shù)。兩個(gè)人數(shù)之和除以2,即得到該年內(nèi)暴露人年數(shù)。表30-3為例說明不同年齡9年的合計(jì)暴露人年數(shù)。
表30-3 男性各年齡各年末存活人數(shù)
年齡組 |
1972.
12.31 |
1973.
12.31 |
1974.
12.31 |
1975
12.31 |
1976.
12.31 |
1977.
12.31 |
1978.
12.31 |
1979.
12.31 |
1980.
12.31 |
1981.
12.31 |
合計(jì)暴露 人年數(shù) |
<45 | 607 | 547 | 471 | 392 | 324 | 246 | 210 | 179 | 148 | 110 | 2875.5 |
45~54 | 598 | 596 | 604 | 599 | 603 | 625 | 598 | 562 | 538 | 510 | 5279 |
55~64 | 369 | 406 | 433 | 472 | 493 | 496 | 519 | 524 | 513 | 526 | 4303.5 |
65及以上 | 62 | 75 | 95 | 111 | 132 | 158 | 180 | 210 | 251 | 286 | 1386 |
合計(jì) | 1636 | 1624 | 1603 | 1574 | 1552 | 1525 | 1507 | 475 | 1450 | 1432 | 13844 |
(李婉先等,1984)
以小于45歲組為例計(jì)算合計(jì)暴露人年數(shù):
。607+547)÷2+(547+471)÷2+(471+392)÷2(392+324)÷2+(324+246)÷2+(246+210)÷2+(210+179)÷2+(179+148)÷2+(148+110)÷2= 2875.5
如此9年內(nèi)共有3名45歲以下男性死亡,男性45歲以下組的死亡率為:3÷2875.5×10萬=104.3/10萬人年。
2.小樣本可以直接計(jì)算若樣本不大,且各人隨訪年數(shù)不同,可先算出各人隨訪人年數(shù),再計(jì)算總?cè)四陻?shù);而且因?yàn)殡S訪期內(nèi)各人的年齡在增長,到一定的日期年齡超過原屬年齡組上限時(shí),會(huì)進(jìn)入下一年齡組。所以還可以算出各年齡組的總?cè)四陻?shù)以及不同的年份的總?cè)四陻?shù),結(jié)合同年齡或同年份發(fā)生的病例數(shù),則可算出各年齡組或年份的發(fā)病率。
例有3人從開始觀察日起至1981年1月1日止,逐個(gè)計(jì)算人年的方法。上例并得出不同年齡組的暴露人年,見表30-4、表30-5。
表30-4 3例出生日期與進(jìn)出研究時(shí)間
對(duì)象編號(hào) |
出生日期 |
進(jìn)入研究時(shí)間 |
退出研究時(shí)間 |
1 |
1927.03.21 |
1966.07.19 |
1977.09.14(遷居外地) |
2 |
1935.04.09 |
1961.11.11 |
1973.12.01(死亡) |
3 |
1942.11.12 |
1970.02.01 |
1981.01.01(觀察結(jié)束時(shí)健在) |
資料來源:錢宇平;流行病學(xué)第二版1986
表30-5 3例人年的計(jì)算
對(duì)象1
1927年3月21日出生 |
對(duì)象2
1935年4月9日出生 |
對(duì)象3
1942年11月12日出生 |
暴露
人年 | |
25~ | 61.11.11~65.04.08
共3年4個(gè)月27天即3.41人年 |
70.02.01~72.11.11
共2年9個(gè)月10天即2.78人年 |
6.19 | |
30~ | 65.04.09~70.04.08
共5.00人年 |
72.11.12~77.11.11
共5.00人年 |
10.00 | |
35~ | 66.07.19~67.03.20
共8個(gè)月即0.67人年 |
70.04.09~73.12.01
共3年7個(gè)月22天即3.65人年 |
77.11.12~81.01.01
共3年1個(gè)月20天即3.14人年 |
7.46 |
40~ | 67.03.21~72.03.20
共5.00人年 |
5.00 | ||
45~ | 72.03.21~77.03.20
共5.00人年 |
5.00 | ||
50~54 | 77.03.21~77.09.14
共5個(gè)月24天即0.48人年 |
0.48 | ||
累計(jì) | 66.07.19~77.09.14
共11.15人年 |
61.11.11~73.12.1
共12.06人年 |
70.0201~81.01.01
共10.92人年 |
34.13
人年 |
資料來源:錢宇平:流行病學(xué)第二版1986
。ㄈ)統(tǒng)計(jì)學(xué)檢驗(yàn)
暴露組與非暴露組間率的差異要進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)。當(dāng)發(fā)病率高時(shí),可用u檢驗(yàn)。如果發(fā)病率比較低,則改用二項(xiàng)分布或泊松分布檢驗(yàn)。檢驗(yàn)方法查閱有關(guān)統(tǒng)計(jì)學(xué)書籍。
。ㄋ)聯(lián)系強(qiáng)度的測(cè)量
為了估計(jì)疾病死亡與暴露的聯(lián)系強(qiáng)度,常用的測(cè)量指標(biāo)有相對(duì)危險(xiǎn)度、特異危險(xiǎn)度、人群特異危險(xiǎn)度。
1.相對(duì)危險(xiǎn)度(relative risk)又稱“危險(xiǎn)比”(risk ratio)或“率比”(rate ratio)。是暴露組發(fā)病率(或死亡率)與非暴露組發(fā)病率(或死亡率)的比值,簡稱RR。
式中Ie=暴露組發(fā)病率,Iu=非暴露組發(fā)病率。
它說明暴露組發(fā)病或死亡為非暴露組的倍數(shù)。
RR>1,說明暴露因素與疾病有“正”的聯(lián)系。暴露越多,發(fā)病越多,可能是致病因素。
RR=1,說明暴露因素與疾病無聯(lián)系。
RR<1,說明暴露因素與疾病有“負(fù)”的聯(lián)系。暴露越多,疾病越少,具有保護(hù)意義。
表30-6中提供的判斷數(shù)據(jù)可供參考。
表30-6 相對(duì)危險(xiǎn)度與聯(lián)系強(qiáng)度
相對(duì)危險(xiǎn)度 |
聯(lián)系的強(qiáng)度 | |
0.9~1.0 | 1.0~1.1 | 無 |
0.7~0.8 | 1.2~1.4 | 弱 |
0.4~0.6 | 1.5~2.9 | 中等 |
0.1~0.3 | 3.0~9.0 | 強(qiáng) |
<0.1 | 10~ | 很強(qiáng) |
2.特異危險(xiǎn)度(attributable risk)又稱歸因危險(xiǎn)度或率差(rate difference),簡稱AR。特異危險(xiǎn)度為暴露組發(fā)。ɑ蛩劳)率與非暴露組發(fā)病(或死亡)率之差。
AR=Ie-Iu=a/N1-c/N0
特異危險(xiǎn)度表示完全由暴露因素所致之危險(xiǎn)度。
3.人群特異危險(xiǎn)度(population attributable risk)簡稱PAR。
PAR=It-Iu
It=全人群某病發(fā)病率或死亡率
Iu=非暴露者某病發(fā)病率或死亡率
人群特異危險(xiǎn)度是測(cè)量在人群中因暴露于某因素所致的發(fā)病率或死亡率。