(一)概說
病例對照研究(casecontrol study)是主要用于探索病因的一種流行病學(xué)方法。它是以某人群內(nèi)一組患有某種病的人(稱為病例)和同一人群內(nèi)未患這種病但在與患病有關(guān)的某些已知因素方面和病例組相似的人(稱為對照)作為研究對象;調(diào)查他們過去對某個或某些可疑病因(即研究因子)的暴露有無和(或)暴露程度(劑量);通過對兩組暴露史的比較,推斷研究因子作為病因的可能性:如果病例組有暴露史者或嚴(yán)重暴露者的比例在統(tǒng)計學(xué)上顯著高于對照組,則可認(rèn)為這種暴露與患病存在統(tǒng)計學(xué)聯(lián)系,有可能是因果聯(lián)系(圖4-1)。究竟是否是因果聯(lián)系,須根據(jù)一些標(biāo)準(zhǔn)再加以衡量判斷(詳見第七章“病因及其推斷”)。所謂聯(lián)系(associatiom)是指兩個或更多個變量間的一種依賴關(guān)系,可以是因果關(guān)系,也可以不是。
圖4-1 病例對照研究示意圖
例如,對一組肺癌病人(病例組)和一組未患肺癌但有可比性的人(對照組)調(diào)查他們的吸煙(暴露)歷史(可包括現(xiàn)在吸煙否,過去吸過煙否,開始吸煙年齡,吸煙年數(shù),最近每天吸煙支數(shù);如已戒煙則為戒煙前每日吸煙支數(shù),已戒煙年數(shù),等等)。其目的為通過比較兩組吸煙史的差別,檢驗吸煙(可疑病因)與疾。ǚ伟)有因果聯(lián)系的假設(shè)。這就是病例對照研究。
實例1.吸煙與肺癌的關(guān)系。
英國流行病學(xué)家A.B.Doll與R.Hill于1948~1952年進行過一項病例對照研究。他們從倫敦20所醫(yī)院及其他幾個地區(qū)選取確診的肺癌1465例。每一病例按性別、年齡組、種族、職業(yè)、社會階層等條件匹配一個對照;對照系胃癌、腸癌及其他非癌癥住院病人,也是1465例。由調(diào)查員根據(jù)調(diào)查表詢問調(diào)查。經(jīng)分析數(shù)據(jù),得到的主要結(jié)果有:①肺癌病人中不吸煙者的比例遠(yuǎn)小于對照組:男性占0.3%,女性占31.7%;而對照組中男性不吸煙者占4.2%,女性占53.3%,差別均很顯著;②肺癌病人在病前10年內(nèi)大量吸煙者(≥25支/日)顯著多于對照組;③隨著每日吸煙量的增加,肺癌的預(yù)期死亡率。(推算出的年死亡率)也升高,例如男性45歲~64歲組日吸煙25~49支者與不吸煙者死亡率之比為2.94/0.14,即前者的率為后者的21倍;④肺癌病人與對照組比較,開始吸煙的年齡較早,持續(xù)的年數(shù)較多,而病例中已戒煙者的停吸年數(shù)也少于對照組中已戒煙者。
以后,Hill,Doll,Peto等又用前瞻性隊列研究法深入研究,經(jīng)長達(dá)20年(女性經(jīng)22年)的觀察,更加令人信服地提示出吸煙為肺癌的主要病因以及吸煙對健康的其他多種危害。他們的結(jié)論已為其他許多研究所證實,成為許多國家提倡不吸煙、限制吸煙及限制卷煙銷售政策的科學(xué)基礎(chǔ)。
病例對照研究是最常用的分析流行病學(xué)方法。因其需要的調(diào)查對象數(shù)目較少,人力、物力都較節(jié)省,獲得結(jié)果較快,并且可由臨床醫(yī)生在醫(yī)院內(nèi)進行。對于少見病的病因研究,常為唯一可行的方法。但這些優(yōu)點都是與前瞻性隊列研究相對而言的,實際上倘與同等規(guī)模的臨床研究或?qū)嶒炇已芯勘容^,病例對照研究所費的時間與精力可能更多。
本書以臨床醫(yī)學(xué)專業(yè)學(xué)生為主要讀者,并不要求他們能掌握或獨立應(yīng)用分析流行病學(xué)方法,目標(biāo)只是了解大概、擴大眼界、培養(yǎng)科學(xué)思辨能力,領(lǐng)會科學(xué)上獲得一個發(fā)現(xiàn)或作出一個結(jié)論的復(fù)雜過程及需要的客觀態(tài)度。
病例對照研究是從現(xiàn)在是否患有某種疾病出發(fā),回溯過去可能的原因(暴露),在時間順序上是逆向的,即是從“果”推求“因”,所以又稱回顧性調(diào)查、研究。
病例對照研究(及其他類型的流行病學(xué)研究)中所謂的暴露(exposure)是指研究對象(病例或?qū)φ?具有某種疑為與患病與否可能有關(guān)的特征或曾受到某種疑為與患病與否可能有關(guān)的因子的影響。所謂特征(characteristic)可以是體質(zhì)上的、生理上的、也可是心理精神上的;即可以是遺傳性的也可以是獲得性的;所謂因子(因素)既可以是外界的也可以是機體內(nèi)在的;特征或因子可以是致病性的,也可以是保護性的(使人免于患病的)。因此,“暴露”是一個涵義廣泛的概念。
(二)方法
1.樣本含量的估計 為了研究一種暴露與疾病的關(guān)系需要多大一個樣本,也就是需要多少個病例和多少個對照,首先取決于4個條件:①人群中暴露者的比例;②假定暴露造成的相對危險度(其涵義詳見后文);③要求的顯著性水平;④要求的把握度。從這4個條件估算樣本的含量的方法,詳見附錄五。實際上,樣本含量還受許多因素的制約,例如病例和對照的來源、財力、人力、完成期限等。假定只有一定數(shù)目的病例與對照可以利用,則一個研究能查出的最小相對危險度是多少?又假定經(jīng)費數(shù)目已限定,則應(yīng)選多少個病例與對照才能取得最大的把握度,這些都是應(yīng)考慮的問題。此外,評價交互反應(yīng),控制混淆因素,亞組分析,每例多個對照等均影響所需樣本的大小。
2.病例和對照的來源與選擇
(1)病例:主要有兩種來源:①從醫(yī)院病人選擇,即是從某一所或若干所醫(yī)院選擇某時期內(nèi)就診或住院的某種病的全部病例。病例應(yīng)符合統(tǒng)一的、明確的診斷標(biāo)準(zhǔn)。最好是新發(fā)生的(新診斷的)病例。因為一種病的全部病例不大可能都有進入某一所或幾所醫(yī)院的同等機會,能進入的只是其中符合條件(即選擇因素)的那一部分,所以不要求能代表某時某地的全部病例,但應(yīng)要求能代表產(chǎn)生病例的人群,即該人群只要發(fā)生該種病例均可能進入該院。這樣,結(jié)果的普遍性雖受限,但真實性不受影響,而真實性是普遍性的前提。這種研究稱為以醫(yī)院為基礎(chǔ)的(hospital-based)病例對照研究;②從某特定人群選擇病例,即是以符合某一明確規(guī)定的人群在某時期內(nèi)(一年或幾年,視病例發(fā)生多少而定)的全部病例或當(dāng)病例數(shù)過多時以其中的一個隨機樣本作為研究對象。其優(yōu)點是選擇偏倚比前一種來源的小,結(jié)論推及該人群的可信程度較高。這種研究稱為以人群為基礎(chǔ)的(population-based)病例對照研究。
(2)對照:設(shè)立對照的目的在于估計如果疾病與暴露無聯(lián)系,則病例組的暴露率可能為多少,也就是為比較提供一個基準(zhǔn)。因此,對照與病例在一些主要方面必須具可比性。首先,對照必須從病例所來自的人群選擇,對照是有可能成為病例的人,換言之,每一病例在未發(fā)病前應(yīng)該是合格的對照,而每一對照若發(fā)病都有可能成為病例組的成員。對照選擇是否恰當(dāng)是病例對照研究成敗關(guān)鍵之一。
通常的做法是:如果病例組來自某一特定人群,則可以該人群的非病例(即未患該種疾病的人)的一個隨機樣本作對照;如果病例來自某所醫(yī)院,則可從同醫(yī)院同時就診或住院的其他病例中選擇對照。要求對照具有和病例一致的某些特征,即對照與病例有可比性,例如性別、年齡、居住地等;同時要求對照沒有患和研究因子與研究疾病有關(guān)的其他疾病的可能。例如,研究吸煙與肺癌的關(guān)系時,不能以慢性支氣管炎病人為對照,因為吸煙同時是這兩種病的可能病因;研究胃癌的病因不能以“慢性胃炎”病人為對照,因為這兩種病在病因上有密切關(guān)系,前者可能是后者在病因鏈上的一環(huán)。上述要求的目的都是減少混淆偏倚。其他來源的對照如病例的鄰居、同事、親屬等。各種不同來源的對照要解決的問題不同,都各有其局限性。例如,鄰居對照可控制社會經(jīng)濟地位的混淆作用,兄弟姊妹對照是考慮控制早期環(huán)境的影響和遺傳因素的混淆作用(極端要求為用同卵孿生),配偶對照是主要考慮成年期環(huán)境的影響。最常采用的方式是對照和病例都選自同一醫(yī)院,因為理論上他們都來自該醫(yī)院所服務(wù)的同一人群,而且對兩者都可在相同的環(huán)境中進行調(diào)查,也易于合作。但是由于不同病種的患者入院的機會不同,有可能使本來與某病無關(guān)的特征在醫(yī)院病例中表現(xiàn)出虛假的聯(lián)系(詳見第七章“病因及其推斷”)。為了減少這種偏倚發(fā)生的可能性,應(yīng)該選取多種疾病而不是一種疾病的病人作對照。
3.病例與對照的配合 設(shè)置對照的作用在于平衡除了研究因子(暴露)以外的其他可能影響患病的因素,也就是說如果暴露與所研究的疾病不存在聯(lián)系的話,病例的暴露比例(率)應(yīng)該與對照的無顯著差別;如果發(fā)現(xiàn)顯著差別,既然對照與病例在其他有關(guān)方面都可比較,因此可以推斷患病與否可能是與暴露率的差別有聯(lián)系。為使兩者具可比性,首先可以通過限制選擇病例與對照的范圍(例如年齡范圍、性別、種族等),使有關(guān)因子盡可能齊同。病例組與對照組的某些特征不應(yīng)存在顯著差別,即應(yīng)該均衡。
另一個選擇對照的重要方法叫匹配(matching,曾譯“配比”),又稱匹配抽樣(matchedsampling),就是在安排病例與對照時,使兩者的某些特征或變量相一致。具體做法有兩種:一種叫成組匹配或頻數(shù)匹配,即在選擇好一組病例之后,在選擇對照組時要求其某些特征或變量的構(gòu)成比例與病例組的一致(即在兩組的總體分布一致),例如性別、年齡構(gòu)成一致,具體做法上類似分層抽樣。另一種做法叫個別匹配,就是以每一病例為單位,選擇少數(shù)幾個特征或變量方面與病例一致的一個或幾個對照者組成一個計數(shù)單位或計數(shù)和分析單位。一個病例匹配一個對照的(即1:1匹配)一般稱為配對,也就是說由一個病例和一個對照組成對子(pair)為一個計數(shù)單位。
個別匹配,特別是1:1匹配,最常被采用。理論上,一個病例可以匹配多個對照,但研究證明病例與對照之比超過1:4時,統(tǒng)計效率不會明顯增加,但工作量卻增大。如果病例與對照來源都充足,調(diào)查費用又差不多,則以1:1匹配最合適;如果病例數(shù)有限而對照易得,則可采用一個病例匹配幾個對照的辦法以提高統(tǒng)計效率(例如實例2)。
在病例對照研究中采用匹配的目的,首先在于提高研究效率(study efficiency),表現(xiàn)為每一研究對象提供的信息量的增加。匹配后再按匹配的因素進行分層分析,可使每一個匹配層中都有一定數(shù)目的病例與對照,不至于因有的層只有病例有的層只有對照而無法對比,不能提供信息。其次,在于控制混淆因素的作用。所以匹配的特征或變量必須是已知的混淆因子,至少也應(yīng)有充分的理由這樣懷疑,否則不應(yīng)匹配。
無論是否采用匹配設(shè)計,為控制混淆作用都須在分析階段用分層、標(biāo)準(zhǔn)化或多元分析,但匹配后再按匹配因素作分層分析可以提高分析的效率,也就是提高了控制混淆因素的效率。
但是匹配也要付出代價:匹配增加了尋找對照的速度,以同樣的低價也許可以得到更多不匹配的對照,從而擴大樣本含量。從這個意義上說,匹配又降低了研究效率。增加匹配項目又會導(dǎo)致可能作為對照者的減少,無法找到可匹配對照的病例只得被剔除;一個項目一經(jīng)匹配不但使它與疾病的關(guān)系不能分析而且使它與其他研究因子的交互作用也不能充分分析。把不必要的項目列入匹配,企圖使病例與對照盡量一致,如果匹配的因素與暴露有聯(lián)系,就可能人為地造成更多的病例與對照暴露史一致的對子,徒然丟失信息,增加工作難度的結(jié)果反而是降低了研究效率。這種情況稱為匹配過度(over-matching),應(yīng)注意避免。
匹配的變量應(yīng)一致到什么程度,取決于變量的性質(zhì)、實際可能與必要:離散變量(即屬性,無中間值的變量)可以完全匹配,連續(xù)變量(在一定范圍內(nèi)可取任何值的變量)往往劃分為若干類或組,再按此匹配。例如按年齡分組、按血壓分組、按吸煙量分組匹配。分得太細(xì),會增加工作難度,也不一定必要,例如年齡要求同歲;但分得太粗,例如年齡按10歲分組,又達(dá)不到控制混淆作用的目的。
當(dāng)估計有許多可能的混淆因素需要控制時,倘僅靠分層則因?qū)訑?shù)太多不能保證每層均有病例與對照,所以采用匹配以保證有效的分層分析。其次,有的列名變量包含許多類別或內(nèi)容復(fù)雜(例如職業(yè)、種族、居住地、籍貫、兄弟姊妹等),如是可能的混淆因子,應(yīng)加匹配。否則單靠分層不能控制混淆作用。
匹配可保證對照與病例在某些重要方面的可比性。對于小樣本研究以及因為病例的某種構(gòu)成(例如年齡、性別構(gòu)成)特殊,隨機抽取的對照組很難與之平衡時,個別匹配最為有用。
一般除性別、年齡之外,對于其他因素是否列入匹配須持慎重態(tài)度,以防止匹配過頭及徒增費用和延長完成時間。
4.計劃和執(zhí)行 病例對照研究在制訂計劃和執(zhí)行時應(yīng)注意以下問題:
(1)主要假設(shè)的說明是否清楚、簡明而且可以檢驗?
(2)疾病與暴露變量的定義清楚、明確否?
(3)是否擬探索劑量反應(yīng)關(guān)系和多個危險因素的聯(lián)合作用?
(4)為解答問題所需之病例數(shù)和對照數(shù)能否得到?這樣大小的樣本能查出的最小相對危險度是多少?與估計的相差多少?[參考附錄五(四)節(jié)]。
(5)病例來源及抽樣技術(shù)明確否?病例數(shù)與對照數(shù)之比是多少?匹配否及匹配哪些變量?
(6)調(diào)查表(問卷)是否已包括打算測量的所有變量并能夠收集到需要的數(shù)據(jù)?其詳盡程度是否已足供分析之用?
(7)醫(yī)院記錄(病歷)及其他來源的信息、從體檢、實驗室檢查、病理切片等獲得的數(shù)據(jù)需表格記錄否?
(8)調(diào)查表經(jīng)過試用否?其真實度與可靠度(重復(fù)性)經(jīng)評估否?訪問時擬使用幫助回憶的實物、模型或圖片否?
(9)調(diào)查員、質(zhì)控員、病歷摘錄員、編碼員的工作手冊已編好否?須專門培訓(xùn)否?
(10)組織機構(gòu)、人員、設(shè)備、經(jīng)費落實否?
(11)協(xié)作單位有書面協(xié)議否?有關(guān)領(lǐng)導(dǎo)機關(guān)已批準(zhǔn)否?將診斷根據(jù)(切片、標(biāo)本、影像圖片等)送到主持單位復(fù)核安排妥當(dāng)否?
(12)實驗室檢驗項目或用儀器檢測的項目所用儀器、方法、試劑是否符合標(biāo)準(zhǔn)?結(jié)果的真實度與可靠度經(jīng)過考核否?
(13)經(jīng)治醫(yī)院、醫(yī)生是否同意提供病例和對照?是否必須取得研究對象在了解情況后的書面同意?資料、數(shù)據(jù)怎樣保密?怎樣保存?
5.數(shù)據(jù)分析 須分析什么項目,計算哪些統(tǒng)計量,用什么統(tǒng)計學(xué)方法,用手工(計算器)還是計算機,如用后者怎樣建數(shù)據(jù)庫和用什么軟件包,等等,都應(yīng)包括在設(shè)計之中,手工計算時還應(yīng)擬好相應(yīng)表格,F(xiàn)在計算機及統(tǒng)計軟件包的應(yīng)用漸趨普及,過去很難進行的一些復(fù)雜的統(tǒng)計檢驗現(xiàn)在很快就可完成并打印出結(jié)果還可繪出統(tǒng)計圖。但是,一些流行病學(xué)專家主張先用手工計算基本內(nèi)容以熟悉數(shù)據(jù),然后再由計算機作復(fù)雜運算(多元分析)。
本節(jié)要介紹的是基本原理和基本方法,無論用手工或機器運算,這些都是應(yīng)熟悉的。
病例對照研究數(shù)據(jù)分析的中心內(nèi)容是比較病例和對照中暴露的比例并由此估計暴露與疾病的聯(lián)系程度,并估計差別與聯(lián)系由隨機誤差造成的可能性有多大,特別要排除由于混淆變量未被控制而造成虛假聯(lián)系或差異的可能。進一步,還可計算暴露與疾病的劑量反應(yīng)關(guān)系,各因子的交互作用(對一種因子的暴露會不會影響對另一種因子的效應(yīng)),等等。非匹配和匹配設(shè)計的研究,數(shù)據(jù)的分析方法有一些不同。
(1)非匹配數(shù)據(jù)的分析:首先要檢驗病例組與對照組在某些主要特征(即可能成為混淆因子的特征)的構(gòu)成上是否沒有顯著差別(均衡性檢驗)。
1)聯(lián)系的顯著性與聯(lián)系強度:某個因素與某種結(jié)局(患病或死亡)之間的聯(lián)系是否有統(tǒng)計學(xué)顯著性,常用χ2檢驗。最簡單的情況是因素與結(jié)局都只分為“有”或“無”兩類,數(shù)據(jù)可納入一張2×2表(即四格表,又稱四格列聯(lián)表),例如表4-1。χ2檢驗可用四格表專用公式(式4-1)。但χ2值的大小并不表示聯(lián)系的強度。χ2≥3.84時,設(shè)兩者無聯(lián)系的假設(shè)(無效價設(shè),H0)被否定,而轉(zhuǎn)向存在聯(lián)系的假設(shè)(備擇假設(shè),HA),這個判斷錯誤的可能性為≤0.05(即ρ≤0.05)。χ2值越大,判斷錯誤的可能性越小。
表4-1 危險因子與疾病的聯(lián)系
患病 | 有暴露史 | 無暴露史 | 合計 |
有 | a | b | a+b |
無 | c | d | c+d |
合計 | a+c | b+d | a+b+c+d=n |
統(tǒng)計學(xué)顯著性可以評價在多大程度上可用機會解釋所觀察到的聯(lián)系。但如數(shù)據(jù)本身存在系統(tǒng)誤差,統(tǒng)計學(xué)顯著性檢驗就無意義,因為它不能區(qū)別聯(lián)系的真或假(由偏倚、混淆所致的聯(lián)系)。此外,統(tǒng)計學(xué)顯著性檢驗結(jié)果極大地受樣本含量的影響,樣本小則隨機變異大;即使實際上暴露的作用很大,也會導(dǎo)致“不顯著”的結(jié)論。所以“不顯著”應(yīng)理解為“不足以否定無效假設(shè)”。
(式4-1)
現(xiàn)況調(diào)查和隊列研究(見本章“二、隊列研究”)可以計算暴露者(或具某特征者)和未暴露者(或不具某特征者)的患病率或發(fā)病率,因為分子數(shù)與分母數(shù)是已知的。也可以計算相對危險度(見本章公式4-11)。這是聯(lián)系強度的一個指標(biāo)。
但是病例對照研究因為不能計算出患病率或發(fā)病率所以不能計算相對危險度,但可用另一個聯(lián)系強度指標(biāo)——比數(shù)比(odds ratio,又譯比,值比、優(yōu)勢比,縮寫為OR)。比數(shù)比是兩個比數(shù)之比。比數(shù)(odds)是表示一個事件發(fā)生機會大小的一種指標(biāo)。以表4-1為例(字母代表數(shù)目),如果是隊列研究與現(xiàn)況調(diào)查,可以計算發(fā)。ɑ蚧疾)比數(shù),暴露組的這個比數(shù)為α/c,未暴露組的這個比數(shù)為bwww.med126.com/d。如果是病例對照研究,可以計算暴露比數(shù),在病例組是α/b,在對照組是c/d。兩組比數(shù)之比稱為比數(shù)比,
OR =(α/b)/(c/d)=αd/bc
或
OR =(α/c)/(b/d)= αd/bc.(式4-2)
這個比正好是四格表中兩條對角線上四個數(shù)字的交叉乘積αd與bc之比,所以四格表數(shù)據(jù)的OR又稱交叉乘積比。OR可用于隊列研究,但更重要的是用于病例對照研究。在少見病,OR可以當(dāng)作RR去解釋,即OR近似于RR。因在此情況下總體內(nèi)不論暴露組或未暴露組中患病者的人數(shù)(分別記為A與B,用大寫字母區(qū)別于樣本數(shù)據(jù)的小寫字母)都遠(yuǎn)少于未患病者的人數(shù)(C與D),所以在總體內(nèi)A+C→C,B+D→D,于是
因為從隨機樣本的α/c與b/d可以估計A/C或B/D,所以可用αd/bc估計AD/BC,也就是說可以用OR作為RR的估計值。
暴露組與未暴露組的發(fā)病率或死亡率之比稱為率比(rate ratio)。兩組發(fā)病概率之比稱為危險度比(risk ratio)。在少見病,這兩個比和比數(shù)比均近似,可統(tǒng)稱為相對危險度。
從OR(或RR)值可估計暴露與疾病的聯(lián)系程度。這種聯(lián)系的穩(wěn)定性,即隨機變異的大小可用顯著性檢驗的ρ值和可信限來估計。OR是用來估評暴露與疾病的聯(lián)系程度或即暴露作用強度的一個點估計值(0~∞),但為估計這個值受隨機變異影響的程度,最好同時算出可能包括真值(參數(shù))的一個取值范圍,表示以一定程度的信心估計參數(shù)值所在的范圍,稱為可信限或可信區(qū)間(confidence interval)。計算方法詳見附錄五。如果可信限包括了無效值(OR=1),說明該聯(lián)系無顯著性;可信限的寬度又反映點估計值(OR)的穩(wěn)定性,范圍寬說明估計值不穩(wěn)定,也就是隨機變異程度大。所以現(xiàn)在認(rèn)為僅計算出點估計值的意義有限,應(yīng)同時計算出其可信限。
2)分層數(shù)據(jù)分析:病例對照研究在設(shè)計階段可采用的控制混淆因素的方法有限制與匹配。限制是指對采用研究對象的范圍加以限制,如混淆因素為列名變量(離散變量)可限定只采用某一類或幾類對象(例如性別、職業(yè)、地區(qū)等),如為連續(xù)變量可限定只采用某一范圍內(nèi)(例如年齡組、段)的對象。其目的都是得到比較勻質(zhì)的研究對象。如果一個因素在各對象間無差別或差別很小,它就不可能起到混淆作用,也就是得到了控制。可在分析階段采用的控制混淆因素的方法有分層、標(biāo)準(zhǔn)化和多元分析。其中以分層分析最常用。
分層就是把樣本按照一個或更多個混淆因子的暴露有無或作用程度而劃分為若干個組,也就是“層”,再分別在每一層內(nèi)分析所研究暴露與疾病的聯(lián)系,計算各層的比數(shù)比(記為OR);
表4-2 第i層內(nèi)病例與對照按暴露有無分組
組別 | 病倒 | 對照 | 合計 |
暴露 | αi | bi | m1i |
未暴露 | ci | di | m0i |
合計 | n1i | n0i | ni |
如果各層 具有齊性[齊性檢驗方法見附錄五(一)],則可以計算總的即各層OR的合并OR。因其方法系Mantel與Haenszel兩人所開發(fā),所以通常記作ORMH。因在同一層內(nèi)作為分層標(biāo)志的因子對病例組與對照組的作用都是相同的,所以對所研究的暴露與疾病的聯(lián)系便不會發(fā)生混淆作用。其原理與匹配相同,實際上1:1匹配就是一種最細(xì)的分層,每層只包括一個病例與一個對照。合并OR是概括各層OR的一個指標(biāo)。
合并OR的計算方法:
(式4-3)
ORMH可信限的計算方法及計算實例見附錄五(一)。
ORMH如果不等于1,那么與1的差異是否顯著?可用作顯著性檢驗,其方法如下:
(式4-4)
式中,ai=各層四格表中的a數(shù)值,
檢驗假設(shè)(即無效假設(shè))Ho:OR=1,雙側(cè)備擇假設(shè)HA:OR≠1。統(tǒng)計量X2MH呈自由度為1的X2分布。
分層分析法舉例:某地進行了一次食管癌病因的病例對照研究,共調(diào)查病例200例,人群對照776例,F(xiàn)分析其中飲酒與食管癌的聯(lián)系,結(jié)果如表4-3。
表4-3 飲酒與食管癌的聯(lián)系
飲酒史 | 病倒數(shù) | 對照數(shù) | 合計 |
飲 酒 | 171 | 381 | 552 |
不飲酒 | 29 | 395 | 424 |
合計 | 200 | 776 | 976 |
OR=6.11 χ2=84.29
可見飲酒與食管癌有強聯(lián)系,但已知吸煙與食管癌也有強聯(lián)系。為了分析飲酒與食管癌顯示出的強聯(lián)系是否可能與吸煙有關(guān),或吸煙是否可能是一個混淆因子,可采用分層分析:按是否吸煙分為兩組,再分析飲酒與食管癌的聯(lián)系,結(jié)果見表4-4。
表4-4 飲酒與食管癌在吸煙與不吸煙者的聯(lián)系
不吸煙者 | 吸煙者 | ||||||
飲酒史 | 病倒 | 對照 | 合計 | 飲酒史 | 病倒 | 對照 | 合計 |
飲 酒 | 69 | 191 | 260 | 飲酒 | 102 | 190 | 292 |
不飲酒 | 9 | 257 | 266 | 不飲酒 | 20 | 138 | 158 |
合計 | 78 | 448 | 526 | 合計 | 122 | 328 | 450 |
OR=10.3 χ2=53.99 OR=3.70 χ2=24.62
計算ORMH,先用公式(4-3)計算
再用公式(4-4)作χ2檢驗:
χ2MH=76.84
ρ<0.00000001。用附錄五公式(附式5-1)計算ORMH的95%可信限,上限為8.09,下限為3.81。用附錄五(一)的Woolf法作各層ORi的齊性檢驗,結(jié)果說明各層間的OR差異顯著,來自同一總體的可能性很小,所以O(shè)RMH不能說明吸煙、飲酒與食管癌的聯(lián)系,因此是無意義的。這種齊性檢驗可同時檢驗各因素間是否存在交互作用。本例的計算過程及結(jié)果解釋見附錄五(一)的計算實例。
以上關(guān)于分析方法的介紹,都是以暴露有無和疾病有無這種最簡單的兩分變量為例。實際情況常較此復(fù)雜,有必要時讀者可參考專書。
多個混淆因子如用分層法同時控制多個混淆因子,則分成的層數(shù)將很多(例如,年齡分5組,性別分2組,吸煙與否2組,就已有20層),在樣本含量不是特別大的情況下,每層的人數(shù)將劇減,而且各層中病例數(shù)與對照數(shù)或與未暴露者數(shù)目的比例波動很大,可能出現(xiàn)只有病例而無對照或相反以及人數(shù)為零的層,以致統(tǒng)計效率降低,信息丟失。這時應(yīng)采用多元分析法解決問題。現(xiàn)在借助電子計算機及軟件包,已可使過去用手工計算很難進行的幾種方法成為普及。多元分析法在樣本不是極大的情況下可同時控制多個變量的作用而不影響研究效率,F(xiàn)在應(yīng)用十分廣泛的是多元logistic回歸分析。
(2)匹配數(shù)據(jù)的分析:本書只以1:1匹配的數(shù)據(jù)為例。數(shù)據(jù)分析的程序基本上與非匹配數(shù)據(jù)相同。
1)檢驗病例與對照的暴露比例是否有顯著差別:就每一對中的病例與對照的暴露史而言,可能有四種組合情況(頻數(shù)記為f ,有暴露記為下標(biāo)1,無暴露記為下標(biāo)0):①病例有暴露,對照也有暴露(記為f11);②病例有暴露,對照無暴露(f10);③病例無暴露,對照有暴露(f01);④病例與對照都無暴露(f00)。只有這四種組合,而且四者必居其一。設(shè)四種情況的對子各有f11,f10,f01,f00對,則全部數(shù)據(jù)可用一張四格表歸納(表4-5)。每格的數(shù)字代表對子數(shù)。
設(shè)暴露與患病無聯(lián)系,即H0:OR=1,x2檢驗用下式:
表4-5 配對數(shù)據(jù)的四格表
病倒 | 對照 | 合計 | |
暴露 | 未暴露 | ||
暴 露 | f11 | f10 | f11+f10 |
未暴露 | f01 | f00 | f01+f00 |
合計 | f11+f01 | f10+f00 | N |
(式4-5)
自由度=1。此式適用于較大樣本。
2)比數(shù)比及其可信限的計算:只有病例與對照暴露史不相同的對子(f10與f01),才能提供關(guān)于暴露與疾病聯(lián)系程度的信息。
OR=f10/f01(f01≠0時)(式4-6)
OR可信限可用附錄五公式(附式5-1)計算。
實倒1:有一項調(diào)查心肌梗死與高血壓的關(guān)系的病例對照研究,用1:1匹配設(shè)計,以收縮壓(SBP)≥18.6kPa(140mmHg)為高血壓。數(shù)據(jù)如表4-6(虛構(gòu))。
表4-6 高血壓與心肌梗死的病例對照研究
心肌梗死病倒 | 對 照 | 合計 | |
SBP≥18.6 | SBP<18.6 | ||
SBP≥18.6 | 15 | 60 | 75 |
SBP<18.6 | 35 | 40 | 75 |
合計 | 50 | 100 | 150 |
用公式(式4-5)作卡方檢驗:
用公式(式4-6)計算OR:
OR=60/35=1.71
用附錄五公式(附式5-1)計算OR的95%可信限:
計算結(jié)果說明高血壓與心肌梗死有中等程度的聯(lián)系(OR=1.71)。高血壓患者患心肌梗死的危險度較非高血壓者約高出70%。OR的可信限不包括1,說明OR值有顯著性。
(3)人群歸因危險度:在一定條件下,從病例對照研究結(jié)果可以算出人群歸因危險度,詳見“隊列研究”。
(三)病例對照研究的偏倚
偏倚問題將在第七章詳細(xì)討論。三種主要偏倚,即選擇偏倚、信息偏倚、混淆偏倚,在病例對照研究都可能發(fā)生。特別www.med126.com是選擇偏倚,在醫(yī)院為基礎(chǔ)的病例對照研究更易發(fā)生。又因作為一種回顧性調(diào)查,特別易受回憶偏倚(信息偏倚的一種)的影響,因為暴露史主要須依靠被調(diào)者的回憶,但一些復(fù)雜煩鎖的問題(如膳食史)很難正確回憶;一些被認(rèn)為可能與患病有關(guān)的暴露史,病例易高估,對照易低估。如果調(diào)查員知道誰是病例誰是對照以及病因假設(shè),則易于在調(diào)查時態(tài)度不同、重點不同,產(chǎn)生誘導(dǎo)作用,從而造成偏倚,稱為調(diào)查員偏倚。這些都是在設(shè)計、執(zhí)行和分析時應(yīng)加預(yù)防和處理的。
實例2:女青年陰道腺癌(vaginal adenocarcinoma)和母親妊娠期服用已烯雌酚關(guān)系的研究。美國波士頓婦產(chǎn)科醫(yī)生AL Herbst注意到1966~1969年期間在該市Vincent紀(jì)念醫(yī)院診斷了7例15~22歲的女青年患陰道腺癌。這本是一種罕見的女性生殖系統(tǒng)癌癥,發(fā)病年齡一般在50歲以上,F(xiàn)在這種明顯的時間和地區(qū)的聚集性以及大為提早的發(fā)病年齡,引起了Herbst醫(yī)生探究其病因的興趣。
初步調(diào)查結(jié)果發(fā)現(xiàn)這7例均無使用陰道局部刺激物的歷史,除1例于發(fā)病后結(jié)婚外均否認(rèn)有性交史。為詳細(xì)了解這些病例從胚胎期至發(fā)病前的情況以及她們的母親在妊娠期的情況,從而尋找病因線索,Herbst決定作一次病例對照研究。
另外,同時期在另一所醫(yī)院也診斷了一例20歲的陰道腺癌病人。這樣,共有8個病例。每例匹配4個對照。從病例出生的醫(yī)院保存的出生記錄中選擇與病例在同等級病房中前后不超過5天出生的女嬰作為對照候選人,優(yōu)先選擇與病例出生時間最近者為對照。由經(jīng)過訓(xùn)練的調(diào)查員用調(diào)查表對病例、對照以及他們的母親進行訪問調(diào)查。
在列入比較的許多因素中,多數(shù)在兩組間無顯著差別。例如,出生時母親的年齡、母親吸煙史、哺乳史及X線照射史等。但有3個因素顯示顯著差別:母親以前流產(chǎn)史,此次懷孕時陰道出血史,此次妊娠期曾用過已烯雌粉(DES)。三者的關(guān)系是:因有前兩個因素存在才用DES治療。尤以DES服用史差別最為明顯(x2=23.22,p<0.00001)。
通過8個病例與32個對照的病例對照研究,Herbst等得出結(jié)論,母親在妊娠早期服用DES可使其在子宮內(nèi)受暴露的女兒以后發(fā)生陰道腺癌的危險性增加。
實際上,在妊娠期用過DES的婦女很多,但她們的女兒發(fā)生陰道腺癌的危險并不高。病例對照研究結(jié)果提供的不是暴露招致的絕對危險度(發(fā)病率)而只是相對危險度。
從方法選擇上,DES與陰道腺癌的聯(lián)系問題,還可用歷史性隊列方法研究:收集在病例診斷前15~25年間曾在妊娠期用過DES的婦女的住院病歷,再選擇合適的、未用過DES的婦女的病歷作為對照組。對兩組婦女的女兒們進行隨訪,確定陰道腺癌的發(fā)生率是否有差別。因為這是一種罕見病,這樣研究雖然理論上可行,但實際做起來困難很多。至于用前瞻性隊列法研究罕見病的病因,雖然理論上也可行,但實際上做不到。因此,可以看出:病例對照法是研究罕見病的最經(jīng)濟最快捷的途徑,常常是唯一實際可行的途徑。Herbst等只用8個病例與32個對照所完成的病例對照研究就是一個有意義的例子。