網(wǎng)站首頁(yè)
醫(yī)師
藥師
護(hù)士
衛(wèi)生資格
高級(jí)職稱
住院醫(yī)師
畜牧獸醫(yī)
醫(yī)學(xué)考研
醫(yī)學(xué)論文
醫(yī)學(xué)會(huì)議
考試寶典
網(wǎng)校
論壇
招聘
最新更新
網(wǎng)站地圖
中醫(yī)理論中醫(yī)臨床診治中醫(yī)藥術(shù)語(yǔ)標(biāo)準(zhǔn)中國(guó)方劑數(shù)據(jù)庫(kù)中醫(yī)疾病數(shù)據(jù)庫(kù)OCT說明書不良反應(yīng)中草藥圖譜藥物數(shù)據(jù)藥學(xué)下載
您現(xiàn)在的位置: 醫(yī)學(xué)全在線 > 中醫(yī)理論 > 中醫(yī)書籍 > 正文:第一節(jié) X2檢驗(yàn)
    

醫(yī)學(xué)統(tǒng)計(jì)學(xué):第一節(jié) X2檢驗(yàn)

X2(稱卡方)檢驗(yàn)用途較廣,但主要用于檢驗(yàn)兩個(gè)或兩個(gè)以上樣本率或構(gòu)成比之間差別的顯著性,也可檢驗(yàn)兩類事物之間是否存在一定的關(guān)系。一、兩個(gè)率的比較(一)X2檢驗(yàn)的基本公式 下頁(yè)末行的例3.1是兩組心肌梗塞病人病死率的比較,見表3.5,其中對(duì)照組未用抗凝藥。兩組病…

X2(稱卡方)檢驗(yàn)用途較廣,但主要用于檢驗(yàn)兩個(gè)或兩個(gè)以上樣本率或構(gòu)成比之間差別的顯著性,也可檢驗(yàn)兩類事物之間是否存在一定的關(guān)系。

一、兩個(gè)率的比較

(一)X2檢驗(yàn)的基本公式 下頁(yè)末行的例3.1是兩組心肌梗塞病人病死率的比較,見表3.5,其中對(duì)照組未用抗凝藥。兩組病人的病死率不同,抗凝藥組為25.33%,對(duì)照組為40.8%。造成這種不同的原因可能有兩種:一種是僅由抽樣誤差所致;另一種是兩個(gè)總體病死率確實(shí)有所不同。為了區(qū)別這兩種情況,應(yīng)當(dāng)進(jìn)行X2檢驗(yàn)。其基本步驟如下:

1.首先將資料寫成四格表形式,如表3.6。

將每個(gè)組的治療人數(shù)分為死亡與生存兩部分,各占四格表中的一格,這些數(shù)字稱為實(shí)際頻數(shù),符號(hào)為A,即實(shí)際觀察得來的數(shù)字。

2.建立檢驗(yàn)假設(shè) 為了進(jìn)行檢驗(yàn),首先作檢驗(yàn)假設(shè):兩種療法的兩總體病死率相等,為35%(即70/200),記為H0:π12。即不論用或不用抗凝藥,病死率都是35%,所以亦可以換一種說法:病死率與療法無關(guān)。

上述假設(shè)經(jīng)過下面步驟的檢驗(yàn)后,可以被接受也可以被拒絕。當(dāng)H0被拒絕時(shí),就意味著接受其對(duì)立假設(shè)即備擇假設(shè)H1。此例備擇假設(shè)為兩總體病死率不相等,記為H1:π1≠π2

因?yàn)槲覀冇^察的是隨機(jī)現(xiàn)象,所以無論是接受或拒絕H0都冒有一定風(fēng)險(xiǎn),即存在著錯(cuò)判的可能性。一般要求,當(dāng)錯(cuò)誤地被拒絕的概率α不超過一定的數(shù)值,如5%(或0.05),此值稱為檢驗(yàn)水準(zhǔn),記為α=0.05。

3.計(jì)算理論頻數(shù) 根據(jù)“檢驗(yàn)假設(shè)”推算出來的頻數(shù)稱理論頻數(shù),符號(hào)為T。計(jì)算方法如下:假設(shè)兩總體病死率相同,都是35.0%,那么抗凝血組治療75人,其死亡的理論頻數(shù)應(yīng)為75×35.0%=26.25人,而生存的理論頻數(shù)為75-26.25=48.75人。用同樣方法可求出對(duì)照組的死亡與生存的理論頻數(shù),前者為43.75人。后者為81.25人。 然后,把這些理論頻數(shù)填入相應(yīng)的實(shí)際頻數(shù)格內(nèi),見表3.6括號(hào)內(nèi)數(shù)字。

計(jì)算理論頻數(shù)也可用下式(3.4)

TRC=nRnC/N(3.4)

式中,TRC為R行與C列相交格子的理論頻數(shù),nR為與計(jì)算的理論頻數(shù)同行的合計(jì)數(shù),nC為與該理論頻數(shù)同列的合計(jì)數(shù),N為總例數(shù)。

例如;表3.6第一行與第一列相交格子的理論頻數(shù)(T1)為

T1 75×70/200=26.25

用兩種方法計(jì)算,結(jié)果是相同的。

4.計(jì)算χ2值,計(jì)算χ2值的基本公式為:

X2=∑(A-T)2/t (3.5)

式中,A為實(shí)際頻數(shù),T為理論頻數(shù),∑為求和符號(hào)。

將表3.6里的實(shí)際頻數(shù)與理論頻數(shù)代入式(3.5)即求得χ2值。此例χ2=4.929。

從式3.5中可看出,實(shí)際頻數(shù)與理論頻數(shù)之差(A-T)愈小,所得的χ2值就愈小,理論頻數(shù)是根據(jù)檢驗(yàn)假設(shè)推算出來的,若與實(shí)際頻數(shù)相差不大,說明假設(shè)與實(shí)際情況符合,于是就接受H0,認(rèn)為兩病死率無顯著差別;反之,若(A-T)大,則χ2值亦大,說明假設(shè)與實(shí)際不符,就拒絕假設(shè),認(rèn)為兩病死率有差別。但χ2值大還是小,要有一個(gè)比較的標(biāo)準(zhǔn),要查χ2值表(附表1),查χ2值表前先要定自由度。

5.求自由度 自由度是數(shù)學(xué)上的一個(gè)名詞。在統(tǒng)計(jì)中,幾個(gè)數(shù)據(jù)不受任何條件(如統(tǒng)計(jì)量,即樣本特征數(shù))的限制,幾個(gè)數(shù)據(jù)就可以任意指定,稱為有幾個(gè)自由度。若受到P個(gè)條件限制,就只有n-p個(gè)自由度了。例如在四格表中有四個(gè)實(shí)際頻數(shù),如沒有任何條件限制,則4個(gè)數(shù)字都可任意取值,有4個(gè)自由度,當(dāng)a+b,,c+d,a+c,b+d都固定后,在a、b、c、d四個(gè)實(shí)際頻數(shù)中,只能有一個(gè)頻數(shù)可任意指定了,因此,四格表的自由度為1。其計(jì)算公式為:

ν=(R-1)(C-1) (3.6)

式中,ν為自由度,R為橫行數(shù),C為縱列數(shù)。

四格表有2行和2列(注意:總計(jì)與合計(jì)欄不算在內(nèi))。因此ν=(2-1)(2-1)=1。

6.求P值,作結(jié)論 根據(jù)自由度查χ2值表(附表1)。此表的左側(cè)ν為自由度,表內(nèi)數(shù)字χ2值,表的上端P是從同一總體中抽得此樣本χ2值的概率。三者關(guān)系是:在同一自由度下,χ2值越大,從同一總體中抽得此樣本的概率P值越。辉谕籔值下,自由度越大,χ2值也越大。χ2值與概率P呈相反的關(guān)系。χ2檢驗(yàn)的常用界值為:

χ220.05()P>0.05 在α=0.05水準(zhǔn)處接受H0,差別不顯著

χ20.05≤χ220.01()0.05≥P>0.01在α=0.05水準(zhǔn)處拒絕HO,接受H1,差別顯著

χ2≥χ20.01()P≤0.01 在α=0.01水準(zhǔn)處拒絕HO,接受H1,差別顯著

這里α是預(yù)定的檢驗(yàn)水準(zhǔn)。χ20.05()是當(dāng)自由度為ν時(shí)與P=0.05相對(duì)應(yīng)的χ2值,簡(jiǎn)稱5%點(diǎn),χ20.01()是與P=0.01相對(duì)應(yīng)的χ2 值,簡(jiǎn)稱1%點(diǎn)。

當(dāng)ν=1時(shí),χ20.05(1)3.84,χ20.01(1)=6.63。本例自由度為1,求得χ2=4.929,介于3.84與6.63之間,或?qū)懗搔?sup>20.05(1)220.01(1)。由于與3.84對(duì)應(yīng)的縱行P=0.05,與6.63對(duì)應(yīng)的縱行P=0.01,因此與樣本χ2=4.929相應(yīng)的概率介于0.05與0.01之間,寫成0.05>P>0.01。在α=0.05水準(zhǔn)處拒絕H0,接受H1,兩總體率不等。對(duì)照組的病死率較抗凝血組高。

在α=0.05水準(zhǔn)處拒絕H0,說明若在同樣情況下作100次判斷,將有5次或不到5次的機(jī)會(huì),將原沒有差別的兩總體率錯(cuò)判為有差別,或說這樣判斷犯I型錯(cuò)誤的概率不超過5%。

下面將實(shí)例的檢驗(yàn)步驟集中列出。

例3.1 兩組心肌梗塞病人的病死率可見于表3.5,其中對(duì)照組未用抗凝藥?鼓M病死率為25.33%,對(duì)照組為40.80%,問兩組病死率有無顯著差別?

表3.5 兩組心肌梗塞病人病死率比較

組別治療人數(shù)死亡人數(shù)病死率(%)
抗凝血組751925.33
對(duì) 照 組1255140.80
總 計(jì)2007035.00

檢驗(yàn)步驟如下:

1.將資料列成四格表形式,如表3.6。

表3.6 四格表式樣

 死亡生存合計(jì)
抗凝血組19(26.25)56(48.75)75
對(duì)照組51(43.75)74(81.25)125
總 計(jì)70130200

2.H0:兩療法的總體病死率相同,即π1=π2

H1:兩療法的總體病死率不同,即π1π2

α=0.05

3.求理論頻數(shù)

抗凝血組:

死亡人數(shù)為75×35.0%=26.25人

存活人數(shù)為75-26.25=48.75人

對(duì)照組:

死亡人數(shù)為125×35.0%=43.75人

存活人數(shù)為125-43.75=81.25人

把理論頻數(shù)填入相對(duì)應(yīng)的實(shí)際頻數(shù)格內(nèi),見表3.6括號(hào)內(nèi)數(shù)字。

4.求χ2值 將表3.6里的數(shù)值代入式(3.5)得,

5.求自由度,確定P值,作結(jié)論

ν=(2-1)(2-1)=1,χ2 0.05(1)=3.84,χ2 0.01(1)=6.63,

本例χ2=4.929,χ2 0.05(1)22 0.01(1),則0.05>P>0.01,在α=0.05水準(zhǔn)處拒絕H0,接受H1,即兩總體病死率不等,對(duì)照組病死率較抗凝血組高。

上例告訴我們,兩個(gè)樣本病死率一大一小,在未作檢驗(yàn)之前,很難說它們兩總體率是否有差別,為了作出正確判斷,作X2檢驗(yàn)。先假設(shè)兩總體病死率相同,推算理論頻數(shù),由實(shí)際頻數(shù)與理論頻數(shù)計(jì)算χ2值,二者相差越大,χ2值也越大。本例得χ2=4.929,根據(jù)自由度為1時(shí)的χ2分布推斷,從同一總體內(nèi)抽樣,出現(xiàn)χ2值等于或大于4.929的概率較小,每一百次中在5次以下,1次以上,因此檢驗(yàn)假設(shè)被拒絕,而判斷為有顯著差別。

(二)連續(xù)性校正公式 χ2檢驗(yàn)是以連續(xù)的光滑曲線做根據(jù)的,當(dāng)自由度為1時(shí),χ2檢驗(yàn)所得的概率容易偏低,因些需要校正,校正后的χ2值比不校正的小一些,校正公式是:

(3.7)

公式中A-T前后兩條直線是絕對(duì)值的符號(hào)。

將表3.5資料代入式(3.7)得:

檢驗(yàn)兩個(gè)率相差的顯著性時(shí)(此時(shí)自由度為1),理論上都可用校正公式。但當(dāng)用公式(3.5)求出的χ2值小于3.84時(shí),相應(yīng)的P值大于0.05,表示兩個(gè)率相差不顯著,校正后χ2值更小,仍得同樣結(jié)構(gòu),就無須校正;當(dāng)用未校正公式求出的χ2值遠(yuǎn)遠(yuǎn)超過3.84時(shí),校正后的結(jié)論仍相同,在此種情況下也可不校正;當(dāng)自由度為2及以上時(shí),則不必校正。

當(dāng)用公式(3.5)求出的χ2值略大于3.84時(shí),校正最為必要,往往會(huì)改變?cè)瓉淼慕Y(jié)論,舉例如下。

例3.2表3.7是六六六粉的兩種配方進(jìn)行野外煙劑滅黃鼠實(shí)驗(yàn)的觀察結(jié)果。

表3.7 六六六粉兩種配方滅黃鼠的效果

煙薰后鼠洞情況合 計(jì)(實(shí)驗(yàn)觀察洞數(shù))滅洞率(%)
未盜開盜 開
04號(hào)配方13(16.63)9(5.37)2259.1
05號(hào)配方80(76.37)21(24.63)10179.2
總 計(jì)933012375.6

現(xiàn)用公式(3.5)及式(3.6)分別計(jì)算χ2值如下:

校正后的χ2值小于3.84,P>0.05,在α=0.05的水準(zhǔn)處接受H0,認(rèn)為兩種配方滅黃鼠效果無顯著差異,這相結(jié)論是比較合理的,如果不經(jīng)校正就會(huì)得出錯(cuò)誤的結(jié)論。

(三)四格表中求χ2的專用公式 用上述基本公式(3.5)求χ2值,需要求出與實(shí)際頻數(shù)一一對(duì)應(yīng)的理論頻數(shù),運(yùn)算較繁。在四格表中,用下列專用公式較為簡(jiǎn)便。

(3.8)

式中a、b、c、d為四格表中的實(shí)際頻數(shù),N表示總例數(shù)(即N=a+b+c+d)。

現(xiàn)仍以表3.5資料為例,先寫成四格表形式,如表3.8。

表3.8 四格表求χ2值專用公式的符號(hào)

 死 亡生存合 計(jì)
抗凝血組19(a)56(b)75(a+b)
對(duì)照組51(c)74(d)125(c+d)
 70(a+c)130(b+d)200(N)

將實(shí)際頻數(shù)代入式(3.8)得,

這里用專用公式求得的χ2值與前面用基本公式求得的結(jié)果完全不同,有時(shí)這兩個(gè)公式求得的結(jié)果小數(shù)點(diǎn)后幾位可能稍有出入,這是由于受小數(shù)四舍五入的影響。

前面已介紹了連續(xù)性校正公式(3.7),為使運(yùn)算更為簡(jiǎn)便,下面列出專用公式的連續(xù)性校正公式(3.9),并以表3.8資料代入計(jì)算如下:

(3.9)

所得結(jié)果與式(3.7)求得的一致。

二、多個(gè)率或多個(gè)構(gòu)成比的比較

(一)2×K表的專用公式,前面已討論了,兩個(gè)率的比較用四格表專用公式計(jì)算χ2值較為簡(jiǎn)便。如果是多個(gè)率比較,就要列成2×K表。這里的K暫為所比較www.med126.com的組數(shù),2為每個(gè)組內(nèi)所劃分的類型數(shù)。求χ2值時(shí)本可用基本公式計(jì)算,但以用下列專用公式為便:

(3.10) (3.11)

表3.9 2×K表形式之一

a1
a2

b1
b2

n1
n2

∑ai∑biN

公式中符號(hào)的意義參閱表3.9,以上兩個(gè)公式的計(jì)算結(jié)果是完全一樣的。

例3.3 某地觀察磺胺三甲氧吡嗪加增效劑(吡嗪磺合劑)預(yù)防瘧疾復(fù)發(fā)的效果,用已知有抗瘧疾復(fù)發(fā)效果的乙胺嘧啶和不投藥組作對(duì)照,比較三組的瘧疾復(fù)發(fā)率,資料如表3.10,問三組復(fù)發(fā)率有無顯著差別?

表3.10 三個(gè)組的瘧疾復(fù)發(fā)率

組 別觀察例數(shù)復(fù)發(fā)例數(shù)復(fù)發(fā)率(%)
吡嗪磺合劑
乙胺嘧啶
對(duì) 照
1996
473
484
76
27
53
3.81
5.71
10.95
合 計(jì)29531565.28

χ2檢驗(yàn)步驟如下:

1.將表3.10資料寫成2×K表形式,見表3.11。注意:這里必須把各組的觀察例數(shù)分為復(fù)發(fā)和未復(fù)發(fā)兩部分,這樣表3.10就為寫成2×3表。

表3.11 三個(gè)組瘧疾復(fù)發(fā)率的比較

 復(fù)發(fā)未復(fù)發(fā)合 計(jì)
吡嗪磺合劑7619201996
乙胺嘧啶27446473
對(duì) 照53431484
合 計(jì)15627972953

2.H0:三個(gè)總體復(fù)發(fā)率相同

H:三個(gè)總體復(fù)發(fā)率不全相同

α=0.05

3.求χ2值 將表3.11的數(shù)值代入式(3.10)(因?yàn)樵诒?.11中,各組的a值較小,計(jì)算較方便)得:

4.求自由度,確定P值,作結(jié)論

ν=(K-1)(2-1)=(3-1)(2-1)=2,查χ2值表得χ20.01(2)=9.21,本例χ2=39.92>χ20.01(2),P<0.01,在α=0.05的水準(zhǔn)處拒絕H0,接受H1,即三個(gè)組的復(fù)發(fā)率有顯著差別。

本例的結(jié)論是三個(gè)組的復(fù)發(fā)率有顯著差別,因此,還需進(jìn)一步說明三組中那兩組有差別,可用四格表對(duì)每?jī)蓚(gè)率進(jìn)行假設(shè)檢驗(yàn)。本例的檢驗(yàn)結(jié)果是:吡嗪磺合劑與對(duì)照組比(P<0.01),乙胺嘧啶組與對(duì)照組比(P<0.01),而吡嗪磺合劑與乙胺嘧啶比(P>0.05),說明吡嗪磺合劑有預(yù)防瘧疾復(fù)發(fā)的作用,其效果不低于乙胺嘧啶。

本例2×K表的2是指得發(fā)、未復(fù)發(fā)兩項(xiàng),K為比較的組數(shù),K=3。如果比較組數(shù)只有2,而構(gòu)成每組的項(xiàng)數(shù)則多于2,如甲狀腺腫的型別構(gòu)成可分為彌漫型、結(jié)節(jié)型、混合型三種。這類資料亦同樣可用2×K表專用公式進(jìn)行檢驗(yàn)。這時(shí)把2作為比較組數(shù),K作為項(xiàng)數(shù),檢驗(yàn)方法同上,表3.12是2×K表的另一種形式。

表3.12 2×K表形式之二

a1a2……∑ai∑bi
b1b2……
n1n2……N

例3.4,為研究不同地域甲狀腺型別的構(gòu)成有無顯著差別,某省對(duì)兩個(gè)縣的居民進(jìn)行甲狀腺腫調(diào)查,得資料如表3.13,問甲乙兩縣各型甲狀腺腫患者構(gòu)成比有無顯著判別?

表3.13 某省甲乙兩縣甲狀腺腫患者型別構(gòu)成比較

縣名彌漫型結(jié)節(jié)型混合型合計(jì)
甲縣48624492
乙縣13326051444
合計(jì)61926255936

檢驗(yàn)步驟如下:

1.H0:兩總體甲狀腺腫型別構(gòu)成相同

H1兩總體甲狀腺腫型別構(gòu)成不同

α=0.05

2.求χ2值, 將表3.13中的數(shù)值代入式3.10得:

3.求自由度,確定P值,作結(jié)論。

ν=(3-1)(2-1)=2,查χ2值表得χ20.01(2)=9.21,本例,χ2=494.36,P<0.01,在α=0.05水準(zhǔn)處拒絕H0,接受H1,甲、乙兩縣甲狀腺腫型別構(gòu)成有差別(P<0.01)。甲縣以彌漫型為主,而乙縣結(jié)節(jié)型較多,地域與患者的型別構(gòu)成具有一定的關(guān)系。

此類資料經(jīng)χ2檢驗(yàn)作結(jié)論,如果不顯著,說明兩組資料的構(gòu)成比來自同一總體,沒有顯著差別。如果結(jié)論顯著,說明兩組的構(gòu)成比來自不同總體,差別有顯著性。同時(shí)要指出兩組構(gòu)成的主要區(qū)別。

(二)R×C表的通用公式當(dāng)資料的行數(shù)和列數(shù)都超過2時(shí)稱R×C表。對(duì)此種資料作假設(shè)檢驗(yàn)時(shí),可用基本公式(3.5),但運(yùn)算較繁,如果用R×C表的通用公式計(jì)算χ2值,較為簡(jiǎn)便。

     。3.12)

式中,Aij為i行第j列的實(shí)際頻數(shù),ni為第i行的合計(jì)數(shù),nj為第j行列的合計(jì)數(shù),N為總頻數(shù)。

這個(gè)公式也系由基本公式(3.5)推導(dǎo)出來,式(3.12)也可用以求四格表、2×K表資料的X2值,故稱通用公式,用此公式不需計(jì)算理論頻數(shù),與基本公式(3.5)相比,較為簡(jiǎn)便。

例3.5某院肝膽外科在手術(shù)中觀察了膽結(jié)石的部位與類型得資料如表3.14,試分析兩者間有無關(guān)系存在?

表3.14 膽52667788.cn/wsj/結(jié)石類型與部位的關(guān)系

結(jié)石部位總例數(shù)例 數(shù)百 分 比
膽固醇結(jié)石膽紅素結(jié)石其它膽固醇結(jié)石膽紅素結(jié)石其它
膽囊11870163259.313.627.1
肝外膽管7512392416.052.032.0
肝內(nèi)膽管2922076.969.024.1
合計(jì)22284756337.833.828.4

檢驗(yàn)步驟如下:

1.將表3.14資料寫成R×C表形式,見表3.15.

表3.15 膽結(jié)石類型與部位的關(guān)系

結(jié)石部位結(jié) 構(gòu) 類 型
 膽固醇結(jié)石膽紅素結(jié)石其它合計(jì) 
膽囊701632118 
肝外膽管12392475 
肝內(nèi)膽管220729 
合計(jì)847563222 

2.H0:膽結(jié)石的類型與部位沒有關(guān)系

H1:膽結(jié)石的類型與部位有關(guān)系

α=0.01

3.求χ2值 將表3.15數(shù)值代入式(3.12)得:

4.求自由度,確定P值,作結(jié)論。

ν=(3-1)(3-1)=4,查χ2值表得χ20.01(4)=13.28,本例χ2=64.06<χ20.01。在α=0.01水準(zhǔn)處拒絕H0,接受H1,膽結(jié)石類型與部位有顯著關(guān)系存在(P<0.01),膽囊內(nèi)以膽固醇結(jié)石居多,肝內(nèi)、外膽管以膽紅素結(jié)石為主。

...
關(guān)于我們 - 聯(lián)系我們 -版權(quán)申明 -誠(chéng)聘英才 - 網(wǎng)站地圖 - 醫(yī)學(xué)論壇 - 醫(yī)學(xué)博客 - 網(wǎng)絡(luò)課程 - 幫助
醫(yī)學(xué)全在線 版權(quán)所有© CopyRight 2006-2046, MED126.COM, All Rights Reserved
皖I(lǐng)CP備06007007號(hào)
百度大聯(lián)盟認(rèn)證綠色會(huì)員可信網(wǎng)站 中網(wǎng)驗(yàn)證