在醫(yī)學(xué)科研中有時需要根據(jù)樣本數(shù)據(jù)推論總體中個體值范圍,其中最常用的是估計正常值范圍。
一、正常值范圍的意義
正常人體的解剖、生理、生化、心理等各種數(shù)據(jù)的波動范圍稱正常值范圍,簡稱正常值。如成人白細胞總數(shù)的正常值為4000~10000個/mm3。以一定數(shù)量“正常人”為樣本,觀察某個或幾個變量,根據(jù)所得樣本數(shù)據(jù),推論總體中變量值的范圍,稱正常值范圍估計。一些與人體有關(guān)的外界環(huán)境如噪音強度、粉塵濃度、昆蟲密度、水中微量元素的含量等,在某一地域、某段時期內(nèi)亦在一定范圍內(nèi)波動;某病患者在病程的某段時期內(nèi),某種檢驗結(jié)果亦常在一定范圍內(nèi)波動。雖然這些范圍不一定是正常的,有的超過了衛(wèi)生標(biāo)準(zhǔn)或正常值,但若從樣本數(shù)據(jù)估計總體中變量值的范圍來說,那么也可以用本章的估計方法,得出的波動范圍可稱為個體值范圍。
二、確定正常值范圍的一般原則和步驟
1.確定研究總體。即對研究總體的同質(zhì)性基礎(chǔ)作出規(guī)定。以“正常人”為例,所謂正常人不是指任何組織與器官的形態(tài)及機能都無異常的人,而是指排除了影響被研究指標(biāo)的疾病和有關(guān)因素的人。例如某單位研究血清谷一丙轉(zhuǎn)氨酶活性的正常值,選取“正常人”的條件為無肝、腎、心、腦、肌肉等器質(zhì)性疾患,近期無特殊用藥史(如氯丙嗪、異煙肼等),測定前未作劇烈運動等。上述條件就是保證研究對象的同質(zhì)性作出的規(guī)定。但不允許以所研究指標(biāo)值的大小來劃分是否“正常人”。對研究總體,如“正常人”的規(guī)定要根據(jù)研究目的、技術(shù)力量與水平以及人力物力等條件來考慮,往往牽涉到多方面的專業(yè)知識。但一般可從地區(qū)、民族、性別、年齡、勞動條件(如是否與有害物質(zhì)接觸)、時間(季節(jié)與晝夜)、月經(jīng)、妊娠、飲食、藥物、生活習(xí)慣等來考慮。例如紅細胞數(shù)及血紅蛋白量,高原居民與平原不同,男子各異;人體血清膽固醇含量隨年齡的增長而增加,妊娠期高于非妊娠期,冬季高于夏季,且受飲食影響;服用某些藥物可直接增加檢測的有關(guān)成分或干擾檢測結(jié)果的準(zhǔn)確性。
各種影響因素,有些可通過詢問與體檢嚴(yán)格控制,如排除那些與被研究指標(biāo)有關(guān)的各病患者,或處于妊娠、經(jīng)期的婦女,近期內(nèi)服用某種藥物者等;有些可用對調(diào)查資料分組統(tǒng)計的辦法加以控制或研究。如先按男、女分別統(tǒng)計,然后檢驗兩組數(shù)據(jù)的分布、均數(shù)與標(biāo)準(zhǔn)差等,有無差別,若有差別則分別求正常值,否則可合并求通用的正常值。
2.確定觀察例數(shù)。正常值范圍的影響因素復(fù)雜,要使樣本分布能正確估計總體分布,例數(shù)不能太少,一般認(rèn)為應(yīng)在200例左右。數(shù)據(jù)變異不大,觀測比較精確的,例數(shù)可相應(yīng)少些;影響因素復(fù)雜、數(shù)據(jù)變異大,觀測方法不夠穩(wěn)定的,例數(shù)相應(yīng)要多一些。但要防止片面追求數(shù)量,而抽選樣本不按規(guī)定,觀測方法不統(tǒng)一,粗率馬虎,以致影響原始數(shù)據(jù)的可靠性。
3.統(tǒng)一測定方法,控制實驗誤差,保證數(shù)據(jù)的可靠性。為達到上述要求應(yīng)注意對檢測人員(醫(yī)生、檢驗人員等)的培訓(xùn),以統(tǒng)一認(rèn)識、統(tǒng)一方法和操作,標(biāo)準(zhǔn)化儀器和試劑,建立質(zhì)量控制防止記錄差錯等。但也要盡量與應(yīng)用正常值范圍時的實際情況相一致,例如臨床檢驗每一個標(biāo)本只作一次,那么為確定正常值的檢驗每個標(biāo)本亦只作一次,不能作兩個平行樣本求平均數(shù)后再估計正常值。否則可能定出的正常值范圍較窄。
4.確定取單側(cè)還是雙側(cè)界值。某些指標(biāo)如白細胞總數(shù),無論過低或過高都不正常,因此需要確定下限和上限兩個界值,稱雙側(cè)界值。有的指標(biāo)如肺活量一般只認(rèn)為過低是不正常,所以只需定下測界值,即下限;但血鉛只是過高不正常,只需定上限。只需定下限或上限的,稱單側(cè)界值。確定取單側(cè)還是雙側(cè)界值,應(yīng)根據(jù)業(yè)務(wù)知識與指標(biāo)用途。
5.確定適當(dāng)?shù)陌俜址秶。調(diào)查一定數(shù)量的正常人若以某指標(biāo)的最小、最大值作為正常值范圍,常因調(diào)查例數(shù)的增加等遇到少數(shù)極端值,使正常值范圍不穩(wěn)定。因此統(tǒng)計上常采用一些方法,刪去一定比例的極端值,使得出的正常值能較穩(wěn)定地反映絕大多數(shù)正常人該指標(biāo)的數(shù)值。那么絕大多數(shù)是指正常人的百分之多少呢?一般包括正常人的80%、90%、95%或99%等。這樣,若按單側(cè)計算,相應(yīng)地將有20%、10%、5%或1%的正常人該指標(biāo)值在正常值范圍以外;若按雙側(cè)計算,相應(yīng)地,過高、過低者各有10%、5%、2.5%或0.5%。這些指標(biāo)值在正常值范圍以外的正常人,將被錯判為不正常。將正常錯判為不正常,稱為I型錯誤,或假陽性,其假陽性率或誤診率用α表示。但亦有些病人的指標(biāo)值,可能落在正常值范圍以內(nèi),這時就會將病人錯判為正常人,這種錯判Ⅱ型錯誤,或假陰性,假陰性率即漏診率用β表示。確定合適的百分范圍應(yīng)根據(jù)研究目的,結(jié)合正常人和病人的數(shù)值分布,同時考慮α及β,一般有下列兩種情況:
。1)正常人和病人的數(shù)據(jù)分布無重疊(見圖5.4a)。這時只考慮減少α;
。2)正常人和病人的數(shù)據(jù)分布有重疊(見圖5.4b)。這時兩分布重疊部分內(nèi)既有病人亦有正常人,若欲減少α,界值向右移,那么β將加大;若欲減少β,界值向左移,那么α將加大。通常兼顧α及β,取兩曲線交點的橫座標(biāo)為界值,這時α與β之和為最小。但實用時還要考慮該正常值范圍的主要用途,若用以普查初篩病人,則要減少假陰性,取80%或90%正常值范圍;若用以確診病人,則要避免假陽性,以取95%或99%正常值范圍為宜。
圖 5.4 正常人和病人數(shù)據(jù)分布示意圖
6.確定估計方法進行估計。估計正常值范圍的方法較多,主要根據(jù)頻數(shù)的分布類型和樣本含量選用。常用的有百分位數(shù)法和正態(tài)分布法。運用百分位數(shù)法的條件是樣本含量大,適用正態(tài)分布法的條件是資料服從正態(tài)分布或經(jīng)過轉(zhuǎn)換后服從正態(tài)分布。此外尚有曲線擬合法等。
三、確定正常值范圍的方法
1.百分位數(shù)法。本法根據(jù)正常人樣本數(shù)據(jù),按照選定的百分范圍計算相應(yīng)的百分位數(shù)作為正常值范圍的界值?筛鶕(jù)原始數(shù)據(jù)直接計算,亦可根據(jù)頻數(shù)表進行計算。計算步驟為:
。1)按已確定的百分范圍從表5.1查得應(yīng)計算的百分位數(shù);
。2)計算出各百分位數(shù)的所在位置;
。3)代入公式計算界限Px
表5.1 估計正常值范圍的計算項目
百分范圍(%) |
百分位數(shù)法 |
正態(tài)分布法 | ||
雙側(cè) | 單側(cè)下(或上)限 | 雙側(cè) | 單側(cè)下(或上)限 | |
80 | P10及P90 | P20(或P80) | X±1.282S | X-(或+)0.842S |
90 | P5及P95 | P10(或P90) | X±1.645S | X-(或+)1.282S |
95 | P 2.5及P97.5 | P5(或P95) | X±1.960S | X-(或+)1.645S |
98 | P1及P99 | P2(或P98) | X±2.326S | X-(或+)2.054S |
99 | P0.5及P99.5 | P1(或P99) | X±2.576S | X-(或+)2.326S |
例5.2 某地測得200例健康成人的血鉛值(微克/100克)得頻數(shù)分布如下,試估計單側(cè)95%上限。
(1)查表5.1,百分范圍95,百分位數(shù)法,單側(cè)上限應(yīng)求P95。
。2)求P95的位置200×0.95=190即為第190個數(shù)據(jù)處,因此知A=188,Lx=35,fx=4,ix=5。
代入公式(4.5)
表5.2 百分位數(shù)法計算單側(cè)上限(200例健康成人的血鉛值)
血鉛值(微克/100克) | 頻數(shù) | 累計頻數(shù) |
0- | 6 | 6 |
5- | 48 | 54 |
10- | 43 | 97 |
15- | 36 | 133 |
20- | 28 | 161 |
25- | 13 | 174 |
30- | 14 | 188 |
35- | 4 | 192 |
40- | 4 | 196 |
45- | 1 | 197 |
50- | 2 | 199 |
55- | 0 | 199 |
60- | 1 | 200 |
合計 | 200 | - |
健康成人血鉛值的95%正常值上限為37.5微克/100克。
若根據(jù)原始資料計算,已算得Px的位置為第190個數(shù)據(jù)后,將原始數(shù)據(jù)從大至小排,第10個數(shù)據(jù)的值即為Px。
此法的優(yōu)點是不拘資料的分布類型,計算簡便,樣本含量較大,分布較穩(wěn)定時結(jié)果穩(wěn)定。但估計結(jié)果受樣本極差的限制,受兩側(cè)尾部數(shù)據(jù)的影響較大,尤其是百分范圍較大(如大于95%)。樣本含量不夠在時,結(jié)果不夠穩(wěn)定。
2.正態(tài)分布法。正態(tài)分布法運用正態(tài)曲線下面積與μ±μασ的關(guān)系來估計數(shù)值范圍的。在圖5.2中曾提到μ±1.96σ的范圍內(nèi)包含了曲線下總面積的95%,亦就是總例數(shù)的95%。在此范圍外則有2.5%的例數(shù)其數(shù)據(jù)值大于μ±1.96σ,另2.5%小于μ-1.96σ。因此,就可用μ±1.96σ來估計雙側(cè)95%的正常值范圍。同理可用μ與相應(yīng)的μασ 估計所需百分范圍,μ可從附表2查得。但在實際中μ與σ常常是不知道的,只能用它們的估計值X與S
來代替。估計正常值范圍時常用的百分范圍與相應(yīng)的X±us見表5.1。用正態(tài)分布法估
計正常值范圍的公式為
X±uαs 。5.4)
例5.3 測得西安市7歲男童102人坐高,X=66.72,S=2.08,試用正態(tài)分布法估計
雙側(cè)95%正常值范圍。
查表5.1,百分范圍95,正態(tài)分布法雙側(cè),應(yīng)求X±1.96S。
代入公式(5.4)
66.72±1.96×2.08=(62.6432,70.7968)
西安市7歲男童坐高的95%正常值范圍為62.6~70.08公分。
此法適用于正態(tài)分布資料,樣本均數(shù)和標(biāo)準(zhǔn)差比較穩(wěn)定者,其優(yōu)點是結(jié)果穩(wěn)定,受兩端尾部數(shù)據(jù)影響較小,也不受樣本數(shù)據(jù)極差的限制,缺點是只適用于正態(tài)分布資料。醫(yī)學(xué)上不少資料呈偏態(tài)分布,但計算較繁。