醫(yī)學(xué)統(tǒng)計學(xué):第二節(jié)　醫(yī)學(xué)統(tǒng)計學(xué)常用的名詞概念

<<醫(yī)學(xué)統(tǒng)計學(xué)>>目錄

一、樣本與總體前面已提及，醫(yī)學(xué)研究中實際觀測或調(diào)查的一部分個體稱為樣本，研究對象的全部稱為總體。如作水質(zhì)檢驗時從井水或河水中采的水樣，臨床化驗中從病人身上采的血液或其它活體組織標(biāo)本，是樣本；而整個一口井或一條河的某一段所有的水，某病人全身所有的血液或…

一、樣本與總體

前面已提及，醫(yī)學(xué)研究中實際觀測或調(diào)查的一部分個體稱為樣本，研究對象的全部稱為總體。如作水質(zhì)檢驗時從井水或河水中采的水樣，臨床化驗中從病人身上采的血液或其它活體組織標(biāo)本，是樣本；而整個一口井或一條河的某一段所有的水，某病人全身所有的血液或某個組織器官，則是總體。這類總體是具體存在的，但另有些總體卻是假想的，只是理論上存在的一個范圍。例如試驗?zāi)骋恢委熈鞲行滤幍寞熜�，最初接受治療的一批流感患者，不論�?shù)量多少，都只是一個樣本。若該藥療效得到肯定，從而加以推廣，那么此后凡在相同條件下接受該藥治療的所有流感患者，都屬于這個總體�？墒钱�(dāng)初試用時，這個總體還并不存在，是假想的。

總體包含的觀察單位通常是大量的甚至是無限的，在實際工作中，一般不可能或不必要對每個觀察單位逐一進(jìn)行研究。我們只能從中抽取一部分觀察單位加以實際觀察或調(diào)查研究，根據(jù)對這一部分觀察單位的觀察研究結(jié)果，再去推論和估計總體情況。如上述某新藥治療流感例子，試驗治療的只是少數(shù)有限的病人，而結(jié)論卻要推廣到全體，得出一個該藥對所有流感患者之療效的規(guī)律性的認(rèn)識。所以說，觀察樣本的目的在于推論總體，這就是樣本與總體的辯證關(guān)系。

為了使樣本能夠正確反映總體情況，對總體要有明確的規(guī)定；總體內(nèi)所有觀察單位必須是同質(zhì)的；在抽取樣本的過程中，必須遵守隨機(jī)化原則；樣本的觀察單位還要有足夠的數(shù)量。

二、概率

又稱機(jī)率，是用以描述某事件發(fā)生的可能性大小的一個數(shù)值。

在自然界和人類社會中，存在著兩類不同的現(xiàn)象：①在一定條件下，肯定發(fā)生的事件叫做必然事件，肯定不發(fā)生的事件叫做不可能事件。如在適當(dāng)溫度濕度下經(jīng)一定時間孵化，正常受精雞蛋必然會孵出小雞來，而石頭是不可能孵出小雞來的。必然事件與不可能事件雖然形式相反，但兩者在發(fā)生某種結(jié)果與否都是確定的，故統(tǒng)稱確定性現(xiàn)象。②在基本條件不變的情況下，可能發(fā)生的結(jié)果有多種，究竟發(fā)生哪種結(jié)果，事先不能肯定，這類現(xiàn)象叫做隨機(jī)現(xiàn)象。隨機(jī)現(xiàn)象的表現(xiàn)結(jié)果稱為隨機(jī)事件。如任意拋擲一枚硬幣，可能徽花向上也可能幣值向上，拋擲前不能肯定，這是一個隨機(jī)現(xiàn)象，而結(jié)果出現(xiàn)“徵花向上”則是一個隨機(jī)事件。

（一)古典概率　是52667788.cn/shiti/最簡單的隨機(jī)現(xiàn)象的概率計算。這類隨機(jī)現(xiàn)象具有兩個特征：①在觀察或試驗中它的全部可能結(jié)果只有有限個，譬如為n個，記為E₁，E₂，…，E_n，而且這些事件是兩兩互不相容的，即任何兩個事件不能同時發(fā)生；②事件E₁，E₂，…，E_n的發(fā)生或出現(xiàn)是等可能的，即它們發(fā)生的概率都一樣。古典概率的大部分問題都能形象地用摸球模型來描述。有利于直觀地理解概率論的許多基本概念；而且它有著多方面的重要應(yīng)用，例如工業(yè)產(chǎn)品的抽樣檢查等。

（二)統(tǒng)計概率　上述“事件”是指不能再進(jìn)行分解或不能由其它事件構(gòu)成的基本事件。在實際工作中，基本事件的發(fā)生并不總是等可能的，而且有時為無窮多個。這樣就有必要把古典概率的定義加以推廣，從事后經(jīng)驗的角度來理解概率的意義。實踐證明，雖然個別隨機(jī)事件在某次試驗或觀察中可以出現(xiàn)也可以不出現(xiàn)，但在大量重復(fù)試驗中它卻呈現(xiàn)出明顯的規(guī)律性。假設(shè)在相同條件下，獨(dú)立地重復(fù)做n次試驗，某隨機(jī)事件A在n次試驗中出現(xiàn)了m次，則比值m/n稱為隨機(jī)事件A在n次試驗中出現(xiàn)的頻率。當(dāng)試驗重復(fù)很多次時，隨機(jī)事件A的頻率m/n就會在某個固定的常數(shù)P附近擺動，而且n愈大擺動的幅度愈小。這種規(guī)律性稱之為統(tǒng)計規(guī)律性。頻率的穩(wěn)定性說明隨機(jī)事件發(fā)生的可能性大小是隨機(jī)事件本身固有的、不隨人們意志為轉(zhuǎn)移的客觀屬性，所以在醫(yī)學(xué)科研中，當(dāng)n充分大時，就以頻率作為概率的近似值，記住P(A)即

由此可見，頻率是就樣本而言的，而概率總是從總體的意義上說的。這樣，概率就為預(yù)計某一事件發(fā)生的可能性大小，提供了衡量的尺度。

例如：某病患者40名，用某療法治療后，其中35人痊愈，治愈者占治療人數(shù)的35/40，這是頻率。因為數(shù)量少，這個頻率可能波動較大。假如經(jīng)過長期的大量觀察，比如數(shù)百、數(shù)千例，得到治愈率為70％，我們就可以說，該療法治愈某病的概率近似值為70％。

又如：某院婦產(chǎn)科在一個月內(nèi)出生嬰兒30名，其中男嬰18名，占新生兒數(shù)的18/30，這叫頻率。大量統(tǒng)計表明，人口中男女的比例基本上是1:1。這是個較穩(wěn)定的常數(shù)，即概率的近似值。于是，在嬰兒分娩前，我們就可用它作為尺度，預(yù)計是男的概率為1/2(0.5或50％)，是女的概率也為1/2(0.5或50％)。

通過以上討論，可以知道：如果某事件是必然事件，則有m=n，所以必然事件的概率等于1；如果某事件是不可能事件，則有m=0，所以不可能事件的概率等于0；如果某事件是隨機(jī)事件，則有0<M<N，所以隨機(jī)事件的概率是介于0與1之間的一個數(shù)。某事件的概率愈接近0，表示發(fā)生的可能性愈�。挥邮�1，表示發(fā)生的可能性愈大。

三、隨機(jī)變量

簡單地說，是指隨機(jī)事件的數(shù)量表現(xiàn)。例如一批注入某種毒物的動物，在一定時間內(nèi)死亡的只數(shù)；某地若干名男性健康成人中，每人血紅蛋白量的測定值；等等。另有一些現(xiàn)象并不直接表現(xiàn)為數(shù)量，例如人口的男女性別、試驗結(jié)果的陽性或陰性等，但我們可以規(guī)定男性為1，女性為0，則非數(shù)量標(biāo)志也可以用數(shù)量來表示。這些例子中所提到的量，盡管它們的具體內(nèi)容是各式各樣的，但從數(shù)學(xué)觀點(diǎn)來看，它們表現(xiàn)了同一種情況，這就是每個變量都可以隨機(jī)地取得不同的數(shù)值，而在進(jìn)行試驗或測量之前，我們要預(yù)言這個變量將取得某個確定的數(shù)值是不可能的。

按照隨機(jī)變量可能取得的值，可以把它們分為兩種基本類型：①離散型隨機(jī)變量，即在一定區(qū)間內(nèi)變量取值為有限個，或數(shù)值可以一一列舉出來。例如某地區(qū)某年人口的出生數(shù)、死亡數(shù)，某藥治療某病病人的有效數(shù)、無效數(shù)等。②連續(xù)型隨機(jī)變量，即在一定區(qū)間內(nèi)變量取值有無限人,或數(shù)值無法一一列舉出來。例如某地區(qū)男性健康成人的身長值、體重值，一批傳染性肝炎患者的血清轉(zhuǎn)氨酶測定值等。

四、誤差

誤差是指實際觀察值與客觀真值之差、樣本指標(biāo)與總體指標(biāo)之差。誤差可分為系統(tǒng)誤差和隨機(jī)誤差。

（一)系統(tǒng)誤差　在實際觀測過程中，由于儀器未校正、測量者感官的某種障礙、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因，使觀察值不是分散在真值兩側(cè)，而是有方向性、系統(tǒng)性或周期性地偏離真值。這類誤差可以通過實驗設(shè)計和技術(shù)措施來消除或使之減弱，但不能靠概率統(tǒng)計辦法來消除或減弱。

（二)隨機(jī)誤差　或稱偶然誤差，是指排除了系統(tǒng)誤差后尚存的誤差。它受多種因素的影響，使觀察值不按方向性和系統(tǒng)性而隨機(jī)地變化。隨機(jī)誤差服從正態(tài)分布，可以用概率統(tǒng)計方法處理。

在隨機(jī)誤差中，最重要的是抽樣誤差。我們從同一總體中隨機(jī)抽取若干個大小相同的樣本，各樣本平均數(shù)（或率)之間會有所不同。這些樣本間的差異，同時反映了樣本與總體間的差異。它是由于從總體中抽取樣本才出現(xiàn)的誤差，統(tǒng)計上稱為抽樣誤差（或抽樣波動)。抽樣誤差在醫(yī)學(xué)生物實驗中最主要的來源是個體的變異。所以這是一種難以控制的、不可避免的誤差。但抽樣誤差是有一定規(guī)律的。研究和運(yùn)用抽樣誤差的規(guī)律,是根據(jù)樣本估計總體時所必須領(lǐng)會的基本概念之一，也是醫(yī)學(xué)統(tǒng)計學(xué)的重要內(nèi)容之一。

隨機(jī)誤差中還包括重復(fù)誤差。它是由于對同一受試對象或檢樣采用同一方法重復(fù)測定時所出現(xiàn)的誤差。如用天平稱同一個燒杯的重量，重復(fù)測定多次，其結(jié)果會有某些波動�？刂浦貜�(fù)誤差的手段主要是改進(jìn)測定方法，提高操作者的熟練程度。重復(fù)是摸清實驗誤差大小的手段，以便分析和減少實驗誤差。

五、假設(shè)檢驗

亦稱顯著性檢驗，其基本原理是先對總體的特征作出某種假設(shè)，然后通過抽樣研究的統(tǒng)計推理，對此假設(shè)應(yīng)該被拒絕還是接受作出推斷。

生物現(xiàn)象的個體差異是客觀存在，以致抽樣誤差不可避免，所以我們不能僅憑個別樣本的值來下結(jié)論。當(dāng)遇到兩個或幾個樣本均數(shù)（或率)、樣本均數(shù)（率)與已知總體均數(shù)（率)有大有小時，應(yīng)當(dāng)考慮到造成這種差別的原因有兩種可能：一是這兩個或幾個樣本均數(shù)（或率)來自同一總體，其差別僅僅由于抽樣誤差即偶然性所造成；二是這兩個或幾個樣本均數(shù)（或率)來自不同的總體，即其差別不僅由抽樣誤差造成，而主要是由實驗因素不同所引起的。假設(shè)檢驗的目的就在于排除抽樣誤差的影響，區(qū)分差別在統(tǒng)計上52667788.cn/wsj/是否成立，并了解事件發(fā)生的概率。

進(jìn)行假設(shè)檢驗時，要先建立檢驗假設(shè)（即上述第一種可能，符號是H₀)與備擇假設(shè)（即上述第二種可能，符號是H₁)，確立檢驗水準(zhǔn)（當(dāng)檢驗假設(shè)為真，但被錯誤地拒絕的概率，記作α)，通常取α=0.05或α=0.01；然后由樣本觀察值按相應(yīng)的公式計算統(tǒng)計量，如X²值、t值等；最后查有關(guān)的統(tǒng)計用表確定P值范圍（有時也可直接計算P值)作出結(jié)論。若P>α，結(jié)論為按α所取水準(zhǔn)不顯著，不拒絕H₀，即認(rèn)為差別很可能是由于抽樣誤差造成的，在統(tǒng)計上不成立；如果P≤α,結(jié)論為按所取α水準(zhǔn)顯著，拒絕H₀，接受H₁，則認(rèn)為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的，故在統(tǒng)計上成立。

...

上一篇文章：第三節(jié)　計數(shù)資料與計量資料

下一篇文章：第一節(jié)　醫(yī)學(xué)統(tǒng)計學(xué)及其主要內(nèi)容

諸葛臥龍丹(《經(jīng)驗秘方類鈔》卷上。)

醫(yī)管家多功能辨證儀

中醫(yī)文化傳承要破除兩個“迷信”

素問識 9 六節(jié)臟象論上課筆記

柏葉膏(《圣濟(jì)總錄》(人衛(wèi)本)卷一三四。)