醫(yī)學(xué)論文撰寫中常見統(tǒng)計(jì)學(xué)問題及其處理
絕大多數(shù)的論文撰寫,均需通過一定數(shù)量臨床病例(或資料)的觀察,研究事物間的相互關(guān)系,以探討客觀存在的新規(guī)律。如確定新診斷、新治療等措施是否優(yōu)于原沿用的方法,就需進(jìn)行兩種方法比較,這就涉及統(tǒng)計(jì)處理;統(tǒng)計(jì)設(shè)計(jì)又是整個課題研究設(shè)計(jì)中一個重要的組成部分。顯然,經(jīng)正確統(tǒng)計(jì)處理的結(jié)果可信度高,論文的質(zhì)量也高。
據(jù)不完全統(tǒng)計(jì),在難以發(fā)表的、已凝聚著作者心血并花費(fèi)較長時間與較大財(cái)力撰寫的研究論文中,約半數(shù)以上是由于統(tǒng)計(jì)錯誤致其結(jié)果與原文主要結(jié)論相違背。如一文采用某新藥引產(chǎn)論文QQ81995535,96例足月孕婦的產(chǎn)后出血與新生兒低Apgar評分率均為2.1%(各2例),明顯低于應(yīng)用原藥引產(chǎn)的19例,其產(chǎn)后出血與新生兒低Apgar評分發(fā)生率均為15.8%(各3例,χ2=7.164,P<0.001)。故認(rèn)為采用新藥引產(chǎn)是一更安全的措施。原藥引產(chǎn)組例數(shù)偏少暫且不談,該資料比較應(yīng)采用精確法分析,結(jié)果是與原結(jié)果恰恰相反(P>0.05),這樣上述的主要結(jié)論就欠可靠而難以發(fā)表,否則論文可起誤導(dǎo)作用。類似問題文稿中還常有出現(xiàn)。現(xiàn)就文稿中常見的統(tǒng)計(jì)問題及其相應(yīng)的處理方法簡述如下。
一、 常用的統(tǒng)計(jì)術(shù)語統(tǒng)計(jì)學(xué)中常用的概念有總體與樣本、隨機(jī)化與概率、計(jì)量與計(jì)數(shù)、等級資料及正態(tài)與偏態(tài)分布資料、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤等。如某研究采用經(jīng)會陰途徑測定宮頸長度,以探討不同宮頸長度與臨產(chǎn)時間的關(guān)系。結(jié)果顯示35例宮頸長度為25~34mm者與32例宮頸長為15~24mm者臨產(chǎn)時間的均值±標(biāo)準(zhǔn)差(x±s)各為57.6±58.1與47.3±49.1小時。該計(jì)量資料,經(jīng)t檢驗(yàn)顯示t=0.780,P>0.05,并未提示不同宮頸長度的臨產(chǎn)時間差異有顯著意義;從標(biāo)準(zhǔn)差大于均值,顯示各變量值離散程度大,呈偏態(tài)分布,故不能采用x±s這一算術(shù)均數(shù)法計(jì)算均數(shù)。經(jīng)偏態(tài)轉(zhuǎn)換成近似正態(tài)分布資料后結(jié)果是:35例與32例的臨產(chǎn)時間各為34.5±4.1與26.7±4.1小時,(t=7.778,P<0.001),兩組差異有極顯著意義?烧J(rèn)為隨著宮頸長度的縮短、臨產(chǎn)時間也縮短。此外,當(dāng)兩組資料單位不同時,其S單位也不同;即使兩組單位相同的變量值,若其均數(shù)差異較大,也都應(yīng)以變異系數(shù)替代s來比較兩組值的離散度的大小。
二、 正常值范圍及異常閾值的確定如何選擇研究對象,至少需多少例,正確統(tǒng)計(jì)處理和參考一定數(shù)量的病例數(shù)據(jù),是確定正常值范圍及異常閾值的四個重要因素。
1.研究對象:應(yīng)為“完全健康者”,可包括患有不影響待測指標(biāo)疾病的患者。如“正常妊娠”的條件:孕前月經(jīng)周期規(guī)則、單胎、妊娠過程順利、無產(chǎn)科并發(fā)癥及其它有關(guān)合并癥,分娩孕周為37~41周+6,新生兒出生體重為2500~4000g和Apgar評分≥7分。
2.觀察數(shù)量:觀察數(shù)量應(yīng)盡可能多于100例;需分組者,各組人數(shù)也是如此(標(biāo)本來源困難時酌情減少)。有些指標(biāo)值如雌三醇(E3)、甲胎蛋白(AFP)、胎盤泌乳素(HPL)等隨孕周進(jìn)展而變化論文QQ81995535,應(yīng)按孕周分組;鄰近孕周均數(shù)相近者,可合并幾周計(jì)算。若為偏態(tài)分布,應(yīng)以百分位數(shù)計(jì)算,則例數(shù)應(yīng)≥120例。取各孕周對象時,應(yīng)考慮到所取各孕周中的例數(shù)分布大致均衡。顯然,文稿中往往以少量例數(shù)求得正常值是欠可靠的。
3.統(tǒng)計(jì)處理:應(yīng)根據(jù)所得數(shù)據(jù)分布特征采用不同的統(tǒng)計(jì)處理方法。屬正態(tài)或近似正態(tài)分布的數(shù)據(jù),可采用x±s法計(jì)算;這也適用于以一定方法能將非正態(tài)分布轉(zhuǎn)換成正態(tài)或近似正態(tài)分布的資料。對無法轉(zhuǎn)換的偏態(tài)資料,應(yīng)采用百分位數(shù)計(jì)算法。具體計(jì)算(包括上下限初步制定)見文獻(xiàn)。
4.對照數(shù)量:相應(yīng)觀察的病例數(shù)(包括分組)應(yīng)不少于30例,這對制定某指標(biāo)有臨床意義的異常閾值尤其重要,這一點(diǎn)往往易被忽視。如在參考較多病例數(shù)據(jù)后,唾液游離E3的下限異常閾值應(yīng)為第2.5百分位數(shù),而非通常采用的5百分位數(shù)。否則,將會導(dǎo)致該指標(biāo)產(chǎn)前監(jiān)護(hù)的假陽性率增加。
三、 t檢驗(yàn)與校正t檢驗(yàn)(t′檢驗(yàn))這是文稿中極易混淆的一類計(jì)量資料統(tǒng)計(jì)問題。
(一)檢驗(yàn)的注意事項(xiàng)
1.t檢驗(yàn)的意義:t檢驗(yàn)與所有統(tǒng)計(jì)分析相同,其結(jié)果提示現(xiàn)有差別不僅僅是抽樣誤差所致,且提示犯第一類錯誤的可能性大小,即t0.05與t0.01犯第一類錯誤的可能性各為5%與1%。
2.統(tǒng)計(jì)意義與臨床意義的關(guān)系:統(tǒng)計(jì)學(xué)有顯著意義,而在臨床上可能是無意義的,提示該研究應(yīng)繼續(xù)深入,以明確該差異是否真有顯著意義;相反,統(tǒng)計(jì)無顯著意義,而臨床上卻是有意義的,不能貿(mào)然輕易地下結(jié)論。應(yīng)復(fù)查實(shí)驗(yàn)設(shè)計(jì)、方法、試劑及儀器性能、質(zhì)控措施和實(shí)驗(yàn)數(shù)據(jù)等是否有問題,或尚需再進(jìn)一步增加樣本量進(jìn)行復(fù)測等。
3.t檢驗(yàn)適用范圍:t檢驗(yàn)僅適用于正態(tài)或近似正態(tài)分布(包括偏態(tài)轉(zhuǎn)換)和其方差是齊性資料的檢驗(yàn);t檢驗(yàn)適用于可比性資料,即除了欲比較的因素外,其它所有可影響的因素應(yīng)相似。
4.t檢驗(yàn)的結(jié)果判斷:判斷結(jié)果不應(yīng)絕對化,P<或>0.05,分別表示可拒絕或接受原定的假設(shè),但兩者都有5%的可能性犯第一類錯誤;而P值越小,只能是更有理由拒絕原定的假設(shè)。
5.單側(cè)與雙側(cè)檢驗(yàn):應(yīng)預(yù)先制定本研究的結(jié)果是需行雙側(cè)還是單側(cè)檢驗(yàn)。對有把握確知某治療措施或某指標(biāo)是不會劣于現(xiàn)有的,才作單側(cè)檢驗(yàn);若不知何者為優(yōu),應(yīng)行雙側(cè)檢驗(yàn)。因?yàn)樵谕籺值的界限上,單側(cè)檢驗(yàn)的概率(P)僅為后者的一半,也就是說單側(cè)檢驗(yàn)較雙側(cè)檢驗(yàn)更易得出差別有統(tǒng)計(jì)意義的結(jié)論,不可隨意制定。一般講,絕大多數(shù)研究以采用雙側(cè)檢驗(yàn)為妥。