直方圖是以直方的面積表示數(shù)量的。直方頂端連成曲線后,整個(gè)曲線下面積就表示總頻數(shù),用1或100%表示。一定區(qū)間曲線下面積就是出現(xiàn)在此區(qū)間的頻數(shù)與總頻數(shù)之比,或出現(xiàn)在該區(qū)間的各個(gè)變量的概率之和。例如以7歲男童102人為100%,則若要知道坐高在66至68cm間的人數(shù)占總?cè)藬?shù)的百分比,只要知道曲線下橫坐標(biāo)為66至68cm區(qū)間內(nèi)的面積就可以了。因此求出曲線下面積有其實(shí)用意義。
曲線下某區(qū)間的面積,可根據(jù)曲線方程用積分求得,但若每次應(yīng)用時(shí)都要用積分計(jì)算,那是很麻煩的。前人已將標(biāo)準(zhǔn)正態(tài)曲線下0至各u值的面積計(jì)算出來的了。由于各書列的方式不完全相同,所以使用時(shí)要注意表上的圖示或說明,仍用7歲男童坐高資料為例說明正態(tài)曲線下面積表(附表2)的使用方法。該表左側(cè)及上端為u值,表中數(shù)字為橫軸自0至u曲線下的面積。
例5.1 根據(jù)表4.3的資料計(jì)算得坐高的X=66.72,S=2.08,試估計(jì)總體中坐高在
(1)66.72-68.80cm間。
(2)66~68cm間及(3)68~70cm間的人數(shù)各占總?cè)藬?shù)的百分比。
(1)求坐高在66.72~68.80cm 之間曲線下面積。
①求u(u=(X-μ)/σ,這里分別以X、S作為μ與σ的估計(jì)值)
(66.72-66.72)/2.08=0
(66.80-66.72)/2.80=1
標(biāo)準(zhǔn)正態(tài)曲線下面積見圖5.3(a)。
②查附表2,u自0至1的面積,即查u=1.00,得α/2=0.3413。坐高在此區(qū)間內(nèi)的人數(shù)占總?cè)藬?shù)的34.13%。
(2)求坐高在66~68cm之間曲線下面積。
①求u
(66-66.72)/2.08=-0.346
(68-66.72)/2.08=0.615
標(biāo)準(zhǔn)正態(tài)曲線下面積見圖5.3(b)
②查附表2 u=0.346,得α/2=0.1353(經(jīng)內(nèi)插法求得,下同)
u=0.615,得α/2=0.2308
0.1353+0.2308=0.3661
坐高在此區(qū)間內(nèi)的人數(shù)占總?cè)藬?shù)的36.61%,即102×0.3661=37.3人,與實(shí)際觀察所得38人相近。
圖5.3 正態(tài)曲線下面積之計(jì)算
(3)求坐高在68~70cm間的人數(shù)占總?cè)藬?shù)的百分比。
①求u
(68-66.72)/2.08=0.615
(70-66.72)/2.08=1.577
標(biāo)準(zhǔn)正態(tài)曲線下面積見圖5.3(c)
②查附表2, u=1.577,得α/2=0.4426
u=0.615,得α/2=0.2308
0.4426-0.2308=0.2118
坐高在此區(qū)間內(nèi)的人數(shù)點(diǎn)總?cè)藬?shù)的21.18%,即有102×0.2118=21.6人。與實(shí)際觀察所得20人相近。
從例5.1可見,因?yàn)檎龖B(tài)曲線對(duì)稱于原點(diǎn),所以不論u為正還是負(fù),絕對(duì)值相同時(shí),自0至u的面積相同。查附表2時(shí),若兩個(gè)u值中有一個(gè)是0,按另一u值查得α/2;若兩個(gè)u異號(hào),將查出的兩個(gè)α/2值相加;若兩個(gè)u同號(hào),則將大的α/2值減去小的即得。但不能將兩個(gè)u值相加(52667788.cn/shouyi/或減)后再查面積。
例5.1已求得u從0-1時(shí),α/2=0.3413,所以u(píng)從-1~1,曲線下面積為0.6827,說明有68.27%的變量值在μ±σ的范圍內(nèi)(見圖5.2)。查附表2,當(dāng)u=1.96時(shí),α/2=0.475,因此μ±1.96σ的范圍內(nèi)包含有95%的變量值,只有5%的變量值在此范圍外。由于曲線左右對(duì)稱,因此有2.5%的變量值等于或小于μ-1.96σ;2.52667788.cn/hushi/5%變量值等于或大于μ+1.96σ。同理,查附表2,u=2.58時(shí),α/2=0.495,因此μ±2.58σ范圍內(nèi)有99%的變量值,在此范圍外的僅占1%。u=1.96和u=2.58(準(zhǔn)確說是u=2.5758)是正態(tài)分布中兩個(gè)重要的界值,稱5%界和1%界,今后在正常值范圍估計(jì)、假設(shè)檢驗(yàn)等中常常要用到。
如果已知資料呈正態(tài)分布,那么理論上只要知道μ和σ就可根據(jù)曲線下面積表求出任兩值之間變量值的個(gè)數(shù),也就是說能算出變量值的頻數(shù)分配。但實(shí)際上μ和σ常常無法獲得,因此只能用X和S作為μ和σ的估計(jì)值,來估計(jì)總
體中變量值(個(gè)體值)的分布。