上述抽樣模擬試驗(yàn)表明,從同一總體中以固定n隨機(jī)抽樣,由于抽樣誤差的影響,樣本均數(shù)x與總體均數(shù)μ往往不相等,且兩個(gè)樣本均數(shù)x1和x2也往往不相等。因此在實(shí)際工作中遇到樣本均數(shù)與總體均數(shù)間或樣本均數(shù)與樣本均數(shù)間不相等時(shí),要考慮兩種可能:①由于抽樣誤差所致;②兩者來(lái)自不同總體。如何作出判斷?統(tǒng)計(jì)上是通過(guò)假設(shè)檢驗(yàn)(hypothesis testing),又稱顯著性檢驗(yàn)(significance test),來(lái)回答這個(gè)問(wèn)題。
下面以樣本均數(shù)x與總體均數(shù)μ比較的假設(shè)檢驗(yàn)為例,介紹假設(shè)檢驗(yàn)的基本步驟。
一、建立假設(shè)和確定檢驗(yàn)水準(zhǔn)
假設(shè)有二。一是無(wú)效假設(shè)(null hypothesis),符號(hào)為H0。假設(shè)兩總體均數(shù)相等(μ=μ0),即樣本均數(shù)x所代表的總體均數(shù)μ與假設(shè)和總體均數(shù)μ0相等。x和μ0差別僅僅由抽樣誤差所致;二是備擇假設(shè)(alternative hypothesis),符號(hào)為H1。二者都是根據(jù)推斷的目的提出的對(duì)總體特征的假設(shè)。這里還有雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)之分,需根據(jù)研究目的和專業(yè)知識(shí)而定:若目的是推斷兩總體是否不等(即是否μ≠μ0),并不關(guān)心μ>μ0還是μ<μ0,應(yīng)用雙側(cè)檢驗(yàn),H0:μ=μ0,H1:μ≠μ0;若從專業(yè)知識(shí)已知μ>μ0,不會(huì)μ<μ0(或已知μ<μ0不會(huì)μ>μ0),或目的是推斷是否μ>μ0(或μ<μ0),則用單側(cè)檢驗(yàn),H0:μ=μ0,H1:u>μ0(或μ<μ0)。一般認(rèn)為雙側(cè)檢驗(yàn)較為穩(wěn)妥,故較常用。
檢驗(yàn)水準(zhǔn)(size of a test)亦稱顯著性水準(zhǔn)(significance level),符號(hào)為α,是假設(shè)檢驗(yàn)時(shí)發(fā)生第一類錯(cuò)誤的概率。α常取0.05或0.01。
二、選定檢驗(yàn)方法和計(jì)算統(tǒng)計(jì)量
根據(jù)研究設(shè)計(jì)的類型、資料類型及分析目的選用適當(dāng)?shù)臋z驗(yàn)方法。如配對(duì)設(shè)計(jì)的兩樣本均數(shù)比較,選用配對(duì)t檢驗(yàn);完全隨機(jī)設(shè)計(jì)的兩樣本均數(shù)比較,選用u檢驗(yàn)(大樣本時(shí))或t檢驗(yàn)(小樣本時(shí))等。
不同的檢驗(yàn)方法有不同的檢驗(yàn)假設(shè)以及不同的公式。根據(jù)公式計(jì)算現(xiàn)有樣本統(tǒng)計(jì)量,如t值、u值等。
三、確定P值,作出推斷結(jié)論
用算得的統(tǒng)計(jì)量與相應(yīng)的界值作比較,確定P值。P值是指在由H0所規(guī)定的總體中隨機(jī)抽樣,獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計(jì)量的概率。根據(jù)P值大小作出拒絕或不拒絕H0的統(tǒng)計(jì)結(jié)論。