為何要進行假設檢定#
分析師常面對各種互相競爭的市場觀點,可能來自個人研究、同事討論或學術文獻。我們需要一套方法,判斷某項陳述「大概為真」還是「大概為假」。
當一個想法能被簡化為對某數量(例如母體平均數)的明確陳述時,它就成為可統計檢定的假設(hypothesis)。典型問題包括:
- 此共同基金的母體平均報酬是否異於其基準指數?
- 某股票被納入指數後波動度是否改變?
- 證券的買賣價差是否與其造市商數量有關?
- 國家債券市場資料是否支持某利率期限結構理論?
**假設檢定(hypothesis testing)屬於統計推論(statistical inference)**的一支:以較小的群體(樣本)做出對較大群體(母體)的判斷。檢定結束後我們對假設真偽的機率會更清楚,但永遠停留在「機率」而非「確定」。
假設檢定的七個步驟#
- 陳述假設
- 辨認合適的檢定統計量及其機率分布
- 指定顯著水準
- 陳述決策規則
- 蒐集資料並計算檢定統計量
- 做出統計決策
- 做出經濟或投資決策
1. 陳述假設#
每次必有兩個假設:
- 虛無假設(null hypothesis, $H_0$):欲檢定的假設,在樣本未提供令人信服的反證之前視為真
- 對立假設(alternative hypothesis, $H_a$):當 $H_0$ 被拒絕時所接受的假設
對母體參數 $\theta$ 與假設值 $\theta_0$,可有三種表述:
| 形式 | $H_0$ | $H_a$ | 類型 |
|---|---|---|---|
| 1 | $\theta = \theta_0$ | $\theta \neq \theta_0$ | 雙尾檢定 |
| 2 | $\theta \leq \theta_0$ | $\theta > \theta_0$ | 單尾檢定 |
| 3 | $\theta \geq \theta_0$ | $\theta < \theta_0$ | 單尾檢定 |
三種形式皆在「等號點」 $\theta = \theta_0$ 進行計算。常見做法:將「希望成立」的條件設為 $H_a$,由樣本提供證據以拒絕 $H_0$。
2. 辨認檢定統計量與分布#
**檢定統計量(test statistic)**的常見形式:
$$ \text{Test statistic} = \frac{\text{樣本統計量} - \text{假設值}}{\text{樣本統計量的標準誤}} $$
本章涉及的四種分布:
- t 分布(t-test)
- 標準常態 z 分布(z-test)
- 卡方分布 $\chi^2$(chi-square test)
- F 分布(F-test)
3. 指定顯著水準#
檢定結束時可能犯兩類錯誤:
| 真實狀況 | 不拒絕 $H_0$ | 拒絕 $H_0$ |
|---|---|---|
| $H_0$ 為真 | 正確 | 第一型錯誤(Type I error) |
| $H_0$ 為偽 | 第二型錯誤(Type II error) | 正確 |
- 顯著水準 $\alpha$:犯第一型錯誤的機率(拒絕真實的 $H_0$)
- $\beta$:犯第二型錯誤的機率(未拒絕假的 $H_0$)
- 檢定力(power of a test):$1 - \beta$,正確拒絕假 $H_0$ 的機率
兩類錯誤之間存在權衡:降低 $\alpha$(如從 0.05 降至 0.01)會提高 $\beta$。唯一同時降低兩者機率的方法是增加樣本大小。
應在計算檢定統計量之前設定 $\alpha$,以避免結果影響判斷。
4–7. 決策規則與後續#
- 決策規則:以**拒絕點(critical value)**比較檢定統計量;若統計量落入拒絕域,則拒絕 $H_0$
- 統計上顯著:拒絕 $H_0$ 時的結果稱為「統計上顯著」
- 統計決策 vs 經濟決策:統計上顯著的差異不一定具有實際投資意義;經濟決策還需考量交易成本、風險偏好等因素
p 值方法#
p 值(p-value):能拒絕 $H_0$ 的最小顯著水準。
- p 值越小 → 對 $H_0$ 的反證越強
- 不需預設 $\alpha$,由讀者自行解讀其顯著性
關於母體平均數的檢定#
單一母體平均數#
| 情境 | 檢定統計量 | 自由度 |
|---|---|---|
| 母體常態、變異數 $\sigma^2$ 已知 | $z = \dfrac{\bar{X} - \mu_0}{\sigma/\sqrt{n}}$ | — |
| 母體常態、變異數 $\sigma^2$ 未知 | $t = \dfrac{\bar{X} - \mu_0}{s/\sqrt{n}}$ | $n - 1$ |
| 大樣本($n \geq 30$)、變異數未知 | 可使用 z 或 t 統計量(CLT) | — |
兩個母體平均數差異#
判斷樣本是否獨立:
- 獨立樣本,變異數相等:以兩樣本變異數的**併合估計量(pooled estimator)**進行 t 檢定
- 獨立樣本,變異數不等:使用近似 t 檢定,自由度由公式調整
- 相依樣本(配對觀察):以**配對比較檢定(paired comparisons test)**處理;t 統計量的分母(差值平均的標準誤)已納入樣本間的相關性
關於變異數的檢定#
單一母體變異數:卡方檢定#
來自常態母體的樣本,檢定統計量:
$$ \chi^2 = \frac{(n - 1) s^2}{\sigma_0^2}, \quad df = n - 1 $$
兩母體變異數差異:F 檢定#
針對兩個獨立常態母體:
$$ F = \frac{s_1^2}{s_2^2} $$
依慣例以較大者為分子,使 $F \geq 1$。F 統計量由分子與分母的自由度(各為 $n_i - 1$)共同決定。
關於相關係數的檢定#
檢定母體相關係數 $\rho$ 是否顯著異於 0:
$$ t = \frac{r \sqrt{n - 2}}{\sqrt{1 - r^2}}, \quad df = n - 2 $$
其中 $r$ 為樣本相關係數,$n$ 為配對觀察數。
母數檢定與非母數檢定#
- 母數檢定(parametric test):對母體分布有特定假設(如常態),或檢定的是分布的參數
- 非母數檢定(nonparametric test):對母體分布做最少假設,或檢定的不是參數
非母數檢定主要用於三種情境:
- 資料不滿足分布假設
- 資料以排名(rank)給出
- 所檢定的假設與參數無關
例如**斯皮爾曼等級相關係數(Spearman rank correlation)**即以兩變數的排名計算,可在非常態資料上檢測單調關聯。
本章重點回顧#
- 假設檢定遵循七步驟,從陳述 $H_0$/$H_a$ 到做出統計與經濟決策
- $H_0$ 為待檢定假設,$H_a$ 為其補集;可為雙尾或單尾
- 第一型錯誤 $\alpha$ 與第二型錯誤 $\beta$ 存在權衡;檢定力 $= 1 - \beta$
- p 值方法以「能拒絕 $H_0$ 的最小顯著水準」呈現證據強度,由讀者解讀
- 平均數檢定:已知變異數用 z;未知變異數用 t;大樣本可由 CLT 通用
- 兩平均數差異需先判斷獨立與相依,獨立樣本下還需依變異數是否相等選擇程序
- 變異數檢定使用 $\chi^2$(單一)與 F(兩個);相關係數檢定使用 t 統計量,自由度 $n-2$
- 非母數檢定適用於資料不滿足分布假設、排名資料或非參數假設的情況