為何要進行假設檢定#

分析師常面對各種互相競爭的市場觀點,可能來自個人研究、同事討論或學術文獻。我們需要一套方法,判斷某項陳述「大概為真」還是「大概為假」。

當一個想法能被簡化為對某數量(例如母體平均數)的明確陳述時,它就成為可統計檢定的假設(hypothesis)。典型問題包括:

  • 此共同基金的母體平均報酬是否異於其基準指數?
  • 某股票被納入指數後波動度是否改變?
  • 證券的買賣價差是否與其造市商數量有關?
  • 國家債券市場資料是否支持某利率期限結構理論?

**假設檢定(hypothesis testing)屬於統計推論(statistical inference)**的一支:以較小的群體(樣本)做出對較大群體(母體)的判斷。檢定結束後我們對假設真偽的機率會更清楚,但永遠停留在「機率」而非「確定」。

假設檢定的七個步驟#

  1. 陳述假設
  2. 辨認合適的檢定統計量及其機率分布
  3. 指定顯著水準
  4. 陳述決策規則
  5. 蒐集資料並計算檢定統計量
  6. 做出統計決策
  7. 做出經濟或投資決策

1. 陳述假設#

每次必有兩個假設:

  • 虛無假設(null hypothesis, $H_0$):欲檢定的假設,在樣本未提供令人信服的反證之前視為真
  • 對立假設(alternative hypothesis, $H_a$):當 $H_0$ 被拒絕時所接受的假設

對母體參數 $\theta$ 與假設值 $\theta_0$,可有三種表述:

形式$H_0$$H_a$類型
1$\theta = \theta_0$$\theta \neq \theta_0$雙尾檢定
2$\theta \leq \theta_0$$\theta > \theta_0$單尾檢定
3$\theta \geq \theta_0$$\theta < \theta_0$單尾檢定

三種形式皆在「等號點」 $\theta = \theta_0$ 進行計算。常見做法:將「希望成立」的條件設為 $H_a$,由樣本提供證據以拒絕 $H_0$。

2. 辨認檢定統計量與分布#

**檢定統計量(test statistic)**的常見形式:

$$ \text{Test statistic} = \frac{\text{樣本統計量} - \text{假設值}}{\text{樣本統計量的標準誤}} $$

本章涉及的四種分布:

  • t 分布(t-test)
  • 標準常態 z 分布(z-test)
  • 卡方分布 $\chi^2$(chi-square test)
  • F 分布(F-test)

3. 指定顯著水準#

檢定結束時可能犯兩類錯誤:

真實狀況不拒絕 $H_0$拒絕 $H_0$
$H_0$ 為真正確第一型錯誤(Type I error)
$H_0$ 為偽第二型錯誤(Type II error)正確
  • 顯著水準 $\alpha$:犯第一型錯誤的機率(拒絕真實的 $H_0$)
  • $\beta$:犯第二型錯誤的機率(未拒絕假的 $H_0$)
  • 檢定力(power of a test):$1 - \beta$,正確拒絕假 $H_0$ 的機率

兩類錯誤之間存在權衡:降低 $\alpha$(如從 0.05 降至 0.01)會提高 $\beta$。唯一同時降低兩者機率的方法是增加樣本大小

應在計算檢定統計量之前設定 $\alpha$,以避免結果影響判斷。

4–7. 決策規則與後續#

  • 決策規則:以**拒絕點(critical value)**比較檢定統計量;若統計量落入拒絕域,則拒絕 $H_0$
  • 統計上顯著:拒絕 $H_0$ 時的結果稱為「統計上顯著」
  • 統計決策 vs 經濟決策:統計上顯著的差異不一定具有實際投資意義;經濟決策還需考量交易成本、風險偏好等因素

p 值方法#

p 值(p-value):能拒絕 $H_0$ 的最小顯著水準。

  • p 值越小 → 對 $H_0$ 的反證越強
  • 不需預設 $\alpha$,由讀者自行解讀其顯著性

關於母體平均數的檢定#

單一母體平均數#

情境檢定統計量自由度
母體常態、變異數 $\sigma^2$ 已知$z = \dfrac{\bar{X} - \mu_0}{\sigma/\sqrt{n}}$
母體常態、變異數 $\sigma^2$ 未知$t = \dfrac{\bar{X} - \mu_0}{s/\sqrt{n}}$$n - 1$
大樣本($n \geq 30$)、變異數未知可使用 z 或 t 統計量(CLT)

兩個母體平均數差異#

判斷樣本是否獨立

  • 獨立樣本,變異數相等:以兩樣本變異數的**併合估計量(pooled estimator)**進行 t 檢定
  • 獨立樣本,變異數不等:使用近似 t 檢定,自由度由公式調整
  • 相依樣本(配對觀察):以**配對比較檢定(paired comparisons test)**處理;t 統計量的分母(差值平均的標準誤)已納入樣本間的相關性

關於變異數的檢定#

單一母體變異數:卡方檢定#

來自常態母體的樣本,檢定統計量:

$$ \chi^2 = \frac{(n - 1) s^2}{\sigma_0^2}, \quad df = n - 1 $$

兩母體變異數差異:F 檢定#

針對兩個獨立常態母體:

$$ F = \frac{s_1^2}{s_2^2} $$

依慣例以較大者為分子,使 $F \geq 1$。F 統計量由分子與分母的自由度(各為 $n_i - 1$)共同決定。

關於相關係數的檢定#

檢定母體相關係數 $\rho$ 是否顯著異於 0:

$$ t = \frac{r \sqrt{n - 2}}{\sqrt{1 - r^2}}, \quad df = n - 2 $$

其中 $r$ 為樣本相關係數,$n$ 為配對觀察數。

母數檢定與非母數檢定#

  • 母數檢定(parametric test):對母體分布有特定假設(如常態),或檢定的是分布的參數
  • 非母數檢定(nonparametric test):對母體分布做最少假設,或檢定的不是參數

非母數檢定主要用於三種情境:

  • 資料不滿足分布假設
  • 資料以排名(rank)給出
  • 所檢定的假設與參數無關

例如**斯皮爾曼等級相關係數(Spearman rank correlation)**即以兩變數的排名計算,可在非常態資料上檢測單調關聯。

本章重點回顧#

  • 假設檢定遵循七步驟,從陳述 $H_0$/$H_a$ 到做出統計與經濟決策
  • $H_0$ 為待檢定假設,$H_a$ 為其補集;可為雙尾或單尾
  • 第一型錯誤 $\alpha$ 與第二型錯誤 $\beta$ 存在權衡;檢定力 $= 1 - \beta$
  • p 值方法以「能拒絕 $H_0$ 的最小顯著水準」呈現證據強度,由讀者解讀
  • 平均數檢定:已知變異數用 z;未知變異數用 t;大樣本可由 CLT 通用
  • 兩平均數差異需先判斷獨立與相依,獨立樣本下還需依變異數是否相等選擇程序
  • 變異數檢定使用 $\chi^2$(單一)與 F(兩個);相關係數檢定使用 t 統計量,自由度 $n-2$
  • 非母數檢定適用於資料不滿足分布假設、排名資料或非參數假設的情況