Hypothesis Testing • 量化投資分析（CFA Institute）

為何要進行假設檢定#

分析師常面對各種互相競爭的市場觀點，可能來自個人研究、同事討論或學術文獻。我們需要一套方法，判斷某項陳述「大概為真」還是「大概為假」。

當一個想法能被簡化為對某數量（例如母體平均數）的明確陳述時，它就成為可統計檢定的假設（hypothesis）。典型問題包括：

此共同基金的母體平均報酬是否異於其基準指數？
某股票被納入指數後波動度是否改變？
證券的買賣價差是否與其造市商數量有關？
國家債券市場資料是否支持某利率期限結構理論？

**假設檢定（hypothesis testing）屬於統計推論（statistical inference）**的一支：以較小的群體（樣本）做出對較大群體（母體）的判斷。檢定結束後我們對假設真偽的機率會更清楚，但永遠停留在「機率」而非「確定」。

假設檢定的七個步驟#

陳述假設
辨認合適的檢定統計量及其機率分布
指定顯著水準
陳述決策規則
蒐集資料並計算檢定統計量
做出統計決策
做出經濟或投資決策

1. 陳述假設#

每次必有兩個假設：

虛無假設（null hypothesis, $H_0$）：欲檢定的假設，在樣本未提供令人信服的反證之前視為真
對立假設（alternative hypothesis, $H_a$）：當 $H_0$ 被拒絕時所接受的假設

對母體參數 $\theta$ 與假設值 $\theta_0$，可有三種表述：

形式	$H_0$	$H_a$	類型
1	$\theta = \theta_0$	$\theta \neq \theta_0$	雙尾檢定
2	$\theta \leq \theta_0$	$\theta > \theta_0$	單尾檢定
3	$\theta \geq \theta_0$	$\theta < \theta_0$	單尾檢定

三種形式皆在「等號點」 $\theta = \theta_0$ 進行計算。常見做法：將「希望成立」的條件設為 $H_a$，由樣本提供證據以拒絕 $H_0$。

2. 辨認檢定統計量與分布#

**檢定統計量（test statistic）**的常見形式：

$$ \text{Test statistic} = \frac{\text{樣本統計量} - \text{假設值}}{\text{樣本統計量的標準誤}} $$

本章涉及的四種分布：

t 分布（t-test）
標準常態 z 分布（z-test）
卡方分布 $\chi^2$（chi-square test）
F 分布（F-test）

3. 指定顯著水準#

檢定結束時可能犯兩類錯誤：

真實狀況	不拒絕 $H_0$	拒絕 $H_0$
$H_0$ 為真	正確	第一型錯誤（Type I error）
$H_0$ 為偽	第二型錯誤（Type II error）	正確

顯著水準 $\alpha$：犯第一型錯誤的機率（拒絕真實的 $H_0$）
$\beta$：犯第二型錯誤的機率（未拒絕假的 $H_0$）
檢定力（power of a test）：$1 - \beta$，正確拒絕假 $H_0$ 的機率

兩類錯誤之間存在權衡：降低 $\alpha$（如從 0.05 降至 0.01）會提高 $\beta$。唯一同時降低兩者機率的方法是增加樣本大小。
應在計算檢定統計量之前設定 $\alpha$，以避免結果影響判斷。

4–7. 決策規則與後續#

決策規則：以**拒絕點（critical value）**比較檢定統計量；若統計量落入拒絕域，則拒絕 $H_0$
統計上顯著：拒絕 $H_0$ 時的結果稱為「統計上顯著」
統計決策 vs 經濟決策：統計上顯著的差異不一定具有實際投資意義；經濟決策還需考量交易成本、風險偏好等因素

p 值方法#

p 值（p-value）：能拒絕 $H_0$ 的最小顯著水準。

p 值越小 → 對 $H_0$ 的反證越強
不需預設 $\alpha$，由讀者自行解讀其顯著性

關於母體平均數的檢定#

單一母體平均數#

情境	檢定統計量	自由度
母體常態、變異數 $\sigma^2$ 已知	$z = \dfrac{\bar{X} - \mu_0}{\sigma/\sqrt{n}}$	—
母體常態、變異數 $\sigma^2$ 未知	$t = \dfrac{\bar{X} - \mu_0}{s/\sqrt{n}}$	$n - 1$
大樣本（$n \geq 30$）、變異數未知	可使用 z 或 t 統計量（CLT）	—

兩個母體平均數差異#

判斷樣本是否獨立：

獨立樣本，變異數相等：以兩樣本變異數的**併合估計量（pooled estimator）**進行 t 檢定
獨立樣本，變異數不等：使用近似 t 檢定，自由度由公式調整
相依樣本（配對觀察）：以**配對比較檢定（paired comparisons test）**處理；t 統計量的分母（差值平均的標準誤）已納入樣本間的相關性

關於變異數的檢定#

單一母體變異數：卡方檢定#

來自常態母體的樣本，檢定統計量：

$$ \chi^2 = \frac{(n - 1) s^2}{\sigma_0^2}, \quad df = n - 1 $$

兩母體變異數差異：F 檢定#

針對兩個獨立常態母體：

$$ F = \frac{s_1^2}{s_2^2} $$

依慣例以較大者為分子，使 $F \geq 1$。F 統計量由分子與分母的自由度（各為 $n_i - 1$）共同決定。

關於相關係數的檢定#

檢定母體相關係數 $\rho$ 是否顯著異於 0：

$$ t = \frac{r \sqrt{n - 2}}{\sqrt{1 - r^2}}, \quad df = n - 2 $$

其中 $r$ 為樣本相關係數，$n$ 為配對觀察數。

母數檢定與非母數檢定#

母數檢定（parametric test）：對母體分布有特定假設（如常態），或檢定的是分布的參數
非母數檢定（nonparametric test）：對母體分布做最少假設，或檢定的不是參數

非母數檢定主要用於三種情境：

資料不滿足分布假設
資料以排名（rank）給出
所檢定的假設與參數無關

例如**斯皮爾曼等級相關係數（Spearman rank correlation）**即以兩變數的排名計算，可在非常態資料上檢測單調關聯。

本章重點回顧#

假設檢定遵循七步驟，從陳述 $H_0$/$H_a$ 到做出統計與經濟決策
$H_0$ 為待檢定假設，$H_a$ 為其補集；可為雙尾或單尾
第一型錯誤 $\alpha$ 與第二型錯誤 $\beta$ 存在權衡；檢定力 $= 1 - \beta$
p 值方法以「能拒絕 $H_0$ 的最小顯著水準」呈現證據強度，由讀者解讀
平均數檢定：已知變異數用 z；未知變異數用 t；大樣本可由 CLT 通用
兩平均數差異需先判斷獨立與相依，獨立樣本下還需依變異數是否相等選擇程序
變異數檢定使用 $\chi^2$（單一）與 F（兩個）；相關係數檢定使用 t 統計量，自由度 $n-2$
非母數檢定適用於資料不滿足分布假設、排名資料或非參數假設的情況