今天的阿宅專題是線性模型的一些數學玩意。

我們(修數理統計的)都知道,
\[ \boldsymbol y = \mathbf X\boldsymbol\beta + \boldsymbol\epsilon, \boldsymbol\epsilon\sim\mathscr N(\boldsymbol 0, \sigma^2\mathbf I) \]
是一切麻煩的源頭,我們就靠這些東西來端飯碗。
首先,我們有興趣的是:$H_0 : \mathbf C’\boldsymbol\beta = \boldsymbol d$是否成立,成立的話,
在$\mathbf C$是colmun-full rank且等於$rank(\mathbf C’) = s$的條件下,我們會得到:
\[ \mathbf C’\hat{\boldsymbol\beta}\sim\mathscr N(\boldsymbol d, \sigma^2\mathbf{C’GC})\]
其中$\hat{\boldsymbol\beta} = \mathbf G\mathbf X’\boldsymbol y$, $\mathbf G = (\mathbf X’\mathbf X)^-$
剩下的就跟單變量的ANOVA沒什麼分別了:
\[ F(H_0) = \frac{\frac{Q}{s}}{\frac{\boldsymbol y'(\mathbf I – \mathbf
P_{\mathbf X})\boldsymbol y}{N-r}}\sim\mathscr F(s, N-r)\]
其中$Q=(\mathbf C’\hat{\boldsymbol\beta} – \boldsymbol d)'(\mathbf C’\mathbf G\mathbf C)^{-1}(\mathbf C’\hat{\boldsymbol\beta} – \boldsymbol d)$
當然,接下來我們要作的事就是計算power了:
\[\mathscr P(F(H_0) > \mathcal F_{s, N- r}(\alpha)|!H_0) \]
真正的麻煩則是現在才開始。
我們知道,如果$H_0$不成立的話(但仍使用常態假設),$Q$會服從一個non-central $\chi_s^2$分佈,而且它的non-central參數$\lambda$是
\[\lambda = \frac{(\mathbf C’\boldsymbol\beta – \boldsymbol d)'(\mathbf C’\mathbf G\mathbf C)^{-1}(\mathbf C’\boldsymbol\beta – \boldsymbol d)}{2\sigma^2}\]
那麼,在常態假設下,我們知道$\nu = F(H_0)$會服從一個non-central $F_{s, N-r,\lambda}$。我們甚至連它的PDF都知道:
\[\sum_{j=0}^\infty\frac{e^{-\lambda}\lambda^j}{j!}\frac{s}{N-r}\frac{\Gamma\left(\frac{N+s-r}{2}\right)}{\Gamma\left(\frac{r}{2}\right)\Gamma\left(\frac{N-r}{2}\right)}\frac{\nu^{\frac{s+2j}{2}-1}(N-r)^{\frac{N-r}{2}}}{(N-r + s\nu)^{\frac{N+s-r}{2}}}\]
問題是什麼呢?
問題是我們根本不知道$\boldsymbol\beta$是什麼啊!那樣怎麼計算$\lambda$呢?

(待續)