目次
前置き
前回の文章では, 分散分析の等平均性の検定の検定統計量がF分布に従うことを示した.
そこでは検定統計量は最小二乗値を用いて表された. 今回の文章の目的は, 尤度比検定を出発点にして検定を構成しても, 同じ最小二乗値を用いた検定統計量が自然に現れることを示すことである.
なぜこのようなことを考えるのか, 目的を明確に述べるために, まず前回の導出の流れを振り返る:
- ガウス確率変数の二次形式はフィッシャー・コクランの定理から, 分布, 独立性が容易にわかる.
- ガウス・マルコフモデルにおける, 制約条件つきと条件なしの最小二乗値(とは, ガウス確率変数の二次形式で表せる.
- フィッシャー・コクランの定理から, とは独立な二次形式となり, 前者は非心カイ二乗分布, 後者はカイ二乗分布に従う.
- 制約条件が実際に成り立つとき, は非心度0のカイ二乗分布に従うので, 比をとることでF検定が導出できる.
- 分散分析モデルはガウス・マルコフモデルの特別な場合であるため, 以上の内容が適用できる.
- 等平均性の仮説は線形制約条件で表すことができ, その仮説に対し, とを具体的に計算すると, よく知られた平方和の式に行き着く.
- よって, 分散分析において用いられている検定量は等平均性の仮定の下ではF分布に従う.
この導出は線形代数やガウス確率変数に関する一般的で比較的単純な結果の応用として示すもので, 論理はクリアだが, 不満点もある. それは, 最小二乗値から構成した検定統計量を考える明確な動機づけに乏しく, やや天下り的なアプローチに見えるという点である.
そこでここでは, 尤度比検定を出発点として検定を構成しても, 前回考えた最小二乗値に関する検定統計量が現れることを示す. これにより, 最小二乗値による検定統計量を考えるに至る自然な道筋が存在することを示すのが, この文章の目的である.
ただし, 統計量が「自然に導かれる」ことは, それが良い統計量だということを必ずしも意味しないことを注意しておく. 統計量の良さは検出力や分散の小ささといった目的に沿った具体的な指標で評価されるべきだからだ.
ここからの内容のアウトラインを説明する. まず, 線形代数から, 射影と一般化逆行列に関する幾つかの命題を準備する. 次に, ガウス・マルコフモデルを説明する. ここは前回の引き写しである. そして, ガウス・マルコフモデルに対し, 線形制約条件を帰無仮説とした場合の尤度比検定を考えることで, 最小二乗値を用いた検定統計量を考えることに自然に導かれることを示す.
準備
以下では, 線形代数の標準的と思われる表記法は断りなく用いる. ベクトル空間は常に適切な次元のユークリッド空間とし, 内積は常に標準内積を考えるものとする. また, 行列とそれの定める線形変換を同一視する. つまり, 行列から定まる線形変換のことを線形変換と書いたり, その変換の像のことをと書いたりする. 行列の転置をとかく.
まず前回も用いた, 線形代数から2つの命題を思い出す.
命題 1 行列に対し, .
証明
ベクトルに対し, なら, . は任意に取れるので, . 逆に, なら, . は任意より, . つまり, . (証明終わり)
線形変換がを満たすとき, 射影という. さらに, を満たすとき, 直交射影という. 部分空間が射影の像であるとき, をへの射影という.
命題 2 を部分空間への直交射影とするとき, 任意のに対し,
証明
任意のに対し,
ここで, より, . よって, . (証明終わり)
次に一般化逆行列について基本的な命題をいくつか示す. 行列に対し, 行列がを満たすとき, はの一般化逆行列という.
注意: Wikipedia に一般化逆行列の記事はあるが, やや制限の強い定義を採用しているようである. 英語版では, ここと同じ定義で扱われている.
一般化行列は常に存在する.
命題 3
任意の行列に対し, その一般化逆行列は存在する.
証明
とすると, 適当な正則行列, によって,
とできる. ただし, はの単位行列で, それぞれのは適当なサイズの全ての成分がの行列である. と定めると,
よって, は一般化逆行列である. (証明終わり)
一般化逆行列は一意的とは限らない. 例えば,
とするとき, 任意の実数に対し,
は一般化逆行列である. ただし明らかなように, が正方行列で正則なときには, 通常の逆行列が唯一の一般化逆行列である.
以下では行列に対し, 一般化逆行列をどれでもいいので一つ固定し, と書く. 特別な一般化逆行列を取る必要があるときはその都度言及する.
命題 4 行列に対し, 以下が成立:
- .
- .
特に, .
証明
(1): よりわかる.
(2):
ベクトルに対し, なら, より, .
よって, なので,
よって, 証明できた.
(証明終わり)
一般化逆行列を使うと, 連立一次方程式の解をシンプルに表せる.
命題 5 を行列, とし, を仮定する. このとき, 連立一次方程式
の解の集合は
である.
証明
より, あるが存在し, . よって, 任意のに対し,
よって, はの解である. 特に, とすれば, は特殊解であるから, あとはがへの射影であることを示せばよい.
, は明らかである. よって, を示せば十分である. は射影なので, . よって, 命題4より,
よって, 証明できた. (証明終わり)
一般化逆行列は, 射影に関するシンプルな表示も与える.
命題 6 行列に対し, はへの射影. またが対称なら, は直交射影.
証明
とおく. このとき, より, 任意のに対し, あるが存在し, . これより, . よって, . 後半の主張は自明. (証明終わり)
ガウス・マルコフモデル
ガウス・マルコフモデルとは, 観測値がいくつかの説明変数の線型結合と誤差との和によって与えられるとするモデルである. より具体的には, 個の観測値が与えられたとき, それぞれの観測値は個の説明変数の線形関係によって生成されると考え, そして, 観測には誤差が伴うとしたものである. また, 誤差は独立同分布で分散の正規分布に従うとする. つまり, 以下の観測値ベクトルと計画行列は, あるパラメータベクトルと誤差ベクトルに対し, 以下のような関係を満たすとする:
ここで,
で, は独立同分布で平均, 分散の正規分布に従うとする. とは既知の値として扱い, パラメータと分散は未知の値である. を仮定する. これは全く制限的な仮定ではない. また, がフルランクであること, つまり, は仮定しない.
行列行列はかつを満たすとし, またとする. このとき, 以下の帰無仮説, 対立仮説の検定を考える:
尤度比検定とF検定の等価性
帰無仮説, 対立仮説の尤度比検定から検定量を導出することを考える. つまり, 以下の検定統計量を考える:
ここで, は尤度関数. つまり,
まず, 分母は制約条件の無い尤度の最大化であるから, 例えば, 偏微分して極値を求めることで容易に以下がわかる:
ここで, はの像への直交射影. 後の便宜のため, であることを注意しておく. なぜなら, だからである.
よって, あとは分子の値を具体的に求めれば, 尤度比が求まる. これは制約条件付きの最大化問題であるからラグランジュの未定乗数法ですぐにできそうである. しかし, ラグランジュ関数の停留点を求める方程式の解き方が分からなかった. そこで, ここではより素朴に, 制約条件を満たすの範囲を先に求め, その中で(制約のない)通常の最大化問題を考える. を満たすをつ固定し, とする.
定理 1 以下が成り立つ:
ただし, は直交射影で, 像は
また, が成り立つ.
証明
より, の基底をつ固定し, それらを並べた行列をとすると, 連立一次方程式の任意の解はと書ける. よって,
右辺は制約条件の無い関数の最大値である. 右辺のの中身の関数の対数をと書き, とすると,
命題4より, 右辺はに含まれるので, これを満たすは,
と書ける. ただし, はの一般化逆行列のつで対称なものとする. 対称なものが取れることは例えば, のスペクトル分解を は互いに直交する直交射影) とするとき, ととれることからわかる. と定めると, 命題6より, はへの直交射影であり, に依らず,
である.
次に, を解くと,
よって,
がわかった.
あとは, , を示せばよい. とはべき等であること, 及び, 命題4から,
の定義から明らかにであることから, がわかる. はの基底を並べた行列なので, で, であるから,
これより, であることが分かる. また, であるから, . (証明終わり)
以上の結果から,
がわかった. 両辺を乗し,
と定めると,
尤度比検定はが小さいときに帰無仮説を棄却する検定であり, これは(*)から, が大きいときに棄却する検定である. よって, この尤度比検定はによる検定と等価である.
この確率変数は前回, 制約条件つき最小二乗値を通じて導いた検定統計量と同じであり, 帰無仮説の下では自由度, の分布に従う. よって, 尤度比検定から出発して, 最小二乗値を用いて表される検定統計量が自然に導かれることが分かった.