分散分析(ANOVA: Analysis of Variance)は、3 つ以上の群の平均を同時に比較する手法です。t 検定を繰り返し行うと多重比較の問題が生じるため、全体としての検定を一度に行う分散分析が用いられます。
一元配置分散分析
個の群があり、第 群には 個のデータ があるとします。モデルは
と表されます。 は全体平均、 は第 群の効果、 は誤差です。
帰無仮説は : (すべての群の平均が等しい)です。
平方和の分解
データの変動を群間変動と群内変動に分解します。
全平方和は
群間平方和は
群内平方和は
であり、 が成り立ちます。
F 検定
平均平方を 、 とします。ここで です。
検定統計量
は帰無仮説のもとで自由度 の F 分布に従います。 が大きいほど群間のばらつきが群内のばらつきに比べて大きく、群の平均に差があることを示唆します。
分散分析表
結果は分散分析表にまとめます。
仮定と多重比較
分散分析の仮定は、各群が正規分布に従うこと、分散が等しいこと(等分散性)、観測が独立であることです。
分散分析で帰無仮説が棄却された場合、どの群間に差があるかを調べるために多重比較を行います。テューキーの方法、ボンフェローニ補正、ダネットの方法などが用いられます。
二元配置以上
要因が二つ以上ある場合は二元配置分散分析を用います。主効果に加えて交互作用も検討でき、より複雑な実験計画に対応できます。