カイ二乗分布は、正規分布に従う確率変数の二乗和として現れる分布です。統計的推測、特に分散の推定や適合度検定において中心的な役割を果たします。
カイ二乗分布の定義
が互いに独立に標準正規分布 に従うとき、その二乗和
は自由度 のカイ二乗分布に従います。これを と書きます。
確率密度関数は
で与えられます。これはガンマ分布 に他なりません。
自由度の意味
自由度 は、独立な標準正規変数の個数を表します。統計学では、データから推定したパラメータの数だけ自由度が減少するという形で現れます。
例えば、 個のデータ が に従うとき、標本分散
に対して は自由度 のカイ二乗分布に従います。平均 を推定に使ったことで自由度が 1 減っています。
期待値と分散
のとき
です。期待値が自由度に等しいことは、 であることと独立性から直ちに従います。
再生性
独立な と に対して
が成り立ちます。自由度は加法的です。
分布の形状
自由度が小さいとき分布は右に歪んでいますが、自由度が大きくなると中心極限定理により正規分布に近づきます。自由度 が大きいとき、 は近似的に に従います。