統計学
35464
views
確率変数の期待値と分散と標準偏差の公式と意味
確率変数と確率分布の簡単な例(さいころ)...「さいころの目」が確率変数Xとなり、1~6が確率変数Xのとりうる値になる。さいころ...
東大出版会の「統計学入門 (基礎統計学)」は統計学で最も有名な専門書の一つ。数学の理論と数学を超えた実用性をうまく取り入れた良書...
「統計学キャンパスゼミ」はマセマという出版社から出ている数学の参考書です。キャンパスゼミシリーズは主に大学生を対象にしていますが...
二項分布B(n,p)とは、確率変数Xについて、X=rにおける確率P(X=r)がnCr p^r (1-p)^{n-r}で表されるよ...
確率変数の変換と期待値、分散、標準偏差の変換公式
正規分布(ガウス分布)は統計学において最も重要な連続確率分布です。自然界や社会現象における多くのデータが正規分布に従うことが知ら...
標準正規分布は正規分布の中でも特に重要な分布で、平均 0、分散 1 の正規分布を指します。任意の正規分布は標準化という操作によっ...
指数分布は「次のイベントが起こるまでの待ち時間」をモデル化する連続確率分布です。ポアソン過程と密接に関連しており、ランダムに発生...
ガンマ分布とベータ分布は、統計学において広く用いられる連続確率分布です。ガンマ分布は指数分布の一般化であり、ベータ分布は区間 $...
カイ二乗分布は、正規分布に従う確率変数の二乗和として現れる分布です。統計的推測、特に分散の推定や適合度検定において中心的な役割を...
t 分布(スチューデントの t 分布)は、母分散が未知の場合に母平均を推定する際に現れる分布です。正規分布に似た釣鐘型ですが、裾...
F 分布は、二つの分散の比を検定する際に現れる分布です。分散分析や回帰分析において重要な役割を果たします。 F 分布の定義 $U...
大数の法則は、標本平均が標本数を増やすにつれて母平均に近づくことを保証する定理です。確率論の基礎をなす最も重要な結果の一つであり...
中心極限定理は、多数の独立な確率変数の和が正規分布に近づくことを述べる定理です。正規分布がなぜこれほど普遍的に現れるのかを説明す...
チェビシェフの不等式は、確率変数が期待値から大きく逸脱する確率の上界を与える不等式です。分布の具体的な形状を仮定せずに成り立つた...
仮説検定は、データに基づいて仮説の妥当性を判断する統計的手法です。「偶然では説明しにくい結果が得られたかどうか」を確率的に評価す...
仮説検定では、判断を誤る可能性が常に存在します。誤りには二つの種類があり、それぞれ第一種の過誤と第二種の過誤と呼ばれます。この二...
検出力は、対立仮説が正しいときに帰無仮説を正しく棄却できる確率です。検定の「効果を見つける能力」を表す指標であり、研究計画におい...
尤度比検定は、二つの仮説のもとでの尤度の比に基づいて検定を行う方法です。最尤推定と密接に関連しており、多くの古典的な検定が尤度比...
母平均の検定は、母集団の平均が特定の値であるかどうかを判断する手法です。母分散が既知の場合は z 検定、未知の場合は t 検定を...
母分散の検定は、母集団の分散が特定の値であるかどうか、または二つの母集団の分散が等しいかどうかを判断する手法です。正規母集団を仮...
単回帰分析は、一つの説明変数から目的変数を予測する統計手法です。二つの変数の間の線形関係をモデル化し、その関係の強さや予測精度を...
重回帰分析は、複数の説明変数から目的変数を予測する統計手法です。単回帰の自然な拡張であり、現実のデータ分析で広く用いられています...
分散分析(ANOVA: Analysis of Variance)は、3 つ以上の群の平均を同時に比較する手法です。t 検定を繰...
統計学の基礎となる平均、分散、標準偏差の計算方法を、具体的なデータを使って練習します。公式を覚えるだけでなく、実際に手を動かして...
共分散と相関係数は、2 つの変数の関係の強さと方向を表す指標です。実際のデータを使って計算手順を確認しましょう。 例題 1:共分...
確率変数を定数倍したり定数を加えたりしたとき、期待値や分散がどう変化するかを計算で確認します。変換の公式を正しく使えるようになる...
正規分布の確率計算は、標準化して標準正規分布表を使うのが基本です。具体的な例題で計算の流れを確認しましょう。 例題 1:基本的な...
二項分布は「成功か失敗か」の試行を繰り返したときの成功回数の分布です。確率の計算方法と、正規近似の使い方を例題で確認します。 例...
ポアソン分布は、単位時間や単位面積あたりに発生するイベント数をモデル化する分布です。平均発生率 $\lambda$ を使った確率...
区間推定は、母数が含まれる範囲を確率的に示す方法です。母平均の区間推定について、母分散が既知の場合と未知の場合の両方を計算で確認...
t 検定は母分散が未知のときに母平均を検定する方法です。一標本と二標本の両方について、計算手順を例題で確認します。 例題 1:一...
カイ二乗検定は、分散の検定や適合度検定、独立性の検定など幅広い場面で使われます。代表的な応用について計算手順を確認します。 例題...
研究や調査を計画する際、必要な標本サイズを事前に決定することが重要です。目標とする精度や検出力から逆算して標本サイズを求める方法...
NumPy を使うと、配列データの平均・分散・標準偏差を簡単に計算できます。手計算と比較しながら、基本的な使い方を確認しましょう...
pandas はデータ分析に特化したライブラリで、データフレーム形式のデータに対して要約統計量を簡単に計算できます。実際のデータ...
2 つの変数の関係を調べるとき、相関係数の計算と散布図の作成は基本的な分析手法です。Python では NumPy、pandas...
SciPy の stats モジュールを使うと、正規分布の確率密度関数、累積分布関数、パーセント点などを簡単に計算できます。グラ...
SciPy と NumPy を使って、二項分布とポアソン分布の確率計算とシミュレーションを行います。理論値と乱数生成による実験結...
中心極限定理は、元の分布によらず標本平均が正規分布に近づくことを述べる定理です。Python でシミュレーションを行い、この重要...