統計検定3級では、データの尺度から代表値・散らばり、相関・回帰、確率、統計的推測まで、覚えるべき用語と公式が数多く登場します。この記事では、頻出の統計用語と公式を分野ごとに一覧で整理しました。試験直前の総まとめや、問題演習で迷ったときの確認用チートシートとして活用してください。
データの尺度・種類
- 名義尺度:順序のないカテゴリ(血液型・性別)
- 順序尺度:順序はあるが間隔に意味がない(5段階評価)
- 間隔尺度:間隔に意味がある量的変数(摂氏温度・西暦)
- 比例尺度:原点があり比(何倍か)に意味がある(身長・体重)
- 離散変数:とびとびの値(人数・個数)/連続変数:連続的な実数値(身長・時間)
代表値(位置の尺度)
- 平均値:すべての値の合計÷個数。外れ値の影響を受けやすい
- 中央値:小さい順に並べた真ん中の値。外れ値に強い
- 最頻値:最も多く現れる値。分布の山の位置
- 右のすそが長い分布:最頻値<中央値<平均値の順になりやすい
散らばり(ばらつきの尺度)
- 範囲:最大値−最小値。外れ値に弱い
- 四分位範囲(IQR):Q3−Q1。外れ値に強い
- 分散:偏差(値−平均)の2乗の平均。偏差の合計は常に0
- 標準偏差:分散の正の平方根。元データと同じ単位
- 変動係数(CV):標準偏差÷平均値。単位のない比較指標(%表記が多い)
標準化・偏差値
- 標準化(zスコア):(値−平均)÷標準偏差。変換後は平均0・標準偏差1
- 偏差値:50+10×(値−平均)÷標準偏差。平均50・標準偏差10になる
- 定数倍 b 倍:平均は b 倍、標準偏差は |b| 倍
- 定数 a を加える:平均は +a、標準偏差は変化しない
四分位数・箱ひげ図
- 第2四分位数(Q2)=中央値
- 5数要約:最小値・Q1・中央値・Q3・最大値
- 箱ひげ図:箱の長さ=IQR、中の線=中央値
- 外れ値の目安:Q3+1.5×IQR より大きい、または Q1−1.5×IQR より小さい値
2変数データ・相関・回帰
- 相関係数 r:−1〜1の値。1に近いほど強い正の相関、−1に近いほど強い負の相関
- 回帰直線:y=a+bx。最小二乗法で残差平方和を最小にして推定
- 決定係数 R²:回帰の当てはまりのよさ(0〜1)。完全に当てはまると1
- 注意:相関があっても因果とは限らない(見かけの相関に注意)
確率・期待値
- 古典的確率:(該当する場合の数)÷(すべての場合の数)
- 余事象の確率:P(Aが起こらない)=1−P(A)
- 排反な事象:同時に起こらない事象(B∩C=空事象)
- 期待値 E(X):各値×その確率をすべて足し合わせた平均的な値
確率変数・確率分布
- 離散型:取り得る値の確率をすべて足すと1
- 分散 V(X):(X−平均)²の期待値。標準偏差はその平方根
- 正規分布:左右対称の釣鐘型。統計的推測の基礎になる分布
データ収集・統計的推測
- PPDACサイクル:Problem→Plan→Data→Analysis→Conclusion
- 実験研究と観察研究:介入を行うかどうかの違い
- 母集団と標本/母数と統計量:全体と一部、真の値と推定値
- 大数の法則:標本を大きくすると標本平均が母平均に近づく
- 中心極限定理:標本平均は近似的に正規分布に従う
早見表の使い方
この早見表は、統計検定3級の8分野の要点を凝縮したものです。まずは一通り目を通して知らない用語がないか確認し、あやふやな項目はテキストに戻って理解を深めましょう。試験直前には、この一覧を見て各項目を自分の言葉で説明できるかセルフチェックすると、弱点があぶり出せます。
ケンテイラボでは、統計検定3級対策問題を全294問・無料で公開しています。この早見表で用語と公式を確認したら、8分野の分野別演習で実際に問題を解き、知識を得点力に変えていきましょう。間違えた問題の復習やランダム出題も使えるので、直前期の総仕上げにも最適です。