Step 4
最初の分析:尺度水準、代表値、ばらつき、図の読み方
「平均や標準偏差を出す前に何を見るか」を整理し、次の本格分析へつなげます。
このページのゴールは、変数の種類に応じて最初に見るべき数値や図を選び、短い気づきを言葉にできるようになることです。
···
尺度水準をざっくり押さえる
名義尺度
例:性別、学科、血液型。まずは table() や棒グラフから始めます。
順序尺度
例:満足度1〜5。度数分布や棒グラフで並びを確認します。
間隔尺度
例:気温、テスト得点。平均、中央値、標準偏差、ヒストグラムが有効です。
比率尺度
例:身長、体重、時間。平均・SD・箱ひげ図・散布図につなげやすいです。
···
まず出してみる数値
- 代表値:平均、中央値
- ばらつき:標準偏差、IQR、範囲
- カテゴリ:度数表
Categorical summarytable
table(df$group)
barplot(table(df$group))
Numeric summarystats
mean(df$score)
median(df$score)
sd(df$score)
IQR(df$score)
range(df$score)
図は何を見るために使うか
- ヒストグラム:分布の形
- 箱ひげ図:中央値、外れ値、ばらつき
- 散布図:2変数の関係
- 棒グラフ:カテゴリの比較
···
図の読み方の最初の型
1. 可視化する
まずはヒストグラム、箱ひげ図、散布図のどれかを置きます。
2. 代表値とばらつきを見る
平均・中央値・SD・IQR を見て、図と数値を往復します。
3. 気づきを文章にする
「A群の方が高そう」「分布が右に裾を引いている」など短文で書きます。
···
3文で書くミニレポート
最初は長文でなくて大丈夫です。次の型で十分です。
Writing templatemini report
1. score の平均は XX 点で、中央値は YY 点だった。
2. ヒストグラムを見ると、分布はおおむね ______ に見えた。
3. group ごとの箱ひげ図では、A群/B群の ______ が目立った。
最後のミニ課題
- 自分のデータで変数の尺度水準を3つ以上書く
- 数値要約を1つ、グラフを2つ以上出す
- 気づきを3文で書く
···