最初の分析:尺度水準、代表値、ばらつき、図の読み方

「平均や標準偏差を出す前に何を見るか」を整理し、次の本格分析へつなげます。

このページのゴールは、変数の種類に応じて最初に見るべき数値や図を選び、短い気づきを言葉にできるようになることです。

···

尺度水準をざっくり押さえる

名義尺度

例:性別、学科、血液型。まずは table() や棒グラフから始めます。

順序尺度

例:満足度1〜5。度数分布や棒グラフで並びを確認します。

間隔尺度

例:気温、テスト得点。平均、中央値、標準偏差、ヒストグラムが有効です。

比率尺度

例:身長、体重、時間。平均・SD・箱ひげ図・散布図につなげやすいです。

···

まず出してみる数値

  • 代表値:平均、中央値
  • ばらつき:標準偏差、IQR、範囲
  • カテゴリ:度数表
Categorical summarytable
table(df$group)
barplot(table(df$group))
Numeric summarystats
mean(df$score)
median(df$score)
sd(df$score)
IQR(df$score)
range(df$score)

図は何を見るために使うか

  • ヒストグラム:分布の形
  • 箱ひげ図:中央値、外れ値、ばらつき
  • 散布図:2変数の関係
  • 棒グラフ:カテゴリの比較
···

図の読み方の最初の型

1. 可視化する

まずはヒストグラム、箱ひげ図、散布図のどれかを置きます。

2. 代表値とばらつきを見る

平均・中央値・SD・IQR を見て、図と数値を往復します。

3. 気づきを文章にする

「A群の方が高そう」「分布が右に裾を引いている」など短文で書きます。

···

3文で書くミニレポート

最初は長文でなくて大丈夫です。次の型で十分です。

Writing templatemini report
1. score の平均は XX 点で、中央値は YY 点だった。
2. ヒストグラムを見ると、分布はおおむね ______ に見えた。
3. group ごとの箱ひげ図では、A群/B群の ______ が目立った。

最後のミニ課題

  • 自分のデータで変数の尺度水準を3つ以上書く
  • 数値要約を1つ、グラフを2つ以上出す
  • 気づきを3文で書く
···