Step 2
基本操作:演算、代入、ベクトル、データフレーム、関数
Rで「書く」「入れる」「まとめる」「調べる」の基本を固めます。
このページのゴールは、簡単なコードを自力で書き、オブジェクトに値を入れ、ベクトルとデータフレームを作り、関数を呼び出せるようになることです。
···
四則演算とコメント
Rは電卓のようにも使えます。# の後ろはコメントになり、実行されません。
Arithmeticbasic
# 足し算、引き算、掛け算、割り算
1 + 1
10 - 3
4 * 6
12 / 3
(2 * 4) / 3
代入:<- を使う
Rでは、値をオブジェクトに保存するときに <- を使うのが定番です。
Assignmentobject
x <- 20
y <- 15
z <- x + y
z
···
オブジェクト名は意味のある名前にする
分析が長くなるほど、x や a では何が何だか分からなくなります。最初から「何が入っているか」が分かる名前にしておくと、後の自分が助かります。
- 悪い例:a, tmp, test
- 良い例:study_hours, mean_score, df_students
···
ベクトルを作る
同じ型の値をまとめたものがベクトルです。Rでは c() を使って複数の値を束ねます。
Vectorc()
kokugo <- c(70, 53, 64, 82, 48)
sugaku <- c(51, 49, 86, 88, 71)
heikin <- (kokugo + sugaku) / 2
heikin
データフレームを作る
複数のベクトルを表形式に束ねたものがデータフレームです。列ごとに変数、行ごとに観測が並びます。
data.frame()table
df_students <- data.frame(
kokugo = kokugo,
sugaku = sugaku,
heikin = heikin
)
df_students
···
関数を使う
Rの便利さは関数にあります。関数名の後ろに () を付け、必要な値を中に渡して使います。
Functionsmean
mean(heikin)
median(heikin)
sd(heikin)
ヘルプを見る
引数が分からないときは、まずヘルプを見る習慣をつけると伸びやすいです。
Help?
?mean
help("sd")
···
列や要素にアクセスする
データフレームの列には $、位置指定には [] をよく使います。
$ で列を呼ぶ
Column$
df_students$kokugo
[] で位置を指定する
Index[]
df_students[1, 2] # 1行2列
kokugo[3] # 3番目の要素
···
データ型を意識する
数字、文字、TRUE/FALSE、factor など、Rでは型によって扱い方が変わります。エラー時はまず型を疑うと早いです。
Type checkstr
str(df_students)
class(kokugo)
パイプ演算子 |>
処理を上から下へ流す書き方です。最初は必須ではありませんが、読みやすいコードに育てやすいので早めに慣れておくと便利です。
Pipe|>
heikin |>
mean()
···
よくあるエラー
- 全角のカッコや引用符を混ぜてしまう
- オブジェクト名のスペルが違う
- 文字列なのに " " で囲っていない
- 関数を使いたいのにパッケージを library() していない
ミニ課題
次のコードを自分で打って、mean(heikin) の結果が出るところまで進めてください。
Practicetask
kokugo <- c(70, 53, 64, 82, 48)
sugaku <- c(51, 49, 86, 88, 71)
heikin <- (kokugo + sugaku) / 2
mean(heikin)