基本操作:演算、代入、ベクトル、データフレーム、関数

Rで「書く」「入れる」「まとめる」「調べる」の基本を固めます。

このページのゴールは、簡単なコードを自力で書き、オブジェクトに値を入れ、ベクトルとデータフレームを作り、関数を呼び出せるようになることです。

···

四則演算とコメント

Rは電卓のようにも使えます。# の後ろはコメントになり、実行されません。

Arithmeticbasic
# 足し算、引き算、掛け算、割り算
1 + 1
10 - 3
4 * 6
12 / 3
(2 * 4) / 3

代入:<- を使う

Rでは、値をオブジェクトに保存するときに <- を使うのが定番です。

Assignmentobject
x <- 20
y <- 15
z <- x + y
z
···

オブジェクト名は意味のある名前にする

分析が長くなるほど、xa では何が何だか分からなくなります。最初から「何が入っているか」が分かる名前にしておくと、後の自分が助かります。

  • 悪い例:a, tmp, test
  • 良い例:study_hours, mean_score, df_students
···

ベクトルを作る

同じ型の値をまとめたものがベクトルです。Rでは c() を使って複数の値を束ねます。

Vectorc()
kokugo <- c(70, 53, 64, 82, 48)
sugaku <- c(51, 49, 86, 88, 71)
heikin <- (kokugo + sugaku) / 2
heikin

データフレームを作る

複数のベクトルを表形式に束ねたものがデータフレームです。列ごとに変数、行ごとに観測が並びます。

data.frame()table
df_students <- data.frame(
  kokugo = kokugo,
  sugaku = sugaku,
  heikin = heikin
)
df_students
···

関数を使う

Rの便利さは関数にあります。関数名の後ろに () を付け、必要な値を中に渡して使います。

Functionsmean
mean(heikin)
median(heikin)
sd(heikin)

ヘルプを見る

引数が分からないときは、まずヘルプを見る習慣をつけると伸びやすいです。

Help?
?mean
help("sd")
···

列や要素にアクセスする

データフレームの列には $、位置指定には [] をよく使います。

$ で列を呼ぶ

Column$
df_students$kokugo

[] で位置を指定する

Index[]
df_students[1, 2]   # 1行2列
kokugo[3]          # 3番目の要素
···

データ型を意識する

数字、文字、TRUE/FALSE、factor など、Rでは型によって扱い方が変わります。エラー時はまず型を疑うと早いです。

Type checkstr
str(df_students)
class(kokugo)

パイプ演算子 |>

処理を上から下へ流す書き方です。最初は必須ではありませんが、読みやすいコードに育てやすいので早めに慣れておくと便利です。

Pipe|>
heikin |>
  mean()
···

よくあるエラー

  • 全角のカッコや引用符を混ぜてしまう
  • オブジェクト名のスペルが違う
  • 文字列なのに " " で囲っていない
  • 関数を使いたいのにパッケージを library() していない

ミニ課題

次のコードを自分で打って、mean(heikin) の結果が出るところまで進めてください。

Practicetask
kokugo <- c(70, 53, 64, 82, 48)
sugaku <- c(51, 49, 86, 88, 71)
heikin <- (kokugo + sugaku) / 2
mean(heikin)