df = read.csv(...)
引数
header
:: Bool -- コラム名として使われるヘッダー行を持つかcomment
:: 文字列 -- コメント行の開始文字例
以下は1行目がコメント、2行目がCSV形式のヘッダー、3行目以降がCSV形式のデータになっている。
# sat-benchmark 0.8.17 on smithi @ 2016-12-15T20:17:17+09:00
solver, num, target, time
"mios-f69b8b8 0.4-2C2L@12-15", 1, "SR2015subset1/38bits_10.dimacs.cnf", 4.12
"mios-f69b8b8 0.4-2C2L@12-15", 2, "SR2015subset1/40bits_10.dimacs.cnf", 1256.82
...
このファイルの名前がresult.csvならば、以下によりデータをデータフレーム型変数dfに代入できる。
df = read.csv("result.csv", header=T, comment="#")
データフレームの一部を取り出すには、[, 列指定添字]、[行指定添字, ] を用いる。返ってくるものはスカラー値またはデータフレーム型になる。 添字はスカラー値でもよいし、ベクターでもよい。
例
df[, 1]
df[, 1:2]
df[2, ]
df[1:4, ]
ヘッダーを持つデータフレームの列は [列名] でindexingできます。列名は文字列型。従って文字列型の変数も使える。
df = ... # データフレーム変数
df["target"]
# または
c = "target"
df[c]
d1 = subset(df, p1==1)
多くの演算はスカラーだけでなくベクターを引数に取ることができるため、通常の計算式がそのまま使えることが多い。
例
df = ... # データフレーム型変数
df[1] + df[2] # 1行目と2行目の要素それぞれを加算