データフレームの変数を抽出したり加工したりする方法を解説します。
データフレーム$列名が基本的な変数の取り出し方ですが、複数のデータを操作する場合は、列番号を指定する方が便利なことも多いです。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。

【R】Rのまとめ
経済統計の使い方では、統計データの入手法から分析法まで解説しています。
https://officekaisuiyoku.com...
変数の抽出
以下のデータフレームを作ります。データフレーム名はtestとします。
A | B | C | D | |
1 | 1 | 6 | 11 | 16 |
2 | 2 | 7 | 12 | 17 |
3 | 3 | 8 | 13 | 18 |
4 | 4 | 9 | 14 | 19 |
5 | 5 | 10 | 15 | 20 |
または、
抽出の方法は何通りかありますが、それぞれの変数を操作するにはデータフレーム$列名が最も使いやすいです。複数の変数を処理するには列番号が便利です。
- データフレーム$列名
- データフレーム[[列番号]] リスト形式で指定
- データフレーム[,列番号] 行列形式で指定
- データフレーム[列番号] リストとして取り出す
それぞれの結果は以下のようになります。
1列目から3列目までを取り出す場合は、行列形式かリストで取り出すことでできます。
変数の加工
変数の加工は$マークを使えば簡単にできます。平均をとるにはmean関数を使います。すべての期に平均のデータが入ります。
下の例は、Aについて平均をとり、同じデータフレームにaverageAとして追加する場合です。
データフレーム名を指定しないと、ベクトルとして保存されます。
よく使う関数としては以下のものがあります。
関数名 | 説明 |
abs | 絶対値 |
exp | 指数 |
sqrt | 平方根 |
log | 自然対数 |
log10 | 常用対数 |
diff | 要素間の差分 |
複数の変数に適用する統計量としては以下のものがあります。
関数名 | 説明 |
sum | 合計 |
mean | 平均 |
median | 中央値 |
var | 分散 |
sd | 標準偏差 |
変数を一括して変換する
データフレームの変数を一括して変換する方法として、apply関数があります。
2番目の引数には、行ごとに処理する場合は1,列ごとに処理する場合は2を入れます。変数を一括処理する場合は、2を選びます。
上記のtestデータについて、すべての変数を対数に変換するには、apply(test,2,log)で実行できます。
スポンサーリンク
スポンサーリンク