データフレームがちゃんとできたかどうかを確認したいことがあると思います。その際はまず、class(データフレーム名)でデータフレームになったかどうかを確認し、dim(データフレーム名)を使って変数の数や各変数のデータ数を調べればよいと思います。
データを直接見たいときはデータフレーム名を入力すればいいですが、大量のデータの場合はhead()が便利です。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。
データフレームの中身を見てみたい
データフレームの中身を簡単に調べたいことは多いと思います。いくつかの調べ方があるのでそれをまとめました。
- class そもそもデータフレームかどうかを確かめたい場合
- head データフレームの最初の方のデータ
- tail データフレームの終わりの方のデータ
- dim いくつの変数で何個あるか
- str dimよりも詳しい結果
簡単なデータフレームを作って、その中身を表示してみます。5変数で1変数当たり20個のデータを作っています。以下のプログラムを流すと、データフレームが作成され、それぞれの結果が示されます。
data1<-data.frame(matrix(seq(1,100),20,5))
class(data1)
head(data1)
tail(data1)
dim(data1)
str(data1)
class()
データフレームの中身を確かめることは多いと思います。まず、データフレームになっているかどうか確かめるには、class()を使います。
class(data1)で調べると、”data.frame”と返ってきます。
> class(data1)
[1] "data.frame"
classは、基本的にはデータの集まりに対して、どのようなタイプになっているのかを表していて、以下のクラスがあります。
- 行列 2次元のデータ構造
- 配列 2次元以上のデータ構造
- 因子 整数値のデータ
- データフレーム 2次元構造で、変数名付き
head()、tail()
次に、ざっと中身をみるには、head()を使います。最初の部分だけが表示されます。反対に最後の部分だけ表示する場合はtail()を使います。
head(data1)の場合は、データの前半が、tail(data1)の場合はデータの後半が示されます。
> head(data1)
X1 X2 X3 X4 X5
1 1 21 41 61 81
2 2 22 42 62 82
3 3 23 43 63 83
4 4 24 44 64 84
5 5 25 45 65 85
6 6 26 46 66 86
> tail(data1)
X1 X2 X3 X4 X5
15 15 35 55 75 95
16 16 36 56 76 96
17 17 37 57 77 97
18 18 38 58 78 98
19 19 39 59 79 99
20 20 40 60 80 100
dim()
データフレームがいくつの変数でできているのかを見るにはdim()を使います。dimension(寸法、次元)の略です。
dim(data1)で、変数の数とそれぞれのデータ数が返ってきます。行数、列数の順に表示されているので、最初の20は変数当たりのデータ数、2番目の5は変数の数です。
> dim(data1)
[1] 20 5
str()
変数の数などの詳しい中身は、str()を使えばわかります。structure(構造)の略です。
str(data1)の結果は以下の通りです。
> str(data1)
'data.frame': 20 obs. of 5 variables:
$ X1: int 1 2 3 4 5 6 7 8 9 10 ...
$ X2: int 21 22 23 24 25 26 27 28 29 30 ...
$ X3: int 41 42 43 44 45 46 47 48 49 50 ...
$ X4: int 61 62 63 64 65 66 67 68 69 70 ...
$ X5: int 81 82 83 84 85 86 87 88 89 90 ...