Rで取り扱うデータにはデータ型(data type)とデータ構造(data structure)があります.ここでは,まずデータ型について解説します.データ型とはデータの性質のことです.Rには数値,論理値,文字列という3つの代表的なデータ型があります.数値は numeric,論理値は logical,文字列は character と称されます.numeric は量的な情報を表現するためのデータ型です.numeric の他に整数(integer)や複素数(complex)などのデータ型もありますが,実データを分析する際にはそこまで細かく区別する必要はありません.logical はTRUEとFALSEの2値で,比較演算や論理演算の結果として返されるデータ型です.character はテキストデータを扱うためのデータ型であり,算術演算の対象とはならないデータ型です.このデータ型は分析を行うときの変数や観測個体のラベルに使用されることが多いです.
オブジェクトに代入されている値のデータ型を確認するためにはclass関数を使用します.なお,class関数は汎用性が高く,データ構造の確認にも使用されます.
X <- 5
X
class(X) # numericが返される
Y <- TRUE
Y
class(Y) # logical
Z <- "Hello World"
Z
class(Z) # character
上掲のように,文字列をオブジェクトに代入するときはダブルクォーテーションが必要にありますが,論理値を代入するときにはダブルクォーテーションは不要です.TRUEやFALSEにダブルクォーテーションを付けると,論理値ではなく文字列として代入されてしまうので注意が必要です.Zに代入されている値を出力すると,Hello Worldという文字列の両端にダブルクォーテーションが付くことが分かると思います.他方,Yを出力すると,TRUEの両端にはダブルクォーテーションが付きません.オブジェクトに代入されている値を確認したときに,ダブルクォーテーションが付いていればデータ型は文字列であると覚えておくと良いでしょう.
また,Rでは numeric が量的変数に対応していると言えますが,質的変数に対応するデータ型はありません.Rでは因子というデータ構造を用いることで質的変数の分析を行います.因子についてはデータ構造を解説するときに採り上げます.