[R]表データを読み込む

サイト移転のお知らせ

移転先はこちらです。
[R]表データを読み込む
新たな記事は移転先に掲載しておりますので、そちらをご確認ください。

スポンサードリンク

ここでお話することは表データをRに読み込ませる方法です。

  1. Rに適した表データの形
  2. 表データを読み込むためのread.csv関数
  3. 表データの操作

という順にお話していきます。

Rに適した表データの形

そもそも表データとは、表計算ソフトのExcelなどで使われているようなデータです。

 

例えば、ある病気の患者の肝機能と腎機能を測定して1つの表データにまとめたとするとこんな表が出来上がります。

 

患者ID 肝機能検査値 腎機能検査値
1 40 3.6
2 25 1.5
3 60 7.3
4 51 5.5
5 38 1.6

 

この表ではデータの数が増えていくと縦に並べていく格好になります。

 

「私は縦にデータを並べる表ではなくて、横に並べる形の表を作りました」という人もいるのではないでしょうか。

 

この場合は上の表を、反時計回りに90°回転させたような形になっていると思います。

 

どちらが正解ということはありませんが、Rに適した形は縦にデータを並べていく形の表です。

 

縦に並べた表データをRに読み込ませるには「CSVファイル」という形の表データとして保存しておく必要があります。

 

CSVファイルとはファイル名の最後に「.csv」と付いているファイルのことです。

 

Excelなどの表計算ソフトで表データを作成して保存すると「.xls」と付くのですが、保存するときに[名前をつけて保存]を選択して[ファイルの種類]から「CSV」を選択すればCSVファイルとして保存できます。

 

[R]表データを読み込む

 

表データをCSVファイルとして保存できたら準備完了です。

表データを読み込むためのread.csv関数

CSVファイルとして保存した表データを読み込むにはread.csv関数を使います。

 

read.csv関数はCSVファイルを読み込んでRで表として操作できるようにする関数です。

 

はじめにサンプルファイルをダウンロードしてパソコンのドキュメントフォルダに保存します。

 

[R]表データを読み込む

 

ドキュメントファルダを開いたらサンプルファイルが表示されている状態にして下さい。

 

[R]表データを読み込む

 

このファイルを使ってやり方を説明します。

 

read.csv関数を使うには作業ディレクトリをドキュメントフォルダに変更しておきます。

 

表を読み込むには次の形式で入力します。

read.csv("ファイル名.csv")

 

ただ表を読み込んだだけでは操作することができません。

 

読み込んだ表をRのオブジェクトとして保存する必要があるので、代入式(<-)を使って保存します。

sample <- read.csv("readcsv_sample01.csv")

 

これでsampleというオブジェクトに表データを保存できました。

 

保存した表データを表示してみます。

   患者ID 肝機能検査値 腎機能検査値
1       1           40          3.6
2       2           25          1.5
3       3           60          7.3
4       4           51          5.5
5       5           38          1.6
6       6           49          1.4
7       7           27          2.0
8       8           91          3.2
9       9           98          6.4
10     10           53          1.2

 

サンプルファイルで「患者ID」という列を作っていますが、Rでは自動で通し番号を付けてくれるので、実際のところ必要ありません。

表データの操作

表データを操作する場面としては

  • 肝機能の数値だけを抽出したい
  • 特定の患者のデータを知りたい
  • 特定の列を削除したい

などがあります。

 

この中のどれをするにも「[](ブラケット)」を使います。

 

オブジェクト名[行番号,列番号]

という形式で使用します。

 

「肝機能の数値だけを取り出したい」場合は列を抽出する作業なので次のようにします。

sample[,2]

 

「行番号」の部分に何も書かないと、すべての行を選択したことになります。

 

同じように「特定の患者のデータを知りたい」場合は次のように操作します。

sample[7,]

 

これだけではデータを見れるだけなので、新たにオブジェクトとして保存して使いやすくすることができます。

sample_liver <- sample[,2]

 

最後に特定の列や行を削除する方法です。

 

これも同じように「[]」を使います。

 

削除したい場合は次の形式で入力します。

オブジェクト名[-行番号,-列番号]

 

削除する場合には「-(ハイフン,マイナス)」記号を削除したい行番号、列番号につけます。

 

「患者IDは余計なので取り除きたい」場合は列を取り除く作業なので次のようにします。

sample[,-1]

 

これをsampleとして新たに保存すれば、不要なデータを取り除いたデータとして扱うことができます。

sample <- sample[,-1]

 

スポンサードリンク

「[R]表データを読み込む」と同じカテゴリーのページ

Rとは?
Rについての説明。 Rを利用するメリット。
[R]インストール手順
Rのインストール方法。 インストール中の画像付。 最初にしておきたい設定。
[R]起動と終了と操作方法
Rの起動、終了。 対話環境について。 R基礎講座の読み方。
[R]作業ディレクトリを変更する
Rでデータを読み込んだりするときに、ディレクトリを変更した方が作業しやすい場合がある。 作業ディレクトリ(作業フォルダ)を変更する方法。
[R]電卓として使う
Rの一番簡単な使い方は関数電卓として使う方法。 電卓として使いながら、基本的な操作を紹介する。
[R]データの一括計算
Rはデータの一括処理が得意。 その中でも基本的な一括計算はベクタ(ベクトル)化された計算と言う。 この操作になれると、Rの利用効率が一気に上がる。
[R]変数の作り方と計算
Rでの変数の作り方と数値計算の方法。
[R]ベクタというデータ型
Rが最も力を発揮するベクタというデータ型を覚えておきましょう。