今日は研究室でR (無料統計ソフト)を使った。
基本的にこのソフトは、データの解析に使うもの。
分散分析とか、回帰分析とか、めっちゃ簡単に出来て便利。
これが無料とか最強
ただ今日はただ単に、データを統合するためだけにRを使った。
どーなのかなぁ・・・おそらく頑張ればExcelでも出来るのだが、早さ的にRの方が早そうだったのでRでやってみた。
やる内容は、同じフォーマットでまとまった150個くらいのcsvファイルの、ある行がある値になっているものだけを集めて、あるフィールドの値を並べたファイルを作るというもの。
フィールドは
ファイル名1|ファイル名2|ファイル名3 ・・・・
って感じ。
ファイルの名前は連続的になっているので
○○ <- read.table("○○", header=TRUE, sep=",")
の○○の所だけexcelでピーってやって、他の文字列と繋いで
メモ帳とかにコピーしてRに貼付けて
読み込みまくり、その後R内でflagとか用意して条件指定してくっつけて変数に入れた。
もちろんflagもexcelでピーってやつ
おそらくもっといいやり方あるんだろうけどなぁ・・・未熟すぎるので原始的なやりかた。
やっているときに困ったのは、cbind とか as.data.frame とかにするときに、その変数の列の長さが全部同じじゃないとデータフレームに出来ないんだよね・・・・
だから
length(変数)<-30000
とか入れて、
length(変数$要素名)<-30000
にして、
length(変数)をもとに戻したらas.data.frameに出来た!
んで無事write.tableして・・・
ってこれ忘れないために書いているんだけど、読み返して分かるのだろうかw
誰かのためにもなるかと思って公開しているのだが、意味あるのだろうか・・・
まいっかw
0 件のコメント:
コメントを投稿