ヘッダー

このエントリーをはてなブックマークに追加

2010/07/01

R データの統合 列の長さの違うものの統合

今日は研究室でR (無料統計ソフト)を使った。


基本的にこのソフトは、データの解析に使うもの。



分散分析とか、回帰分析とか、めっちゃ簡単に出来て便利。



これが無料とか最強




ただ今日はただ単に、データを統合するためだけにRを使った。



どーなのかなぁ・・・おそらく頑張ればExcelでも出来るのだが、早さ的にRの方が早そうだったのでRでやってみた。




やる内容は、同じフォーマットでまとまった150個くらいのcsvファイルの、ある行がある値になっているものだけを集めて、あるフィールドの値を並べたファイルを作るというもの。

フィールドは

ファイル名1|ファイル名2|ファイル名3 ・・・・

って感じ。





ファイルの名前は連続的になっているので



○○ <- read.table("○○", header=TRUE, sep=",")


の○○の所だけexcelでピーってやって、他の文字列と繋いで


メモ帳とかにコピーしてRに貼付けて

読み込みまくり、その後R内でflagとか用意して条件指定してくっつけて変数に入れた。



もちろんflagもexcelでピーってやつ


おそらくもっといいやり方あるんだろうけどなぁ・・・未熟すぎるので原始的なやりかた。



やっているときに困ったのは、cbind とか as.data.frame とかにするときに、その変数の列の長さが全部同じじゃないとデータフレームに出来ないんだよね・・・・



 だから



length(変数)<-30000



とか入れて、


length(変数$要素名)<-30000


にして、



length(変数)をもとに戻したらas.data.frameに出来た!



んで無事write.tableして・・・




ってこれ忘れないために書いているんだけど、読み返して分かるのだろうかw



誰かのためにもなるかと思って公開しているのだが、意味あるのだろうか・・・





まいっかw

0 件のコメント:

コメントを投稿