備忘録

ただの覚え書き

R

大量データの読み込み

R

Rで大量のデータを読み込むときは read.csvよりもfread を用いた方が処理が速い. data.tableパッケージを導入すると使える. ・data.tableはdata.frameの拡張版.より大規模データを処理できる. ・ただし,data.frameと同じ処理ができない場合があるので,…

dummiesパッケージ

R

"dummies" ダミー変数を作るためのパッケージ. endogenous の sampselect が factor に対応していないので導入. https://cran.r-project.org/web/packages/dummies/dummies.pdf サンプルコード参照 > letters <- c( "a", "a", "b", "c", "d", "e", "f", "g…

endogenousパッケージ

R

endogenousパッケージの sampselect(outcome, probit, init = NULL, id = NULL, se = "R") についてのメモ. ・init:初期値はNULLのままでOK. ・probitの被説明変数は,無い時を1,ある時を0にしないと回らない. (https://cran.r-project.org/web/pack…

data.frameへのアクセス

R

2通りある. ⓵attach() data$要素のグループといちいち打つのが面倒な時に使える. > data = read.csv("Tigers_2018_batting.csv")> attach(data)> 選手名 [1] 糸原 健斗 糸井 嘉男 福留 孝介 梅野 隆太郎 大山 悠輔 ロサリオ [7] 陽川 尚将 北條 史也 鳥谷 …

factor を numeric に型変換するとき

R

型がfactorのものをnumericに型変換するときは as.numeric(as.character(data)) と必ずas.characterを挟む必要あり. しなかった場合↓ > data [1]2015 Levels:2015 > class(data) [1]"factor" > as.numeric(data) [1]1 と,よくわからないことに. lengthが…