Intree: R package for randomforest interpretation 1. 森を見たい “Interpreting Tree Ensembles with inTrees” inTrees package (by Houtao Deng) を紹介します 第51回R勉強会@東京(#TokyoR) 2. ランダムフォレスト 学習データのランダムサブセットで構築した様々な決定木の集合(=森)の 予測結果 を統合する 分類 → 多数決 回帰 → 平均 ALL DATA Random subset Random subset Random subset … 3. 特徴変数の 重要度 も評価できます どれだけ予測力に貢献しているか という情報をもとに特徴変数の重要度を評価する 4. ランダムフォレスト 学習データのランダムサブセットで構築した様々な決定木の集合(=
最近Rにおけるランダムフォレストの高速な実装としてrangerパッケージが発表された。 開発者が既存のランダムフォレスト実装パッケージと比較した論文をarxivに掲載している。 http://arxiv.org/pdf/1508.04409v1.pdf rangerは速い…のか? 既存のランダムフォレスト実装としてrandomForest、randomForest、bigrf、randomForestSRC、Random Jungle、Rboristが比較されている。 私が扱うデータはほとんどがサンプルサイズ>>特徴量数というデータなので、Table2とFigure4が比較結果として参考になる。 Table2ではサンプルサイズ100,000、特徴量数100というデータに対して各パッケージの処理速度とメモリ消費量を比較している。 ざっとみた感じ高速なのは二値型の特徴量(dichotomous
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く