Estimating the Effect of Advertisment
by Varian’s approach with R
Shota Yasui
Japan.R 2015-12-05
Estimating the effect of advertising with Machine learning
広告の効果を機械学習を使って推定するという話。
広告の効果をちゃんと推定するのは難しい
Estimating the effect of advertising with Machine learning
Estimating the effect of advertising with Machine learning
Estimating the effect of advertising with Machine learning
どちらの方に多く広告を出稿しますか?
Estimating the effect of advertising with Machine learning
Selection Bias
• マーケターは相性の良さそうなタイミングや場所で多
く出稿する。
• この時単純に売り上げの差分を広告の効果と主張する
のはNG
カリフォル
ニア
アリゾナ
Sales
広告の効果?
Selection Bias
• 効果を推定したい事象がランダムには割り振られていない。
• その事を加味した推定方法を利用しなければ、推定された効果はselection
biasを内包した状態になる。
• こういった状況に対処する為によく使うものが、
• Instrumental Variable Method
• Propensity Score
広告の効果
元々の相性
今回はHal Varianが2014年にBig Data: New Tricks
for Econometricsという論文で提唱したアプロー
チをRでやってみた。
データ
• KaggleのRossmann Store Salesのデータを利
用する。
• ドイツにあるドラッグストア1115店舗の3年
分の売上とそれに関連する店舗の特徴データ。
• このデータの中にPromotionという変数が0 or
1のダミー変数で入ってる
• 今回はこのPromotionの変数が広告であるとい
う仮定を行い分析を進める。
Promotion = 0
モデル学習データ
10 hold cv
Promotion = 0

の比較対象データ
Promotion = 1
の予測対象データ
モデル学習
未学習のデータとしてモデ
ルに投入して予測値を算出。
結
果
1. 比較してみる。
2. Promotion = 1データでの予
測値と実売上の差分を見る。
N=37万
N=32万
N=14万
流れ
学習されたモデルを広告が無い世界での売
り上げを予測してくれるものだと捉える。
モデル
• Gradient Boosting Decision Treeを採用。
• Xgboostパッケージで学習
• 理由は慣れてるから。
• Ntree = 3000 Shrinkage = 0.5 Max.depth = 5
• Log(売上)に対して学習   Log(Sales) = f(Features) +
error
• 10 hold CVでrmseが0.07程度。
Promotion = 0

の比較対象データ
• 横軸がモデルでの予測。
• 縦軸が実際の売上。
※このデータはモデルにとって未知のデータ。
Rmseは0.072
• 事象の構造に変化が無ければ、予測はある程度上手く行く。(右)
• 事象の構造に変化が有れば、予測はずれる。(左)
• データの差が広告のみであるならば、実際の売上の値とモデルの予
測値との乖離が広告の効果であると言える。
• Promotion = 1のデータの予測値とlog(sales)の差の平均は0.46
• この値を対数差分の近似として捉えれば、Promotionの効果は平
均的に売上に対して46%の増加をもたらすと考えられる。
• ただし、Promotion = 1のデータセットとPromotion = 0のデータ
セット間で広告の投下と相関しているような差が発生していなけ
れば・・・
• 例えばクリスマスシーズンは全ての店と全ての年で広告を出して
いる状態なら、クリスマスシーズンのデータはPromotion = 1の
データセットにしか入っていない状態になる。
• 結果この46%の増加の中にはクリスマスシーズンというセレク
ションバイアスが含まれていることになる。
結果のまとめ
+α:広告効果の推定値に対しての学習
• Ntree = 500
• Shrinkage = 0.5
• Max.depth = 5
• Store type
• 曜日
• 商品の品ぞろえ
• 露点
• 競合店との距離
• あたりが広告効果と思われる差分
の“予測には”効いてる。
• こういった要素から広告効果の受
けやすい店舗とかが解
る・・・・・・・かも。
Enjoy!

More Related Content

PPTX
SeekR Annual Search Trends Report 2015
PPTX
Tokyo r45 beginner_2
PDF
20151205 Japan.R SparkRとParquet
PDF
前処理のための前処理(Tokyo.R#45)
PDF
Jenkins によるレポートスクリプト管理
PDF
「R for Cloud Computing」の紹介
PPTX
PDF
10分で分かるr言語入門 短縮バージョン 15-0117_upload用
SeekR Annual Search Trends Report 2015
Tokyo r45 beginner_2
20151205 Japan.R SparkRとParquet
前処理のための前処理(Tokyo.R#45)
Jenkins によるレポートスクリプト管理
「R for Cloud Computing」の紹介
10分で分かるr言語入門 短縮バージョン 15-0117_upload用

More from Shota Yasui (14)

PDF
L 05 bandit with causality-公開版
PDF
Contextual package
PDF
PaperFriday: The selective labels problem
PDF
TokyoR 20180421
PDF
何故あなたの機械学習はビジネスを改善出来ないのか?
PDF
木と電話と選挙(causalTree)
PDF
計量経済学と 機械学習の交差点入り口 (公開用)
PDF
Factorization machines with r
PPTX
Prml nn
PPTX
Xgboost for share
PPTX
重回帰分析で頑張る
PDF
Dynamic panel in tokyo r
PDF
Rで部屋探し For slide share
PDF
Salmon cycle
L 05 bandit with causality-公開版
Contextual package
PaperFriday: The selective labels problem
TokyoR 20180421
何故あなたの機械学習はビジネスを改善出来ないのか?
木と電話と選挙(causalTree)
計量経済学と 機械学習の交差点入り口 (公開用)
Factorization machines with r
Prml nn
Xgboost for share
重回帰分析で頑張る
Dynamic panel in tokyo r
Rで部屋探し For slide share
Salmon cycle
Ad

Recently uploaded (17)

PDF
12_星の杜中学校小倉ももこ『家族ってなに』inspirehigh発表物.pdf
PDF
11_「なぜ議会への関心が低いのか?」長野県長野西高等学校 片桐 菜々美さん.pdf
PDF
8_「世の中の流行はどのようにして生まれるのか」学校法人聖ドミニコ学園竹野はるいpptx.pdf
PDF
My Inspire High Award 2024(岡田秀幸).pptx.pdf
PDF
5_「AIと仲良くなるには?」日本大学東北高等学校南梨夢乃さんinspirehigh.pdf
PDF
7_「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」明治大学付属中野八王子中学校宮本ゆりかさん.pdf
PDF
10_「孤独は敵なのか?」 桜花学園高等学校堀川愛可さんinspirehigh.pdf
PDF
共同売店から考える沖縄の新しい流通のしくみ2025琉球大学流通原論講義資料.pdf
PDF
外国人が日本のテーブルマナーに驚く理由は?_公文国際学園高等部 角田 恵梨佳さん
PDF
6_「老いることは不幸なこと?」植草学園大学附属高等学校森 珠貴さんinspirehigh.pdf
PPTX
PPT KANJI IRODORI SHOKYUU 1 BAB 9 (FURIGANA)
PDF
3_「本当の『悪者』って何?」鷗友学園女子中学校_福島 雪乃さんinspirehigh.pdf
PDF
13_「他者と自分、対立を防ぐには?」市原中央高等学校 大野リリinspirehigh.pdf
PDF
9_前田音葉さん:「Yakushima Islandってなんか変じゃない?」.pdf
PDF
12_「家族とは何か」星の杜中学校小倉ももこ『家族ってなに』inspirehigh.pdf
PDF
14_「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」公文国際学園高等部古澤琴子.pdf
PDF
「なぜ、好きなことにいつかは飽きるの?」大塚莉子 - My Inspire High Award 2024.pdf
12_星の杜中学校小倉ももこ『家族ってなに』inspirehigh発表物.pdf
11_「なぜ議会への関心が低いのか?」長野県長野西高等学校 片桐 菜々美さん.pdf
8_「世の中の流行はどのようにして生まれるのか」学校法人聖ドミニコ学園竹野はるいpptx.pdf
My Inspire High Award 2024(岡田秀幸).pptx.pdf
5_「AIと仲良くなるには?」日本大学東北高等学校南梨夢乃さんinspirehigh.pdf
7_「なぜ人は他人と違うところがあってもそれをなかなか誇れないのか?」明治大学付属中野八王子中学校宮本ゆりかさん.pdf
10_「孤独は敵なのか?」 桜花学園高等学校堀川愛可さんinspirehigh.pdf
共同売店から考える沖縄の新しい流通のしくみ2025琉球大学流通原論講義資料.pdf
外国人が日本のテーブルマナーに驚く理由は?_公文国際学園高等部 角田 恵梨佳さん
6_「老いることは不幸なこと?」植草学園大学附属高等学校森 珠貴さんinspirehigh.pdf
PPT KANJI IRODORI SHOKYUU 1 BAB 9 (FURIGANA)
3_「本当の『悪者』って何?」鷗友学園女子中学校_福島 雪乃さんinspirehigh.pdf
13_「他者と自分、対立を防ぐには?」市原中央高等学校 大野リリinspirehigh.pdf
9_前田音葉さん:「Yakushima Islandってなんか変じゃない?」.pdf
12_「家族とは何か」星の杜中学校小倉ももこ『家族ってなに』inspirehigh.pdf
14_「スーパーマーケットで回収されたキャベツ外葉は廃棄されているの?」公文国際学園高等部古澤琴子.pdf
「なぜ、好きなことにいつかは飽きるの?」大塚莉子 - My Inspire High Award 2024.pdf
Ad

Estimating the effect of advertising with Machine learning