Prophet ⼊⾨【理論編】
Facebook の時系列予測ツール
2017/07/22
@hoxo_m
1
About me
HOXO-M Inc.
代表取締役 CEO
2
【宣伝】Rによる⾃動データ収集
Webスクレイピングとテキストマイニングの実践
ガイド
共同翻訳
しました
3
本⽇の内容
•  Prophet の時系列モデルについて下記の
発表では伝えられなかった部分を紹介
•  Prophet ⼊⾨【Python編】
https://www.slideshare.net/hoxo_m/
prophet-facebook-76285278
•  Prophet ⼊⾨【R編】
https://www.slideshare.net/hoxo_m/
prophetrfacebook
4
時系列モデル
•  ⽬的:
–  直感的に理解可能な調整パラメータを
持つモデル
•  アイデア:
–  ❌ ⽣成モデル
–  曲線フィッティングの問題として解く
–  各成分に分解可能なモデル
5
時系列モデル
•  Decomposable TS Model (Harvey+ ’90)
•  g(t): 成⻑関数 (growth)
•  s(t): 周期性 (seasonality)
•  h(t): 祝⽇効果 (holiday)
•  ε(t): 誤差 (正規分布を仮定)
6
7
=
+
成⻑関数 周期性
時系列データ
① 成⻑関数
•  ⾮線形関数
•  線形関数
8
成⻑関数
•  成⻑関数(ロジスティック関数)
•  ただし
•  新機能のリリースなどでトレンドが変化
•  成⻑率 k の変化をモデルに組込みたい
9
10
=
+
成⻑関数 (変化点あり) 周期性
時系列データ
変化点の組み込み
•  変化点 sj : j = (1, 2, … , S) に対して
•  成⻑率の変化 δj
•  時点 t での成⻑率
•  ただし
11
=
変化点の組み込み
•  変化点の結合部で連続になるように補正
•  変化点を組み込んだ成⻑関数
12
成⻑関数
•  ⾮線形成⻑
•  線形成⻑
13
変化点の⾃動検出
•  変化点 sj を多めに取ってスパース推定
•  成⻑率の変化
14
② 周期性
•  フーリエ級数で近似 (Harvey+ 1993)
•  年周期: P = 365.25 N = 10
•  週周期: P = 7 N = 3 を使⽤
•  他の周期も柔軟に⼊れることが可能
15
③ 祝⽇効果
16
祝⽇効果
•  同じ祝⽇は同じ効果と仮定
•  例: D1 = クリスマス κ1 = 毎年の上乗せ分
17
時系列モデル
•  Decomposable TS Model (Harvey+ ’90)
•  加法モデルとしてパラメータ推定可能
–  バックフィッティング
–  ニュートン法
•  (疑問: h(t) は滑らかでなくていい?)
18
パラメータ推定
•  確率的プログラミング⾔語 Stan を使⽤
•  L-BFGS (準ニュートン法) で MAP 推定
•  メリット
–  ⾼速
–  モデルの記述が容易
–  モデルを柔軟に変更可能 (周期の追加など)
–  ベイズ推定にも切り替え可能 (低速)
19
Stan コード
20
適⽤例: Facebookのイベント数
21
22
祝⽇効果
成⻑関数
週周期
年周期
まとめ
•  予測モデルに⽣成モデルを使わず、曲線
フィッティングの問題として考えた
•  調整パラメータが直感的に理解可能
–  線形成⻑ or ⾮線形成⻑
–  変化点とその数
–  周期性 (年周期、週周期 など)
–  祝⽇・イベント効果
23
参考⽂献
•  Sean J. Taylor and Benjamin Letham,
Forecasting at Scale, 2017
–  A. Harvey and S. Peters, Estimation procedures
for structural time series models, Journal of
Forecasting, 9:89–108, 1990
–  A. C. Harvey and N. Shephard, Structural time
series models, In G. Maddala, C. Rao, and H.
Vinod, editors, Handbook of Statistics, volume
11, chapter 10, pages 261–302. Elsevier, 1993
24

Prophet入門【理論編】Facebookの時系列予測ツール