How to work
Tableau x Google Cloud Platform in
CyberAgent AdTech Studio
2016 March 24th
CyberAgent, Inc. All Rights Reserved
Agenda
サイバーエージェントとは
アドテクスタジオとは
サイバーエージェントでのTableauの導入について
サイバーエージェントでのGoogle Cloud Platformの導入について
実際のTableau x Google Cloud Platformの導入事例
自己紹介
Ken Takao
株式会社サイバーエージェント
アドテク本部 技術戦略部 技術戦略室
Central Infrastructure Agency
Infra Manager
アドテク本部の技術ボードメンバー
としてTableau,GCPの推進を行ってます。
サイバーエージェントとは?
OUR VISION
当社は1998年の創業以来、インターネットを軸に事業を展開し、
現在では当社の代表的なサービスである「Ameba」をはじめ、ス
マートフォン向けに多数のコミュニティサービスやゲームを提供
しています。2011年よりスマートフォン事業へ経営資産を大きく
シフトし、2014年9月期には売上高の約7割がスマートフォン事
業に転換。変化対応力を強みに事業拡大を続けております。
Ameba事業は、先行投資期から収穫期に移行。インターネット
広告事業においては、スマートフォン広告市場の約3割を取り扱
い、インターネット広 告 市 場 国 内ナンバーワンのシェアを拡 大
し、アドテクノロジー分野や動画広告など、新しい広告手法にも
積極的に取り組んでおります。2009年から展開するゲーム事業
においても、ネイティブゲームにて複数本のヒットタイトルが出る
など、国内有数のゲーム事業へ成長いたしました。
タイトル TITLE
タイトル TITLE
アドテクスタジオとは?
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
200名以上の
エンジニア
20以上の
広告システム
1000台以上の
物理サーバー GCP,AWS,
IDCF Cloudなど
マルチクラウド
10PB以上の
データ基盤
数PBの
データ
ウェアハウス
サイバーエージェントでの
Tableauの導入
2014年3月よりTableau Desktopを導入
一部の開発者やデータサイエンティストが
データを可視化するのに利用。
2014年12月よりTableau Serverを導入
一部のチームでTableau Serverを
利用してデータの可視化を共有し始める。
2016年1月よりTableau Server Core Licenseを導入
社内のTableauユーザー数が爆発的に増加
288人が使ってどれくらい CPUを使っているかというと全く使ってない
(ロードアベレージが平均 0.0133)
ネットワークトラフィックはそこそこ出ているが上限が 20Gbps
社員全員が使ってくれるといいな。
Tableauの何がいいのか?
1.数クリックで簡単にグラフが作れちゃう。
2.データソースが何でも繋がる。
よく使うデータソースCSV,Excel,MySQL,PostgreSQL,
Redshift,Oracle,
Matrix,Google Spreadsheetなどなど
3.数クリックで簡単にデータを共有できちゃう。
コアライセンスなら
4.簡単に管理画面に組み込めてしまう!
5.ユーザー数が増えれば増えるほどお得に!
サイバーエージェントでの
Google Cloud Platform
の導入
Google Cloud Platformの導入状況
Ameba事業本部、アドテク本部で導入中
cyberagent.co.jp,cyberagent.io,ameba-cloud.comの3つのドメ
インが存在する。
ameba-cloud.comの方ではabema.tvやameba freshなど
新規サービスで利用中。
アドテク本部では動画広告配信システムに利用中。
AWSと比較すると
 リザーブドインスタンスを購入する必要が無い。
  (いっぱい使っていると勝手に割り引かれる。)
 BigQueryだったり、強力なロードバランサーが使えたり、
 リージョンをまたいでも同一ネットワークだったり便利
BigQueryについて
サーバーを必要とせず、
簡単にデータを保持できる超高速データベース
現在では配信サーバーのログデータをストリームでインサー
トして(月間54TB)配信のアルゴリズムに役立てている。
(後半、神田より実用事例を説明します。)
データ量が少ないとか金額も少ないので管理系のCSVをロー
ドさせるのにも最適!
Tableauで費用分析
Google Cloud Platformでは1日ごとの費用を
CSVにしてGoogle Cloud Storageにアップできます。
http://ameblo.jp/principia-ca/entry-12104991502.html
これをCRONでBigQueryにロード
これをTableauで可視化
             
                 
bq load --skip_leading_rows=1 payment.gcp gs://cia-payment/payment-2016-03-16.csv Account_ID:STRING,
Line_Item:STRING,Start_Time:TIMESTAMP,End_Time:TIMESTAMP,Project:STRING,Measurement1:STRING,
Measurement1_Total_Consumption:FLOAT,Measurement1_Units:STRING,Credit1:STRING,Credit1_Amount:
FLOAT,Credit1_Currency:STRING,Cost:FLOAT,Currency:STRING,Project_Number:STRING,Project_ID:STRING,
Project_Name:STRING,Project_Labels:STRING,Description:STRING
なんと僅か数分で左のグラフ
ができてしまう!
Tableauの予測機能で費用予
測まで可能!?
実際のTableau x
Google Cloud Platform
の導入事例
自己紹介
Katsunori Kanda
株式会社サイバーエージェント
アドテク本部 技術戦略部 技術戦略室
Core Development Group
Senior Software Engineer
potix2 @ twitter/github
※毎月LispMeetup(shibuya.lisp)を開催しています
今月は3/30に開催予定。残りわずか。
Tableau × BigQueryの
限界を探ったときの話
Tableau × BigQueryの
導入に際して実施した、
その限界を探るパイロットスタディの
顛末をお話します
広告の前提知識を少しだけ・・・
いつ x 誰が x どの広告と何処で接触して
その結果、どうなったのか?
ということに関心があります。
広告システムでは、
例えば、
帰宅中にtwitterをしている会社員は、ゲーム広告を見るとよくクリックする傾向がある。
というような事象がわかれば効率よく広告配信ができる。
みたいな話です。
それをふまえて、
スタディ1
1分区切りで配信状況を可視化
やってみたこと
Tableauのデータソースとして、
BigQueryを追加
これをクリック
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
1日分のログ1TBに、
Group By hour, minute
ちょっと重いけど、普通に動いた!
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
ただ・・・
レポートをちょっと修正すると
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
思考の妨げ
課金
そこで、
データ抽出
コレをクリック
スタディ1まとめ
● TableauからBigQueryの接続は簡単
● 快適な操作&コスト低減のためにはデータ抽出が有効
● RDB的感覚で無理なクエリーでもBigQueryなら動く
スタディ2
どの広告がいつ配信されているのか
を可視化したい
スタディ1のデータソースに
「広告主」のディメンジョンを追加
Group By hour, minute, advertiser
だいたい数百万行くらい
これでもBigQueryは動く
広告主ごとに色分けをしてみる
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
Tableauでも表示できた!
もう少し過酷にしてみる
メジャーを追加していくと・・・
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
突然のレンダリング待ち
スタディ2まとめ
● データソースを変更&色分けだけで得られる情報量は格段
にあがった
● ただ、現実的な時間で描画できるとは限らない
● ポイントを絞り、不要な情報を削ぎ落とすことで「見やすく」、
「高速な」レポートができる
※最初から情報を削ぎ落としすぎると新たな気づきが得られないことも・・・
ちょっとだけ脱線
スタディ2のクエリーへさらに
ディメンジョンを追加する
Group By hour, minute, advertiser,
publisher
数十億から数百億件くらい
これだとBigQueryも、
Tableauも動かなくなる・・・
広告配信は、
組み合わせ最適化問題
配信先が追加されただけで
組み合わせ数が一気に跳ね上がる
ちなみに、今回のスタディを通して
● システムの改善ポイントを見つけ、修正するに至った
● 事業上の取り組むべき課題を見つける事ができた
まとめ
● データは雄弁
● 速いは正義
● 常識にとらわれないクエリーから新たな気づきを得る

More Related Content

PDF
広告におけるビッグデータの分析事例
PDF
[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...
PDF
Google big query × Amazon redshift
PDF
MapR Hadoop M7 in CyberAgent AdTech Studio
PDF
データサイエンスを支える基盤とそのテクノロジー@WebDBフォーラム2015 #webdbf2015
PDF
Ironicを運用して半年が経過しました - OpenStack最新情報セミナー(2016年7月)
PDF
データにまつわるWeb業界の仕事について
PDF
10分でわかるサイバーエージェント広告部門のハイブリッドクラウド環境 公開用
広告におけるビッグデータの分析事例
[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...
Google big query × Amazon redshift
MapR Hadoop M7 in CyberAgent AdTech Studio
データサイエンスを支える基盤とそのテクノロジー@WebDBフォーラム2015 #webdbf2015
Ironicを運用して半年が経過しました - OpenStack最新情報セミナー(2016年7月)
データにまつわるWeb業界の仕事について
10分でわかるサイバーエージェント広告部門のハイブリッドクラウド環境 公開用

What's hot (19)

PDF
AbemaTV Developer Conference 2016
PPTX
F.O.Xを支える技術
PDF
データファースト開発
PPTX
クラウドの積極的利活用による生産性向上と経営に寄与する仕組みづくり
PPTX
Tableau Server Client(Python) でできる3000人規模の サーバーレス運用管理
PPTX
ハイブリッドクラウドで変わるインフラストラクチャ設計
PDF
株式会社サイバーエージェント アドテクスタジオの技術と開発
PDF
Googleアシスタントアプリ実際のところ
PPTX
グリーにおけるAWS移行の必然性
PDF
行ってみよう、やってみよう!
PDF
"フルスタック"セキュリティ
PDF
Business Innovation cases driven by AI and BigData technologies
PPTX
Sumo Logic活用事例とその運用
PPTX
第一回☆GREE AI Programming ContestでTensorFlow
PPTX
[デブサミ秋2015] 新卒入社エンジニアが 2年間fluentdを運用して学んだ事いろいろ
PDF
[Japan Tech summit 2017] MAI 005
PPTX
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
PDF
Tableau活用4年の軌跡
PPTX
DataEngConf NYC’18 セッションサマリー #1
AbemaTV Developer Conference 2016
F.O.Xを支える技術
データファースト開発
クラウドの積極的利活用による生産性向上と経営に寄与する仕組みづくり
Tableau Server Client(Python) でできる3000人規模の サーバーレス運用管理
ハイブリッドクラウドで変わるインフラストラクチャ設計
株式会社サイバーエージェント アドテクスタジオの技術と開発
Googleアシスタントアプリ実際のところ
グリーにおけるAWS移行の必然性
行ってみよう、やってみよう!
"フルスタック"セキュリティ
Business Innovation cases driven by AI and BigData technologies
Sumo Logic活用事例とその運用
第一回☆GREE AI Programming ContestでTensorFlow
[デブサミ秋2015] 新卒入社エンジニアが 2年間fluentdを運用して学んだ事いろいろ
[Japan Tech summit 2017] MAI 005
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
Tableau活用4年の軌跡
DataEngConf NYC’18 セッションサマリー #1
Ad

How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio