Upload
Download free for 30 days
Login
Submit Search
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
7 likes
4,599 views
Ken Takao
TableauとGoogle Cloud Platformをヘビーに使っているアドテクスタジオですが、今回イベントでどのように利用しているかを話してきました。その時の資料です。
Technology
Related topics:
Google Cloud Platform
Read more
1 of 73
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
More Related Content
PDF
広告におけるビッグデータの分析事例
Ken Takao
PDF
[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...
Insight Technology, Inc.
PDF
Google big query × Amazon redshift
Fumihide Nario
PDF
MapR Hadoop M7 in CyberAgent AdTech Studio
Ken Takao
PDF
データサイエンスを支える基盤とそのテクノロジー@WebDBフォーラム2015 #webdbf2015
Yahoo!デベロッパーネットワーク
PDF
Ironicを運用して半年が経過しました - OpenStack最新情報セミナー(2016年7月)
VirtualTech Japan Inc.
PDF
データにまつわるWeb業界の仕事について
Masanori Takano
PDF
10分でわかるサイバーエージェント広告部門のハイブリッドクラウド環境 公開用
Ken Takao
広告におけるビッグデータの分析事例
Ken Takao
[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...
Insight Technology, Inc.
Google big query × Amazon redshift
Fumihide Nario
MapR Hadoop M7 in CyberAgent AdTech Studio
Ken Takao
データサイエンスを支える基盤とそのテクノロジー@WebDBフォーラム2015 #webdbf2015
Yahoo!デベロッパーネットワーク
Ironicを運用して半年が経過しました - OpenStack最新情報セミナー(2016年7月)
VirtualTech Japan Inc.
データにまつわるWeb業界の仕事について
Masanori Takano
10分でわかるサイバーエージェント広告部門のハイブリッドクラウド環境 公開用
Ken Takao
What's hot
(19)
PDF
AbemaTV Developer Conference 2016
康洋 板敷
PPTX
F.O.Xを支える技術
Yuto Suzuki
PDF
データファースト開発
Katsunori Kanda
PPTX
クラウドの積極的利活用による生産性向上と経営に寄与する仕組みづくり
gree_tech
PPTX
Tableau Server Client(Python)でできる3000人規模のサーバーレス運用管理
Ken Takao
PPTX
ハイブリッドクラウドで変わるインフラストラクチャ設計
gree_tech
PDF
株式会社サイバーエージェント アドテクスタジオの技術と開発
Naoyuki Yamada
PDF
Googleアシスタントアプリ実際のところ
Yahoo!デベロッパーネットワーク
PPTX
グリーにおけるAWS移行の必然性
gree_tech
PDF
行ってみよう、やってみよう!
gree_tech
PDF
"フルスタック"セキュリティ
gree_tech
PDF
Business Innovation cases driven by AI and BigData technologies
DataWorks Summit/Hadoop Summit
PPTX
Sumo Logic活用事例とその運用
gree_tech
PPTX
第一回☆GREE AI Programming ContestでTensorFlow
gree_tech
PPTX
[デブサミ秋2015] 新卒入社エンジニアが2年間fluentdを運用して学んだ事いろいろ
gree_tech
PDF
[Japan Tech summit 2017] MAI 005
Microsoft Tech Summit 2017
PPTX
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
Yahoo!デベロッパーネットワーク
PDF
Tableau活用4年の軌跡
Recruit Technologies
PPTX
DataEngConf NYC’18 セッションサマリー #1
gree_tech
AbemaTV Developer Conference 2016
康洋 板敷
F.O.Xを支える技術
Yuto Suzuki
データファースト開発
Katsunori Kanda
クラウドの積極的利活用による生産性向上と経営に寄与する仕組みづくり
gree_tech
Tableau Server Client(Python)でできる3000人規模のサーバーレス運用管理
Ken Takao
ハイブリッドクラウドで変わるインフラストラクチャ設計
gree_tech
株式会社サイバーエージェント アドテクスタジオの技術と開発
Naoyuki Yamada
Googleアシスタントアプリ実際のところ
Yahoo!デベロッパーネットワーク
グリーにおけるAWS移行の必然性
gree_tech
行ってみよう、やってみよう!
gree_tech
"フルスタック"セキュリティ
gree_tech
Business Innovation cases driven by AI and BigData technologies
DataWorks Summit/Hadoop Summit
Sumo Logic活用事例とその運用
gree_tech
第一回☆GREE AI Programming ContestでTensorFlow
gree_tech
[デブサミ秋2015] 新卒入社エンジニアが2年間fluentdを運用して学んだ事いろいろ
gree_tech
[Japan Tech summit 2017] MAI 005
Microsoft Tech Summit 2017
YJTC18 D-7 Yahoo!ショッピングのサービスデータ活用事例
Yahoo!デベロッパーネットワーク
Tableau活用4年の軌跡
Recruit Technologies
DataEngConf NYC’18 セッションサマリー #1
gree_tech
Ad
How to work Tableau x Google Cloud Platform in CyberAgent AdTech Studio
1.
How to work Tableau
x Google Cloud Platform in CyberAgent AdTech Studio 2016 March 24th CyberAgent, Inc. All Rights Reserved
2.
Agenda
3.
サイバーエージェントとは アドテクスタジオとは サイバーエージェントでのTableauの導入について サイバーエージェントでのGoogle Cloud Platformの導入について 実際のTableau
x Google Cloud Platformの導入事例
4.
自己紹介
5.
Ken Takao 株式会社サイバーエージェント アドテク本部 技術戦略部 技術戦略室 Central Infrastructure
Agency Infra Manager アドテク本部の技術ボードメンバー としてTableau,GCPの推進を行ってます。
6.
サイバーエージェントとは?
7.
OUR VISION 当社は1998年の創業以来、インターネットを軸に事業を展開し、 現在では当社の代表的なサービスである「Ameba」をはじめ、ス マートフォン向けに多数のコミュニティサービスやゲームを提供 しています。2011年よりスマートフォン事業へ経営資産を大きく シフトし、2014年9月期には売上高の約7割がスマートフォン事 業に転換。変化対応力を強みに事業拡大を続けております。 Ameba事業は、先行投資期から収穫期に移行。インターネット 広告事業においては、スマートフォン広告市場の約3割を取り扱 い、インターネット広 告
市 場 国 内ナンバーワンのシェアを拡 大 し、アドテクノロジー分野や動画広告など、新しい広告手法にも 積極的に取り組んでおります。2009年から展開するゲーム事業 においても、ネイティブゲームにて複数本のヒットタイトルが出る など、国内有数のゲーム事業へ成長いたしました。
8.
タイトル TITLE
9.
タイトル TITLE
10.
アドテクスタジオとは?
14.
200名以上の エンジニア 20以上の 広告システム 1000台以上の 物理サーバー GCP,AWS, IDCF Cloudなど マルチクラウド 10PB以上の データ基盤 数PBの データ ウェアハウス
15.
サイバーエージェントでの Tableauの導入
16.
2014年3月よりTableau Desktopを導入 一部の開発者やデータサイエンティストが データを可視化するのに利用。 2014年12月よりTableau Serverを導入 一部のチームでTableau
Serverを 利用してデータの可視化を共有し始める。 2016年1月よりTableau Server Core Licenseを導入 社内のTableauユーザー数が爆発的に増加
17.
288人が使ってどれくらい CPUを使っているかというと全く使ってない (ロードアベレージが平均 0.0133) ネットワークトラフィックはそこそこ出ているが上限が
20Gbps 社員全員が使ってくれるといいな。
18.
Tableauの何がいいのか? 1.数クリックで簡単にグラフが作れちゃう。 2.データソースが何でも繋がる。 よく使うデータソースCSV,Excel,MySQL,PostgreSQL, Redshift,Oracle, Matrix,Google Spreadsheetなどなど 3.数クリックで簡単にデータを共有できちゃう。 コアライセンスなら 4.簡単に管理画面に組み込めてしまう! 5.ユーザー数が増えれば増えるほどお得に!
19.
サイバーエージェントでの Google Cloud Platform の導入
20.
Google Cloud Platformの導入状況 Ameba事業本部、アドテク本部で導入中 cyberagent.co.jp,cyberagent.io,ameba-cloud.comの3つのドメ インが存在する。 ameba-cloud.comの方ではabema.tvやameba
freshなど 新規サービスで利用中。 アドテク本部では動画広告配信システムに利用中。 AWSと比較すると リザーブドインスタンスを購入する必要が無い。 (いっぱい使っていると勝手に割り引かれる。) BigQueryだったり、強力なロードバランサーが使えたり、 リージョンをまたいでも同一ネットワークだったり便利
21.
BigQueryについて サーバーを必要とせず、 簡単にデータを保持できる超高速データベース 現在では配信サーバーのログデータをストリームでインサー トして(月間54TB)配信のアルゴリズムに役立てている。 (後半、神田より実用事例を説明します。) データ量が少ないとか金額も少ないので管理系のCSVをロー ドさせるのにも最適!
22.
Tableauで費用分析 Google Cloud Platformでは1日ごとの費用を CSVにしてGoogle
Cloud Storageにアップできます。 http://ameblo.jp/principia-ca/entry-12104991502.html これをCRONでBigQueryにロード これをTableauで可視化 bq load --skip_leading_rows=1 payment.gcp gs://cia-payment/payment-2016-03-16.csv Account_ID:STRING, Line_Item:STRING,Start_Time:TIMESTAMP,End_Time:TIMESTAMP,Project:STRING,Measurement1:STRING, Measurement1_Total_Consumption:FLOAT,Measurement1_Units:STRING,Credit1:STRING,Credit1_Amount: FLOAT,Credit1_Currency:STRING,Cost:FLOAT,Currency:STRING,Project_Number:STRING,Project_ID:STRING, Project_Name:STRING,Project_Labels:STRING,Description:STRING なんと僅か数分で左のグラフ ができてしまう! Tableauの予測機能で費用予 測まで可能!?
23.
実際のTableau x Google Cloud
Platform の導入事例
24.
自己紹介
25.
Katsunori Kanda 株式会社サイバーエージェント アドテク本部 技術戦略部 技術戦略室 Core Development
Group Senior Software Engineer potix2 @ twitter/github ※毎月LispMeetup(shibuya.lisp)を開催しています 今月は3/30に開催予定。残りわずか。
26.
Tableau × BigQueryの 限界を探ったときの話
27.
Tableau × BigQueryの 導入に際して実施した、 その限界を探るパイロットスタディの 顛末をお話します
28.
広告の前提知識を少しだけ・・・
29.
いつ x 誰が
x どの広告と何処で接触して その結果、どうなったのか? ということに関心があります。 広告システムでは、
30.
例えば、 帰宅中にtwitterをしている会社員は、ゲーム広告を見るとよくクリックする傾向がある。 というような事象がわかれば効率よく広告配信ができる。 みたいな話です。
31.
それをふまえて、
32.
スタディ1
33.
1分区切りで配信状況を可視化
34.
やってみたこと
35.
Tableauのデータソースとして、 BigQueryを追加
36.
これをクリック
39.
1日分のログ1TBに、
40.
Group By hour,
minute
41.
ちょっと重いけど、普通に動いた!
43.
ただ・・・ レポートをちょっと修正すると
45.
思考の妨げ
46.
課金
47.
そこで、
48.
データ抽出
49.
コレをクリック
50.
スタディ1まとめ ● TableauからBigQueryの接続は簡単 ● 快適な操作&コスト低減のためにはデータ抽出が有効 ●
RDB的感覚で無理なクエリーでもBigQueryなら動く
51.
スタディ2
52.
どの広告がいつ配信されているのか を可視化したい
53.
スタディ1のデータソースに 「広告主」のディメンジョンを追加
54.
Group By hour,
minute, advertiser
55.
だいたい数百万行くらい
56.
これでもBigQueryは動く
57.
広告主ごとに色分けをしてみる
59.
Tableauでも表示できた!
60.
もう少し過酷にしてみる
61.
メジャーを追加していくと・・・
63.
突然のレンダリング待ち
64.
スタディ2まとめ ● データソースを変更&色分けだけで得られる情報量は格段 にあがった ● ただ、現実的な時間で描画できるとは限らない ●
ポイントを絞り、不要な情報を削ぎ落とすことで「見やすく」、 「高速な」レポートができる ※最初から情報を削ぎ落としすぎると新たな気づきが得られないことも・・・
65.
ちょっとだけ脱線
66.
スタディ2のクエリーへさらに ディメンジョンを追加する
67.
Group By hour,
minute, advertiser, publisher
68.
数十億から数百億件くらい
69.
これだとBigQueryも、 Tableauも動かなくなる・・・
70.
広告配信は、 組み合わせ最適化問題
71.
配信先が追加されただけで 組み合わせ数が一気に跳ね上がる
72.
ちなみに、今回のスタディを通して ● システムの改善ポイントを見つけ、修正するに至った ● 事業上の取り組むべき課題を見つける事ができた
73.
まとめ ● データは雄弁 ● 速いは正義 ●
常識にとらわれないクエリーから新たな気づきを得る