Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Recruit Lifestyle Co., Ltd.
PDF, PPTX
1,847 views
CET(Capture EveryThing)プロジェクトにおけるﰀ機械学 習・データマイニング最前線
2016/2/4「ソフトウェアジャパン・ビッグデータ活用実務フォーラム」でのプレゼン資料です。
Technology
◦
Read more
4
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 35
2
/ 35
3
/ 35
4
/ 35
5
/ 35
6
/ 35
7
/ 35
8
/ 35
9
/ 35
10
/ 35
11
/ 35
12
/ 35
13
/ 35
14
/ 35
15
/ 35
16
/ 35
17
/ 35
18
/ 35
19
/ 35
20
/ 35
21
/ 35
22
/ 35
23
/ 35
24
/ 35
25
/ 35
26
/ 35
27
/ 35
28
/ 35
29
/ 35
30
/ 35
31
/ 35
32
/ 35
33
/ 35
34
/ 35
35
/ 35
More Related Content
PPTX
CET (Capture EveryThing)プロジェクトにおける機械学習・データマイニング最前線
by
Recruit Lifestyle Co., Ltd.
PPTX
リクルートライフスタイル全サービス横断のリアルタイムログ収集・可視化・分析基盤
by
Recruit Lifestyle Co., Ltd.
PPTX
【Tokyowebmining】open compute project
by
Junichiro Tani
PDF
分析手法のご紹介
by
Recruit Technologies
PDF
「リクルートデータセット」 ~公開までの道のりとこれから~
by
Recruit Technologies
PDF
経営のアジリティを支えるDevOpsと組織
by
Recruit Technologies
PPTX
キャリアコンサルタント向け「企業で求められるITスキルの実態」と実践スキル向上研修
by
Daiyu Hatakeyama
PDF
「リクルートデータセット」 ~公開までの道のりとこれから~
by
Recruit Technologies
CET (Capture EveryThing)プロジェクトにおける機械学習・データマイニング最前線
by
Recruit Lifestyle Co., Ltd.
リクルートライフスタイル全サービス横断のリアルタイムログ収集・可視化・分析基盤
by
Recruit Lifestyle Co., Ltd.
【Tokyowebmining】open compute project
by
Junichiro Tani
分析手法のご紹介
by
Recruit Technologies
「リクルートデータセット」 ~公開までの道のりとこれから~
by
Recruit Technologies
経営のアジリティを支えるDevOpsと組織
by
Recruit Technologies
キャリアコンサルタント向け「企業で求められるITスキルの実態」と実践スキル向上研修
by
Daiyu Hatakeyama
「リクルートデータセット」 ~公開までの道のりとこれから~
by
Recruit Technologies
What's hot
PDF
リクルートにおけるVDI導入 ~働き方変革とセキュリティ向上の両立を目指して~
by
Recruit Technologies
PPTX
佐賀大学 - データ分析と向き合う
by
Daiyu Hatakeyama
PDF
Tableau活用4年の軌跡
by
Recruit Technologies
PDF
ウェアラブルカンファレンスの講演資料 - リクルートテクノロジーズ
by
Recruit Technologies
PPTX
利用事例にみる AI技術活用のポイントと、Microsoft AI最新動向
by
Daiyu Hatakeyama
PDF
Pepper+独自会話エンジン
by
Recruit Technologies
PDF
Hccjp purpose andhistory
by
Masahiko Ebisuda
PPTX
技術としての機械学習を理解し、世の中に役に立つ事を考える基礎知識
by
Daiyu Hatakeyama
PDF
Expectations and reality of hybrid cloud
by
Naoki Yonezu
PDF
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
by
Deep Learning Lab(ディープラーニング・ラボ)
PDF
企業文化をサービスデザインスタイルに
by
Recruit Technologies
PDF
データプロダクト開発を成功に導くには
by
Recruit Lifestyle Co., Ltd.
PDF
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
by
Recruit Lifestyle Co., Ltd.
PPTX
早稲田大学 理工メディアセンター 機械学習とAI セミナー: 機械学習中級編
by
Daiyu Hatakeyama
PDF
マルチクラウドで実演するカスタマーセントリックな分析基盤
by
Recruit Lifestyle Co., Ltd.
PPTX
データ価値を最大化するビジュアル分析とストーリーテリングの重要性
by
Ryusuke Ashiya
PDF
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
by
Hironori Washizaki
PDF
リクルートライフスタイル流!分析基盤との賢い付き合い方
by
Recruit Lifestyle Co., Ltd.
PDF
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
by
Recruit Technologies
PDF
DX推進で成長する企業とそれを支える最新技術(抜粋版)
by
満 近森
リクルートにおけるVDI導入 ~働き方変革とセキュリティ向上の両立を目指して~
by
Recruit Technologies
佐賀大学 - データ分析と向き合う
by
Daiyu Hatakeyama
Tableau活用4年の軌跡
by
Recruit Technologies
ウェアラブルカンファレンスの講演資料 - リクルートテクノロジーズ
by
Recruit Technologies
利用事例にみる AI技術活用のポイントと、Microsoft AI最新動向
by
Daiyu Hatakeyama
Pepper+独自会話エンジン
by
Recruit Technologies
Hccjp purpose andhistory
by
Masahiko Ebisuda
技術としての機械学習を理解し、世の中に役に立つ事を考える基礎知識
by
Daiyu Hatakeyama
Expectations and reality of hybrid cloud
by
Naoki Yonezu
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
by
Deep Learning Lab(ディープラーニング・ラボ)
企業文化をサービスデザインスタイルに
by
Recruit Technologies
データプロダクト開発を成功に導くには
by
Recruit Lifestyle Co., Ltd.
リクルートライフスタイルにおける深層学習の活用とGCPでの実現方法
by
Recruit Lifestyle Co., Ltd.
早稲田大学 理工メディアセンター 機械学習とAI セミナー: 機械学習中級編
by
Daiyu Hatakeyama
マルチクラウドで実演するカスタマーセントリックな分析基盤
by
Recruit Lifestyle Co., Ltd.
データ価値を最大化するビジュアル分析とストーリーテリングの重要性
by
Ryusuke Ashiya
青山幹雄先生を偲んで(開拓、理論、実践、コミュニティ&国際)
by
Hironori Washizaki
リクルートライフスタイル流!分析基盤との賢い付き合い方
by
Recruit Lifestyle Co., Ltd.
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
by
Recruit Technologies
DX推進で成長する企業とそれを支える最新技術(抜粋版)
by
満 近森
Viewers also liked
PDF
ナレッジを共有する文化をつくるために
by
Recruit Lifestyle Co., Ltd.
PDF
20150723AWS startup tech_meetup
by
Recruit Lifestyle Co., Ltd.
PDF
IoTとビッグデータとは
by
Ismail Arai
PDF
交通ビッグデータを用いた圏央道開通の多面的な影響分析
by
Kohei Ota
PPTX
JIRA meets Tableau & AWS
by
Recruit Lifestyle Co., Ltd.
PPTX
リクルートライフスタイルにおけるUX領域の取り組み
by
Recruit Lifestyle Co., Ltd.
PDF
IoT/ビッグデータ/AI連携により次世代ストレージが促進するビジネス変革
by
CLOUDIAN KK
PDF
NIPS2016 Supervised Word Mover's Distance
by
Recruit Lifestyle Co., Ltd.
PDF
自動化を支えるCI/CDツールの私の選択 ~何をするためにCI/CDツールを選ぶか~
by
Recruit Lifestyle Co., Ltd.
PDF
R使いがSparkを使ったら
by
atsushi_hayakawa
PDF
事業成長にコミットするエンジニア組織への道のり
by
Recruit Lifestyle Co., Ltd.
PDF
15歳からはじめる賞コレ〜ICTコンテストで高専生が活躍するワケ〜
by
Ismail Arai
PDF
クラウド、ビッグデーター、IoTの進化を支えるインテルの技術革新
by
softlayerjp
PPTX
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
by
Cloudera Japan
PPTX
仮説とデータ解析の関係
by
Michitaro Okano
PDF
Apache HBase 入門 (第2回)
by
tatsuya6502
PPTX
The Future of Hadoop: A deeper look at Apache Spark
by
Cloudera, Inc.
PDF
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
by
Naoto Tamiya
PDF
Technologies for Data Analytics Platform
by
N Masahiro
PDF
ビッグデータ
by
Shigeru Kishikawa
ナレッジを共有する文化をつくるために
by
Recruit Lifestyle Co., Ltd.
20150723AWS startup tech_meetup
by
Recruit Lifestyle Co., Ltd.
IoTとビッグデータとは
by
Ismail Arai
交通ビッグデータを用いた圏央道開通の多面的な影響分析
by
Kohei Ota
JIRA meets Tableau & AWS
by
Recruit Lifestyle Co., Ltd.
リクルートライフスタイルにおけるUX領域の取り組み
by
Recruit Lifestyle Co., Ltd.
IoT/ビッグデータ/AI連携により次世代ストレージが促進するビジネス変革
by
CLOUDIAN KK
NIPS2016 Supervised Word Mover's Distance
by
Recruit Lifestyle Co., Ltd.
自動化を支えるCI/CDツールの私の選択 ~何をするためにCI/CDツールを選ぶか~
by
Recruit Lifestyle Co., Ltd.
R使いがSparkを使ったら
by
atsushi_hayakawa
事業成長にコミットするエンジニア組織への道のり
by
Recruit Lifestyle Co., Ltd.
15歳からはじめる賞コレ〜ICTコンテストで高専生が活躍するワケ〜
by
Ismail Arai
クラウド、ビッグデーター、IoTの進化を支えるインテルの技術革新
by
softlayerjp
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
by
Cloudera Japan
仮説とデータ解析の関係
by
Michitaro Okano
Apache HBase 入門 (第2回)
by
tatsuya6502
The Future of Hadoop: A deeper look at Apache Spark
by
Cloudera, Inc.
Machine Learning Casual Talks #4 ビッグデータチームを発足するにあたって気をつけておきたいn個のこと
by
Naoto Tamiya
Technologies for Data Analytics Platform
by
N Masahiro
ビッグデータ
by
Shigeru Kishikawa
Similar to CET(Capture EveryThing)プロジェクトにおけるﰀ機械学 習・データマイニング最前線
PDF
マーケティング・戦略・組織視点のBIGDATA活用について
by
Recruit Technologies
PDF
skillstock slide for CANPAN NPO Forum
by
skillstock project
PDF
n次請けSIerでもできること
by
陽一 滝川
PDF
リクルート式ビッグデータ活用術
by
Recruit Technologies
PDF
ATLにおけるBigDataへの取り組み
by
Recruit Technologies
PDF
求職サービスの検索ログを用いたクエリのカテゴリ推定とその活用事例の紹介
by
Recruit Technologies
PDF
Goodforjob_概要資料
by
HIROMUSHIOZAKI
PDF
NGY Goodfind Seminar 2011-12-10
by
YUTAKA ITO
PDF
株式会社リスキル 会社説明資料
by
ReskillCorp
PDF
Gaiaxセミナー資料20111216
by
ITmedia_HR(人事・採用)
PDF
Gaiaxセミナー20111216「採用現場が考えるソーシャル」
by
URANO HEIYA
PDF
ディープラーニング開発組織のつくり方と運営ノウハウ_DLLAB Case Study Day
by
Deep Learning Lab(ディープラーニング・ラボ)
PDF
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
by
Recruit Technologies
PPTX
「R」による従業員満足度調査(ES)事例
by
良治 富田
PDF
人的資本を“中から育てる” ──りろーかるの取り組み紹介(2025.06).pdf
by
kentoteraki
PDF
2009年すみだ工業振興マスタープラン シンポジウム
by
Masaki Muranaka
PDF
20130423 #devlove 職場を劇的にさせる四十八手 —「n次請けSIerでも出来ること」のその続き—
by
陽一 滝川
PPTX
厳選採用を成功させる新卒採用の要諦
by
Tomohiro KIMURA
PPTX
Struggle against crossdomain data complexity in Recruit Group
by
DataWorks Summit/Hadoop Summit
PDF
データから価値を生み続けるには
by
Recruit Lifestyle Co., Ltd.
マーケティング・戦略・組織視点のBIGDATA活用について
by
Recruit Technologies
skillstock slide for CANPAN NPO Forum
by
skillstock project
n次請けSIerでもできること
by
陽一 滝川
リクルート式ビッグデータ活用術
by
Recruit Technologies
ATLにおけるBigDataへの取り組み
by
Recruit Technologies
求職サービスの検索ログを用いたクエリのカテゴリ推定とその活用事例の紹介
by
Recruit Technologies
Goodforjob_概要資料
by
HIROMUSHIOZAKI
NGY Goodfind Seminar 2011-12-10
by
YUTAKA ITO
株式会社リスキル 会社説明資料
by
ReskillCorp
Gaiaxセミナー資料20111216
by
ITmedia_HR(人事・採用)
Gaiaxセミナー20111216「採用現場が考えるソーシャル」
by
URANO HEIYA
ディープラーニング開発組織のつくり方と運営ノウハウ_DLLAB Case Study Day
by
Deep Learning Lab(ディープラーニング・ラボ)
Struggling with BIGDATA -リクルートおけるデータサイエンス/エンジニアリング-
by
Recruit Technologies
「R」による従業員満足度調査(ES)事例
by
良治 富田
人的資本を“中から育てる” ──りろーかるの取り組み紹介(2025.06).pdf
by
kentoteraki
2009年すみだ工業振興マスタープラン シンポジウム
by
Masaki Muranaka
20130423 #devlove 職場を劇的にさせる四十八手 —「n次請けSIerでも出来ること」のその続き—
by
陽一 滝川
厳選採用を成功させる新卒採用の要諦
by
Tomohiro KIMURA
Struggle against crossdomain data complexity in Recruit Group
by
DataWorks Summit/Hadoop Summit
データから価値を生み続けるには
by
Recruit Lifestyle Co., Ltd.
More from Recruit Lifestyle Co., Ltd.
PDF
業務と消費者の体験を同時にデザインするリクルートの価値検証のリアル ー 「Airレジ ハンディ」セルフオーダーのブレない「価値」の確かめ方 ー
by
Recruit Lifestyle Co., Ltd.
PPTX
分散トレーシングAWS:X-Rayとの上手い付き合い方
by
Recruit Lifestyle Co., Ltd.
PDF
OOUIを実践してわかった、9つの大切なこと
by
Recruit Lifestyle Co., Ltd.
PDF
Flutter移行の苦労と、乗り越えた先に得られたもの
by
Recruit Lifestyle Co., Ltd.
PDF
CTIサービスを支える裏側 〜物理デバイスとの戦い〜 | iOSDC Japan 2020
by
Recruit Lifestyle Co., Ltd.
PDF
「進化し続けるインフラ」のためのマルチアカウント管理
by
Recruit Lifestyle Co., Ltd.
PDF
Air事業のデザイン組織とデザイナー
by
Recruit Lifestyle Co., Ltd.
PDF
リクルートライフスタイル AirシリーズでのUXリサーチ
by
Recruit Lifestyle Co., Ltd.
PDF
ホットペッパービューティーにおけるモバイルアプリ向けAPIのBFF/Backend分割
by
Recruit Lifestyle Co., Ltd.
PPTX
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
by
Recruit Lifestyle Co., Ltd.
PDF
Real-time personalized recommendation using embedding
by
Recruit Lifestyle Co., Ltd.
PDF
Jupyter だけで機械学習を実サービス展開できる基盤
by
Recruit Lifestyle Co., Ltd.
PDF
SQLを書くだけでAPIが作れる基盤
by
Recruit Lifestyle Co., Ltd.
PDF
BtoBサービスならではの顧客目線の取り入れ方
by
Recruit Lifestyle Co., Ltd.
PDF
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
by
Recruit Lifestyle Co., Ltd.
PDF
ビックデータ分析基盤の成⻑の軌跡
by
Recruit Lifestyle Co., Ltd.
PDF
Refactoring point of Kotlin application
by
Recruit Lifestyle Co., Ltd.
PDF
データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて
by
Recruit Lifestyle Co., Ltd.
PDF
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
by
Recruit Lifestyle Co., Ltd.
PDF
既存Redshift/ETLからSpectrum/Glueへの移行を徹底解明!
by
Recruit Lifestyle Co., Ltd.
業務と消費者の体験を同時にデザインするリクルートの価値検証のリアル ー 「Airレジ ハンディ」セルフオーダーのブレない「価値」の確かめ方 ー
by
Recruit Lifestyle Co., Ltd.
分散トレーシングAWS:X-Rayとの上手い付き合い方
by
Recruit Lifestyle Co., Ltd.
OOUIを実践してわかった、9つの大切なこと
by
Recruit Lifestyle Co., Ltd.
Flutter移行の苦労と、乗り越えた先に得られたもの
by
Recruit Lifestyle Co., Ltd.
CTIサービスを支える裏側 〜物理デバイスとの戦い〜 | iOSDC Japan 2020
by
Recruit Lifestyle Co., Ltd.
「進化し続けるインフラ」のためのマルチアカウント管理
by
Recruit Lifestyle Co., Ltd.
Air事業のデザイン組織とデザイナー
by
Recruit Lifestyle Co., Ltd.
リクルートライフスタイル AirシリーズでのUXリサーチ
by
Recruit Lifestyle Co., Ltd.
ホットペッパービューティーにおけるモバイルアプリ向けAPIのBFF/Backend分割
by
Recruit Lifestyle Co., Ltd.
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
by
Recruit Lifestyle Co., Ltd.
Real-time personalized recommendation using embedding
by
Recruit Lifestyle Co., Ltd.
Jupyter だけで機械学習を実サービス展開できる基盤
by
Recruit Lifestyle Co., Ltd.
SQLを書くだけでAPIが作れる基盤
by
Recruit Lifestyle Co., Ltd.
BtoBサービスならではの顧客目線の取り入れ方
by
Recruit Lifestyle Co., Ltd.
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
by
Recruit Lifestyle Co., Ltd.
ビックデータ分析基盤の成⻑の軌跡
by
Recruit Lifestyle Co., Ltd.
Refactoring point of Kotlin application
by
Recruit Lifestyle Co., Ltd.
データサイエンティストとエンジニア 両者が幸せになれる機械学習基盤を求めて
by
Recruit Lifestyle Co., Ltd.
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
by
Recruit Lifestyle Co., Ltd.
既存Redshift/ETLからSpectrum/Glueへの移行を徹底解明!
by
Recruit Lifestyle Co., Ltd.
CET(Capture EveryThing)プロジェクトにおけるﰀ機械学 習・データマイニング最前線
1.
⼀一般社団法⼈人 情報処理理学会 SOFTWARE JAPAN
2016 ビッグデータ活⽤用実務フォーラム CET(Capture EveryThing)プロジェクトにおける 機械学習・データマイニング最前線 ⾼高柳柳慎⼀一 株式会社リクルートコミュニケーションズ ICTソリューション局アドテクノロジーサービス開発部 兼 株式会社リクルートライフスタイル ネットビジネス本部ディベロップメントデザインユニット アーキテクト2 兼 リーン開発グループ
2.
2 ⾃自⼰己&会社紹介
3.
⾃自⼰己紹介 • ⾼高柳柳慎⼀一 • 専⾨門:物理理学,
統計科学 • 経歴: – 2006: 北北海道⼤大学⼤大学院理理学研究科物理理学先⾏行行修⼠士卒 – 2006-‐‑‒2008: 某材料料系財団法⼈人 • 半導体試料料画像・測定装置スペクトルの解析ソフト開発 – 2008-‐‑‒2015: 某⾦金金融技術開発会社 • (俗にいう)クオンツ業務 – 2013:総合研究⼤大学院⼤大学複合科学研究科統計科学専攻博⼠士課程 – 2015:株式会社リクルートコミュニケーションズ・リクルートラ イフスタイル • サービス開発・データ分析/機械学習 3
4.
【会社説明】リクルートの提供価値=ビジネスモデル <提供価値> ⼈人⽣生や⽣生活の中で意思決定において その⼈人が必要とする情報を提供 クライアント ユーザー <提供価値> ユーザとの出会いの機会や 最終的なマッチングを創出
5.
【会社説明】リクルートグループ内での⽴立立ち位置 5 ㈱リクルート ホールディングス ㈱リクルートキャリア ㈱リクルートジョブズ ㈱リクルートスタッフィング ㈱スタッフサービス・ホールディングス ㈱リクルートライフスタイル ㈱リクルートマーケティングパートナーズ ㈱リクルート住まいカンパニー ㈱リクルートアドミニストレーション ㈱リクルートテクノロジーズ ㈱リクルートコミュニケーションズ 主な事業会社 機能会社 制作・設計・宣伝・流流通・CS WEBサービス開発機能 社員募集領領域 AP⼈人材募集領領域 派遣⼈人材募集領領域 本社機能 R&D(事業開発) グローバル 住宅宅領領域 派遣⼈人材募集領領域 ⽇日常消費領領域 結婚・進学・⾃自動⾞車車等領領域 アドミニストレーション機能 IT/基幹システム開発 2012年年10⽉月1⽇日 リクルートグループの主要10社
6.
リクルートコミュニケーションズの概要 6 • リクルートコミュニケーションズ – リクルートグループの機能会社 –
制作、流流通・宣伝、カスタマーサポート – デジタルマーケティング等の統括的な⽀支援 リクルートコミュニケーションズ メディア 制作 流流通・宣伝 カスタマー サポート サポート デジタル マーケティ ング
7.
6 リクルートライフスタイルのサービス概要
8.
8 CETプロジェクトについて
9.
• リクルートライフスタイルの全サービス横 断で、リアルタイムにデータ(システムロ グ、ユーザの⾏行行動、在庫変動など)を収 集・分析するための基盤 • リアルタイムデータ分析に必要な処理理(収 集、加⼯工、集計、分析、可視化)を⼀一気通 貫で実施 •
少数精鋭なビジネス系メンバ、データサイ エンティスト、エンジニアでプロジェクト を推進 CETの概要・特徴 9�
10.
• サービス・ビジネスに関するあらゆる情報 の変化(ユーザの⾏行行動、在庫量量の変動な ど)を、我々サービス提供者がリアルタイ ムに把握できていない • その結果、状況に応じて最適な施策を講じ ることができておらず、機会損失が発⽣生し ている CETが解決する課題 10� •
リアルタイムなデータに対する適切切な処理理 を実施することで課題を解決
11.
CETのログ収集システム構成 11� CET – Capture
EveryThingサービス サービス 運⽤用者 機械学習 エンジニア データ 分析者 が 活⽤用 ELB Elasticsearch,Kibana BigQuery S3 APIELB Cloud Bigtable *GCP関連製品は技術検証中 Cloud Pub/Sub Cloud Dataproc,Apache Spark 計算結果を格納
12.
• コールセンタでリアルタイムにログをモニタ リング • アプリケーションのスローダウンやユーザ操 作の⼾戸惑いなど、ユーザビリティに関する情 報を迅速に検知し、顧客サポート品質向上に 努める リアルタイムデータ可視化事例例
– Airレジ 12�
13.
• Spark Streamingを使⽤用してウインドウ集計を 実施 •
定期的に直近のユーザ⾏行行動ログを集計し、宿 ページごとのUU数をリアルタイムに算出 ストリームデータ処理理事例例1 – じゃらん 13�
14.
• Spark Streamingを使⽤用してログを定期的に集計 •
処理理時間が特定のしきい値を超えるログの件数を URLごとに集計し、結果をサービス運⽤用者へ通知 ストリームデータ処理理事例例2 – サービス共通 CET – Capture EveryThingサービス サービス 運⽤用者 ELB Cloud Pub/Sub Cloud Dataproc Apache Spark 14� Amazon SNS AWS Lambda メール Slack
15.
ストリームデータ処理理事例例3 – 直近閲覧状況の可視化 15
16.
16 CETにおける機械学習/データマイニング
17.
17 SQL / DB技術 コーディングスキル 機械学習 統計学 エンジニア兼データ分析者の使う道具・学問
18.
CETプロジェクト全体像(順次GCPに移⾏行行中) 18 出典:「AWSからGCPに切り替えたらコストが1/10になった」CETエンジニア 吉田啓二氏インタビュー http://engineer.recruit-lifestyle.co.jp/techblog/2015-11-27-yoshida-interview-2/
19.
CETのデータ分析環境(AET) 19 AWS S3 Elastic Search TreasureData RedShift Spark
Notebook Docker ※⼀一部試験環境⽤用 AWS S3 Cloud Bigtable RUNDECK ※サーバ・バッチ起動管理理 Adhoc分析⽤用サーバ(EC2) Spark⽤用サーバ(EMR) Compute Engine ⾃自動 ロード バッチサーバ
20.
機械学習/データマイニングの流流れ • データの取得 – COLDデータ:
数億件のレコードをRedShift, TreasureDataで捌いて特徴量量抽出/⽣生成 – HOTデータ: CETのElastic Searchから取得 • 機械学習/データマイニングの実⾏行行 – 1,000万件程度度のレコードに対して実施 • 分析環境(AWS) – 基本的にはr3.2xlargeを複数⼈人で使⽤用 – 計算パワーが⾜足りないときは💰で殴る (インスタンスのグレードを上げる) • サービスへの展開 – BigTableに格納し、結果をAPI化 • バッチ処理理はRundeckで⼀一元管理理 • バッチサーバー構築はAnsible(絶賛作業中) 20
21.
Rundeckによるバッチ⼀一元管理理 21
22.
社内⽤用パッケージの開発 • DB接続・IDマスキング・AUC計算などの よくやる処理理をパッケージとして共通化 22
23.
顧客のクラスタリング • 時系列列データのクラスタリングを実施 • あるクラスタに属するユーザに対して、 サービス改善の施策を提案 23※クラスタリング結果(同⼀一クラスタに属するもの)
24.
XXしそうなユーザの判定 • ユーザの⾏行行動に応じて、画⾯面選択の省省略略やデフォ ルト値の変更更を⾏行行う • 多値クラス分類問題を解いて、デフォルトの選択 肢を⽤用意する 24
25.
⼈人気上昇ランキング • じゃらんの全宿の”予約速度度”を計算し、ス コアリング。⼈人気度度に応じた⽂文⾔言を表⽰示 25
26.
• 在庫変動データに基づいた、在庫売り切切れ予測 • 予約が急激⼊入り始める時点の予測 •
多腕バンディットアルゴリズムを活⽤用した配信 • ディスプレイ広告配信の最適化 • リアルタイム異異常検知 今後対応を検討していること 26�
27.
27 機械学習/データマイニングエンジニアの スキル向上の施策
28.
⼿手を動かしながら学ぶ機械学習 28 ⼿手を動かしながら学ぶ機械学習 クラスタリング・回帰・⾃自然⾔言語処理理までを⼿手を動かしながら 順にお勉強するという企画
29.
機械学習⼤大会 29 機械学習⼤大会 某機械学習サイトにインスパイアされたサイト(Play frameworkで内製)。 予測結果をアップロードすると結果の計算&順位付けを⾏行行う (※この⼤大会は、ほぼ皆某Deepでやってました…)
30.
論論⽂文輪輪読会 30 論論⽂文輪輪読会 テーマは⾃自由&論論⽂文の時期も⾃自由、ただし「発表者本⼈人が これから勉強したいこと」が条件
31.
論論⽂文輪輪読会 31
32.
32 補⾜足
33.
• SparkRをEC2上で動かして分散処理理して みる |
Tech Blog | リクルートライフスタ イル RECRUIT LIFESTYLE http://engineer.recruit-‐‑‒lifestyle.co.jp/ techblog/2015-‐‑‒08-‐‑‒19-‐‑‒sparkr/ • 第4回 [データ分析編]“制約なし”で⼤大 規模データ分析基盤を構築:リクルートラ イフスタイルの技術⼒力力を追え!|gihyo.jp … 技術評論論社 http://gihyo.jp/dev/serial/01/recruit-‐‑‒ lifestyle/0004 (補⾜足)関連資料料 1/3 33�
34.
• リクルートライフスタイル全サービス横断 のリアルタイムログ収集・可視化・分析基 盤@JAWS-‐‑‒UG Meguro
#2 http://www.slideshare.net/ RecruitLifestyle/ss-‐‑‒53400381 • 「ビッグデータは“リアルタイム”でこそ価 値がある」CETエンジニア 吉⽥田啓⼆二⽒氏イ ンタビュー | Tech Blog | リクルートライ フスタイル RECRUIT LIFESTYLE http://engineer.recruit-‐‑‒lifestyle.co.jp/ techblog/2015-‐‑‒11-‐‑‒02-‐‑‒yoshida-‐‑‒ interview-‐‑‒1/ (補⾜足)関連資料料 2/3 34�
35.
• 「AWSからGCPに切切り替えたらコストが 1/10になった」CETエンジニア 吉⽥田啓⼆二 ⽒氏インタビュー http://engineer.recruit-‐‑‒lifestyle.co.jp/ techblog/2015-‐‑‒11-‐‑‒27-‐‑‒yoshida-‐‑‒ interview-‐‑‒2/ (補⾜足)関連資料料
3/3 35�
Download