SlideShare a Scribd company logo
Next Generation
Apache Cassandra
データ&サイエンスソリューション統括本部
データプラットフォーム本部開発3部KVS
星井祥吾
今日のアジェンダ
• 自己紹介
• Cassandra利用状況
• Cassandra利用事例
• NGCCとは?
• NGCC発表内容
• NGCC重要トピック
• 最後に
2
今日のアジェンダ
• 自己紹介
• Cassandra利用状況
• Cassandra利用事例
• NGCCとは?
• NGCC発表内容
• NGCC重要トピック
• 最後に
3
• Cassandraオペレータ
– 広告部署から全社KVSチームに異動 -> サービス側にKVSプラット
フォームを提供、運用
• Cassandra自動デプロイシステムの刷新を担当
– Chef
– Jenkins
• Cassandraコントリビュータ
– https://github.com/shoshii
• Video gamer
– PSN ID: kobuchizawa0102
自己紹介
4
今日のアジェンダ
• 自己紹介
• Cassandra利用状況
• Cassandra利用事例
• NGCCとは?
• NGCC発表内容
• NGCC重要トピック
• 最後に
5
提供サービス
Media
US
Search Video Answer Mail
JP
US
JP
Membership C2C Payment C2C EC B2C EC Local
Search Knowledge search MailNews
YAHUOKU!Premium Wallet Loco
利用データベース
7
300
Systems
Yahoo! JAPAN
Cassandra利用シ
ステムは約100
Cassandraクラスタ状況
8
50
clusters
30TB
usages
1000
nodes
300,000
read/sec
100,000
write/sec
2016
10
nodes
160
nodes
…
1
Common
clusters
50
Special
clusters
50
systems
50
systems
3
DCs
今日のアジェンダ
• 自己紹介
• Cassandra利用状況
• Cassandra利用事例
• NGCCとは?
• NGCC発表内容
• NGCC重要トピック
• 最後に
9
利用事例 #1 : パーソナルデータ
• 月間3000万のアクティブユーザーID属性
• 弊社プライバシーポリシー[1]に基づき、各サービスに応じて
様々な属性を格納
10
個人属性
[1] Yahoo! JAPAN利用規約 第2章 プライバシーポリシー
エンドユーザの趣味嗜好
アプリ通知メッセージ
利用事例 #2 : 行動履歴
• 弊社プライバシーポリシー[1]に基づき、各サービスの履歴
データを格納
11
[1] Yahoo! JAPAN利用規約 第2章 プライバシーポリシー
行動履歴
広告クリック履歴・CV履歴
リアルタイム検索ツイート閲覧ログ
利用事例 #3 : コンテンツキャッシュ
• RDBのコンテンツ情報や、集計情報などを格納し、各サービ
スのスケールアウトに活用
12
メタデータ
集計情報
電子書籍:商品ID、レコメ情報
ニュース:テーマID、記事ID、記事内容
今日のアジェンダ
• 自己紹介
• Cassandra利用状況
• Cassandra利用事例
• NGCCとは?
• NGCC発表内容
• NGCC重要トピック
• 最後に
13
Next Generation Cassandra Conference
• Cassandraトップコントリビュータが集まる国際会議
• ほぼDataStax社の主要メンバで構成されるが、最近は
外部メンバの取り込みに積極的
• 各自が議題を持ち寄って議論する
– 専任のファシリテータがいないので、待ちの姿勢だと議論に参
加できないことも
• 今年で3年目、3回目の開催
• youtube公開動画:資料末尾の付録参照
14
弊社注目ポイント
• (弊社発表分)コネクション過多時の問題の解決
• 巨大パーティション対応
15
今日のアジェンダ
• 自己紹介
• Cassandra利用状況
• Cassandra利用事例
• NGCCとは?
• NGCC発表内容
• NGCC重要トピック
• 最後に
16
How to manage 30,000+
connections
17
What’s the problem?
18
Cassandra process goes down when too many clients
connect it
19
Client machine
Apache child process
Client machine
Client machine
• 200 client machines
Cassandra process goes down when too many clients
connect it
20
• 200 client machines * 128 apache child
processes
Cassandra process goes down when too many clients
connect it
21
• 200 client machines * 128 apache child
processes * 2 (request + heart beat) =
Cassandra process goes down when too many clients
connect it
22
• 200 client machines * 128 apache child
processes * 2 (request + heart beat) =
51,200 connections / node
Cassandra process goes down when too many clients
connect it
23
Cassandra process goes down when too many clients
connect it
24
Client machine
Apache child process
51,200 > 32,768 ( max open file num )
Client machine
Client machine
写真:アフロ
Cassandra process goes down when too many clients
connect it
25
Process down
写真:アフロ
Cassandra process goes down when too many clients
connect it
26
Process down
写真:アフロ
Our solution
27
Cassandra Proxy
28
写真:アフロ
Our solution ~ Cassandra Proxy
29
Client machine
Apache child process
Cassandra Proxy
Client machine
Client machine
写真:アフロ
• 200 client machines
Our solution ~ Cassandra Proxy
30
• 200 client machines * 128 apache child
processes
Our solution ~ Cassandra Proxy
31
• 200 client machines * 128 apache child
processes 1 proxy
Our solution ~ Cassandra Proxy
32写真:アフロ
• 200 client machines * 128 apache child
processes 1 proxy * 2 (request + heart beat)
=
Our solution ~ Cassandra Proxy
33
写真:アフロ
• 200 client machines * 128 apache child
processes 1 proxy * 2 (request + heart beat)
= 400 connections / node
Our solution ~ Cassandra Proxy
34
写真:アフロ
• 51,200 -> 400 connections / node
Our solution ~ Cassandra Proxy
35
写真:アフロ
Consequences
36
• Stress test
– 1 msec / request (95%)
– 1 Cassandra Proxy can send 300 requests/sec
to C*
Consequences
37
写真:アフロ
• Production
– 370 client machines – 33 Cassandra nodes
– 3,000 read requests / sec (cluster)
• To be 100,000 read requests / sec
– Advertisement platform
– Available on datastax cpp driver
Consequences
38
• In the future?
– Cassandra Proxy could become one of the
functions of datastax cpp driver?
Consequences
39
今日のアジェンダ
• 自己紹介
• Cassandra利用状況
• Cassandra利用事例
• NGCCとは?
• NGCC発表内容
• NGCC重要トピック
• 最後に
40
Large partition in Cassandra
41
remark
• This is a summary of following tickets:
– https://issues.apache.org/jira/browse/CASSANDRA-11206
– https://issues.apache.org/jira/browse/CASSANDRA-9738
Agenda
• Recap the read path
• What’s the problem?
• Solutions
High level: read path
Row Cache
Key Cache
SSTables Mem Table
1. Check row cache before going to key cache
2. Check the key cache to get the
offsets to data
3. Find the offsets to data and retrieve data
4. Merge data from sstables and memtable
5. Populate row cache with new row returned
http://docs.datastax.com/en/cassandra/3.x/cassandra/dml/dmlAboutReads.html
Pattern 1. The row is in row cache
Partition
Summary
Disk
Mem Table
Compression
Offsets
Bloom Filter
Row Cache
Heap Off Heap
Key Cache
Partition
Index
Data
1. read request
2. return row when that is in row cache
Pattern 2. The key is in key cache
Partition
Summary
Disk
Mem Table
Compression
Offsets
Bloom Filter
Row Cache
Heap Off Heap
Key Cache
Partition
Index
Data
1. read request
2. Check bloom filters 3. Check the partition key is in key cache
4. Find the offset to the result set
5. Access the result set
Pattern 3. The key is not cached
Partition
Summary
Disk
Mem Table
Compression
Offsets
Bloom Filter
Row Cache
Heap Off Heap
Key Cache
Partition
Index
Data
1. read request
2. Miss -> Check bloom filters
3. Check the partition key is in key cache
4. Miss -> Bsearch the close location of index
5. Disk scan to find the offsets 6. Find the offset into the result set
7. Access the result set
8. Update key cache
What’s the problem?
• GC pressure by key cache when a large partition is read
Partition Index Recap
• http://distributeddatastore.blogspot.jp/2013/08/cassandra-sstable-storage-format.html
RowIndexEntry
• Partition size < 64 kb
– RowIndexEntry
• Position
• Seriarized size of data
• Partition size > 64 kb
– IndexedEntry
• Position
• Seriarized size of data
• IndexInfo[]
– Seriarize method
– Offset
– width
– Etc.
Approximation on 16 byte value
1mb : 3kb / > 200 objects
4mb : 11kb / > 800 objects
64mb : 180kb / > 13k objects
512mb : 1.4mb / > 106k objects
3. The key is not cached
Partition
Summary
Disk
Mem Table
Compression
Offsets
Bloom Filter
Row Cache
Heap Off Heap
Key Cache
Partition
Index
Data
1. read request
2. Miss -> Check bloom filters
3. Check the partition key is in key cache
4. Miss -> Bsearch the close location of index
5. Disk scan to find the offsets 6. Find the offsets into the result set
7. Access the result set
8. Update key cache
9. GC, GC, GC…
Current solution
• If partition size <
column_index_cache_size_in_kb(configurable)
– IndexedEntry is kept on heap
• Otherwise
– Always read from disk when needed
• https://issues.apache.org/jira/browse/CASSANDRA-11206
• https://www.youtube.com/watch?v=qa84vABqftM
Other possible solutions
• IndexInfo never be kept on heap
– Read from disk when needed
– degrades performance when small partition is read
Other possible solutions
• Migrate key cache to be fully off heap
– https://issues.apache.org/jira/browse/CASSANDRA-9738
– Serialization & deserialization cost so much when large partition is
read
• Will Birch help us to solve this problem?
– https://issues.apache.org/jira/browse/CASSANDRA-9754
What we go for
• 来年もNGCCに呼んでもらえるように頑張ろう!
そのためには?: Cassandraコミュニティに貢献する
1. 日本で一番Apache Cassandraを使っている会社になる。
2. Cassandraのコード改善や問題提起の活動を継続する。
3. Cassandraコミュニティの人と仲良くなる。
55
DAY3 ?
• 3日目(おまけ)
56
今日のアジェンダ
• 自己紹介
• Cassandra利用状況
• Cassandra利用事例
• NGCCとは?
• NGCC発表内容
• NGCC重要トピック
• 最後に
57
最後に
58
D I S T R I B U T E D
大規模分散処理
H A R D W A R E
ハードウエア分野
N E T W O R K
ネットワーク分野
mailto:kvs-pj-recruit@mail.yahoo.co.jp
ご清聴ありがとうございました
59
付録:NGCC動画集
• Next-Gen Schema
– https://www.youtube.com/watch?v=eAWRj0kqpvU
• Change Data Capture
– https://www.youtube.com/watch?v=Y0fOxa3tC98
• Explicit support for time series data
– https://www.youtube.com/watch?v=CmsQNNdDuSA
• Automated Repair
– https://www.youtube.com/watch?v=8sGUn6Q2bUU
• Storage format and key cache changes to support large partitions
– https://www.youtube.com/watch?v=qa84vABqftM
• SASI update
– https://www.youtube.com/watch?v=yUFoSAg6rA4
• Instagram’s use cases
– https://www.youtube.com/watch?v=VwhovoqavT4
• Lightning Talks
– https://www.youtube.com/watch?v=6y5UV4OTawg
60

More Related Content

What's hot (20)

The rethinkingofrepair
The rethinkingofrepairThe rethinkingofrepair
The rethinkingofrepair
Kazutaka Tomita
 
Cassandraバージョンアップ&移設
Cassandraバージョンアップ&移設Cassandraバージョンアップ&移設
Cassandraバージョンアップ&移設
Takehiro Torigaki
 
Cassandra Meetup Tokyo, 2016 Spring
Cassandra Meetup Tokyo, 2016 SpringCassandra Meetup Tokyo, 2016 Spring
Cassandra Meetup Tokyo, 2016 Spring
datastaxjp
 
Cassandraとh baseの比較して入門するno sql
Cassandraとh baseの比較して入門するno sqlCassandraとh baseの比較して入門するno sql
Cassandraとh baseの比較して入門するno sql
Yutuki r
 
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
terurou
 
Cassandra Summit Tokyo 2015 - intra-mart
Cassandra Summit Tokyo 2015 - intra-martCassandra Summit Tokyo 2015 - intra-mart
Cassandra Summit Tokyo 2015 - intra-mart
Akihiro Sei
 
cassandra 100 node cluster admin operation
cassandra 100 node cluster admin operationcassandra 100 node cluster admin operation
cassandra 100 node cluster admin operation
oranie Narut
 
RDB開発者のためのApache Cassandra データモデリング入門
RDB開発者のためのApache Cassandra データモデリング入門RDB開発者のためのApache Cassandra データモデリング入門
RDB開発者のためのApache Cassandra データモデリング入門
Yuki Morishita
 
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best Practiceマルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
Hadoop / Spark Conference Japan
 
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSSYahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
Yahoo!デベロッパーネットワーク
 
HDFS Supportaiblity Improvements
HDFS Supportaiblity ImprovementsHDFS Supportaiblity Improvements
HDFS Supportaiblity Improvements
Cloudera Japan
 
Cassandraのバックアップと運用を考える
Cassandraのバックアップと運用を考えるCassandraのバックアップと運用を考える
Cassandraのバックアップと運用を考える
Kazutaka Tomita
 
Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Evolution of Impala #hcj2014
Evolution of Impala #hcj2014
Cloudera Japan
 
Apache Cassandra最新情報まとめ
Apache Cassandra最新情報まとめApache Cassandra最新情報まとめ
Apache Cassandra最新情報まとめ
Yuki Morishita
 
刊行記念セミナー「HBase徹底入門」
刊行記念セミナー「HBase徹底入門」刊行記念セミナー「HBase徹底入門」
刊行記念セミナー「HBase徹底入門」
cyberagent
 
Devsumi2013【15-e-5】NoSQLの野心的な使い方 ~Apache Cassandra編~
Devsumi2013【15-e-5】NoSQLの野心的な使い方 ~Apache Cassandra編~Devsumi2013【15-e-5】NoSQLの野心的な使い方 ~Apache Cassandra編~
Devsumi2013【15-e-5】NoSQLの野心的な使い方 ~Apache Cassandra編~
kishimotosc
 
サンプルで学ぶCassandraアプリケーションの作り方
サンプルで学ぶCassandraアプリケーションの作り方サンプルで学ぶCassandraアプリケーションの作り方
サンプルで学ぶCassandraアプリケーションの作り方
Yuki Morishita
 
Cassandraのトランザクションサポート化 & web2pyによるcms用プラグイン開発
Cassandraのトランザクションサポート化 & web2pyによるcms用プラグイン開発Cassandraのトランザクションサポート化 & web2pyによるcms用プラグイン開発
Cassandraのトランザクションサポート化 & web2pyによるcms用プラグイン開発
kishimotosc
 
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakaltKuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakalt
Toshihiro Suzuki
 
Cassandraバージョンアップ&移設
Cassandraバージョンアップ&移設Cassandraバージョンアップ&移設
Cassandraバージョンアップ&移設
Takehiro Torigaki
 
Cassandra Meetup Tokyo, 2016 Spring
Cassandra Meetup Tokyo, 2016 SpringCassandra Meetup Tokyo, 2016 Spring
Cassandra Meetup Tokyo, 2016 Spring
datastaxjp
 
Cassandraとh baseの比較して入門するno sql
Cassandraとh baseの比較して入門するno sqlCassandraとh baseの比較して入門するno sql
Cassandraとh baseの比較して入門するno sql
Yutuki r
 
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
スマートフォン×Cassandraによるハイパフォーマンス基盤の構築事例
terurou
 
Cassandra Summit Tokyo 2015 - intra-mart
Cassandra Summit Tokyo 2015 - intra-martCassandra Summit Tokyo 2015 - intra-mart
Cassandra Summit Tokyo 2015 - intra-mart
Akihiro Sei
 
cassandra 100 node cluster admin operation
cassandra 100 node cluster admin operationcassandra 100 node cluster admin operation
cassandra 100 node cluster admin operation
oranie Narut
 
RDB開発者のためのApache Cassandra データモデリング入門
RDB開発者のためのApache Cassandra データモデリング入門RDB開発者のためのApache Cassandra データモデリング入門
RDB開発者のためのApache Cassandra データモデリング入門
Yuki Morishita
 
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best Practiceマルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
Hadoop / Spark Conference Japan
 
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSSYahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
Yahoo! JAPANのプライベートRDBクラウドとマルチライター型 MySQL #dbts2017 #dbtsOSS
Yahoo!デベロッパーネットワーク
 
HDFS Supportaiblity Improvements
HDFS Supportaiblity ImprovementsHDFS Supportaiblity Improvements
HDFS Supportaiblity Improvements
Cloudera Japan
 
Cassandraのバックアップと運用を考える
Cassandraのバックアップと運用を考えるCassandraのバックアップと運用を考える
Cassandraのバックアップと運用を考える
Kazutaka Tomita
 
Evolution of Impala #hcj2014
Evolution of Impala #hcj2014Evolution of Impala #hcj2014
Evolution of Impala #hcj2014
Cloudera Japan
 
Apache Cassandra最新情報まとめ
Apache Cassandra最新情報まとめApache Cassandra最新情報まとめ
Apache Cassandra最新情報まとめ
Yuki Morishita
 
刊行記念セミナー「HBase徹底入門」
刊行記念セミナー「HBase徹底入門」刊行記念セミナー「HBase徹底入門」
刊行記念セミナー「HBase徹底入門」
cyberagent
 
Devsumi2013【15-e-5】NoSQLの野心的な使い方 ~Apache Cassandra編~
Devsumi2013【15-e-5】NoSQLの野心的な使い方 ~Apache Cassandra編~Devsumi2013【15-e-5】NoSQLの野心的な使い方 ~Apache Cassandra編~
Devsumi2013【15-e-5】NoSQLの野心的な使い方 ~Apache Cassandra編~
kishimotosc
 
サンプルで学ぶCassandraアプリケーションの作り方
サンプルで学ぶCassandraアプリケーションの作り方サンプルで学ぶCassandraアプリケーションの作り方
サンプルで学ぶCassandraアプリケーションの作り方
Yuki Morishita
 
Cassandraのトランザクションサポート化 & web2pyによるcms用プラグイン開発
Cassandraのトランザクションサポート化 & web2pyによるcms用プラグイン開発Cassandraのトランザクションサポート化 & web2pyによるcms用プラグイン開発
Cassandraのトランザクションサポート化 & web2pyによるcms用プラグイン開発
kishimotosc
 
Kuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakaltKuduを調べてみた #dogenzakalt
Kuduを調べてみた #dogenzakalt
Toshihiro Suzuki
 

Viewers also liked (20)

SlowQueryログ開発秘話#cassandrameetupjp
SlowQueryログ開発秘話#cassandrameetupjpSlowQueryログ開発秘話#cassandrameetupjp
SlowQueryログ開発秘話#cassandrameetupjp
Yahoo!デベロッパーネットワーク
 
第17回Cassandra勉強会: MyCassandra
第17回Cassandra勉強会: MyCassandra第17回Cassandra勉強会: MyCassandra
第17回Cassandra勉強会: MyCassandra
Shun Nakamura
 
Cassandra @ Yahoo Japan (Satoshi Konno, Yahoo) | Cassandra Summit 2016
Cassandra @ Yahoo Japan (Satoshi Konno, Yahoo) | Cassandra Summit 2016Cassandra @ Yahoo Japan (Satoshi Konno, Yahoo) | Cassandra Summit 2016
Cassandra @ Yahoo Japan (Satoshi Konno, Yahoo) | Cassandra Summit 2016
DataStax
 
ジャンク解析入門
ジャンク解析入門ジャンク解析入門
ジャンク解析入門
Akira Kaneda
 
Cassandra @ Yahoo Japan | Cassandra Summit 2016
Cassandra @ Yahoo Japan | Cassandra Summit 2016Cassandra @ Yahoo Japan | Cassandra Summit 2016
Cassandra @ Yahoo Japan | Cassandra Summit 2016
Yahoo!デベロッパーネットワーク
 
Apache Sparkを使った感情極性分析
Apache Sparkを使った感情極性分析Apache Sparkを使った感情極性分析
Apache Sparkを使った感情極性分析
Tanaka Yuichi
 
「Python 機械学習プログラミング」 の挫折しない読み方
「Python 機械学習プログラミング」の挫折しない読み方「Python 機械学習プログラミング」の挫折しない読み方
「Python 機械学習プログラミング」 の挫折しない読み方
Hiroki Yamamoto
 
How you can contribute to Apache Cassandra
How you can contribute to Apache CassandraHow you can contribute to Apache Cassandra
How you can contribute to Apache Cassandra
Yuki Morishita
 
RDBからの脱却: 新ERP"HUE"におけるCassandra
RDBからの脱却: 新ERP"HUE"におけるCassandraRDBからの脱却: 新ERP"HUE"におけるCassandra
RDBからの脱却: 新ERP"HUE"におけるCassandra
2t3
 
本当にあったApache Spark障害の話
本当にあったApache Spark障害の話本当にあったApache Spark障害の話
本当にあったApache Spark障害の話
x1 ichi
 
アメーバブログを支えるデータセンターとインフラ技術
アメーバブログを支えるデータセンターとインフラ技術 アメーバブログを支えるデータセンターとインフラ技術
アメーバブログを支えるデータセンターとインフラ技術
Hiroki NAKASHIMA
 
EC × Google
EC × GoogleEC × Google
EC × Google
Takami Kazuya
 
【ビービット】 グローバル×デジタルの鍵はLocal UX 【グローバルTips】
【ビービット】 グローバル×デジタルの鍵はLocal UX 【グローバルTips】【ビービット】 グローバル×デジタルの鍵はLocal UX 【グローバルTips】
【ビービット】 グローバル×デジタルの鍵はLocal UX 【グローバルTips】
Yasufumi Fujii
 
オウンドメディアによるグローバルブランド戦略:生活者×企業のコミュニケーションは“伝える”から“伝わる”へ
オウンドメディアによるグローバルブランド戦略:生活者×企業のコミュニケーションは“伝える”から“伝わる”へオウンドメディアによるグローバルブランド戦略:生活者×企業のコミュニケーションは“伝える”から“伝わる”へ
オウンドメディアによるグローバルブランド戦略:生活者×企業のコミュニケーションは“伝える”から“伝わる”へ
トライベック・ストラテジー株式会社 / Tribeck Strategy Inc.
 
“人”の気持ちに応え、好かれるオウンドメディアコミュニケーション ~オムニチャネル時代に求められる企業アイデンティティとは~
“人”の気持ちに応え、好かれるオウンドメディアコミュニケーション ~オムニチャネル時代に求められる企業アイデンティティとは~“人”の気持ちに応え、好かれるオウンドメディアコミュニケーション ~オムニチャネル時代に求められる企業アイデンティティとは~
“人”の気持ちに応え、好かれるオウンドメディアコミュニケーション ~オムニチャネル時代に求められる企業アイデンティティとは~
トライベック・ストラテジー株式会社 / Tribeck Strategy Inc.
 
WooCommerce 勉強会 - 20161022
WooCommerce 勉強会 - 20161022WooCommerce 勉強会 - 20161022
WooCommerce 勉強会 - 20161022
Kei Tamura
 
Cassandra Summit 2016 注目セッション報告
Cassandra Summit 2016 注目セッション報告Cassandra Summit 2016 注目セッション報告
Cassandra Summit 2016 注目セッション報告
Yahoo!デベロッパーネットワーク
 
第17回Cassandra勉強会: MyCassandra
第17回Cassandra勉強会: MyCassandra第17回Cassandra勉強会: MyCassandra
第17回Cassandra勉強会: MyCassandra
Shun Nakamura
 
Cassandra @ Yahoo Japan (Satoshi Konno, Yahoo) | Cassandra Summit 2016
Cassandra @ Yahoo Japan (Satoshi Konno, Yahoo) | Cassandra Summit 2016Cassandra @ Yahoo Japan (Satoshi Konno, Yahoo) | Cassandra Summit 2016
Cassandra @ Yahoo Japan (Satoshi Konno, Yahoo) | Cassandra Summit 2016
DataStax
 
ジャンク解析入門
ジャンク解析入門ジャンク解析入門
ジャンク解析入門
Akira Kaneda
 
Apache Sparkを使った感情極性分析
Apache Sparkを使った感情極性分析Apache Sparkを使った感情極性分析
Apache Sparkを使った感情極性分析
Tanaka Yuichi
 
「Python 機械学習プログラミング」 の挫折しない読み方
「Python 機械学習プログラミング」の挫折しない読み方「Python 機械学習プログラミング」の挫折しない読み方
「Python 機械学習プログラミング」 の挫折しない読み方
Hiroki Yamamoto
 
How you can contribute to Apache Cassandra
How you can contribute to Apache CassandraHow you can contribute to Apache Cassandra
How you can contribute to Apache Cassandra
Yuki Morishita
 
RDBからの脱却: 新ERP"HUE"におけるCassandra
RDBからの脱却: 新ERP"HUE"におけるCassandraRDBからの脱却: 新ERP"HUE"におけるCassandra
RDBからの脱却: 新ERP"HUE"におけるCassandra
2t3
 
本当にあったApache Spark障害の話
本当にあったApache Spark障害の話本当にあったApache Spark障害の話
本当にあったApache Spark障害の話
x1 ichi
 
アメーバブログを支えるデータセンターとインフラ技術
アメーバブログを支えるデータセンターとインフラ技術 アメーバブログを支えるデータセンターとインフラ技術
アメーバブログを支えるデータセンターとインフラ技術
Hiroki NAKASHIMA
 
【ビービット】 グローバル×デジタルの鍵はLocal UX 【グローバルTips】
【ビービット】 グローバル×デジタルの鍵はLocal UX 【グローバルTips】【ビービット】 グローバル×デジタルの鍵はLocal UX 【グローバルTips】
【ビービット】 グローバル×デジタルの鍵はLocal UX 【グローバルTips】
Yasufumi Fujii
 
オウンドメディアによるグローバルブランド戦略:生活者×企業のコミュニケーションは“伝える”から“伝わる”へ
オウンドメディアによるグローバルブランド戦略:生活者×企業のコミュニケーションは“伝える”から“伝わる”へオウンドメディアによるグローバルブランド戦略:生活者×企業のコミュニケーションは“伝える”から“伝わる”へ
オウンドメディアによるグローバルブランド戦略:生活者×企業のコミュニケーションは“伝える”から“伝わる”へ
トライベック・ストラテジー株式会社 / Tribeck Strategy Inc.
 
“人”の気持ちに応え、好かれるオウンドメディアコミュニケーション ~オムニチャネル時代に求められる企業アイデンティティとは~
“人”の気持ちに応え、好かれるオウンドメディアコミュニケーション ~オムニチャネル時代に求められる企業アイデンティティとは~“人”の気持ちに応え、好かれるオウンドメディアコミュニケーション ~オムニチャネル時代に求められる企業アイデンティティとは~
“人”の気持ちに応え、好かれるオウンドメディアコミュニケーション ~オムニチャネル時代に求められる企業アイデンティティとは~
トライベック・ストラテジー株式会社 / Tribeck Strategy Inc.
 
WooCommerce 勉強会 - 20161022
WooCommerce 勉強会 - 20161022WooCommerce 勉強会 - 20161022
WooCommerce 勉強会 - 20161022
Kei Tamura
 
Ad

Similar to [db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会社 星井 祥吾 (20)

はじめるCassandra
はじめるCassandraはじめるCassandra
はじめるCassandra
Kakeru Iwanaga
 
Yahoo! JAPANにおけるApache Cassandraへの取り組み
Yahoo! JAPANにおけるApache Cassandraへの取り組みYahoo! JAPANにおけるApache Cassandraへの取り組み
Yahoo! JAPANにおけるApache Cassandraへの取り組み
Yahoo!デベロッパーネットワーク
 
081108huge_data.ppt
081108huge_data.ppt081108huge_data.ppt
081108huge_data.ppt
Naoya Ito
 
サーバ性能改善事例
サーバ性能改善事例サーバ性能改善事例
サーバ性能改善事例
KLab Inc. / Tech
 
Cassandra Meetup Tokyo, 2016 Spring
Cassandra Meetup Tokyo, 2016 SpringCassandra Meetup Tokyo, 2016 Spring
Cassandra Meetup Tokyo, 2016 Spring
Shigeru Harasawa
 
PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門
じゅん なかざ
 
Cloudian nosql casestudy_20120318
Cloudian nosql casestudy_20120318Cloudian nosql casestudy_20120318
Cloudian nosql casestudy_20120318
CLOUDIAN KK
 
SparkとCassandraの美味しい関係
SparkとCassandraの美味しい関係SparkとCassandraの美味しい関係
SparkとCassandraの美味しい関係
datastaxjp
 
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
Insight Technology, Inc.
 
絵で見てわかる 某分散データストア
絵で見てわかる 某分散データストア絵で見てわかる 某分散データストア
絵で見てわかる 某分散データストア
Takahiko Sato
 
NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA と PostgreSQL が挑んだ総力戦NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA OSS Professional Services
 
Inside pixiv's infrastructure〜application cluster side〜
Inside pixiv's infrastructure〜application cluster side〜Inside pixiv's infrastructure〜application cluster side〜
Inside pixiv's infrastructure〜application cluster side〜
Tatsuhiko Kubo
 
Cassandra v0.6-siryou
Cassandra v0.6-siryouCassandra v0.6-siryou
Cassandra v0.6-siryou
あしたのオープンソース研究所  
 
[db tech showcase Tokyo 2015] E35: Web, IoT, モバイル時代のデータベース、Apache Cassandraを学ぼう
[db tech showcase Tokyo 2015] E35: Web, IoT, モバイル時代のデータベース、Apache Cassandraを学ぼう[db tech showcase Tokyo 2015] E35: Web, IoT, モバイル時代のデータベース、Apache Cassandraを学ぼう
[db tech showcase Tokyo 2015] E35: Web, IoT, モバイル時代のデータベース、Apache Cassandraを学ぼう
datastaxjp
 
Amazon ElastiCache - AWSマイスターシリーズ
Amazon ElastiCache - AWSマイスターシリーズAmazon ElastiCache - AWSマイスターシリーズ
Amazon ElastiCache - AWSマイスターシリーズ
SORACOM, INC
 
Datastax Enterpriseをはじめよう
Datastax EnterpriseをはじめようDatastax Enterpriseをはじめよう
Datastax Enterpriseをはじめよう
Yuki Morishita
 
Yahoo! JAPANのOSS Cassandra貢献の今までとこれから
Yahoo! JAPANのOSS Cassandra貢献の今までとこれからYahoo! JAPANのOSS Cassandra貢献の今までとこれから
Yahoo! JAPANのOSS Cassandra貢献の今までとこれから
Yahoo!デベロッパーネットワーク
 
[data analytics showcase] B12: サーバー1,000台を監視するということ by 株式会社インサイトテクノロジー 小幡 一郎
[data analytics showcase] B12: サーバー1,000台を監視するということ by 株式会社インサイトテクノロジー 小幡 一郎[data analytics showcase] B12: サーバー1,000台を監視するということ by 株式会社インサイトテクノロジー 小幡 一郎
[data analytics showcase] B12: サーバー1,000台を監視するということ by 株式会社インサイトテクノロジー 小幡 一郎
Insight Technology, Inc.
 
Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219
Cloudera Japan
 
はじめるCassandra
はじめるCassandraはじめるCassandra
はじめるCassandra
Kakeru Iwanaga
 
081108huge_data.ppt
081108huge_data.ppt081108huge_data.ppt
081108huge_data.ppt
Naoya Ito
 
サーバ性能改善事例
サーバ性能改善事例サーバ性能改善事例
サーバ性能改善事例
KLab Inc. / Tech
 
Cassandra Meetup Tokyo, 2016 Spring
Cassandra Meetup Tokyo, 2016 SpringCassandra Meetup Tokyo, 2016 Spring
Cassandra Meetup Tokyo, 2016 Spring
Shigeru Harasawa
 
PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門PHP開発者のためのNoSQL入門
PHP開発者のためのNoSQL入門
じゅん なかざ
 
Cloudian nosql casestudy_20120318
Cloudian nosql casestudy_20120318Cloudian nosql casestudy_20120318
Cloudian nosql casestudy_20120318
CLOUDIAN KK
 
SparkとCassandraの美味しい関係
SparkとCassandraの美味しい関係SparkとCassandraの美味しい関係
SparkとCassandraの美味しい関係
datastaxjp
 
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
[db tech showcase Tokyo 2014] L32: Apache Cassandraに注目!!(IoT, Bigdata、NoSQLのバ...
Insight Technology, Inc.
 
絵で見てわかる 某分散データストア
絵で見てわかる 某分散データストア絵で見てわかる 某分散データストア
絵で見てわかる 某分散データストア
Takahiko Sato
 
Inside pixiv's infrastructure〜application cluster side〜
Inside pixiv's infrastructure〜application cluster side〜Inside pixiv's infrastructure〜application cluster side〜
Inside pixiv's infrastructure〜application cluster side〜
Tatsuhiko Kubo
 
[db tech showcase Tokyo 2015] E35: Web, IoT, モバイル時代のデータベース、Apache Cassandraを学ぼう
[db tech showcase Tokyo 2015] E35: Web, IoT, モバイル時代のデータベース、Apache Cassandraを学ぼう[db tech showcase Tokyo 2015] E35: Web, IoT, モバイル時代のデータベース、Apache Cassandraを学ぼう
[db tech showcase Tokyo 2015] E35: Web, IoT, モバイル時代のデータベース、Apache Cassandraを学ぼう
datastaxjp
 
Amazon ElastiCache - AWSマイスターシリーズ
Amazon ElastiCache - AWSマイスターシリーズAmazon ElastiCache - AWSマイスターシリーズ
Amazon ElastiCache - AWSマイスターシリーズ
SORACOM, INC
 
Datastax Enterpriseをはじめよう
Datastax EnterpriseをはじめようDatastax Enterpriseをはじめよう
Datastax Enterpriseをはじめよう
Yuki Morishita
 
[data analytics showcase] B12: サーバー1,000台を監視するということ by 株式会社インサイトテクノロジー 小幡 一郎
[data analytics showcase] B12: サーバー1,000台を監視するということ by 株式会社インサイトテクノロジー 小幡 一郎[data analytics showcase] B12: サーバー1,000台を監視するということ by 株式会社インサイトテクノロジー 小幡 一郎
[data analytics showcase] B12: サーバー1,000台を監視するということ by 株式会社インサイトテクノロジー 小幡 一郎
Insight Technology, Inc.
 
Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219
Cloudera Japan
 
Ad

More from Insight Technology, Inc. (20)

グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?
Insight Technology, Inc.
 
Docker and the Oracle Database
Docker and the Oracle DatabaseDocker and the Oracle Database
Docker and the Oracle Database
Insight Technology, Inc.
 
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Insight Technology, Inc.
 
事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明する事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明する
Insight Technology, Inc.
 
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
Insight Technology, Inc.
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
Insight Technology, Inc.
 
グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?
Insight Technology, Inc.
 
DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームDBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォーム
Insight Technology, Inc.
 
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門
Insight Technology, Inc.
 
Lunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL ServicesLunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL Services
Insight Technology, Inc.
 
db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉 db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉
Insight Technology, Inc.
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
Insight Technology, Inc.
 
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
Insight Technology, Inc.
 
難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?
Insight Technology, Inc.
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Insight Technology, Inc.
 
そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?
Insight Technology, Inc.
 
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
Insight Technology, Inc.
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
Insight Technology, Inc.
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Insight Technology, Inc.
 
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
Insight Technology, Inc.
 
グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?
Insight Technology, Inc.
 
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Insight Technology, Inc.
 
事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明する事例を通じて機械学習とは何かを説明する
事例を通じて機械学習とは何かを説明する
Insight Technology, Inc.
 
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
Insight Technology, Inc.
 
MBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごとMBAAで覚えるDBREの大事なおしごと
MBAAで覚えるDBREの大事なおしごと
Insight Technology, Inc.
 
グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?
Insight Technology, Inc.
 
DBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォームDBREから始めるデータベースプラットフォーム
DBREから始めるデータベースプラットフォーム
Insight Technology, Inc.
 
SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門SQL Server エンジニアのためのコンテナ入門
SQL Server エンジニアのためのコンテナ入門
Insight Technology, Inc.
 
db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉 db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉
Insight Technology, Inc.
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
Insight Technology, Inc.
 
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
Insight Technology, Inc.
 
難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?難しいアプリケーション移行、手軽に試してみませんか?
難しいアプリケーション移行、手軽に試してみませんか?
Insight Technology, Inc.
 
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Insight Technology, Inc.
 
そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?そのデータベース、クラウドで使ってみませんか?
そのデータベース、クラウドで使ってみませんか?
Insight Technology, Inc.
 
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
Insight Technology, Inc.
 
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。 複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
Insight Technology, Inc.
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Insight Technology, Inc.
 
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
Insight Technology, Inc.
 

[db tech showcase Tokyo 2016] D27: Next Generation Apache Cassandra by ヤフー株式会社 星井 祥吾

  • 2. 今日のアジェンダ • 自己紹介 • Cassandra利用状況 • Cassandra利用事例 • NGCCとは? • NGCC発表内容 • NGCC重要トピック • 最後に 2
  • 3. 今日のアジェンダ • 自己紹介 • Cassandra利用状況 • Cassandra利用事例 • NGCCとは? • NGCC発表内容 • NGCC重要トピック • 最後に 3
  • 4. • Cassandraオペレータ – 広告部署から全社KVSチームに異動 -> サービス側にKVSプラット フォームを提供、運用 • Cassandra自動デプロイシステムの刷新を担当 – Chef – Jenkins • Cassandraコントリビュータ – https://github.com/shoshii • Video gamer – PSN ID: kobuchizawa0102 自己紹介 4
  • 5. 今日のアジェンダ • 自己紹介 • Cassandra利用状況 • Cassandra利用事例 • NGCCとは? • NGCC発表内容 • NGCC重要トピック • 最後に 5
  • 6. 提供サービス Media US Search Video Answer Mail JP US JP Membership C2C Payment C2C EC B2C EC Local Search Knowledge search MailNews YAHUOKU!Premium Wallet Loco
  • 9. 今日のアジェンダ • 自己紹介 • Cassandra利用状況 • Cassandra利用事例 • NGCCとは? • NGCC発表内容 • NGCC重要トピック • 最後に 9
  • 10. 利用事例 #1 : パーソナルデータ • 月間3000万のアクティブユーザーID属性 • 弊社プライバシーポリシー[1]に基づき、各サービスに応じて 様々な属性を格納 10 個人属性 [1] Yahoo! JAPAN利用規約 第2章 プライバシーポリシー エンドユーザの趣味嗜好 アプリ通知メッセージ
  • 11. 利用事例 #2 : 行動履歴 • 弊社プライバシーポリシー[1]に基づき、各サービスの履歴 データを格納 11 [1] Yahoo! JAPAN利用規約 第2章 プライバシーポリシー 行動履歴 広告クリック履歴・CV履歴 リアルタイム検索ツイート閲覧ログ
  • 12. 利用事例 #3 : コンテンツキャッシュ • RDBのコンテンツ情報や、集計情報などを格納し、各サービ スのスケールアウトに活用 12 メタデータ 集計情報 電子書籍:商品ID、レコメ情報 ニュース:テーマID、記事ID、記事内容
  • 13. 今日のアジェンダ • 自己紹介 • Cassandra利用状況 • Cassandra利用事例 • NGCCとは? • NGCC発表内容 • NGCC重要トピック • 最後に 13
  • 14. Next Generation Cassandra Conference • Cassandraトップコントリビュータが集まる国際会議 • ほぼDataStax社の主要メンバで構成されるが、最近は 外部メンバの取り込みに積極的 • 各自が議題を持ち寄って議論する – 専任のファシリテータがいないので、待ちの姿勢だと議論に参 加できないことも • 今年で3年目、3回目の開催 • youtube公開動画:資料末尾の付録参照 14
  • 16. 今日のアジェンダ • 自己紹介 • Cassandra利用状況 • Cassandra利用事例 • NGCCとは? • NGCC発表内容 • NGCC重要トピック • 最後に 16
  • 17. How to manage 30,000+ connections 17
  • 19. Cassandra process goes down when too many clients connect it 19 Client machine Apache child process Client machine Client machine
  • 20. • 200 client machines Cassandra process goes down when too many clients connect it 20
  • 21. • 200 client machines * 128 apache child processes Cassandra process goes down when too many clients connect it 21
  • 22. • 200 client machines * 128 apache child processes * 2 (request + heart beat) = Cassandra process goes down when too many clients connect it 22
  • 23. • 200 client machines * 128 apache child processes * 2 (request + heart beat) = 51,200 connections / node Cassandra process goes down when too many clients connect it 23
  • 24. Cassandra process goes down when too many clients connect it 24 Client machine Apache child process 51,200 > 32,768 ( max open file num ) Client machine Client machine 写真:アフロ
  • 25. Cassandra process goes down when too many clients connect it 25 Process down 写真:アフロ
  • 26. Cassandra process goes down when too many clients connect it 26 Process down 写真:アフロ
  • 29. Our solution ~ Cassandra Proxy 29 Client machine Apache child process Cassandra Proxy Client machine Client machine 写真:アフロ
  • 30. • 200 client machines Our solution ~ Cassandra Proxy 30
  • 31. • 200 client machines * 128 apache child processes Our solution ~ Cassandra Proxy 31
  • 32. • 200 client machines * 128 apache child processes 1 proxy Our solution ~ Cassandra Proxy 32写真:アフロ
  • 33. • 200 client machines * 128 apache child processes 1 proxy * 2 (request + heart beat) = Our solution ~ Cassandra Proxy 33 写真:アフロ
  • 34. • 200 client machines * 128 apache child processes 1 proxy * 2 (request + heart beat) = 400 connections / node Our solution ~ Cassandra Proxy 34 写真:アフロ
  • 35. • 51,200 -> 400 connections / node Our solution ~ Cassandra Proxy 35 写真:アフロ
  • 37. • Stress test – 1 msec / request (95%) – 1 Cassandra Proxy can send 300 requests/sec to C* Consequences 37 写真:アフロ
  • 38. • Production – 370 client machines – 33 Cassandra nodes – 3,000 read requests / sec (cluster) • To be 100,000 read requests / sec – Advertisement platform – Available on datastax cpp driver Consequences 38
  • 39. • In the future? – Cassandra Proxy could become one of the functions of datastax cpp driver? Consequences 39
  • 40. 今日のアジェンダ • 自己紹介 • Cassandra利用状況 • Cassandra利用事例 • NGCCとは? • NGCC発表内容 • NGCC重要トピック • 最後に 40
  • 41. Large partition in Cassandra 41
  • 42. remark • This is a summary of following tickets: – https://issues.apache.org/jira/browse/CASSANDRA-11206 – https://issues.apache.org/jira/browse/CASSANDRA-9738
  • 43. Agenda • Recap the read path • What’s the problem? • Solutions
  • 44. High level: read path Row Cache Key Cache SSTables Mem Table 1. Check row cache before going to key cache 2. Check the key cache to get the offsets to data 3. Find the offsets to data and retrieve data 4. Merge data from sstables and memtable 5. Populate row cache with new row returned http://docs.datastax.com/en/cassandra/3.x/cassandra/dml/dmlAboutReads.html
  • 45. Pattern 1. The row is in row cache Partition Summary Disk Mem Table Compression Offsets Bloom Filter Row Cache Heap Off Heap Key Cache Partition Index Data 1. read request 2. return row when that is in row cache
  • 46. Pattern 2. The key is in key cache Partition Summary Disk Mem Table Compression Offsets Bloom Filter Row Cache Heap Off Heap Key Cache Partition Index Data 1. read request 2. Check bloom filters 3. Check the partition key is in key cache 4. Find the offset to the result set 5. Access the result set
  • 47. Pattern 3. The key is not cached Partition Summary Disk Mem Table Compression Offsets Bloom Filter Row Cache Heap Off Heap Key Cache Partition Index Data 1. read request 2. Miss -> Check bloom filters 3. Check the partition key is in key cache 4. Miss -> Bsearch the close location of index 5. Disk scan to find the offsets 6. Find the offset into the result set 7. Access the result set 8. Update key cache
  • 48. What’s the problem? • GC pressure by key cache when a large partition is read
  • 49. Partition Index Recap • http://distributeddatastore.blogspot.jp/2013/08/cassandra-sstable-storage-format.html
  • 50. RowIndexEntry • Partition size < 64 kb – RowIndexEntry • Position • Seriarized size of data • Partition size > 64 kb – IndexedEntry • Position • Seriarized size of data • IndexInfo[] – Seriarize method – Offset – width – Etc. Approximation on 16 byte value 1mb : 3kb / > 200 objects 4mb : 11kb / > 800 objects 64mb : 180kb / > 13k objects 512mb : 1.4mb / > 106k objects
  • 51. 3. The key is not cached Partition Summary Disk Mem Table Compression Offsets Bloom Filter Row Cache Heap Off Heap Key Cache Partition Index Data 1. read request 2. Miss -> Check bloom filters 3. Check the partition key is in key cache 4. Miss -> Bsearch the close location of index 5. Disk scan to find the offsets 6. Find the offsets into the result set 7. Access the result set 8. Update key cache 9. GC, GC, GC…
  • 52. Current solution • If partition size < column_index_cache_size_in_kb(configurable) – IndexedEntry is kept on heap • Otherwise – Always read from disk when needed • https://issues.apache.org/jira/browse/CASSANDRA-11206 • https://www.youtube.com/watch?v=qa84vABqftM
  • 53. Other possible solutions • IndexInfo never be kept on heap – Read from disk when needed – degrades performance when small partition is read
  • 54. Other possible solutions • Migrate key cache to be fully off heap – https://issues.apache.org/jira/browse/CASSANDRA-9738 – Serialization & deserialization cost so much when large partition is read • Will Birch help us to solve this problem? – https://issues.apache.org/jira/browse/CASSANDRA-9754
  • 55. What we go for • 来年もNGCCに呼んでもらえるように頑張ろう! そのためには?: Cassandraコミュニティに貢献する 1. 日本で一番Apache Cassandraを使っている会社になる。 2. Cassandraのコード改善や問題提起の活動を継続する。 3. Cassandraコミュニティの人と仲良くなる。 55
  • 57. 今日のアジェンダ • 自己紹介 • Cassandra利用状況 • Cassandra利用事例 • NGCCとは? • NGCC発表内容 • NGCC重要トピック • 最後に 57
  • 58. 最後に 58 D I S T R I B U T E D 大規模分散処理 H A R D W A R E ハードウエア分野 N E T W O R K ネットワーク分野 mailto:[email protected]
  • 60. 付録:NGCC動画集 • Next-Gen Schema – https://www.youtube.com/watch?v=eAWRj0kqpvU • Change Data Capture – https://www.youtube.com/watch?v=Y0fOxa3tC98 • Explicit support for time series data – https://www.youtube.com/watch?v=CmsQNNdDuSA • Automated Repair – https://www.youtube.com/watch?v=8sGUn6Q2bUU • Storage format and key cache changes to support large partitions – https://www.youtube.com/watch?v=qa84vABqftM • SASI update – https://www.youtube.com/watch?v=yUFoSAg6rA4 • Instagram’s use cases – https://www.youtube.com/watch?v=VwhovoqavT4 • Lightning Talks – https://www.youtube.com/watch?v=6y5UV4OTawg 60