Data-Intensive Text Processing with MapReduce(Ch1,Ch2)
This document is written about "Data-Intensive Text Processing with MapReduce" Chapter 1 and 2.
It includes basic topics about MapReduce programming model.
Next document will be more advanced topics.
Big Dataの時代!
● 我々のデータ蓄積能力は、データ処理能力を大
幅に上回っている
● Big Data(数十TB以上)を扱うのは当たり前
● そもそも現実世界は Big Data である
● だから現実世界のシステムはこれに立ち向かわなけ
ればならない
● Big Data を扱うのは技術がいる
● 分散処理、アルゴリズム、etc...
7.
世界の企業が扱うBig Data
● Googleは2008年時点で20PBをMapReduceで
処理してた
● eBayは約10PB
● FaceBookは2010年時点で15PB [1]
8.
なんで Big Dataを扱うの?
● 「そこにデータがあるからだ」
● たくさんのデータがあれば、よりよいアルゴリ
ズムを使うことができる
● 現実世界の問題を解決しやすくできる
これで Why は説明した
この本の残りは全て How について説明する
9.
クラウドコンピューティング
● かつて「ユーティリティコンピューティング」
と呼ばれていたもの [2]
● ユーティリティコンピューティングの基本コン
セプトは、「Everything as a Service」