大数据知识及技术简介 
作者:李烨
内容提纲 
•背景介绍 
•基础概念 
•大数据 
•大数据分析 
•相关技术 
•相关职位 
•社会影响
信息过载 
•1880 美国人口普查 
•1941 “信息爆炸” 
•1944 Fremont Rider 发现:美 国大学图书馆藏书每16年倍增 
•1961 DerekPrice推进Rider的发 现
大数据时代
基本概念 
•数据 
•数据可视化 
•数据分析 
•数据挖掘 
•Machine Learning 
•预测和建模 
•“数据科学”
大数据 
•Volume:大量 
•Velocity:高速 
•Variety:多样 
•Value:价值
大数据分析
大数据分析 
•与传统数据分析的区别 
•运算追逐数据 
•生成同步处理 
•全体取代抽样 
•当前难点 
•数据处理——处理大量、高速、多样的数据 
•数据分析——现有算法的并行化
数据及数据分析相关职位 
传统职位 
•统计 
•Business Intelligence 
•数据分析师(data analyst) 
大数据相关职位 
•算法研究(researcher) 
•数据科学家(data scientist) 
•数据工程师(data engineer) 
•数据保障(data quality)
大数据技术 
•分布式存储+ 并行计算 
•云计算
Hadoop 
•HDFS + MapReduce 
•Hadoop
Hadoop Alternatives & Related 
•Storm 
•Spark 
•Mahout 
•SAS on Hadoop
NoSQL Database 
•NOT ONLY SQL 
•MongoDB 
•Redis 
•Cassandra 
•Hbase 
•Run SQL on KeyValuePair 
•Hive 
•Pig
大数据的影响 
•定量分析 
•从必然到相关 
•信息安全
谢谢! ye.julia.li@gmail.com

More Related Content

PDF
What is big data
PPT
Dmresearch
PDF
BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告
PDF
Introduction to big data
PPTX
BDTC2015 小米-大数据和小米金融
PPTX
大数据漫谈-bilibili
PDF
张振杰:大数据时代的隐私保护的挑战和机遇
PDF
Silf2012lw3
What is big data
Dmresearch
BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告
Introduction to big data
BDTC2015 小米-大数据和小米金融
大数据漫谈-bilibili
张振杰:大数据时代的隐私保护的挑战和机遇
Silf2012lw3

Viewers also liked (6)

PDF
Hadoop-分布式数据平台
PDF
Qcon2013 罗李 - hadoop在阿里
PPTX
大數據導讀
PDF
超基本網站分析,數據會說話(網路版)
PPTX
行動廣告與大數據資料分析策略與執行
PDF
Impact of big data on analytics
Hadoop-分布式数据平台
Qcon2013 罗李 - hadoop在阿里
大數據導讀
超基本網站分析,數據會說話(網路版)
行動廣告與大數據資料分析策略與執行
Impact of big data on analytics
Ad

Similar to 大数据知识及技术简介(Introduction to basic concepts and techiques of big data in Chinese) (20)

PPTX
Spark Introduction
PPT
第1章-大数据概述.pptBigdataBigdataBigdataBigdata
PPTX
大数据 数据挖掘
PDF
Hadoop
PDF
肖永红:科研数据应用和共享方面的实践
PDF
查礼 -大数据技术如何用于传统信息系统
PDF
Dtcc ibm big data platform 2012-final_cn
PDF
Bigdata bizoppor
PPTX
Big Data and Future
PDF
Big data, big deal ms it168文库
PDF
Big data, big deal ms it168文库
PPTX
Introduction of libraries' big data in China
PPTX
The Evolution of Data Systems
PDF
逻辑数据编织 – 构建先进的现代企业数据架构
PDF
《数据库发展研究报告-解读(2023年)》.pdf
PDF
云存储与虚拟化分论坛 基于云计算的海量数据挖掘
PDF
医药企业的数字化转型 - 逻辑数据结构策略
PPTX
数据挖掘理论与实践
PDF
Can data virtualization uphold performance with complex queries? (Chinese)
PPTX
海量数据计算架构实现
Spark Introduction
第1章-大数据概述.pptBigdataBigdataBigdataBigdata
大数据 数据挖掘
Hadoop
肖永红:科研数据应用和共享方面的实践
查礼 -大数据技术如何用于传统信息系统
Dtcc ibm big data platform 2012-final_cn
Bigdata bizoppor
Big Data and Future
Big data, big deal ms it168文库
Big data, big deal ms it168文库
Introduction of libraries' big data in China
The Evolution of Data Systems
逻辑数据编织 – 构建先进的现代企业数据架构
《数据库发展研究报告-解读(2023年)》.pdf
云存储与虚拟化分论坛 基于云计算的海量数据挖掘
医药企业的数字化转型 - 逻辑数据结构策略
数据挖掘理论与实践
Can data virtualization uphold performance with complex queries? (Chinese)
海量数据计算架构实现
Ad

大数据知识及技术简介(Introduction to basic concepts and techiques of big data in Chinese)