A Benchmark Test on Presto, Spark Sql and Hive on TezGw Liu
Presto、Spark SQLとHive on Tezの性能に関して、数万件から数十億件までのデータ上に、常用クエリパターンの実行スピードなどを検証してみた。
We conducted a benchmark test on mainstream big data sql engines including Presto, Spark SQL, Hive on Tez.
We focused on the performance over medium data (from tens of GB to 1 TB) which is the major case used in most services.
株式会社ブレインパッドが行ったApache Sparkのパフォーマンス検証作業に関する資料です。詳細は、ブレインパッド公式ブログ「Platinum Data Blog」をご覧ください。URL:http://blog.brainpad.co.jp/
株式会社ブレインパッドが行ったApache Sparkのパフォーマンス検証作業に関する資料です。詳細は、ブレインパッド公式ブログ「Platinum Data Blog」をご覧ください。URL:http://blog.brainpad.co.jp/
Hive on Spark を活用した高速データ分析 - Hadoop / Spark Conference Japan 2016Nagato Kasaki
現在、DMM.comでは、1日あたり1億レコード以上の行動ログを中心に、各サービスのコンテンツ情報や、地域情報のようなオープンデータを収集し、データドリブンマーケティングやマーケティングオートメーションに活用しています。しかし、データの規模が増大し、その用途が多様化するにともなって、データ処理のレイテンシが課題となってきました。本発表では、既存のデータ処理に用いられていたHiveの処理をHive on Sparkに置き換えることで、1日あたりのバッチ処理の時間を3分の1まで削減することができた事例を紹介し、Hive on Sparkの導入方法やメリットを具体的に解説します。
Hadoop / Spark Conference Japan 2016
http://www.eventbrite.com/e/hadoop-spark-conference-japan-2016-tickets-20809016328
Online Marketing Amersfoort introductie - Online & Education bij BeeckestijnRamon de la Fuente
Online Marketing Amersfoort (#OM033) organiseerde opnieuw een inspirerend evenement: “Online & Education!” In deze vijfde editie vertelden een drietal enerverende sprekers van Squla, Nimbles en de TU Delft over hun ervaringen met online in de educatie branche. Zij verklapten aan de hand van leuke cases hoe online kan bijdragen aan realisatie van de commerciële doelstellingen. Ook hebben de sprekers hun geleerde punten en verbeteringen openhartig gedeeld.
"Online & Education" vond plaats op een prachtige locatie in de bosrijke omgeving van Amersfoort bij Beeckestijn Business School.
MOOC's - Arno Smets TU Delft - presentatie bij Online Marketing AmersfoortRamon de la Fuente
Presentatie voor Online Marketing Amersfoort #OM033. Arno Smets is hoogleraar Zonne-energie aan de Technische Universiteit Delft. Vanaf de herfst van 2013 doceert hij zijn Massive Open Online Course (MOOC) ‘Solar Energy’ op het edX platform. Met deze online cursus heeft hij meer dan 150.000 studenten over de hele wereld bereikt. Arno Smets zal praten over zijn ervaring met deze vorm van onderwijs: Wat is de impact van online onderwijs op studenten, docenten, on-campus en globaal onderwijs? Wie zijn de MOOC studenten? Hoe werkt de marketing van een MOOC?
Wat is de wervende werking van een MOOC? Wat zijn de beperkingen van een MOOC? Welke nieuwe mogelijkheden biedt deze vorm van online onderwijs?
株式会社ブレインパッドが行ったApache Sparkのパフォーマンス検証作業に関する資料です。詳細は、ブレインパッド公式ブログ「Platinum Data Blog」をご覧ください。URL:http://blog.brainpad.co.jp/
株式会社ブレインパッドが行ったApache Sparkのパフォーマンス検証作業に関する資料です。詳細は、ブレインパッド公式ブログ「Platinum Data Blog」をご覧ください。URL:http://blog.brainpad.co.jp/
Hive on Spark を活用した高速データ分析 - Hadoop / Spark Conference Japan 2016Nagato Kasaki
現在、DMM.comでは、1日あたり1億レコード以上の行動ログを中心に、各サービスのコンテンツ情報や、地域情報のようなオープンデータを収集し、データドリブンマーケティングやマーケティングオートメーションに活用しています。しかし、データの規模が増大し、その用途が多様化するにともなって、データ処理のレイテンシが課題となってきました。本発表では、既存のデータ処理に用いられていたHiveの処理をHive on Sparkに置き換えることで、1日あたりのバッチ処理の時間を3分の1まで削減することができた事例を紹介し、Hive on Sparkの導入方法やメリットを具体的に解説します。
Hadoop / Spark Conference Japan 2016
http://www.eventbrite.com/e/hadoop-spark-conference-japan-2016-tickets-20809016328
Online Marketing Amersfoort introductie - Online & Education bij BeeckestijnRamon de la Fuente
Online Marketing Amersfoort (#OM033) organiseerde opnieuw een inspirerend evenement: “Online & Education!” In deze vijfde editie vertelden een drietal enerverende sprekers van Squla, Nimbles en de TU Delft over hun ervaringen met online in de educatie branche. Zij verklapten aan de hand van leuke cases hoe online kan bijdragen aan realisatie van de commerciële doelstellingen. Ook hebben de sprekers hun geleerde punten en verbeteringen openhartig gedeeld.
"Online & Education" vond plaats op een prachtige locatie in de bosrijke omgeving van Amersfoort bij Beeckestijn Business School.
MOOC's - Arno Smets TU Delft - presentatie bij Online Marketing AmersfoortRamon de la Fuente
Presentatie voor Online Marketing Amersfoort #OM033. Arno Smets is hoogleraar Zonne-energie aan de Technische Universiteit Delft. Vanaf de herfst van 2013 doceert hij zijn Massive Open Online Course (MOOC) ‘Solar Energy’ op het edX platform. Met deze online cursus heeft hij meer dan 150.000 studenten over de hele wereld bereikt. Arno Smets zal praten over zijn ervaring met deze vorm van onderwijs: Wat is de impact van online onderwijs op studenten, docenten, on-campus en globaal onderwijs? Wie zijn de MOOC studenten? Hoe werkt de marketing van een MOOC?
Wat is de wervende werking van een MOOC? Wat zijn de beperkingen van een MOOC? Welke nieuwe mogelijkheden biedt deze vorm van online onderwijs?
1) The study surveyed 590 Canadian communication professionals and 1039 Canadian consumers on their use of social media in 2011, comparing results to a 2009 study.
2) Key findings showed that since 2009, professionals' social media use has increased, with Twitter becoming ubiquitous. Consumers also use social media more frequently daily.
3) While objectives and understanding of social media have improved, communication professionals still tend to overestimate its influence on shaping opinions and consumer purchases compared to what consumers report.
María de Guadalupe Morales García nació el 25 de julio de 1996 en Chetumal, México. Es la hija más joven de Manuel y Lorena Morales, quienes han estado casados por 29 años, y la única mujer entre sus tres hijos. Le gusta leer, tomar café, pasar tiempo con amigos y familia, comer, dormir y bailar. Sus objetivos profesionales incluyen terminar su carrera universitaria, graduarse con buen promedio, conseguir un trabajo, realizar diplomados y obtener una maestría en Puebla.
El documento resume el arte prehistórico, dividiéndolo en períodos como el Paleolítico, Mesolítico y Neolítico. Explica que en el arte Paleolítico se usaban materiales como conchas y piedras para crear Venus y arte rupestre en cuevas, usando técnicas como grabados e incisiones con temas de caza. También menciona importantes cuevas con arte rupestre como Altamira y Lascaux que contienen pinturas polícromas y monocromas.
El documento describe el Antiguo Régimen en Europa entre los siglos XV y XVIII, caracterizado por la agricultura señorial, el absolutismo y la sociedad estamental. A finales del XVIII, el Antiguo Régimen comenzó a ser reemplazado por sistemas liberales y la Revolución Industrial, trayendo consigo cambios ideológicos, sociales, políticos y económicos.
El documento describe los recursos necesarios para lanzar un proyecto empresarial, incluyendo recursos humanos (el equipo del proyecto), recursos físicos (instalaciones, maquinaria, terreno), recursos económicos (financiación propia sin plazo de devolución, financiación ajena de terceros con intereses y plazo, ayudas y subvenciones), y recursos intelectuales. Explica que cada proyecto requiere diferentes tipos y cantidades de recursos para completarse.
This document is a resume for Cem CİHAN providing personal and professional details. It summarizes his education including a degree in Metallurgical and Materials Engineering from Yildiz Technical University and certification in welding engineering from Gedik University. It also outlines his work experience as a Project Manager at Teknokon Group A.S. and as a Project & Quality Engineer at Mastır Enerji Montaj A.S., detailing his responsibilities in those roles managing projects, quality, and budgets. His skills include project management, cost and time management, welding, and languages of English and French.
- The document discusses the TU Delft's use of WhatsApp for their webcare services, in addition to traditional channels like Facebook.
- Their WhatsApp webcare is available from 9am-5pm and 5pm-12am daily with 11 core team members and 16 assistants handling requests.
- Research found WhatsApp interactions to be more personal and informal than Facebook, with customers expecting faster response times. However, this also brings challenges like long conversations and unclear priorities.
- The document provides tips for webcare teams on WhatsApp like using status updates, quick first responses, discussing cases, and clearly defining responsibilities.
Information system security deals with securing systems, information in transit, and establishing security services, mechanisms, and policies. It aims to provide confidentiality, integrity, authentication, and controlled access. Cryptography is the study of mathematical techniques used for these security objectives and includes symmetric and asymmetric encryption methods. Cryptanalysis involves attempting to defeat cryptographic techniques.
Este documento describe las principales infraestructuras de ingeniería romana como calzadas, puentes, acueductos y cloacas. Explica cómo los romanos construyeron calzadas empedradas para facilitar el movimiento de tropas y el comercio, puentes de piedra con arcos sobre pilares, y acueductos para transportar agua a ciudades. También detalla cómo diseñaron un sistema de alcantarillado bajo las ciudades con cloacas lo suficientemente grandes para que caminara un hombre.
Este documento resume el ocio y tiempo libre de los romanos y griegos, incluyendo sus juegos, termas y banquetes. Los griegos promovían el ejercicio físico como ideal de belleza y preparación para la guerra, mientras que los romanos veían el ocio como un tiempo de descanso mental y físico. Algunos juegos populares incluían dados, pelota y juegos de mesa. Las termas eran lugares sociales con salas de vapor, agua caliente y fría. Los banquetes romanos consistían en varios platillos
This document discusses recommendation techniques for implicit feedback datasets. It begins with an introduction to recommendation 101, distinguishing between explicit feedback (e.g. ratings) and implicit feedback (e.g. purchases). It then covers matrix factorization, factorization machines, and Bayesian probabilistic ranking (BPR) as techniques for modeling implicit feedback. Matrix factorization represents users and items as vectors in a shared latent factor space. Factorization machines extend this to model feature interactions. BPR samples positive and negative item pairs for each user and optimizes rankings with a pairwise loss function.
マイクロソフトは より効率的、かつ大量のデータを使ったデータ分析のための基盤を急ピッチで拡充しています。
分析自体やデータ準備の前処理における手段の1つとして使って頂くことを想定している各種製品・サービスについて説明します。
具体的には、R の並列実行環境である Microsoft R Server、Power BI、並列処理基盤である Azure Data Lake Analytics、Azure Machine Learning を取り上げます。
This is a slide deck that was used for our 11/19/15 Nike Tech Talk to give a detailed overview of the SnappyData technology vision. The slides were presented by Jags Ramnarayan, Co-Founder & CTO of SnappyData
The traditional way of student recruitment is to give the student as much information as we think they need to make a rational decision on their choice of study. Wilco van Dijk will show you a complete new way of thinking: GO EAST! Easy, Attractive, Social and Timely nudges to steer students in the right direction.
DB TechShowcase Tokyo - Intelligent Data PlatformDaiyu Hatakeyama
AI (Artificial Intelligence) が様々なアプリケーション/サービスに組み込まれ始めて、それをうみだす原動力ともいえるデータプラットフォームもその立ち位置を変えてきています。次期SQL Server 2017には、Machine Learning Servicesが同梱され、まさに次世代のデータプラットフォームの一つの形といえるでしょう。このセッションでは、System of Record から、System of Insight へとその価値を変えていく最新のData Platformの世界をご紹介します。
8. 8
Machine
Learning
Stream Analytics
SQL Data Ware House
/ SQL Database
/ DocumentDB
IoT Hub /
Event Hub
各種デバイス
Data Factory
Data Lake Store
Storage
(Blob / Table / Queue)
Data Lake Analytics
Power BI
Cortana Analytics Suite (コルタナ アナリティクス スイート) * IoT Hub と R Server 除く
一部サービス含む
Microsoft
R Server
HDInsight
Project
Oxford
Data Catalog
28. 28
• 無償、オープン ソースの R ディストリビューション
• マイクロソフトによって拡張して提供
Microsoft R Open (MRO)
• スケール実行が可能でサポートが受けられる
R ディストリビューション
• マイクロソフトによって作成した特別なコンポーネントを含む
Microsoft R Server (MRS)
29. 29
Revolution R
Enterprise
Revolution R
Open
Microsoft R Server
SQL Server 2016
R Services *
Microsoft R Open
これまで これから
Windows
Hadoop
Red Hat SuSE
Teradata
Linux (Ubuntu/CentOS
/Red Hat/SuSE)
Windows Mac
* SQL Server 2016 リリースまでは Revolution R Enterprise for Windows を利用
31. 31
• Microsoft R Server for Red Hat Linux
• Microsoft R Server for SUSE Linux
• Microsoft R Server for Teradata DB
• Microsoft R Server for Hadoop on Red Hat
• RRE for Windows
(Microsoft SQL Server 2014 Enterprise Edition + SA の場合)
Microsoft R Server (MRS)
32. 32
• メモリに収まる範囲での処理
• 大規模データ使用時の Out of Memory
• データのサンプリングによる制約
• 直列処理、処理するためにはデータの移動が必要
• 長時間かかる処理、データ移動も長時間かかる
• 並列実行を独自に組み込むには複雑
• 商用サポートなし
• 個人 PC のみでの利用で低い機能性、企業利用の場合問題が発生しても
解決が難しい場合も
33. 33
データ処理 インメモリ インメモリ インメモリ or ディスク
分析スピード シングルスレッド マルチスレッド
マルチスレッド
1:N のサーバーに対する
並列処理
サポート コミュニティ コミュニティ
コミュニティ+
商用サポート
分析のための
パッケージ
7500 を超えるパッ
ケージ (CRAN)
7500 を超えるパッ
ケージ (CRAN)
7500 を超えるパッケージ
(CRAN) +
商用の高速並列関数
ライセンス オープンソース オープンソース 商用ライセンス
Microsoft R
Open (MRO)
Microsoft R
Server (MRS)
63. 63
Machine
Learning
Stream Analytics
SQL Data Ware House
/ SQL Database
/ DocumentDB
IoT Hub /
Event Hub
各種デバイス
Data Factory
Data Lake Store
Storage
(Blob / Table / Queue)
Data Lake Analytics
Power BI
Cortana Analytics Suite (コルタナ アナリティクス スイート) * IoT Hub と R Server 除く
一部サービス含む
Microsoft
R Server
HDInsight
Project
Oxford
Data Catalog