Кластер БГУИР: расширенные возможности

Вычислительный кластер БГУИР
Кафедра ЭВМ
Лаборатория высокопроизводительных
вычислений

Аппаратная платформа
Система в сборе:
● Стойка Rack 10 Units
● Кластер вычислительных
узлов
● Источник бесперебойного
питания

Характеристики кластера
Тип узла Количество Характеристики узла
Вычислительный 7
Blade: GPU SuperBlade SBI-7127RG
2 х CPU Intel Xeon E5-2650
32 Gb RAM
2x Tesla M2075 6 Gb RAM
InfiniBand 4x QDR (40Gbps)
Network 2x Gigabit Ethernet
Управляющий 1
Blade: GPU SuperBlade SBI-7127RG
2 х CPU Intel Xeon E5606
24 Gb RAM
2x SSD 80Gb
4x HDD 300Gb
InfiniBand 4x QDR (40Gbps)
Network 2x Gigabit Ethernet

Характеристики платформы
1. Intel® Xeon® processor E5-2600
family; QPI up to 8.0 GT/s
2. Intel® C602 Chipset
3. Up to 256GB RDIMM or 64GB UDIMM;
8x DIMM slots
4. Intel® i350 Dual port Gigabit Ethernet
5. 4x QDR (40Gb) InfiniBand or 10GbE
mezzanine HCA
6. IPMI 2.0, KVM over IP, Virtual Media
7. 1x SATA DOM up to 64GB
8. Integrated Matrox G200eW Graphics

CPU Intel Xeon E5-2650
Характеристика Значение
Семейство Intel Xeon E5-2600
Микроархитектура Sandy Bridge
Запуск в продажу Март 2012
Количество ядер 8
Поток на ядро 2
Часто базовая 2000 МГц
Частота турбо 2800 МГц (1 или 2 ядра)
2700 МГц (3 ядра)
2500 МГц (4, 5 или 6 ядер)
2400 МГц (7 или 8 ядер)
Кэш L3 20 Мбайт
Память 4 канала DDR 3
Инструкции AVX, SSE1-4, EM64T, AES и др.
Пиковая производительность
(double)
~150 Gflops

GPU Nvidia Tesla M2075
Характеристика Значение
Микроархитектура Fermi
Запуск в продажу 2011
Количество ядер 448
Частота ядер 1215 МГц
Память 6 Гбайт
Пропускная способность
памяти
144 Гбайт/с
Пиковая производи-
тельность (double)
~500 Gflops
На каждом узле содержится 2 карты: итого 14 карт Tesla
14шт. x 448ядер x 32нити => 200704 и это параллельно выполняющихся потоков, не
считая возможностей псевдопараллельного выполнения каждой картой до 65535 потоков!

High performance computing (HPC)
Первое
Первое блюдо (в частности суп) – по некоторым соображениям является очень
полезным составляющим обеда. В нашем контексте полезность заключается в
максимальной утилизации имеющихся ресурсов.

HPC-кластер
HPC архитектура предполагает превосходство времени вычислений над
временем доступа к данным. Поэтому отсутствие ЖД на вычислительных узлах
оправдано и широко распространено.

Программное обеспечение – обновлено
● ОС Alt Linux 7.0
● TORQUE — менеджер распределенных
ресурсов для вычислительных кластеров
● Компилятор gcc
● OpenMP
● OpenMPI
● OpenCL
● Nvidia CUDA Toolkit
OpenSUSE 13.2
(SLES 11.4)
Обновление
версии
версии
версии
версии
версии
версии

Уровни параллелизма
Программы уровня 0
● OpenMP + MPI + CUDA
● Максимальная загрузка
всей вычислительной
мощности

● Использование мощности
CPU или GPU всех узлов
● OpenMP + MPI
● CUDA
● Эффективность
применения: 60%

● Использование только CPU
● Эффективность
применения: 10 – 15%

Решаемые задачи
●
Исследования погодных и климатических явлений
●
Биоинформатика
●
Вычислительная гидродинамика
● Автоматизированное проектирование и рендеринг
●
Deep learnong
● Автоматизация проектирования электронных
устройств (EDA)
● Компьютерное зрение, обработка изображений и
видео
●
Исследование материалов
●
Медицинская визуализация
● Молекулярная динамика
●
Численный анализ
● Физика
● Квантовая химия
●
Структурная механика
●
Визуализация и стыковка

Так же можно принять участие...
...на безвозмездной основе в распределенных вычислениях по следующим
темам:
● Астрофизика (Albert@home, Asteroids@home, Cosmology@Home,
Einstein@Home)
● Физика (ATLAS@Home)
● Искусство (BURP, Electric Sheep)
● Биохимия (CAS@home)
● Изучение климата (Climate Prediction)
● Математика (Collatz Conjecture)
● Медицина и биология (DENIS@Home)
● Анализ данных и машинное обучение (DistributedDataMining)
● Криптография (Distributed.net)
● Изучение рака (DreamLab)
● Молекулярная биология (Folding@home)
… и множество других
Полный список:
https://en.wikipedia.org/wiki/List_of_distributed_computing_projects

Infrastructure-as-a-Service (IaaS)
Platform-as-a-Service (PaaS)
Второе
Второе – как например жареная картошечка с котлетой – вещь не
самая полезная, но без нее тоже неуютно.
Инфраструктура как услуга (IaaS, англ.
Infrastructure-as-a-Service)
предоставляется как возможность
использования облачной
инфраструктуры для самостоятельного
управления ресурсами обработки,
хранения, сетями и другими
фундаментальными вычислительными
ресурсами
Платформа как услуга (PaaS, англ.
Platform-as-a-Service) — модель,
когда потребителю предоставляется
возможность использования
облачной инфраструктуры для
размещения базового программного
обеспечения для последующего
размещения на нём новых или
существующих приложений

OpenStack
OpenStack — комплекс проектов
свободного программного обеспечения,
который может быть использован для
создания инфраструктурных облачных
сервисов и облачных хранилищ.

Реализация на кластере

Text

BigData
Десерт.
В нашем случае – это тортик.
Вещь приятная на вкус и цвет.

LHPChadoop на кластере БГУИР

HDFS
HDFS (Hadoop Distributed File System) — файловая система, предназначенная для хранения файлов
больших размеров, поблочно распределённых между узлами вычислительного кластера, создана
основываясь на концепции GoogleFS

HDFS и LHPChadoop кластер
Монтирование GlusterFS к
каждой машине, поверх
которых собрана HDFS

Hadoop MapReduce
Основе Hadoop вместе с HDFS находится парадигма MapReduce
MapReduce – это модель распределенной обработки данных,
предложенная компанией Google для обработки больших объёмов
данных на компьютерных кластерах.

YARN
Yet Another Resource Negotiator
YARN — «ещё один ресурсный посредник» — модуль, отвечающий за
управление ресурсами кластеров и планирование заданий.
YARN может быть рассмотрен как кластерная операционная система в том смысле,
что ведает интерфейсом между аппаратными ресурсами кластера и широким
классом приложений

Hive
Apache Hive – это инфраструктура хранения данных построенная поверх Hadoop
(т. е. HDFS+MapReduce) для предоставления возможностей сбора, выборки и
анализа информации.
HiveQL – SQL-подобный интерфейс доступа к данным хранящимся на HDFS

Pig
● Pig Latin
● User Defined Functions on Java,
Python, JavaScript, Ruby or Groovy
● lazy evaluation
● extract, transform, load (ETL)
● is able to store data at any point during
a pipeline
● declares execution plans
● supports pipeline splits, thus allowing
workflows to proceed along DAGs
instead of strictly sequential pipelines

Mahout
● Distributed Row Matrix API with R and Matlab
like operators
● Similarity Analysis
● Collaborative Filtering
● Classification
● Clustering
● Dimensionality Reduction note
● Frequent itemset mining
● etc.
Проект Mahout призван удовлетворить требования разработчиков и дата
сайнтистов в выполнении над БигДата машинного обучения. Обработка
основывается на парадигме MapReduce, хотя поддерживают и другие мдели.

Giraph
Giraph предназначен для обработки графов используя
парадигму MapReduce.
Facebook: анализ триллиона ребер графа используя
200 машин за 4 минуты

HBase
● HBase features compression
● in-memory operation
● Bloom filters on a per-column basis
● Replication across the data center
● Atomic and strongly consistent row-level operations
● Near real time lookups
● cells no larger than 10 MB
● 1 and 3 column families per table
● Time based versions
HBase — NoSQL распределённая база данных, является аналогом
Google BigTable. Работает поверх распределенной файловой
системы HDFS и обеспечивает BigTable-подобные возможности для
Hadoop.

Kafka
Apache Kafka — распределённый программный брокер сообщений.
● Масштабируемость
● Репликация
● Высокая пропускная
способность источников
и подписчиков
● Объединение
подписчиков в группы
● Временное хранение
для последующей
пакетной обработки
данных

Storm
Fast
● Fast
● Scalable
● Fault-tolerant
● Reliable
● Easy to operate
Apache Storm – распределенная near real-time система обработки поточных
данных.
Преимущественно MISD архитектура (конвейерная обработка).

Типичное применение

Spark – speed
Logistic regression in Hadoop and Spark
● Программный каркас с открытым исходным кодом для реализации
распределённой обработки неструктурированных и
слабоструктурированных данных.
● Использует специализированные примитивы для рекурентной обработки в
оперативной памяти
● Выполнение программ до 100 раз быстрее чем в Hadoop MapReduce в
памяти или до 10 раз с использованием диска

Spark – Ease of Use
Word count in Spark's Python API
● Поддерживаются Java, Scala, Python, R.
● Возможность интерактивной обработки с использованием коммандных
оболочек языков Scala, Python или R.

Spark – Speed
Streaming, SQL, Graph processing and machine
learning
Расширяется стеком библиотек включая SQL and DataFrames, MLlib for machine
learning, GraphX, and Spark Streaming.

Spark – speed
Access diverse data sources including
HDFS, Cassandra, Hbase, S3, Hive,
Tachyon, and any Hadoop data source

Вишенка на торте

Zeppelin
Браузерное приложение
позволяющее в виде небольших
записных книжек интерактивно
выполнять анализ и визуализацию
данных используя
производительность подсистем
Hadoop и Spark.
Поддерживается написание
скриптов подготовки, обработки и
визуализации данных на Scala,
Hive, SparkSQL, Linux Shell,

Zeppelin

Архитектура проекта анализа трафика
кафедра ЭВМ
|grep http,GET,POST,CONNECT...
Получение трафика с
маршрутизатора
Фильтрация пакетов
Передача в брокер
Kafka
Поточная обработка
Сопряжение с
данными из ресурсов
университета
Постоянное
хранилище данных о
трафике,
расписаниях, списках
групп
Механизм
представления
данных
пользователю

Что касается BigData в целом

Но мы-то знаем..!

Возможности
1. Развитие инфраструктуры кластера в направлении BigData
2. Изучение технологий BigData: Data Computing, Data Sciense
3. Накопление и анализ опыта участия в различных проектах в
виде данных

Кластер БГУИР: расширенные возможности

More Related Content

What's hot (20)

Similar to Кластер БГУИР: расширенные возможности (20)

Кластер БГУИР: расширенные возможности

Editor's Notes