Тематический план
О курсе / About this course
В курсе рассматриваются вопросы о том, что такое Большие Данные (Big Data) и как с ними работать. В процессе изучения мы затронем такие темы, как базовые принципы анализа данных применительно к большим массивам данных; основы распределённых и параллельных вычислений; современные системы хранения и обработки больших данных, используемые в индустрии (Hadoop, Spark, Storm, HBase,Cassandra и др.). Курс содержит практическую часть в виде лабораторных работ, на которых Вы получите навыки работы с Apache Spark и библиотекой для анализа данных и машинного обучения MLlib.
In this course you will learn what is Big Data and how to deal with them. We’ll cover key topics such as principals of data analysis applied to massive datasets, basics of distributed and parallel computing, modern storage and processing systems used in industry mainly Hadoop, Spark, Storm, HBase, Cassandra etc. The course includes a practical part in the form of labs where you will get experience with Apache Spark and the special library, MLlib, for data analysis and machine learning.
Программа курса / Syllabus
Модуль 1. Большие Данные и Анализ Данных
Модуль 2. Распределенные и параллельные вычисления
Модуль 3. Системы обработки и хранения больших данных
Модуль 4. Большие Данные и облачные сервисыModule 1. Big Data and Data Analysis
- Big Data Concept
- Use Cases
- Data Analysis and Machine Learning
Module 2. Distributed and Parallel Computing
- Parallelism at different levels
- Distributed and Shared Memory Computing
- Technologies for distributed and parallel programming
- Distributed Computing
Module 3. Big Data Processing and Storage Systems
- Distributed File Systems
- Relational and NoSQL Database Management Systems
- Batch Processing Systems
- Stream Processing Systems
- Graph Processing Systems
Module 4. Big Data and Cloud Services (optional)
Автор / Created by
МГТУ им. Н.Э. Баумана
к.т.н., доцент,
Папулин Сергей ЮрьевичBauman Moscow State Technical University, Moscow, Russia
PhD, Associate Professor,
Sergei Papulin