Тематический план

  • О курсе / About this course

    В курсе рассматриваются вопросы о том, что такое Большие Данные (Big Data) и как с ними работать. В процессе изучения мы затронем такие темы, как базовые принципы анализа данных применительно к большим массивам данных; основы распределённых и параллельных вычислений; современные системы хранения и обработки больших данных, используемые в индустрии (HadoopSparkStormHBase,Cassandra и др.). Курс содержит практическую часть в виде лабораторных работ, на которых Вы получите навыки работы с Apache Spark и библиотекой для анализа данных и машинного обучения MLlib.

    In this course you will learn what is Big Data and how to deal with them. We’ll cover key topics such as principals of data analysis applied to massive datasets, basics of distributed and parallel computing, modern storage and processing systems used in industry mainly Hadoop, Spark, Storm, HBaseCassandra etc. The course includes a practical part in the form of labs where you will get experience with Apache Spark and the special library, MLlib, for data analysis and machine learning.

    • Программа курса / Syllabus

      Модуль 1. Большие Данные и Анализ Данных
      Модуль 2. Распределенные и параллельные вычисления
      Модуль 3. Системы обработки и хранения больших данных
      Модуль 4. Большие Данные и облачные сервисы

      Module 1. Big Data and Data Analysis

      • Big Data Concept
      • Use Cases
      • Data Analysis and Machine Learning

      Module 2. Distributed and Parallel Computing

      • Parallelism at different levels
      • Distributed and Shared Memory Computing
      • Technologies for distributed and parallel programming
      • Distributed Computing

      Module 3. Big Data Processing and Storage Systems

      • Distributed File Systems
      • Relational and NoSQL Database Management Systems
      • Batch Processing Systems
      • Stream Processing Systems
      • Graph Processing Systems

      Module 4. Big Data and Cloud Services (optional)

      • Автор / Created by

        МГТУ им. Н.Э. Баумана
        к.т.н., доцент,
        Папулин Сергей Юрьевич

        Bauman Moscow State Technical University, Moscow, Russia
        PhD, Associate Professor,
        Sergei Papulin