Содержание дисциплины, структурированное по модулям

Модуль 1. OLAP системы. Объем: 51 час.

Лекции по модулю 1. Содержание. Объем: 20 часов:

Лекция1. Введение в оперативный анализ данных - OLAP систем. Цели и задачи курса. Архитектура OLAP систем: OLAP-клиент, OLAP-сервер. (2 часа)

Лекция2. Основные способы реализации OLAP систем. MOLAP структура и основные свойства. ROLAP структура и основные свойства. HOLAP структура и основные свойства (2 часа)

Лекция3. Математическая модель OLAP кубов. Многомерное представление данных. Кубы. Измерения. Иерархии. Агрегирующие функции, меры. Виды запросов к кубам. Операции, выполняемые над гиперкубом. (2 часа)

Лекция 4. Общая схема и алгоритм работы с OLAP системой. Подготовка данных, загрузка данных в гиперкуб, реализация гиперкуба и построения срезов. (2 часа)

Лекция 5. Источники данных. Классификация типов источников данных. Предназначение, структура и свойства OLTP систем. Преимущества, недостатки, проблемы, возникающие при прямом доступе к источникам данных.  (2 часа)

Лекция 6. Извлечение и преобразование данных ETL. Подходы к реализации ETL процесса. Элементы ETL процесса. Диаграммы движения, преобразования и управления преобразованием данных. Моделирование движения данных. (2 часа)

Лекция 7. Введение в хранилище данных (ХД). Обзор архитектур ХД. Типовая структура хранилищ данных. Основные особенности концепции ХД. Основные требования к ХД. Основные концепции ХД. (2 часа)

Лекция 8. Задачи, решаемые ХД. Многомерные хранилища данных. Гибридные ХД. Витрины данных. Централизованное ХД с витринами данных. Виртуальные ХД. (2 часа)

Лекция 9. Трансформация данных. Основные методы трансформации данных. Группировка данных. Разгруппировка данных. Слияние данных. Операции над таблицами: объединение, внутреннее соединение, внешнее соединение, полное внешнее соединение (4 часа)

Лабораторные работы по модулю 1. Содержание. Объем: 18 часов.

1.     Машинное обучение. Часть 1.                                                                            (4 часа)

2.     Машинное обучение. Часть 2.                                                                            (4 часа)

3.     Эволюционные алгоритмы.                                                                                (4 часа)

4.     Изучение инструментариев интепретатора языка Haskell и графического интерфейса. (6 часа)

Самостоятельная работа. Объем: 13 часов.

Проработка разделов лекционного курса    -           - 2 часа.

Подготовка к лабораторным работам                   - 8 часов.

Подготовка к рубежному контролю                       - 3 часа.

Модуль 2. Data Mining. Объем: 53 часа.

Лекции по модулю 2.  Содержание. Объем: 12 часов:

Лекция 1.

Интеллектуальный анализ данных Data Mining. Задачи Data Mining: классификация, регрессия, ассоциативные правила, кластеризация.                                                        (2 часа)

Лекция 2.

Модели Data Mining: описание и предсказание. Методы Data Mining: базовые методы, нечеткая логика, генетические алгоритмы, нейронные сети.                          (2 часа)

Лекция 3.

Методы Data Mining – Базовые методы. Нечеткая логика. Генетические алгоритмы. Нейронные сети.                                                                                                                 (2 часа)

Лекция 4.

Классификация. Постановка задачи. Правила классификации. Деревья решений. Методы построения правил классификации, деревьев решений.                                  (2 часа)

Лекция 5.

Кластеризация. Постановка задачи. Меры близости, основанные на расстояниях. Алгоритмы кластеризации.                                                                                                (2 часа)

Лекция 6

Прогнозирование. Постановка задачи. Задачи прогнозирования. Методы и модели прогнозирования. Классификация методов прогнозирования. Аналитические методы прогнозирования. Статистические методы прогнозирования. Временные ряды.

(2 часа)

Лабораторные работы по модулю 2. Объем часов: 16 часов.

1.       Изучение ПО Pentaho Report Designer.                                                                (4 часа)

2.       Знакомство с BI QlickView.                                                                                (4 часа)

3.       Построение датологической и ассоциативной моделей на базе BI QlickView.     (4 часа)

4.       Средства визуализации данных.                                                                        (4 часа)

Самостоятельная работа. Объем: 25 часов.

Проработка разделов лекционного курса                           - 2 часа.

Подготовка к лабораторным работам                              - 8 часов.

Подготовка к рубежному контролю                                   - 3 часа.

Выполнение домашнего задания                                          - 12 часов.

Модуль 3. Обобщение пройденного материала. Объем: 4 часа.

Лекции по модулю 3. Содержание. Объем: 2 часа:

Лекция 1.

Визуализация данных. Введение. Цели и задачи визуализации. Инструменты визуализации. Методы визуализации. Методы геометрических преобразований. Отображение иконок. Методы, ориентированные на пиксели. Иерархические образы. Обзор пройденного материала.                                                                                         (2 часа)

Самостоятельная работа. Объем: 2 часа.

Другие виды самостоятельной работы                              - 2 часа.


Последнее изменение: Четверг, 7 мая 2020, 20:01