Разработка нейросетевых систем
Настоящая рабочая программа дисциплины разработана кафедрой ИУ5 «Системы обработки информации управления» в соответствии с Самостоятельно устанавливаемым образовательным стандартом (СУОС), основной профессиональной образовательной программой по направлению подготовки 09.04.01 «Информатика и вычислительная техника».
Цель изучения дисциплины – изучение теоретических положений и практических методов проектирования интеллектуальных систем на основе методов вычислительного интеллекта и экспертных систем. Полученные знания дают более глубокое понимание значимости будущей специальности, формируют ответственное отношение к профессиональной деятельности.
Общий объем дисциплины составляет 4 зачетные единицы (з.е.), 144 час.
В том числе: 2 семестр - 4 з.е. (144 час.).
Объём дисциплины по видам учебных занятий (в часах):
Виды учебной работы |
Объем в часах по семестрам |
|
Всего |
2 семестр |
|
Объём дисциплины: |
144 |
144 |
Аудиторная работа (всего) |
51 |
51 |
· Лекции (Л) |
17 |
17 |
· Лабораторные работы (ЛР) |
34 |
34 |
2. Самостоятельная работа обучающихся (СР) (всего) |
93 |
93 |
· Проработка учебного материала лекций |
4 |
4 |
· Подготовка к лабораторным работам и написание отчета |
8 |
8 |
· Подготовка к рубежному контролю, контрольной работе |
6 |
6 |
· Выполнение домашнего задания |
21 |
21 |
· Подготовка к экзамену |
30 |
30 |
· Другие виды самостоятельной работы (подготовка докладов, рефератов, презентации и т.п., к зачету и распределенному экзамену) |
24 |
24 |
Вид промежуточной аттестации обучающегося |
Экзамен |
Экзамен |
Содержание дисциплины, структурированное по разделам (темам)
Модуль 1. Основы предобработки исходных данных (76 часов).
Лекции по модулю 1 (12 часов).
1. Введение в область искусственного интеллекта (2 часа).
Понятие интеллекта. Область и подходы к определению искусственного интеллекта (ИИ). Информационный, бионический и эволюционный подходы. Интеллектуальные системы. Цели, задачи и возможность создания ИИ. Этапы развития и основные направления ИИ. Основные понятия и определения ИИ и вычислительного интеллекта.
2. Проектирование систем вычислительного интеллекта на основе нейронных сетей (4 часа).
Нейронные сети и их применение в ИС. Математические модели нейронов. Однослойные и многослойные искусственные нейронные сети. Обучение нейронных сетей. Персептроны. Процедура обратного распространения. Нейронные сети ассоциативной памяти. Сверточные нейронные сети и алгоритмы глубокого обучения.
3. Основные подходы к предобработке исходных данных (6 часов).
Определения. Нормализация данных, виды нормализации. Удаление аномальных значений. Восстановление пропущенных данных. Методы формирования обучающих выборок. Понятие переобучение/недообучения нейронных сетей и способы борьбы с ними. Регуляризация параметров сети, early-stopping, принцип проектирования минимальной достаточной архитектуры сети. Классификаторы сверточной нейронной сети в виде однослойного персептрона и их оптимизация с помощью различных методов обучения.
Лабораторные работы по модулю 1 (17 часов).
1. Проектирование и оптимизация классификатора сверточной нейронной сети для распознавания образов (8 часов).
Постановка и формализация задачи распознавания образов. Предобработка исходных данных. Реализация процедуры разметки изображений и создание базы данных размеченных изображений. Анализ и оценка методов оптимизации классификатора сверточной нейронной сети прямого распространения в виде однослойного персептрона. Проектирование алгоритма оптимизации количества нейронов скрытого слоя персептрона для сверточной нейронной сети прямого распространения с помощью различных методов обучения (инкрементального, расщепления нейронов и генетического алгоритма). Анализ полученных результатов и разработка отчета.
1. Проектирование и оптимизация классификатора сверточной нейронной сети для обработки текстов (9 часов).
Постановка и формализация задачи обработки текстов. Предобработка исходных данных. Реализация процедуры разметки текстов. Анализ и оценка методов оптимизации классификатора сверточной нейронной сети встречного распространения в виде однослойного персептрона. Проектирование алгоритма оптимизации количества нейронов скрытого слоя персептрона для сверточной нейронной сети встречного распространения с помощью различных методов обучения (инкрементального, расщепления нейронов и генетического алгоритма). Анализ полученных результатов и разработка отчета.
Самостоятельная работа по модулю 1 (47 часов).
1. Проработка учебного материала лекций (12 часов).
2. Подготовка к лабораторным работам и написание отчета (26 часов).
3. Подготовка к рубежному контролю (3 часа).
4. Подготовка к презентации л/р (6 часов).
Модуль 2 – Основы проектирования сверточных нейронных сетей (68 часов).
Лекции по модулю 2 (5 часов).
1. Глубокие сверточные нейронные сети. (2 часа)
Определения. Основные принципы оптимизации архитектур сверточных нейронных сетей. Алгоритмы Boosting-Bagging-Stacking. Достоинства и недостатки интеллектуальных систем на основе сверточных нейронных сетей. Типичные ошибки при проектировании интеллектуальных систем на основе сверточных нейронных сетей.
2. Нейронные сети прямого распространения для распознавания изображений и встречного распространения для обработки текста. (3 часа).
Определения. Общий подход к сборке искусственных нейронных сетей различных архитектур на высокоуровневых языках программирования и с помощью фреймворков. Достоинства и недостатки. Особенности обучения нейронной сети прямого распространения и нейронной сети встречного распространения.
Лабораторные работы по модулю 2 (17 часов).
3. Проектирование нейронной сети прямого распространения для распознавания образов - (8 часов).
Постановка и формализация задачи проектирования. Вариант 1: проектирование простой нейронной сети прямого распространения, содержащей два сверточных и один полносвязный слои, на высокоуровневом языке программирования. Вариант 2: проектирование сложной нейронной сети прямого распространения с помощью фреймворка Caffe/Keras/TensorFlow. Сборка сети. Обучение созданной нейронной сети. Анализ и визуализация полученных результатов по обучению сети и разработка отчета.
4. Проектирование нейронной сети встречного распространения для обработки текста (9 часов).
Постановка и формализация задачи проектирования. Вариант 1: проектирование сети Элмана на высокоуровневом языке программирования. Вариант 2: проектирование deep LSTM на фреймворке Caffe/Keras/TensorFlow. Сборка сети. Обучение созданной нейронной сети. Анализ и визуализация полученных результатов по обучению сети и разработка отчета.
Самостоятельная работа по модулю 2 (46 часов).
1. Проработка
учебного материала лекций (6 часов).
2. Подготовка к лабораторным работам и написание отчета (26 часа).
3. Подготовка к рубежному контролю (3 часа).
4. Подготовка к презентации л/р (11 часов).
Основная литература по дисциплине
1. Caffe is a deep learning framework, http://caffe.berkeleyvision.org
2. Keras: The Python Deep Learning library, https://keras.io/
Дополнительные учебные материалы
1. Девятков В.В. Системы искусственного интеллекта. М.: Изд-во МГТУ им. Баумана, 2001. 352 с.
2. Рыбина Г.В. Основы построения интеллектуальных систем // М.: Финансы и статистика, Инфра-М, 2010. 432 с.
3. 4. Люгер Джордж Ф. "Искусственный интеллект. Стратегии и методы решения сложных проблем". М. Издательский дом "Вильямс", 2005 - 864 стр.
5. Хайкин С. Нейронные сети: полный курс, 2-е издание. – Издательский дом Вильямс, 2008.
6. Sedgewick R., Flajolet F. An Introduction to the Analysis of Algorithms (2nd Edition), 2013, s. 3-26.
7. Макаров И. М. Искусственный интеллект и интеллектуальные системы управления / И. М. Макаров, В. М. Лохин, С. В. Манько; отделение информационных технологий и вычислительных систем РАН. – М.: Наука, 2006. С. 30-31.
8. A. Li, L. Liu, K. Wang, S. Liu and S. Yan, "Clothing Attributes Assisted Person Reidentification," in IEEE Transactions on Circuits and Systems for Video Technology, vol. 25, no. 5, pp. 869-878, May 2015.
9. E. S. Jaha and M. S. Nixon, "From Clothing to Identity: Manual and Automatic Soft Biometrics," in IEEE Transactions on Information Forensics and Security, vol. 11, no. 10, pp. 2377-2390, Oct. 2016.
11. Стюарт Рассел (Stuart Russell) и Питер Норвиг (Peter Norvig) Искусственный интеллект: современный подход (AIMA), 2-е издание (Artificial Intelligence: A Modern Approach, 2nd Edition), 2007 - 1408 стр.
12. 9. Veit A. et al. Learning visual clothing style with heterogeneous dyadic co-occurrences //Proceedings of the IEEE International Conference on Computer Vision. – 2015. – С. 4642-4650.
Перечень ресурсов сети интернет, рекомендуемых для самостоятельной работы при освоении дисциплины
· Caffe - основы глубокого обучения http://caffe.berkeleyvision.org
· Keras: библиотека глубокого обучения Python https://keras.io/
· TensorFlow: Библиотека программного обеспечения с открытым исходным кодом для Machine Intelligence https://www.tensorflow.org/
· Массовый открытый образовательный курс Udacity «Введение в искусственный интеллект» / Питер Норвиг, Дэвид Тран (Intro to Artificial Intelligence / Peter Norvig, Sebastian Thrun) ‑ http://www.udacity.com/course/cs271
· Массовый открытый образовательный курс Coursera «Нейронные сети в обучении машин» (Geoffrey Hinton ) ‑ http://www.coursera.org/course/neuralnets
· Массовый открытый образовательный курс Coursera «Разработка технологии искусственного интеллекта» / Gerhard Wickler, Austin Tate ‑ https://www.coursera.org/course/aiplan
· Дистанционные учебные курсы Национального открытого университета «ИНТУИТ» в области искусственного интеллекта http://www.intuit.ru/studies/courses?service=0&option_id=17&service_path=1