Семинар 3
Семинар: "Байесовские сети как основа коллективного
интеллекта в мультиагентных системах"
Цель: Сформировать у студентов понимание того, как
байесовские сети могут быть использованы для представления знаний, принятия
решений и координации в мультиагентных системах в условиях неопределенности.
Основные вопросы:
· Ключевая проблема: Принятие решений в условиях
неопределенности и ограниченности знаний.
· Недостаток классических подходов: Детерминированные
правила ("если увидел дым, то сообщи о пожаре") приводят к ложным
срабатываниям и нескоординированным действиям.
· Предлагаемое решение: Использовать байесовские сети
как "разум" каждого агента, позволяющий ему:
1. Иметь
собственное, вероятностное представление о мире (Belief).
2. Обновлять это
представление на основе новых свидетельств (Байесовский вывод).
3. Обмениваться не
сырыми данными, а этими "убеждениями" (Beliefs) для достижения
консенсуса.
Теоретические сведения
Пример "Пожарный дрон"
Задача: Дрон-разведчик обследует лес. Его сенсоры
ненадежны.
· Основные концепции:
1. Условная
вероятность: "Как изменится уверенность в гипотезе (A) после появления
свидетельства (B)?"
2. Байесовская сеть:
Граф как компактное представление совместного распределения вероятностей.
· Узлы: Случайные
переменные (Пожар, Дым, Сообщение_от_дрона).
· Ребра:
Причинно-следственные или условные зависимости.
· Таблицы
условных вероятностей (CPT): "Знания" агента о мире.
3. Байесовский вывод
(Inference):
· Задача:
Вычислить P(Гипотеза | Свидетельства).
· Пример:
"Сенсор показал 'дым'. Какова теперь вероятность P(Пожар | Дым=Да)?"
Расчет по формуле
Байеса.
· Важность
априорной вероятности: P(Пожар) = 0.01 (в лесу) или 0.0001 (в городе) – существенно
меняет вывод.
Интеллектуальные агенты и МАС
· Интеллектуальный агент: Автономная сущность, которая:
· Воспринимает среду
(сенсоры).
· Действует
(актуаторы).
· Стремится к цели.
Байесовская сеть — это модель мира агента. Она
отвечает на вопрос: "Во что я должен верить, учитывая все, что я видел и
слышал?"
Мультиагентная система (МАС): Множество таких
агентов.
· Проблемы МАС:
· Координация: Как
избежать ситуации, когда все агенты делают одно и то же?
· Кооперация: Как
объединить усилия для достижения общей цели?
· Коммуникация: Что
именно передавать? Сырые данные или обработанную информацию?
Синтез: БС + МАС = Коллективный Интеллект
Решение проблем МАС при помощи БС
Жизненный цикл байесовского агента":
1. Восприятие:
Получить данные с сенсора (e.g., Дым=Да).
2. Локальный
вывод: Обновить свою БС. Вычислить P(Пожар | Дым=Да) = 0.75. Это его личное
убеждение (Belief).
3. Коммуникация
(Что передавать?):
· Не следует: передавать сырые данные
(Дым=Да). Сосед не знает контекста.
· Следует:
Передать свое убеждение ("Я уверен на 75%, что здесь пожар") или даже
всю распределенную оценку. Это семантически богаче.
4. Получение
сообщений: Получить убеждения соседей (Агент_B: Уверенность=0.9, Агент_C:
Уверенность=0.3).
5. Интеграция
свидетельств: Ввести в свою БС новые узлы Сообщение_от_B и Сообщение_от_C,
связав их с гипотезой Пожар. Провести новый вывод с учетом всех свидетельств.
Получить P(Пожар | Все_свидетельства) = 0.95.
6. Принятие
решения: На основе обновленной уверенности действовать (например, если >
0.9, -> атаковать очаг).
· Преимущества подхода:
· Естественная
обработка шума: Противоречивые сообщения не "ломают" систему, а лишь
понижают общую уверенность.
· Экономия
коммуникации: Можно передавать только значимые изменения в убеждениях.
· Распределенность: Каждый агент сам отвечает за свою "картину мира", нет единой точки отказа.
Байесовские сети превращают агентов из простых исполнителей
правил в разумных субъектов, способных к настоящей кооперации в неопределенном
мире.
Задание 1: "Проектирование простой БС" (5 минут)
Сценарий: Вы создаете агента-охранника для умного дома. Его задача — определять, произошло ли проникновение (Проникновение = Да/Нет).
Данные:
· Агент имеет два сенсора:
1. Датчик движения (Движение = Да/Нет)
2. Датчик разбития стекла (Звук = Да/Нет)
· Известно, что:
· Датчик движения иногда срабатывает на домашних животных (P(Движение=Да | Проникновение=Нет) = 0.1)
· Датчик звука очень надежен при обнаружении разбития стекла (P(Звук=Да | Проникновение=Да) = 0.95)
Задача:
1. Нарисуйте байесовскую сеть (узлы и связи)
2. Заполните таблицы условных вероятностей для узлов Движение и Звук
3. Какие априорные вероятности вы бы назначили узлу Проникновение и почему?
Задание 2: "Байесовский вывод в уме"
Сценарий: Ваш агент-охранник из Задания 1 зафиксировал срабатывание датчика движения (Движение = Да), но датчик звука молчит (Звук = Нет).
Исходные данные:
· P(Проникновение=Да) = 0.01 (очень низкая априорная вероятность)
· P(Движение=Да | Проникновение=Да) = 0.9
· P(Движение=Да | Проникновение=Нет) = 0.1
· P(Звук=Да | Проникновение=Да) = 0.95
· P(Звук=Да | Проникновение=Нет) = 0.01
Задача:
1. Оцените P(Проникновение=Да | Движение=Да, Звук=Нет)
2. Как изменится уверенность агента, если оба датчика сработают одновременно?
3. При каком пороге уверенности (> ?%) агент должен вызывать полицию?
Задание 3: "Коммуникация убеждений"
Сценарий: Теперь у вас два агента-охранника в разных комнатах одного дома.
· Агент A: Имеет только датчик движения. Его текущая уверенность: P_A(Проникновение=Да) = 0.3
· Агент B: Имеет только датчик звука. Его текущая уверенность: P_B(Проникновение=Да) = 0.8
Задача:
1. Что должен передать Агент B Агенту A? (сырые данные или свое убеждение?)
2. Как Агент A должен интегрировать полученную информацию?
3. Предложите простое правило для принятия коллективного решения (когда система считает, что проникновение действительно произошло)
Задание 4: "Разрешение конфликта свидетельств"
Сценарий: Три дрона обследуют зону возможного пожара.
· Дрон 1: P_1(Пожар=Да) = 0.9 (видит открытое пламя)
· Дрон 2: P_2(Пожар=Да) = 0.1 (не видит ничего подозрительного)
· Дрон 3: P_3(Пожар=Да) = 0.6 (видит слабый дым)
Задача:
1. Какой будет коллективная уверенность при простом усреднении?
2. Почему простое усреднение может быть плохой идеей?
3. Предложите лучший механизм агрегации убеждений и обоснуйте свой выбор
Задание 5: "Проектирование протокола взаимодействия"
Сценарий: Команда из 5 роботов-курьеров должна доставить 5 посылок в 5 разных точек города. У каждого робота:
· Своя БС с представлением о загруженности дорог
· Ограниченный заряд батареи
· Возможность обмениваться сообщениями
Задача:
Спроектируйте простой протокол взаимодействия,где роботы:
1. Сообщают друг другу о обнаруженных пробках
2. Перераспределяют задания при низком заряде батареи
3. Координируют маршруты чтобы избежать столкновений
Опишите:
· Какие типы сообщений будут передаваться?
· Что будет содержаться в сообщении (сырые данные или убеждения)?
· Как агент обрабатывает входящие сообщения?