Тематический план
Лабораторные работы 4 семестр
Требования к отчетам по лабораторным работам:
- Титульная страница должна соответствовать шаблону в ЭУ.
- По каждому заданию нужно привести текст задания из методички (Ctrl+C, Ctrl-V).
- По каждому заданию должны быть выводы по проделанной работе.
- В конце лабораторной работы должны быть ответы на контрольные вопросы.
Контрольные мероприятия 4-й семестр
- Вопросы итогового рубежного контроля:
- Длинная петля реплея процессора P6 состоит из блоков.
- Упорядочите состояния микрокоманд в Reorder Buffer порядке их изменения.
- Что хранится в Z-буфере?
- Для чего используется Z-буфер?
- Какой тип данных обычно используется для хранения значений глубины в Z-буфере?
- Какие минимальные вычислительные единицы использованы в архитектуре NVIDIA GPU?
- Как Retirement Unit управляет зависимостями между инструкциями?
- В каком случае допускается выгрузка результатов в память из Блока связи с памятью (Memory Order Buffer)?
- В предыдущие два раза переход по указанному в команде jg адресу был совершен в первый раз и не совершен во второй раз. Каков будет результат предсказания в BTB с двухбитной историей переходов для указанного адреса перехода в следующий раз?
- В предыдущие два раза переход по указанному в команде jg адресу был совершен в первый раз и не совершен во второй раз. Каков будет результат предсказания в BTB с двухбитной историей переходов для указанного адреса перехода в следующий раз?
- В предыдущий раз команда ветвления привела к переходу к следующей команде (переход не совершен). Каков будет результат предсказания в BTB с двухбитной историей переходов для указанной команды в следующий раз?
- В предыдущий раз команда ветвления привела к переходу по указанному в ней адресу. Каков будет результат предсказания в BTB для указанного адреса перехода в следующий раз?
- В предыдущий раз команда ветвления привела к переходу по указанному в ней адресу. Каков будет результат предсказания в BTB для указанной команды в следующий раз?
- Что происходит, если два полигона проецируются на один и тот же пиксель, и у них одинаковое значение Z?
- Возможен ли поиск в кэш-памяти данных первого уровня L1D по физическому адресу?
- Какую архитектуру использует вычислительный комплекс Тераграф?
- Какую структуру данных использует процессор SPE для ускорения поиска (вычислительный комплекс Тераграф)?
- Что делает функция `mq_receive(unsigned int bufsize, char *buf)` в sw_kernel в библиотеке lnh64 (вычислительный комплекс Тераграф)?
- Как инициализируется GPC?
- Какую архитектуру имеет процессор CPE в составе GPC (вычислительный комплекс Тераграф)?
- Какую архитектуру имеет процессор SPE (вычислительный комплекс Тераграф)?
- Сколько ключей-значений можно разместить в локальной памяти одного ядра DISC GPC (вычислительный комплекс Тераграф)?
- Какой максимальный объем локальной памяти доступен для одного ядра DISC GPC (вычислительный комплекс Тераграф)?
- В каком типе памяти хранятся ключи и значения в процессоре SPE (вычислительный комплекс Тераграф)?
- Каково назначение функции `def_handlers в библиотеке gpc64io`?
- Какая технология используется для ускорения передачи данных через аппаратные очереди (вычислительный комплекс Тераграф)?
- Какую ключевую роль играет процессор lnh64 в архитектуре Тераграфа?
- Какая основная функция процессора lnh64 в комплексе Тераграф?
- Какие функции выполняет хост-подсистема в вычислительном комплексе Тераграф?
- Что возвращают функции `mq_send_buf` и `mq_receive_buf в библиотеке gpc64io`?
- Что происходит после передачи сигнала инициализации в GPC (вычислительный комплекс Тераграф)?
- Для чего используется метод `finish()` объекта gpc в библиотеке gpc64io?
- Как хост-подсистема вызывает обработчик (handler) в загруженном software kernel (вычислительный комплекс Тераграф)?
- В каком состоянии находится GPC во время выполнения обработчика, вызванного хост-подсистемой (вычислительный комплекс Тераграф)?
- Как хост-подсистема узнает о завершении обработки обработчика в GPC (вычислительный комплекс Тераграф)?
- Как загружается sw_kernel в примере host-приложения (вычислительный комплекс Тераграф)?
- Как происходит вызов обработчиков в sw_kernel из host-приложения (вычислительный комплекс Тераграф)?
- Как определяются номера обработчиков в файле `gpc_handlers.h` (вычислительный комплекс Тераграф)?
- Как обеспечивается синхронизация между GPC и хост-подсистемой (вычислительный комплекс Тераграф)?
- Что такое LSM в контексте вычислительного комплекса Тераграф?
- Какой механизм используется для обмена большими массивами данных между host-приложением и sw_kernel в примере с echo-пакетами (вычислительный комплекс Тераграф)?
- Что характерно для набора команд DISC (вычислительный комплекс Тераграф)?
- Какие операции поддерживает набор команд DISC процессора lnh64 (вычислительный комплекс Тераграф)?
- Поддерживает ли GPC многопоточность?
- Какая ключевая особенность микроархитектуры гетерогенного ядра обработки графов (GPC), вычислительный комплекс Тераграф?
- Как обеспечивается параллельная обработка в Тераграфе?
- Какой размер имеет базовое сообщение, передаваемое функцией `mq_send(...) в библиотеке Lnh64 (вычислительный комплекс Тераграф)`?
- Что возвращает функция `mq_send(unsigned int bufsize, char *buf) в библиотеке Lnh64 (вычислительный комплекс Тераграф)`?
- Какой объем оперативной памяти (ОЗУ) имеет каждый вычислительный элемент CPE (вычислительный комплекс Тераграф)?
- Что происходит, если принимающая сторона не читает данные из очереди вовремя при обмене данными между GPC и хост-системой через аппаратные очеред?
- Как взаимодействует подсистема обработки графов с хост-подсистемой (вычислительный комплекс Тераграф)?
- Упорядочите следующие действия по стадиям графического конвейера: Вычисление цвета пикселя, Преобразование координат вершин, Определение видимости пикселей, Отображение на экране, Обрезка, Растеризация.
- Что происходит на этапе "Transform"?
- Что происходит на этапе "Rasterize"?
- Какое действие выполняется на этапе "Visibility/Blend"?
- Длинная петля реплея процессора P6 состоит из блоков
- Как BTB помогает в увеличении производительности процессора?
- Как происходит обновление TLB после изменения страниц в оперативной памяти?
- Какая степень ассоциативности используется в большинстве случаев в кэш L2 и L1 современных микропроцессоров?
- Какая(какие) из команд являются "простыми" для декодеров микропроцессора P6?
- Какая(какие) из команд являются "сложными" для декодеров микропроцессора P6?
- Какие из перечисленных блоков процессора P6 относятся к InOrder части конвейера?
- Какие из перечисленных блоков процессора P6 относятся к OutOfOrder части конвейера?
- Какие из перечисленных блоков процессора P6 составляют видимое состояние (Visible State)
- Какие преимущества использования физических регистров?
- Какова главная функция Retirement Unit в Intel P6?
- Какова основная задача буфера меток перехода (BTB)?
- Какова основная функция регистров замещения в микропроцессоре Intel P6?
- Какова основная функция устройства выборки команд?
- Какова роль блока удаления и восстановления в ЭВМ?
- Какова роль буфера переупорядочивания команд?
- Какова функция блока вычисления адреса следующей команды?
- Каково основное назначение блока шинного интерфейса?
- Каково основное различие между статическим и динамическим предсказанием переходов?
- Какое количество портов запуска в микропроцессоре P6?
- Какое назначение блока BTB в суперскалярных микропроцессорах?
- Какой алгоритм, часто используемый для управления содержимым TLB, предполагает замену самой старой записи?
- Какой из методов используется для устранения конфликтов по данным в конвейере?
- Какой из следующих факторов может негативно влиять на производительность TLB?
- Какой тип организации кэш применяется в современных процессорах?
- Какой(какие) размер(ы) кэш-линейки используется в современных процессорах?
- Короткая петля реплея процессора P6 состоит из блоков
- Какой компонент в модели взаимодействия OpenCL отвечает за инициализацию платформы и запуск kernels?
- Что такое kernel в контексте OpenCL?
- Для чего используется контекст (context) в OpenCL?
- В какой части модели OpenCL происходит параллельная обработка данных?
- Какой тип памяти устройства OpenCL имеет наибольший объем, но и самый медленный доступ?
- Какая память доступна всем рабочим элементам (work-items) в пределах одного рабочего блока (work-group)?
- Что такое память хоста в контексте OpenCL?
- Какое утверждение о когерентности памяти в OpenCL верно?
- Что представляет собой kernel в контексте GPGPU?
- Какое из следующих утверждений описывает потенциальное узкое место в схеме GPGPU?
- Что отвечает за параллельную обработку данных в GPGPU?
- Как характер доступа к памяти отличается в CPU и GPU?
- В каком типе процессора распараллеливание доступа к памяти более эффективно?
- Что занимает большую часть площади кристалла в CPU?
- Какой тип процессора более эффективен при обработке данных с зависимостями?
- С помощью какой команды(команд) можно выполнить программную предвыборку?
- Сколько портов запуска в микропроцессоре P6 используется Блоком связи с памятью (MIU)?
- Сколько портов запуска в микропроцессоре P6 используется при выгрузке результатов в память?
- Сколько портов запуска в микропроцессоре P6 используется при загрузке операнда из памяти?
- Упорядочите стадии графического конвейера в правильной последовательности. Выберите правильную последовательность из предложенных вариантов.
- На каком этапе происходит определение того, какие части сцены видны, а какие скрыты?
- Упорядочите этапы обработки геометрии в графическом конвейере: Transform, Rasterize, Clip, Shade.
- Какой тип шейдера отвечает за обработку вершин геометрических объектов?
- Какой шейдер отвечает за окончательное определение цвета каждого пикселя?
- Какой тип шейдера может генерировать, удалять или изменять примитивы?
- Для чего предназначены вычислительные шейдеры (Compute Shaders)?
- Какой тип шейдера используется для увеличения детализации поверхности модели путем добавления новых вершин?
- Укажите, какие из перечисленных состояний может принимать микрокоманда в ROB?
- Укажите, какие из устройств свзаны с портами запуска микропроцесосра P6?
- Хранение двух бит истории для команды перехода повышает точность предсказания по сравнению с однобитной историей:
- Что вы понимаете под статической стратегией предсказания переходов?
- Что делает PHT (Pattern History Table) в динамическом предсказании переходов?
- Что означает конфликт по данным в конвейере?
- Что означает проблема условных переходов в конвейере?
- Что определяет размер линейки кэш-памяти?
- Что произойдет, если предсказание перехода не совпадает с фактическим результатом?
- Что происходит с записями в BTB, когда происходит ошибочное предсказание?
- Что происходит с инструкциями в Retirement Unit, когда они завершаются?
- Что такое Retirement Unit в архитектуре Intel P6?
- Что такое TLB (Translation Lookaside Buffer)?
- Что такое архитектурные регистры?
- Что такое устройство арифметики переходов?
- Что характерно для суперкскалярного суперконвейерного процессора?
- Какая характеристика наиболее точно описывает архитектуру GPU на стадии фиксированного функционала?
- Что стало ключевым нововведением на стадии программируемых шейдеров?
- На какой стадии развития GPU стало возможным использовать их для общих вычислений (GPGPU)?
- Что ограничивало возможности GPU на стадии фиксированного функционала?
- Какое из следующих применений стало возможным благодаря развитию GPGPU?
- Вопросы итогового рубежного контроля:
- Как устроена длинная петля реплея и обработка микрокоманд в процессоре P6?
- Как работает предсказание переходов с использованием BTB и двухбитной истории?
- Каковы основные этапы графического конвейера и какую роль в нём играет Z-буфер?
- Как организована работа кэш-памяти и TLB в современных процессорах?
- Какие вычислительные блоки и шейдерные модели используются в архитектуре GPU?
- Как устроен вычислительный комплекс Тераграф и как в нём взаимодействуют GPC и хост-подсистема?
- Какие механизмы позволяют процессору эффективно обрабатывать команды в конвейере?
- Как устроена модель параллельных вычислений в OpenCL и GPGPU?
- Как процессор управляет порядком выполнения команд и доступом к памяти?
- Какие ключевые особенности микроархитектуры процессора P6 влияют на его производительность?
- Какие методы оптимизации доступа к памяти применяются в CPU и GPU?
- Как в ВК Тераграф реализована обработка графовых данных?
- Как динамическое исполнение команд повышает производительность процессора?
- Как работают шейдерные модели в современных GPU?
- Как процессор обрабатывает ошибки и восстанавливает корректное состояние?