ETL (Extraction Transformation Loading)Процесс подготовки данных перед загрузкой в аналитическую БД, который проходит в три этапа:
|
HOLAP (Hybrid OLAP)использует реляционные таблицы для хранения базовых данных и многомерные
таблицы для агрегатов. |
MDX (Multidimensional Expressions)язык запросов для доступа к многомерным структурам данных. |
MOLAP (Multidimensional OLAP) классическая форма OLAP, так что
её часто называют просто OLAP. Она использует суммирующую базу данных и создаёт
требуемую многомерную схему данных с сохранением как базовых данных, так и
агрегатов. |
OLAP (Online Analytical Processing)Способ организации БД, заключающийся в подготовке суммарной
(агрегированной) информации на основе больших массивов данных,
структурированных по многомерному принципу. Эта БД предназначена длябыстрой
обработки аналитических запросов. |
OLTP (Online Transaction Processing)Способ организации БД, при котором система работает с небольшими по размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется от системы минимальное время отклика.
|
ROLAP (Relational OLAP)работает напрямую с реляционной базой данных, факты и таблицы с измерениями хранятся в реляционных таблицах, и для хранения агрегатов создаются дополнительные реляционные таблицы. |
SQL (Structured Query Language)(язык структурированных запросов) - формальный, непроцедурный, декларативный язык
программирования, применяемый для создания, модификации и управления данными в
произвольной реляционной базе данных, управляемой соответствующей системой
управления базами данных (СУБД). |
Агрегация/детализацияпереход к более общему/детальному представлению информации по параметрам
агрегируемости (см. ). |
Агрегируемость данныхналичие различных уровней обобщения информации, подразумевает привязку
данных к какому-либо параметру (например, ко времени, географическому
положению, структурным единицам и т.д.). |
Администратор базы данныхлицо или группа лиц, ответственная за проектирование и эффективное использование БД. Основные функции администратора базы данных: 1. Участие в разработке проекта по созданию БД. 2. Обеспечение согласованности БД (копирование, репликация, восстановление). 3. Обучение пользователей работе с БД (вход в БД, ввод паролей, работа в нормальной и экстремальной ситуациях и др.). 4. Отслеживание трафика загрузки БД, сбоев, характеристик (время доступа, общее время обработки запросов и т.д.). 5. Реорганизация БД с целью улучшения характеристик базы. 6. Реализация многопользовательского режима работы с БД (защита от несанкционированного доступа, шифрование данных, разделение доступа и др.). |
Администратор СУБД (DBA)лицо или группа лиц, ответственная за развертывание, бесперебойную
эксплуатацию и эффективное использование СУБД. |
Атрибут (поле записи, столбец таблицы)отдельная характеристика (свойство) объекта.
|
Аутентификацияпроверка принадлежности субъекту доступа предъявленного им
идентификатора, подтверждение подлинности. |
База данных (БД)организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей. |
Банк данных (БнД) (устаревшее)совокупность БД, СУБД и комплекса технических средств (компьютеры, внешние устройства, устройства связи и др.). |
Блокировка записейпроцесс предотвращения доступа к данным изменяемым транзакцией, пока она
не будет закончена. Средства блокировки обеспечивают безопасность данных в
случае параллельной обработки данных. |
Внешний ключполе дочерней таблицы, которое содержит значение первичного ключа
родительской таблицы (атрибут “Код подразделения” сущности “СОТРУДНИК” является
внешним ключом, т. к. он содержит значение первичного ключа в родительской
таблице “ПОДРАЗДЕЛЕНИЕ”). |
Вращениевращение гиперкуба (местоположение отдельных осей меняются местами).
|
Вторичный ключ (кандидат)уникальный ключ таблицы, который мог бы быть первичным, но не является оным, поскольку первичный ключ только один. |
Декомпозицияразделение целого на части. Также декомпозиция — это научный метод, использующий структуру задачии позволяющий заменить решение одной большой задачи решением серии меньших задач, пусть и взаимосвязанных, но более простых. Декомпозиция, как процесс расчленения, позволяет рассматривать любую исследуемую систему как сложную, состоящую из отдельных взаимосвязанных подсистем, которые, в свою очередь, также могут быть расчленены на части. В качестве систем могут выступать не только материальные объекты, но и процессы, явления и понятия. |
Дискреционное управление доступамразграничение доступа между поименованными субъектами и поименованными
объектами. Субъект с определенным правом доступа может передать это право
любому другому субъекту. |
Доменобласть значений одного или нескольких атрибутов. |
Доступ к информациивозможность ознакомления с информацией, а также возможность ее обработки (в частности, копирования),
модификации, уничтожения. |
Дочерняя таблицатаблица в которой присутствует внешний ключ используемой в связи (см.) и
содержащий значение первичного ключа родительской таблицы. |
Записьданные об одном конкретном экземпляре сущности - предмете, человеке или событии. Запись это одна строка в таблице реляционной БД. Запись состоит из полей. Пример. Сущность “СОТРУДНИК”, экземпляр
сущности ‑ данные об Иванове И. Одна строка в таблице “СОТРУДНИКИ” . |
Запросэто выражение, определяющее выборку нужных данных из одной или
нескольких таблиц БД, удаление или изменение этих данных, создание или удаление новых объектов БД. Все реляционные СУБД понимают структурированный язык запросов SQL. |
Идентификатор доступауникальный признак объекта или субъекта доступа. |
Идентификацияприсвоение объектам и субъектам доступа идентификатора и (или) сравнение
предъявляемого идентификатора с перечнем присвоенных идентификаторов. |
Индексобъект БД
(таблица), в простейшем случае, содержащая записи, каждая
из которых состоит из двух полей:
|
Интерфейс ODBCИнтерфейс ODBC (OpenDatabaseConnectivity) является посредником между приложением и СУБД; обеспечивает доступ из приложения к базам с различными СУБД. В состав ODBC входят драйверы (для каждой СУБД один драйвер, который преобразует форматы данных и команды приложения в форматы и команды СУБД и обратно) и диспетчер драйверов, который подключает нужный драйвер. Разработан и поддерживается компанией Microsoft. |
Кластеризованный индексиндекс, который хранит данные таблицы в отсортированном, по значению
ключа индекса, виде. |
Клиент серверная архитектура СУБДсуть этой архитектуры в том, что запросы от приложения
выполняются на сервере БД, а приложению передаются выбранные данные. |
Ключполе или суперпозиция несколько полей и\или их фрагментов (называемых ключевыми), однозначно определяющая запись таблицы.
|
Коллективный доступвозможность одновременной работы с БД многим пользователям. Для корректной работы при одновременной корректировке отдельных записей возможны блокировки записей. |
Колоночный индексИндекс columnstore в памяти хранит данные и управляет данными с
использованием основанного на столбцах хранилища данных и обработки запросов. |
Конфиденциальная информацияинформация, которая требует защиты. |
Концептуальная модель БДэто совокупность сущностей и их взаимосвязей вне зависимости от
конкретной СУБД. |
Куб OLAPкуб OLAP (гиперкуб) представляет собой структуру данных, которая обеспечивает возможность быстрого анализа данных, выходя за рамки ограничений реляционных баз данных. Кубы OLAP могут отображать и суммировать большие объемы данных, а также предоставлять пользователям доступ к любым точкам данных с возможностью поиска, чтобы эти данные можно было свести, разделить и обрезать по мере необходимости для обработки самых широкого спектра вопросов, относящихся к интересующей вас области пользователя. |
КучаТаблица не имеющая кластеризованного индекса называется кучей. |
Логическая модель (логическая схема)это концептуальная модель в терминах конкретной СУБД.
|
Локальная архитектура СУБДприложение работающее с БД и сама база находятся на одном компьютере. |
Мерыэто числовые значения, позволяющие пользователям создавать плоскостные и
объемные срезы, выполнять агрегирование и анализ. |
Многомерная модель |
Монопольный доступиспользуется обычно при массовых операциях с базой (реорганизация или восстановление базы и др.) и блокирует доступ ко всей БД другим пользователям.
|
Несанкционированный доступдоступ к информации, который нарушает правила разграничения доступа с
использованием штатных средств, предоставляемых средствами вычислительной
техники или автоматизированными системами. |
Нормализацияэто разбиение таблицы на две или более, обладающие лучшими свойствами при включении, изменении и удалении данных. Окончательная цель нормализации сводится к получению такого проекта базы данных, в котором каждый атрибут появляется лишь в одном месте, т.е. исключена избыточность информации. Это делается не столько с целью экономии памяти, сколько для исключения возможной противоречивости хранимых данных и предсказуемости поведения системы во время эксплуатации. Применялось в прошлом веке при проектировании БД. |
Объект (сущность)предмет, человек или событие, о котором собирается и хранится информация в БД. |
Объект доступаединица информации автоматизированной системы, доступ к которой регламентируется правилами разграничения доступа. Объектами доступа (контроля) в СУБД является практически все, что содержит конечную информацию: таблицы (базовые или виртуальные), представления, а также более мелкие элементы данных: столбцы и строки таблиц и даже поля строк (значения). Таблицы базы данных и представления имеют владельца или создателя. |
Парольидентификатор субъекта, который является его секретом. |
Первичный ключполе однозначно определяющее запись (экземпляр сущности), используется
для связи с другими таблицами. Значения этого поля должны быть уникальны в
пределах таблицы. Такой ключ может быть только один на таблицу. В реальных БД в
качестве первичных используются суррогатные ключи. |
Показатели KPI (Ключевой показатель эффективности)представляют из себя бизнес-метрики, создаваемые для наблюдения за
продвижением в сторону определенных заданных целей. |
Поле записиотдельная характеристика (свойство, атрибут) сущности. |
Полнотекстовый индексСпециальный тип функционального индекса, основанный на токене,
построенный и поддерживаемый средством полнотекстового поиска. |
Порядок (степень)/Мощность отношения (кардинальное число) отношениячисло атрибутов/кортежей в отношении.
|
Постреляционная модельэто реляционная модель, допускающая многозначные поля (атрибуты), т.е. само поле может быть таблицей.
|
Правила разграничения доступасовокупность правил, регламентирующих права субъектов доступа к объектам
доступа. |
Предметная область базы данныхэто та часть реального мира, о которой информационная система хранит, собирает и анализирует информацию.
|
Приложениекомплекс программ, автоматизирующий обработку данных для прикладной
задачи. |
Пространственный индексПространственный индекс обеспечивает возможность более эффективного
использования определенных операций с пространственными объектами
(пространственными данными) в столбце типа данных geometry. |
Распределенная база данныхэто совокупность логически взаимосвязанных баз данных, распределенных в компьютерной сети. Распределенная база данных может объединять базы данных, поддерживающие любые модели (иерархические, сетевые, реляционные и объектно-ориентированные базы данных) в рамках единой глобальной схемы. Подобная конфигурация должна обеспечивать для всех приложений прозрачный доступ к любым данным независимо от их местоположения и формата.
|
Реляционная база данныхпредставляет собой набор взаимосвязанных двухмерных таблиц. Эта модель предложена сотрудником фирмы “IBM” Эдгаром Коддом в 1970 году.
Таблица базы данных соответствует одному объекту предметной области и состоит из фиксированного числа полей, собранных в записи, каждая из которых соответствует экземпляру объекта.
Порядка 75% эксплуатируемых в настоящее время СУБД являются реляционными.
Все реляционные СУБД поддерживают язык SQL. |
Репликациямеханизм синхронизациисодержимого нескольких копий БД. Репликация — это процесс, под которым понимается копирование данных из одной БД в другую и поддержание копий в актуальном и согласованном состоянии. При репликации изменения, сделанные в одной копии БД, распространяются в другие копии. |
Родительская таблицатаблица содержащая первичный ключ используемой в связи (см.), значение которого записывается в поле внешнего ключа дочерней таблицы. |
Санкционированный доступдоступ к информации, который не нарушает правил разграничения доступа. |
СвязьСвязь между родительской и дочерней таблицами (сущностями) это сопоставление записей, которое производится по равенству значений первичного и внешнего ключей, соответственно в обеих таблицах. |
Связь типа “Многие-ко-многим” (М:М)Одному экземпляру родительской сущности соответствуют несколько
экземпляров дочерней сущности и наоборот одному экземпляру дочерней сущности
соответствуют несколько экземпляров родительской сущности. Наличие такой связи
между сущностями говорит о том, что, какая-то значимая сущность еще не
выявлена. Именно эта сущность и преобразует связь типа “Многие-ко-многим” к
двум связям типа “Один-ко-многим”. |
Связь типа “Один-к-одному”, или бинарная связь (1:1)Одной записи (экземпляру) родительской таблицы (сущности) соответствует
одна запись (экземпляр) дочерней таблицы (сущности). |
Связь типа “Один-ко-многим” (1:М)Одной записи родительской таблицы соответствует несколько записей
дочерней таблицы. При этом внешний ключ участвующий в связи не уникален. |
Система управления базой данных (СУБД)совокупность
программных, лингвистических и методических средств общего или специального
назначения, обеспечивающих управление созданием и использованием БД. |
Словарьцентрализованное хранилище сведений об объектах БД: таблицах, связях,
форматах и диапазонах значений полей, представлениях, хранимых процедурах и
т.д. Словарь — это, по сути, БД содержащая всю служебную информацию СУБД. |
Согласованность (целостность) базы данныхсоответствие имеющейся в базе данныхинформации её внутренней логике, структуре и всем явно заданным правилам. Каждое правило, налагающее некоторое ограничение на возможное состояние базы данных, называется ограничением целостности. Примеры правил: каждый студент должен состоять к учебной группе; количество знаков в телефонном номере не должно превышать 15; баланс банка должен сходится; число проданных билетов не превышает число посадочных мест и т. д. |
Составной индекс (Индекс с включенными столбцами)Некластеризованный индекс, дополнительно содержащий кроме ключевых
столбцов еще и неключевые. |
Срезподмножество гиперкуба, полученное в результате фиксации одного или нескольких измерений.
|
Субъект доступалицо или процесс, действия которого регламентируются правилами
разграничения доступа. |
Сущностьпредмет, человек или событие, о котором собирается и хранится
информация. Сущность всегда проецируется в таблицу реляционной БД |
Таблицасовокупность записей с фиксированным числом полей. Таблица содержит данные о всех экземплярах сущности. Далее приведено соответствие терминов в различных областях знаний.
| ||||||||||||
Тиражирование данныхпредполагает создание копии (репликаций) фрагментов базы в узлах сети.
Синхронизация копий и базы осуществляется специальной программой-репликатором,
при этом передаются только изменения или транзакции. |
Толстый клиентклиентская часть, реализуемая в виде приложения. |
Тонкий клиентклиентская часть, реализуемая на браузере. |
Транзакцияпроцесс, который переводит базу данных из одного согласованного состояния, в другое согласованное состояние. Допускается, что в процессе работы транзакции согласованность может нарушаться, но извне транзакции этого не видно. По сути это группа последовательных операций с базой данных, обычно записанная на языке SQL, которая представляет собой логическую неделимую единицу работы с данными. Транзакция может быть выполнена либо целиком и успешно, соблюдая согласованность данных и независимо от параллельно идущих других транзакций, либо не выполнена вообще и тогда она не должна произвести никакого эффекта. Транзакции обрабатываются СУБД и другими транзакционными системами, в процессе работы которых создаётся история транзакций (журналы транзакций). Транзакции необходимы для поддержания согласованности базы данных. |
Трехзвенная архитектура СУБДк серверам баз добавляются серверы приложений (ApplicationServer), на которых выполняются
приложения клиентов.Клиент формирует исходную информацию для расчета, посылает
запрос на выполнение расчета на сервер приложения, где он и выполняется. При
необходимости сервер приложения формирует запрос к серверу БД. |
Триггерхранимая процедура особого типа, которую пользователь не вызывает непосредственно, а исполнение которой обусловлено действием по модификации данных: добавлением INSERT, удалением DELETE строки в заданной таблице, или изменением UPDATE данных в определенном столбце заданной таблицы реляционной базы данных. Триггеры применяются для обеспечения целостности данных и реализации сложной бизнес-логики. Триггер запускается сервером автоматически при попытке изменения данных в таблице, с которой он связан. Все производимые им модификации данных рассматриваются как выполняемые в транзакции, в которой выполнено действие, вызвавшее срабатывание триггера. Соответственно, в случае обнаружения ошибки или нарушения целостности данных в результате работы триггера может произойти откат этой транзакции.
|
Файл серверная архитектура СУБДприложение находятся на одном компьютере, а база данных - на другом.
Приложение обращается за информацией к файлу‑серверу, который возвращает
приложению файлы, содержащие необходимые данные. В настоящее время не
применяется. |
Фильтрованный индексОптимизированный некластеризованный индекс, в особенности подходящий для покрытия запросов из хорошо определенного подмножества данных. Он использует предикат фильтра для индексирования части строк в таблице. Хорошо спроектированный отфильтрованный индекс позволяет повысить производительность запросов, снизить затраты на обслуживание и хранение индексов по сравнению с полнотабличными индексами. |
Хранилище (склад) данных (ХД)извлеченные данные из оперативных и архивных БД, преобразованные в формат, приемлемый для сложных нерег¬ламентированных запросов и многомерного анализа.
|
Хэш индексПри использовании хэш-индекса доступ к данным осуществляется через
хэш-таблицу в памяти. Хэш-индексы используют фиксированный размер памяти,
который зависит от числа контейнеров. |
Экземпляр объекта (кортеж, запись)данные об одном конкретном объекте - предмете, человеке или событии.
Пример. Объект “СОТРУДНИК”, экземпляр данные об Иванове И.
|