ETLбазовое понятие: Extraction, Transformation, Loading. Три этапа:
|
HOLAP (Hybrid OLAP)использует реляционные таблицы для хранения базовых данных и многомерные
таблицы для агрегатов. |
MDX (Multidimensional Expressions)язык запросов для доступа к многомерным структурам данных. |
MOLAP (Multidimensional OLAP) классическая форма OLAP, так что
её часто называют просто OLAP. Она использует суммирующую базу данных и создаёт
требуемую многомерную схему данных с сохранением как базовых данных, так и
агрегатов. |
OLAP(OnlineAnalyticalProcessing) -Способ организации БД, заключающийся в подготовке суммарной
(агрегированной) информации на основе больших массивов данных,
структурированных по многомерному принципу. Эта БД предназначена длябыстрой
обработки аналитических запросов. |
OLAP (Online Analytical Processing)Способ организации БД, заключающийся в подготовке суммарной (агрегированной) информации на основе больших массивов данных, структурированных по многомерному принципу. Эта БД предназначена для быстрой обработки аналитических запросов.
|
OLTP(Online Transaction
Processing), Способ организации БД, при котором система работает с небольшими по
размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется
от системы минимальное время отклика. |
OLTP (Online Transaction Processing)Способ организации БД, при котором система работает с небольшими по размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется от системы минимальное время отклика.
|
ROLAP (Relational OLAP)работает напрямую с реляционной базой данных, факты и таблицы с измерениями хранятся в реляционных таблицах, и для хранения агрегатов создаются дополнительные реляционные таблицы. |
SQL(structuredquerylanguage- «язык структурированных запросов») - формальный, непроцедурный, декларативный язык
программирования, применяемый для создания, модификации и управления данными в
произвольной реляционной базе данных, управляемой соответствующей системой
управления базами данных (СУБД). |
SQL (structured query language - «язык структурированных запросов»)формальный непроцедурный язык программирования, применяемый для создания, модификации и управления данными в произвольной реляционной базе данных, управляемой соответствующей системой управления базами данных (СУБД).
|
TESTTESTtesttesttest |
Агрегация/детализацияпереход к более общему/детальному представлению информации по параметрам
агрегируемости (см.). |
Агрегируемость данныхналичие различных уровней обобщения информации, подразумевает привязку
данных к какому-либо параметру (например, ко времени, географическому
положению, структурным единицам и т.д.). |
Администратор базы данныхлицо или группа лиц, ответственная за проектирование и эффективное использование БД. Основные функции администратора базы данных: 1. Участие в разработке проекта по созданию БД. 2. Обеспечение согласованности БД (копирование, репликация, восстановление). 3. Обучение пользователей работе с БД (вход в БД, ввод паролей, работа в нормальной и экстремальной ситуациях и др.). 4. Отслеживание трафика загрузки БД, сбоев, характеристик (время доступа, общее время обработки запросов и т.д.). 5. Реорганизация БД с целью улучшения характеристик базы. 6. Реализация многопользовательского режима работы с БД (защита от несанкционированного доступа, шифрование данных, разделение доступа и др.). |
Администратор СУБД (DBA)лицо или группа лиц, ответственная за развертывание, бесперебойную
эксплуатацию и эффективное использование СУБД. |
Атрибут (поле записи, столбец таблицы)отдельная характеристика (свойство) объекта.
|
Аутентификацияпроверка принадлежности субъекту доступа предъявленного им
идентификатора, подтверждение подлинности. |
База данных (БД)организованная в соответствии с определёнными правилами и поддерживаемая в памяти компьютера совокупность данных, характеризующая актуальное состояние некоторой предметной области и используемая для удовлетворения информационных потребностей пользователей. |
Банк данных (БнД) (устаревшее)совокупность БД, СУБД и комплекса технических средств (компьютеры, внешние устройства, устройства связи и др.). |
Блокировка записейпроцесс предотвращения доступа к данным изменяемым транзакцией, пока она
не будет закончена. Средства блокировки обеспечивают безопасность данных в
случае параллельной обработки данных. |
Внешний ключполе дочерней таблицы, которое содержит значение первичного ключа
родительской таблицы (атрибут “Код подразделения” сущности “СОТРУДНИК” является
внешним ключом, т. к. он содержит значение первичного ключа в родительской
таблице “ПОДРАЗДЕЛЕНИЕ”). |
Вращениевращение гиперкуба (местоположение отдельных осей меняются местами).
|
Вторичный ключ (кандидат)уникальный ключ, который может быть первичным, но не является оным, поскольку первичный ключ только один.
|
Декомпозицияразделение целого на части. Также декомпозиция — это научный метод, использующий структуру задачии позволяющий заменить решение одной большой задачи решением серии меньших задач, пусть и взаимосвязанных, но более простых. Декомпозиция, как процесс расчленения, позволяет рассматривать любую исследуемую систему как сложную, состоящую из отдельных взаимосвязанных подсистем, которые, в свою очередь, также могут быть расчленены на части. В качестве систем могут выступать не только материальные объекты, но и процессы, явления и понятия. |
Дискреционное управление доступамразграничение доступа между поименованными субъектами и поименованными
объектами. Субъект с определенным правом доступа может передать это право
любому другому субъекту. |
Доменобласть значений одного или нескольких атрибутов. |
Доступ к информацииознакомление с информацией, ее обработка (в частности, копирование),
модификация, уничтожение. |
Дочерняя таблицатаблица в которой присутствует внешний ключ используемой в связи (см.) и
содержащий значение первичного ключа родительской таблицы. |
Записьданные об одном конкретном экземпляре сущности - предмете, человеке или событии. Запись состоит из полей. Пример. Сущность “СОТРУДНИК”, экземпляр сущности ‑ данные об Иванове И. |
Запросэто выражение, определяющее выборку нужных данных из одной или
нескольких таблиц базы, удаление или изменение этих данных, создание новых
таблиц. Все реляционные СУБД понимают структурированный язык запросов SQL. |
Идентификатор доступауникальный признак объекта или субъекта доступа. |
Идентификацияприсвоение объектам и субъектам доступа идентификатора и (или) сравнение
предъявляемого идентификатора с перечнем присвоенных идентификаторов. |
Индекс на вычисляемых столбцахИндекс на столбце, являющемся производным от одного или нескольких
других столбцов или нескольких детерминированных источников. |
Индексный файлфайл, содержащий записи, каждая из которых содержит два значения: индекса (ключа) и адреса записи таблицы со значением данного индекса.
|
Интерфейс ODBCИнтерфейс ODBC (OpenDatabaseConnectivity) является посредником между приложением и СУБД; обеспечивает доступ из приложения к базам с различными СУБД. В состав ODBC входят драйверы (для каждой СУБД один драйвер, который преобразует форматы данных и команды приложения в форматы и команды СУБД и обратно) и диспетчер драйверов, который подключает нужный драйвер. Разработан и поддерживается компанией Microsoft. |
Инфологическая модельописание, выполненное с использованием естественного языка, математических формул, таблиц, графиков и других средств, понятных всем людям, работающих над проектированием базы данных. |
Кластеризованный индексиндекс, который хранит данные таблицы в отсортированном, по значению
ключа индекса, виде. |
Клиент серверная архитектура СУБДотличается от предыдущей модели тем, что запросы от приложения
выполняются на сервере БД, а приложению передаются выбранные данные. |
Ключполе или суперпозиция несколько полей и\или их фрагментов (называемых ключевыми), однозначно определяющая запись таблицы.
|
Коллективный доступдает возможность одновременной работы с БД многим пользователям. Для корректной работы при одновременной корректировке отдельных записей возможны блокировки записей.
|
Колоночный индексИндекс columnstore в памяти хранит данные и управляет данными с
использованием основанного на столбцах хранилища данных и обработки запросов. |
Конфиденциальная информацияинформация, которая требует защиты. |
Концептуальная модельсовокупность объектов предметной области и их взаимосвязей вне зависимости от конкретной СУБД |
Концептуальная модель (концептуальная схема)это совокупность объектов и их взаимосвязей вне зависимости от конкретной СУБД.
|
Концептуальная модель БДэто совокупность сущностей и их взаимосвязей вне зависимости от
конкретной СУБД. |
Куб OLAPКуб OLAP представляет собой структуру данных, которая обеспечивает возможность быстрого анализа данных, выходя за рамки ограничений реляционных баз данных. Кубы OLAP могут отображать и суммировать большие объемы данных, а также предоставлять пользователям доступ к любым точкам данных с возможностью поиска, чтобы эти данные можно было свести, разделить и обрезать по мере необходимости для обработки самых широкого спектра вопросов, относящихся к интересующей вас области пользователя. |
КучаТаблица не имеющая кластеризованного индекса называется кучей. |
Логическая модель (логическая схема)это концептуальная модель в терминах конкретной СУБД.
|
Логическая модель БДэто концептуальная модель в терминах конкретной СУБД. |
Локальная архитектура СУБДприложение и база находятся на одном компьютере. |
Мерыэто числовые значения, позволяющие пользователям создавать плоскостные и
объемные срезы, выполнять агрегирование и анализ. |
Многомерная модельузкоспециализированная модель, предназначенная для хранения данных в виде многомерного массива (гиперкуба), используемых системами оперативной аналитической обработки типа OLAP (On Line Analytical Processing) или систем поддержки принятия решений DSS (Decision Support). |
Монопольный доступиспользуется обычно при массовых операциях с базой (реорганизация или восстановление базы и др.) и блокирует доступ ко всей БД другим пользователям.
|
Несанкционированный доступдоступ к информации, который нарушает правила разграничения доступа с
использованием штатных средств, предоставляемых средствами вычислительной
техники или автоматизированными системами. |
Нормализацияэто разбиение таблицы на две или более, обладающие лучшими свойствами при включении, изменении и удалении данных. Окончательная цель нормализации сводится к получению такого проекта базы данных, в котором каждый атрибут появляется лишь в одном месте, т.е. исключена избыточность информации. Это делается не столько с целью экономии памяти, сколько для исключения возможной противоречивости хранимых данных и предсказуемости поведения системы во время эксплуатации. Применялось в прошлом веке при проектировании БД. |
Объект (сущность)предмет, человек или событие, о котором соби¬рается и хранится информация.
|
Объект доступаединица информации автоматизированной системы, доступ к которой регламентируется правилами разграничения доступа. Объектами доступа (контроля) в СУБД является практически все, что содержит конечную информацию: таблицы (базовые или виртуальные), представления, а также более мелкие элементы данных: столбцы и строки таблиц и даже поля строк (значения). Таблицы базы данных и представления имеют владельца или создателя. |
Парольидентификатор субъекта, который является его секретом. |
Первичный ключполе однозначно определяющее запись (экземпляр сущности), используется
для связи с другими таблицами. Значения этого поля должны быть уникальны в
пределах таблицы. Такой ключ может быть только один на таблицу. В реальных БД в
качестве первичных используются суррогатные ключи. |
Показатели KPI (Ключевой показатель эффективности)представляют из себя бизнес-метрики, создаваемые для наблюдения за
продвижением в сторону определенных заданных целей. |
Поле записиотдельная характеристика (свойство, атрибут) сущности. |
Полнотекстовый индексСпециальный тип функционального индекса, основанный на токене,
построенный и поддерживаемый средством полнотекстового поиска. |
Порядок (степень)/Мощность отношения (кардинальное число) отношениячисло атрибутов/кортежей в отношении.
|
Постреляционная модельэто реляционная модель, допускающая многозначные поля (атрибуты), т.е. само поле может быть таблицей.
|
Правила разграничения доступасовокупность правил, регламентирующих права субъектов доступа к объектам
доступа. |
Предметная область базы данныхэто та часть реального мира, о которой информационная система хранит, собирает и анализирует информацию.
|
Приложениекомплекс программ, автоматизирующий обработку данных для прикладной
задачи. |
Пространственный индексПространственный индекс обеспечивает возможность более эффективного
использования определенных операций с пространственными объектами
(пространственными данными) в столбце типа данных geometry. |
Распределенная база данныхэто совокупность логически взаимосвязанных баз данных, распределенных в компьютерной сети. Распределенная база данных может объединять базы данных, поддерживающие любые модели (иерархические, сетевые, реляционные и объектно-ориентированные базы данных) в рамках единой глобальной схемы. Подобная конфигурация должна обеспечивать для всех приложений прозрачный доступ к любым данным независимо от их местоположения и формата.
|
Реляционная база данныхпредставляет собой набор взаимосвязанных двухмерных таблиц. Эта модель предложена сотрудником фирмы “IBM” Эдгаром Коддом в 1970 году.
Таблица базы данных соответствует одному объекту предметной области и состоит из фиксированного числа полей, собранных в записи, каждая из которых соответствует экземпляру объекта.
Порядка 75% эксплуатируемых в настоящее время СУБД являются реляционными.
Все реляционные СУБД поддерживают язык SQL. |
Репликациямеханизм синхронизациисодержимого нескольких копий БД. Репликация — это процесс, под которым понимается копирование данных из одной БД в другую и поддержание копий в актуальном и согласованном состоянии. При репликации изменения, сделанные в одной копии БД, распространяются в другие копии. |
Родительская таблицатаблица содержащая первичный ключ используемой в связи (см.), значение которого записывается в поле внешнего ключа дочерней таблицы. |
Санкционированный доступдоступ к информации, который не нарушает правил разграничения доступа. |
СвязьСвязь между родительской и дочерней таблицами (сущностями) это сопоставление записей, которое производится по равенству значений первичного и внешнего ключей, соответственно в обеих таблицах. |
Связь типа “Многие-ко-многим” (М:М)Одному экземпляру родительской сущности соответствуют несколько
экземпляров дочерней сущности и наоборот одному экземпляру дочерней сущности
соответствуют несколько экземпляров родительской сущности. Наличие такой связи
между сущностями говорит о том, что, какая-то значимая сущность еще не
выявлена. Именно эта сущность и преобразует связь типа “Многие-ко-многим” к
двум связям типа “Один-ко-многим”. |
Связь типа “Один-к-одному”, или бинарная связь (1:1)Одной записи (экземпляру) родительской таблицы (сущности) соответствует
одна запись (экземпляр) дочерней таблицы (сущности). |
Связь типа “Один-ко-многим” (1:М)Одной записи родительской таблицы соответствует несколько записей
дочерней таблицы. При этом внешний ключ участвующий в связи не уникален. |
Система управления базой данных (СУБД)совокупность
программных, лингвистических и методических средств общего или специального
назначения, обеспечивающих управление созданием и использованием БД. |
Словарьцентрализованное хранилище сведений об объектах БД: таблицах, связях,
форматах и диапазонах значений полей, представлениях, хранимых процедурах и
т.д. Словарь — это, по сути, БД содержащая всю служебную информацию СУБД. |
Согласованность (целостность) базы данныхсоответствие имеющейся в базе данныхинформации её внутренней логике, структуре и всем явно заданным правилам. Каждое правило, налагающее некоторое ограничение на возможное состояние базы данных, называется ограничением целостности. Примеры правил: каждый студент должен состоять к учебной группе; количество знаков в телефонном номере не должно превышать 15; баланс банка должен сходится; число проданных билетов не превышает число посадочных мест и т. д. |
Составной индекс (Индекс с включенными столбцами)Некластеризованный индекс, дополнительно содержащий кроме ключевых
столбцов еще и неключевые. |
Срезподмножество гиперкуба, полученное в результате фиксации одного или нескольких измерений.
|
Субъект доступалицо или процесс, действия которого регламентируются правилами
разграничения доступа. |
Сущностьпредмет, человек или событие, о котором собирается и хранится
информация. |
Таблицасовокупность записей с фиксированным числом полей. Таблица содержит данные о всех экземплярах сущности. Далее приведено соответствие терминов в различных областях знаний.
| ||||||||||||
Тиражирование данныхпредполагает создание копии (репликаций) фрагментов базы в узлах сети.
Синхронизация копий и базы осуществляется специальной программой-репликатором,
при этом передаются только изменения или транзакции. |
Толстый клиентклиентская часть, реализуемая в виде приложения. |
Тонкий клиентклиентская часть, реализуемая на браузере. |
Транзакцияпроцесс, который переводит базу данных из одного согласованного состояния, в другое согласованное состояние. Допускается, что в процессе работы транзакции согласованность может нарушаться, но извне транзакции этого не видно. По сути это группа последовательных операций с базой данных, обычно записанная на языке SQL, которая представляет собой логическую неделимую единицу работы с данными. Транзакция может быть выполнена либо целиком и успешно, соблюдая согласованность данных и независимо от параллельно идущих других транзакций, либо не выполнена вообще и тогда она не должна произвести никакого эффекта. Транзакции обрабатываются СУБД и другими транзакционными системами, в процессе работы которых создаётся история транзакций (журналы транзакций). Транзакции необходимы для поддержания согласованности базы данных. |
Трехзвенная архитектура СУБДк серверам баз добавляются серверы приложений (ApplicationServer), на которых выполняются
приложения клиентов.Клиент формирует исходную информацию для расчета, посылает
запрос на выполнение расчета на сервер приложения, где он и выполняется. При
необходимости сервер приложения формирует запрос к серверу БД. |
Триггерхранимая процедура особого типа, которую пользователь не вызывает непосредственно, а исполнение которой обусловлено действием по модификации данных: добавлением INSERT, удалением DELETE строки в заданной таблице, или изменением UPDATE данных в определенном столбце заданной таблицы реляционной базы данных. Триггеры применяются для обеспечения целостности данных и реализации сложной бизнес-логики. Триггер запускается сервером автоматически при попытке изменения данных в таблице, с которой он связан. Все производимые им модификации данных рассматриваются как выполняемые в транзакции, в которой выполнено действие, вызвавшее срабатывание триггера. Соответственно, в случае обнаружения ошибки или нарушения целостности данных в результате работы триггера может произойти откат этой транзакции.
|
Файл серверная архитектура СУБДприложение находятся на одном компьютере, а база данных - на другом.
Приложение обращается за информацией к файлу‑серверу, который возвращает
приложению файлы, содержащие необходимые данные. В настоящее время не
применяется. |
Фильтрованный индексОптимизированный некластеризованный индекс, в особенности подходящий для покрытия запросов из хорошо определенного подмножества данных. Он использует предикат фильтра для индексирования части строк в таблице. Хорошо спроектированный отфильтрованный индекс позволяет повысить производительность запросов, снизить затраты на обслуживание и хранение индексов по сравнению с полнотабличными индексами. |
Хранилище (склад) данных (ХД)извлеченные данные из оперативных и архивных БД, преобразованные в формат, приемлемый для сложных нерег¬ламентированных запросов и многомерного анализа.
|
Хэш индексПри использовании хэш-индекса доступ к данным осуществляется через
хэш-таблицу в памяти. Хэш-индексы используют фиксированный размер памяти,
который зависит от числа контейнеров. |
Экземпляр объекта (кортеж, запись)данные об одном конкретном объекте - предмете, человеке или событии.
Пример. Объект “СОТРУДНИК”, экземпляр данные об Иванове И.
|