1.Базы данных. СУБД. Основные понятия, определения.
2.Классификация БД
3.Классификация СУБД
4.Схема обработки информации файл – сервер
5.Схема обработки информации клиент – сервер
6.Характеристики СУБД
7.Компоненты СУБД
8.Функции СУБД
9.Архитектура БД
10.Определение и классификация моделей данных.
11.Схемы, отображения, независимость данных
12.Иерархическая модель данных.
13.Сетевая модель данных
14.Реляционная модель данных
15.Определение реляционной алгебры
16.Реляционная алгебра. Определение. основные понятия.
17.Понятие эквивалентности отношений
18.Понятие сцепления строк. Операции реляционной алгебры, использующие сцепление
19.Операции реляционной алгебры: объединение
20.Операции реляционной алгебры: деление
21.Операции реляционной алгебры: расширенное декартово произведение
22.Операции реляционной алгебры: выборка, проекция.
23.Операции реляционной алгебры: разность
24.Операции реляционной алгебры: соединение
25.Операции реляционной алгебры: пересечение
1)Базы данных. СУБД. Основные понятия, определения
2)Классификация БД - По характеру хранимой информации: а) Фактографические БД; Данные структурированы. б) Документальные БД; Данные не структурированы. По способу доступа к данным БД: а) с локальным доступом б) с удаленным (сетевым доступом).
РАСПРЕДЕЛЕННЫЕ БД - Может содержать набор пересекающихся или даже дублирующих друг друга частей БД. Недостатки: обращение к средствам коммуникации, сложность СУРБД.
Фундаментальный принцип РБД– для пользователя распределённая система должна выглядеть также как нераспределённая система
Цели принципа:
ЦБД с сетевым доступом - Технологии обработки данных: а) файл – сервер б) клиент – сервер
3)Классификация СУБД
По степени универсальности: а) системы общего назначения б) специализированные системы
Системы общего назначения - Не ориентированы на конкретную предметную область (коммерческие СУБД). Преимущества- сокращение сроков разработки, развитые функциональные возможности. Недостаток - функциональная избыточность.
Специализированные системы - Создаются при невозможности использовать СУБД общего назначения Преимущество – компактность СУБД Недостаток – невозможность использования в разных предметных областях
4)Схема обработки информации файл – сервер
5)Схема обработки информации клиент – сервер
6)Характеристики СУБД
1. Производительность
скорость поиска информации
временем выполнения операций импортирования БД из других форматов
временем выполнения коррекции, вставки, удаления данных
максимальным числом параллельных обращений к данным в многопользовательском режиме
ФАКТОРЫ, ВЛИЯЮЩИЕ НА ПРОИЗВОДИТЕЛЬНОСТЬ
- поддержка целостности данных
- обеспечение безопасности данных
ЦЕЛОСТНОСТЬ ДАННЫХ
Наличие средств, позволяющих поддерживать информацию в БД корректной и полной (независимо от того каким образом данные заносятся в память
- в интерактивном режиме,
- посредством импорта
- с помощью специальной программы)
Назначение первичных ключей записей, создающие уникальность записи
Средства поддержания ссылочной целостности
2. ОБЕСПЕЧЕНИЕ БЕЗОПАСНОСТИ
предотвращает несанкционированный доступ
к БД со стороны пользователей:
ограничение уровня доступа (Администратор БД)
защита паролем (индивидуальные и групповые)
шифрование прикладных программ и данных
3. Работа в многопользовательских средах
блокировка данных, (файла, записи, поля)
идентификации станции, установившей блокировку
обновление информации после модификации
контроль за временем и повторение обращения
обработка транзакций (последовательность операций пользователя над БД, сохраняющая её логическую целостность)
работа с сетевыми системами (Net Ware, Unix)
4. Импорт – экспорт
обработка СУБД информации, подготовленной другими программными средствами
использование другими программами данных, сформированных средствами СУБД
Форматы файлов (ASCII-файлы. DBF, XLS, WК* и др.)
5. Языковые средства СУБД
Основные функции:
описание данных
выполнение операций манипулирования данными-
описание данных - обеспечивается языком ЯОД (DDL–data definition language). Предоставляет средства указания структуры хранимых данных, а также средства задания ограничений.
Основные функции:
выполнение операций манипулирования данными - обеспечивается языком манипулирования или управления данных ЯМД (DML –data manipulation language)
язык запросов (Query language) вставка, удаление, извлечение информацию из БД
SQL – специальный международный стандарт языка запросов
Является обязательным для любых реляционных СУБД (содержит ЯОД и ЯМД)
Способы представления языковых средств: в явной синтаксической форме (для профессионалов)
Косвенным образом (для пользователей) QBE ( Query by Example ): в виде меню, диалоговых форм, таблиц ( преобразуются в конструкции языка)
Два вида языков DML, отличающихся способом извлечения данных
1. ПРОЦЕДУРНЫЕ- обрабатывают информацию БД последовательно запись за записью и используются для описания того, КАК МОЖНО получить желаемый результат
2. НЕПРОЦЕДУРНЫЕ – оперируют наборами записей SQL используются для описания того, ЧТО СЛЕДУЕТ получить.
Язык запросов (Structured Query Language) реализован в различных СУБД либо как базовый либо как альтернативный.
Совместимость СУБД с SQL- системами необходима для работы с корпоративными данными систем (клиент-сервер)
7)Компоненты СУБД
ЯДРО СУБД – (Data Base Engine)
Является основной резидентной частью СУБД.
Отвечает за:
управление данными во внешней памяти
управление буферами оперативной памяти
управление транзакциями
журнализацию
КОМПОНЕНТЫ ЯДРА: менеджер данных, менеджер буферов, менеджер транзакций и менеджер журнала.
Их функции взаимосвязаны и для обеспечения корректной работы СУБД все эти компоненты должны взаимодействовать по тщательно продуманным и проверенным протоколам.
Ядро является основной составляющей серверной части системы при использовании архитектуры КЛИЕНТ-СЕРВЕР. Ядро обладает собственным интерфейсом
(недоступен пользователям напрямую) используется в программах, производимых компилятором SQL и утилитах БД.
Ядро является основной составляющей серверной части системы при использовании архитектуры КЛИЕНТ-СЕРВЕР.
Ядро обладает собственным интерфейсом
( недоступен пользователям напрямую ) используется в программах, производимых компилятором SQL и утилитах БД.
Процессор языка БД (компилятор обычно SQL)
Обеспечивает оптимизацию запросов.
Создает машинно-независимого исполняемый внутренний код
Подсистема поддержки времени исполнения
системы поддержки времени выполнения, представляют собой интерпретатор внутреннего языка.
Интерпретатор - Вид транслятора, осуществляющего пооператорную (покомандную) обработку и выполнение исходной программы или запроса (в отличие от компилятора, транслирующего всю программу без её выполнения).
Сервисные программы
Утилиты - обеспечивают ряд дополнительных возможностей по обслуживанию информационных систем
В утилиты выделяют процедуры, которые накладно выполнять с использованием языка БД
(загрузка и выгрузка БД, сбор статистики, глобальная проверка целостности БД и т.д.)
8)Функции СУБД
1. Управление данными во внешней памяти
обеспечение необходимых структур
внешней памяти для хранения данных и
для служебных целей
2. Системный каталог или словарь данных
хранилище информации, описывающий данные в БД, данные о данных или МЕТАДАННЫЕ
Обычно в каталоге хранятся:
имена, типы, размеры элементов данных
имена связей
ограничения, накладываемые на данные
используемые индексы
имена санкционированных пользователей, которым предоставлено право доступа к данным
внешняя, концептуальная, внутренняя схемы и отображения между ними
статистические данные
3. Управление буферами оперативной памяти
В развитых СУБД поддерживается собственный набор буферов ОП
Отдельное направление СУБД:
Ориентировано на постоянное присутствие в ОП всей БД.
4. Управление ТРАНЗАКЦИЯМИ
ТРАНЗАКЦИЯ – Операции модификации информации в БД
5. Журнализация
Состоит из записей обо всех изменениях основной части БД.
Используется СУБД для восстановления информации во внешней памяти
Недоступна пользователям СУБД.
Состоит из записей обо всех изменениях основной части БД.
Используется СУБД для восстановления информации во внешней памяти
Недоступна пользователям СУБД.
Виды аппаратных сбоев:
мягкие сбои
жесткие сбои (с потерей информации)
Для восстановления БД после жесткого сбоя используют журнал и архивную копию БД.
6. Поддержка языков БД
9)Архитектура БД
Есть двухуровневая архитектура: 1) Логический уровень 2) Физических уровень
Трехуровневая: 1) Внешняя 2) Концептуальная 3) Внутренняя
![]() |
Внешний уровень – представление БД о точке зрения пользователей, описывает ту часть базы данных, которая относиться к каждому пользователю.
Концептуальный уровень – Обобщающее представление БД, описывает данные такими, какие они есть. Содержит логическую структуру всей БД, ограничения, накладываемые на данные, информация о целостности данных.
Внутренний уровень – физическое представление данных на ПК. Этот уровень описывает, как информация хранится в БД и предназначен для достижения оптимальной производительности и обеспечения экономного использования дискового пространства
Цель трехуровневой архитектуры –
Отделение пользовательских представлений БД от её физического представления.
Каждый пользователь должен иметь возможность обращаться к одним и тем-же данным, используя свое представление о них, не оказывая влияние на других пользователей.
Пользователь не знает подробностей хранения данных в базе.
Создается возможность переноса хранимой информации на другие носители, сохраняя работоспособность всех приложений, работающих с БД.
10) Определение и классификация моделей данных
Модель данных – интегрированный набор понятий для описания данных, связей между ними и ограничениях, накладываемых на них.
Модели данных подразделяются на три категории
объектные (object-based)
модели данных,
модели данных на основе записей (record-based),
физические модели данных.
При создании объектных
моделей данных используются следующие понятия:
Сущность— это отдельный элемент
деятельности организации (сотрудник или клиент, место или вещь, понятие или
событие), который должен быть представлен в базе данных.
Атрибут— это свойство, которое описывает некоторый аспект объекта и
значение которого следует зафиксировать.
Связь— это ассоциативное отношение между сущностями.
11) Схемы, отображения, независимость данных
Общее описание БД называют схемой БД
Есть три типа схем БД, которые определяются в соответствии с уровнем.
Внешние схемы или подсхемы
Концептуальная схема
Внутренняя схема
СУБД отвечает за установку соответствия. Между этими тремя типами схем и проверку их противоречности.
Отображения
Концептуальная схема связана с внутренней схемой посредством концептуально внутреннего отображения оно позволяет СУБД:
- найти фактическую запись или набор записей на физическом устройстве хранения, которые образуют логическую запись в концептуальной схеме, с учетом любых ограничений, установленных для операций, выполняемых над данной логической записью.
- обнаружить любые различия в именах объектов, именах атрибутов, порядке следования атрибутов, их типах данных и т.д.
Каждая внешняя схема связана с концептуальной схемой с помощью концептуально внешнего отображения. С его помощью СУБД может отображать имена пользовательского представления на соответствующую часть концептуальной схемы.
Типы независимости данных:
Логическая независимость от данных означает полную защищенность внешних схем от изменений, вносимых в концептуальную схему.
Физическая независимость от данных означает защищенность концептуальной схемы от изменений, вносимых во внутреннюю схему.
12) Иерархическая модель данных
В иерархической модели узел может иметь только одного родителя. Иерархическая модельможет быть представлена как древовидный граф с записями в виде узлов (которые также называются сегментами) и множествами в виде ребер его родителя.
Для описания структуры (схемы) иерархической БД на некотором языке программирования используется тип данных "дерево".
Тип "дерево" является составным. Он включает в себя подтипы ("поддеревья"), каждый из которых, в свою очередь, является типом "дерево". Каждый из типов "дерево" состоит из одного "корневого" типа и упорядоченного набора (возможно пустого) Каждый подчиненный узел связан с одним исходным. Близнецы – это записи, которые находятся на одном уровне и имеют одного предка. Целостность в иерархии автоматическая между предками и потомками.
+ Наглядность представления, Простота организации.
- Невозможность организации связей между объектами в разных ветвях.
13) Сетевая модель данных
Сетевая модель данных позволяет отображать разнообразные взаимосвязи элементов данных в виде произвольного графа, обобщая тем самым иерархическую модель данных
Для описания схемы сетевой БД используется две группы типов:"запись", "связь".
Тип "связь" определяется для двух типов "запись": предка и потомка. Переменные типа "связь" являются экземплярами связей.
Сетевая БД состоит из набора записей и набора соответствующих связей.
На формирование связи особых ограничений не накладывается. Если в иерархических структурах запись-потомок могла иметь только одну запись-предка, то в сетевой модели данных запись-потомок может иметь произвольное число записей-предков (сводных родителей).
14) Реляционная модель данных
Реляционная модель данныхпредложена сотрудником фирмы IBM Эдгаром Коддом и основывается на понятии отношение (relation)
Отношениепредставляет собой множество элементов, называемых кортежами. Наглядной формой представления отношения является привычная для человеческого восприятия двумерная таблица. Таблица имеет: строки (записи), столбцы (колонки). Каждая строка таблицы имеет одинаковую структуру и состоит из полей. Строкам таблицы соответствуют кортежи, а столбцам - атрибуты отношения. С помощью одной таблицы удобно описывать простейший вид связей между данными, а именно: деление одного объекта (явления, сущности, системы и проч.), информация о котором хранится в таблице, на множество подобъектов, каждому из которых соответствует строка или запись таблицы. Каждый из подобъектов имеет одинаковую структуру или свойства, описываемые соответствующими значениями полей записей. Поскольку в рамках одной таблицы не удается описать более сложные логические структуры данных из предметной области, применяютсвязываниетаблиц
+Достоинствореляционной модели данных: наглядность представления информации; Простота построения модели; малая избыточность данных.
-Недостатки реляционной модели: невозможность использования пользовательских типов данных.
15) (16) Определение реляционной алгебры / Реляционная алгебра. Определение. основные понятия.
Р.А. – это теоретический язык операций, который на основе одного или нескольких отношений позволяет создать новое отношение без изменения исходных отношений.
Исходные данные реляционной алгебры и результат являются отношениями, поэтому результат одной операции может стать исходными данными для другой операции, что позволяет создать вложенные операции, аналогично вложенным моделям – это называется замещенностью ????????????
Р.А. – это высокоуровневый процедурный язык, который используется для объяснения СУБД, как построить новое отношение из изменяющихся.
Процедурный язык – это последовательность действий.
17) Понятие эквивалентности отношений
Имеет одинаковую степень и такой набор атрибутов, что на одинаковых местах будут находиться сравнимые атрибуты, т.е. принимающие значение из одного домена. Над эквивалентными отношениями применяются теоретика – множественные операции – Объединение, пересечение, разность бинарных операций.
18)
19) Операции реляционной алгебры: объединение
Бинарная операция , требует эквивалентности
Отношение содержащее множество строк, принадлежавших первому или
второму исходным отношениям, исключая дублирующие строки. (данные на пересечении берутся 1 раз)
R1=(r1)
R2=(r2)
Где r1 и r2 строки отношений R1 и R2
R1 υ R2 = [ |r € R1 υ R2], где r – строка нового отношения, υ - сложение
20) Операции реляционной алгебры: деление
![]() |
из таблицы A берутся значения строк, для которых присутствуют все комбинации значений из таблицы B
Операция деления является набор строк отношенийR1, определенные на множестве атрибутов С, которые соответствуют комбинации всех кортежей отношения R2
C – атрибуты R1, которые не являются атрибутами отношений R2. Степень результатов = m-n
21) Операции реляционной алгебры: расширенное декартово произведение
Не требует эквивалентности, теоретико множественная оператсия
Определяет новое отношение, которое является результатом сцепления (конкатенации) каждого кортежа первого отношения с каждым кортежем второго отношения.
РДК меняет степень отношения результата, которая становиться равна ссуме степени их исходного отношения (m+n) Если исходные отношения имеют одинаковые имена атрибутов, то поле имени атрибута результирующего отношения будет стоять (хз что за слово) исходного отношения
22) Операции реляционной алгебры: выборка, проекция.
Проекция – унарная операция
(фильтруем поля)
Проекция является операцией, при которой из отношения выделяются атрибуты только из указанных доменов, то есть из таблицы выбираются только нужные столбцы, при этом, если получится несколько одинаковых кортежей, то в результирующем отношении остается только по одному экземпляру подобного кортежа.
Выборка
Выборка(фильтратсия данных из полей) — это операция, которая выделяет множество строк в таблице, удовлетворяющих заданным условиям. Условием может быть любое логическое выражение.
23) Операции реляционной алгебры: разность
Бинарная оператсия, требует
эквивалентности
в результирующем отношении содержатся кортежи, присутствующие в первом и отсутствующие во втором исходных отношениях. Операция разности зависит от порядка отношения в операции
24) Операции реляционной алгебры: соединение
Бинарная Операция соединения обратна операции проекции и создает новое отношение из двух уже существующих. Новое отношение получается конкатенацией кортежей первого и второго отношений, при этом конкатенации подвергаются отношения, в которых совпадают значения заданных атрибутов. (как объединение но данные на пересечении берутся х2)
Соединение является производной от операции
декартового произведения. Есть 5 операций соединения
Вот одно из них – ТЕТА – соединение – определяет новое отношение, которое содержит
троки декартового произведения исходных отношений, удовлетворяющих заданному
условию (=> , <= , = , < , > , <>) Степень результата n+m, где n и m степени исходных отношений
Естественное соединение – соединение, выполняемое по всем общим атрибутам двух отношений. Из результатов исключается по одному экземпляру общего атрибута. Степень результата n+m-k , где n и m степени исходных отношений, k – количество общих атрибутов
25) Операции реляционной алгебры: пересечение
Пересечение – бинарная оператсия, требует эквивалентности
Отношение которое содержит множество строк, принадлежавших
одновременно первому и второму отношению.
Результатом операции пересечения будет
отношение, состоящее из кортежей, полностью входящих в состав обоих
отношений.