4. Информация и данные. Система управления базой данных (СУБД), основные понятия банков данных, база данных как информационно - логическая модель предметной области.

1) Информатика рассматривает информацию как концептуально связанные между собой сведения, данные, понятия, изменяющие наши представления о явлении или объекте окружающего мира. Наряду с информацией в информатике часто употребляется понятие данные. Их отличие в том, что данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. В том случае, если появляется возможность использовать эти данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Поэтому можно утверждать, что информацией являются используемые данные.

2) База данных – это информационная модель, позволяющая упорядоченно хранить данные о группе объектов, обладающих одинаковым набором свойств.

Программное обеспечение, предназначенное для работы с базами данных, называется система управления базами данных (СУБД). СУБД используются для упорядоченного хранения и обработки больших объемов информации.

Система управления базами данных (далее «СУБД») - это специализированное программное обеспечение, которое предназначено для эффективного хранения и обработки больших объемов информации, представленной в БД.

На сегодняшний день СУБД занимает одно из основных мест в структуре ИБС, обеспечивая защищенный, надежный и эффективный способ хранения и обработки информации различного типа.

СУБД - организует хранение информации таким образом, чтобы ее было удобно: *просматривать, *пополнять, *изменять, *искать нужные сведения, *делать любые выборки, *осуществлять сортировку в любом порядке

Информация в базах данных структурирована на отдельные записи, которыми называют группу связанных между собой элементов данных. По способу установления связей между данными СУБД основывается на использовании трёх основных видов модели: иерархической, сетевой или реляционной; на комбинации этих моделей или на некотором их подмножестве.

Иерархическая модель - записи упорядочиваются в определенную последовательность, как ступеньки лестницы, и поиск данных может осуществляться последовательным «спуском» со ступени на ступень. Иерархическая база данных по своей структуре соответствует структуре иерархической файловой системы.

Сетевая модель - Сетевая модель СУБД во многом подобна иерархической: если в иерархической модели для каждого сегмента записи допускается только один входной сегмент при N выходных, то в сетевой модели для сегментов допускается несколько входных сегментов наряду с возможностью наличия сегментов без входов с точки зрения иерархической структуры.

Реляционная модель - по сути, представляет собой двумерную таблицу. Реляционная модель хранения данных была предложена И. Ф. Коддом в 1969 г.

Столбцы таблицы называются полями: каждое поле характеризуется своим именем и типом данных. Поле таблицы базы данных – это столбец таблицы, содержащий значения определенного свойства. В реляционной базе данных используются четыре основных типов полей: *Числовой, *Символьный (слова, тексты, коды и т.д.), *Дата (календарные даты в форме «день/месяц/год»), *Логический (принимает два значения: «да» - «нет» или «истина» - «ложь»)

Строки таблицы являются записями об объекте. Запись таблицы базы данных – это строка таблицы, содержащая набор значения определенного свойства, размещенный в полях базы данных.

Постреляционная - наличие таблицы внутри таблицы)

Многомерная модель, используется в системах искусственного интеллекта.

Исторически наибольшее распространение получили СУБД, поддерживающие реляционную модель хранения данных

СУБД позволяют объединять большие объемы информации и обрабатывать их, сортировать, делать выборки по определенным критериям и т. п. Современные СУБД дают возможность включать в них не только текстовую и графическую информацию, но и звуковые фрагменты и даже видеоклипы.

Простота использования СУБД позволяет создавать новые базы данных, не прибегая к программированию, а пользуясь только встроенными функциями. СУБД обеспечивают правильность, полноту и непротиворечивость данных, а также удобный доступ к ним, например СУБД: Microsoft Access и т.п.

Обычно в современной СУБД можно выделить:

- ядро, которое отвечает за управление данными во внешней и оперативной памяти и журнализацию, обеспечивающет организацию ввода, обработки и хранения данных;

- процессор языка базы данных, обеспечивающий оптимизацию запросов на извлечение и изменение данных и создание, как правило, машинно-независимого исполняемого внутреннего кода;

- подсистему поддержки времени исполнения, которая интерпретирует программы манипуляции данными, создающие пользовательский интерфейс с СУБД; *сервисные программы (внешние утилиты), обеспечивающие ряд дополнительных возможностей по обслуживанию информационной системы.

Важной компонентой СУБД явл-ся трансляторы или компиляторы (кот обеспечивают перевод языка СУБД на некотор внутр язык, используемый ядром) для используемых ею языковых средств.

Архитектурно СУБД состоит из двух языковых основных компонентов; языка описания данных, позволяющего создать схему описания данных (типов данных) в базе, и языка манипулирования данными (или язык запросов), выполняющего операции с базой данных (наполнение, обновление, удаление, выборку информации). Данные языки могут быть реализованы в виде тренажеров или интерпретаторов. Помимо ЯОД и ЯМД к СУБД следует отнести средства (или языки) подготовки отчетов (СПО), позволяющие подготовить сводки (отчеты) на основе информации, найденной в базе данных, по заданным формам.

Основные функции СУБД: Управление данными - можно указать, кому разрешено знакомиться с данными, корректировать их или добавлять новую информацию. Можно также определять правила коллективного доступа. Журнализация изменений, резервное копирование и восстановление базы данных после сбоев. Поддержка языков БД (язык определения данных, язык манипулирования данными). Определение данных - определить, какая именно информация будет храниться в базе данных, задать свойства данных, их тип (например, число цифр или символов), а также указать, как эти данные связаны между собой. Обработка данных - данные могут обрабатываться самыми различными способами. Можно выбирать любые поля, фильтровать и сортировать данные. Можно объединять данные с другой, связанной с ними, информацией и вычислять итоговые значения.

По архитектуре организации хранения данных:

*локальные СУБД (все части локальной СУБД размещаются на одном компьютере) и *распределенные СУБД (части СУБД могут размещаться на двух и более компьютерах).

Требования к современной СУБД

Масштабируемость - возможность СУБД хранить и обрабатывать увеличивающиеся в объеме данные, а также обслуживать большее количество одновременных сеансов работы пользователей, не теряя при этом в эффективности.

Поддержка многоплатформенности. Иногда возможности СУБД масштабироваться ограничены возможностями самой ОС, под управлением которой выполняется СУБД (ограничение на размер файлов, ограничение на объем адресуемой памяти и т. п.). В Необходимо, чтобы при значительном увеличении объемов данных и количества пользователей, использующих СУБД, можно было поменять программно-аппаратную платформу на более мощную

Современная СУБД должна иметь встроенную систему журналирования транзакций и резервного копирования данных, обеспечивающую быстрое восстановление работоспособности СУБД при сбоях и поддержание хранящихся данных в непротиворечивом состоянии.

Единая утилита администрирования - наличия в составе СУБД единой утилиты администрирования, обеспечивающей управление всеми ресурсами ИБС на основе СУБД из одной точки сети.

Открытая архитектура. Современные ИБС не являются однородными, поэтому современная СУБД должна поддерживать, помимо фирменных интерфейсов, универсальные интерфейсы доступа к данным (ODBC, JDBC).

3) Банк данных является классическим примером ИС. В банке данных реализованы функции централизованного хранения и накопления обрабатываемой информации, организованной в одну или несколько баз данных. Банк данных (БнД) является современной формой организации хранения и доступа к информации.

Банк данных – это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных.

Основные требования, предъявляемые к БнД:

- адекватность отображения предметной области (полнота, целостность и непротиворечивость данных);

- возможность взаимодействия пользователей разных категорий и в разных режимах;

- дружелюбность интерфейсов и малое время на освоение системы, особенно для конечных пользователей;

- обеспечение секретности и конфиденциальности для некоторой части данных;

- определение групп пользователей и их полномочий;

- обеспечение взаимной независимости программ и данных;

- обеспечение надежности функционирования БнД; защита данных от случайнго и преднамеренного разрушения; - возможность быстрого и полного восстановления данных в случае их разрушения;

- приемлемые характеристики функционирования БнД (стоимость обработки, время реакции системы на запросы, требуемые машинные ресурсы и др.).

Приемущества:

- Существенно изменит деятельность организации, где она внедряется: привести к обеспечению большей доступности данных для всех категорий сотрудников, сокращению документооборота, перераспределению функций между сотрудниками и изменению характера выполняемых функций;

- Централизованное управление данными - использование СУБД обеспечивает высокое качество выполнения функций по управлению данными и облегчает процесс создания информационных систем;

- Выделение специальной группы сотрудников, выполняющих функции по проектированию и развитию БнД (администраторов БД), и освобождение от этих функций всех остальных пользователей

Основные недостатки:

- предъявляются высокие требования к квалификации разработчиков БнД, - Для управления данными требуется специализированное программное обеспечение, которое, в зависимости от класса системы, может быть сравнительно дорогим, предъявляющим повышенные требования к техническим средствам.


Информационная компонента. Ядром БнД является база данных. База данных – это поименованная совокупность взаимосвязанных данных, находящихся под управлением СУБД.

Программные средства БнД представляют собой сложный комплекс, обеспечивающий взаимодействие всех частей информационной системы при ее функционировании. Основу программного обеспечения БнД представляют программные компоненты СУБД: ядро СУБД, обеспечивающее создание БД, организацию ввода, обработки и хранения данных и другие компоненты, обеспечивающие настройку системы, средства тестирования, утилиты, обеспечивающие выполнение вспомогательных функций, таких как восстановление баз данных, сбор статистики о функционировании БнД и др.

Языковые средства предназначаются для пользователей разных категорий: конечных пользователей, системных аналитиков, профессиональных программистов. Повышение уровня языковых средств позволяет пользователям-непрограммистам большее число функций выполнять самостоятельно.

Языки запросов (ЯЗ)- предназначенные для формирования запросов к БД (в такой трактовке их можно считать одной из разновидностей ЯМД). Однако сейчас ЯЗ понимается шире, многие ЯЗ включают в себя еще и возможности описания данных и корректировки БД.

В составе языков описания данных(ЯОД) в зависимости от особенностей СУБД поддерживаются все или некоторые из следующих языков: язык описания схем (ЯОС), язык описания подсхем (ЯОПС), язык описания хранимых данных (ЯОХД), языки описания внешних данных (входных, выходных). В некоторых СУБД и сами эти разновидности языков, и

Языки манипулирования данными (ЯМД) разделяются на две большие группы: процедурные и непроцедурные. При пользовании процедурными языками надо указать, какие действия и над какими объектами необходимо выполнить, чтобы получить результат. В непроцедурных языках указывается, что надо получить в ответе, а не как этого достичь.

Технических средства для банков данных чаще всего используются универсальные ЭВМ, периферийные средства для ввода информации в базу данных и отображения выводимой информации. Иногда используются дополнительные технические средства для хранения больших объемов данных на внешних носителях. Если банк данных реализуется в сети, то необходимы соответствующие технические средства для обеспечения ее работы

Организационно-методические средства банка данных представляют собой различные инструкции, методические и регламентирующие материалы, предназначенные для пользователей разных категорий, взаимодействующих с банком данных. Это могут быть инструкции конечным пользователям по работе с базой данных, документы, определяющие права доступа и регламент работы; сюда же отнесем и методики проектирования баз.

Администраторы банка данных Функционирование БнД невозможно без участия специалистов, обеспечивающих создание, функционирование и развитие БнД. Такая группа специалистов называется администратором банка данных (АБД). Эта группа специалистов считается составной частью банка данных.

4) Информационно-логическая модель (ИЛМ) отображает данные предметной области в виде совокупности информационных объектов (ИО) и связей между ними. Эта модель представляет данные, подлежащие хранению в базе данных. Каждый информационный объект в модели данных должен иметь уникальное имя.

Информационный объект — это информационное описание некоторой сущности предметной области; реального объекта, процесса, явления или события. Информационный объект является совокупностью логически взаимосвязанных реквизитов, представляющих качественные и количественные характеристики сущности. Примерами сущностей являются: товар, поставщик, заказчик, поставка, отгрузка, сотрудник, отдел, студент, преподаватель, кафедра и т.п

Процесс выделения информационных объектов предметной области, отвечающих требованиям нормализации, может производиться на основе интуитивного или формального (аналитического) подхода. При интуитивном подходе сразу легко могут быть установлены информационные объекты, соответствующие реальным объектам. Однако получаемая при этом информационно-логическая модель, как правило, требует дальнейших преобразований, в частности, преобразования многозначных связей между объектами. При отсутствии достаточного опыта использования такого подхода возможны существенные ошибки.

При аналитическом подходе в ходе исследования предметной области сначала необходимо выявить совокупность данных и различных сведений об объектах и процессах, характеризующих данную область, перечень документов, содержащих эти данные, а также комплекс задач и запросов, которые предполагается реализовать.

Важнейшим этапом проектирования базы данных является разработка информационно-логической (инфологической) модели предметной области. Информационно-логическая модель предметной области отражает предметную область в виде совокупности информационных объектов и их структурных связей.

Инфологическая модель предметной области строится первой. Предварительная инфологическая модель строится еще на пред проектной стадии и затем уточняется на более поздних стадиях проектирования баз данных.

Требования, предъявляемые к инфологической модели:

1.Основное требование - адекватное отображение ПО. ИЛМ должна быть непротиворечивой.

2.Несмотря на то, что реальный мир, отображаемый в ИЛМ, является по своей природе бесконечным, она является конечной, что обеспечивается четким ограничением ПО. ИЛМ должна в связи с этим обладать свойством легкой расширяемости, обеспечивающим ввод новых данных без изменения ранее определенных, а также и удаление данных.

3.Инфологическая модель должна легко восприниматься разными категориями пользователей, а также всеми специалистами, которые в дальнейшем участвуют в процессе проектирования БД и программного обеспечения. Желательно, чтобы ИЛМ строил специалист, работающий в этой ПО.