Р. майсурадзе проектирование б a з данных Регистрировано редакционно- издательским советом гту тбилиси 2008 icon

Р. майсурадзе проектирование б a з данных Регистрировано редакционно- издательским советом гту тбилиси 2008


Смотрите также:
Р. майсурадзе проектирование б a з данных Регистрировано редакционно- издательским советом гту...
Утверждено редакционно-издательским советом гту, 27. 05. 2009, протокол №5 Тбилиси 200 9...
Учебно-методическое пособие Рекомендовано редакционно-издательским советом Академии управления...
Технический университет И. П...
И. А. Грешилова, М. Н...
Учебное пособие Омск  2008 Федеральное агентство по образованию...
Учебное пособие Омск 2008 Федеральное агентство по образованию...
И. З. Шарипов материаловедение рекомендовано редакционно-издательским советом угату в качестве...
Методические указания...
Ж. Д. Дамбиева Microsoft PowerPoint...
Программа-минимум кандидатского экзамена по специальности 05. 02...
Прокурор в уголовном процессе...



Загрузка...
страницы:   1   2   3   4   5
скачать
ГРУЗИНСКИЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ


С. М. ПОЧОВЯН, Г. Р. МАЙСУРАДЗЕ


проектирование бAз данных




Регистрировано редакционно-
издательским советом ГТУ


Тбилиси

2008


УДК 658.012.011.56


Рассмотрены методология и методика проектирования баз данных. Изложены основные концепции, архитектура базы и банка данных, методы представления предметной области, основные подходы и модели построения баз данных, воп- росы поддержания целостности, нормализации и построения канонической структуры базы данных.

Предназначено для студентов, магистрантов и докторан- тов, разработчиков и администраторов баз и банков данных, специалистов по автоматизированным системам управления.


Рецензент: проф. Сургуладзе Г. Г.


© Издательский дом “Технический университет”, 2008

ISBN 978-9941-14-032-7


Предисловие

Содержание учебного пособия соответствует программе курса «Проектирование баз данных», читаемого студентам по специальности «Автоматизированные системы обработки ин-формации и управления». Кроме того, учебное пособие постро-ено таким образом, чтобы его могли использовать магистран- ты, докторанты, разработчики баз и банков данных, а также спе-циалисты по автоматизированным системам управления.

Книга предназначена для того, чтобы дать знания о теоре-тических основах, то есть методологии и методике, проектиро-вания баз и банков данных. Базы и банки данных проектиру- ются, внедряются и используются в составе автоматизирован- ных систем управления различных уровней управления. Разра- работка баз данных обеспечивает эффективтивную организацию данных в сфере управления фирмами, организациями, предприя-тиями, банками и в научных исследованиях.

^ В первой главе рассматриваются следующие вопросы: приведены основные концепции и определения баз и банков данных; логическое и физическое описания данных, определе-ния виртуальных и прозрачных данных; основные типы орга-низации данных, назначение администратора базы данных, не-обходимость двух уровней независимости (логической и физи-ческой) данных; определения модели данных, схемы, подсхе- мы, основных структур и видов описания данных; описание архитектуры базы и банка данных; основные типы связей в

схемах и подсхемах; разработка модели предметной области.

^ Во-второй главе рассматриваются следующие вопросы: моделирование локальных проектных представлений; объедине-ние моделей локальных представлений с описанием используе-мых основных концепций; организация иерархических, сетевых и реляционных моделей и представлений баз данных, описания ограничений целостности; определения и описания основных нормальных форм схем отношений и операций реляционной алгебры; основные этапы и процедура построения каноничес- кой структуры базы данных.


Введение

Появление баз и банков данных изменило природу эволю-ции общества. Базы данных разрабатывают поэтапно и пред-ставляют собой совокупность взаимосвязанных хранящихся вместе данных. Существующие и разрабатываемые базы дан- ных предназначены для ограниченного ряда приложений. Наз-начение базы данных заключается в том, чтобы одну и ту же совокупность данных можно было использовать для макси-мального возможного числа приложений. Использование баз данных позволяет обеспечить многоаспектный доступ к сово-купности взаимосвязанных данных, интеграцию и централиза-цию управления данными, устранение излишней избыточности данных, возможность эффективного совмещения различных ре-жимов обработки данных. Вместе с потребностями в базах дан-ных в различных сферах управления возрастают требования на технические и программные средства обслуживания баз данных. Базы и банки данных разрабатываются в составе информаци-онного обеспечения автоматизированных систем управления, и поэтому являются одними из основных компонентов автомати-зированных систем различных типов и уровней управления. Кон-цепция баз данных стала определяющим фактором при создании эффективных систем автоматизированной обработки данных.


Глава 1. Методология проектирования

баз данных

1.1. Современная концепция баз данных

Разработка баз данных является одним из основных нап-равлений деятельности в области обработки данных. Данные рассматриваются как жизненно важные ресурсы, которые дол-жны быть организованы так, чтобы ценность их была по воз-можности максимальной. Новый подход к организации про-цессов обработки данных нашёл наиболее яркое выражение в концепциях баз и банков данных. Концепция баз данных стала определяющим фактором при проектировании эффективных ав-томатизированных систем управления

Проектирование и использование баз и банков данных из-менило природу эволюции общества, так как объём массивов данных, которые можно накапливать и обрабатывать на со-временных персональных компьютерах, непрерывно возраста- ет. На практике существует известное, но трудно реализуемое понятие базы данных как хранилища большого обьёма данных, в которое можно помещать все обрабатываемые данные и из которого пользователи могут эти данные получать. Такая база данных представляется очень сложной и нереальной. Тем не менее базы данных необходимо поэтапно разрабатывать. Су-ществующие и разрабатываемые базы данных предназначены для ограниченного ряда приложений. На практике часто на од-ном компьютере создаются и используются несколько баз дан-ных. Базы данных реализующие отдельные функции можно за-тем объединять, если это будет способствовать увеличению эффективности и интенсивности использования всей системы. Назначение базы данных заключается в том, чтобы одну и ту же совокупность данных можно было использовать для мак- симального возможного числа приложений. Базы данных необ- ходимо разрабатывать в качестве хранилища такой информа- ции, необходимость в которой возникает в процессе выполне- ния определённых функций в организации, предприятии, фир- ме и т.д. Такая база данных должна обеспечивать не только поиск и получение необходимой информации, но и постоянную модификацию данных, необходимую для процессов управления. Определённые совокупности данных баз данных могут быть ис- пользованы другими организациями.

Понятие об информации как о знании о чём-либо сложилось давно. Информация создаётся и используется во всех сферах человеческой деятельности. Человек создаёт информационные системы как для обработки и передачи информации, так и для принятия управленчесих решений. Представим следующую си-туацию: имеются некоторая система, информация о состоянии которой представляет интерес, и наблюдатель, способный вос-производить состояния системы и в определённой форме фик-сировать их в своей памяти. В этом случае говорят, что в па- мяти наблюдателя находятся «данные», описывающие состоя- ние системы. В качестве такого «наблюдателя» в общем случае и выступает информационная система. Соответственно двум понятиям – «информация» и «данные» – в базах данных раз-личают два аспекта рассмотрения вопросов: инфологический и датологический.

^ Инфологический аспект употребляется при рассмотрении вопросов, связанных со смысловым содержанием данных, не- зависимо от способов их представления в памяти системы. На этапе инфологического проектирования информационной сис-темы должны быть решены вопросы: 1) о каких объектах или явлениях реального мира требуется накапливать и обрабатывать информацию в системе; 2) какие их основные характеристики и взаимосвязи между собой будут учитываться; 3) уточнение вводимых в информационную систему понятий об объектах и явлениях, их характеристиках и взаимосвязях. Таким образом, на этапе инфологического проектированая выделяется часть реального мира, определяющая информационные потребности системы, то есть её предметная область.

^ Датологический аспект употребляется при рассмотрении вопросов представления данных в памяти информационной сис-темы. При датологическом проектировании системы исходя из возможностей имеющихся средств восприятия, хранения и об-работки информации разрабатываются соответствующие формы представления информации в системе посредством данных, а также приводятся модели и методы представления и преобра-зования данных, формируются правила смысловой интерпрета-ции данных.

Данные соответствуют зарегистрированным фактам об объ-ектах или явлениях реального мира. Чтобы в дальнейшем ис-пользовать данные, требуется их смысловое содержание – се-мантика данных. Поэтому в информационной системе дол- жны быть сформулированы правила смысловой интерпретации данных. В некоторых случаях известно смысловое содержание поступающих данных на основе априорной информации о мес-тах, способах и времени их формирования. Тогда семантика данных определяется контекстом их применения в системе, поэтому достаточно обрабатывать только конкретные значения поступающих данных. На практике встречаются информаци-онные системы, для которых данный способ интерпретации данных не обеспечивает нормальное функционирование. Для таких систем более характерны способы, позволяющие семан-тику данных выражать в самих данных, что диктуется необ-ходимостью выполнения определённых видов смысловой об-работки данных, то есть, данные уже нельзя рассматривать просто как совокупность некоторых значений. Это представ-ление носит абстрактный характер, поскольку в соответствии с целями системы при формировании данных выполняется абстрагирование от несуществующих деталей описания фактов, то есть является целевой информационной моделью предмет- ной области, реализованной в системе посредством данных. Ос- новными средствами представления семантики данных являют-ся естественные и формализованные языки. Формализованные языки позволяют эффективно организовать обработку данных на компьютере и представить необходимую семантику данных, удовлетворяющую практическим потребностям пользователей. Базы данных относятся к этому классу информационных сис- тем. Таким образом, по своему назначению база данных – это информационная система. Базы данных применяют в сфе- ре управления организациями, предприятиями и фирмами, тран-спортом, в медицине и сельском хозяйстве, научных исследо-ваниях и т.д. Базы данных проектируются в составе автоматизи-рованных систем управления различных уровней управления.

^ Базу данных можно определить как совокупность взаимо-связанных хранящихся вместе данных при выполнении следу-ющих условий:

- наличие такой минимальной избыточности, которая до-пускает их использование оптимальным образом для одного или нескольких условий;

- данные запоминаются так, чтобы они были независимы от программ, использующих эти данные;

- для модификации и поиске данных применяется общий управляемый способ;

- данные структурируются таким образом, чтобы была обес-печена возможность дальнейшего наращивания приложений;

- на одном компьютере может быть создана одна или не-сколько баз данных, и кроме того, одна база данных может быть организована на нескольких компьютерах;

- к совокупности данных должны иметь доступ программы;

- одну и ту же совокупность данных можно использовать для для максимально возможного числа приложений.

Система баз данных содержит совокупность баз данных, если эти базы данных структурно полностью самостоятельны. Совокупность баз данных называется банком данных.


^ 1.2. Основные определения базы

и банка данных

Под информацией понимают любые сведения о каком-ли- бо событии, сущности, процессе и т.д., являющиеся объектом некоторых операций: восприятия, хранения, преобразования, ис- пользования и передачи.

^ Данные можно определить как информацию, фиксированную в определённой форме, используемой для последующей обра-ботки, хранения и передачи.

Байт – наименьшая адресуемая группа битов.

Элемент данных (или поле в файлах) – наименьшая едини-

ца поименованных данных. Он может состоять из любого ко-личества битов и байтов.

^ Агрегат данных – поименованная совокупность элементов данных внутри записи, рассматриваемая как единое целое. На-пример, агрегат ДАТА может состоять из элементов данных: ЧИСЛО, МЕСЯЦ и ГОД. Часто агрегат называется группой или групповым элементом. Существуют два типа агрегата дан-ных: векторы и повторяющиеся группы. Вектор – одномерная упорядоченная совокупность элементов данных. Например, при-ведённая выше совокупность ДАТА. Повторяющаяся группа – совокупность данных, которые встречаются несколько раз в эк-земпляре записи. Например, приём и выдача вкладов в записи счёта сберкассы. В повторяющую группу могут входить отдель-ные элементы данных, векторы, агрегаты данных или другие повторяющие группы.

^ Логическая запись (или запись) – поименованная совокуп- ность элементов данных или агрегатов данных. При поиске и чтении из базы данных программы прочитывают логические записи.

^ Физическая запись – злементарная единица данных, которая может быть считана или записана одной командой ввода-вы- вода программы. Одна физическая запись может содержать од- ну или множество логических записей.

^ Набор данных (или набор) – поименованная совокупность физических записей. (или записей), образующих двухуровневую иерархическую структуру.

Группа – это поименованная совокупность элементов дан-ных или элементов и других групп. Различают группы: простую и составную, повторяющуюся и неповторяющуюся.

Файл – поименованная совокупность всех экземпляров ло-

гических записей заданного типа. В простом файле в каждой ло-гической записи содержится одинаковое число элементов дан-ных. В сложном файле из-за наличия повторяющихся групп за-писи могут состоять из различного числа элементов данных.

^ База данных – совокупность экземпляров различных типов записей и отношений между записями, агрегатами данных и эле-ментами данных.

Предметная область – это область применения базы дан-ных.

^ Банк данных или система баз данных совокупность баз данных. В одной системе может использоваться несколько баз данных, в каждой из которых используются не все типы запи-сей, а только их совокупность. Но в этом случае предполага- ется, что различные базы данных разделены и не связаны меж- ду собой. И для обозночения этой совокупности баз данных потребляется термин банк данных.

^ Банк данных – зто информационная система, включающая в свой состав комплекс специальных методов и средств для поддержания динамической информационной модели предмет-ной области с целью обеспечения информационных запросов пользователей. Граница банка данных определяется задачами поддержания информационной модели в требуемом состоянии и обеспечения информационных запросов пользователей. За-дача поддержания информационной модели в требуемом сос-тоянии требует чтобы в банке данных выполнялись операции хранения и модификации (то есть операции исправления, допол-нения и удаления данных) в информационной модели, в со-ответствии с изменениями состояний, состава и связей между объектами предметной области. Задача обеспечения инфома-ционных запросов пользователей имеет два аспекта. Первый аспект – это определение границ предметной области и раз-работка описания информационной модели. Банк данных дол-жен обеспечивать автоматизированную систему всей необходи-мой информацией, включая и ту, которая может потребовать- ся при расширении автоматизированной системы. Второй ас- пект – разработка банка данных, ориентированного на эффек-тивное обслуживание запросов пользователей. Для этого ана-лизируют типы и виды запросов пользователей, а также функ-циональные задачи автоматизированной системы, для которых банк данных является источником информации.

^ Банк данных включает следующие основные компоненты: базу данных, систему управления базой данных (СУБД), ад-министратора базы данных (АБД), словарь данных, одну или несколько персональных компьютеров и обслуживающий пер-сонал. База данных (БД) – это датологическое представление информационной модели предметной области. Система управ-ления базой данных – это специальный пакет программ, по-средством которого реализуется централизованное управление базой данных и обеспечивается доступ к данным. Для этого использутся языки описания данных (ЯОД) и языки манипу-лирования данными (ЯМД). Банк данных может включать в свой состав несколько разнотипных СУБД. ЯОД – это язык высокого уровня, декларативного типа, предназначенный для задания подсхем и схемы базы данных. С его помощью опи-сываются типы данных, их структура и связи между собой. ЯМД (или называемый языком запросов) представлен систе- мой команд манипулирования данными. Например, 1) произ-вести выборку из базы данных конкретного данного, значе- ние которого удовлетворяет заданному условию; 2) произвести выборку из базы данных всех данных определённого типа, значения которых удовлетворяют заданным условиям и т.д. Словарь данных представляет собой специальную систему, предназначенную для хранения единообразной и централизо-ванной информации обо всех ресурсах банка данных. В слова- ре данных содержатся следующие сведения: об объектах, их свойствах и отношениях; о хранимых данных (наименования, шифры, смысловые описания, структура, связи с другими дан-ными и т.д.); о форматах представления данных и возможных значениях; о источниках возникновения данных; о разграниче-ниях доступа к данным со стороны пользователей и кодах за-щиты, описания моделей баз данных и отображений между ни-ми и т.д. Администратор базы данных – это лицо (или груп- па лиц), реализующее управление базой данных. Если в качес-тве объекта управления выступает база данных, то качестве уп-равляющего органа – один или несколько специалистов, зна-комых с теорией систем обработки данных и со спецификой предметной области и реализующих централизованное управ-ление базой данных, включая принятия и реализацию реше- ний об изменениях в состоянии базы данных.


^ 1.3. Логическое и физическое описания данных

Описания данных и отношения между ними бывают двух видов: логическое и физическое. Логическое описание данных указывает на то, в каком виде данные представляются поль-зователю или программисту. Физическое описание данных оп-ределяет способ физического хранения данных во внешней памяти. Термины логический и физический используются для описания различных аспектов данных: логический – указывает на то, как данные представляются пользователю или програм-мисту, а физический – указывает, каким образом данные хра-нятся в среде хранения. Для уменьшения объёма памяти и вре-мени доступа физическая запись может содержать несколько логических записей. Структура данных и их взаимосвязь в фи-зической и логической организациях данных могут не совпа-дать. Терминами логическое описание, логическая структура и логическое отношение данных описываются представление дан- ных с точки зрения пользователя или программиста. Термины физическое описание, физическая структура и физическое от-ношение данных описывают способы хранения данных. Прог-раммное обеспечение передаёт программам логические записи в требуемых последовательностях. Преобразование логических описаний в физическую выполняется программным обеспече-нием. Слово виртуальный, относящееся к данным и техничес-ким запоминающим устройствам, указывает на то, что некото-рый элемент в запросе представляется прикладному програм-мисту или пользователю существующим, тогда как фактичес- ки в таком виде он отсутствует. Например, программист может писать программу в предположении, что память бесконечна, в то же время как на самом деле память ограниченна. Аналогично программист может обращаться за виртуальными данными, ко-торые предполагаются существующими, но не существуют фак-тически, по крайней мере в данной представленной форме, или располагаются на винчестере другого персонального компью-тера. В то время как виртуальное представляется только су-ществующим, прозрачное представляется несуществующим, но на самом деле существует. Прозрачными для прикладных прог-раммистов, пользователей и прикладных программ являются механизмы хранения и передачи данных, а также процессы преобразования логических файлов в физически хранящиеся данные и обратно. Например, когда программа запрашивает логическую запись, она может получать только необходимые ей поля. В физически хранимой записи могут существовать ещё другие элементы данных, требуемые для других приложений, но они являются прозрачными для данной программы. Только используя прозрачность можно строить сложные структуры баз данных.

Элементы, информацию о которых мы сохраняем, называют объектами. Объект может быть материальным (например, слу- жащий, студент, изделие) и нематериальным (например, собы-тие, название курсового проекта, счёт покупателя). Объект име- ет различные свойства, которые можно запоминать (например, ФИО, цвет). При обработке данных имеют дело с совокупнос-тью однородных объектов (например, служащие, студенты) и записывают информацию об одних и тех же свойствах каждо- го из них. Совокупность однородных объектов называют на- бором объектов. Информация может находиться на бумажных документах или во внешней памяти персональных компьюте-ров. Программисты и пользователи имеют дело с записью о каждом объекте и записями об однородных объектах, сгруп-пированных в наборы записей об объектах. Записи связаны с атрибутами объектов (то есть названиями, идентификаторами полей записей) и содержат значения этих атрибутов. При об-суждении понятия информация выделяют три области. Первая область – реальный мир, в котором объекты существуют и имеют определённые свойства. Вторая область – область идей и информация, существующая в представлении пользователей и программистов. В этой области имеют дело с атрибутами объектов, обозначают атрибуты символически (на естественном языке и языке программирования), а также атрибутам припи-сывают значения. Третья область  область, в которой исполь-зуются строки символов и битов для кодирования элементов информации, Эту область затем разделяют: 1) на данные в представлении пользователей и прикладных программистов; 2) общую логическую структуру данных в представлении ад-министратора базы данных; 3) на физическое представление данных. Совокупность символов или битов, представляющая значение конкретного элемента данных, должна быть связана с тем элементом данных, который имеет это значение. Эле- мент данных представляет атрибут, и атрибут должен быть связан с соответствующим объектом. Один атрибут имеет кон-кретное значение, которым он идентифицирует объект. Самый простой способ связи величины с элементом данных и связи элементов данных с атрибутами соответствующих объектов – это запоминание элементов данных вместе в виде фиксирован-ной последовательности. Такое простое двумерное отображе- ние элементов данных называют плоским. Многие файлы пред-ставляют собой плоские, или двумерные файлы. Фиксирован-ную последовательность элементов данных, то есть записи та-ких двумерных плоских файлов, представляют в виде таблицы (прямоугольника) (рис. 1.1.÷1.3.). В прямоугольнике представ-лен набор элементов данных. Приведено значение каждого эле-мента данных. В каждой строке перечислены элементы дан- ных, относящиеся к конкретному объекту. Каждая колонка (столбец) содержит имя (название) атрибута (то есть поля за-писи). Крайные левые колонки содержат те элементы данных (в прямоугольнике они подчёркнуты), которые идентифициру-ют объект. Вверху над прямоугольником для каждой колон- ки приведены шифр, тип и длина элемента данных (то есть поля записи), связанные с атрибутом конкретного типа. Име- на, шифры, тип и длина атрибутов не записываются в файле, а записываются в словаре данных. Некоторые значения (шиф- ры и имена) атрибутов (например, Шифр-отдела, Шифр-про-фессии) могут быть именами и идентификаторами объектов в других файлах. Группа элементов данных, формирующая стро-ку на рис 1.1.÷1.3., составляет запись об объекте. Хранимая запись может отличаться от записи, представляемой програм-мистом, а также может отличаться от физической записи. Фи-зическая запись может содержать много хранимых записей. Со-вокупность данных, показанная на рис. 1.1.÷1.3., представляет собой взаимосвязь между этими элементами данных. Такой на-бор взаимосвязанных величин называется записью, кортежем или группой элементов данных. Программист, пользователь и администратор базы данных должны иметь возможность обра-щаться к записи (кортежу), связанному с данным объектом. Прикладная программа должна иметь возможность идентифи-цировать запись (записи) и располагать средствами их обнару-жения на запоминающем устройстве. С этой целью один или несколько элементов данных определяются в качестве иден-тификатора объекта (например, идентификаторами объекта СВЕДЕНИЯ-О-РЕЙСАХ-САМОЛЁТОВ являются Номер-рейса и Дата-вылета (число, месяц и год); идентификаторами объ- екта СЛУЖАЩИЕ (рис. 1.3.) являются Шифр-организации и Шифр-служащего). Идентификатор объекта рассматривается как ключ записи или группы записей и называется первич- ным ключом (на рис. 1.1.÷1.3. первичные ключи подчёркнуты). В тех случаях, когда в качестве ключа используются несколь- ко элементов данных (то есть два, три и более элементов данных), они должны соединяться символом „+“ (например,


ОРГАНИЗАЦИИ


BIWOR1 BIWNO2 BIWAO3 BIWWR4 BIWTR5


N(6) C(16) C(30) C(18) C(8)


Шифр


органи-


зации




Наименование


организации



Адрес


организации




ФИО


руково-


дителя


Рабочий


телефон


руков.



1



2



3


4


5


104715


104716




Фирма

«Компсервис»


Фирма «Комптех-

обслуживание»



г. Тбилиси, пр.

Важа Пшавела 476


г. Тбилиси, пр.

А. Церетели 392


Махарад-

зе В. С.


Ломидзе

Т. А.


39-17-45


34-95-77


Рис. 1.1. Набор элементов данных (простое двумерное отобра-

жение элементов данных) записи типа «ОРГАНИЗАЦИИ»


ОТДЕЛЫ


BITOR1 BITOT2 BITNT3 BITAT4 BITWT5 BITTT6



N(6) N(3) C(18) C(30) C(18) C(8)



Шифр


органи-


зации


Шифр


отдела




Наименование


отдела




Адрес


отдела




ФИО


зав.


отделом



Рабочий


телефон


зав. отд.


1


2


3


4


5


6



104715

104715

104715

104716

104716

104716

104716



201

202

203

301

302

303

304



Отдел кадров

Бухгалтерия

Сервисный

Канцелярия

Отдел кадров

Бухгалтерия

Техобслуживание



״ –

״ –

״ –

״ –

״ –

״ –

״ –


Каладзе А.С.

Метревели Г.В.

Парфёнов Н.Б.

Васильева Т.А.

Каландадзе Н.Г.

Пирцхалава Д.К.

Балашов И.И.


39-17-45

39-17-46

39-35-36

34-95-77

34-08-42

34-95-18

34-08-42


Рис. 1.2. Набор элементов данных (простое двумерное

отображение элементов данных) записи типа «ОТДЕЛЫ»

СЛУЖАЩИЕ


BICOR1 BICCL2 BICOT3 BICWC4 BICDO5 BICPR6 BICPO7 BICTC8


N(6) N(4) N(3) C(18) N(2) N(4) N(1) C(8)



Шифр


органи-


и- зации



Шифр


служа-


щего



Шифр


отдела




ФИО


служащего





Шифр


долж-


ности



Шифр


профес-


сии





Пол



Рабочий


телефон


служащ.




1



2


3


4


5


6


7


8


104715


104715

104715


104715


104716


104716


104716


104716


3003


3004


3005


3006


1004


1005


1006


1007


202


201


203


203


302


301


304


303




Метревели Г. В.

Каладзе А. С.


Парфёнов Н. Б.

Сахаров С. В.


Каландадзе Н.Г.


Васильева Т. А.

Балашов И. И.

Пирцхалава Д.К.



12


15


16


16


15


14


16


12


2105


1940


1800


1800


1940


1642


1800


2105


1


1


1


1


2


2


1


2


39-17-

46

39-17–

45

39-35–

36

39-35-

36

34-95-

77

34-95-

77

34-08-

42

34-95-

18


Рис. 1.3. Набор элементов данных (простое двумерное

отображение элементов данных) записи типа «СЛУЖАЩИЕ»


Номер-рейса + Дата-вылета; Шифр-организации + Шифр-служа-щего).

^ Первичный ключ – это такой элемент данных или такая со-вокупность элементов данных, которая единственным образом идентифицирует одну запись или группу записей. Кроме того, первичный ключ должен включать в свой состав минимально

необходимое количество элементов данных.

Значения атрибутов не обязательно должны запоминаться вместе с ключами таким способом, как это показано на рис. 1.1.÷1.3, так как в этом случае почти всегда существует из-быточность значений атрибутов. Для того чтобы устранить из-быточность, значения атрибутов могут храниться отдельно от ключей и снабжаться указателями на них со стороны ключей.

Прикладная программа может использовать ключ, который идентифицирует не уникальную запись (кортеж), а все записи или группы записей, имеющие определенное свойство. Такой ключ называется вторичным. Вторичный ключ не идентифи-цирует объект единственным образом. Например, значение ат- рибута Цвет может быть использовано как вторичный ключ, например Зелёный. Этот ключ может быть использован для идентификации объектов, которые имеют например Зелёный цвет или для тех записей (кортежей), для которых элемент данных Цвет имеет значение Зелёный. Файл может иметь не-сколько вторичных ключей, которые используются для поиска записей с данными характеристиками. Например, на рис. 1.3. вторичными ключами могут быть – Шифр-профессии и Пол. Связь вторичного ключа с элементами данных или группами элементов данных, к которым он относится, может быть реали- зована различными способами. Один из таких способов – ис-пользование вторичного индекса. Вторичный индекс использу- ет вторичный ключ как вход, а на выходе предоставляет пер-вичный ключ, в результате чего идентифицируется нужная за-пись. Элементарная форма вторичного индекса – инвертиро-ванный список. Инвертированный список содержит все значе- ния вторичного ключа и хранит вместе с каждым его значе- нием соответствующие идентификаторы записи. Например, на основе файла на рис. 1.3. для каждого вторичного ключа может быть получен свой инвертированный список: 1) Шифр-про- фессии, Шифр-организации и Шифр-служащего; 2) Пол, Шифр- -организации и Шифр-служащего. Списки не содержат других, представленных на рис. 1.1.÷1.3., атрибутов. Списки должны использоваться вместе с файлом (рис. 1.1.÷1.3.) для получения информации, касающейся других атрибутов.

Существуют два основных метода, с помощью которых данные могут быть организованы и использованы. Первый спо-соб определяется тем, что каждая запись (кортеж) содержит значения атрибутов данного объекта, Второй способ является инверсией первого; с помощью этого способа могут быть по-лучены идентификаторы объектов, связанных с данным атри-бутом. Первый способ используется для получения информа-ции на вопрос: каковы свойства данного объекта? Второй спо-соб используется для получения информации на вопрос: ка- кие объекты имеют данное свойство? Полностью инвертиро-ванный файл – это такой файл, который хранит идентификато-ры объектов, связанные с конкретным значением каждого ат-рибута. Частично инвертированный файл является более прос-тым и хранит идентификаторы объектов, связанные со значе-нием некоторых (но не всех) атрибутов.





оставить комментарий
страница1/5
Дата17.10.2011
Размер1,76 Mb.
ТипКнига, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы:   1   2   3   4   5
Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Загрузка...
Документы

Рейтинг@Mail.ru
наверх