Учебное пособие Разработчик: Белов В. С. Москва, 2008 icon

Учебное пособие Разработчик: Белов В. С. Москва, 2008


1 чел. помогло.

Смотрите также:
Реферат ргазу
Учебное пособие Москва 2008 удк машкин М. Н. Информационные технологии: Учебное пособие. М...
Учебное пособие Москва 2008...
Учебное пособие Москва 2008 удк 004. 738 Ббк 32. 973. 202...
Учебное пособие Москва 2008 г. Воропаев В. И. История и тенденции развития управления проектами...
Учебное пособие москва 2008 удк ббк федоров И. В., Новикова М. А...
Учебное пособие 28365942 Москва 2008 ббк 66. 0 П 50...
Учебное пособие Москва 200 8 удк 004. 738 Ббк 32. 973. 202...
Учебное пособие Москва, 2008 Авторы: В. О...
Учебное пособие Москва 2008 Орлова Е. И. Образ автора в литературном произведении...
Учебное пособие москва-2008 ббк 88. 53 Удк 316...
Учебное пособие Санкт-Петербург 2008 удк 531...



страницы: 1   2   3   4   5   6   7
вернуться в начало
скачать
^

Тема 3. Технологии сбора и хранения данных – концепция информационных хранилищ.


Понятие о гибкой архитектуре данных. Повышение качества информации при сборе её в информационное хранилище. Преобразование данных в единый формат и приведение их к единой структуре. Основные принципы построения информационных хранилищ. Понятие о метаданных (МД), базе МД - репозитории, используемых в информационном хранилище.


^ Концепции организации хранения данных.

Подготовка принятия решений требует сосредоточения значительного, а подчас колоссального количества информации (выше приведены возможные её объёмы в зависимости от масштабов и сложности решений) на месте его подготовки. Естественно стремление приблизить места хранения и использования информации. Проблемы подготовки принятия решений разрешаются с использованием инструментальных систем поддержания принятия решения Decision Support Sistem (DSS). В них большое место стали занимать OLAP-технологии, интеллектуальный анализ, подготовка плановых и стандартных документов, которые используют информационные ресурсы, предоставляемые системами сбора и хранения данных.

Проблема сбора и хранения информационных ресурсов выделилась как занимающая особое место во всей системе управления предприятием (корпорацией) и оформилась в концепцию информационных хранилищ (ИХ) - англоязычный термин Data Warehouse (DW). Эта подсистема является центральной в интегрированной информационной системе, которой становится совокупность локальных информационных систем и информационных технологий, слитых воедино средствами ИАС.


^ Концепция информационного хранилища.

Хранилища выполняют задачи накопления сведений о деятельности предприятия, партнёров, других информационных ресурсов из различных источников, в том числе баз данных, отображающих отдельные бизнес-процессы, автоматизированных рабочих мест, информационных систем и других источников информации, в том числе из глобальных информационных сетей, как например Internet.

Simon (Саймон) [11] называет такие источники данных операционными базами данных. Сбор перечисленных сведений сочетается, как правило, с доработкой исходных данных, которая заключается в проверке достоверности, устранении противоречивости, сортировке, систематизации в соответствии с заранее построенной в соответствии с заданиями пользователей единой структурой хранилища.

Инмон (Inmon) - автор концепции информационных хранилищ выделяет следующие характерные для них свойства:

-предметную ориентированность;

-интегрированность;

-неизменчивость;

-поддержка хронологии.

^ Свойство предметной ориентированности означает компоновку пулов информации по определённым предметным областям или целям, обеспечивающим подготовку и принятие соответствующих решений в соответствующей системе DSS или использования в каком-либо другом виде приложения, например для разработки планов развития предприятия, инвестиционных проектов, реинжиниринга и для любых работ, для выполнения которых необходимы исходные данные, накопленные в информационном хранилище. Необходимо подчеркнуть, что сосредотачиваемые в хранилище данные поддерживают аналитическую деятельность, а не функциональные или технологические процессы. Не непосредственную производственную деятельность, а анализ данных в историческом аспекте.

Интегрированность предусматривает сбор и доработку (предварительную обработку) информации по определённой предметной области из различных источников и превращение её в организованный по заданным правилам, подчинённым определённой цели, массив в виде гиперкуба или системы поликубов информации. Пользователь легко использовать совместное использование данных из различных секций хранилища, относящихся к разным направлениям деятельности или функциям предприятия.

Неизменчивость состоит в том, что в хранилище данные из различных источников накапливаются, практически не подвергается каким-либо изменениям, только в случае крайней необходимости, в основном при обнаружении искажений. Они наращиваются по заданному, чётко определённому графику. Пользователь имеет только право чтения информации. Манипуляции с содержимым хранилища доверяются только администраторам.

^ Поддержка хронологии заключается в обязательности привязки данных ко времени. Информация, содержащаяся в хранилище, рассматривается в историческом аспекте. Используют следующие типы привязки ко времени:

  • к моменту совершения события или факта;

  • к моменту фиксации его информационными средствами;

  • комбинированные методы, сочетающие оба подхода.



Таким образом, идея хранилищ данных – это не просто единый подход к хранению необходимых данных, а создание единого многопрофильного в рамках одной концептуальной идеи информационного ресурса предприятия, направления исследования, корпоративной структуры и т.д.




Рис. 5.1 Структура информационного хранилища.


Данные в хранилище из источников накапливаются в течение определённого периода времени в зоне накопления. В течение этого времени производится работа по обеспечению необходимого качества данных по описанным выше правилам. В процессе перекачки из источников данные трансформируются в единый формат, проверяются их смысловая согласованность, наличие ошибок, проводятся мероприятия по повышению качества данных. При достижении необходимого уровня качества и определённого графиком работы момента времени данные переносятся в зону хранения.

В зоне хранения они могут быть представлены в виде реляционной или многомерной модели (объектном виде). В случае использования реляционной модели необходимо иметь в хранилище зону объектного представления данных для достижения уровня характеристик системы, соответствующего требованиям, предъявляемым к OLAP-системам. Содержание их будет рассмотрено в разделе …

Реализация концепции ИХ может быть осуществлена несколькими способами - имеются несколько вариантов концепций ИХ.


^ 5.2 Концепция централизованного хранилища данных

Такой подход означает, что при нескольких источниках информации - операционных базах данных создаётся единое централизованное хранилище. В первичных источниках информация хранится в "сыром" - недоработанном виде, то есть в структуре информационного пространства данного источника информации или операционной БД. Вся поступающая в ИХ информация должна быть преобразована в принятую в данном ИХ структуру. Передача данных из операционных БД в ИХ, которая сопровождается доработкой, может быть организована по заданному временному графику и правилам доработки с соблюдением принципов Инмона. Допускаются неожиданные запросы "на лету", что предъявлет более строгие требования к инструментальным средствам ИХ.



Рис.5.2 Схема централизованного хранения данных

При реализации такой концепции возникает потребность в мощном компьютере. В зависимости от масштабов предметной области это будет или персональный компьютер с предельно высокими характеристиками, особенно в части требований к объёмам памяти или майнфрейм и даже суперкомпьютер. Необходимо наличие развитых средств телекоммуникаций, обеспечивающих информационный обмен "операционные БД - ИХ". Это требование относится к любому варианту концепции ИХ.


^ Концепция распределённого хранилища данных

Возможен и имеет место противоположный подход к хранению данных на основе распределения функций ИХ по местам их возникновения или группировки нескольких операционных БД вокруг локального или регионального информационного хранилища. Эти хранилища могут быть ориентированы на определённую предметную область или на регион в корпоративных структурах. Система локальных хранилищ действует в качестве распределённого хранилища. Не исключается и наличие центрального хранилища, но в такой структуре требования к его размерности значительно облегчаются.

Такой подход предусматривает трансляцию каждого запроса к каждому источнику (базе данных), обработку, увязывание, согласование, компоновку извлечённых данных "на лету" и предоставление их пользователю.

Такой подход при экономии ресурсов на создание крупного централизованного хранилища имеет ряд недостатков, к которым можно отнести:

-в связи с нормализованностью данных в операционных базах и длительностью доступа из "центра" общее время отклика такой системы выходит за рамки допустимого;

-должны быть обеспечены постоянство нахождения в сети и открытость всех источников информации, так как отсутствие какого либо из них может сорвать весь процесс анализа;

-возможна противоречивость и несогласованность ответов из различных источников из-за различных форматов представления, разницы в темпах обновления, правил привязки ко времени, изменения смысловой нагрузки данных и т. д.;

-практическая невозможность комплексного исторического обзора содержащейся в разнородных источниках информации из-за различного порядка её хранения - навязать единый порядок весьма затруднительно.













Операционная база 2.1

Операционная база 2.m


Операционная.

база 1.n



Операционная база 3.1

Операционная база 3.k

Рис. 5.3 Схема распределённого информационного хранилища.

Концепция автономных витрин данных

Одним из вариантов организации централизованного хранения и представления информации является концепция витрин данных (Data Mart). Она предложена Forrester Research в 1991 году. При таком подходе информация, относящаяся к крупной предметной области - например информационному пространству крупной корпоративной системы, имеющей несколько достаточно самостоятельных направлений деятельности, группируется по этим направлениям в специально организованных базах данных, которые называют витринами данных. Этот подход является развитием концепции распределённого ИХ в части придания функций предметной ориентированности некоторым локальным ИХ.

Такой подход позволяет обойтись сравнительно менее ресурсоёмкими аппаратными и программными средствами,


Операционная база 1

Операционная

База 2

Операционная база 3

Операционная база N




Витрина данных 1,


совмещённая с ИХ

Витрина данных M,


совмещённая с ИХ

















Операционная база 1

Операционная база 2

Операционная база 3


Операционная база 4

Операционная база N

Рис.5.4 Схема автономных витрин данных.


обеспечивает повышение адаптируемости системы к изменяющимся условиям, расширяет доступность для внедрения. Пользователь предприятия или другого подразделения корпорации получает своё ИХ, обслуживающее местные потребности.

    1. Концепция единого интегрированного хранилища и многих витрин



    2. данных



.

Рис. 5.5 Схема центрального информационного хранилища и многих витрин данных


В 1994 году M. Demarset предложил объединить две концепции:

единого интегрированного хранилища и связанных с ним и получающих из него информацию витрин данных. В таком варианте имеется крупное информационное хранилище агрегированной и подработанной информации, которое может удовлетворить потенциальные запросы по отдельным направлениям деятельности.

Здесь очевидны преимущества: данные заранее агрегируются, обеспечивается единая хронология, согласованы различные форматы, устраняются противоречивость и неоднозначность данных - информация приобретает необходимую кондицию для быстрого и достаточно полного удовлетворения необходимого множества запросов.

Недостатком является необходимость применения высокопроизводительных аппаратных средств и специализированных многомерных или гибридных программных инструментальных средств.


В таком варианте ИАС приобретает иерархическую многоуровневую структуру, содержащую следующие уровни:

-общекорпоративное централизованное хранилище данных;

-витрины данных по направлениям деятельности;

-локальные или региональные базы и хранилища данных;

-операционные базы данных, автоматизированные рабочие места пользователей автономных программ и АЭИС.

Пунктам концентрации информации соответствуют иерархические уровни использования при подготовке, принятии и реализации решений данных, которые являются появляющейся в результате функционирования предприятия (корпорации):

- уровень лиц, принимающих решения, который может быть совмещён с уровнем витрин данных;

- уровень рабочих мест аналитиков и других заинтересованных пользователей.


Рассмотренные концепции охватывают лишь те стороны функционирования ИАС, которые относятся к организации хранения данных. Они не определяют требования и подходы к выполнению анализа, способы представления данных в ИХ - реляционный или многомерный.


^ База метаданных информационного хранилища (репозиторий ИХ)


Общие положения

Управление ИАС осуществляется посредством использования метаданных, то есть данных о том, что представляют собой и как хранятся данные и по существу содержат информацию о предметной области. Благодаря их использованию предоставляется информация, необходимая для автоматизации процессов сбора, преобразования и загрузки данных в ИХ и использования всей ИАС.

Проектирование ИХ, разработка сценариев OLAP и интеллектуального анализа начинается с формирования массивов метаданных, которые реализуются соответствующими программными модулями. Этими модулями описываются атрибуты метаданных, проверяется их корректность, создаётся физическая структура хранения, обеспечивается вызов для реализации заданных в сценарии анализа функций.

Метаданные можно разделить на два типа - бизнес-метаданные и технические метаданные. Они позволяют ориентироваться в огромном объёме информации.

Бизнес-метаданные служат в основном интересам пользователя. К ним относятся определения данных, величины атрибутов, и областей, своевременность данных, бизнес-правила, соотношения данных, их охват. Технические метаданные используются службой администратора. К ним относятся сведения о времени обновления и преобразовании данных, права доступа и т.д.

В связи со сложностью потоков данных из операционных БД технические МД необходимы для работы многих программ.

Более подробно, в состав бизнес-метаданных входят:

-определённые объекты;

-иерархии;

-столбцы углубления;

-столбцы анализа;

-столбец фактических значений в прогнозных или бюджетных документах;

-столбцы бюджетных значений в прогнозных или бюджетных документах;

-временные измерения;

-значения, определяющие успех предприятия;

-категории и классификации данных;

-сведения о зависимых и независимых переменных;

-вид анализа и ограничений и т.д.


В состав технических метаданных входят:

-структура и семантика данных;

-алгоритмы агрегирования;

-сведения о разграничениях доступа и защите информации;

-периодичность загрузки и очистки;

-права собственности на информацию;

-поисковые таблицы, перечень и правила исключений;

-другие данные, относящиеся к техническому сопровождению.


Классификация метаданных.

Под метаданными понимают также сведения в виде некоего справочника - репозитория, который помогает пользователям и лицам, обеспечивающим функционирование ИАС, ориентироваться в содержащихся в ИХ данных. Репозиторий является одним из центральных блоков инструментальной части ИАС.

Группа проектировщиков на основе рассмотрения требований пользователей, в которую входят их представители и работники ИТ-подразделения, составляет список подлежащих сосредоточению в ИХ показателей и их реквизитов. Эта работа выполняется на основе анализа документации, опросов, специальных исследований. Составляется перечень документов, аналитических сценариев с предполагаемыми запросами. Из полученных в результате обследования материалов выделяются сущности в разрезе достижения целей анализа. Их называют классы в терминологии объектно-ориентированного подхода, показатели в традиционной терминологии. Из всей совокупности материалов выделяют признаки (реквизиты, атрибуты), описывающие сущности (классы, показатели). На следующем этапе повторяющиеся по смыслу атрибуты представляют в виде одного согласованного по смыслу и синтаксису атрибута. В процессе слияния атрибутов в репозиторий появляются свои, присущие хранилищу атрибуты, их можно назвать системообразующими.

Метаданные должны содержать сведения о преобразовании исходных данных, истинные даты событий и временные характеристики отображаемых процессов, диапазоны для полей данных, сведения об источниках данных и их форматах и т. д.

В связи с обширностью сведений, содержащихся в МД, а также разнообразием вариантов реализации ИАС и ИХ возникла необходимость в более детальной классификации различных видов МД по нескольким признакам.

По динамике использования различают МД активные и пассивные. К активным относят те, которые контролируют функции или поведение приложений. Пассивные носят информационный характер и используются при просмотре содержимого ИХ.

По стадии применения различают проектные и рабочие метаданные

Проектные МД это совокупность атрибутов, содержащихся в исходных БД или файловых системах в составе их проектов, созданных с помощью CASE-средств. Воспринятые из этих источников МД и дополненные метаданными собственно хранилища должны уточняться в процессе обновления версий источников. Версии приложений для OLTP (функциональных систем) появляются реже, чем для систем поддержки принятия решений, поэтому проблема отслеживания проектных МД облегчается.

В шестимерной модели, которая далее будет рассмотрена, к проектным МД относятся измерения:

  • МД для сущностей, описывающих содержимое ИХ,

  • МД для расположения данных,

  • МД для движущих сил развития ИХ.

Рабочие метаданные – это совокупность атрибутов, используемых в процессе эксплуатации системы (хранилища или ИАС в целом) Они делятся на активные и пассивные.


Активные рабочие МД имеют два источника: проектные метаданные и собственные компоненты метаданных ИХ. Этот тип МД используется для управления ИХ в частности и ИАС в целомна этапе эксплуатации системы. Активные рабочие метаданные используют для обеспечения безопасности и контроля за доступом к данным в ИХ, накопления статистики по обращениям к тем или иным разделам ИХ с целью совершенствования архитектуры ИАС. Информация, учитывающая время, может составлять значительный объём, к тому же она динамична. В размерностной (шестимерной) модели часть активных рабочих МД соответствует измерениям, описывающим операции над данными и людей, пользующихся хранилищем, а также временной аспект, то есть привязку данных и событий ко времени.


Пассивные рабочие МД привязаны к деловому аспекту, то есть целевому использованию ИХ. Пользователь, используя такие МД, приобретает возможность легче ориентироваться в огромных массивах данных, экономя время на доступ к ним, применять их для формирования запросов, для облегчения понимания смысла содержащихся в ИХ данных.

Пользователи должны знать источник содержащихся в ИХ данных, ответственных лиц, график загрузки. Эти сведения должны содержаться в репозитории МД. Помимо этого необходимо хранить данные о приложениях, языках программирования, датах переработки, о моделях данных, которые используются в CASE-средствах

.


^ Модели метаданных по измерениям.

Под измерениями при рассмотрении совокупностей метаданных, понимают назначение и другие отличительные признаки входящих в эти совокупности групп МД. Различают (13) два основных вида классификации и соответствующих моделей: трёхмерную и шестимерную.

Трёхмерная система классификации и модель МД

Такая система подразумевает три типа метаданных:

- МД оперативных баз данных – источников данных для ИХ,

- МД об использовании данных, то есть об их назначении в интересах конечного пользователя,

  • МД для управления информационным хранилищем.

Эта система классификации применяется для ИХ и ИАС малого масштаба с одной предметной областью или небольшим их количеством.
















Рис 6.1 Трёхмерная модель метаданных.

Размерностная модель МД информационного хранилища

Эта модель обеспечивает более детальный и строгий учёт данных, сосредоточенных в ИХ. Она отвечает на вопросы: что? где? когда? кто? почему? как?. Такая модель называется схемой Захмана.

Перечислим эти измерения:

1. Сущности, которые составляют содержимое ИХ - Что?

2. Размещение данных в операционных базах и непосредственно в ИХ - Где?

3. Моменты загрузки и агрегирования данных, время их происхождения - Когда?

4. Люди, которые используют и поддерживают хранилища - Кто?

5. Движущие силы создания и развития ИХ - Почему?

6. Действия, которые выполняются над данными - Как?
















Рис. 6.2 Размерностная модель МД ИХ


Содержание компонентов размерностной модели МД ИХ.

Метаданные, описывающие сущности.

Это измерение является основой создания информационного хранилища. От правильности формирования содержимого хранилища зависит успех его использования. Должна быть документально определена предметная область или области и зафиксирована в метаданных. Если рассматривается несколько предметных областей, то в метаданных должны быть сведения о взаимодействии этих областей, а для одной предметной области о связях её частей.

Сущности определяются на этапе моделирования. МД должны содержать имена полей, тип данных, домены включённых в ИХ данных, а также сведения о полях в источниках. Одна часть описаний полей может содержаться в источниках данных, другая – в хранилище, а также возможно их нахождение одновременно и в источниках и в хранилище.

Связи между сущностями определяются бизнес-правилами и они фиксируются в базе метаданных. При моделировании структуры метаданных ИХ целесообразно применение объектного подхода и соответствующих инструментальных средств.


Метаданные, относящиеся к размещению ресурсов

В базе метаданных должны быть сведения о размещении ресурсов ИХ и ИАС в целом. К таким ресурсам относятся: серверы, рабочие станции, сетевое оборудование, программные средства. Эти метаданные используются для управления конфигурацией, сопровождения системы, Они создаются путём загрузки файла конфигурации таких операционных систем как: UNIX, LINUX, Windows и других, а также путём выполнения инвентаризации технической и программной платформы.


Метаданные, описывающие временные аспекты ИХ

В хранилище отслеживаются:

- время происхождения событий в бизнес-сфере или другой предметной области;

- периоды времени, в течение которых происходят процессы;

- моменты появления сведений в источниках данных и в хранилище.

Имеются сущности из пользовательской сферы, которые акцентируют внимание на временных аспектах. К ним относятся: планы, графики работ, планируемая и фактическая их продолжительность.

В репозиторий вносятся МД, относящиеся к функционированию ИАС, в том числе: моменты обращения пользователей, длительность отклика на запросы, моменты начала и окончания загрузки данных в хранилище. По этим сведениям можно оценивать динамические характеристики ИАС.


Метаданные, относящиеся к пользователям и администраторам ИХ и ИАС

Функции, права доступа лиц, имеющих отношение к ИХ, фиксируются в соответствующих разделах базы МД. У названных лиц, независимо от названий их должностей в тех или иных организациях, имеются определённые права и обязанности, касающиеся работы в среде ИАС. Суть их работы определяется направлением деятельности: архитектор данных, специалист по информационным технологиям, руководитель проекта, администраторы баз данных первичных источников, бизнес-аналитик, менеджеры деловой сферы (лица, принимающие решения) и другие.

Все роли и лица их выполняющие должны быть зафиксированы в репозитории ИХ. Там же должна быть отражена организационная структура или её часть, относящаяся к ИАС.

Защита данных в процессе создания ИАС должна осуществляться, но поэтапно, чтобы не слишком ограничивать действия исполнителей проекта. Полномасштабная корпоративная защита вводится по завершении проекта.


Метаданные о движущих силах создания ИАС.

Под движущими силами авторы концепции размерностной модели метаданных ИХ понимают цели и задачи проекта ИАС, которые должны быть чётко сформулированы и внесены в репозиторий. Необходимо дать описание выполнения задач бизнес-подразделений.

Целесообразно отобразить организационные и технические меры по обеспечению высокого качества данных. В состав МД вводят характеристики ИАС по возможностям смыслового содержания запросов, скорости ответа на них, которые определяют в ходе испытаний и опытной эксплуатации. Отражаются схемы и технологии взаимодействия с бизнес-пользователями.


Действия, которые выполняются над данными.

В репозитории должны находиться МД о преобразованиях, которым должны подвергнуться перегружаемые из источников в хранилище данные. Должен быть разъяснён и унифицирован в хранилище их смысл. Необходимо отобразить те действия, которые совершаются над данными в хранилище заблаговременно с тем, чтобы не тратилось время на это при реализации запланированных запросов, а также возможности по совершению действий над данными при выполнении незапланированных запросов.

Модели данных информационного хранилища


^ Понятие модели данных информационного хранилища

Многомерная модель данных представляет исследуемый объект в виде многомерной или объектно-ориентированной схемы данных, которая в геометрическом представлении представляет собой системы поликубов. Для зрительного восприятия используют совокупность фрагментарных трёхмерных моделей. По осям или граням куба откладываются измерения или реквизиты-признаки. Реквизиты-основания являются наполнением ячеек куба. Многомерный куб или как иногда называют пул данных может быть представлен комбинацией трёхмерных кубов с целью облегчения восприятия и квазиобъёмного представления при формировании отчётных и аналитических документов и мультимедийных презентаций по материалам аналитических работ в системе поддержки принятия решений.


Многомерные данные могут быть отображены в моделях инструментами в виде СУБД на основе реляционных моделей данных, а также и специальными многомерными инструментальными средствами, называемыми объектными надстройками (32), многомерными и/или объектно-ориентированными СУБД.


Элементы моделей данных информационного хранилища

Содержание и назначение таблицы фактов

В многомерном пуле информации создаётся большая центральная таблица, называемая таблица факта (fact table). В ней помещаются все данные относительно интересующего пользователя обобщающего показателя, то есть объекта или события, которые интересуют пользователя. Таблицы фактов содержат числовые или качественные (содержательные) значения.

Рассматривают четыре вида фактов:

  • транзакционные факты (transaction facts), отражающие происходящие в системе события, например финансовые и другие операции;

  • «моментальные снимки» (Snapshot facts), фиксирующие состояния объекта в заданные моменты времени – наличие товаров на складах, состояния счетов в банке и так далее;

  • элементы документов (Line-item facts), содержащие сведения о реквизитах документов – таких как количество отправленных, полученных товаров, ценах, дате и времени отправки;

событие или состояние объекта (Event or state facts), отражающие акт совершения того или иного действия – отправку или прибытие товара, перечисление денежных сумм без описания их.

В таблицы фактов включаются, как правило, данные на уровне детализации, то есть самого нижнего уровня иерархии. Она имеет внутренний составной ключ из ключей окружающей её меньших таблиц, которые содержат данные по признакам.


Таблицы размерности (измерений), другие компоненты модели

Таблицы, наполняющие содержанием факт-таблицы называют таблицы размерности или измерений (dimensional table).

Они содержат постоянные или редко и мало изменяемые данные и должны находиться в отношении «один ко многим» к таблице фактов. Таблицы размерности являются родительскими по отношению к таблице факта. Таблица факта является дочерней. В случае наличия в таблице измерений иерархии в ней должны быть поля, указывающие на «предков». Их называют ещё консольные таблицы (outrigger table). Они присоединяются к таблицам размерности и детализируют отдельные атрибуты. Консольные таблицы являются родительскими по отношению к таблицам размерности.

При разработке базы данных по схеме "звезда’’ или по другой многомерной схеме необходимо глубоко и тщательно проанализировать предметную область; поместить в центральную таблицу факта все характеризующие исследуемый объект данные, предварительно разработав систему признаков.

Консольные и таблицы размерности, а также таблица факта соединяются идентифицирующими связями. Первичные ключи родительских таблиц являются внешними ключами дочерних. Так, первичный ключ таблицы размерности является внешним ключом таблицы факта.

Консольные и таблицы размерности, а также таблица факта соединяются идентифицирующими связями. Первичные ключи родительских таблиц являются внешними ключами дочерних. Так, первичный ключ таблицы размерности является внешним ключом таблицы факта.

^ Схемы представления многомерных данных.

Представление многомерных данных в рамках реляционных моделей может выполняться в виде трёх вариантов схем:

- "звезда";

- "снежинка";

- "созвездие".

Линейное представление на плоскости отображено на рисунках 7.1 – 7.3

Схема “звезда” состоит только из таблиц размерности и таблицы факта. Она представлена на рис. 7.1 и 7.4.

Развитием схемы "звезда" является схема "снежинка" (snowflake schema). Её отличает от первой схемы большое количество консольных таблиц, они имеются практически на каждой таблице размерности и могут иметь несколько уровней иерархии, как показано на рис. 7.2 и 7.5




Рис 7.1 Модель данных по схеме "звезда"




Рис 7.2 Модель данных по схеме "снежинка"





Рис 7.3 Модель данных по схеме "созвездие".






Скачать 0,96 Mb.
оставить комментарий
страница4/7
Дата28.09.2011
Размер0,96 Mb.
ТипУчебное пособие, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы: 1   2   3   4   5   6   7
отлично
  1
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

наверх