скачать ЛЕКЦИЯ № 6. ПО ДИСЦИПЛИНЕ: «Автоматизированная деятельность в таможенных органах». Тема: 6. Базы и банки информационных данных. Понятие баз данных. Система управления базами данных. Банки данных. СОДЕРЖАНИЕ: Понятие и создание информационной базы данных. Базы информационных данных ЕАИС. Основные понятия процесса накопления данных. Работа по управлению базами данных. Особенности баз данных, используемых ФТС России. Система управления базами данных. Централизация управления данными. Хранилища баз данных в ЕАИС. При создании информационной базы ЕАИС в основном используются подходы: файловый и основанный на концепции базы данных. Основным разработчиком баз данных ФТС России является ГНИВЦ. В ходе развития информационных систем были сформулированы принципы организации больших массивов данных:
Удовлетворение этих принципов связано с созданием единого для всех задач блока данных, называемого базой данных, и разработкой единой управляющей программы для манипулирования данными, называемой системой управления базой данных - СУБД. База данных (БД) представляет собой данные, организованные и обрабатываемые в накопителях в соответствии с определенными правилами хранения и доступа. Логическая, а часто и физическая автономность данных является существенным отличием баз данных от прочего программного обеспечения. Фиксированная, строго оговоренная структура хранения данных и их безусловная типизация отличает базу данных от текстовых и табличных процессоров, а широкая гамма допустимых операций на множествах является важным преимуществом ее перед пакетами прикладных программ и системами программирования. Выделением базы данных как особой части программного обеспечения преследуется несколько целей: эффективная структуризация информации; сведение к минимуму повторяющихся данных; обеспечение быстрого доступа к информации прямо на носителе; удобство дополнения информации новыми сведениями; обеспечение целостности данных; предотвращение несанкционированного доступа к информации; облегчение автоматизации обработки данных и ведения отчетности. Объекты, процессы, явления предметной области представляются в базах данных коллекциями записей (сущностей) определенной структуры. Различают иерархическую, сетевую и реляционную модели данных. Иерархическая модель отражает структуру, аналогичную файловой системе. Это дерево с узлами, в которых хранятся данные, и ветвями, связывающими их между собой. Узел, в который не входит ни одна ветвь, называется корнем. В свою очередь, любой узел дерева - это в то же время и корень поддерева. Число таких поддеревьев именуется степенью узла. Концевой узел, имеющий нулевую степень, называется листом. Таким образом, граф иерархической модели должен удовлетворять определенным ограничениям. Если же эти ограничения убрать, получится граф произвольного вида, отображаемый сетью. Сетевая модель рассматривает базу данных как абстрактное хранилище связанных друг с другом записей, то есть объектами такой базы являются и записи, и связи между ними. Форма хранения информации в базе данных сетевого типа напоминает способ хранения образов в мозгу человека. Между элементами данных существует отношение наследования типа «родитель-потомок», причем любой элемент может оказаться наследником нескольких родителей и наоборот. Связи в базе данных сетевого типа реализуются с помощью сложной системы указателей. Поскольку каждый элемент данных должен содержать ссылки на другие элементы, такая модель требует значительных ресурсов памяти и высокого быстродействия компьютера. В настоящее время ведутся исследования в области создания объектно-ориентированных сетевых баз данных, финансируемых такими компаниями, как, например, IBM в США. Идея автоматизированной реляционной, или табличной, организации данных принадлежит польскому математику З. Я. Слонимскому, в 1845 году удостоенному Демидовской премии Петербургской академии наук за изобретение математической машины, использующей таблицы с определенными правилами считывания. Концепция реляционной модели была разработана Э. Ф. Коддом в 1970 году. В основе ее лежит понятие бинарного отношения как двухмерной таблицы единой структуры. Значения элементов ее являются атомарными (неделимыми) величинами и не содержат других отношений. В этом заключается главное отличие реляционной модели от иерархической и сетевой. Сравнительная простота инструментальных средств поддержки реляционной модели является ее достоинством, тогда как жесткость структуры и зависимость от скорости работы, от размера базы данных относятся к недостаткам. Разработчики реляционных СУБД никогда не ставили целью предоставление пользователю мощных функций многомерной обработки данных, их анализа и синтеза. Такие функции обычно перекладываются на различные отдельные инструменты для конечного пользователя, такие как широкоформатные таблицы, графические программы и специализированные пакеты прикладных программ. Метод динамической аналитической обработки ОLАР (Оn-line Analytical Росеssing), предложенный тем же Э. Ф. Коддом, ускоряет решение указанных задач. Он предполагает многомерное концептуальное представление данных и их прозрачность для пользователя, доступность и высокую производительность в работе. Системой управления базой данных (СУБД) называется программа, выполняющая управление и поиск в базах данных, их систематизацию и актуализацию. Под управлением данными понимается, во-первых, манипулирование записями, выполняемое пользователем, а во-вторых - задание и коррекция схемы базы данных, т.е. ее логической или физической структуры, выполняемое программистом. В наиболее полном варианте СУБД содержит свой интерфейс пользователя, дающий возможность непосредственного управления данными; язык для программирования прикладных задач обработки данных; средства для придания завершенной программе вида готового коммерческого продукта. Будучи механизмом пользователя, СУБД предусматривает систематизацию и оперативный поиск данных и имеющихся в них сведений, а также поддержание данных в актуальном состоянии - их добавление, изменение, выборку, отображение. Будучи инструментом программиста, СУБД помогает ему в проектировании, предусматривая следующие этапы: определение объектов - источников данных и выявление связей между ними; определение свойств объектов и выявление связи между свойствами; создание словаря данных; разработка операций над данными; назначение пользователей и разграничение их прав доступа. Пользователь общается с базой данных через копии ее фрагментов. Для этого он либо осуществляет фильтрацию записей, либо обращается к базе данных с запросом. Запросы к реляционным базам данных выполняются на языках реляционного исчисления, основанных на классических операциях на множествах (объединение, пересечение, дополнение, разность), и исчислении предикатов (проекция, выбор). Язык запросов предоставляет пользователю набор правил или инструмент для формирования вопроса с информацией о желаемом результате. На основании запроса СУБД автоматически выдает ответ посредством генерации новых таблиц. Статусом стандартного языка запросов обладает сегодня реляционный структурированный процедурный язык SQL. (Structured Query Language), разработанный фирмой IВМ. Весьма популярен и непроцедурный язык запросов на примере QBE (Query Ву Ехаmр1е), созданный М. Злуфом в фирме IВМ в 1977 году. Более 15 лет представлен на мировом рынке пакет Огас1е. Долгое время каждая третья продаваемая в мире СУБД работала под Огас1е. На Огас1е разработано значительное число прикладных систем для банков, промышленных предприятий, энергетических объектов, учреждений здравоохранения и таможни. Она обеспечивает целостность баз данных при выполнении распределенных запросов, автономию узлов базы и высокую производительность. Система поддерживает открытую архитектуру: в едином ее приложении могут согласованно работать компоненты СУБД различных фирм, файлы операционной системы, аппаратура (промышленные контроллеры, кассовые аппараты). Инструментарий Огас1е позволяет создавать графический интерфейс пользователя со сложной логикой обработки данных. Постепенно реляционная СУБД Огас1е преобразуется в объектно-ориентированную систему на основе языка SQL++, хранящую данные в виде объектов вместо таблиц. Для упорядочивания информации в таможенных БД используются языки высокого уровня, для тонких запросов - Аssembler. При этом в качестве операционной системы в ГНИВЦ ФТС используется Оpen VMS, а для управления БД используются разработки Огас1е. Объем центральной базы данных ФТС России составляет сотни терабайт: это архивы оформляемых таможенных деклараций (более 2,5 млн. документов в год, по нескольку десятков килобайт каждый) плюс специализированные базы данных документов контроля доставки товаров и транспортных средств, таможенных приходных ордеров, сертификатов и нормативно-справочной информации, а также БД по участникам ВЭД. Приказ ГТК России от 12 мая 2003 г. № 499 «О порядке сбора, проведения форматно-логического контроля и передачи электронных копий грузовых таможенных деклараций» утвердил:
В таблице приведен ряд новых терминов и определений, впервые введенных Приказом № 499. Центральный элемент комплексной системы таможенного оформления - база данных ГТД. Каждый товар, приходящий на границу, имеет множество сопроводительных документов -накладные, контракт, паспорт сделки, которая предваряет поставку, книжки перевозчиков и другие документы. Вся информация из этих документов сводится в один - грузовую таможенную декларацию; этот документ в настоящее время наиболее важен в работе таможенных служб. В ГТД описывается сам товар, его отправитель, получатель, указывается таможенная стоимость, вес, способ доставки и тому подобное. Форма этого документа вписана в структуру БД, и каждое его поле имеет под собой информационную поддержку. Формирование ГТД и ее использование включает несколько этапов. При поступлении груза на границу таможенник проверяет товаросопроводительные документы и формирует на их основе электронный документ контроля доставки, который по электронной почте направляется в таможню назначения этого груза, а точнее в ее вычислительный центр. Одновременно информация идет в центральную базу данных ФТС, где проверяются сведения о юридическом или физическом лице, которому предназначен данный груз. Таможня назначения, получив груз, помещает его на склад временного хранения и проверяет соответствие заявленных кодов, наименования, объема и стоимости фактически поступившему товару, после чего формирует ГТД и направляет ее в центральную БД, а товар выпускает в свободное обращение. Термины, введенные Приказом ГТК от 12 мая 2003 г. № 499: «Зарегистрированные ГТД», «Оформленные ГТД», «Тракт оперативного мониторинга ГТД», «Тракт оформленных ГТД», «Протокол завершения контроля ГТД», «Файл пакета передачи данных (ФППД)», «Центральная база данных ГТД (ЦБД ГТД)», «Центральная база данных "Оперативный мониторинг" (ЦБД "Оперативный мониторинг")», «Центральная база данных предварительной загрузки», «Центральная база данных Журналов учета и регистрации ГТД». ГТД, появившись на таможне назначения, становится тем документом, вокруг которого в дальнейшем проводятся все проверки, а сведения, осевшие в БД грузовых таможенных деклараций, подвергаются различной обработке. Помимо проверки правильности оформления ГТД и при необходимости ее корректировки центральная БД ФТС России предусматривает возможности перекрестной проверки данных ГТД и других специализированных документов, проведения статистической обработки информации о поступивших в Россию товарах и их объемах (для предоставления сведений экономическим и финансовым ведомствам), а также функции «зеркальной статистики» - сопоставления экспортных данных Евросоюза с информацией о реально поступивших в Россию грузах продублирована: в частности каждая региональная БД хранит всю информацию, накопленную РТУ за все время работы, и каждая таможня имеет полную информацию о своей деятельности. Такое многоуровневое резервирование позволяет в любой момент восстановить информацию, если что случится с центральной базой. Доступ к центральной БД опосредован промежуточными Intel-серверами. Современные операционные системы позволяют непосредственно работать с массивами информации, что предопределяет возможность несанкционированного доступа к хранящейся информации. Поэтому в ФТС прежде всего формализована специфика работы каждого таможенного подразделения, и сотрудники могут работать только с определенными полями таможенных деклараций в соответствии со своими задачами. Например, управление контроля таможенной стоимости работает с полями «Стоимость», «Вес нетто», «Вес брутто», а также с количеством наименований товаров. При этом сведения, которые запрашивает пользователь, выгружаются на промежуточный сервер, и обратного хода нет. Таким образом, исходная информация центральной БД развязана с теми данными, которые обрабатываются в повседневной деятельности. Понятие о хранилищах данных появилось в ЕАИС при построении ее первой очереди, развивалось при построении второй очереди и является магистральным направлением построения ее третьей очереди. Своей популярностью они, в первую очередь, обязаны строгой ориентации на конечного потребителя информационной продукции, а также тому факту, что практически не требуют от рядового пользователя таможенных органов освоения принципиально новых приемов работы с данными. Временные характеристики показателей (динамический ряд) составляющих информационных хранилищ данных сохраняются как основа таможенной статистики при трансформации на новую платформу третьей очереди ЕАИС. Необходимое дополнение к ним - СППР, позволяющие отбирать нужную информацию и получать быстрые ответы на сложные деловые вопросы. Использование информационных хранилищ данных позволяет повысить качество обслуживания, а также число услуг, предоставляемых ЕАИС как таможенным органам, так и внешним неторговым организациям. Литература:
|