Отчёт по лабораторной работе №1 по предмету psi тема: Описание предметной области. Постановка задачи icon

Отчёт по лабораторной работе №1 по предмету psi тема: Описание предметной области. Постановка задачи


Смотрите также:
Отчет должен состоять из следующих пунктов: Заголовок лабораторной работы (название и цель...
За письменный отчёт о лабораторной работе, за доклад или реферат по теме...
Описание предметной области...
Методические указания по проведению экзамена по 5423 «Учет в непроизводственной сфере» Обсуждены...
Отчет по лабораторной работе №...
Отчет по лабораторной работе №...
Отчет по лабораторной работе по информационным технологиям Тема: "Подпись электронных...
Отчет о лабораторной работе №2 Data Mining...
Оформите отчет по лабораторной работе, который должен содержать: титульный лист (см рис 1)...
Тема: Мультимедиа технологии...
Лабораторная работа «Основы работы с bios setup Utility»...
Оформите отчет по лабораторной работе, который должен содержать: титульный лист (см рис 1)...



Загрузка...
скачать


Министерство Образования Республики Молдова

Технический Университет Молдовы

Факультет CIM

Кафедра Информационных Технологий


ОТЧЁТ

по лабораторной работе №1

по предмету PSI


Тема: Описание предметной области. Постановка задачи.


Выполнил: студент группы TI-044

Войков К.


Проверил: преподаватель

Скороходова Т. А.


Кишинев 2007

Тема:

Описание предметной области. Постановка задачи.


Цель

Для заданной предметной области (точнее – моделирование потребления природного газа в зависимости от природных условий) составить её [предметной области] описание. Определить задачи моделирования.


Содержание:

  1. Введение;

  2. Существующие технологии анализа данных;

  3. Современные методы прогнозирования;

  4. Планируемые результаты;

Выводы;

Список использованных источников (библиография).


1. Введение.

Природный газ сегодня является одним из основных используемых энергоресурсов. Его основным потребителем всегда была и остается промышленность. Доля промышленного потребления газа достаточно значительна и может достигать 60%.

С распадом плановой экономики закончилась эпоха практически неограниченных и дешевых энергоресурсов, когда их доля в себестоимости продукции составляла всего лишь несколько процентов. Вместе с удорожанием энергоресурсов, как необходимое следствие, наступил экономически целесообразный предел их потребления в рамках исторически сложившихся технологий для каждого отдельного предприятия. Фактор высокой стоимости энергоресурсов обусловил в последние годы кардинальное изменение отношения к организации энергоучета в промышленности и других энергоемких отраслях (транспорт и жилищно-коммунальное хозяйство).

В ушедшую эпоху дешевых энергоресурсов и безусловной монополии их поставщиков приборный учет энергоресурсов был весьма ограничен и относителен, так как затраты на его организацию не оправдывали подчас того эффекта, который он мог обеспечить в условиях административно-командной экономики. В промышленности приборный энергоучет и особенно его автоматизацию внедряли в первую очередь руководители крупных энергоемких производств, а также дальновидные и инициативные энергетики, стремившиеся навести порядок в своем энергохозяйстве. Большинство предприятий рассчитывались с поставщиками энергоресурсов либо на основе множества показаний отдельных приборов невысокой точности и надежности, требовавших визуально-ручного съема измерительных данных с табло приборов или лент самописцев, а зачастую и дополнительной ручной обработки этих данных («метод карандаша, калькулятора и бумаги»), либо «наглазок» - по суммарной мощности подключенных установок и расчетным нормам энергопотребления, что было весьма выгодно поставщикам энергоресурсов.

Энергоучет «вчерашнего дня» не может устроить сегодня промышленные предприятия. Потребители начинают осознавать, что в их интересах необходимо рассчитываться с поставщиком энергоресурсов не по каким-то условным нормам, договорным величинам или устаревшим и неточным приборам, а на основе современного и высокоточного приборного учета. Именно поэтому предприятия по газификации и газоснабжению стремятся как-то реорганизовать свой энергоучет, сделав его адекватным требованиям дня сегодняшнего.

При наличии современной автоматизированной системы коммерческого учета энергоресурсов (АСКУЭ) промышленное предприятие полностью контролирует весь свой процесс энергопотребления и имеет возможность по согласованию с поставщиками энергоресурсов гибко переходить к разным тарифным системам, минимизируя свои энергозатраты. Поставщикам и газораспределительным компаниям это дает возможность принятия прибыльных решений управления путем построения моделей потребления и использования прогнозируемых величин для отрасли или отдельного потребителя.

Рыночные отношения между производителями и потребителями энергоресурсов по-новому ставят вопросы энергоснабжения, нормирования и повышения эффективности использования энергоресурсов. Важной задачей работы является постановка и решение проблем газоснабжения во взаимосвязи с энергосистемой, а именно прогнозирование и управление спросом на газ по прогнозу спроса и анализ предложения природного газа. Контроль, прогнозирование и управление использования энергоресурса важны с точки зрения соблюдения установленных предельных значений для мощности потребителей и количества использованного природного газа.


Анализ отечественных и зарубежных публикаций показал, что существующие модели и методы прогнозирования недостаточно точно учитывают существующие тенденции, в связи с исключением из рассмотрения наиболее важных в современных условиях параметров. Известны математические модели для краткосрочного и долгосрочного прогнозирования, учитывающие ряд ключевых параметров, но обладающие недостаточной точностью. В сложившихся жестких экономических условиях вопросы расширения средств анализа временных рядов и усовершенствования прогнозных моделей с целью снижения ошибки прогнозирования являются актуальными.

^ Целью работы является моделирование, анализ и прогнозирование потребления природного газа.

Для достижения поставленной цели необходимо решить следующие задачи:

  • проанализировать состояние теории и практики моделирования временных рядов экономических показателей;

  • проанализировать известные модели прогнозирования и выявить недостатки моделей анализа и прогнозирования временных рядов спроса на природный газ;

  • выявить возможности адаптации и модификации известных моделей анализа и прогнозирования, предложить модель прогнозирования спроса на природный газ с учетом требований надежности прогнозных значений;

  • выбрать наиболее подходящие методы решения задачи с учетом различных временных периодов прогнозирования;

  • разработать архитектуру подсистемы и реализовать комплекс программных средств, который позволит производить выбор рациональных вариантов прогнозных моделей.

^ Научная новизна работы заключается в разработке методических и практических аспектов анализа и прогнозирования спроса на природный газ, которые выражаются в следующих основных положениях:

  • предложен подход к анализу и прогнозированию потребления природного газа, который реализован при построении моделей анализа и прогнозирования, отличающихся от известных моделей математическим аппаратом, позволяющим проводить анализ потребления газа населением и предприятиями, расширить возможности анализа в части дифференциации и классификации условий потребления во времени и идентифицировать по категориям потребителей;

  • планируется построение модели потребления природного газа, позволяющей учитывать максимальное число факторов, влияющих на объем и характер потребления;

  • предполагается использование комбинации методов прогнозирования в зависимости от периода прогноза. Композиции часто дают наилучший результат, так как в этом случае погрешности различных моделей компенсируют друг друга.


К тому же существующие продукты по данному направлению коммерческие, а потому дорогостоящие и, к сожалению, не могут быть использованы большинством отечественных компаний.


^ 2. Существующие технологии анализа данных.

Все современные программные системы, связанные с обработкой накопленных данных, а именно результатов первичной деятельности компании, можно условно разбить на три основные категории: средства регламентированной отчетности; OLAP-системы, т.е. системы аналитической обработки данных; средства поддержки Data Mining. Полная структура такой системы приведена на рисунке 1.




Рисунок 1 – Полная структура информационно-аналитической системы.


Наиболее интересные и сложные возможности анализа данных заключаются в прогнозировании и выявлении тенденций. Подобные вычисления основаны на построении функции экстраполяции на базе имеющегося (определяемого пользователем) набора исходных данных. Прогнозирование всегда существенно зависит от особенностей предметной области, поэтому универсальных алгоритмов экстраполяции не существует. Различные инструменты создания аналитических приложений содержат несколько алгоритмов, основанных на линейном, экспоненциальном тренде и учете сезонных колебаний. В ряде систем помимо этого предлагается мощный математический аппарат, позволяющий создавать собственные алгоритмы на основе известных законов, но не более того.

Термин Data Mining переводится как "извлечение информации" или "добыча данных" [11]. Цель Data Mining состоит в выявлении скрытых правил и закономерностей в наборах данных. Современные технологии Data Mining обрабатывают информацию с целью автоматического поиска шаблонов (паттернов), характерных для каких-либо фрагментов неоднородных многомерных данных. В отличие от OLAP в Data Mining бремя формулировки гипотез и выявления необычных (unexpected) шаблонов переложено с человека на компьютер. Data Mining - это не один, а совокупность большого числа различных методов обнаружения знаний. Выбор метода часто зависит от типа имеющихся данных и от того, какую информацию вы пытаетесь получить.

Основные достоинства Data Mining:

  • наиболее полный пакет методов на рынке программного обеспечения;

  • большой набор готовых решений;

  • удобный пользовательский интерфейс, полностью интегрированный с MS Office;

  • мощные средства разведочного анализа;

  • полностью оптимизированный пакет для работы с огромным объемом информации;

  • гибкий механизм управления;

  • многозадачность системы;

  • чрезвычайно быстрое и эффективное развертывание.

В программном обеспечении системы Data Mining представлены следующими классами и примерами систем:

  • статистические пакеты (STATGRAPHICS, STATISTICA, STADIA);

  • предметно-ориентированные аналитические системы;

  • нейронные сети (BrainMaker, NeuroShell, OWL); системы рассуждений на основе аналогичных случаев (KATE tools (Франция), Pattern Recognition Workbench (США), КОРА (Россия));

  • деревья решений (IDIS, KnowledgeSEEKER, See5/C5.0);

  • эволюционное программирование (PolyAnalyst);

  • генетические алгоритмы (GeneHunter);

  • алгоритмы ограниченного перебора (WizWhy);

  • системы для визуализации многомерных данных (Data Miner 3D).


^ 3. Современные методы прогнозирования.

Из существующих методов прогнозирования в области потребления энергоресурсов наиболее часто применяются статистические методы и методы эвристического прогнозирования.

Одним из распространенных способов построения вероятностных прогнозов является построение регрессионных зависимостей. Строятся, в основном, однопараметрические модели, где переменной является фактор времени. Такие модели часто называются динамическими; они более типичны для прогнозирования, так как здесь решается вопрос об изменении главного признака - времени в будущем.

Чтобы выявить некоторые закономерности изменения во времени, недостаточно определить только тенденцию. Для этого необходимо изучить внутреннюю структуру отклонений динамического ряда от найденной тенденции, используя корреляционный метод. Только в этом случае можно в качестве прогнозирующей функции использовать модель вида:


(3.1)


где - найденная тенденция (детерминированная компонента);

  • - стохастическая компонента;

- случайная компонента.


Отличительной чертой динамических рядов является наличие корреляции между соседними членами рядами. Однако методы корреляционного анализа основываются на предположении о независимости элементов статистического ряда. Поэтому для установления тесноты связи между уровнями ряда динамики определяется коэффициент автокорреляции.

Наиболее часто в рядах динамики встречается полиномиальная, экспоненциальная и гармоническая составляющая тренда. Наиболее пригодным для выделения тренда является метод скользящей средней.

Пользуются двумя модификациями метода скользящей средней:

простое сглаживание основывается на составлении нового ряда из простых среднеарифметических, исчисленных для определенных промежутков времени;

взвешенное сглаживание состоит в определении взвешенных средних для равных точек ряда динамики.

Как правило, значения временного ряда из недалекого прошлого лучше описывают прогноз, чем более старые значения этого же ряда. Тогда можно использовать для прогнозирования скользящее среднее


Y(t+1)=(1/(T+1))*[Y(t)+Y(t-1)+...+Y(t-T)], (3.2)


Смысл его заключается в том, что модель видит только ближайшее прошлое (на T отсчетов по времени в глубину) и, основываясь только на этих данных, строит прогноз. При прогнозировании довольно часто используется метод экспоненциальных средних, который постоянно адаптируется к данным за счет новых значений.

Формула, описывающая эту модель, записывается как:


y(t+1)=a*y(t)+(1-a)* y^(t), (3.3)


где y(t+1) – прогноз на следующий период времени;

y(t) – реальное значение в момент времени t;

y^(t) – прошлый прогноз на момент времени t;

a – постоянная сглаживания (0<=a<=1)).


Наряду с описанными выше методами, основанными на экспоненциальном сглаживании, уже достаточно долгое время для прогнозирования используются регрессионные алгоритмы. Существует прогнозируемая переменная Y (зависимая переменная) и отобранный заранее комплект переменных, от которых она зависит - X1, X2, ..., XN (независимые переменные). Природа независимых переменных может быть различной. Главное - уметь формализовать все внешние факторы, от которых может зависеть уровень спроса в числовую форму.

Модель множественной регрессии в общем случае описывается выражением:


(3.4)


В более простом варианте линейной регрессионной модели зависимость зависимой переменной от независимых имеет вид:


(3.5)


Здесь - подбираемые коэффициенты регрессии,

- компонента ошибки. Предполагается, что все ошибки независимы и нормально распределены.


При построении долгосрочных прогнозов используют более современные технологии прогнозирования, например: нейронные сети, генетические алгоритмы, экспертные системы.

В исследуемой проблеме первоочередным является определение срока, на который делается прогноз.

При этом существует следующая градация периодов:

  1. краткосрочный - период упреждения от нескольких часов до месяца;

  2. среднесрочный - от нескольких месяцев до года;

  3. долгосрочный - от года до 5 лет и более.


Одной из наиболее сложных в методическом отношении является проблема долгосрочного прогнозирования. Сложность ее обусловлена объективно существующими трудностями учета качественных изменений объекта прогноза, достоверная и систематизированная информация о которых в ретроспективном периоде часто отсутствует.

Процесс решения задачи прогнозирования может быть рассмотрен как преобразование исходной информации, полученной путем сбора статистических данных или анализа результатов решения смежных задач. Статистические данные, характеризующие процесс газопотребления, образуют дискретные динамические ряда, получаемые регистрацией данных через определенный период (час, день, неделя, месяц, год).

В настоящей работе исследованию подлежит совокупность статистических данных, состоящая из N объектов-потребителей, каждый из которых вписывается исследуемым признаком за определенный интервал времени. Исходные эмпирические данные могут быть записаны в виде набора матрицы размерностью N*n , где элемент Xij представляет собой величину рассматриваемого признака для i-го объекта в j-ый период времени. Каждая строка матрицы представляет собой характеристику определенного объекта, каждый столбец - набор значений признака в исследуемой совокупности. В силу громоздкости по объему массива исходных данных необходима их классификация, группировка. Наиболее рациональная группировка исследуемой совокупности может быть получена путем многошагового процесса последовательных разбиений. Одновременно принимается во внимание, что суточный и годовой режимы газопотребления формируют факторы, меняющиеся под влиянием метеорологических, астрономических и общественных условий.

Краткосрочный прогноз необходим в целях диспетчерского управления, где предвидение почасовых и ежесуточных потребностей в газе необходимо для рационального перераспределения потоков газа между потребителями в течение суток, месяца. Среднесрочные и долгосрочные прогнозы служат плановым разработкам с целью выявления общей тенденции развития системы газоснабжения рассматриваемого экономического района. Наиболее целесообразно применение в целях прогнозирования следующих методов:

  1. экстраполяции тенденций;

  2. моделирования;

  3. экспертных оценок.


Как показали исследования, суточный и годовой режимы газопо­требления формируются: метеорологическими (текущие и предшест­вующие температуры наружного воздуха), астрономическими (смена дня и ночи, дней недели) режимными (степень загрузки и структура потребителей), общественными (социальный уклад населения) и другими факторами. Необходимость применения эвристического анализа обусловливается также наличием в исходной информации факторов, не поддающихся количественной оценке и относящихся по классификации типа информации к мнению.

Анализ и обработка суждений экспертов об указанных факторах позволяют объединить разнородную субъективную информацию и полу­чить их количественную оценку. Для полного описания процесса газопотребления необходимо представить его совокупностью количественных и качественных связей, полученных эвристичеким анализом, в виде системы уравнений:


(3.6)

где F(t)- разложение в ряд Фурье.


При таком подходе к решению задачи устанавливаются количественные и качественные характеристики, отражающие специфику изучаемого процесса, на основе чего, подставляя нужные значения аргумента t, можно прогнозировать режимы и качественные изменения газопотребления.

Из современных методов построения прогноза я планирую использовать нейронные сети.

  • Выбор обусловлен такими преимуществами нейронных сетей:

  • по сравнению с линейными методами статистики, нейронные сети позволяют эффективно строить нелинейные зависимости, более точно описывающие наборы данных;

  • нейронная сеть же обучается на всей выборке данных, не фрагментируя её, что повышает адекватность настройки нейросети;

  • нейронная сеть же создается путем указания вида структуры, числа слоев и числа нейронов в каждом слое, что гораздо быстрее. А алгоритмы построения растущих нейросетей и вовсе не требуют первоначального задания размера нейронной сети. Альтернативой нейронной сети при построении сложных нелинейных моделей является только метод группового учета аргументов (МГУА).


^ 4. Планируемые результаты.

К результатам работы разрабатываемой подсистемы можно отнести следующее:

  • организация хранения информации о потреблении природного газа с возможностью извлечения необходимых данных;

  • построение модели прогнозирования с учетом максимального числа факторов, влияющих на потребления природного газа;

  • получение максимально приближенных к действительным ожидаемых потребления по заданному потребителю, группе в указанным период времени, которые могут использоваться при принятии управленческих решений.


Выводы

- Таким образом, в данном реферате была представлена задача анализа и прогнозирования потребления природного газа, как одного из основных энергоресурсов. В работе был приведен обзор существующих методов и система анализа и прогнозирования потребления природного газа, выбрана и описана постановка задачи для дальнейшего исследования в магистерской работе.

- Дальнейшие исследования будут производиться с учетом использования современных средств анализа данных и специфического подхода к прогнозированию.

- Особенность подхода к построению прогноза заключается в том, что с целью увеличения точности прогноза предполагается в зависимости от периода прогнозирования использовать различные методы решения задач и их комбинации.


Библиография

  1. Панкратов В.С., Берман Р.Л. Разработка и эксплуатация АСУ газотранспортными системами. - Москва, 1982.

  2. Бархударян И.Г., Оганесян Л.А. Современный уровень прогнозирования режимов газопотребления и их моделирование. - Ереван,1981

  3. Айвазян С.А. и др. Прикладная статистика: основы моделирования и первичной обработки данных. - Москва, 1983.

  4. Тарасенко В., Филиппов В., Сенюков В., Миденко М. «Система управления газовым хозяйством региона» Журнал «Системная интеграция. Нефтегазовая промышленность», №2, 2000г.

  5. http://www.forecsys.ru/technologies.phphttp://www.forecsys.ru Библиотека средств прогнозирования

  6. http://www.statsoft.ru STATISTICA, анализ данных, статистический анализ, статистический анализ данных, визуализация, прогнозирование, моделирование, сегментация, исследование, аналитические решения.

  7. Андрей Суслов. Инструменты и технологии аналитической обработки данных. Обзор современных решений в области анализа данных. - "Сетевой журнал" №12,2001.

  8. С.Д. Коровкин, И.А. Левенец, И.Д. Ратманова, В.А. Старых, Л.В. Щавелёв. Решение проблемы комплексного оперативного анализа информации хранилищ данных – 1998.

  9. Коваленко М.В., Махотило К.В. "Нейросетевая модель прогнозирования потребления газа в жилищно-бытовом секторе" Вести. Нац. техн. ун-та "ХПИ", выпуск №12, 2002г.

  10. Дюк В., Самойленко А. Конспект книги "Data Mining: учебный курс". - СПб. Изд. "Питер", 2001.




  1. http://www.w3.org Анализ данных, нейронные сети, прогнозирование. Прогнозирование потребления электроэнергии.

  2. http://www.bi-grouplabs.ru Анализ данных, нейронные сети, прогнозирование.

  3. http://www.neuroproject.ru/ Методы прогнозирования.

  4. Ивахненко А.Г. Долгосрочное прогнозирование и управление сложными системами. - М., «Техника», 1975.

  5. Грешилов А.А., Стакун В.А., Стакун А.А. Математические методы построения прогнозов. – М.: Радио и связь,1997.

  6. http://www.gmdh.net/gmdh.htm Метод МГУА для социально экономического прогнозирования, математического моделирования, статистического анализа данных, аналитической оценки систем и программирования.

  7. http://www.interface.ru Обзор современных решений в области анализа данных.

  8. Кречетов, Иванов. Продукты для интеллектуального анализа данных //ComputerWeek, Москва 1997 №14-15.





Скачать 145,2 Kb.
оставить комментарий
Скороходова Т. А
Дата29.09.2011
Размер145,2 Kb.
ТипОтчет, Образовательные материалы
Добавить документ в свой блог или на сайт

Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Загрузка...
Документы

Рейтинг@Mail.ru
наверх