Моделирование процессов самообучения интеллектуальных систем на нечетких семантических сетях в недоопределенных средах icon

Моделирование процессов самообучения интеллектуальных систем на нечетких семантических сетях в недоопределенных средах



Смотрите также:
Вторая Международная научная конференция моделирование нелинейных процессов и систем...
Предварительная программа Диалога-2010...
Программа наименование дисциплины Моделирование бизнес-процессов...
Автоматизированная диалоговая система надра–Д исследования процессов в многокомпонентних средах...
Учебная программа. Наименование тем, их содержание...
Программа дисциплины «Моделирование и анализ бизнес-процессов»...
Математические модели и методы анализа волновых процессов в нелинейных средах 05. 13...
Программа вступительного испытания...
Программа дисциплины Информационное моделирование (на английском языке) для направления 080700...
И. Б. Петров, доктор физ мат наук, проф., зав каф...
Системы искусственного интеллекта и нейронные сети...
Рабочая программа дисциплины теория и практика управления процессами нефтегазодобычи...



скачать


На правах рукописи


КРАСОВСКАЯ ЛЮДМИЛА ВЛАДИМИРОВНА




МОДЕЛИРОВАНИЕ ПРОЦЕССОВ САМООБУЧЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ НА НЕЧЕТКИХ СЕМАНТИЧЕСКИХ СЕТЯХ В НЕДООПРЕДЕЛЕННЫХ СРЕДАХ


Специальность: 05.13.18 – математическое моделирование, численные методы и комплексы программ


АВТОРЕФЕРАТ


диссертации на соискание ученой степени

кандидата технических наук


Махачкала – 2006г.

Работа выполнена в ГОУ ВПО «Дагестанский государственный технический университет»


^

НАУЧНЫЙ РУКОВОДИТЕЛЬ: доктор технических наук, профессор

Мелехин В.Б.




ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ: доктор технических наук, профессор

Исмаилов Ш.-М.А.
^

кандидат технических наук, доцент

Омаров О.М.




ВЕДУЩАЯ ОРГАНИЗАЦИЯ: Дагестанский научный центр Российской

Академии наук


Защита состоится «21» ноября 2006г. в 14 час. 00 мин. на заседании специализированного совета К 212.052.03 по защите диссертаций при Дагестанском государственном техническом университете по адресу: 367015, г. Махачкала, пр. Шамиля, 70.


С диссертацией можно ознакомиться в библиотеке Дагестанского государственного технического университета.


Автореферат разослан «21» октября 2006г.


Ученый секретарь

диссертационного совета

к.т.н., доцент Меркухин Е.Н.


^ ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Создание и совершенствование принципов управления сложными объектами, разработка эффективных систем принятия решений и построение экспертных систем на основе современных достижений искусственного интеллекта является одним из важнейших направлений развития производства и ускорения научно-технического прогресса.

Актуальность рассматриваемой проблемы подтверждается и бурным развитием исследований в области искусственного интеллекта, а также интенсивным их внедрением в различные сферы человеческой деятельности. Существенный вклад в развитие интеллектуальных систем (ИС) внесли: Аверкин А.Н., Берштейн Л.С., Вагин В.Н., Ефимов Е.И., Журавлев Ю.Н., Зарипов А.Х., Клыков Ю.И., Литвицева Л.В., Левин Д.Д., Любарский Ю.А., Мелихов А.Н., Нариньяни А.С., Поспелов Д.А., Попов Э.В., Тимофеев А.В., Фин В.К., Цаленко М.Ш., Чернухин Ю.В., Яхно Т.М. и многие другие.

Однако несмотря на достигнутые успехи, проблема создания эффективных интеллектуальных систем (ИС) на сегодняшний день остается открытой. Особую актуальность приобретают исследования, связанные с созданием систем, способных принимать решения и целенаправленно функционировать в априорно неописанных проблемных средах (ПС). Это обусловлено тем, что априорное описание закономерностей реальной среды вряд ли возможно с той полнотой, которая необходима для эффективного планирования целенаправленного поведения в реальных условиях.

^ Цель работы и задачи работы. Целью работы является разработка алгоритмов самообучения и построение программного комплекса для моделирования процессов целесообразного поведения интеллектуальных систем, способных автономно функционировать в недоопределенных проблемных средах (ПС), когда модель среды представляется в виде нечеткой семантической сети (НСС).

Поставленная цель формулирует следующие основные задачи диссертационного исследования:

- построить эффективную информационную модель проблемной среды для представления знаний безотносительно к конкретной предметной области, позволяющую организовать самообучение и принятие решений в сложных динамических проблемных средах на основе имитации целесообразного поведения на НСС;

- разработать методику несмещенной оценки и равенства нечетко выраженных отношений между объектами модели в ПС;

- синтезировать и исследовать процедуры самообучения, позволяющие организовывать целесообразное поведение интеллектуальной системы в априорно неописанных проблемных средах;

- разработать и исследовать процедуры целенаправленного поведения с привлечением механизмов адаптации, обобщения и применения накопленного опыта в сложных проблемных средах;

- разработать пакет программ для моделирования целесообразного поведения ИС, позволяющий определить эффективность использования алгоритмов в различных условиях ПС.

^ Методы исследования. В процессе решения поставленных задач использованы теория искусственного интеллекта, принципы ситуационного управления, теория четких и расплывчатых множеств, теория графов, математическая логика, теория алгоритмов, теория вероятностей и математического моделирования.

^ Научная новизна. Для решения поставленных задач разработаны алгоритмы самообучения ИС, наделяющие их способностями изучать различные закономерности ПС и на этой основе организовать целесообразное поведение в априорно неописанных средах.

К основным результатам составляющих новизну проведенного исследования, можно отнести следующее:

  1. Предложена оригинальная модель ПС в виде нечеткой семантической сети, отличающаяся от известных наличием вершин, определяющих независимые от ИС события, что позволяет моделировать динамические проблемные среды, и обеспечивать имитацию самообучения ИС в недоопределенных динамических средах.

  2. Разработана методика сравнения нечетко представленных отношений в модели ПС, отличающаяся от известных тем, что она позволяет выполнять несмещенную оценку равенства нечетко выраженных показателей и тем самым повысить достоверность сравнения.

  3. Синтезированы и исследованы алгоритмы самообучения, позволяющие формировать программы целесообразного поведения в различных проблемных средах, отличающиеся от известных, имитацией отработки пробующих действий на НСС, что дает возможность исключить влияние ИС на ПС в процессе изучения закономерностей среды;

  4. Разработаны и исследованы процедуры выбора алгоритмов целесообразного поведения ИС в соответствии с характером закономерностей ПС, установленных в процессе моделирования целесообразного поведения.

  5. Разработан пакет программ, позволяющий моделировать целесообразное поведение интеллектуального робота в ПС, и на этой основе определить эффективность применения алгоритмов самообучения в различных условиях проблемной среды.

^ Практическая ценность работы заключается в возможности использования разработанных алгоритмов целесообразного поведения для самообучения интеллектуальных систем в реальных труднодоступных для человека проблемных средах.

Важной особенностью предложенных информационных моделей представления знаний и алгоритмов целесообразного поведения является их достаточно высокая универсальность, позволяющая использовать эти методы и процедуры для построения решающих систем интеллектуальных роботов; в системах ситуационного управления сложными объектами; для организации планирования движения различных автоматических транспортных средств и т.д.

^ Реализация результатов работы.

Полученные результаты использованы в учебном процессе при чтении лекций по дисциплине «Интеллектуальные системы» и при проведении курсового и дипломного проектирования.

^ Апробация работы. Работа в целом и ее отдельные результаты докладывались и обсуждались на Всероссийской научно-технической конференции “Современные информационные технологии в управлении”, 2003г., на III Республиканской научно-практической конференции ДНЦ РАН, 2004г., на научно-технических конференциях Дагестанского Государственного технического университета с 2003 по 2005г.

Публикации. По теме диссертации опубликовано 10 печатных работ, из них 7 статей общим объемом 2.5 п.л.

^ Структура и объем диссертационной работы. Диссертация состоит из введения, 4 разделов и заключения, изложенных на 140 страницах, содержит 43 рисунка, 41 таблицу, 93 наименования библиографии. Имеется приложение на 65 стр., куда вынесены листинг моделирующей программы, а также акты о внедрении результатов диссертационной работы.


^ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы исследования, сформулированы цель и задачи работы, определена научная новизна и показана практическая значимость работы.

^ В первой главе рассмотрены вопросы организации и построения информационных моделей представления знаний ИС безотносительно к конкретной предметной области. Рассмотрена классификация образов ПС. Усовершенствована модель обобщенного описания ситуаций проблемной среды в виде нечеткой семантической сети.

Характерной особенностью ИС, способных функционировать в условиях неопределенности является то, что такие системы должны быть наделены способностями к самообучению, а знания таких сис­тем должны быть не только структурированы, но и представлены безотносительно к конкретным условиям функционирования. Для описания ситуаций ПС безотносительно к конкретной области можно использовать нечеткие семантические сети (НСС) ак­тивного и пассивного типа.

Формально нечеткая семантическая сеть является ори­ентированным нечетким мультиграфом G1=(V1,E1),где V1={vi1} i1= 1,n1 и E1={ei2} i2=1,n2-соответственно множество вершин и ребер. Вершины биективно соответствуют объектам ПС, ребра – отношениям, складывающимся в среде между этими объектами.

Однако описание ПС с помощью известных НСС не позволяет эффективным образом организовать моделирование процесса самообучения ИС в динамических проблемных средах. Для устранения указанного недостатка в дополнение к активным и пассивным вершинам сети определяется множество вершин V*, соответствующих событиям, происходящим в проблемной среде независимо от ИС. При этом ребра, исходящие из этих вершин к вершинам, помеченным объектами, определяются характером воздействия соответствующих событий среды на соответствующие объекты. В самом общем случае формат описания вершин – событий будет иметь следующее содержание:<идентификатор события><повторяемость события><возможные результаты воздействия на вершины объектов>.

Для представления отношений в НСС используется тройка < xi, i(xi), Tj>, где xi – количественное значение.

Для перехода от количественных значений отношений между объектами ПС, измеренных при помощи информационно-измери­тельной системы ИС и определяемых базовыми значениями лингвистических переменных, к качественным их значениям, т.е. к одному из термов можно использовать преобразо­вания следующего вида:


æ , если ;

F: xi ® í , если ; (1)

è , если ;

где и, соответственно нижняя и верхняя граница числовых значений терма .


При этом степень принадлежности значений базовой переменной к множеству числовых значений терма может вычис­ляться согласно следующему характерному числовому выражению:


(2)

где - интервал численных значений терма ; - середина интервала числовых значений этого тер­ма.


Рассмотренный подход определения компонентов тройки < xi, > при помощи выражений (1) и (2) позволяет легко переходить от количественного значения отношения, определяемого базовой переменной xi, к качественному значению отношения, выраженному парой <>, а также осуществлять обратный переход от качественного значения к количественному при функционировании в конкретных условиях ПС.

Для сравнения двух значений отношений между собой, заданных тройками < xi ,> и < xi,> введем характеристику степени равенства (близости) , которая может вычисляться следующим образом:




где - параметр, задающий приведенное значение точности сравнения величины отношения;

 - операция расплывчатой экви­валентности, определяемая по формуле ;

& - конъюнкция, показывающая одновременность выполняющихся условий.


Выражение (3) можно обосновать следующим образом. Два количественных значения отношения равны меж­ду собой, если они попадают в интервал численных значений одного и того же терма , в окрестность одной и той же точки, определяе­мую значением параметра (случай а). Два количественных значения и нечетко равны между собой, если они принадлежат интервалу численных значений одного и того же терма . Причем, если оба значения степени принадлежности сравниваемых значений попадают в одну и ту же половину интервала численных значений терма, то степень сравнения вычисляется по «б», в противном случае, она определяется по «в». Значения и не равны между собой, если они попадают в интервалы численных значений различных тер­мов лингвистической переменной (случай г). Следовательно, два значе­ния одного и того же отношения равны при . Эти значения отношения являются нечетко равными, если и они не равны в случае, ког­да .

^ Во второй главе рассмотрены вопросы, связанные с организацией самообучения ИС в проблемных средах первого уровня сложности. Разработаны и исследованы алгоритмы самообучения с активной и активно-пассивной логикой, позволяющие ИС автоматически формировать модель целесообразного поведения в априорно неописанных условиях функционирования.

На каждом этапе самообучения ИС имитирует отработку пробных действий на НСС. Для имитации отработки действий на НСС каждое из них определяется с помощью следующего формата описания <<имя действия><НСС, определяющие условия отработки действия><НСС, описывающие результат>>, которое будем называть фреймом действия (ФД).

Имитация отработки действий осуществляется следующим образом. В НСС, определяющей текущую ситуацию ПС по третьей части ФД вносятся соответствующие действию изменения значений отношений между объектами среды. Если в результате имитации отработки действия текущая ситуация приближается к целевой ситуации по своему содержанию то, формируется звено в цепи поведения в форме элементарного акта поведения  bj1 , где приведенная запись означает, что при восприятии текущей ситуации ПС отработка действия bj1 приводит к ее преобразованию в результирующую ситуацию тек. Причем степень близости ( Siтек,Sцел )< ( Si+1тек , Sцел), т.е. действие bj1 преобразует ситуацию Siтек в ситуацию Si+1тек, между которой и цепью наблюдается меньшее число различий, чем между целевой и исходной ситуациями.

Если действие приводит к необходимому преобразованию ситуаций в среде, то оно закрепляется в формируемой программе целесообразного поведения (ПЦП). В результате формируется модель следующего вида . Полученная модель поведения закрепляется окончательным образом достижением цели после ее непосредственной реализации в ПС. Это в значительной степени упрощает процесс самообучения, так как позволяет исключить из этого процесса реальные изменения в среде, которые могут быть вызваны при непосредственной отработке пробных действий не способствующих улучшению сложившейся текущей ситуации.

В работе разработаны два алгоритма самообучения в средах первого уровня сложности: с активной и активно-пассивной логикой поведения. Алгоритм с активной логикой поведения предназначен для самообучения ИС в статических средах, т.е. средах, в которых преобразование ситуаций происходит только в результате отрабатываемых системой действий. В динамических ПС преобразование ситуации происходит еще и от независимых от ИС событий. Поэтому в таких средах используются алгоритмы самообучения с активно-пассивной логикой поведения.

В алгоритме с активно-пассивной логикой сначала выполняется наблюдение за изменением ситуации. Если произошло самопроизвольное преобразование ситуации, то в этой вновь сформированной ситуации ИС по выше описанному принципу выявляет целесообразное воздействие и формирует отдельное звено целесообразного поведения, запоминая цепочку Siтек bj  Sцел. Далее принимается Sцел за Siтек и продолжаются наблюдения за изменением среды. Если процесс не привел к достижению цели, то ИС переходит к самообучению на основе активной логики поведения. В работе приведено структурированное описание указанных алгоритмов самообучения, показывающие сложность алгоритмов самообучения, определяющую числом пробных действий, выполненных ИС в процессе самообучения в зависимости от числа объектов, характеризующих ПС. Указанная сложность имеет порядок ]n2[, n – число объектов ПС.

^ В третьей главе рассмотрены проблемы организации самообучения ИС в проблемных средах второго уровня сложности.

Среда второго уровня сложности характеризуется наличием разветвленной взаимосвязи условных сигналов, определяющих и сопровождающих различные преобразования ее допустимых ситуаций.

Таким образом, ПС относится к среде второго уровня сложности:

- при появлении "тормозных сигналов", препятствующих отработке ранее сформированной программы целесообразного поведения, которая до появления этого сигнала в ПС приводила к достижению соответствующего стандартного сигнала;

- при наблюдении суммарных комплексов условных сигналов, определяющих необходимость одновременного выполнения в среде нескольких событий, связанных с достижением заданной цели;

- при наличии в среде причинно - следственных связей между условными сигналами и происходящими событиями.

При наличии в ПС тормозных сигналов ИС функционирует в ней следующим образом. Допустим, при обработке ранее сформированной цепи поведения S1iтек & b1j  S2i+1тек & b2j ... Ski+nтек & bkj  Sцел после реализации действия b2j не произошли требуемые преобразования и появление сигнала Ski+nтек , тогда ИС имитирует обработку действий и начинает преобразование среды и наличие S2i+1тек пробует отработать действие b1j. Если в результате появляется сигнал ТС, то у него формируется звено поведения ( S1iтек & ТС) & b1j, где ТС – тормозной сигнал, который следует устранить перед отработкой действия b1j. Затем ИС формирует цепь устранения ТС.

Следует отметить, что ИС в процессе самообучения при наличии в ИС тормозных сигналов не может использовать алгоритмы с активно-пассивной логикой поведения, т.к. промежутки времени включения и выключения этих сигналов могут иметь значительную протяженность. В этой связи, опираясь на описание ситуаций проблемной среды в виде нечетких семантических сетей, требуется организация процесса самообучения ИС с активной логикой поведения, позволяющей вырабатывать программы поведения, связанные с выявлением и выключением тормозных сигналов путем наблюдения за самовольными изменениями. После выключения "тормозного сигнала" ИС приступает к отработке ранее сформированной прог­раммы целесообразного поведения, связанной с достижением заданного стандарт­ного сигнала Sцел.

Процесс самообучения ИС в проблемной среде при наличии суммарных сигналов сводится к выработке программ целесообразного поведения, имеющих следующую структуру:

...Si+1тек& bj2k


( Siтек& Si+1тек & ... & Si+nтек) & bj  Sцел ,




...Siтекk & bj1k ... Siтекxk & bjxk


где (Siтек&Si+1тек&…&Siтекxk)&bjSцел - элементарное звено поведения, которое означает, что действие bj после отработки приведет к появлению в проблемной среде целевой ситуации Sцел при одновременном присутствии в ней сигналов Siтек,Si+1тек,…,Siтекxk1, образующих суммарный комплекс.


Рассмотрим два возможных случая:

- когда ИС априори задано содержание суммарного сигнала, и она его уточняет и корректирует в конкретных условиях проблемной среды;

- когда ИС априори неизвестно содержание суммарного сигнала, и она его выявляет в процессе адаптации к проблемной среде.

В первом случае необходимость одновременного присутствия в проблемной среде всех компонентов Siтек,Si+1тек,…,Si+nтекxk1 закрепляемого в вырабатываемой программе целесообразного поведения суммарного сигнала, может проверяться путем поочередного их выключения с последующей отработкой действия bj. В противном случае отсутс­твующий компонент приобретает роль обязательной составляющей суммарного сигнала в текущих условиях проблемной среды.

Во втором случае суммарный сигнал может быть выявлен в процессе самообучения ИС путем наблюдения за характером изменений, происходящих в проблемной среде. В данном случае поведение ИС носит пассивный характер и осуществляется следующим образом. Если при наличии в проблемной среде нескольких явно выраженных сигналов (например, несколько объектов в определенных состояниях) выполненное ИС действие приводит к необходимым преобразованиям, а в случае отсутствия любого из них таких изменений не происходит, то суммарный сигнал и выполненное действие запоминаются. Затем ИС проверяет необ­ходимость одновременного присутствия всех компонентов суммарного сигнала для достижения цели путем поочередного их выключения с последующей отработкой необходимых действий, связанных с достижением закрепленных в программе целесообразного поведения сигналов.

В процессе самообучения ИС при наличии в ПС причинно - следственных связей, обусловленных выполнением в ней раз­личных по своему содержанию событий, необходимо исключить возможность закрепления в вырабатываемых ПЦП случайных элементарных цепей поведения Siтек  bj S1цел, формирующихся в результате неверного определения причин изменения ситуаций среды.

Для этой цели при разработке алгоритма самообучения используются механизмы действия многократного совпадения двух условных сигналов во времени. Приведем один из возможных принципов реализации этого механизма. Введем параметр , принимающий значения из интервала [0,1] и определяю­щий степень уверенности ИС в закономерности отдельного элементарного акта поведения. Считаем, что если параметр для соответствующего элементарного акта поведения в процессе многократной его реализации принимает значение, равное единице, то данное правило отражает закономерное преобразование ПС. В противном случае, при =0 принимается решение о том, что элементарное звено поведения носит случайный характер. Для программы целесообразного поведения, состоящей из актов поведения, значение степени уверенности ИС для эффективного применения этой программы поведения может опреде­ляться согласно выражению: ,

где степень уверенности в истинности элементарного акта поведения, входящего в структуру искомой программы целесообразного поведения.

Если у ИС имеется несколько альтернативных ПЦП, приводящих к достижению определенного стан­дартного сигнала S1цел, то предпочтение отдается наращиванию и выполнению программы поведения с большим значением параметра . При наличии двух ПЦП с одинаковыми значениями параметра используется программа, имеющая меньшую сложность реали­зации.

Для реализации рассмотренного механизма многократного совпадения двух сигналов во времени, необходимо выбрать ко­личество повторных совпадений условных сигналов, при кото­ром принимается решение об истинности формируемого элементарного звена поведения. Значение можно определить эв­ристическим путем, опираясь на накопленный опыт поведения или на основе результата опроса экспертов. Зная можно вы­числить шаг приращения параметра , как . Отсюда, удачная отработка действия элементарного звена поведения поощряется увеличением параметра на т.е. , в противном случае следует штраф и .

Используя описанный механизм, ИС, наблюдая за происходя­щими в ПС событиями, принимает следующее решение: если после восприятия условного сигнала Siтек через интервал времени появляется сигнал и данное совпадение проявляется мно­гократно, т.е. для него ,то сигнал Siтек рассматривается как предвестник появления условного сигнала, на который сис­тема реагирует определенным образом. Далее, если сигнал появляется часто, то изменений в характере поведения ИС не происходит. Система ожидает самопроизвольно­го появления требуемого условного сигнала и реагирует на него определенным образом согласно ПЦП, в которой закреп­лен этот сигнал.

В противном случае ИС принимает решение о необходимости достижения одного из условных сигналов Siтек или при по­мощи отрабатываемых им действий bj1 В. Цепочки действий, приводящие к появлению условных сигналов Siтек и в среде, ИС формирует на основании алгоритма самообучения с активно-пассивной логикой самообучения, вырабатывая соответствующие ПЦП.

В случае, когда предвестниковый сигнал Siтек предсказы­вает появление вредного или тормозного сигнала для достижения стоящей перед ИС целью , то вырабатывается ПЦП, приводящая к выключению сигнала Siтек до появления связанно­го условного с ним сигнала . Если по истечении заданного промежутка времени t2 ПЦП, приводящая к выключению сигнала Siтек, полностью еще не сформирована, то по мере появления условного сигнала ИС вырабатывает ПЦП, связанную с его устранением, и т.д., пока не будут выработаны обе ПЦП, приво­дящие к выключению тормозных сигналов Siтек и .

В случае неудачной попытки сформировать ПЦП, связанную с выключением (или включением) предвестникового сигнала ,ИС уточняет условный сигнал путем выявления независя­щего от него события qiQ, приводящего к включению пред­вестника при наличии в ПС необходимых для этого условий, оп­ределяющихся условным сигналом . После выработки элементарного акта поведения Siтек & qi путем наб­людения за происходящими в среде событиями формируется ком­бинированный условный сигнал qi. Затем ИС выявляет действие bj B, приводящее к появлению в среде необходимого события qi  Q и формирует элементарное звено поведения Siтек & bj qi. После этого формируется ПЦП, связанная с выполнением в ПС события qi  Q с учетом различных допустимых ситуаций среды.

Для эффективного взаимодействия ИС с ПС ей необходимо выбрать наиболее подходящий для сложившейся ситуации алгоритм поведения, связанного с преобразованиями ситуации среды для достижения цели.

Для этого ИС может использовать следующие правила выбора различных алгоритмов функционирования:

  1. ИС отрабатывает стандартные реакции при восприятии в ПС соответствующей ситуации Sцел, определяющей целевое условие функционирования.

  2. ИС выполняет ПЦП, если среда характеризуется SiтекS, закрепленным в ПЦП, связанной с достижением цели.

  3. Если имитация отработки программы поведения не приводит к цели Sцел, то отработка прекращается, и принимает решение о возможном наличии в ПС тормозного сигнала.

  4. Система самообучается согласно соответствующему алгоритму самообучения при наличии в нем тормозного сигнала.

  5. В динамической ПС самообучение ИС базируется на основе алгоритмов с активно-пассивной логикой поведения. ИС принимает решение, что ПС является динамической путем наблюдения за характером изменений, происходящих в проблемной среде.

  6. В квазистационарных ПС самообучение ИС базируется на алгоритмах с активной логикой. Система принимает решение, что конкретная ПС является квазистационарной, так как изменения происходят в ней в результате действий ИС.

  7. При наличии суммарных сигналов самообучение ИС осуществляется на основе соответствующих алгоритмов. ИС принимает решение о наличии в среде априорно неизвестных суммарных сигналов, если между исходной и целевой ситуациями среды имеется ряд различий по состояниям находящихся в них объектов.

^ В четвертой главе проводится разработка программного комплекса для моделирования процесса самообучения интеллектуальной системы на примере интеллектуального робота (ИР) в априори неописанной среде.

Для моделирования процесса самообучения ИР используется пример следующего содержания. На рабочем участке станка с ЧПУ расположена подставка и стеллаж, на котором лежит заготовка. Роботу необходимо перенести заготовку и вставить ее в рабочий орган станка с ЧПУ. Стеллаж находится на расстоянии а1 = 1 м от ИР и а2 = 5м от станка. Подставка расположена на расстоянии а3 = 0,2 м от стан­ка и а4 = 5м от ИР. Рабочая зона манипулятора ИР задается полусферой радиусом м. Зона видимости технического зрения робота равна м.

Пусть оценивается расстояние от ИР до подставки с помощью термов лингвистической переменной «расстояние» <совсем рядом>, <рядом>, <близко>, <недалеко>,<далеко>. Для термов: «совсем рядом» - верхнее граничное значение м выбирается, исходя из размеров рабочей зоны манипулятора робота; «рядом» - граница этого терма м; «близко» - верхняя граница м этого терма берется равной расстоянию, на котором система технического зрения робота способна воспринимать и распознавать известные ему объекты, т.е. численное значение равно верхнему пределу зоны восприятия робота; «недалеко» - граница этого терма ; «далеко» - граница этого терма м.

Структура НСС1, определяющей исходную ситуацию для описанной выше тестовой задачи приводится на рис.1.




Аналитическое описание данной ситуации имеет следующее содержание:

{ИР ((((<<0.4/близко>заготовка>) & <0.4/близко>стеллаж>) &<1/далеко>станок>) &<1/далеко>подставка>)} & {станок ((<<0,2/рядом>подставка> & <<1/далеко>стеллаж>)} & {подставка ((<<0.2/рядом>станок>) & <<1/далеко>заготовка>)},

где &- конъюнкция, обозначающая одновременность происходяще­го события.

При аналитическом описании НСС выражение, заключенное в фигурные скобки рассматривается как отдельный фрагмент сети, а имена объектов, с которых начинаются фрагменты, определя­ются как ключевые понятия фрагментов. Фрагменты НСС, необхо­димые для описания ПС достаточного для принятия решений, можно сформировать на основе эвристических процедур. Например, первый базовый фрагмент строится относительно ключевой вершины се­ти, помеченной понятием "ИР". Следующие необходимые фрагмен­ты формируются относительно объектов, входящих в структуру заданного на текущий момент времени целевого условия, но над которыми ИР непосредственных действий не выполняет. Третий тип фрагментов строится в процессе функционирования относительно объектов, используемых ИР в качестве вспомога­тельных инструментов.

В процессе имитации поведения ИР на первом шаге обучения выявлено действие «подойти к стеллажу». После имитации выполнения этого действия среда преобразуется в новую ситуацию, которая описывается с помощью НСС2. (рис.2).




Аналитическое описание данного графа имеет следующее содержание:

{ИР ((((<<0.2/рядом>заготовка>) & <<0.2/рядом>стеллаж>) & <<1/далеко>станок>) & <<1/далеко>подставка>)} & {станок ((<<0,2/рядом>подставка> & <<1/далеко>стеллаж>)} & {подставка ((<<0.2/рядом>станок>) & <<1/далеко>заготовка>)}.


В целом в процессе самообучения ИР сформировал следующую программу действий: <подойти к стеллажу>, <взять заготовку>, <дойти до подставки>, <положить заготовку на подставку>, В <ИР подходит к станку >. В результате была получена целевая ситуация НСС (рис. 3).

Для машинной реализации различных алгоритмов самообучения ИР к программному комплексу имитационного моделирования были сформулированы следующие основные требования:

- высокое быстродействие;

- удобство в управлении программой.





Программа написана на алгоритмическом языке Visual Studio C++, которая имеет удобный пользовательский интерфейс для создания, компиляции, отладки, выполнения программ и просмотра результатов расчета. Исходными данными являются начальная ситуация, множество пробных действий и результирующая ситуация. Данные представляются в виде таблицы массивов ситуаций и действий ИР.

Программный комплекс состоит из следующих модулей-подпрограмм. К ним относятся: головная программа modellingDlg.h, которая имитирует поведение ИР на нечетких семантических сетях в средах первого и второго уровня сложности; resultDlg.h- модуль описания окна результатов; modellingDlg.cpp – подпрограмма описания исходных и результирующих данных; ResultDlg.cpp – подпрограмма вывода ПЦП; CResultDlg::ActiveAlgorithm – подпрограмма моделирования алгоритма самообучения с активной логикой поведения; CResultDlg::ActivePasiveAlgorithm – подпрограмма моделирования алгоритма самообучения с активно- пассивной логикой; CResultDlg::StopAlgorithm – подпрограмма моделирования алгоритма самообучения при наличии в ПС тормозного сигнала; CResultDlg::Summ1Algorithm - подпрограмма моделирования алгоритма самообучения при наличии в статической среде суммарных сигналов; CResultDlg::Summ2Algorithm - подпрограмма моделирования алгоритма самообучения при наличии в динамической среде суммарных сигналов; CResultDlg::SledstvieAlgorithm - подпрограмма моделирования алгоритма самообучения при наличии в ПС причинно-следственной связи. Результаты имитации выводятся в формате html-файлов, импортируемых в таблицы результатов матрицы смежности НСС, определяющей текущее состояние ПС на данный момент времени в результате имитации отработки выбранного действия.

Программа выполняет имитацию отработки действий в выбранной проблемной среде для моделирования поведения интеллектуального робота в средах первого и второго уровня сложности.

^ В заключении сформулированы основные выводы по диссертационной работе в целом.

В приложении приведены:

  1. сведения о внедрении результатов диссертационной работы;

  2. листинг моделирующей программы

^ ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

При проведении исследований получены следующие основные результаты, позволяющие как в совокупности, так и в отдельности, повысить эффективность самообучения ИС в априори неописанных условиях ПС:

  1. Для моделирования динамических ПС при ее описании нечеткой семантической сетью предложено определить дополнительное множество вершин, соответствующих событиям, происходящих в среде независимо от ИС;

  2. С целью повышения достоверности сравнения нечетко выраженных отношений в НСС разработана несмещенная оценка равенства их значений;

  3. Для моделирования целесообразного поведения ИС на НСС в различных ПС синтезированы и исследованы алгоритмы самообучения на основе имитации отработки пробующих действий;

  4. С целью установления характера закономерностей ПС сформулированы и исследованы процедуры выбора алгоритмов целесообразного поведения ИС;

  5. Для определения эффективности алгоритмов целесообразного поведения в различных условиях ПС разработан пакет программ моделирующего целесообразно поведение интеллектуального робота.


^ По теме диссертации опубликованы следующие работы:

  1. Мелехин А.В., Кагиров К.А., Красовская Л.В. Организация самообучения интеллектуальных систем на основе имитации целесообразного поведения // Технические науки. Вестник ДГТУ. - Махачкала: ДГТУ, 2002. - №5 (0,7/0,4 п.л.)

  2. Мелехин В.Б., Красовская Л.В. Информационная модель представления динамических знаний в интеллектуальных системах прогнозирования аварийных и чрезвычайных ситуаций // Современные информационные технологии в управлении. Сб. тез. докл. Всероссийской научно-технической конференции. – Махачкала, 2003 (0,2/0,1 п.л.).

  3. Красовская Л.В., Магомедов Х.Д., Мелехин А.В. Динамические модели представления знаний в интеллектуальных системах прогнозирования аварийных и чрезвычайных ситуаций // Информационные и телекоммуникационные системы: сетевые технологии. Материалы III Республиканской научно-практической конференции. – Махачкала: ДНЦ РАН, 2004 (0,6/0,2 п.л.).

  4. Мелехин В. Б., Красовская Л. В. Организация самообучения интеллектуального робота на нечетких семантических сетях // Неделя науки- 2004. Сборник докладов XXV итоговой научно-технической конференции преподавателей, сотрудников, аспирантов и студентов ДГТУ.– Махачкала: ДГТУ, 2004 (0,2/0,1 п.л.).

  5. Красовская Л. В. Особенности организации самообучения ИС в режиме полифазного поведения // Неделя науки- 2005. Cб. тез. докл. XXVI итоговой научно-технической конференции преподавателей, сотрудников, аспирантов и студентов ДГТУ. – Махачкала: ДГТУ, 2005 (0,2 п.л.).

  6. Красовская Л. В. Алгоритмы самообучения интеллектуальных систем на нечетких семантических сетях // Технические науки. Вестник ДГТУ.- Махачкала: ДГТУ, 2005. - №7 (0,5 п.л.).

  7. Красовская Л. В. Несмещенные оценки сравнения отношений в нечетких семантических сетях // Технические науки. Вестник ДГТУ.- Махачкала, 2005.- №7 (0,5 п.л.).

  8. Красовская Л.В. Алгоритмы самообучения интеллектуальных систем на нечетких семантических сетях в проблемной среде при наличии в ней суммарных сигналов // Современные информационные технологии в проектировании, управлении и экономике. Часть 1. Сборник научных трудов. – Махачкала: ДГТУ, 2005 (0,5 п.л.).

  9. Красовская Л.В. Алгоритмы самообучения интеллектуальных систем в проблемной среде при наличии в ней причинно-следственных связей // Современные информационные технологии в проектировании, управлении и экономике. Часть 1. Сборник научных трудов. – Махачкала: ДГТУ, 2005 (0,5 п.л.).

  10. Красовская Л.В. Алгоритмы самообучения интеллектуальных систем на нечетких семантических сетях с имитацией отработки действий // Радиоэлектроника.- Известия вузов России. 2006. – № 4 (0,6 п.л.).






Формат 60х84.1/16. Печать ризографная. Бумага №1. Гарнитура Таймс.

Усл.п.л. – 1,5 изд. п.л. – 1,5. Заказ № 398-04 Тираж – 100 экз.

Отпечатано в издательстве «Полиграфист»

М


ахачкала, ул. Акушинского, 7





Скачать 280,65 Kb.
оставить комментарий
КРАСОВСКАЯ ЛЮДМИЛА ВЛАДИМИРОВНА
Дата22.09.2011
Размер280,65 Kb.
ТипАвтореферат, Образовательные материалы
Добавить документ в свой блог или на сайт

плохо
  1
отлично
  1
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

наверх