скачать На правах рукописи КРАСОВСКАЯ ЛЮДМИЛА ВЛАДИМИРОВНАМОДЕЛИРОВАНИЕ ПРОЦЕССОВ САМООБУЧЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ НА НЕЧЕТКИХ СЕМАНТИЧЕСКИХ СЕТЯХ В НЕДООПРЕДЕЛЕННЫХ СРЕДАХ Специальность: 05.13.18 – математическое моделирование, численные методы и комплексы программ АВТОРЕФЕРАТдиссертации на соискание ученой степени кандидата технических наук Махачкала – 2006г. Работа выполнена в ГОУ ВПО «Дагестанский государственный технический университет» ^ ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ: доктор технических наук, профессор Исмаилов Ш.-М.А. ^ ВЕДУЩАЯ ОРГАНИЗАЦИЯ: Дагестанский научный центр Российской Академии наук Защита состоится «21» ноября 2006г. в 14 час. 00 мин. на заседании специализированного совета К 212.052.03 по защите диссертаций при Дагестанском государственном техническом университете по адресу: 367015, г. Махачкала, пр. Шамиля, 70. С диссертацией можно ознакомиться в библиотеке Дагестанского государственного технического университета. Автореферат разослан «21» октября 2006г. Ученый секретарь диссертационного совета к.т.н., доцент Меркухин Е.Н. ^ Актуальность темы. Создание и совершенствование принципов управления сложными объектами, разработка эффективных систем принятия решений и построение экспертных систем на основе современных достижений искусственного интеллекта является одним из важнейших направлений развития производства и ускорения научно-технического прогресса. Актуальность рассматриваемой проблемы подтверждается и бурным развитием исследований в области искусственного интеллекта, а также интенсивным их внедрением в различные сферы человеческой деятельности. Существенный вклад в развитие интеллектуальных систем (ИС) внесли: Аверкин А.Н., Берштейн Л.С., Вагин В.Н., Ефимов Е.И., Журавлев Ю.Н., Зарипов А.Х., Клыков Ю.И., Литвицева Л.В., Левин Д.Д., Любарский Ю.А., Мелихов А.Н., Нариньяни А.С., Поспелов Д.А., Попов Э.В., Тимофеев А.В., Фин В.К., Цаленко М.Ш., Чернухин Ю.В., Яхно Т.М. и многие другие. Однако несмотря на достигнутые успехи, проблема создания эффективных интеллектуальных систем (ИС) на сегодняшний день остается открытой. Особую актуальность приобретают исследования, связанные с созданием систем, способных принимать решения и целенаправленно функционировать в априорно неописанных проблемных средах (ПС). Это обусловлено тем, что априорное описание закономерностей реальной среды вряд ли возможно с той полнотой, которая необходима для эффективного планирования целенаправленного поведения в реальных условиях. ^ Целью работы является разработка алгоритмов самообучения и построение программного комплекса для моделирования процессов целесообразного поведения интеллектуальных систем, способных автономно функционировать в недоопределенных проблемных средах (ПС), когда модель среды представляется в виде нечеткой семантической сети (НСС). Поставленная цель формулирует следующие основные задачи диссертационного исследования: - построить эффективную информационную модель проблемной среды для представления знаний безотносительно к конкретной предметной области, позволяющую организовать самообучение и принятие решений в сложных динамических проблемных средах на основе имитации целесообразного поведения на НСС; - разработать методику несмещенной оценки и равенства нечетко выраженных отношений между объектами модели в ПС; - синтезировать и исследовать процедуры самообучения, позволяющие организовывать целесообразное поведение интеллектуальной системы в априорно неописанных проблемных средах; - разработать и исследовать процедуры целенаправленного поведения с привлечением механизмов адаптации, обобщения и применения накопленного опыта в сложных проблемных средах; - разработать пакет программ для моделирования целесообразного поведения ИС, позволяющий определить эффективность использования алгоритмов в различных условиях ПС. ^ В процессе решения поставленных задач использованы теория искусственного интеллекта, принципы ситуационного управления, теория четких и расплывчатых множеств, теория графов, математическая логика, теория алгоритмов, теория вероятностей и математического моделирования. ^ . Для решения поставленных задач разработаны алгоритмы самообучения ИС, наделяющие их способностями изучать различные закономерности ПС и на этой основе организовать целесообразное поведение в априорно неописанных средах. К основным результатам составляющих новизну проведенного исследования, можно отнести следующее:
^ работы заключается в возможности использования разработанных алгоритмов целесообразного поведения для самообучения интеллектуальных систем в реальных труднодоступных для человека проблемных средах. Важной особенностью предложенных информационных моделей представления знаний и алгоритмов целесообразного поведения является их достаточно высокая универсальность, позволяющая использовать эти методы и процедуры для построения решающих систем интеллектуальных роботов; в системах ситуационного управления сложными объектами; для организации планирования движения различных автоматических транспортных средств и т.д. ^ Полученные результаты использованы в учебном процессе при чтении лекций по дисциплине «Интеллектуальные системы» и при проведении курсового и дипломного проектирования. ^ Работа в целом и ее отдельные результаты докладывались и обсуждались на Всероссийской научно-технической конференции “Современные информационные технологии в управлении”, 2003г., на III Республиканской научно-практической конференции ДНЦ РАН, 2004г., на научно-технических конференциях Дагестанского Государственного технического университета с 2003 по 2005г. Публикации. По теме диссертации опубликовано 10 печатных работ, из них 7 статей общим объемом 2.5 п.л. ^ . Диссертация состоит из введения, 4 разделов и заключения, изложенных на 140 страницах, содержит 43 рисунка, 41 таблицу, 93 наименования библиографии. Имеется приложение на 65 стр., куда вынесены листинг моделирующей программы, а также акты о внедрении результатов диссертационной работы. ^ Во введении обоснована актуальность темы исследования, сформулированы цель и задачи работы, определена научная новизна и показана практическая значимость работы. ^ рассмотрены вопросы организации и построения информационных моделей представления знаний ИС безотносительно к конкретной предметной области. Рассмотрена классификация образов ПС. Усовершенствована модель обобщенного описания ситуаций проблемной среды в виде нечеткой семантической сети. Характерной особенностью ИС, способных функционировать в условиях неопределенности является то, что такие системы должны быть наделены способностями к самообучению, а знания таких систем должны быть не только структурированы, но и представлены безотносительно к конкретным условиям функционирования. Для описания ситуаций ПС безотносительно к конкретной области можно использовать нечеткие семантические сети (НСС) активного и пассивного типа. Формально нечеткая семантическая сеть является ориентированным нечетким мультиграфом G1=(V1,E1),где V1={vi1} i1= 1,n1 и E1={ei2} i2=1,n2-соответственно множество вершин и ребер. Вершины ![]() Однако описание ПС с помощью известных НСС не позволяет эффективным образом организовать моделирование процесса самообучения ИС в динамических проблемных средах. Для устранения указанного недостатка в дополнение к активным и пассивным вершинам сети определяется множество вершин V*, соответствующих событиям, происходящим в проблемной среде независимо от ИС. При этом ребра, исходящие из этих вершин к вершинам, помеченным объектами, определяются характером воздействия соответствующих событий среды на соответствующие объекты. В самом общем случае формат описания вершин – событий будет иметь следующее содержание:<идентификатор события><повторяемость события><возможные результаты воздействия на вершины объектов>. Для представления отношений в НСС используется тройка < xi, i(xi), Tj>, где xi – количественное значение. Для перехода от количественных значений отношений между объектами ПС, измеренных при помощи информационно-измерительной системы ИС и определяемых базовыми значениями ![]() ![]() æ ![]() ![]() F: xi ® í ![]() ![]() è ![]() ![]() где ![]() ![]() ![]() ![]() ![]() При этом степень принадлежности ![]() ![]() ![]() ![]() где ![]() ![]() ![]() Рассмотренный подход определения компонентов тройки < xi, ![]() ![]() Для сравнения двух значений отношений между собой, заданных тройками < xi , ![]() ![]() ![]() ![]() где ![]() - операция расплывчатой эквивалентности, определяемая по формуле ![]() & - конъюнкция, показывающая одновременность выполняющихся условий. Выражение (3) можно обосновать следующим образом. Два количественных значения отношения равны между собой, если они попадают в интервал численных значений одного и того же терма ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ^ рассмотрены вопросы, связанные с организацией самообучения ИС в проблемных средах первого уровня сложности. Разработаны и исследованы алгоритмы самообучения с активной и активно-пассивной логикой, позволяющие ИС автоматически формировать модель целесообразного поведения в априорно неописанных условиях функционирования. На каждом этапе самообучения ИС имитирует отработку пробных действий на НСС. Для имитации отработки действий на НСС каждое из них определяется с помощью следующего формата описания <<имя действия><НСС, определяющие условия отработки действия><НСС, описывающие результат>>, которое будем называть фреймом действия (ФД). Имитация отработки действий осуществляется следующим образом. В НСС, определяющей текущую ситуацию ПС по третьей части ФД вносятся соответствующие действию изменения значений отношений между объектами среды. Если в результате имитации отработки действия текущая ситуация приближается к целевой ситуации по своему содержанию то, формируется звено в цепи поведения в форме элементарного акта поведения ![]() ![]() ![]() ![]() Если действие приводит к необходимому преобразованию ситуаций в среде, то оно закрепляется в формируемой программе целесообразного поведения (ПЦП). В результате формируется модель следующего вида ![]() ![]() В работе разработаны два алгоритма самообучения в средах первого уровня сложности: с активной и активно-пассивной логикой поведения. Алгоритм с активной логикой поведения предназначен для самообучения ИС в статических средах, т.е. средах, в которых преобразование ситуаций происходит только в результате отрабатываемых системой действий. В динамических ПС преобразование ситуации происходит еще и от независимых от ИС событий. Поэтому в таких средах используются алгоритмы самообучения с активно-пассивной логикой поведения. В алгоритме с активно-пассивной логикой сначала выполняется наблюдение за изменением ситуации. Если произошло самопроизвольное преобразование ситуации, то в этой вновь сформированной ситуации ИС по выше описанному принципу выявляет целесообразное воздействие и формирует отдельное звено целесообразного поведения, запоминая цепочку Siтек bj Sцел. Далее принимается Sцел за Siтек и продолжаются наблюдения за изменением среды. Если процесс не привел к достижению цели, то ИС переходит к самообучению на основе активной логики поведения. В работе приведено структурированное описание указанных алгоритмов самообучения, показывающие сложность алгоритмов самообучения, определяющую числом пробных действий, выполненных ИС в процессе самообучения в зависимости от числа объектов, характеризующих ПС. Указанная сложность имеет порядок ]n2[, n – число объектов ПС. ^ рассмотрены проблемы организации самообучения ИС в проблемных средах второго уровня сложности. Среда второго уровня сложности характеризуется наличием разветвленной взаимосвязи условных сигналов, определяющих и сопровождающих различные преобразования ее допустимых ситуаций. Таким образом, ПС относится к среде второго уровня сложности: - при появлении "тормозных сигналов", препятствующих отработке ранее сформированной программы целесообразного поведения, которая до появления этого сигнала в ПС приводила к достижению соответствующего стандартного сигнала; - при наблюдении суммарных комплексов условных сигналов, определяющих необходимость одновременного выполнения в среде нескольких событий, связанных с достижением заданной цели; - при наличии в среде причинно - следственных связей между условными сигналами и происходящими событиями. При наличии в ПС тормозных сигналов ИС функционирует в ней следующим образом. Допустим, при обработке ранее сформированной цепи поведения S1iтек & b1j S2i+1тек & b2j ... Ski+nтек & bkj Sцел после реализации действия b2j не произошли требуемые преобразования и появление сигнала Ski+nтек , тогда ИС имитирует обработку действий и начинает преобразование среды и наличие S2i+1тек пробует отработать действие b1j. Если в результате появляется сигнал ТС, то у него формируется звено поведения ( S1iтек & ТС) & b1j, где ТС – тормозной сигнал, который следует устранить перед отработкой действия b1j. Затем ИС формирует цепь устранения ТС. Следует отметить, что ИС в процессе самообучения при наличии в ИС тормозных сигналов не может использовать алгоритмы с активно-пассивной логикой поведения, т.к. промежутки времени включения и выключения этих сигналов могут иметь значительную протяженность. В этой связи, опираясь на описание ситуаций проблемной среды в виде нечетких семантических сетей, требуется организация процесса самообучения ИС с активной логикой поведения, позволяющей вырабатывать программы поведения, связанные с выявлением и выключением тормозных сигналов путем наблюдения за самовольными изменениями. После выключения "тормозного сигнала" ИС приступает к отработке ранее сформированной программы целесообразного поведения, связанной с достижением заданного стандартного сигнала Sцел. Процесс самообучения ИС в проблемной среде при наличии суммарных сигналов сводится к выработке программ целесообразного поведения, имеющих следующую структуру: . ![]() ( ![]() ![]() . ![]() где (Siтек&Si+1тек&…&Siтекxk)&bjSцел - элементарное звено поведения, которое означает, что действие bj после отработки приведет к появлению в проблемной среде целевой ситуации Sцел при одновременном присутствии в ней сигналов Siтек,Si+1тек,…,Siтекxk1, образующих суммарный комплекс. Рассмотрим два возможных случая: - когда ИС априори задано содержание суммарного сигнала, и она его уточняет и корректирует в конкретных условиях проблемной среды; - когда ИС априори неизвестно содержание суммарного сигнала, и она его выявляет в процессе адаптации к проблемной среде. В первом случае необходимость одновременного присутствия в проблемной среде всех компонентов Siтек,Si+1тек,…,Si+nтекxk1 закрепляемого в вырабатываемой программе целесообразного поведения суммарного сигнала, может проверяться путем поочередного их выключения с последующей отработкой действия bj. В противном случае отсутствующий компонент приобретает роль обязательной составляющей суммарного сигнала в текущих условиях проблемной среды. Во втором случае суммарный сигнал может быть выявлен в процессе самообучения ИС путем наблюдения за характером изменений, происходящих в проблемной среде. В данном случае поведение ИС носит пассивный характер и осуществляется следующим образом. Если при наличии в проблемной среде нескольких явно выраженных сигналов (например, несколько объектов в определенных состояниях) выполненное ИС действие приводит к необходимым преобразованиям, а в случае отсутствия любого из них таких изменений не происходит, то суммарный сигнал и выполненное действие запоминаются. Затем ИС проверяет необходимость одновременного присутствия всех компонентов суммарного сигнала для достижения цели путем поочередного их выключения с последующей отработкой необходимых действий, связанных с достижением закрепленных в программе целесообразного поведения сигналов. В процессе самообучения ИС при наличии в ПС причинно - следственных связей, обусловленных выполнением в ней различных по своему содержанию событий, необходимо исключить возможность закрепления в вырабатываемых ПЦП случайных элементарных цепей поведения Siтек bj S1цел, формирующихся в результате неверного определения причин изменения ситуаций среды. Для этой цели при разработке алгоритма самообучения используются механизмы действия многократного совпадения двух условных сигналов во времени. Приведем один из возможных принципов реализации этого механизма. Введем параметр ![]() ![]() ![]() ![]() ![]() ![]() где ![]() ![]() Если у ИС имеется несколько альтернативных ПЦП, приводящих к достижению определенного стандартного сигнала S1цел, то предпочтение отдается наращиванию и выполнению программы поведения с большим значением параметра ![]() ![]() Для реализации рассмотренного механизма многократного совпадения двух сигналов во времени, необходимо выбрать количество ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Используя описанный механизм, ИС, наблюдая за происходящими в ПС событиями, принимает следующее решение: если после восприятия условного сигнала Siтек через интервал времени ![]() ![]() ![]() ![]() ![]() В противном случае ИС принимает решение о необходимости достижения одного из условных сигналов Siтек или ![]() ![]() В случае, когда предвестниковый сигнал Siтек предсказывает появление вредного или тормозного сигнала ![]() ![]() ![]() ![]() ![]() В случае неудачной попытки сформировать ПЦП, связанную с выключением (или включением) предвестникового сигнала ![]() ![]() ![]() ![]() Для эффективного взаимодействия ИС с ПС ей необходимо выбрать наиболее подходящий для сложившейся ситуации алгоритм поведения, связанного с преобразованиями ситуации среды для достижения цели. Для этого ИС может использовать следующие правила выбора различных алгоритмов функционирования:
^ проводится разработка программного комплекса для моделирования процесса самообучения интеллектуальной системы на примере интеллектуального робота (ИР) в априори неописанной среде. Для моделирования процесса самообучения ИР используется пример следующего содержания. На рабочем участке станка с ЧПУ расположена подставка и стеллаж, на котором лежит заготовка. Роботу необходимо перенести заготовку и вставить ее в рабочий орган станка с ЧПУ. Стеллаж находится на расстоянии а1 = 1 м от ИР и а2 = 5м от станка. Подставка расположена на расстоянии а3 = 0,2 м от станка и а4 = 5м от ИР. Рабочая зона манипулятора ИР задается полусферой радиусом ![]() ![]() Пусть оценивается расстояние от ИР до подставки с помощью термов лингвистической переменной «расстояние» <совсем рядом>, <рядом>, <близко>, <недалеко>,<далеко>. Для термов: ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Структура НСС1, определяющей исходную ситуацию для описанной выше тестовой задачи приводится на рис.1. ![]() Аналитическое описание данной ситуации имеет следующее содержание: {ИР ((((<<0.4/близко>заготовка>) & <0.4/близко>стеллаж>) &<1/далеко>станок>) &<1/далеко>подставка>)} & {станок ((<<0,2/рядом>подставка> & <<1/далеко>стеллаж>)} & {подставка ((<<0.2/рядом>станок>) & <<1/далеко>заготовка>)}, где &- конъюнкция, обозначающая одновременность происходящего события. При аналитическом описании НСС выражение, заключенное в фигурные скобки рассматривается как отдельный фрагмент сети, а имена объектов, с которых начинаются фрагменты, определяются как ключевые понятия фрагментов. Фрагменты НСС, необходимые для описания ПС достаточного для принятия решений, можно сформировать на основе эвристических процедур. Например, первый базовый фрагмент строится относительно ключевой вершины сети, помеченной понятием "ИР". Следующие необходимые фрагменты формируются относительно объектов, входящих в структуру заданного на текущий момент времени целевого условия, но над которыми ИР непосредственных действий не выполняет. Третий тип фрагментов строится в процессе функционирования относительно объектов, используемых ИР в качестве вспомогательных инструментов. В процессе имитации поведения ИР на первом шаге обучения выявлено действие «подойти к стеллажу». После имитации выполнения этого действия среда преобразуется в новую ситуацию, которая описывается с помощью НСС2. (рис.2). ![]() Аналитическое описание данного графа имеет следующее содержание: {ИР ((((<<0.2/рядом>заготовка>) & <<0.2/рядом>стеллаж>) & <<1/далеко>станок>) & <<1/далеко>подставка>)} & {станок ((<<0,2/рядом>подставка> & <<1/далеко>стеллаж>)} & {подставка ((<<0.2/рядом>станок>) & <<1/далеко>заготовка>)}. В целом в процессе самообучения ИР сформировал следующую программу действий: <подойти к стеллажу>, <взять заготовку>, <дойти до подставки>, <положить заготовку на подставку>, В <ИР подходит к станку >. В результате была получена целевая ситуация НСС (рис. 3). Для машинной реализации различных алгоритмов самообучения ИР к программному комплексу имитационного моделирования были сформулированы следующие основные требования: - высокое быстродействие; - удобство в управлении программой. ![]() Программа написана на алгоритмическом языке Visual Studio C++, которая имеет удобный пользовательский интерфейс для создания, компиляции, отладки, выполнения программ и просмотра результатов расчета. Исходными данными являются начальная ситуация, множество пробных действий и результирующая ситуация. Данные представляются в виде таблицы массивов ситуаций и действий ИР. Программный комплекс состоит из следующих модулей-подпрограмм. К ним относятся: головная программа modellingDlg.h, которая имитирует поведение ИР на нечетких семантических сетях в средах первого и второго уровня сложности; resultDlg.h- модуль описания окна результатов; modellingDlg.cpp – подпрограмма описания исходных и результирующих данных; ResultDlg.cpp – подпрограмма вывода ПЦП; CResultDlg::ActiveAlgorithm – подпрограмма моделирования алгоритма самообучения с активной логикой поведения; CResultDlg::ActivePasiveAlgorithm – подпрограмма моделирования алгоритма самообучения с активно- пассивной логикой; CResultDlg::StopAlgorithm – подпрограмма моделирования алгоритма самообучения при наличии в ПС тормозного сигнала; CResultDlg::Summ1Algorithm - подпрограмма моделирования алгоритма самообучения при наличии в статической среде суммарных сигналов; CResultDlg::Summ2Algorithm - подпрограмма моделирования алгоритма самообучения при наличии в динамической среде суммарных сигналов; CResultDlg::SledstvieAlgorithm - подпрограмма моделирования алгоритма самообучения при наличии в ПС причинно-следственной связи. Результаты имитации выводятся в формате html-файлов, импортируемых в таблицы результатов матрицы смежности НСС, определяющей текущее состояние ПС на данный момент времени в результате имитации отработки выбранного действия. Программа выполняет имитацию отработки действий в выбранной проблемной среде для моделирования поведения интеллектуального робота в средах первого и второго уровня сложности. ^ сформулированы основные выводы по диссертационной работе в целом. В приложении приведены:
^ При проведении исследований получены следующие основные результаты, позволяющие как в совокупности, так и в отдельности, повысить эффективность самообучения ИС в априори неописанных условиях ПС:
^
![]() Формат 60х84.1/16. Печать ризографная. Бумага №1. Гарнитура Таймс. Усл.п.л. – 1,5 изд. п.л. – 1,5. Заказ № 398-04 Тираж – 100 экз. Отпечатано в издательстве «Полиграфист» М ахачкала, ул. Акушинского, 7
|