Изобретание, проектирование, разработка и сопровождение) Том Интеллектуальные системы (Системы решения проблем)  Альберт Александрович Красилов icon

Изобретание, проектирование, разработка и сопровождение) Том Интеллектуальные системы (Системы решения проблем)  Альберт Александрович Красилов


1 чел. помогло.
Смотрите также:
Изобретание, проектирование...
Изобретание, проектирование...
Изобретание, проектирование...
Изобретание, проектирование...
Том Интеллектуальные системы (Системы решения проблем)  Альберт Александрович Красилов...
Том Интеллектуальные системы (Системы решения проблем)  Альберт Александрович Красилов...
Лекция: Этапы проектирования ис с применением uml: Основные типы uml-диаграмм...
Программа дисциплины интеллектуальные информационные системы индекс дисциплины по учебному плану...
Рабочая программа учебной дисциплины (модуля) Интеллектуальные системы принятия проектных...
Интеллект человека и искусственный интеллект...
Программа: Iдень...
Предмет и метод курса "Проектирование информационных систем"...



Загрузка...
страницы: 1   2   3   4   5   6   7   8   9   ...   32
вернуться в начало
скачать

^ Критерий соразмерности. Соразмерность понятий - это эквивалентность объемов понятий определяемого и определяющего. Этот критерий обеспечивает успех в понимании определения понятия.


^ Критерий объемности. Объемность понятия (количество значений) может противоречить другим критериям, но тем не менее она обеспечивает максимальное понимание понятия, не оставляющее места для неправильного толкования определения и определяемого понятия. Этот критерий подразумевает балансирование количества и качества.


^ Критерий неотрицательности. Неотрицательность (положительность) определения понятия (исключение использования «не» и др.) является важным критерием, поскольку общее количество признаков несчетно, а используемых в определении признаков конечное число. Отрицательными суждениями не описать всего многообразия того, что не присуще определению. Это ограничение не означает того, что некоторое суждение, входящее в определение, не должно быть логически отрицательным. Отрицательные логические суждения в определениях допустимы.


^ Критерий относительности. Общая относительность определения понятия не является критерием отбора понятий, но является лишь предупреждением о наличии самого факта относительности. Относительные определения предполагают наличие других определений. Даже при перечислениях, например констант, каждая часть перечисления, так или иначе, определяется. Некоторые определения известны человеку (или машине), они создают контекст нового определения (которое, возможно, задано перечислением). Замкнутость (абсолютная) системы определений понятий также относительна. Некоторыми определениями необходимо пренебречь, иначе система становится по размерам бесконечной. В таком пренебрежении усматривается метод абстрагирования. Абсолютного понятия не бывает тем более, поскольку каждое понятие живет и развивается.


Многокритериальность является опасным и сложным делом в силу возможной несогласованности отдельных критериев. Применение многих критериев решается в конкретных случаях конкретно. На этот счет трудно сформулировать четкие правила. Однако необходимо иметь в виде все критерии в качестве контролирующего средства при построении терминологии или терминологических словарей.


^ 5.2. Теория имени и значения, наименование понятия


Несмотря на то, что имя и значение были объектом для исследований в далекие и не в столь далекие времена (например, см. у Фреге), теория имени и значения является вполне открытой областью в науке. Дальнейшие рассмотрения, представленные здесь, предназначены для того, чтобы вызвать некоторый интерес к информатическим исследованиям подобного рода. Научных проблем здесь значительно больше, нежели практических результатов, которые частично решаются интуитивными методами в программировании и информатике.


^ 5.2.1. Имена и значения. Начнем с рассмотрения понятия имени. Имя - сорт выражения, который используется для обозначения чего-либо при общении или передаче информации в любой системе. Имена подразделяются на собственные и несобственные имена. Собственные имена - это константы, им предписано значение, которое они обозначают. Ими являются лексемы. Несобственные имена – это, вообще говоря, переменные величины, им в данный момент предписано текущее значение, которое может со временем изменяться или заменяться. Ими являются все термины. Конечно, здесь использовано информатическое определение имени, оно отличается от определения в СиГ ЕЯ. Для наших целей этого вполне достаточно. Теория имени должна рассматривать общие представления понятия имени.


Все должно быть поименовано, иначе не будет эффективного общения, так как имя передает сущность мысли или вызывает ассоциацию с некоторым объектом. Любопытный пример рассматривают обычно в связи с проблемой именования. <предмет без имени> - это уже имя предмета, который еще не поименован, но уже имеет имя. Так можно охарактеризовать базовую проблему общения.


Имена в соответствии с СиГ бывают также собственные и несобственные. Собственное имя присваивается живому существу. Однако возникают собственные имена для части неживой природы. Для Интеллсист несущественно то, что обозначается собственным именем. Если некоторое имя является собственным (по СиГ), то оно может быть в информатике собственным и несобственным, в зависимости от его роли. Если оно используется в качестве значения, то оно является информатически собственным. Если оно используется в качестве термина, принимающего значения, то оно становится несобственным. Поэтому СеГ (в отличие от СиГ) не содержит никаких правил для формирования и применения собственных имен, кроме правил для констант. В СеГ важно то, что каждое понятие должно обладать именем и значением.


Имя обозначает понятие и представляется термином. Имя становится термином, когда оно привязано к понятию, которое уже определено и имеет характеристики. Терминами снабжаются предметы, явления, процессы, свойства, отношения, действия и т.п. Можно также говорить о том, что имя является ссылкой на такие объекты.


Необычность имени в информатике состоит в следующем. Имя представляется термином, а термин состоит из слов, знаков, чисел или строк, а также из последовательности этих объектов (от одного до некоторого числа), и имеет в наличии характеристику, определяющую свойства понятия. Указанные условие, требование или квалификация имени являются расширением известного из ЕЯ понятия имени и его значения.


Термин - это представление имени понятия, имеющего смысл или, по крайней мере, множество смыслов, которые могут быть предписаны понятию. Имя обозначает только один или совокупность предметов, явлений, процессов, свойств, отношений или действий. Термины ориентированы на поддержку некоторых принципов. Среди них имеются следующие принципы:

  • принцип однозначности, термин не может принимать одновременно более одного значения;

  • принцип предметности, термин обязательно обозначает понятие о предмете, явлении или процессе, предмет имеет смысл;

  • принцип значности, имя не имеет своего собственного смысла, если оно является термином, кроме собственных имен, и оно имеет свой собственный смысл, если в качестве термина рассматривается значение (лексема);

  • принцип общности, термин может принимать значения (образовывать факт) из некоторого множества значений (его типа), хотя бы одно значение имеется в этом множестве (значение может быть пустым, но имеющим имя);

  • принцип отражения знания, термин всегда выступает в паре имя + значение по определению понятия и термин + лексема по реализации понятия;

  • принцип связности, термин понятия становится определенным только в контексте с другими терминами;

  • принцип идентификации, термин должен быть всегда однозначно определенным в цепи терминов для идентификации используемого термина;

  • принцип структурности, структурные термины состоят из последовательности простых терминов, соединенных операциями-связками;

  • принцип абстрактности, термин может оставаться неопределенным своим текущим значением до производства логического вывода решения логического уравнения, используя весь контекст или его часть применения термина;

  • принцип содержательности, каждый термин понятия должен определяться для придания понятию содержания;

  • принцип существования, термин берется из текстов БЗ или запросов, он может составляться человеком, он может порождаться в процессах логического вывода или синтеза программы.


Остановимся на определении понятия значения. Значение - это внутреннее содержание понятия в одной из возможных форм. Такое определение также является информатическим. Значение любого объекта для человека скрыто (оно может быть описано или напечатано). Тем не менее, для более точного понимания понятия значения необходимо рассмотреть соотношения между именем и значением. Кроме этого имя и значение необходимо рассмотреть в соотношении с понятиями смысл и вещь или объект.


Соотношение имени и значения определяется следующими двумя положениями: имя обладает значением и имя ссылается на значение. Это всегда так и подтверждается в информатике повсеместно. Для подтверждения можно посмотреть на конструкции любого языка программирования и язык Лейбниц. Будем считать, что такого описания соотношения достаточно для быстрого понимания. Это соотношение важно для понимания того, что по имени понятия можно в любой момент рассмотреть его значение путем печати или показа на экране дисплея. Пара имя-значение, представляющая элементарное знание или факт, является примером использования соотношения.


Имеется одно соотношение для значения и имени, оно выражается так: Каждое значение именуется. Имя является как бы внешним представителем значения. Собственное имя (или лексема) явно представляет значение, а несобственное имя (термин) - неявно, по ссылке. Это соотношение также подтверждается в информатике, оно обеспечивает возможность приписывания значения некоторому понятию. Запись фактов является примером для этого соотношения.


Имеется несколько соотношений имя и имя. Их представителями являются:

  • имя может быть частью другого имени (например, составное или расширенное имя),

  • имя может составляться из других имен, имя может индексироваться (и быть связанным с именем индекса),

  • имя может строиться рекурсивно или может определяться через прямую или косвенную ссылку на это же имя,

  • имя может быть именем значения другого имени (например, факт «имя=Иван»).

В различных языках программирования имеются и другие соотношения имени и имени, совпадающими с одним или двумя из указанных соотношений. Имеется достаточное число конкретных соотношений имени и имени.


Имеется несколько соотношений значения и значения. Их могут представить следующие факты:

  • значение может состоять из частей, которые могут быть значениями (каждое число состоит из цифр, являющихся значениями),

  • одно значение может быть эквивалентно другому значению (в особенности при кодировании разных значений),

  • значения могут быть упорядочены по некоторым признакам или относительно некоторой операции (все дискретные типы данных),

  • некоторая композиция значений может образовывать вновь значение структурного понятия (агрегаты: вектор, матрица, множество или конкретная запись).

Таковы некоторые соотношения, используемые в языках программирования и в представлении знаний.


Для теории имени и значения важны также соотношения имени и смысла, имени и объекта, смысла и объекта, смысла и значения. Здесь только обращается общее внимание на такие соотношения, их подробное рассмотрение обычно остается в стороне, в теории имени и значения, но они используются при построении языков данных и знаний. Для того чтобы подчеркнуть важность таких соотношений, рассмотрим их примеры. Имя, как обычно, выражает смысл или имеет данный смысл - это одно примерное соотношение. Смысл определяет денотат или является концептом этого денотата [Клини73,Фреге77] - это второе примерное соотношение. Объект - это предмет имени, денотат, что задает третье примерное соотношение.


Относительно имени можно высказать некоторые законы. Одним из представителей группы законов является следующее высказывание: каждое имя в информатике должно иметь только один текущий смысл, определяемый этим именем или контекстом его использования. В ЕЯ имя может иметь большое число смыслов. Это же встречается и в текстах программ. Такие ситуации требуют в текстах ЕЯ длинного или протяженного контекста. Для упрощения проблемы общения с ВМ обычно применяется закон, высказанный выше об одном смысле для каждого имени. Если некоторый ФЯ допускает несколько смыслов для одного имени, то смысл его распознается по краткому контексту. Такие правила обычно оговариваются в описаниях ФЯ. Теория имени и значения вводит еще некоторые понятия, связанные с именем, понятием, термином или смыслом. Часто, например, вводится или рассматривается понятие косвенного имени, ссылки (имя имени). Это понятие распространено в методах программирования. Их использование эффективно для передачи информации об объектах. Итак, кратко рассмотрены основные понятия теории имени и значения. Необходимость такой теории очевидна и она призвана решить огромный ряд проблем корректности представления знаний в памяти ВМ, эффективности объектно-ориентированного и модульного программирования знаний, экономичности алгоритмов обработки сложных структур данных и программ.


Убеждение состоит в том, что изложенное понимание представления понятий удовлетворяет требованиям ввода в Интеллсист любых сведений для разрешения запросов пользователя. Для установления точного и надежного общения пользователя с Интеллсист необходимо задать для системы определение понятия. Определение вводятся в двух видах. Первый вид в форме комментария - текста ЕЯ, который предназначен для пользователя и вызывается по клавише F1 для напоминания о человеческой сущности понятия. Второй вид в форме информации о характеристиках, запрашиваемых окнами меню и предназначенных для работы МЛВ и МАВ. Определение понятия представляется логическим выражением, раскрывающим форму и содержание понятия. По форме понятие полностью определяется своим термином или его синонимом. По содержанию понятие определяется своими характеристиками. Форма и содержание понятия задается в обоих видах его определения.


Главная задача определения понятия состоит в построении отличительных признаков данного объекта по сравнению с другими понятиями других объектов. Признаки не могут быть полными (нельзя объять необъятное), но они должны быть такими, чтобы можно было указать различие данного и других понятий, тем самым обслужить конкретную область знания. Термин понятия упоминается в текстах знаний или запросов, по крайней мере, дважды: первый раз - это определяющее упоминание (описание термина при его определении), второй раз и все последующие упоминания - это использующее упоминание (вхождение термина в логические выражения из знаний или запросов). Заметим, что отличительным признаком может быть сам термин. Два различных термина могут иметь совершенно одинаковые остальные характеристики. В описании такие термины задаются списком с одним и тем же типом и даже с одинаковыми определениями для человека.


^ 5.2.2. Наименование понятия. Определения термина связаны с многообразием конкретных его характеристик и связей с другими терминами. Два вида определения понятия (для человека и для Интеллсист) дополняются третьим видом - логической связью данного понятия с другими понятиями. Именно логические связи терминов доопределяют каждый термин, участвующий в связи, более точно, это чаще всего оказывается весомее автономного определения термина (понятия). Если первых два вида определения понятия только очерчивают его границы или указывают факты этого понятия, то третий вид определения составляет основу знаний, используемых для разрешения запросов пользователя.


Также разнообразны структуры самих определений. Структура определения понятия разрешает задачу раскрытия его содержания и смысла понятия. Важно отметить, что любая структура определения состоит из логических связей определяемого понятия с уже определенными понятиями (требование ясности определения). Только через определенные понятия можно определить новое понятие. Все определения можно расклассифицировать по структуре на явные и неявные определения. Явные определения состоят из описаний отношений между определяемым понятием, с одной стороны, и логическими связями между определяющими понятиями, с другой стороны. Явными определениями являются описательные (путем показа) и интенсиональные определения. Неявные определения понятия - это такие определения, в которых описываются определенные отношения между уже определенными понятиями, используемыми в некотором контексте определенных понятий. К неявным определениям относятся остальные определения: контекстные, концептуальные, аксиоматические, операциональные (генетические) и индуктивные. Некоторые из перечисленных структур неявных определений могут быть представлены как явные.


Говорят, что об определениях никогда или почти никогда не спорят. Это подтверждается тем обстоятельством, что как бы не определялось понятие, его определение годится для пополнения БЗ, если оно не противоречит другим понятиям. Более того, можно высказать такую «смелую» мысль: определение любого понятия можно представить в любом оформлении и любым способом, но так, чтобы полнота знаний не понесла ущерба от неполноты определений. Однако никоим образом нельзя допускать глобального противоречия между определениями, в то время как локальное противоречие является допустимым. Определение одного понятия может корректироваться определением другого понятия.


Можно выделять сорта понятий и соответствующих им определения. Сортами понятий являются: собирательные, единичные, конкретные, общие, абстрактные, деятельные и синтезированные сорта. Эти наименования сортов понятий говорят сами за себя, они соответствуют видам знаний в информатике. Причем надо отметить, что обычно не допускается определение понятия через само себя или другое понятие, которое определяется через него. Кажущийся порочный круг разрывается путем применения и использование в определении частных случаев значений определяемого понятия или только ссылок на определяемое понятие. Это напоминает использование рекурсии, для которой указана отправная точка начала рекурсии. Например, правильным будет понятие умножение, которое можно определить через умножение и сложение так, чтобы частные случаи умножения на 0 или 1 также входили в определение вместе с правилами перехода к следующим числам. Другой правильный пример. Для определения термина «список» используется запись с полями: значение элемента списка и ссылка на то же понятие списка.


Определения понятий можно конструировать, а в соответствии со способом конструирования классифицировать их следующим образом. Определение можно строить через отношение (как логический прием), которое указывает на соотношение данного понятия с другими понятиями. Определение можно строить через противоположности данного понятия с другими понятиями. Определение можно строить через абстракцию как равенство, в котором устанавливается отношение для свойств определяемого и изучаемого множества. Примеры будут приведены в тексте.


Классическими методами построения определений являются два следующих в некотором смысле полярных метода. Первый базируется на том, что определение опирается на более общее понятие и его определение, а в самом определении указывается те ограничения, которые характеризуют определяемое понятие. Второй метод базируется на том, что определение понятия конструируется на основе перечисления частных значений определяемой вещи. Такие два общих метода и используются обычно, несмотря на то, что имеется большое число других (промежуточных относительно указанных) методов построения определений. Указанные два метода являются фундаментальными и основополагающими.


Следует вспомнить, что на точность системы определений и терминологии вообще влияет их классификация, она важна в любой области знаний. Определение определения не может представить полную характеристику этого понятия, поэтому необходимо воспользоваться классификацией определений как дополнительной информацией об этом понятии. Такое положение (определение определения) в равной мере относится и к другим определениям других понятий.


Естественным образом каждое понятие имеет свое наименование, которое формируется из символов (не обязательно графического типа). В ЕЯ наименование понятия составляется из букв национального алфавита (или в отдельности из знаков). Наименование - это слово или совокупность слов ЕЯ (или отдельный знак). Понятию соответствует наименование термина. В ЯПП наименования могут формироваться из слов, лексем и других знаков. Например, в языках программирования наименованием понятия является идентификатор, состоящий из букв, цифр и, возможно, из некоторых других символов. В химическом языке понятие может приобретать формы химических формул.


Важный вопрос при построении нового понятия заключается в выборе или построении нового наименования понятия, его термина. Проблемы построения термина изучены достаточно широко в машинной лингвистике. Поэтому не уделяется дополнительного внимания раскрытию смысла, форм, методов построения термина. Нам необходимо иметь в виду, что машинный анализ терминов выдвигает ряд требований к способам формирования самих терминов. Словосочетание, формирующее термин, должно состоять из слов, не совпадающих со словами других грамматических категорий. Например, идентификатор операнда не должен совпадать с идентификатором операции. Терманды формируются из наименований предметов, а термации - из наименований действий. В информатике допускается смешение наименований. Термандом может быть глагол, а термацией - наименование предмета.


В соответствии с правилами СеГ наименование понятия (термин) строится из слов, лексем и знаков. Одно слово или один знак могут представлять понятие. Например, «раздел запроса» - термин понятия, используемый в качестве заголовка последовательности утверждений, составляющих задачу для Интеллсист и требующих ответа. «+» - знак операции сложения различных типов данных и величин таких типов. Два слова могут представить понятие. «для каждого» - это термин операции проверки последовательности утверждений на истинность относительно набора значений величины, которая помещается вслед за этим термином. Два знака могут представить понятие. => - это обозначение понятия следовать в логических выражениях. Более двух слов, двух знаков или композиции слов и знаков также могут представить понятие. «А + В» - обозначение понятие, которое необходимо исследовать по каким-либо признакам. Практика описания знаний в каждой области знаний или в каждой профессии всегда опирается на установившийся лексикон из терминов, наименований понятий. Поэтому и не возникает сложных проблем с методами или способами построения наименований. Проблемы не возникают еще в силу того, что термины чаще всего черпаются из ЕЯ.


Имеются только две главные проблемы относительно выбора наименований. Одна проблема возникает при обозначении двух различных понятий одинаковыми терминами. Коллизии такого сорта либо обнаруживаются автоматически при анализе текстов знаний или запросов самой Интеллсист, либо разрешаются в результате сравнения профилей, они должны быть различными для одинаковых наименований. Окончательное решение о переименовании одного из понятий за пользователем или знаниеведом. Другая проблема возникает при обозначении понятия несколькими терминами. Разрешение проблемы является простым делом. Один термин выбирается ведущим или идентификатором, а остальные синонимами этого термина. Может оказаться так, что некоторый термин не является синонимом, тогда его необходимо описать как новый термин другого понятия. Так или иначе, но Интеллсист в большинстве случаев эти проблемы разрешает автоматически по подсказке пользователя.


^ 5.3. Структура определения


С формальной точки зрения каждое определение формализуется логическим выражением, которое считается истинным. Такие выражения называются прикладными аксиомами (отличными от аксиом классической, неклассической или формальной логик). Форма аксиом может быть произвольной и зависит от используемых логических операций, арности логики и принятых стандартных обозначений (терминов) для понятий. Например, некоторое определение может быть представлено в форме равенства А = Ф(..В..), что представляет также логическое выражение, прикладную аксиому. С формальной точки зрения этим о структуре определения все сказано. Возможны бесконечные интерпретации (выражения) указанного формализма. Чаще всего интерпретация использует ЕЯ или некоторый ФЯ. Примеры этому будут рассмотрены в дальнейшем. А пока ограничимся только такими заметками относительно структуры определения.


Если принять данный тезис о структуре определения, то ясными становятся некоторые проблемы концептуальной информатики. Для обучения машины понятиям необходимо иметь подходящий формальный логический язык предикатов и транслятор ЕЯ или ЯПП на выбранный ФЯ. Проблема построения новых понятий также может быть автоматизирована путем формирования логических выражений и применения транслятора ФЯ на ЕЯ или ЯПП. Во втором случае точнее будет сказать: не создание транслятора, а создание синтезатора фраз ЕЯ. Интеллсист выполняет работу по созданию или уточнению понятий. Результат ее работы - это альтернативы совместных уточнений определений.


Структура определения зависит от контекста его нахождения, от конструкции самого определения, от характеристик определяемого объекта, от языка описания определения, от параметров-характеристик определяемого объекта и др. Основные структуры зафиксированы в языке Лейбниц, они располагаются в разделах, в которых определяются новый термин предмета или действия. Если термин подразумевается и явно не дается, то его определение составляется по произвольной структуре в виде последовательностей фраз или утверждений (или таблиц).


В информатике важно указать на допустимые структуры определений, что сделано в языке Лейбниц. Они существенно зависят от множества допустимых значений определяемого понятия, от начального значения. Все структуры определений формально и точно определены в ЯПП. Записи таких определений воспринимаются и используются в формулировках знаний и запросов для Интеллсист. Каждый ФЯ полностью определяет понятия, которые участвуют в решениях задач.


Обобщенная структура определения внутри Интеллсист включает следующие компоненты: специально выделенный новый термин, возможное определение для пользователей, тип понятия (множество допустимых его значений) и возможное начальное значение. Структура определения универсальна в том смысле, что каждый новый термин определяется только по указанной схеме. В этом можно убедиться после анализа ФЯ Лейбниц.


^ 5.4. Теория и классы определений


В концептуальной информатике, как и в любой другой научной дисциплине, имеется два подхода к исследованию, в частности, теории определений: теоретический и практический. Некоторые практические результаты концептуальной информатики описаны, например в [Тыугу84], на уровне известного понятия концептуального программирования. Теоретические результаты в настоящее время отсутствуют или находятся в начальной стадии исследования. Предлагается схема для построения теории определений понятий. Она вытекает естественным образом из логики информатики и правил СеГ. Также предлагается схема для построения практической концептуальной информатики средствами языка Лейбниц. Теория определений еще не сформировалась в конечном виде, поэтому она рассматривается на описательном уровне. Прагматика определений базируется на интуиции исследователя, реализации программ и на критериях отбора определений. Таковы две проблемы для их рассмотрения в данной главе.


В соответствии с ИЛ (т. 5) определение представляет собой совокупность аксиом некоторого сорта, из которых должны вытекать все свойства определяемого объекта и контекста его применения. Поэтому теория определений опирается на исчисление ИЛ в части, касающейся определяемого объекта. Главными проблемами теории являются поиск и разрешение противоречий как внутри определения, так и в контексте с другими объектами, определение независимости прикладных аксиом между собой и с другими аксиомами и полнота определений. Таким образом, для теории определений важны проблемы экологической чистоты самих определений.


Что касается проблемы прагматики концептуальной информатики, то здесь можно сказать о накопленном богатом практическом опыте по отбору понятий и их определений с помощью критериев качества. Некоторые из них рассматриваются в данной главе. Кроме этого, имеющийся материал позволяет выдвинуть ряд проблем, которые могут заинтересовать исследователя и стимулировать его подвиги в построении формализма теории определений. Итак, некоторые основы теории определений можно обнаружить при чтении этой главы. В ней даются классы определений для понятий, используемых в записях знаний и запросов.


^ 5.5. Классы определений


Существует значительное число типов определений понятий. Некоторый набор определений был кратко рассмотрен выше (см. 3.4). Здесь рассматриваются семь классов, которые выдерживают принятую в теории познания идею от знака до системы. Классификация может подвергаться любой критике, способствующей развитию теории определений. Более того, отметим, что в соответствии с законами информатики все определения имеют одинаковый эффект по точности передачи смысла понятия. Каждое понятие можно определить каждым из семи способов, все определения по смыслу будут идентичными. Рассмотрим их последовательно.


^ 5.5.1. Описательное определение


Самым простым и распространенным определением понятия является описательное определение. Его именуют еще и экстенсиональным. Такие определения содержатся почти во всех естественнонаучных дисциплинах. Обычно для создания описательных определений используются тексты ЕЯ. В последнее время в связи с проникновением информатики в естественные науки начинается использование формальных различных средств и методов представления знаний таких наук. Каждая наука использует более всего не ЕЯ, а язык профессии. Постепенно ЯПП обогащается формальными средствами. Знание и изучение средств ЯПП важно для интенсификации проникновения информатики в конкретную науку. Для полной формализации сообщений на языке профессии (на ЯПП) необходима системная программа, именуемая транслятором ЯПП на ФЯ.


Построение транслятора ЯПП способствует передачи описательных определений в разряд аксиоматических и формальному анализу этого сорта знаний. Описательное определение не имеет фиксированной структуры (скорее всего оно является бесструктурным), а точнее сказать, оно может принимать виды всех структур по правилам СеГ. С точки зрения машинного анализа описательные определения являются самыми сложными. Можно указать на многие примеры, имеющиеся в данном тексте, которые представляют собой описательные определения. Данное здесь определение описательного определения является также описательным. Большое число понятий информатики описательно определено в Приложении 1.


Рассмотрим кратко пример описательного определения с ответом на вопрос: что можно отнести к понятию информатики? Прежде всего, к информатике относятся вопросы применения ВМ, которое связано в современных условиях с различными видами, методами и приемами программирования. Применение ВМ осуществляется в результате взаимодействия человека с ВМ. Система человек-ВМ призвана автоматизировать вычисления с числами, текстами, массивами, записями, программами и знаниями, представленными в форме фреймов, семантических сетей и формул. Тексты обычно содержат знания и запросы на решение задач, которые также могут обрабатываться на ВМ. Вычисления задаются машине в виде, например, последовательности операторов над данными. Интеллсист является программой обработки знаний и запросов. Автоматизация базируется на методах обработки информации (или сообщений), применение которых подразумевает преобразование исходных данных в выходные данные. Этот процесс преобразования представляет собой модель части реального мира, которая также вводится в систему человек-ВМ на некотором декларативном, алгоритмическом или другом языке. Если под понятие знание отнести тексты, числа, массивы и записи, то работа Интеллсист сводится к обработке знаний, а это самая важная работа для человека. Вся описанная деятельность составляет сущность информатической работы по преобразованию информации, представляющей наши знания, для получения нового знания. Все это определяет информатику.


Так выглядит описательное определение информатики. Оно используется чаще других определений, если рассмотреть полный набор наук. Формализации такие определения поддаются в том случае, когда они представлены на СеГ конкретного ЕЯ.


^ 5.5.2. Контекстное определение


Вторым сортом определения является контекстное определение. Оно существенно отличается от описательного определения. Знания, представленные текстами, выражениями и таблицами, используют именно контекстные определения. Поток сведений конкретной области знания состоит из определений различных величин и операций с указанием связей между ними. Каждый абзац текста представляет законченную мысль (содержательно) и связи величин и операций, которые и являются контекстным определением величины, операции или величин и операций через связь их с известными величинами и операциями. Для простоты под контекстом будем понимать весь текст, в котором используется понятие через вхождение термина независимо от того, как входит термин, он определяется или используется в тексте.


Итак, контекстное определение включает связи с другими известными понятиями, а определяемое понятие дается в контексте этих известных понятий. Предмет, явление или процесс становятся определенными, если их понятия использованы в связи с некоторым набором известных понятий через использования их терминов. Контекстное определение - это такое определение, которое строится на основе знания связи определяемого понятия с контекстом, в котором оно употребляется. Контекстное определение раскрывает содержание и сущность понятия путем указания его связей с другими понятиями. Причем всегда имеются трудности в точном указании того понятия, которое в данном тексте определяется, поскольку другой текст, где возможно определяется другое понятие с помощью контекстного определения. В другом тексте уже определенное понятие также доопределяется и может быть даже наравне с определяемым понятием. Контекстное определение понятия может быть дано на протяжении всего текста, а не отдельного абзаца.


Контекст по своему существу определяет некоторый (возможно частичный, как в результатах работы Интеллсист) смысл понятия. Контекстное определение можно именовать смысловым определением. Такие определения имеют широкое распространение в практике фиксации знания. Например, первая фраза этого раздела представляет собой контекстное определение. Вторая фраза этого абзаца есть остенсиональное определение. Совокупность всех абзацев данного раздела есть контекстное определение контекстного определения. Это же можно распространить на весьма многие понятия. Может создаться впечатление, что почти все определения понятий являются контекстными, если понятие используется.


Синонимами контекстного определения являются взаимосвязанные определения, семантические определения и некоторые другие аналогичные определения. Контекстные определения образуют кластер, в котором находятся все синонимические наименования определений. Их можно классифицировать по некоторому родовому признаку.


Чаще всего в литературе не выделяются формальные определения вещей или их свойств. Однако читателю всегда ясны используемые понятия в силу того обстоятельства, что эти определения черпаются из всего текста, по контексту. Нашим примером контекстного определения является определение понятия ПРОГРАММИРОВАНИЕ. Его невозможно определить одной или несколькими фразами, только контекст может дать представление о программировании. В таком же положении находится определение понятия информатики, несмотря на то, что имеется и точное краткое определение этого понятия: во-первых, определение одного и того же понятия может быть представлено любым сортом определения; во-вторых, весь текст под названием «Информатика» посвящен определению информатики.


Контекстные определения почти всегда являются неполными. И действительно, для К понятий можно рассматривать К! (факториал) связей. Чтобы полностью определить понятие, необходимо задать тексты в объеме К!. Практически реализовать это бывает чрезвычайно трудно. С другой стороны, для решения задачи некоторые связи не нужны. Заметим, что ненужных связей по количеству оценивается числом почти равным К!. Именно поэтому большинство практически полезных задач все же решаются точно или приближенно. Когда же некоторая связь отсутствует, то задача не поддается быстрому решению или вообще она считается неразрешимой. Из-за отсутствия знаний относительно связей операций сложения и возведения в степень трудной оказалась историческая проблема Ферма о целочисленных решениях уравнения X**n + Y**n = Z**n относительно X, Y и Z при n>2.


Интеллсист «чувствует» недостаток контекстных определений. Если в результате логического вывода ответа на запрос не получены альтернативы совместных фактов, то до построения программы Интеллсист сформулирует явные или косвенные вопросы относительно определения некоторых операций или связей набора операций. При получении ответов на вопросы знания будут пополнены для решения данной задачи, они могут оказаться достаточными для получения альтернативы совместных фактов.


^ 5.5.3. Остенсиональное определение


Самым простым определением понятия является остенсиональное определение, состоящее из явного перечисления составляющих понятие терминов предметов, явлений или процессов. Такие определения содержат весь объем понятия и являются вербальными или словесными. Простейшим примером остенсионального определения является определение метапонятия в языке Лейбниц. Оно состоит из перечня терминов понятий, который и определяет метапонятие. Имеется несколько сортов конструкций простых определений. Наиболее распространенными являются следующие сорта (кластер остенсиональных определений).


^ Первый сорт - это определение через класс объектов, указанных в самом определении (определение метапонятия). При этом необходимо помнить, что рекурсивное определение не допустимо, а точнее сказать, если определение содержит рекурсию, то оно не является остенсиональным. В перечислении объектов нельзя употреблять непосредственно сам определяемый объект. В качестве примера можно дать определение сортов определений. Имеется семь сортов определений: описательное (экстенсиональное), контекстное, концептуальное (остенсиональное), интенсиональное, аксиоматическое, операциональное, индуктивное, а другие типы определений являются вариантами или синонимами указанных.


^ Второй сорт - это определение через образцы, по которым можно восстановить полный объем понятия. Например, в определении N из-за невозможности явного перечисления всех целых чисел натуральный ряд определяется по образцам целых чисел, составляющих начало натурального ряда. N = 1, 2, 3,.. Предполагается, что такие определения «достраиваются» автоматически по образцам. И опять, рекурсивные определения в данном случае являются недопустимыми.


^ Третий сорт - это определение, построенное на основе имеющегося определения с добавлением новых значений понятия или отдельных образцов объектов. Например, определение понятия словаря можно дать через перечисление всех видов словарей. Интеллсист содержит в БЗ словари из слов, терминов, строк, комментариев и чисел. Определение фактической части БЗ для пользователя можно ограничить таким перечислением словарей. Рекурсивные определения такого типа также является недопустимым.


^ Четвертый сорт - это определение, включающее перечисление всех значений термина. В качестве примера возьмем определение понятия цвет радуги. Цвет радуги - это красный, оранжевый, желтый, зеленый, голубой, синий и фиолетовый цвета. Как обычно, рекурсия недопустима.


^ Пятый сорт - это определение (остенсиональное) по непосредственному указанию на сами предметы, явления или процессы, которые обозначаются определяемым термином. Например, Интеллсист можно определить как программный комплекс, состоящий из программ интерфейса (меню), транслятора смешанных вычислений, МЛВ, МАВ и синтезатора программ.


Каждый сорт остенсионального определения отличается незавершенностью, поскольку в них не содержатся связи с другими понятиями (кроме тех, которые включены в определение) или операциями, которые в остенсиональном определении вообще отсутствуют. Определение набора операций состоит из имен операций. Остенсиональное определение связывает понятие только с вещами, термины которых явно указаны в определении. Для конкретных нужд остенсиональное определение является достаточным, в то время как для других проблем оно не годится для успешного их разрешения.


Имеется одно общее замечание. Многие определения трудно отнести к тому или иному сорту или даже классу, поскольку они несут оттенок свойств от всех сортов и классов определений, они являются смешанными.


^ 5.5.4. Интенсиональное определение


Интенсиональное определение характеризуется следующими атрибутами. Оно должно содержать:

  • описание свойств, характеристик предмета, явления или процесса, выделяющих определяемое в сравнении с другими предметами, явлениями или процессами соответственно;

  • пояснение смысла термина указанием правил выделения его среди прочего;

  • указание ближайшего понятия и отличительных признаков по сравнению с другими определениями других понятий.

Таково синтетическое определение понятия интенсионального определения. Понятие - это некоторое семейство подмножеств универсума. Действительно, пусть формально, но это утверждение можно пояснить следующим образом. Признаки, которые позволяют выделять понятие, имеют значения, которые характеризуют данное понятие и принадлежат к некоторому множеству значений, или образуют полное множество значений данного признака. Таких множеств, связанных с данным понятием, несколько, а именно столько, сколько признаков характеризует данное понятие. Они образуют семейство множеств значений признаков.


К интенсиональному виду определений относится реальное определение. Реальное определение - это такое определение, которое отображает существенные признаки, свойства и характеристики предмета, явления или процесса с целью формирования отличий от других предметов, явлений или процессов. Как видно из этого определения главной частью содержания определения является указание на набор существенных отличительных признаков исследуемой вещи. К интенсиональному виду определений относятся собирательное определение и представительное определение. Все они являются сортами или синонимными определениями, друг друга напоминающими и содержательно не отличающимися. Они образуют кластер интенсионального определения понятий. Их формулировка и анализ важны для более полного раскрытия сущности интенсионального определения.


В качестве примера можно сослаться на определение понятия в ЯПП. В разделе 5.3 указана структура определения понятия, которая включает атрибуты интенсионального определения: для каждого понятия указывается в определении термин, характеристики, пояснение смысла (определение для пользователя) и отличия от определений других понятий.


^ 5.5.5. Аксиоматическое определение


Аксиоматические определения являются фундаментальными. Это следует из существа самого понятия, определение которого строится из суждений (логических выражений). В информатике принято, что любое высказывание, содержащее новое знание, является прикладной аксиомой, определяющей величину (или константу), операцию или их комбинации. Эта посылка позволяет определить аксиоматическое определение. Кратко оно определяется так. Аксиоматическим определением называется (конъюнктивная) совокупность утверждений, содержащих определяемое и определяющие понятия в этих утверждениях. При формулировках таких определений на ЕЯ будет возникать определенная трудность, связанная с распознаванием терминов, входящих в утверждения. Использование же ЯПП не будет вызывать трудностей распознавания терминов, но будут трудности формализации, которые могут породить ошибки. Уже упоминалось, что каждое определение можно вполне именовать аксиоматическим определением. Можно выделить критерий для разделения чисто аксиоматических и «неаксиоматических» определений, критерий содержится в определении понятия аксиоматического определения.


Любой ФЯ, включающий метод конструирования определений, вполне определяет и использует аксиоматическое определение. Можно рассмотреть пример метаязыка, определяющего ФЯ программирования, например, в форме Бэкуса-Наура или языка Марков. Любые синтаксические определения так или иначе связаны с введением аксиоматических определений некоторых текстовых конструкций. Классическим примером аксиоматических определений являются также аксиомы ИЛ.


Некоторые формы аксиоматических определений образуют кластер. Например, абстрактное определение, формальное определение, логические исчисления, формальные грамматики - все такие определения относятся к аксиоматическим определениям, они формируют кластеры. Полную классификацию можно построить только в результате всесторонних и глубоких исследований концептуальной информатики совместно со специальными разделами лингвистики. Если к сорту определений подходить не строго, то формулировка определения любого сорта представляет собой аксиому и, следовательно, оно является аксиоматическим. Может быть в силу этих обстоятельств аксиоматические определения именуются фундаментальными.


Однако можно рассматривать аксиоматические определения строго, тогда можно сформулировать критерий выделения из всех сортов определений именно аксиоматические. Таким идеальным критерием является использование всех определяемых понятий в формулировке определения данного понятия. Данная совокупность аксиоматических определений полностью определяет используемые в них понятия. В таком случае говорят о построении исчислений некоторой теории, в состав которого входит данная совокупность аксиоматических определений. Если некоторое исчисление не содержит аксиому, связывающую величины или операции, то оно теоретически будет не полным. С увеличением объема знаний (при построении недостающих аксиом) теория, построенная на базе нового исчисления, может стать классически полной. Это утверждение верно и для определения полноты знаний относительно запросов пользователей.


Практика представления знаний не довольствуется только аксиоматическими определениями, более того, практика стремится избегать использования их в силу большой сложности построения. Пренебрежение аксиоматическими определениями не наносит ущерба для БЗ и запросов пользователя. При этом ввод знаний с помощью других сортов определений может лишь привести к вводу избыточного знания, которые, скорее всего, не будут обнаружены пользователем или знаниеведом.


Аксиоматические определения предназначены главным образом для представления знаний в Интеллсист. Все знания представляются обычно для человека на ЕЯ, который расчленяется на ЯПП путем выделения профессионального лексикона, создания СеГ и подсоединением формальных или формализованных языков. В конечном счете, фразы ЯПП преобразуются транслятором в логические формулы внутреннего языка Лейбниц для формирования БЗ из отдельных аксиом, которые являются аксиомами либо предметной области (для термандов), либо проблемной области (для термаций). Представленные таким образом знания используются для вывода ответов на запросы пользователей по заданной терминологии конкретной области знания.


К аксиоматическим определениям относятся все формальные определения. Записи выражений из формальных определений можно трактовать как аксиомы об операциях, константах и величинах. К настоящему времени построено огромное число формальных методов, которые содержат формальные определения понятий для разнообразных применений. Формализм, являясь абстракцией, обобщением, помогает установить закономерности при изучении вещей различной природы. В деле построения определений многие полезные результаты можно почерпнуть из рассмотрения формальных методов и описаний.


^ 5.5.6. Операциональное определение


Операциональное определение задает правила, которые указывают, что необходимо сделать для построения понятия, что с этим понятием можно сделать или какими операциями можно воспользоваться для синтеза определяемого понятия. Операциональное определение, как и другие классы определений, образуют кластер, в который входят сорта определений, данные ниже.


Алгоритмическое определение (аналогичное данному выше определению) связано с понятиями алгоритма или программы - конкретного предписания о способе получения нового понятия (выраженного результатом выполнения предписания), оперирования с понятием или синтеза его определения. Такие определения ближе других расположены к информатике. Действительно, каждая запись алгоритма или программы может рассматриваться как средство определения некоторого понятия. Например, программа вычисления корней полинома определяет значение корня или ошибки в задании полинома. Алгоритмы или программы - это представление алгоритмического знания, которое определяет новый смысл понятия по значению, получаемому после выполнения или реализации алгоритма или программы.


В кластер операциональнох определений входит и генетическое определение, которое предписывает правила порождения предмета, явления или процесса, указывает на их происхождение в некоторой классификации или систематике. Такие определения подразумевают действия по формированию понятия или его определения. Ближе всех других к операциональному определению находится номинальное определение, которое является предписанием требований, какими должны быть определяемые объекты, только при реализации предписаний можно определить объект. Также близким является дескриптивное определение. Деятельное определение также входит в кластер алгоритмических определений, но оно предполагает больший упор в определении на физические перемещения или преобразования. Аналогичных определений можно построить достаточно много, они будут образовывать подкластер алгоритмических или операциональных определений.


Любой вариант (элемент кластера) алгоритмического определения предполагает выполнение ряда операций следующего сорта:

  • как сделать предмет, явление или процесс, какие действия необходимы для формирования определяемого объекта;

  • как оперировать некоторым исходным материалом и что получится в результате выполнения операций на этом материале для того, чтобы получилась определяемый объект;

  • что делает предмет, явление или процесс и что получается в результате его деятельности, какой объект или какая сущность объекта;

  • что делается с предметом, явлением или процессом после применения операций из некоторого набора при получении определяемого предмета, явления или процесса;

  • способ создания или синтеза предмета, явления или процесса, которые определяются.

Применяемые в розницу или комплексно эти операции должны привести к формированию понятия и его определения.


^ 5.5.7. Индуктивное определение


Индуктивное определение - это такое определение, которое позволяет отталкиваться от некоторых исходных понятий путем применения некоторых логических операций и строить новое определение нового понятия таким образом, что в процессе построения можно использовать данное понятие рекурсивно или ссылочно (явно или неявно). Индуктивные определения являются наиболее сложными, они чаще всего встречаются в ФЯ, например, в языках программирования или представления знаний.


Определение идентификатора в языках программирования рекурсивно и содержит индукцию. Это определение наиболее распространено, на его базе или по аналогии с ним строятся другие определения. Рекурсия используется тогда, когда отпадает необходимость во введении ограничений на размеры предмета построения или реализации понятия. Длина идентификатора не определена заведомо, пока его не построил программист при составлении программы, поэтому определение идентификатора рекурсивно. Практика всегда подсказывает момент остановки рекурсивного процесса определения понятия.


Примеров рекурсивных определений в формализме чрезвычайно много, они являются экономными и эффективными в применениях. Однако, они сложны для построения и использования, так как при этом работает принцип внутреннего умолчания, который затрудняет понимание определения. Рекурсивные определения предполагают раскрытие рекурсии с помощью памяти магазинного типа. Для устного анализа рекурсивных определений возникают сложности запоминания глубинных состояний анализируемого определения.


Важная особенность индуктивного определения заключена в том, что оно обобщает все предыдущие сорта определений. Если рассмотреть некоторый сорт определения и в определяющую часть поместить определяемое понятие, то осуществляется переход к индуктивному определению (включение в определение рекурсии).


Индуктивное определение строится обычно для тех объектов, которые имеют бесконечное число значений определяемого объекта. Например, ФЯ определяют бесконечные словари, хотя практическое использование словарей приводит к словарям с конечным набором слов или терминов. Именно это обстоятельство вынуждает прибегать к индуктивным определениям. Почти любой формализм (а он всегда связан с ФЯ) предполагает использование индуктивных определений понятий.


Следует помнить одно важное ограничение на индуктивные определения: каждое индуктивное определение должно содержать «начальную точку» или частный случай определяемого понятия. Например, слово есть последовательность букв, т.е. слово получается из слова приписыванием к нему еще одной буквы. Процесс приписывания букв бесконечен. По этому определению нельзя определить слово. В этом определении пропущена «начальная точка»: словом является любая буква. Теперь рекурсивное определение становится правильным. Без «начальной точки» определение является неправильным, оно может привести к ошибочным решениям в задачах, использующих неправильное определение.


^ 5.6. Теория определений в алгоритмах


Большое число задач с применением теории определений возникает в прикладных науках и, в частности, внутри самой информатики. Здесь будет представлена задача автоматизации составления словаря из слов, а также терминологического словаря по произвольным текстам на ЕЯ.


Интеллсист содержит словарь из стандартных слов. Новые слова появляются в результате анализа записей знаний или запросов пользователя, в которых определяются новые термины. Словарь пополняется автоматически, он служит лишь кодировочной таблицей для слов. Интеллсист содержит терминологический словарь из стандартных терминов СеГ, в который вводятся новые термины только по указанию пользователя или из БЗ. Терминологический словарь является основой лексикона, в котором собираются все характеристики терминов.


Особое место занимает первичный анализ произвольных текстов, при котором создаются потенциальные словари. Первичные тексты могут быть проанализированы программами «Сборки» одного из разделов меню инструментария. О теоретической части в программах «Сборки» здесь и будет рассказано.


Новый еще не подвергнутый анализу текст можно рассматривать с различных точек зрения. Пользователя текста интересует его смысловой анализ. Оставим в стороне вопросы статистического анализа текста, которым часто интересовалась и интересуется лингвистика, и перейдем к смысловому анализу текста. Выделим ряд особенностей или требований к анализу текстов. Во-первых, если считать, что смысл текстов полностью определяется смыслом составных частей - терминов, то смысловой анализ текстов - это его терминологический анализ. Во-вторых, каждый термин должен входить в текст, по крайней мере, дважды: первое вхождение определяющее, второе - использующее. Не лишено смысла требование трех и более вхождений термина в текст. Многократные вхождения термина подчеркивают его важность. В третьих, в «незнакомом» тексте состав терминов неизвестен, он может состоять из слов, знаков, чисел и других компонентов. Задание требований о составе терминов может быть бессмысленным. В четвертых, число составных частей термина также считается неизвестным, поэтому невозможно выставить требование на размер термина. Наконец, в пятых, исходные тексты можно считать случайными функциями. Они случайным образом зависят от вхождений слов, знаков, чисел и др. Все перечисленные особенности или требования приводят к мысли, что тексты в начальной стадии изучения (системой) необходимо подвергнуть корреляционному анализу.


Понятие корреляционного анализа случайной функции известно и широко используется. Для случайной функции F(X) корреляционная функция вычисляется так:


К(j):= (1/N) * sum(i, 1, N, F(i) * F(i - j)),


sum - суммирование по i от 1 до N, j - изменяется от 1 до N, F - анализируемый текст из слов и знаков, * - операция сравнения слов и знаков, выдающая 0 при несовпадении их и 1 в противном случае. В качестве F используется одно слово или один знак, а также некоторое число подряд стоящих слов и знаков (по заказу пользователя). В результате анализа составляется словарь терминов заданной длины и частоты использования также не ниже заданного числа. Среди терминов могут быть случайные слова, поскольку начальный текст знания весьма избыточен. По предварительным оценкам избыточность текстов оценивается числами 80-90% всего текста. Действительно, в учебниках или пособиях содержится много вспомогательного материала, который с точки зрения знаний либо уже учтен во встроенных знаниях, либо содержится в используемой БЗ, либо выражаются самые общие знания, которые конкретизуются в запросах. Окончательное решение о составе словаря ложится на пользователя. Сформированные в результате корреляционного анализа словари могут использоваться через инструментарий для формирования знаний, анкет, шаблонов или запросов. Таков алгоритм автоматического составления чернового или начального терминологического словаря.


Корреляционный анализ реализован как программа с параметрами: заданное число элементов термина (слово, знак, лексема), число, выражающее самое низкое требование на повторяемость, и число, выражающее самое низкое требование на повторяемость при передаче словаря на печать. Практически программа запускается несколько раз для того, чтобы подобрать ее параметры или задать условия анализа. Время работы программы зависит от числа компонент термина. Например, на IBM 386 текст размером 7 Мб при составлении словаря из терминов с пятью компонентами программа анализа работала примерно один час. Не всякие повторяющиеся композиции элементов текста могут быть терминами. Из числа терминов целесообразно исключить последовательности слов, чисел, символов, строк, знаков, которые не выполняют требованиям, заданные пользователем. Среди требований могут быть такими:

  • соблюдать парность скобок ( и ), [ и ], { и } или « и », использование в термине одной из скобок недопустимо;

  • недопустимо использование парных скобок, написанных в термине наоборот, например, нельзя использовать в термине последовательности: )(, ][, }{ или »«;

  • в терминах не используются графические знаки;

  • длинные последовательности знаков обычно не используются, а точнее так - в термине не допускается использовать больше, чем задано пользователем число элементов;

  • допускается использовать только грамматически правильные многозначия, например одну, две и три точки (подчеркиваний или тире);

  • недопустимы последовательности из однобуквенных слов (разрядка);

  • недопустимы, например, три знака с одним словом.


Словари могут быть составлены неправильно, если не будут учтены правила СиГ хотя бы для окончаний слов. Два термина «белый аист» и «белому аисту» будут различными, тогда подсчет числа использования термина «белый аист» будет неверным. В алгоритмы корреляционного анализа вложены правила, по которым указанные два термина отождествляются. В терминологический словарь потенциально попадает термин «бел_ый аист», что обеспечивает отождествление его с термином «бел_ому аист_у». Статистика использования не будет испорчена. Сложнее учитывать правила СиГ относительно вариации суффиксов. Их также можно учесть.


Алгоритмическими проблемами являются следующие проблемы. Пока неясно как определять синонимы. В терминологический словарь попадают (или нет) синонимы терминов, которые можно распознать только с помощью контекста. Анализ контекста проблематичен. Пока неясно как обнаруживать сами определения терминов. По-видимому, опять на помощь может прийти контекст использования данного термина. Пока неясно как определять избыточную часть текста знаний. Отчасти эту проблему можно решать, используя сведения из стандартных словарей. Некоторые результаты определения избыточности могут быть получены после сравнения получаемого терминологического словаря и имеющегося лексикона. Это только три проблемы из большого числа не только алгоритмических проблем, но и принципиальных проблем теории определений.


^ 5.7. Концептуальная информатика как теория


Итак, рассмотрены некоторые вопросы теории определений: критерии для построения правильных определений, основы теории имени и значения, структуры и классы определений. Совокупность определений, методов, приемов и алгоритмов является принадлежностью новой дисциплины, которую можно именовать концептуальной информатикой. После достаточного накопления знаний по этой дисциплине можно говорить об определении понятия концептуальной информатики. Из написанного материала следует, что она имеет:

  • предмет для изучения - это формирование или поиск терминов и их определений,

  • назначение – это терминологический анализ знания,

  • цели - автоматизация построения словарей и атрибутов элементов словарей,

  • задачи - это создание алгоритмов обработки текстов по смыслу,

  • области применения - это информатика в общем смысле слова,

  • проблемы - это выявленные противоречия как внутри дисциплины, так и вне нее, при сопоставлении в уже сформировавшейся лингвистике.


Пока можно говорить лишь о теории концептуальной информатики, которая сразу же находит применение в разработках ЭС, ПС, СИИ и Интеллсист. Конечно, эта теория применяется в разработках лексиконов и применялась ранее при статистическом анализе текстов, для автоматизированных средств написания рефератов и при составлении терминологических словарей вручную.









оставить комментарий
страница6/32
Дата23.09.2011
Размер6,34 Mb.
ТипДокументы, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы: 1   2   3   4   5   6   7   8   9   ...   32
отлично
  1
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Загрузка...
Документы

Рейтинг@Mail.ru
наверх