Применение технологий управления icon

Применение технологий управления



Смотрите также:
Применение информационно-коммуникационных технологий и интернет-технологий на урок...
Реферат по дисциплине: «Исследование систем управления» на тему: «Анализ управления персоналом...
Муниципальная целевая программа «Развитие и применение информационных технологий в Атяшевском...
Темы курсовых работ по дисциплине «Информационные технологии управления персоналом»...
«Результаты внедрения информационных технологий в область изобразительного искусства»...
Обобщенные ограничения: применение к управлению роботами...
M. 18. O. Применение технологий модульного проектирования при создании программного обеспечения...
Рабочая программа По дисциплине «Применение интеллектуальных технологий в экономических...
Васина О. С. Применение информационно-коммуникационных технологий в учебном процессе школы...
«Применение информационных технологий в биофизических исследованиях»...
«применение информационных технологий в банковской системе»...
«Применение информационных технологий в социологических исследованиях»...



скачать




ГЛАВА 2.

ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ УПРАВЛЕНИЯ
ЗАНИЯМИ В УЧЕБНОМ ПРОЦЕССЕ.


2.1. Анализ учебного процесса


При разработке крупных информационных систем, предназначенных для автоматизации деятельности предприятий, с целью снижения рисков и повышения качества работ применяются методики анализа и моделирования подлежащих автоматизации процессов. Наиболее распространенная методика IDEF0 (Integrated Definition Function Modeling) позволяет с помощью функциональной декомпозиции построить адекватную модель происходящих процессов на любом уровне детализации. Для описания документооборота и обработки информации используются диаграммы потоков данных (Data Flow Diagramming, DFD). Описание логики взаимодействия информационных потоков выполняется с помощью IDEF3, называемой также Workflow Diagramming, - методологии моделирования, использующей графическое описание информационных потоков. Моделирование бизнес-процессов на крупных фирмах обычно ведется с помощью CASE-средств, например программы BPWin, позволяющей строить комбинированные модели с использованием всех трех методик.

Рассмотрим более подробно методику IDEF0 и ее применение для анализа учебного процесса. Язык моделирования бизнес-процессов IDEF0 (ранее назывался SADT - Structured Analysis and Design Technique), был предложен более 20 лет назад Дугласом Россом. Детальное изложение методологии SADT имеется в [7]. Под моделью в IDEF0 понимают описание системы (текстовое и графическое), которое должно дать ответ на заранее определенные вопросы. Процесс моделирования какой-либо системы в IDEF0 начинается с определения контекста, т.е. наиболее абстрактного уровня описания системы в целом. В контекст входит определение субъекта моделирования, цели и точки зрения на модель. Под субъектом понимается моделируемая система, при этом необходимо точно установить, что входит в систему, а что лежит за ее пределами, другими словами, должно быть определено, что рассматривается как компонент системы, а что как внешнее воздействие. На определение субъекта системы будет существенно влиять позиция, с которой рассматривается система, и цель моделирования - вопросы, на которые построенная модель должна дать ответ. IDEF0-модель предполагает наличие четко сформулированной цели, единственного субъекта моделирования и одной точки зрения. Основу методологии IDEF0 составляет графический язык описания бизнес-процессов. Модель в нотации IDEF0 представляет собой совокупность иерархически упорядоченных и взаимосвязанных диаграмм. Вершина этой древовидной структуры, представляющая собой самое общее описание системы и ее взаимодействия с внешней средой, называется контекстной диаграммой. После описания системы в целом проводится разбиение ее на крупные фрагменты. Этот процесс называется функциональной декомпозицией, а диаграммы, которые описывают каждый фрагмент и взаимодействие фрагментов, называются диаграммами декомпозиции. После декомпозиции контекстной диаграммы проводится декомпозиция каждого большого фрагмента системы на более мелкие и так далее до достижения нужного уровня подробности описания. После каждого сеанса декомпозиции проводятся сеансы экспертизы - эксперты предметной области указывают на соответствие реальных бизнес-процессов созданным диаграммам. Найденные несоответствия исправляются и только после прохождения экспертизы без замечаний можно приступать к следующему сеансу декомпозиции. Таким образом достигается соответствие модели реальным бизнес-процессам на каждом уровне модели. Синтаксис описания системы в целом и каждого ее фрагмента одинаков во всей модели. Работы (Activity), которые означают поименованные процессы, функции или задачи, изображаются в виде прямоугольников. Взаимодействие работ с внешним миром и между собой описывается в виде стрелок. В IDEF0 различают пять типов стрелок:

  • вход (Input) - материал или информация, которая используется или преобразовывается работой,

  • управление (Control) - правила, стратегии, процедуры или стандарты, которыми руководствуется работа,

  • выход (Output) - материал или информация, производимая работой,

  • механизм (Mechanism)- ресурс, выполняющий работу,

  • вызов - специальная стрелка, указывающая на другую модель работы.


Проанализируем процесс обучения с целью выявления основных типов работ. Контекстная диаграмма верхнего уровня представлена на рис. 2.1-1.





Основой любого учебного процесса является получение студентом знаний, носителем которых являются преподаватели. Обучение строится из курсов, в ходе которых студенту передается определенное количество знаний. Для прохождения курса необходимо наличие начальной подготовки, обеспечивающей понимание излагаемого материала. Курс заканчивается испытанием (тестом, экзаменом, курсовой или дипломной работой), выявляющим соответствие объема и качества полученных студентом знаний требуемому уровню. В качестве базы возьмем процесс подготовки студента в ВУЗе (рис. 2.1-2), который состоит из нескольких этапов (рис. 2.1-3), соответствующим семестрам или изучаемым курсам.



С учетом маршрута подготовки студентов, 2-й шаг декомпозиции будет выглядеть так, как это изображено на рис. 2.1-4.


Р
ассматривая обучение как совокупность различных форм занятий, на третьем шаге мы получим следующую диаграмму (рис. 2.1-5).





Уже на этом уровне детализации видны ограничения модели IDEF0: она не позволяет отобразить последовательность проводимых работ. Для представления этой последовательности требуется моделирование по методике IDEF3. Однако, возможности IDEF0 еще не исчерпаны. На приведенных выше диаграммах упущен существенный аспект учебного процесса. Помимо подготовки студентов в учебном заведении идет непрерывное совершенствование методических материалов (рис. 2.1-6) и тестовых задач (рис. 2.1-7). Если материалы по базовым дисциплинам, таким как физика или математика практически не пересматриваются, то прикладные курсы, предшествующие финишной подготовке и выпуску, обновляются постоянно.









Схемы, представляющие процессы обновления методических материалов и заданий выполнены на основе методики DFD, чтобы показать логику работ и не являются строгой моделью. Применяя результаты проведенного выше анализа необходимо учитывать, что он проведен с отступлением от методик. В основном это касается верификации шагов моделирования экспертом, т.е. квалифицированным специалистом в области обучения. Другим недостатком анализа является его недостаточная детальность. Также осталась неиспользованной возможность применить к учебному процессу методики IDEF3 и DFD. Причина заключается в том, что проведенный анализ уже позволяет определить список основных процессов. При проведении детального анализа выявится существенная разница моделей для различных типов учебных заведений и форм обучения.

При автоматизации деятельности крупных фирм необходимость в методиках моделирования обосновывается сложностью происходящих процессов [8]. В малых фирмах структура управления достаточно прозрачна, чтобы при организации бизнес-процессов обойтись интуитивными решениями. Учебное заведение, особенно ВУЗ, в этом плане аналогично крупной фирме – при автоматизации его деятельности применение формальных методов необходимо. Однако, между фирмой и учебным заведением имеется важное отличие, не позволяющее в полной мере воспользоваться результатами анализа. В торговой фирме автоматизируемые процессы скоротечны – от начала процесса до его окончания может пройти от нескольких минут до нескольких недель. В производстве, особенно сложном, процессы могут протекать дольше – до нескольких месяцев. Наконец, сроки разработки наукоемкой продукции варьируются от месяца до года. Столь длительные процессы имеют место в единичных экземплярах и не автоматизируются полностью, поскольку за время работы над проектом может обновиться техническая база, смениться руководство, измениться методика работы. В таких случаях речь может идти только об автоматизации отдельных процедур. Краткосрочные курсы переподготовки длительностью в десятки часов, подобно деятельности торговой фирмы могут быть проанализированы полностью. Процесс подготовки специалиста, протекающий в течение нескольких лет, проходит на фоне непрерывных изменений в учебных планах, структуре, преподавательском составе и т.д. Автоматизация учебной деятельности на основе результатов анализа, проведенного по методикам SADT, возможна только в рамках периодически повторяющихся процессов, поэтому следует уделить особое внимание организации решения следующих задач:

  • выполнение разовых работ большого объема,

  • поддержание актуальности информационных ресурсов в условиях постоянных изменений.

Перечень наиболее важных работ, выявленных на первых шагах анализа учебного процесса представлен в табл. 2.1-1.

П
риведенные в таблице работы, относящиеся к работе с МТМ, определены достаточно конкретно и, фактически, являются функциями АОС. Работы, сформулированные слишком абстрактно, чтобы описывать функцию информационной системы, нуждаются в дальнейшей декомпозиции с учетом специфики конкретного учебного заведения. Например, процесс «Зачисление» может включать в себя следующие виды работ:

  • обработка результатов вступительных экзаменов (конкурс),

  • генерация учетной информации о студенте,

  • регистрация зачетной книжки/студенческого билета,

  • регистрация читательского билета,

  • подготовка типового набора документов для бухгалтерии, военкоматов и др. организаций,

  • регистрация в компьютерном классе,

  • выделение личных информационных ресурсов (дисковое пространство, электронный почтовый ящик, web-страница).

В отсутствие интегрированной информационной системы, выполняющей эти и другие необходимые функции значительно увеличивается объем работ, их избыточность, потребность в вспомогательном персонале, имеет место увеличение совокупной сложности информационных систем, снижение их надежности, усложнение процедур доступа к информации, снижение скорости обновления информационных ресурсов и потеря их актуальности.


2.2 Принципы построения информационных систем, обеспечивающих учебный процесс


Традиционно, создание АОС происходит в несколько этапов. Выполнение работ на разных этапах осуществляется различными группами: созданием типовых подсистем занимаются программисты, разработкой материалов курсов – преподаватели-предметники, вводом учебного материала в систему – редакторы. Заказчик предъявляет к системе ряд требований и определяет набор обязательных функций, которые должны быть реализованы в системе. Разработчик выбирает наиболее удобную для него платформу, инструментарий и методику реализации и создает программу, полностью отвечающую поставленным требованиям. Полученный программный продукт является заказным (не серийным) и разовым (программисты не участвуют в дальнейшем сопровождении системы). Практика показывает, что программы разработанные по разовым заказам характеризуются следующим образом [9]:

  • в точности подходящие для выполнения поставленной задачи,

  • эффективные,

  • удобные (имеют специализированный интерфейс и требуют минимальной подготовки),

  • сложные (в одной программе сосредоточено большое количество функций),

  • плохо поддающиеся отладке,

  • плохо поддающиеся модификации,

  • нетехнологичные.


Напротив, типовые продукты, которые постоянно совершенствуются разработчиком, обычно:

  • не имеют всех необходимых функций,

  • могут быть неудобны для какого-либо конкретного применения,

  • простые (каждая программа используется для выполнения небольшого количества функций),

  • постоянно улучшаются и отлаживаются,

  • технологичные.

Стремление сократить количество людей, обслуживающих систему (администрирующий персонал и редакторы) и дать возможность работать с системой непосредственно преподавателю диктует использование специализированных заказных АОС. Этот факт иллюстрируется обилием простых однотипных систем, отличающихся одной-двумя особенностями. Основным недостатком подобного подхода является неполный жизненный цикл системы – появляющиеся в ходе эксплуатации пожелания к системе не воплощаются в новой версии продукта. Жизненные циклы серийных программ и АОС представлены на рис. 2.2-1 и рис. 2.2-2.





Когда количество нереализованных функций становится чрезмерно велико и система перестает удовлетворять заказчика, происходит переход на новую систему. Такой переход сопровождается рядом отрицательных последствий, например, необходимостью повторного ввода материалов курса и необходимостью переобучения преподавателей, редакторов и учебно-вспомогательного персонала.

Построение комплексной системы компьютерной поддержки учебного процесса требует пересмотра привычного подхода к разработке подобных систем. Природа интегрированной системы такова, что необходимость модификаций и добавления новых функций будет возникать, прежде чем пройдет цикл отладки. В результате находящаяся в эксплуатации система будет либо постоянно находиться в нестабильном состоянии, либо приобретать необходимую функциональность со значительным запозданием.

Д
ля обеспечения высокой надежности и функциональности система должна иметь модульную структуру [10], позволяющую использовать как специализированные модули собственной разработки, так и серийные программы. Возможная организация такой системы изображена на рис. 2.2-3.


Серийные программы целесообразно использовать для выполнения сложных функций, качественная реализация которых требует значительных затрат времени или высокой квалификации программистов. Специализированные модули должны решать задачи, направленные на учет специфики конкретного учебного заведения или учебного процесса.

Разделение системы на модули, разработка и отладка которых может проводиться независимо позволяет сократить продолжительность цикла отладки и увеличить скорость разработки. Модульная схема часто применяется при разработке наращиваемых программ с большим количеством функций, однако в таких программах (например PhotoShop) модули выполняются в виде динамически компонуемых библиотек, что позволяет жестко определить формат данных. В случае крупномасштабной информационной системы, включающей в качестве модулей серийные программы и средства управления операционной системой, основную сложность представляет разграничение функций системы между модулями, организация взаимодействия между модулями, согласование форматов и структуры данных. Это означает, что от проектирования информационной системы как программного комплекса мы переходим к построению информационного пространства (ИП). Под информационным пространством понимается совокупность необходимых для обработки информации аппаратных и программных средств, системы организации данных и ее информационного наполнения [11]. При построении ИП будем руководствоваться следующими принципами:

  • ИП должно быть ориентировано на обеспечение эффективного выполнения задач учебного процесса в конкретном учебном заведении,

  • ИП должно обеспечивать простой и единообразный доступ ко всем типам ресурсов,

  • обеспечение безопасности важных и конфиденциальных данных (полная информация о сотрудниках и студентах, данные бухгалтерского учета, информация об успеваемости) должно достигаться не различием форматов и применением нестандартных методов доступа, а разделением инфраструктуры на низких уровнях – разрыв компьютерных сетей, использование шифрованного обмена данными и т.п.,

  • система управления ИП должна быть адаптирована к частым изменениям структуры ИП и модификации отдельных программных компонентов,

  • программные компоненты должны быть максимально независимы друг от друга,

  • функции, выполняемые модулями, должны в максимальной степени соответствовать работам, выявленным при анализе учебного процесса по методике IDEF0,

  • структура объектов ИП (хранилищ информации, действующих сервисов) должна в максимальной степени соответствовать структуре данных, полученной при анализе учебного процесса по методике DFD.

Исходя из результатов функционального анализа учебного процесса (табл. 2.1-1), сформулируем важнейшие задачи, возлагаемые на ИП:

  1. сбор, хранение и предоставление информации, необходимой для проведения учебного процесса

  2. обеспечение информационного обмена между студентом и преподавателем,

  3. обеспечение деятельности преподавателей, направленной на поддержание актуальности информационных ресурсов,

  4. накопление ценных информационных ресурсов, созданных
    в результате деятельности студентов,

  5. сбор статистической информации об учебном процессе,

  6. обеспечение анализа собранной статистической информации,

  7. публикация информационных ресурсов согласно политике учебного заведения.


Такой комплекс задач характерен не только для процесса обучения. Существует целый класс информационных систем, предназначенных для выполнения аналогичных функций. Отрасль информатики, в рамках которой осуществляется разработка и практическое применение таких систем, получила название «Управление знаниями» (Knowledge Management, КМ). Системы управления знаниями широко применяются для организации информационно-аналитических служб, автоматизации документооборота и управления предприятиями. Коммерческая направленность этих систем определяет промышленный подход к их разработке, т.е. высокое качество реализации, техническое сопровождение и постоянное развитие. Совокупность этих факторов позволяет использовать эти системы как для заимствования отдельных программных компонентов, так и для формирования основы ИП учебного процесса.


2.3. Системы управления знаниями


В современных источниках [12,13,14,15] вся без исключения информация о системах управления знаниями относится к экономической сфере. Хотя термин «Управление знаниями» используется достаточно долго и может считаться устоявшимся, авторы методик и программных средств считают неудачным как английский оригинал термина «Knowledge management», так и его русский эквивалент «управление знаниями». Под данным термином подразумевается управление информационной инфраструктурой, обеспечивающей процессы сбора, хранения, передачи и использования знаний. В самых разных источниках «управление знаниями» неизменно характеризуется следующими положениями:

  • системы управления знаниями (СУЗ) необходимы для быстрого принятия оптимального решения,

  • управление знаниями не приносит непосредственной прибыли, однако дает экономический эффект за счет рациональной организации работ,

  • управление знаниями дает сотрудникам четкое и согласованное представление о процессах, происходящих в компании,

  • основную трудность представляет не разработка программных средств, а организация их тотального использования.


Корни систем управления знаниями лежат в области средств автоматизации учета, корпоративных баз данных и электронного документооборота. Удобство редактирования, поиска и передачи электронных документов породили стремление максимально использовать компьютерные средства для организации документооборота внутри фирм. Однако такие системы по настоящему эффективны только в том случае, если единой системой охвачены все без исключения подразделения, и сэкономленное за счет автоматизации время тратится на преобразование форматов, распечатку, повторный ввод и т.д. Поэтому совершенствование таких систем идет в направлении интеграции с имеющимися средствами обработки и передачи информации, а также охвата всех сторон деятельности предприятия.

Современные решения в области организации электронного документооборота позволяют создавать динамичные масштабируемые системы, обеспечивающие решение следующих задач [16]:

  • первоначальный сбор информации,

  • преобразование информации в электронный вид,

  • приведение данных к единому формату,

  • автоматическое структурирование, классификацию, индексацию и другое обслуживание данных,

  • оперативный совместный доступ к информации,

  • единообразие процедур поиска, просмотра и редактирования документов, независимо от применяемой вычислительной платформы и местоположения пользователя,

  • организацию управления процессами обработки информации,

  • организацию управления процессами обслуживания системы.


2.4. Четыре процесса обработки знаний


Разработчики систем управления знаниями выделяют четыре основных процесса обработки информации [17], в ходе которых решаются вышеперечисленные задачи: Externalization, Internalization, Intermediation и Cognition (поскольку русские эквиваленты этих терминов еще не устоялись, далее будут использоваться английские оригиналы). На рис. 2.4-1 представлено положение, занимаемое каждым процессом в общей схеме обработки информации.





Externalization - это сбор данных из внешних источников, их структурирование и организация хранения. Характерными представителями программных продуктов, реализующих этот процесс обработки являются программы распознавания текста, разнообразные конвертеры форматов, "роботы", собирающие информацию из Интернет, электронные архивы и системы автоматической рубрикации документов. Основная задача externalization - собирать доступные знания и обеспечивать их накопление.

Internalization представляет собой выборку информации, добытой с помощью externalization. Этот процесс необходим для того, чтобы конечный пользователь не «утонул» в огромном объеме корпоративной информации и смог быстро найти то, что ему нужно. Internalization выполняется поисковыми машинами, системами фильтрования и обработки запросов в СУБД, автоматическими генераторами рефератов и т.д.

Процесс, называемый Intermediation, отвечает за выявление скрытых знаний. Если работа internalization описывается стратегией "pull" (выборка данных происходит по инициативе пользователя), то intermediation работает по стратегии "push". В этом случае информационная система по своей инициативе снабжает пользователя данными, относящимися к его сфере деятельности. К приложениям, реализующим intermediation, можно отнести системы передачи сообщений, фильтрования и чтения новостей, но в большей степени это все-таки расширенные поисковые механизмы, выполняющие наряду с поиском по запросам пользователя, поиск и по контекстно-связанным документам.

Cognition - это процесс автоматического использования знаний самой системой. Он базируется на программных средствах искусственного интеллекта, таких как экспертные системы. Cognition традиционно реализовывался в системах автоматизированного управления, требующих мгновенной реакции или оперирующих со слишком большим для человека количеством параметров. Применение cognition в системах электронного документооборота обычно сводится к накоплению опыта работы в стандартных ситуациях и оптимизации потоков работ и путей обработки данных.


2.5. Архитектура систем управления знаниями


Реализация отдельных процессов обработки знаний часто осуществляется на основе относительно простых технологий [18]. Это Intranet, электронная почта, системы мгновенного обмена сообщениями, групповое программное обеспечение, базы данных и т.д. Наилучшие результаты достигаются, если удается построить распределенную информационную систему, бесконфликтно объединяющую эти механизмы [19].

На рис. 2.5-1 показана структура типовой СУЗ, в которой процесс Externalization представлен в виде внешней системы сбора информации, Internalization выполняется непосредственно средствами сервера СУЗ, а Intermediation реализован в подсистемах DSS (decision support system – система поддержки принятия решений) и ERP (enterprise resource planing – планирование ресурсов предприятия) [20]. Взаимодействие пользователей с системой управления знаниями осуществляется с помощью полнофункционального («толстого») клиента, например Lotus Notes, на территории офисов и «тонкого» клиента на базе web-браузера при работе с домашних и мобильных компьютеров.





В следующих разделах будут более подробно рассмотрены технологии обработки информации, на основе которых строятся компоненты СУЗ и средства, позволяющие объединять отдельные компоненты в единую информационную систему.


2.6 Средства построения распределенных информационных систем


Любая система управления знаниями организует работу множества пользователей с одним или несколькими информационными ресурсами. Поэтому основой для построения СУЗ служат распределенные информационные системы (ИС). Переходу от «настольных» однопользовательских информационных систем к распределенным способствовал целый ряд причин. К наиболее значимым причинам относятся

  • слишком высокая концентрация данных для единого центра обработки и хранения,

  • необходимость обеспечения совместной работы большого количества людей,

  • необходимость обеспечения совместной работы с удаленных и мобильных площадок.

О
бычная ИС (рис. 2.6-1) представляет собой рабочее место пользователя, выполняющее функции обработки и хранения данных. Основными характеристиками такой системы являются производительность узла обработки информации и емкость хранилища. На качество работы системы также могут оказывать влияние производительность хранилища, определяемая временем поиска и скоростью передачи информации. В распределенной ИС (рис. 2.6-2) появляется дополнительный элемент – система коммуникации, связывающая отдельные рабочие места. Ее основными характеристиками являются пропускная способность и время прохождения сигнала (задержка). Возможность взаимодействия между узлами обеспечивается иерархией протоколов обмена данными, описывающих правила передачи информации начиная от физического уровня и заканчивая уровнем прикладной программы.






Производительность распределенной ИС зависит не столько от параметров отдельных рабочих мест, сколько от структуры всей системы в целом: количества рабочих мест, топологии сети связи, распределения нагрузки и т.д. Распределенные ИС применяются для решения нескольких классов задач, сильно различающихся требованиями к элементам структуры ИС.

  • Публикация данных

характеризуется низким объемом передаваемой информации, средней интенсивностью запросов, большой протяженностью линий передачи данных.

  • Передача больших объемов информации

требует высокой пропускной способности линий связи

протяженность линий связи может сильно варьироваться

подразумевает наличие одного или нескольких крупных хранилищ

характер запросов, зависит от выполняемой задачи.

  • Работа с удаленными БД

характеризуется балансом требований к различным компонентам.

  • Удаленное управление и мониторинг

требует линий связи с малой задержкой.

  • Распределенные вычисления

требования к линии связи сильно зависят от решаемой задачи, необходима высокая вычислительная мощность отдельных узлов обработки (или их большое количество, для задач, хорошо поддающихся распараллеливанию).

  • Вещание в реальном масштабе времени

подразумевает соблюдение фиксированных значений характеристик линий связи, нетребовательно к устройствам хранения информации и вычислительным ресурсам.


В зависимости от назначения конкретного узла системы баланс между его основными техническими характеристиками может смещаться в сторону какой-либо одной из них (например, мощность процессора или объем хранилища). Узлы, используемые для взаимодействия с пользователем, называются рабочими станциями. Узлы, работающие без непосредственного участия пользователя, называются серверами. Как правило, сервера специализированы для выполнения одной основной функции, такой как обработка информации или хранение данных. В различных информационных системах варьируется разделение функций между отдельными узлами. За счет этого достигается распределение вычислительной нагрузки и потоков информации в соответствии с предназначением того или иного узла системы. Существует ряд типовых конфигураций узлов и способов распределения функций между узлами, которые оптимальны для решения фиксированного класса задач. Далее будут рассмотрены наиболее типичные схемы построения информационных систем [21]. Значения основных характеристик этих систем представлены в табл. 2.6-1, 2.6-2, 2.6-3 и 2.6-4.


Файл-серверные системы.

Программное обеспечение, выполняющее обработку информации, запускается на рабочей станции. Сервер предоставляет в общее пользование свой главный ресурс – дисковое пространство.

Табл. 2.6-1.

Характеристики файл-серверных систем.





Сервер

Рабочая станция

Вычислительная мощность

Низкая

Умеренная

Объем хранилища

Очень высокий

Умеренный


Такая организация требует высокой пропускной способности коммуникационной системы. Ее достоинством является удобство управления данными – их резервированием, перемещением, перераспределением между разными серверами и разграничение прав доступа. Такие системы применяются для организации централизованного хранения информации, архивов и т.д.


Клиент-серверные системы.

Функции обработки информации распределены между рабочей станцией и сервером.

Табл. 2.6-2.

Характеристики клиент-серверных систем.




Сервер

Рабочая станция

Вычислительная мощность

Высокая

Умеренная

Объем хранилища

Высокий

Умеренный

Трафик в таких системах обычно ниже, чем в файл-серверных, за счет того, что наиболее интенсивная работа с данными происходит на сервере. Клиент-серверная архитектура используется для работы с базами данных и публикации (web-системы). В зависимости от баланса вычислительной нагрузки между клиентом и сервером выделяют толстые, средние и тонкие клиенты. Под «тонким» клиентом понимается web-браузер. «Толстыми» и «средними» являются клиенты, выполненные на основе обычных и скриптовых языков программирования. Преимущество систем с «тонкими» клиентами заключается в их унифицированности, независимости от платформы, на которой функционирует клиентская часть. Недостаток заключается в низкой эффективности работы и сильными ограничениями возможностей рабочего пространства.

Терминально-мэйнфреймовые системы

можно считать частным случаем клиент-серверных систем с «очень тонким» клиентом. Если обычный «тонкий» клиент (например браузер Microsoft Internet Explorer) способен локально интерпретировать коды программ на Java, Java-script, а иногда и VB-script, локально хранить значительные объемы информации и выполнять ряд других функций, то «очень тонкий» клиент – терминал – предназначен исключительно для отображения текстовой или графической информации и передачи на сервер информации от устройств ввода: мыши и клавиатуры. Интенсивность трафика между терминалом и сервером зависит от степени интеллектуальности терминала, т.е. от набора команд отображения. Все логические операции с данными выполняются только на сервере.

Табл. 2.6-3.

Характеристики терминально-мэйнфреймовых систем.




Сервер

Рабочая станция

Вычислительная мощность

Очень высокая

Низкая

Объем хранилища

Высокий

Низкий


Комбинированные системы.

Этот тип распределенных систем является наиболее распространенным. Его появление было вызвано ростом требований к гибкости распределения нагрузки и ресурсов системы. В комбинированных системах проводится более четкое разделение функций хранения данных, логической (вычислительной) обработки и отображения. Комбинированная распределенная система содержит сервера БД, обеспечивающие надежное хранение информации, сервера, выполняющие обработку данных и клиентские места, выполняющие отображение. Распределение функций обработки информации между компонентами системы варьируется в зависимости от характера выполняемых задач и типовых характеристик используемого оборудования.



    1. Обзор базовых технологий обработки информации


2.7.1 Хранение данных


Ядром любой СУЗ является хранилище документов [22], к которому предъявляются следующие требования:

1. масштабируемость,

2. устойчивость к ошибкам,

3. возможность полного и частичного архивирования и восстановления данных в пределах одной системы,

4. возможность полной или частичной выгрузки данных в другую систему,

5. высокая эффективность использования хранилища,

6. высокая производительность хранилища,

7. возможность оценки состояния хранилища, диагностика и мониторинг.

Требование масштабируемости вытекает из имеющейся тенденции к увеличению объема корпоративных данных. Практика документооборота в информационных службах показывает, что в базах данных накапливаются не только статистические и фактические данные, но и результаты всех выполненных работ: отчеты, сводки, бюллетени. Это означает, что информационная система должна быть наращиваемой. При этом желательно, чтобы добавление новых модулей не уменьшало эффективности операций, не изменяло логическую структуру системы, не создавало "узких мест" в системе обработки и выполнялось в максимально сжатые сроки.

Требование устойчивости к ошибкам предъявляется к любой информационной системе. Жесткость этого требования растет пропорционально размеру базы и важности хранимой в ней информации. Возможность полного или частичного восстановления является одним из способов обеспечить надежность системы путем ее регулярного резервирования.

Эффективность информационной системы зачастую зависит от того, насколько просто она позволяет выполнять импорт информации из уже имеющихся баз данных на основе этой или другой системы. Также на эффективность влияет количество хранимой в системе избыточной служебной информации и скорость работы хранилищ. Очевидно, что для сопровождения системы необходимо иметь диагностические утилиты, позволяющие оценивать загрузку отдельных элементов и использование ресурсов всей системы в целом.

В современных информационных системах, таких как Lotus Domino, Documentum4i или Excalibur, хранилище документов выполняется на базе высокоэффективных промышленных СУБД, таких как Oracle, MS SQL Server, Informix.

Поскольку СУБД ориентированы на работу со структурированными данными, а не с текстом, то хранилище служит контейнером, который позволяет снабдить каждый документ произвольным набором признаков. Наличие этих признаков дает возможность строить иерархии документов, организовывать учет использования, осуществлять контроль версий [23]. С одной стороны такой подход позволяет сохранять в базе документы произвольного формата, независимо от приложения, которое создает данные документы. Это могут быть как текстовые редакторы, так и системы автоматизированного проектирования, языки программирования, графические и издательские системы. С другой стороны, содержимое документа для управляющей оболочки недоступно, а значит, система не может самостоятельно осуществлять целый ряд операций, таких как индексирование текста, поиск ключевых слов и т.д.

Дополнение СУБД средствами анализа наиболее популярных форматов документов и эффективными механизмами ввода, индексирования, поиска, рубрикации и выборки неструктурированной информации (текста, графики или мультимедийных данных), позволяет реализовать три процесса обработки знаний – Externalization, Internalization и Intermediation. Доступность знаний конечным пользователям определяется качеством средств визуализации (интерфейс клиентской части) и сетевого доступа (эффективность дистанционной работы). Для реализации четвертого процесса обработки знаний (Cognition) требуется создание программ, способных выполнять интеллектуальную обработку данных применительно к конкретной ситуации.


2.7.2 Поиск


Возможность поиска и представления необходимой информации является ключевой функцией систем СУЗ. Поиск в неупорядоченном массиве информации выполняется за счет полного перебора элементов данных и их сравнения с условиями запроса. Высокая скорость поиска информации в СУБД обеспечивается за счет алгоритмов, работающих с упорядоченной информацией. Простейшим способом упорядочения данных является сортировка, однако, она затрудняет обслуживание базы, внесение изменений и позволяет увеличить скорость поиска только по одному параметру. При необходимости поиска по нескольким параметрам применяется индексация – сортировка массива указателей на элементы данных. Классические механизмы сортировки и индексации ориентированы на работу с традиционными для СУБД типами данных: числовыми значениями, идентификаторами, строками и элементами множеств. Использование в качестве основного наполнения БД текста на естественном языке требует разработки новых методов поиска [24].

Поиск в текстовой БД ставит своей целью выбор документов по определенной пользователем теме. Запрос пользователя представляет собой набор слов, словосочетаний или предложений, описывающих интересующую его тематику. Стандартным требованием к средству поиска является возможность сортировки результатов поиска по релевантности, т.е. по степени соответствия найденного документа запросу.

Простейшим из решений, применяемых для поиска текстов, является поиск по ключевым словам. Согласно этому методу, каждому документу ставится в соответствие список слов, наилучшим способом описывающих его содержание. Полученные списки индексируются и служат для ускорения поиска и оценки релевантности. Наиболее подходящим считается тот документ, наибольшее количество ключевых слов которого встречается в тексте запроса. К достоинствам такого способа относится высокая скорость индексации и поиска. Качество поиска напрямую зависит от того, насколько хорошо выбранные ключевые слова описывают содержание текста. В случае автоматической обработки текста, в качестве ключевых слов выбираются:

  • слова, составляющие заголовок,

  • слова, входящие в содержание или краткий обзор (реферат),

  • слова, наиболее часто употребляющиеся в тексте.

Наилучшие результаты дает ручной подбор ключевых слов. Недостатком этого метода является невозможность поиска по словам, отличным от ключевых. Допустим, какой-либо термин встречается в тексте один или несколько раз, и вероятность его попадания в список ключевых слов мала. Если использовать этот термин в качестве запроса, то данный документ не будет найден. Для преодоления этого недостатка применяется полнотекстовая индексация, при которой в список ключевых вносятся все слова, встречающиеся в документе. Объем индексов резко увеличивается, однако точность поиска остается недостаточной, поскольку данный метод не учитывает следующие факторы:

  • существование нескольких форм одного слова (словоформ),

  • наличие слов-синонимов и омонимов,

  • контекстную зависимость слов в документе.

Если в документе употреблен синоним искомого слова или другая форма этого слова, то такой документ будет пропущен, хотя и удовлетворяет запросу с точки зрения человека. Отсутствие учета контекста (или смысла) документа приводит к попаданию в результаты поиска документов, в которых фигурирующее в запросе слово не является значимым. Обычно это происходит при поиске по широко употребимым словам, которые могут использоваться в различных контекстах. Современные поисковые машины учитывают существование синонимов и различных словоформ одного и того же слова с помощью словарей. Это увеличивает объем работ, поскольку практически любое слово имеет несколько синонимов, каждый из которых имеет несколько форм. Эффективным способом борьбы с многообразием языка является процедура нормализации. Для этого из каждого синонимического ряда выбирается типичный представитель (наиболее употребимое или привычное в обращении слово). На стадии индексирования документа в список ключевых слов вносится не только найденное слово в том виде, в котором оно присутствует в тексте, но и его базовая словоформа или типичный представитель синонимического ряда. Аналогичной процедуре подвергается запрос пользователя. Такой подход приводит не более чем к двукратному росту объема индексов и количества поисковых процессов, по сравнению с обычным полнотекстовым поиском, независимо от количества синонимов и форм слова.

К сожалению, процедура нормализации не решает другой известной проблемы – поиска словосочетания. Все описанные выше методы будут находить не только документы, действительно содержащие словосочетания, но и документы, включающие разрозненные элементы словосочетания. Для решения этой проблемы требуется семантический анализ текстов. Программное обеспечение, реализующее вышеописанные алгоритмы выполняется в виде отдельных программ-надстроек, оперирующих с БД или в виде дополнительных модулей к СУБД. Примером такой реализации служит ПО "Русский текст" фирмы RedLab, представляющее собой модуль расширения к высокопроизводительной СУБД Informix. Существуют аналогичные средства и для более популярных СУБД, таких как MS SQL Server или Oracle.

Существует ряд решений для поиска информации других типов. Наиболее известной является технология APRP (adaptive pattern recognition processing – технология адаптивного распознавания образов), разработанная фирмой Excalibur, которая используется для поиска текстовой, графической, видео и звуковой информации. Метод APRP разработан на основе данных о функционировании нервной системы животных и включает алгоритмы нечеткой логики, семантических и нейронных сетей.


2.7.3 Семантический анализ


Технология семантического анализа [26,27] предназначена для формирования формального описания смысла текста в виде фреймов, семантической сети или других способов представления знаний. При этом текст подвергается многоступенчатой обработке. На первом этапе из текста удаляются слова, не несущие значительной смысловой нагрузки: предлоги, междометия и т.п. Затем выбираются слова или устойчивые словосочетания, обозначающие объект речи, (т.е. подлежащие) и связи между ними (т.е. сказуемые). Считается, что объекты, имеющие наибольшее количество связей в пределах данного текста являются наиболее важными, а связи между этими объектами отражают основной смысл текста.

Для проведения семантического анализа необходимы средства статистической обработки, словари, базы данных, описывающие синтаксис и морфологию, словари синонимов, омонимов и профессионализмов (тезаурусы). Технологии семантического анализа требуют от разработчика огромной вспомогательной работы по сбору и обработке лингвистической информации, поэтому в полной мере ими располагают всего несколько десятков компаний во всем мире, которые лицензируют свои средства семантического анализа для использования в прикладных системах. Семантический анализ служит основой для таких функций обработки текста, как рубрикация, реферирование, смысловой поиск и компьютерный перевод. Наиболее известные отечественные разработки. Среди отечественных систем семантического анализа наиболее известны продукты «Серверный следопыт» компании «Медиалингва» и «ТекстАналист».


2.7.4 Рубрикация


При работе с большим количеством объектов, представленных как в естественной, так и в электронной форме, одним из средств сокращения времени поиска и обеспечения удобного доступа является рубрикация или классификация. Существуют два основных варианта постановки задачи классификации [58,59]. Первый вариант заключается в определении принадлежности изучаемого объекта к тому или иному классу заранее заданной системы классификации. Второй, более сложный, вариант предполагает не только определение принадлежности объекта, но и одновременное формирование самой системы классов. Математической основой алгоритмов классификации является задача кластеризации, решение которой относится к области математической статистики [60,61]. Системы рубрикации используют результаты семантического анализа текста, поэтому они обычно являются частью поисковой машины.


2.7.5 Реферирование


Реферирование документов является эффективным средством борьбы с чрезмерным информационным потоком. Формирование краткого обзора, отражающего основную мысль текстового материала, применяется для повышения удобства навигации в документах большого объема. Автоматическое реферирование основано на технологии выделения ключевых слов, оценки релевантности и выявления устойчивых словосочетаний и других групп, характерных для данного документа. Реферат представляет собой выделенные из текста предложения, наилучшим образом описывающие его содержание, то есть включающие объекты речи, получившие наибольший вес при семантическом анализе. Простейшие средства автоматического реферирования включены в пакет MS Office (начиная с версии 8.0), однако, качество их работы оставляет желать лучшего. Более удачны разработки фирм Excalibur, Inxight, MediaLingua и TextAnalyst, интегрированные с поисковыми машинами и классификаторами.


2.7.6 Ввод (распознавание образов)


Основным источником информации для корпоративных систем документооборота и управления знаниями являются бумажные документы, содержащие печатный и рукописный текст и таблицы. Ввод документов в компьютер - очень трудоемкая задача. Для ее автоматизации применяются программы OCR (optic cognition routine - оптическое распознавание текста).
Наиболее совершенные программы этого семейства основаны на следующих принципах распознавания, заимствованных у живых систем [28].

1. Принцип целостности предполагает, что каждый пространственный объект состоит из элементарных частей, связанных между собой определенными геометрическими отношениями. Объект считается распознанным, если найдены все его части и установлено, что все они находятся в нужных отношениях. Например, если мы распознаем обстановку помещения и находим геометрический предмет, расположенный на полу и состоящий из четырех вертикальных палок и горизонтальной плоскости, прикрепленной к верхним концам палок, то мы определяем, что это табурет.

2. Принцип целенаправленности утверждает, что процесс эффективного распознавания должен производиться путем выдвижения и последующей проверки гипотез. В нашем примере мы можем выдвинуть гипотезу о табурете на основе наличия у объекта трех или четырех вертикальных палок и отсутствия спинки.

3. Принцип адаптивности гласит, что для надежного распознавания разнородных объектов система должна иметь способность к самообучению. Например, если система не знала про трехногие табуреты, но, распознав однажды трехногий табурет как, скорее всего, табурет и, получив дополнительное подтверждение по контексту (на табурете сидит человек), система начинает уверенно распознавать трехногие табуреты.

На основе этих принципов построена технология целостного целенаправленного адаптивного распознавания (Integral Purposeful Adaptive perception, IPA-технология), реализованная в ABBYY FineReader – одной из лучших программ распознавания текста.


2.7.7 Отображение


В современных приложениях взаимодействие пользователя с системой осуществляется через графический интерфейс, состоящий из отдельных составных частей (элементов управления - controls, widgets). Элементы управления являются реализацией различных концепций представления данных: отображение в виде списка, таблицы, гистограммы, иерархическое представление, пиктограммы, имитация физических объектов и т.д. Компании, разрабатывающие операционные системы (Microsoft, Apple), средства навигации в Интернет (Netscape), компьютерные тренажеры и системы управления постоянно работают над созданием интерфейсов нового типа, позволяющих значительно более эффективно выполнять отображение и манипулирование информацией за счет использования знаний о человеческой системе восприятия. Среди программных средств этого направления выделяются системы когнитивной графики и гиперболические браузеры [29] фирмы Inxight, позволяющие преодолеть порог одновременного восприятия в 5-9 объектов. К аппаратным системам отображения и управления относятся атрибуты виртуальной реальности (ВР): индуктивные, магнитные и гироскопические датчики положения, сенсорные экраны, манипуляторы в виде перчаток, костюмов и органов управления реальным оборудованием, шлемы ВР, средства слежения за направлением взгляда и т.д.


    1. Перспективы применения технологий семантической обработки в автоматизированных обучающих системах.


Использование семантических технологий входящих в состав СУЗ в виде отдельных модулей позволяет эффективно организовывать документооборот, обслуживание массивов информации и поиск данных [30]. Однако внедрение этих технологий в АОС представляет значительно большие возможности в области осуществления индивидуального подхода к обучению и передачи компьютеру максимально возможного количества функций преподавателя. Успешное выполнение этих задач требует от обучающей системы уровня интеллектуальности, достаточного для осуществления следующих действий без связи с преподавателем:

  1. Адекватное определение пробелов в знаниях.

Вместо выставления интегральной оценки (по проценту выполнения тестового набора задач), необходимо оценивать качество усвоения каждого представленного в курсе понятия в отдельности.

  1. Автоматическое принятие мер по устранению этих пробелов.

Вернуть обучаемого к недостаточно хорошо усвоенному фрагменту материала уже немало, но гораздо более полезно сформулировать ту же информацию другими словами, дать большое количество примеров на эту тему или акцентировать внимание на отношениях между трудным для понимания объектом и другими объектами, представленными в рамках данного курса или дополнительной литературы.

  1. Определение индивидуальных характеристик обучаемого.

К таким характеристикам относятся склад мышления (индуктивный, дедуктивный), оптимальная скорость восприятия информации, преобладающий тип памяти (зрительная, слуховая, моторная), длительность концентрации внимания и т.д.

  1. Оптимизация подачи материала с учетом индивидуальных характеристик

Один и тот же материал может демонстрироваться с различной скоростью, различным соотношением текста и иллюстраций, текста и звука, формальной информации и пояснений. В зависимости от склада мышления можно также варьировать порядок представления абстрактной информации и примеров.

Реализация этих функций требует от компьютера возможности оперировать смысловыми единицами учебного материала - описаниями объектов, процессов, законов, преобразований, правил и т.д. Для этого в состав курса помимо текстовых, графических и мультимедийных материалов, предназначенных для обучаемого, необходимо включить семантическую информацию, описывающую материалы курса. Каждый феномен предметной области, рассмотренный непосредственно в курсе, или на который имеется ссылка, должен иметь семантическое описание, с которым может оперировать компьютер. Для элементарных объектов, таких как аксиомы или определения примитивных объектов (точка в геометрии), достаточно простой декларации его существования. Семантические описания более сложных объектов, таких как теоремы, дополнительно включают ссылки на описания связанных объектов. Например, определение "параллельные прямые" ссылается на определения "прямая", "точка", "пересечение".

Преподавание большей части дисциплин (всех технических и части гуманитарных) строится по следующей схеме: курс рассчитан на передачу обучаемому определенного набора знаний и навыков. Предполагается, что перед началом обучения студент владеет базовыми знаниями, необходимыми для понимания материала (например математический аппарат или исторические сведения). Обучение заключается в передаче информации студенту малыми частями, для понимания которых достаточно уже изученных фрагментов и базовых знаний. Сложность передаваемой информации постепенно нарастает, для понимания каждой новой части требуется знание все большего количества предыдущих частей. Наиболее наглядно эта схема иллюстрируется курсом геометрии, где в доказательстве практически каждой теоремы используется результат предыдущей. Таким образом, помимо семантических описаний феноменов, представленных в курсе, в интеллектуальную обучающую систему необходимо включить информацию о взаимосвязях между этими феноменами, наиболее важной из которых является необходимость знания одного для понимания другого. Совокупность семантических описаний феноменов предметной области, взаимосвязей между этими феноменами и информации о расположении текстовых, иллюстративных и других материалов, описывающих эти феномены, будем называть семантическим сопровождением курса.

Для улучшения качества тестирования необходимо осуществить привязку к семантическому сопровождению не только обучающего, но и контролирующего материала. Эта мера позволяет даже с помощью простейших тестов получить вместо общего балла, оценку знания каждого понятия, правила, формулы и т.д. Наличие семантических описаний позволяет также поднять реализацию тестовых мероприятий на новый уровень. Подавляющее большинство современных систем тестирования проверяют правильность данного учеником ответа. Для учебных целей важнее контролировать процесс решения. Для этого обучаемому необходимо предоставить список возможных законов, на которые он может ссылаться или доступных преобразований, которые он может использовать. Наличие семантического сопровождения подразумевает наличие формализованных описаний этих и других объектов. Контроль последовательности применения законов, преобразований или формул позволяет оценить направление хода решения: приближается ли к ответу тестируемый или только запутывается в задаче. Выбор направления решения, понимание взаимосвязей в изучаемой области и способность их правильного применения значительно лучше характеризуют уровень и полноту знаний, нежели просто факт правильного ответа.

Семантическое сопровождение является основой и для индивидуального подхода к изложению информации на основе психологических особенностей обучаемого или информации о слабых местах в подготовке, полученной в ходе тестирования [31]. Обучающая система после неудачной попытки решения задачи может вернуть ученика к определению или примеру. В обычных системах хранится единственный вариант изложения Закона Ома, сопровождаемый несколькими (обычно тремя) примерами. В случае ошибки обучаемый снова и снова возвращается к этой формулировке и одним и тем же примерам. В данной ситуации преподаватель постарается объяснить тот же закон другими словами или на других примерах. Интеллектуальная система обучения может при необходимости предъявить плохо успевающему студенту все примеры и формулировки, которые ей доступны. В то же время, если студент выполнил тест, нет необходимости демонстрировать ему все разнообразие примеров по пройденной теме.


Итак, для эффективного использования компьютеров в учебном процессе, необходимо построение информационного пространства на базе распределенной информационной системы, имеющей модульную структуру. Функциональность модулей этой системы должна определяться задачами, выявленными при анализе учебного процесса по методике IDEF0. Решение простых задач, связанных с приспособлением системы к деятельности конкретного учебного заведения может осуществляться его собственным отделом информационных технологий. Для выполнения работ по сбору, накоплению и обслуживанию методических материалов целесообразно использование высокотехнологичных компонентов систем управления знаниями промышленного уровня. Приведенный выше обзор технологий обработки информации показывает, что реализация только базовых функций системы управления знаниями требует совместного использования результатов исследований в области искусственного интеллекта, математической статистики, обработки сигналов, систем массового обслуживания и систем автоматического управления. Обработка данных, специфичная для предметной области, в которой применяется СУЗ, осуществляется специализированными программами, применяемыми в комплексе с СУЗ. В случае информационной системы, поддерживающей проведение учебного процесса, такими специализированными программами являются традиционные компоненты АОС: средства представления материалов учебных курсов, проведения тестов, интеллектуальные тренажеры и др. Применение штатных средств СУЗ (web-браузеров, текстовых редакторов) для взаимодействия с конечным пользователем в большинстве случаев является нецелесообразным, поскольку они значительно уступают специализированным демонстрационным программам и оболочкам АОС по возможностям согласованной демонстрации текстовых и мультимедийных данных, которые имеют первоочередное значение для учебного процесса. Для обеспечения эффективной совместной работы модулей информационной системы, выполняющих функции АОС и СУЗ, и интеллектуализации АОС необходимо создание подсистемы управления, включающей средства работы с основной технологией СУЗ – семантической обработкой данных.






Скачать 365,36 Kb.
оставить комментарий
Дата31.03.2012
Размер365,36 Kb.
ТипДокументы, Образовательные материалы
Добавить документ в свой блог или на сайт

Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

наверх