Методика построения тематического рубрикатора скиир 31 > 13. 1 Постановка задачи 31 13. 2 Реализованный подход 33 icon

Методика построения тематического рубрикатора скиир 31 > 13. 1 Постановка задачи 31 13. 2 Реализованный подход 33



Смотрите также:
Дисциплина: Инженерия знаний Доклад Генетические алгоритмы...
Курсовая работа...
Содержательная постановка задачи «Бросание мячика в стенку»...
Проектная методика, как средство активизации учебной деятельности учащихся...
Методика преподавания русского языка Пособие для учителя...
Проблемы построения структуры содержания сельскохозяйственного образования в условиях...
Методика и технология речевого развития школьников: лингвоконцептоцентрический подход...
1. Постановка задачи оптимального быстродействия для линейных систем Постановка задачи...
Контрольная работа №2 Аппроксимация функций Постановка задачи : аппроксимировать заданную...
Методика формирования понятий 2 Лекция №3...
Методика построения многоуровневой модели обучения аудированию в системе профессиональной...
Издательства



страницы:   1   2   3   4   5   6   7
скачать
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ


МОСКОВСКИЙ ФИЗИКО-ТЕХНИЧЕСКИЙ ИНСТИТУТ

(Государственный Университет)


ФАКУЛЬТЕТ ОБЩЕЙ И ПРИКЛАДНОЙ ФИЗИКИ

Кафедра Системной Интеграции и Менеджмента


Реализация семантического подхода к построению тематического рубрикатора информационных ресурсов


Магистерская диссертация студента 125 группы

Сергеева Евгения Владимировича


Научный руководитель:

кандидат филологических наук, доцент

Рыков В.В.


Рецензент:

доктор технических наук, профессор

Беляев И.П.


Москва 2007

Содержание


Содержание 2

Используемые сокращения 3

Введение 4

1.1. Цель работы 5

1.2. Актуальность темы 5

1.3. Научная новизна и практическая значимость 6

Обзор технологий Semantic Web 7

1.4. Принципы построения модели RDF 8

1.5. Использование словарей: RDF Schema 10

1.6. Онтология и язык OWL 11

1.7. Topic Maps как альтернатива RDF 12

Порталы знаний и семантические порталы 15

1.8. Возможности применения онтологий 16

1.9. Примеры семантических порталов 18

1.10. Технологии построения семантических порталов SEAL 19

Разработка тематического рубрикатора в системе СКИИР 22

1.11. Причины создания новой системы 23

1.12. Архитектура и функции СКИИР 25

1.13. Методика построения тематического рубрикатора СКИИР 31

1.13.1 Постановка задачи 31

1.13.2 Реализованный подход 33

1.13.3 Программная реализация 36

1.13.4 Автоматическая рубрикация на основе метода SVM 41

1.13.5 Результаты автоматического рубрицирования 42

Заключение 43

1.14. Направления дальнейшей работы 44

Литература 45

Приложение 1. Архитектура СКИИР и ее окружение 47

Приложение 2. Диаграммы таблиц базы данных рубрикатора СКИИР 48

Приложение 3. Пример тематических рубрик для классификации информационных ресурсов ДИИ. 50


^

Используемые сокращения


XML – Extensible Markup Language (Расширяемый язык разметки)

RDF – Resource Description Framework (Схема описания ресурсов)

OWL – Web Ontology Language (Язык онтологий для Интернета)

URI – Uniform Resource Identifier (Универсальный идентификатор ресурса)

URLUniform Resource Locator (Универсальный указатель ресурса)

СУБД – Система управления базой данных

СУЗ – Система управления знаниями

ПЗ – Портал знаний

КИП – Корпоративный информационный портал

КПЗ – Корпоративный портал знаний

SVM – Support Vector Machine (Метод опорных векторов)


Введение


Важнейшим ресурсом современного предприятия, способным значительно повлиять на повышение его конкурентоспособности и инвестиционной привлекательности, являются корпоративные знания. Сегодня с этим никто не спорит, вопрос только в том, как воспользоваться этими корпоративными знаниями, так как большинство из них скрыто в головах сотрудников. Люи План, экс-президент Hewlette-Packard, считает: «Если бы только корпорация Hewlett-Packard осознавала то, что она знает, она была бы в три раза более продуктивной».

Поиск того, что уже известно становится реальной проблемой для организаций, которые хранят большую часть своей информации в изолированных «ad-hoc» системах, при этом теряя возможность единого доступа к ней. Возрастающая популярность различных корпоративных Intranet-систем привела к тому, что большая часть организаций стала размещать свои данные в многочисленных хранилищах, где информация накапливалась как в структурированном, так и в неструктурированном виде. Подобная информация доступна опытным пользователям, которые точно знают, где и каким образом ее нужно искать. Но для непросвещенных пользователей, являющихся ее потребителями, задача поиска необходимой информации становится достаточно трудоемкой, так как они могут даже не подозревать, доступна ли им в действительности эта информация.

В данной работе рассматриваются различные подходы к построению корпоративных порталов знаний – информационных систем, направленных на обеспечение средств эффективного управления знаниями. В начале работы проводится анализ технологий Semantic Web, а так же существующих решений, построенных на их основе. Показывается каким именно образом рассматриваемые технологии помогают решать проблемы эффективного управления знаниями, в частности обеспечения систематизации и персонализации представления знаний.

Заключительная часть работы посвящена апробации выработанного семантического подхода при разработке Системы коллективного использования информационных ресурсов (СКИИР) Департамента исследований и информации Банка России. В этой части проводится анализ информационных потоков, технологий и видов деятельности, поддерживающих аналитическую работу специалистов Департамента исследований и информации. На основе проделанного анализа делается вывод о необходимости в применении семантического подхода для реализации портала ДИИ и строится модель рубрикатора информационных ресурсов на основе технологии Topic Maps. Показывается каким образом построенная модель была успешно применена при проектировании и разработке системы СКИИР.
^

1.1.Цель работы


Целью данной работы является разработка методов, позволяющих использовать семантические технологии для организации структуры хранения и доступа к информационным ресурсам в корпоративных портальных системах. В работе обсуждаются основные подходы к построению порталов знаний на основе технологий Semantic Web.

Практическая часть работы заключается в реализации модуля рубрикации информационных ресурсов Системы коллективного использования информационных ресурсов Департамента исследований и информации Банка России на основе применения выработанных методов. Предлагаемая реализация оценивается с точки зрения эффективности ее применения для автоматизации основных видов деятельности ДИИ.
^

1.2.Актуальность темы


Совершенствование существующих и разработка новых подходов к сбору, хранению, обработке и распространению информации является неотъемлемой частью процесса развития информационных технологий и информационных систем. Необходимость такого совершенствования во многом обусловлена непрерывным ростом объема информационных ресурсов и их доступности, что ввиду их слабой структурированности сильно осложняет работу пользователей с ними.

В последнее время все более популярным решением данной проблемы в различных организациях становится использование корпоративного информационного портала (КИП). Однако сейчас нельзя ни обратить внимание на тот факт, что функции, предоставляемые корпоративными порталами, являются необходимыми, но не достаточными для эффективной работы с корпоративной информацией - прежде всего для решения задач ее обнаружения.

Не смотря на то, что Web-интерфейсы современных корпоративных порталов обеспечивают единый и структурированный доступ к гетерогенной информации, они, прежде всего, направлены на предоставление средств управления доступом, изменения и актуализации хранящейся информации, но не ее структуризации и систематизации.

Полнотекстовый поиск по содержимому, как бы хорошо он не был реализован, не способен обеспечить пользователю инструмент эффективного поиска произвольной информации. В большинстве случаев пользователю либо не удается подобрать нужные ключевые слова, либо возвращается слишком большое количество результатов поиска. Как показывает практика, функции семантического поиска и рубрикации в пакетных портальных решениях присутствуют исключительно «для галочки» и не могут применяться в реальных промышленных условиях.

Таким образом, функции корпоративных портальных систем, построенных на современных портальных технологиях, не могут являться достаточными при решении задач обеспечения средств эффективного обнаружения информации. В частности, ввиду отсутствия в них средств формального семантического описания, возникают серьезные проблемы при использовании больших массивов информации.

Одним из подходов к решению данной проблемы является использование семантических технологий, призванных обеспечить обработку информации в корпоративных порталах с учетом ее семантики. Применение в корпоративных порталах новых подходов и методов к обработке информации имеет высокую практическую значимость, а исследования подходов и разработка методов построения структуры хранения и доступа к корпоративным порталам на основе семантических технологий являются актуальными.




оставить комментарий
страница1/7
Дата10.10.2011
Размер0,52 Mb.
ТипРеферат, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы:   1   2   3   4   5   6   7
Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

наверх