скачать Федеральное агентство по образованию Государственное образовательное учреждение высшего профессионального образования «Иркутский государственный педагогический университет» Факультет математики, физики и информатики Утверждено на заседании совета факультета математики, физики и информатики протокол №_____от __________2007 г. Председатель совета________________ (Кузьмина Н.Д.) УЧЕБНАЯ ПРОГРАММА ДИСЦИПЛИНЫДС.Ф.02. Алгоритмы для Интернет^ Квалификация: информатик в образовании Курс: 4 Семестр: 8 Форма обучения: очная Количество часов на дисциплину: 78 час. Количество аудиторных часов: 39 час.; из них: Лекций: 18 час. Лабораторных занятий: 21 час. Самостоятельная работа: 39 час. Итоговый контроль: зачет. ^ 1. Место дисциплины Дисциплина “Компьютерные издательские системы” является практически-ориентированной, включена в учебный план в рамках федерального компонента в качестве специальной дисциплины. Она является неотъемлемой частью подготовки специалиста в области информационных технологий.^ Цель дисциплины – познакомить студентов с приемами решения практических задач в сети Интернет с помощью алгоритмов поиска и индексации данных. ^ Задачи курса – обучить студентов алгоритмам, которые применяются в поисковых системах Интернет. 4. Принципы отбора содержания и организации учебного материала Учебный материал содержит различные алгоритмы, применяемые в сети Интернет. В основу отбора материала положен принцип обзора различных математических моделей алгоритмов и методов их построения. ^ Содержание курса входит в необходимый минимум профессиональных знаний выпускников по специальности, а также является необходимой основой для усвоения специальных курсов, выполнения курсовых и дипломных работ. ^ Текущий – проводится по учебной единице в форме проверки задания для самостоятельного выполнения. Итоговый – проводится в форме зачета. ^
^ Модуль №1. Алгоритмы для Интернет 1. Построение суффиксного дерева (по Укконену) Суффиское дерево: способ представления текста. Применение: поиск подстрок, поиск наибольшей общей подстроки. Основные идеи алгоритма: on-line построение, вспомогательные суффиксные стрелки, неравномерная оценка времени работы. ^ Вычисление преобразования Берроуза-Вилера, вычисление обратного преобразования, применение к архивированию. 3. Архитектура поисковых систем. Pagerank Модели информационного поиска: булевская, векторная, вероятностная. PageRank: модель случайного блуждания, основное уравнения PageRank, PageRank как собственный вектор матрицы всех ссылок. ^ примеры реальных сетей: биологические, социальные, информационные, технологические. Свойства сетей: связность, кластеризация, распределение сетей, корреляции базовых свойств между собой. Модели сетей: Пуассона, конфигурационная, Прайса, Small World. ^ Понятие байесовской сети. Применение байесовских сетей. Вероятностная логика. Фрагменты знаний. 6. Автоматическая классификация текстов Постановка задачи, подходы и применение. Индексация документов: базовый подход, уменьшение размерности векторов. Построение и обучение классификатора: выбор порога, линейные on-line классификатор, метод регрессии, ДНФ-правило, нейронные сети. Оценка качества классификации: метрики из информационного поиска, методы сравнения двух классификаторов. ^ Постановка задачи классификации. Оптимальная разделяющая гиперплоскость: разделение прямой, разделение полосой, случай линейной разделимости, случай отсутствия линейной разделимости. Обучение машины опорных векторов. Расширение пространства признаков. Примеры. ^ История и мотивация. Архитектура семантического Веба: общая архитектура, RDF – синтаксис семантического Веба, OWL – язык описания онтологий. Проекты семантического Веба. ^ Эгоистические агенты и кратчайший путь. Аукцион Викри, эгоистические подрядчики и составление расписаний. Общий механизм Викри-Грувса-Кларка. ^ Крупномасштабная фильтрация. Распространение меток. Выявление структур. Основные понятия Суффиксное дерево, неявное суффиксное дерево, фаза, типы продлений, суффиксная стрелка, преобразование Берроуза-Вилера, общий алгоритм образного преобразования Берроуза-Вилера, булевская модель информационного поиска, векторная модель информационного поиска, релевантность векторной модели, вероятностная модель информационного поиска, функция соответствия, прямой индекс, обратный индекс, релевантность, оценки качества поиска, модель случайного блуждания, основное уравнение PageRank, понятие информационной сети, отношения между информационными объектами, технологические сети, биологические сети, эффект «маленького мира», распределение степеней, корреляции, случайные пуассоновские графы, конфигурационная модель, модель «маленького мира», модель Прайса, байесовские сети, байесовские сети доверия, алгебраические байесовские сети, виды классификации, индексация документов, обучение классификатора, оценка качества классификации, ранжирование и четкая классификация, линейные on-line классификатор, метод регрессии, ДНФ-правило, нейронные сети, метрики из информационного поиска, абстрактная задача классификации, линейный классификатор, шумы и штрафы, синтансис и семантика Веб, язык RDF, язык OWL, «пирог» Тима Бернерса-Ли, дублинское ядро, эгоистические агенты, задача кратчайшего пути, игры с неполной информацией, механизм Викри-Грувса-Крарка, проблема крупномасштабной фильтрации, задача распространения меток, задача выявления структур. ^ Студенты должны подготовить доклад по одной из предложенных тем и выступить на семинаре. Подготовка доклада делается парами. К докладу должны быть сделаны слайды. Доклад должен длиться не более 70 минут. После его окончания проводится дискуссия с аудиторией. План доклада должен содержать, по возможности, максимум из следующего списка:
Темы для докладов:
Литература.
^ Текущий контроль Производится оценка качества сделанных докладов и презентаций. Итоговый контроль Примерные вопросы к зачету
^ 1. Рекомендуемая литература а) Учебная (основная)
б) Учебная (дополнительная)
^ а) Электронный курс, выставленный в информационно-образовательной среде кафедры математической информатики «DOMIC» (http://matinf.igpu.ru/domic/). Электронный курс содержат лекции, презентации к лекциям. Составитель: старший преподаватель кафедры математической информатики Зинченко А.С.Рекомендовано на заседании кафедры математической информатики протокол № ___ от ________________ 200_ г. Зав. кафедрой __________________________ Н.А. Перязев _____________________________ Одобрено на заседании УМК факультета математики, физики и информатики протокол № ___ от ________________ 200_ г. Председатель УМК ______________________
|