Программа дисциплины «Интеллектуальный Системы интеллектуального анализа данных» для специальности 080801. 65 Прикладная информатика (в экономике) подготовки специалистадля направления 080700 Бизнес-информатика подготовки магистра icon

Программа дисциплины «Интеллектуальный Системы интеллектуального анализа данных» для специальности 080801. 65 Прикладная информатика (в экономике) подготовки специалистадля направления 080700 Бизнес-информатика подготовки магистра



Смотрите также:
Программа дисциплины «Системы статистического анализа данных» для направления 080700...
Программа дисциплины «Системы статистического анализа данных» для направления 080700...
Программа дисциплины «Технологии оперативного анализа данных» для направления...
Методические рекомендации к написанию курсовой работы по дисциплине «Системы статистического и...
Программа дисциплины «Хранилища данных» для направления 080700...
Программа дисциплины Управление электронным предприятием для направления 080700...
Программа дисциплины «Субъектно-ориентированное моделирование социально-экономических систем»...
Программа дисциплины Иностранный язык профессионального общения для направлений 080700...
Программа дисциплины Иностранный язык профессионального общения для направлений 080700...
Программа дисциплины «Хранилища данных» для направления 080700...
Программа дисциплины Риторика и ораторское искусство для направления 080700...
Программа дисциплины Риторика и ораторское искусство для направления 080700...



скачать

Министерство экономического развития и торговли

Российской Федерации




Государственный университет-

Высшая школа экономики


Факультет Бизнес-информатики


Программа дисциплины


«Интеллектуальный Системы интеллектуального анализа данных»


для специальности 080801.65 Прикладная информатика

(в экономике)

подготовки специалистадля направления 080700 Бизнес-информатика

подготовки магистра

Автор – Г.И.Перминов


Рекомендовано секцией УМС Одобрена на заседании

Секция «Бизнес-информатика» кафедры бизнес-аналитики
Председатель Зав. кафедрой

_________________В.И.ГрекулГ.А.Левочкина _____________Т.К.Кравченко

“___” ________________ 2006 г. “___” _______________2006 г.
^

Утверждено УС факультета

Бизнес-информатики


Ученый секретарь

_______________А.И.Олейник

“___” _______________ 2006 г.


Москва - 2006

  1. ^ Тематический план учебной дисциплины




№ п/п

Наименования тем

Всего часов

Аудиторные часы

Внеаудиторные часыСамостоятельная работа

Лекции

Практич.еские занятия

Всего аудиторных

  1. 1

Тема 1. Этапы интеллектуального анализа данных. Специфические отраслевые решения ИАД на практике.

612

2

0

2

10

  1. 2

Тема 2. Методы построения регрессионных ИАД. Эволюционное программирование.

1916

2

2

4

12

  1. 3

Тема 3. Нейронные сети.

1320

2

4

6

14

  1. 4

Тема 4. Методы ближайших соседей

16

2

2

4

12

  1. 5

Тема 5. Генетические алгоритмы

14

2

2

4

10

  1. 6

Тема 6. Алгоритмы классификации в ИАД

1418

2

2

4

14

  1. 7

Тема 7. Деревья решений

17

1

2

3

14

  1. 8

Тема 8. Кластерный анализ и алгоритмы ассоциации

2914

2

2

4

10

  1. 0

Тема 9. Измерение эффективности применения методов

38

1

0

1

7




Итого часов

135

16

16

32

103




  1. Формы рубежного контроля и структура итоговой оценки

Итоговая оценка складывается из оценок за:

  • работу на практических занятиях;

  • курсовую работу;

  • ответ на экзамене.

  1. Базовый учебник

    1. Кравченко Т.К., Перминов Г.И. Информационная технология процесса принятия экономических решений. - М.: ГУ-ВШЭ, 2006.

  2. Содержание дисциплины

Тема 1. Этапы интеллектуального анализа данных. Специфические отраслевые решения ИАД на практике.

Определение интеллектуального анализа данных (ИАД или Data Mining (DM)), история и предпосылки возникновения. ИАД и извлечение знаний из данных (Knowledge Discovery in Databases, KDD). Место и роль DM в процессе принятия решений. Основные задачи DM, виды моделей. DM и статистический анализ. DM и хранилища данных. DM и OLAP. DM как самостоятельная отрасль индустрии программного обеспечения.

Этапы построения модели методами ИАД. Идентификация бизнес-проблемы, типовые «узкие места» бизнеса. Выбор, очистка и предобработка данных. DM - преобразование данных в полезную для принятия решений информацию. Практическое воплощение принятого решения – воздействие. Измерение результатов. Наблюдение за моделью.

Специфические отраслевые решения Data Mining на практике. Бизнес-задача: в условиях жесткой конкуренции переманивание клиентов от конкурентов - одна из наиболее важных задач телекоммуникационного бизнеса. Предоставление новой услуги или продукта - эффективный путь привлечения клиента. Направленная и массовая маркетинговые кампании. Выбор набора входных данных, предобработка, анализ. Измерение результата.

Основная литература

Основная

  1. Дюк В., Самойленко А. Data Mining. Учебный курс. - С-Пб.: Питер, 2001., гл.1.

Дополнительная литература

  1. Дополнительная

  1. Кравченко Т.К., Перминов Г.И. Информационные Информационная технологии технология процесса принятия экономических решений. - М.: ГУ-ВШЭ. 2005, гл. 3, гл. 5.

  2. 3. Барсегян А.А. и др. Методы и модели анализа данных: OLAP и Data Mining. – С.Пб.: БХВ-Петербург, 2004, гл.4.

  3. 4. Turban E., Aronson J.E. Decision support systems and intelligent systems. - N.Y.: Prentice Hall International. 2001.

  4. 5. www.Megaputers.ru.

Тема 2. Методы построения регрессионных ИАД. Эволюционные алгоритмы.

Регрессионные методы ИАД и их отличия от статистических. Эволюционное программирование. Временные последовательности и особенности их обработки. Алгоритмы ограниченного перебора. Эволюционные алгоритмы. Главные факторы эволюции. Направления эволюционного программирования. Разновидности эволюционных алгоритмов. Эволюционное программирование. Эволюционные стратегии. Метод группового учета аргументов Ивахненко.


Основная литература

Основная

  1. 1. Андрейчиков А.В., Андрейчикова О.Н. Интеллектуальные информационные системы. – М.: ФиС, 2004, гл.6.



  2. 2. Дюк В., Самойленко А. Data Mining. Учебный курс. - С-Пб.: Питер, 2001., гл.4.

Дополнительная литература

Дополнительная

  1. 3. Кравченко Т.К., Перминов Г.И. Информационная технология процесса принятия экономических решений. - М.: ГУ-ВШЭ., 2005, гл. 3, гл. 5.



  2. 4. Барсегян А.А. и др. Методы и модели анализа данных: OLAP и Data Mining. – С.Пб.: БХВ-Петербург, 2004, гл.5.



  3. 5. www.Megaputers.ru.

Тема 3. Нейронные сети

Нейронные сети. Область их применения. Классификация по типу нейронов. Классификация нейросетевых архитектур. Модели нейронных сетей. Классификация методов обучения. Особенности современных нейронных сетей.


Основная литература

Основная

  1. 1. Андрейчиков А.В., Андрейчикова О.Н. Интеллектуальные информационные системы. – М.: ФиС, 2004, гл.5.



  2. 2. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. Пер. с польского. – М.: Горячая линия-Телеком, 2006, гл.5.


Дополнительная литература

Дополнительная

  1. 3. Галушкин А.И. Теория нейронных сетей. Кн. 1/Под ред. А.И.Галушкина - М.: ИПРРЖР, 2000.



  2. 4. Нейронные сети. STATISTICA Neural Networks. M.: Телеком. 2001. 182 с.



  3. 5. Дюк В., Самойленко А. Data Mining. Учебный курс. - –С-Пб.: Питер, 2001., гл.3.


Тема 4. Методы ближайших соседей.

Метод k-ближайших соседей. Модифицированные методы. Редуцированные методы. Адаптивные методы. Обобщенный метод.


Основная литература

Основная

  1. 1. Толчеев В.О. Разработка и исследование новых модификаций метода ближайшего соседа. – М.: Информационные технологии, №3, 2005.

Дополнительная литература

Дополнительная

  1. Некрасов И. В., Толчеев В. О. Модифицированный метод ближайшего соседа с использованием опорных точек для классификации текстовых документов // Вестник МЭИ. 2004. № 1. С. 76-81 с.


Тема 5. Генетические алгоритмы.

Генетические алгоритмы. Способы продукций: функциональная композиция и итерация/рекурсия. Классический генетический алгоритм. Фундаментальная теорема генетического алгоритма. Разновидности генетических алгоритмов (по методам селекции, процедурам репродукции, генетическим операторам, методам кодирования, масштабированию функции приспособленности. Отсечение эквивалентных или тривиальных разветвлений программ.


Основная литература

Основная

    1. 1. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. Пер. с польского. – М.: Горячая линия-Телеком, 2006, гл.4.



    2. 2. Андрейчиков А.В., Андрейчикова О.Н. Интеллектуальные информационные системы. – М.: ФиС, 2004, гл.6.

Дополнительная литература

Дополнительная

  1. 3. Дюк В., Самойленко А. Data Mining. Учебный курс. - –С-Пб.: Питер, 2001., гл.4.



  2. 4. www.Megaputers.ru.



  3. 5. www.BaseGroup.ru.

Тема 6. Алгоритмы классификации в ИАД.

Классификация на основе нечеткой логики. Характеристика подходов, основанных на теории нечетких множеств, теории приближенных множеств, Необходимость в модификациях алгоритмов: жесткого (strict) и мягкого (liberal).

Основная литература

Основная

  1. Кравченко Т.К., Перминов Г.И. Информационная технология процесса принятия экономических решений. - М.: ГУ-ВШЭ., 2005, гл. 3, гл. 5.



  2. 2. Барсегян А.А. и др. Методы и модели анализа данных: OLAP и Data Mining. – С.Пб.: БХВ-Петербург, 2004, гл.7.


Тема 7. Деревья решений

.

Методы Деревья решений (DT). Описание графа набора данных (узлы, ветви, листья). Основные алгоритмы построения DT в случае двух возможных дискретных состояний результирующей переменной. Обобщение алгоритма, когда результирующая переменная принимает не два, а большее количество дискретных значений. Леса решений.

Основная литература

Основная

  1. 1. Кравченко Т.К., Перминов Г.И. Информационная технология процесса принятия экономических решений. - М.: ГУ-ВШЭ., 2005, гл. 3, гл. 5 .

Дополнительная литература

Дополнительная

  1. 2. Дюк В., Самойленко А. Data Mining. Учебный курс. - С-Пб.: Питер, 2001.



  2. 3. www.Megaputers.ru.



  3. 4. www.BaseGroup.ru.



  4. 5. Turban E., Aronson J.E. Decision support systems and intelligent systems. - N.Y.: Prentice Hall International. 2001.

Тема 8. Кластерный анализ и алгоритмы ассоциации.

K-means кластеризация. Отличия методов кластеризации ИАД от статистических. Кластеризация по распределению плотности. Метод корзины покупателя.

Основная литература

Основная

  1. 1. Кравченко Т.К., Перминов Г.И. Информационная технология процесса принятия экономических решений. - М.: ГУ-ВШЭ., 2005, гл. 3, гл. 5.



  2. 2. Барсегян А.А. и др. Методы и модели анализа данных: OLAP и Data Mining. – С.Пб.: БХВ-Петербург, 2004, гл.7.


Дополнительная литература

Дополнительная

  1. 3. Дюк В., Самойленко А. Data Mining. Учебный курс. - С-Пб.: Питер, 2001.



  2. 4. www.Megaputers.ru.



  3. 5. www.BaseGroup.ru.



  4. 6. Turban E., Aronson J.E. Decision support systems and intelligent systems. - N.Y.: Prentice Hall International. 2001.

Тема 9. Измерение эффективности применения методов.

Измерение ИАД моделей: измерение описательных моделей, измерение предсказательных моделей. Основные статистические термины. Измерение результатов ИАД. Критерии эффективности применения методов ИАД.

Основная литература

Основная

  1. Кравченко Т.К., Перминов Г.И. Информационная технология процесса принятия экономических решений. - М.: ГУ-ВШЭ., 2005, гл. 3, гл. 5

Дополнительная литература

Дополнительная

  1. Дюк В., Самойленко А. Data Mining. Учебный курс. - С-Пб.: Питер, 2001.



  2. www.Megaputers.ru.



  3. www.BaseGroup.ru.



  4. Turban E., Aronson J.E. Decision support systems and intelligent systems. - N.Y.: Prentice Hall International. 2001.



  1. IV. Цель написания курсовой работы



  2. В курсовой работе в рамках выбранной предметной области студенты должны последовательно описать фрагменты выполненных этапов построения модели методами ИАД:

  3. ^ 1. Идентификация проблемной области

  4. Характеристика проблемной области проводится в следующих аспектах:

  5. сфера применения: < уточненная тема работы, пользователи >;

  6. класс решаемых проблем: < (анализ), диагностика, прогнозирование, проектирование, планирование и т.д.>

  7. цель: < имя целевой переменной >;

  8. ожидаемые результаты: < гипотезы - список возможных значений цели >;

  9. исходные данные (факторы): < список имен переменных >;

  10. особенности решения задач: < особенности исходных данных, длина временного ряда, наличие пропущенных значений и т.д.>.

  11. ^ 2. Предварительная обработка исходных данных

  12. В курсовой работе приводятся способы доступа к исходным данным, определяются типы переменных в исходных данных, их необходимые преобразования для применения методов ИАД.

  13. ^ 3. Применение методов ИАД

  14. Обосновывается перечень применяемых пакетов прикладных программ и методов для реализации поставленных задач. Приводятся распечатки найденных закономерностей и правил при применении методов ИАД. Сравниваются результаты, полученные различными методами, и делаются выводы. При необходимости проводится углубленный анализ моделей.

  15. ^ 4. Выводы по достижению поставленных целей

  16. В курсовой работе делаются содержательные выводы по полученным моделям ИАД и другим способам углубленного анализа.



  17. Основной группой курсовых проектов является «Интеллектуальный анализ данных (допускаются: анализ текстов, Web – информации) для конкретных предметных областей». Курсовые проекты данной группы могут быть выполнены для любой предметной области. Ниже приведены примеры возможных тем:

  18. ^ 1. Интеллектуальный анализ данных кинопроката

  19. 2.Интеллектуальный анализ данных салона СD дисков

  20. Интеллектуальный анализ данных специализированного магазина

  21. Интеллектуальный анализ данных домашней библиотеки

  22. Интеллектуальный анализ данных музыкальных групп

  23. Интеллектуальный анализ данных кинопроката

  24. Интеллектуальный анализ данных газовых активов

  25. Интеллектуальный анализ данных формулы-1

  26. Интеллектуальный анализ данных зоомагазина

  27. Интеллектуальный анализ данных аудиотеки

  28. Интеллектуальный анализ данных автосалона

  29. Интеллектуальный анализ данных склада парфюмерной продукции

  30. Интеллектуальный анализ данных склада специализированной литературы

  31. Интеллектуальный анализ данных спортивного клуба

  32. Интеллектуальный анализ данных туристической компании

  33. Интеллектуальный анализ данных центра технического обслуживания подвижного состава

  34. Интеллектуальный анализ данных столовой

  35. Интеллектуальный анализ данных средней школы

  36. Интеллектуальный анализ данных музыкального портала

  37. Интеллектуальный анализ данных системы учета авиарейсов и зарплаты обслуживающего персонала

  38. Интеллектуальный анализ данных магазинов по продаже сотовых телефонов

  39. Интеллектуальный анализ данных аптеки

  40. Интеллектуальный анализ данных склада (варианты: склад торговой организации, занимающейся продажей как продукции собственного производства, так и продукции внешних поставщиков; склад оптовой торговой организации; склад готовой продукции; склад сырья и материалов и др.).

  41. Интеллектуальный анализ данных выполнения нагрузки преподавателей ВУЗа.

  42. Интеллектуальный анализ данных сессионной успеваемости студентов ВУЗа.

  43. Интеллектуальный анализ данных контингента студентов ВУЗа

  44. Интеллектуальный анализ данных организации дипломного проектирования в ВУЗе

  45. Интеллектуальный анализ данных курсового проектирования.

  46. Интеллектуальный анализ данных для профкома ВУЗа.

  47. Интеллектуальный анализ данных начисления стипендии.

  48. Интеллектуальный анализ данных успеваемости школьников.

  49. Интеллектуальный анализ данных партнеров софтверной фирмы.

  50. Интеллектуальный анализ данных коммерческого учебного центра

  51. Интеллектуальный анализ данных для расчета заработной платы (варианты: преподавателей ВУЗа, всех сотрудников ВУЗа, предприятий/организаций с разными системами оплаты труда).

  52. Интеллектуальный анализ данных для учета домашних финансов.

  53. Интеллектуальный анализ данных для районной библиотеки.

  54. Интеллектуальный анализ данных для домашней видеотеки.

  55. Интеллектуальный анализ данных для пункта проката видеофильмов

  56. Интеллектуальный анализ данных домашней аудиотеки

  57. Интеллектуальный анализ данных пациентов районной поликлиники.

  58. Интеллектуальный анализ данных стоимости аренды квартир

  59. Интеллектуальный анализ данных риэлтерского агентства

  60. Интеллектуальный анализ данных услуг, оказываемых юридической консультационной фирмой

  61. Интеллектуальный анализ данных автосервисной фирмы

  62. Интеллектуальный анализ данных автозаправочной станции

  63. Интеллектуальный анализ данных подсистемы «Кадры» (варианты: для ВУЗа, школы, промышленного предприятия, торговой фирмы, софтверной фирмы и т.п.).



  64. ^ V. Контрольные вопросы.

  1. Классификация интеллектуальных систем.

  2. Что такое методы ИАД и каково их назначение?

  3. Каковы особенности методов ИАД?

  4. Охарактеризуйте области применения методов ИАД.

  5. Каковы этапы исследований методами ИАД?

  6. В чем заключается этап предварительной обработки данных при использовании ИАД?

  7. Охарактеризуйте метод «Деревьев решений».

  8. Охарактеризуйте особенности регрессионного анализа в методах ИАД.

  9. Какие разновидности регрессионного метода ИАД Вы знаете?

  10. Охарактеризуйте модели временных рядов с запаздываниями.

  11. Охарактеризуйте метод «Ближайшего соседа».

  12. Охарактеризуйте метод поиска правила.

  13. Охарактеризуйте метод кластеризации.

  14. Охарактеризуйте метод классификации.

  15. Охарактеризуйте метод дискриминации.

  16. Какая разница в целях и алгоритмах статистического и интеллектуального подходов.

  17. Охарактеризуйте генетические алгоритмы.

  18. Охарактеризуйте нейросетевые методы анализа.

  19. Охарактеризуйте методы для анализа нечетких множеств.

  20. Перечислите основные направления эволюционного моделирования и приведите основные факторы, определяющие неизбежность эволюции.

  21. В чем особенности эволюционного программирования? Приведите основные шаги обобщенного алгоритма эволюционного программирования.

  22. Охарактеризуйте метод эволюционных стратегий. В чем его отличие от эволюционного программирования и от генетических алгоритмов?

  23. Расскажите о применении эволюционных вычислений в ИИС.

  24. Какие алгоритмы называют генетическими? Сформулируйте основные особенности генетических алгоритмов.

  25. Охарактеризуйте простой генетический алгоритм. Приведите пример.

  26. Опишите операторы репродукции и кроссинговера в простом генетическом алгоритме. Приведите примеры.

  27. Приведите примеры использования простого генетического алгоритма для вычисления функции f(x) = х4 на интервале [0,1, 2, 3,4].

  28. Составьте примеры, иллюстрирующие работу операторов репродукции, кроссинговера, мутации и инверсии.

  29. Дайте характеристику понятию «схема» в простом генетическом алгоритме. Расскажите о назначении и способах использования схем. Приведите примеры.

  30. Расскажите о фундаментальной теореме генетического алгоритма.

  31. Приведите пример применения фундаментальной теоремы генетического алгоритма.

  32. Сформулируйте прикладную экономическую или управленческую оптимизационную задачу и опишите ее решение с применением генетического алгоритма.

  33. Расскажите о классифицирующих системах Холланда. Приведите пример.

  34. Перечислите основные этапы технологии генетического программирования.

  35. Каким образом применяют ГА для обучения нейронных сетей? Приведите небольшой содержательный пример, демонстрирующий применение ГА для формирования продукционных правил интеллектуальной системы.




  1. VIII. Методические материалы преподавателю

Все практические занятия и самостоятельная работа студентов проводятся с использованием пакетов PolyAnalyst, Deductor, MS OLAP.






Скачать 166,95 Kb.
оставить комментарий
Г.И.Перминов
Дата04.03.2012
Размер166,95 Kb.
ТипПрограмма дисциплины, Образовательные материалы
Добавить документ в свой блог или на сайт

Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

наверх