Программа дисциплины «Системы статистического и интеллектуального анализа данных» icon

Программа дисциплины «Системы статистического и интеллектуального анализа данных»



Смотрите также:
Методические рекомендации к написанию курсовой работы по дисциплине «Системы статистического и...
Программа дисциплины «Интеллектуальный Системы интеллектуального анализа данных» для...
Программа дисциплины «Системы статистического анализа данных» для направления 080700...
Программа дисциплины «Системы статистического анализа данных» для направления 080700...
Программа дисциплины Кафедра методов и технологий социологических исследований Программа...
Программа промежуточной аттестации дисциплины Статистика налогов Специальность: «Налоги и...
Нечеткие гибридные системы в задачах интеллектуального анализа данных...
«Системы статистического анализа данных»...
Удк 007. 5: 519. 216...
Пояснительная записка Программа разработана доцентом кафедры социологии А. В. Лисовским 1...
Пояснительная записка Программа разработана доцентом кафедры социологии А. В. Лисовским 1...
Программа дисциплины Системы разработки данных и машинного обучения для направления 010500...



страницы: 1   2   3
вернуться в начало
скачать


Обучающая программа на Изучении С Bayesian Сетями

Сеть Байсиана

Барсегян А.А. и др. Методы и модели анализа данных: OLAP и Data Mining. –С.Пб.: БХВ-Петербург, 2004, гл.6

Чубукова И.А. Data Mining. – М.: Интернет – Университет Информационных Технологий; БИНОМ. 2006. гл. 15.

WWW.OLAP.ru

Бонгард М.М. Проблемы узнавания. – М.: Наука. 1967

Дюк В., Самойленко А. Data Mining. Учебный курс. С-Пб.: Питер, 2001. гл. 5

Киселев М., Соломатив Е. Средства добычи знаний в бизнесе и финансах. Открытые системы, № 4, 1997, с. 41-44

Тема 2.9. Модели TextMining и WebMining.

Понятие о Text Mining. Особенности данных для Text Mining

Задачи Text Mining. Суммаризация (реферирование). Составление выдержек. Формирование краткого изложения. Классификация. Кластеризация. Семантические карты. Ответ на запросы, поиск по ключевым словам. Хранилище слов.

Аналитическая обработка текстовой информации. Применение нейронных сетей при анализе текстовой информации

Пример алгоритма Text mining

Модули текстового анализа в системе PolyAnalyst. Text Analysis (ТА) - текстовый анализ. Text Categorizer (TC) - каталогизатор текстов. Link Terms (LT) - связь понятий.

Направления применения Web Mining и Web Usage Mining.

Задачи применения Data Mining в Web Сети.

Спецификация доступных ресурсов. Увеличение ценности каждого посетителя. Учет интересов посетителя вебсайта. Дифференцированное управление своими ресурсами. Сбор информации новыми способами. Проверка качества содержания и архитектуры вебсайта.

Области применения Web Analyst (WA). E-участник. Сайты по рекламированию. Интеграторы Сети. Поиск в сети с помощью Data Mining. (Задача структуризация Сети. Вертикальный Поиск. Мобильный Поиск. Мультимедийный Поиск.)

Архитектура Web-Analyst. Компоненты Web-Analyst On-Line. Автономные Компоненты Web-Analyst. Перспективы применения WA.

Направление Web Content Mining.

Продукты Ontos Series. Light Ontos – управление информацией и поиском документов.

LightOntos Personal Edition. LightOntos Business Edition. LightOntos for Workgroups.

Сферы применения LightOntos.

База знаний в Web Mining. Понятие онтологии. Онтологии в Web Mining.

Практическая реализация задач Web Mining.

Сбор данных для анализа. Определение предметной области. Аналитическая обработка документов. Структурирование знаний, обеспечение их хранения, обновления и представления. Формирование базы знаний. Представление знаний. Организация приближенного поиска и передача знаний заинтересованным лицам. Поиск по объекту во внешнем источнике информации. Поиск по ситуации во внешнем источнике информации.

Поиск с применением технологии триплетов. Передача знаний.

^ Основная литература

Перминов Г.И. УМК - «Системы интеллектуального анализа данных» (Business Intelligence). Тема 16 - 17. ГУ-ВШЭ, 2007.

Дополнительная литература

«Технологии извлечения знаний из текста» Н.Ильин, С. Киселев, В. Рябышкин, С. Танков http://www.osp.ru/text/302/2700556/ p2.html

«Добыча знаний» Дмитрий Ландэ http://www.visti.net/~dwl/art/dz/

«Системы автоматического реферирования» У. Хан, И. Мани

http://www.osp.ru/text/302/178370/ p3.html

«Обработка текстов на естественном языке» Константин Селезнев

http://www.osp.ru/text/302/l 83694/

. http://megaputer.ru

"Text Mining and the Knowledge Management Space" Semio Corporation

http://www.dmreview.com/whitepaper/paper_sub.cfm?whitepaperld=10080

http://www.megaputer.com/products/wa/testprogram.php3

http://www. cs.uic.edu/~liub. WWW-2005. Web Component Mining

http://ontos.com

Cai, D, Yu, S., Wen, J-R and Ma, W-Y. "Extracting Content Structure for Web Pages based on Visual Representation", Fifth Asia Pacific Web Conference (APWeb-03), 2003.

Gupta, S., Kaiser, G., Neistadt, D. and Grimm, P. DOM based Content Extraction of HTML Documents, WWW-03, 2003.

^ IV. Литература:

Основная литература

Ахим Бююль, Петер Цефель. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Торгово издательский дом Dia Soft Москва, Санкт-Петербург, Киев 2002.

Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере. М., Наука, 1997.

Кравченко Т.К., Перминов Г.И. Информационные технологии принятия экономических решений. – М.: ГУ-ВШЭ. Тасис, 2006.

Дюк В., Самойленко А. Data Mining. Учебный курс. - С-Пб.: Питер, 2001., гл.1.

Андрейчиков А.В., Андрейчикова О.Н. Интеллектуальные информационные системы. – М.: ФиС, 2004, гл.6.

Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. Пер. с польского. – М.: Горячая линия-Телеком, 2006, гл.5.

Толчеев В.О. Разработка и исследование новых модификаций метода ближайшего соседа. – М.: Информационные технологии, №3, 2005.

Барсегян А.А. и др. Методы и модели анализа данных: OLAP и Data Mining. – С.Пб.: БХВ-Петербург, 2004, гл.4.

Дополнительная литература

Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. – СПб.: Питер, 2005. – 192 с.: ил.

SPSS для Windows. Руководство пользователя. Кн.1-6. М.: Статистические Системы и Сервис. 1996.

SPSS statistical algorithms. 2nd ed. Chicago. SPSS Inc. 1991.

SPSS Base 9.0 Руководство по применению

SPSS Base 9.0 Руководство пользователя

Turban E., Aronson J.E. Decision support systems and intelligent systems. - N.Y.: Prentice Hall International. 2001.

www.Megaputers.ru.

Галушкин А.И. Теория нейронных сетей. Кн. 1/Под ред. А.И.Галушкина - М.: ИПРРЖР, 2000.

Нейронные сети. STATISTICA Neural Networks. M.: Телеком. 2001. 182 с.

Некрасов И.В., Толчеев В.О. Модифицированный метод ближайшего соседа с использованием опорных точек для классификации текстовых документов// Вестник МЭИ. 2004. № 1. 76-81 с.

www.BaseGroup.ru.

  1. Тематика заданий по различным формам текущего контроля

Тематика домашних работ

    1. Построение модели для оценка кредитоспособности предприятия

    2. Выбор коммерческого банка

    3. Оценка конкурентоспособности продукции

    4. Выбор поставщика продукции

    5. Анализ макроэкономических показателей

    6. Прогноз экономических показателей

    7. Построение портрета покупателя на основе анализа опросных листов




  1. Контрольные вопросы

По разделу «Статистический анализ данных в среде SPSS»:

  1. Основные методы статистического анализа данных.

  2. Шкалы измерений.

  3. Особенности подготовки данных для статистического анализа в системе SPSS.

  4. Описательная статистика для номинальных и порядковых шкал в системе SPSS.

  5. Частотные таблицы: валидный и кумулятивный процент. Реализация в системе SPSS.

  6. Таблицы сопряженности в системе SPSS.

  7. Описательная статистика для количественных переменных. Реализация в системе SPSS.

  8. Корреляционный анализ. Частные и парные корреляции.

  9. Простая и множественная линейная регрессия. Реализация в системе SPSS.

  10. Бинарная и мультиномиальная логистические регрессии. Реализация в системе SPSS.

  11. Дискриминантный анализ. Реализация в системе SPSS.

  12. Кластерный анализ: основные принципы и методы. Реализация в системе SPSS.

  13. Иерархический кластерный анализ. Реализация в системе SPSS.

  14. Факторный анализ и анализ главных компонент. Реализация в системе SPSS.

  15. Деревья решений: метод CHAID. Реализация в системе SPSS.




Скачать 477,74 Kb.
оставить комментарий
страница2/3
Т.К. Богданова
Дата29.09.2011
Размер477,74 Kb.
ТипПрограмма дисциплины, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы: 1   2   3
Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

Загрузка...
База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

наверх