Учебно-методическое пособие Санкт-Петербург 2005 ббк 73: 81. 1 З-38 icon

Учебно-методическое пособие Санкт-Петербург 2005 ббк 73: 81. 1 З-38


Смотрите также:
Учебно-методическое пособие Санкт-Петербург 2005 ббк 81. 1 З-38...
Учебно-методическое пособие Санкт-Петербург 2011 ббк 88. 53 Ю 49...
Учебно-методическое пособие Санкт-Петербург...
Учебно-методическое пособие Минск, 2005 удк616. 33-07-08-053. 3-053. 6+616. 342-07-08-053. 3-053...
Учебно-методическое пособие Ставрополь 2007 ббк 51. 1 (2) удк 614. 1/2 (06)...
Учебно-методическое пособие Чебоксары 2005 ббк 87. 7р30 п 784...
Учебно-методическое пособие таганрог 2005 ббк 67. 01 Составитель...
Учебно-методическое пособие таганрог 2005 ббк 67. 01 Составитель...
Учебное пособие Санкт-Петербург 2005 удк 662. 61. 9: 621. 892: 663. 63 Ббк г214(я7)...
Учебно-методическое пособие Москва Издательство Российского университета дружбы народов 2005...
Учебно-методическое пособие Москва Издательство Российского университета дружбы народов 2005...
Учебно-методическое пособие Казань, 2010 ббк 66. 75 О 18...



страницы: 1   2   3   4
вернуться в начало


^ Лабораторная работа № 3

(Русскоязычные вербальные ИПС: поиск)

Составление и отладка тематического запроса

  1. Составить в тетради запрос по теме «Морские сражения во время Великой отечественной войны». При этом убрать из темы незначащие слова, расширить запрос синонимами, составить логическую формулу запроса с обязательным использованием операторов конъюнкции, дизъюнкции, расстояния и фразы (жесткое словосочетание).

  2. Показать запрос преподавателю.

  3. Затем записать его варианты на языках систем Апорт, Яндекс, Рамблер.

  4. Отладить запрос в режиме реального поиска, проводя последовательно сеансы во всех трех системах. Попытаться варьировать поисковые предписания, чтобы добиться оптимальных показателей поиска. Для этого фиксировать в тетради полученные результаты по каждому варианту: точность (по первым 20 документам) и условную полноту (абсолютный объем выдачи).

  5. Вернуться к наилучшему поисковому предписанию и текст запроса скопировать через буфер обмена из поисковой строки (окно для ввода запроса) в окно файла отчета Report3 (поочередно в каждой системе). Указать при этом в отчете показатели точности и полноты. Первую веб-страницу с результатами поиска в каждой системе сохранить в своей папке в формате «только html».


Знакомство с поиском по полям («Расширенный поиск»)

  1. Найти с помощью системы Яндекс документы, посвященные Льву Гумилеву. Количество найденных документов и сайтов записать в файл отчета. Адрес (URL) первого документа из списка сохранить в Избранном в папке «Гумилев».

  2. Затем перейти в режим расширенного поиска и найти документы, посвященные Льву Гумилеву, с датой после 1 октября 2004 г. Новое количество найденных документов и сайтов снова записать в файл отчета. Первый документ из списка результатов поиска сохранить в своей папке в формате «веб-архив, один файл» (*.mht).

  3. Найти через систему Рамблер документы по теме «Экономика города Москвы». При этом объём выдачи (количество описаний документов на странице результатов) установить равным 30. Результаты поиска отсортировать по дате (по убыванию) и первую веб-страницу с результатами поиска сохранить в своей папке в формате «только html». Количество найденных документов и сайтов зафиксировать в файле отчета.

  4. Перейти в режим расширенного поиска и найти документы по той же теме, но находящиеся лишь на сайте www.rbc.ru. Результаты поиска отсортировать по дате (по возрастанию) и первую веб-страницу с результатами поиска сохранить в своей папке в формате «только html». Количество найденных документов и сайтов зафиксировать в файле отчета.

  5. Найти через систему Яндекс документы по теме «Образование», из которых есть ссылка на сайт www.rsuh.ru. Первую веб-страницу с результатами поиска сохранить в своей папке в формате «только html». Количество найденных документов и сайтов зафиксировать в файле отчета.

  6. Загрузить один из найденных документов, просмотреть его html-код, найти в нем ссылку на сайт www.rsuh.ru и элемент гиперссылки (от начального до конечного тега А) через буфер обмена скопировать в файл отчета.

  7. Документ в формате mht, сохраненный в п. 7 (о Льве Гумилеве), прочитать в редакторе Word: вначале в формате веб-страницы, затем в формате «только текст». При втором чтении просмотреть содержимое окна ввода редактора Word (особенно начало и конец файла), скопировать первую страницу окна ввода в файл отчета и быть готовым объяснить, что такое формат mht.

Примечание. Формат mht кодируется в соответствии со стандартом MIME (RFC2046 и RFC2047) .

  1. Предъявить работу преподавателю.


^ Лабораторная работа № 4

(Глобальные вербальные ИПС: сравнительный анализ)

  1. Работа заключается в сравнительном изучении заданных глобальных ИПС сети Интернет вербального типа.

Примечание. Набор систем и их количество может меняться по усмотрению преподавателя.

  1. Перейти на сайт соответствующей поисковой системы (здесь и далее — доменное имя системы: www.название_системы.com). Найти в каждой системе ссылки на ее описание в целом, на описание языка запросов, интерфейсов, режимов работы и других особенностей системы. Описание каждой ИПС кратко законспектировать в тетради.

  2. Проанализировать и сравнить возможности систем в режиме расширенного поиска. Страницы интерфейса расширенного поиска сохранить в своей папке.

  3. Результаты анализа в сжатом виде представить в форме сводной таблицы (с. 38) в файле отчета Report4 (ориентация таблицы — альбомная). Размеры таблицы можно увеличить. Если что-то не помещается в таблице, в ячейке делать сноску на текст под таблицей (таблица не столько форма представления результатов, сколько схема анализа).

  4. Предъявить работу преподавателю.

^ Результаты сравнительного изучения глобальных вербальных ИПС


п/п

Параметры

Wise-nut

Goo-gle

AlltheWeb

Teoma

1

^ Логические операторы (какие и как задаются)













2

^ Синтагматические операторы
(какие и как задаются)













3

^ Поиск по полям (составить список полей, отмечать их наличие / отсутствие в конкретных системах)
















поле 1
















поле 2
















………
















поле k













4

^ Выбор поисковой базы данных
(в каких ресурсах можно искать)
















ресурс 1
















ресурс 2
















………
















ресурс k













5

^ Формат выдачи содержит следующие элементы (под таблицей привести пример из каждой системы)
















элемент 1
















элемент 2
















………
















элемент k













6

^ Специальные возможности или характерные особенности
(описать для каждой системы)















^ Лабораторная работа № 5

(Глобальные вербальные ИПС: изучение и поиск)

  1. Провести поиск по теме «Компьютерная лингвистика» в заданных глобальных ИПС (набор систем и их количество может меняться по усмотрению преподавателя). Поисковое предписание логически должно выглядеть следующим образом:

(computational V computing V computer) & linguistics.
Запрос задать по-английски дважды, как конъюнкцию и как устойчивое словосочетание (фраза), используя характерные для каждой системы способы выражения операторов (для незнакомых систем найти соответствующую справочную информацию). Первую веб-страницу с результатами каждого поиска сохранить в своей папке в виде «только html». Количественные результаты отразить в таблице:



п/п

Название ИПС

Найдено документов/сайтов

Комментарий
(если
требуется)







Запрос как конъюнкция

Запрос как устойчивое словосочетание




1

AlltheWeb (Fast)










2

AltaVista










3

Google










4

MSN Search










5

Teoma










6

WiseNut










7

Yahoo










  1. Проанализировать и попытаться объяснить полученные объемы выдачи в каждой системе.

  2. В трех системах (Яндекс, Рамблер, Google) провести поиск по теме «Компьютерная лингвистика». Поисковое предписание, соответствующее логической формуле «(компьютерная V вычислительная) & лингвистика» (дизъюнкция устойчивых словосочетаний «компьютерная лингвистика» и «вычислительная лингвистика»), задать по-русски, используя характерные для каждой системы способы выражения операторов. Обратить внимание на различия в морфологической нормализации в разных системах. Первую веб-страницу с результатами каждого поиска сохранить в своей папке в виде «только html». Количественные результаты отразить в файле отчета в виде таблицы.

  3. Провести поиск по той же теме, сузив область поиска заданием дополнительных терминов, позволяющих отобрать документы, где наиболее вероятны определения данного термина (учебник, курс лекций, определение, называется и т.п.). Количество найденных документов указать в файле отчета. Туда же через буфер обмена скопировать поисковые предписания по каждой системе.

  4. Просмотреть в каждой системе найденные документы, найти в них по одному определению термина «компьютерная лингвистика» и записать их в файл отчета с указанием адреса (URL) соответствующего документа.

  5. Предъявить работу преподавателю.

^ Лабораторная работа № 6

(Глобальные вербальные ИПС: изучение и поиск)

  1. С помощью систем Yahoo, AltaVista, Google найти материалы по психологическим (psychological) аспектам взаимодействия человека и компьютера (human computer interaction), опубликованные на английском языке в 1998 году. При составлении поискового предписания обязательно использовать аббревиатуру HCI (human computer interaction). По каждой системе первую веб-страницу с результатами поиска и один из документов сохранить в своей папке в формате «только html». Количество найденных документов и текст поискового предписания в каждой системе сохранить в таблице в файле Report6.doc в своей папке. Цель — правильное составление запроса и знакомство с системами. Текст поискового предписания записать также в рабочей тетради.

  2. Найти в системе AltaVista фотографии с изображениями Ниагарского водопада (Niagara falls) (поиск в БД изображений — images). Одну из них сохранить как графический файл в своей папке на диске, а ее URL — в своей папке в Избранном.

  3. Провести поиск на английском языке в системе Vivisimo по теме «Русская литература». Первую веб-страницу с результатами поиска скопировать в файл отчета.

  4. С помощью системы AlltheWeb (Fast) выявить материалы на русском языке по автоматическому синтаксическому анализу. Цель — правильное составление поискового предписания. Наилучший вариант поискового предписания через буфер обмена скопировать в файл отчета. Первую веб-страницу с результатами поиска сохранить в своей папке в формате «только html».

  5. Используя системы Teoma и WiseNut, найти веб-страницы на английском языке, посвященные изучению аномальных/ паранормальных явлений в России. Для перевода запроса на английский язык и подбора синонимов воспользоваться онлайновыми словарями (www.multitran.ru, Lingvo на сайте Яндекса и др.). Отметить особенности языка запросов в каждой системе. Веб-страницу с результатами поиска по каждой системе сохранить на диске в своей папке в формате «только html».

  6. Предъявить работу преподавателю.

^ Лабораторная работа № 7

(ИПС AltaVista и Google)

  1. Ознакомиться с системой AltaVista (Базы данных, Расширенный поиск, Уточнение формулы запроса (More Precision), Настройки, Семейный фильтр). Установить режимы: База данных: Web — Область поиска: Worldwide — Языки: Russian, English. Установить объем выдачи 30 документов. Провести поиск по запросу на русском языке «Карл Маркс. Манифест Коммунистической партии». Первую веб-страницу с результатами поиска сохранить в своей папке в формате «веб-архив, один файл».

  2. Один из документов выдачи (текст манифеста) перевести на английский язык средствами самой системы. Текст перевода на английский язык сохранить.

  3. Провести поиск на английском языке по тому же запросу в базе данных каталога (Directory) и со страницы с результатами поиска для первых трех документов скопировать в файл отчета раздел(ы) каталога системы AltaVista, к которым отнесены эти документы (например, Category: Work & Money/Business/Economics/Writers/Marx, Karl).

  4. Ознакомиться с системой Google (Расширенный поиск, Настройки, Языковые инструменты). Установить язык интерфейса — английский (Настройки). Установить объем выдачи 20 документов. Ограничить множество выдаваемых документов немецким языком (Расширенный поиск). Провести поиск по запросу Leningrad. Cкопировать в файл отчета раздел(ы) каталога Google, к которым будут отнесены первые три документа. Сохранить в своей папке в формате «только html» первую веб-страницу с результатами поиска и один из документов выдачи на немецком языке.

  5. Снова войти в Настройки. Установить язык поиска (язык выдаваемых документов) — любой. Объем выдачи 10 документов. Язык интерфейса — русский. Провести поиск в ИПС Google по базе данных Groups (Группы) в режиме «Расширенный групповой поиск». Найти все новостные научные группы сети Relcom (relcom.sci.*). Список найденных групп сохранить в файле отчета. В найденном списке выбрать группу relcom.sci.philosophy, просмотреть ее содержимое и описать в файле отчета, в каком виде выдается информация (с примерами, скопированными с экрана).

  6. Провести поиск в ИПС Google по базе данных Groups (Группы) в телеконференции relcom.sci.libraries по запросу «Internet in Libraries»: сначала по полю темы (Subject), затем по всему сообщению, представив запрос как конъюнкцию, затем по всему сообщению, представив запрос как устойчивое словосочетание (phrase).

  7. Далее провести поиск в Google по запросу «Internet in Libraries» в базе данных Web (Веб): сначала по полю заголовка страницы, затем по всему документу (где угодно на странице), представив запрос как конъюнкцию и как устойчивое словосочетание (phrase).

  8. Сравнительные количественные результаты поиска представить в табличном виде в файле отчета:

    ^ Поисковая база

    Область поиска

    Запрос как конъюнкция

    Запрос как «phrase»

    Группы

    Тема










    Всё сообщение







    Веб

    Заголовок страницы










    Весь документ







  9. Предъявить работу преподавателю.

^ Лабораторная работа № 8

(Глобальные вербальные ИПС: ранжирование выдачи)

  1. Используя системы Google, Fast (AlltheWeb), Teoma и WiseNut провести поиск по запросу «Корпусная лингвистика» на английском языке. Логическая формула: (corpus V corpora) & (linguistics V language).

  2. Сохранить первую веб-страницу с результатами поиска (10 документов) в каждой системе в своей папке в формате «только html».

  3. Составить в файле отчета таблицу с количественными результатами поиска.

  4. Проанализировать (попарно) совпадение документов в выдаче по каждой системе (10 документов):




Google

Fast

Teoma

WiseNut

Google

*







Fast

число 1

*





Teoma

число 2

число 4

*



WiseNut

число 3

число 5

число 6

*

где число_i,— количество совпавших документов.

  1. Выписать все совпавшие документы по следующей схеме:

– документы, присутствующие в выдаче (в первой десятке) во всех четырех системах;

– документы, присутствующие в выдаче (в первой десятке) в трех системах;

– документы, присутствующие в выдаче (в первой десятке) в двух системах;
при этом каждый документ идентифицировать следующим образом: sN, где s — идентификатор системы (соответственно g, f, t или w), а N — ранг документа в данной системе. Таким образом, для документа, представленного в выдаче в трех системах, в файле отчета будет создана, скажем, такая запись: g3—f9—w2, что означает, что этот документ был найден в системах Google, Fast, и WiseNut и находится в выдаче этих систем соответственно на 3-м, 9-м и 2-м месте.

6. Проанализировать релевантность первых 10 документов и оценить точность каждой системы. Результаты представить в виде таблицы:

№ п/п

Название системы

Количество релевантных документов

Сумма рангов
релевантных
документов













  1. Предъявить работу преподавателю.

^ Лабораторная работа № 9

(Метапоисковые системы)

  1. Изучить метапоисковые ИПС MetaСrawler (www.metacrawler.com), Profusion (www.profusion.com) и Ixquick Metasearch (www.ixquick. com). Результат — краткий конспект в тетради и поисковый синтаксис (состав и функции операторов) в файле отчета. Перечислить в файле отчета системы, через которые по умолчанию ведется поиск в Profusion. Перечислить виды поиска в Ixquick Metasearch.

  2. Провести сравнительный поиск в Profusion (включив в расширенном поиске системы поиск по всем системам (All)) и Ixquick Metasearch по запросу «corpus linguistics». Первые веб-страницы с результатами поиска сохранить в своей папке в формате «только html». В файле отчета описать (показать), как в данных системах указывается релевантность (score) найденных документов. Попытаться объяснить, как формируется этот показатель.

  3. В системе Profusion перейти по ссылке Search Analysis, проанализировать полученную страницу и сохранить ее в своей папке.

  4. Изучить систему Kartoo (www.kartoo.com). Провести поиск по тому же запросу. Первую веб-страницу с результатами поиска сохранить в своей папке в формате «веб-архив, один файл». Проанализировать результаты поиска и оценить их релевантность. Объяснить смысл и назначение левого фрейма на странице результатов поиска.

  5. Провести сравнительный поиск в MetaСrawler и в Google по теме «Психологические аспекты взаимодействия человека и компьютера». Воспользоваться поисковым предписанием, отлаженным и сохраненным в работе № 6. Проанализировать качество поиска по первым десяти документам. Результаты представить в виде таблицы:

    № п/п

    Название системы

    Количество найденных документов

    Количество релевантных документов

    Сумма рангов релевантных документов

    1

    Google










    2

    MetaСrawler










  6. Ознакомиться с системой HotBot. Обратить внимание на возможность менять входной интерфейс системы (Skin Hotbot: Skins | Style Picker | Total CSS Control), на возможность устанавливать фильтры (Preferences), на возможности расширенного поиска, на метапоисковый характер данной системы. Быть готовым отвечать на вопросы по данной ИПС. Найти описание логических операторов языка запросов и скопировать его в файл отчета.

  7. Ознакомиться с системой Vivisimo. Обратить внимание на способ представления результатов поиска в данной системе (автоматическая кластеризация).

  8. Провести поиск в HotBot и Vivisimo по теме «Морфология». При этом исключить из поиска медицинскую (medicine) и биологическую (biology, anatomy, cell) тематику. В HotBot сделать это установкой отрицательного текстового фильтра для Google (Preferences: Word Filter: None of these words). Веб-страницу с установленным фильтром сохранить в своей папке. Первые веб-страницы с результатами поиска сохранить в своей папке в формате «только html». Количественные результаты поиска представить в виде таблицы в файле отчета.

  9. Предъявить работу преподавателю.

^ Лабораторная работа № 10

(Специализированные порталы и мультипорталы)

  1. Найти на сайте Yahoo (раздел Weather) и скопировать в файл отчета прогноз погоды в Санкт-Петербурге на ближайшие десять дней.

  2. Найти на сайте Рамблера карту Вологодской области. Сохранить ее в графическом формате в своей папке.

  3. Ознакомиться с мультипорталами Яндекс и «Кирилл и Мефодий» (www.km.ru). Перечислить в тетради их основные порталы и сервисы. Быть готовым дать их характеристики.

  4. Найти и сохранить в своей папке стартовые страницы порталов нескольких типов: тематический портал; отраслевой портал; туристический; информационный; бизнес-портал.

  5. Используя возможности порталов различных типов, найти и сохранить в файле отчета следующую информацию:

– курс японской йены на день выполнения работы;
– информацию о температуре воздуха на день выполнения работы на острове Хоккайдо (Япония);
– стоимость тура в Таиланд.

  1. Средствами портала РосБизнесКонсалтинг (www.rbc.ru) разыскать информацию о рейтингах российских банков на текущий момент. Записать в файл отчета названия трех самых крупных и трех самых «филиальных» банков.

  2. Имеется значительное число порталов, обеспечивающих поиск программных средств. Ознакомиться с одним из них: www.freesoft.ru – и найти информацию о текстовом редакторе «Лексикон». Страницу с результатами поиска сохранить в своей папке.

  3. Ознакомиться со службами, позволяющими найти адреса людей, в том числе электронные адреса, по имени:

http://www.yahoo.com/search/people

http://www.records.com/

http://www.bigfoot.com

http://www.infospace.com

http://www.whowhere.com

http://www.iaf.net

  1. Выбрать трех человек (желательно с Запада — к сожалению, поиск по русским «персональным» ресурсам в настоящее время очень ограничен) и попытаться найти их электронные адреса. Результаты поиска сохранить в файле отчета.

  2. Ознакомиться со специализированными порталами, посвященными информационному поиску:

http://www.searchenginewatch.com

http://www. searchengines.ru

Найти названия и адреса 5 метапоисковых систем и сохранить их в файле отчета.

  1. Предъявить работу преподавателю.



Содержание



1. Введение в теорию и практику информационного поиска ..........

3

1.1. Основные понятия информационного поиска ……………



1.2. Информационный поиск в сети Интернет ………………..

8

1.3. Языки запросов ИПС Интернет …………………………...

14

2. Программа учебной дисциплины «Теория информационного поиска» ………………………………………………………………..


16

2.1. Организационно-методический раздел …………………………



2.2. Содержание курса ……………………………………………….

17

2.3. Примерные вопросы для самоконтроля ………………………...

21

2.4. Примерная тематика докладов, рефератов, курсовых работ …...

24

2.5. Примерный перечень вопросов к экзамену (зачету)
по всему курсу ..……………………………………………………...........


25

2.6. Распределение часов курса по темам и видам работы ………….

27

2.7. Форма текущего, промежуточного и итогового контроля ……..

28

2.8. Учебно-методическое обеспечение курса ……………………...



3. Практикум (лабораторные работы) ………………………………

31

Инструкция по выполнению лабораторных работ ……………



Лабораторная работа № 1 ………………………………………

32

Лабораторная работа № 2 ………………………………………

33

Лабораторная работа № 3 ………………………………………

35

Лабораторная работа № 4 ………………………………………

37

Лабораторная работа № 5 ………………………………………

38

Лабораторная работа № 6 ………………………………………

40

Лабораторная работа № 7 ………………………………………

41

Лабораторная работа № 8 ………………………………………

42

Лабораторная работа № 9 ………………………………………

44

Лабораторная работа № 10 ……………………………………

45


Учебное издание


Виктор Павлович Захаров


^ ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ


Учебно-методическое пособие


Зав. редакцией Г.И. Чередниченко

Редактор Н.Г. Михайлова

Технический редактор Л.Н. Иванова

Обложка А.В. Калининой


Подписано в печать с оригинала-макета 28.11.2005.
Ф-т 60х84/16. Усл. печ. л. 2,79. Уч.-изд. л. 1,81.
Тираж 120 экз. Заказ № .

РОПИ С.-Петербургского государственного университета.
199034, С.-Петербург, Университетская наб., 7/9.

Типография Издательства СПбГУ.
199061, С.-Петербург, Средний пр., 41.


1 Ранее большие и малые буквы различались; в ныне работающей версии эта возможность отсутствует.




Скачать 0,62 Mb.
оставить комментарий
страница4/4
В.П. Захаров
Дата29.09.2011
Размер0,62 Mb.
ТипУчебно-методическое пособие, Образовательные материалы
Добавить документ в свой блог или на сайт

страницы: 1   2   3   4
плохо
  1
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

База данных защищена авторским правом ©exdat 2000-2014
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

Рейтинг@Mail.ru
наверх