скачать 3. Возможности Интернета для поиска профессиональной информации Разделы: 3.1. Поисковые возможности Интернет 1 3.2. Формулировка запроса для поиска информации в Интернете 8 3.3. Организация поиска информации в Интернете 13 3.4. Электронные коллекции и электронные библиотеки 28 Выводы 65 Вопросы для самопроверки: 66 Литература: 67 3.1. Поисковые возможности ИнтернетПо мере развития Интернета обостряется парадокс — вероятность существования нужной информации возрастает, а возможность ее нахождения уменьшается. В принципе гипертекстовая природа WWW обеспечивает нахождение любой информации в процессе целенаправленного продвижения по ссылкам. Однако согласно оценкам, в Интернете на начало 1997 г. существовало более 60 млн. документов (период удвоения числа документов в Интернете – не более 3 – 8 месяцев), и найти нужное в этом пространстве, продвигаясь просто от ссылки к ссылке, практически невозможно. ^ (поиск по входящим в узлы словам, являющимся серьезным расширением алфавитного каталога) не всегда удобны. Во многих случаях трудно или невозможно сформулировать ключевые слова, но если тематика точно известна, наиболее подходящим инструментом поиска оказываются каталоги (предметные указатели). Разные поисковые системы отличаются друг от друга деталями, но не общими принципами (описание систем см. Рис. 1). Рис. 1. Описание конкретных систем
Наиболее распространены два вида поисковых ресурсов: ^ . В последние годы появляются новые механизмы — порталы, объединяющие большое количество ресурсов одной проблематики Каталоги составляются людьми – редакторами, просматривающими каждый новый сайт до его включения в индекс, или самими составителями описаний. Каталоги обычно организованы в соответствии с предметной классификацией и содержат сведения о web-страницах (так называемый «видимый» Интернет) (фрагмент сводной таблицы предметных интернет-каталогов см. Error: Reference source not found)1. ^
Качество каталогов выше, чем у поисковых машин, но люди не могут успеть за темпами расширения и изменения Интернета: индекс популярного каталога Yahoo! содержит лишь немногим более миллиона записей. «Yahoo!» исходит из того, что просмотр узлов, аннотирование их содержимого и размещение его в соответствующих разделах иерархической классификационной структуры реально осуществляется людьми. Кроме того, часто в каталогах накапливаются устаревшие адреса - если, конечно, авторы не удосужились автоматизировать процесс проверки. В большинстве поисковых механизмов используются автоматизированные агенты, называемые пауками (spiders). Они предназначены для отслеживания любой гиперссылки и используют средства, которые автоматически индексируют отдельное слово на странице. Паук (spider) или ползун (crawler), постоянно обходит Сеть в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами. Важными показателями качества поисковой машины являются:
Обычно в поисковых машинах есть и дополнительные возможности (расширенный поиск, поиск похожих документов, ограничение области поиска), удобный пользовательский интерфейс и справочная система Мощная поисковая машина обходит всю сеть за несколько дней. При этом составляется весьма свежий и довольно подробный индекс - опись доступных ресурсов. При каждом новом цикле обхода индекс обновляется, и старые недействительные адреса удаляются. Однако автоматизированный подход приводит к тому, что в индекс могут попасть дубликаты (один и тот же документ на разных сайтах, в разных кодировках). Возможности некоторых российских поисковых машин представлены ниже (Error: Reference source not found) [Error: Reference source not found]. ^
Каталожные и поисковые службы непрерывно совершенствуются в условиях жесточайшей конкуренции. Они снабжены справочными материалами по использованию; описывать их здесь более детально нецелесообразно. Сервисы, составляющие портал, могут нести различную тематическую нагрузку. Портал, предоставляющий информацию и сервисы только по одной узкой теме, называется вертикальным, а портал, состоящий из разнотематических сервисов, — горизонтальным [Error: Reference source not found]. Следует отметить, что, портал это НЕ выход наружу, а вход внутрь. Главная задача любого портала — задержать пользователя как можно дольше, чтобы он провел там десятки минут и даже часы. К отличительным особенностям хорошего образовательного портала можно отнести:
Кроме порталов большое распространение в сети получают тематические обзоры. Периодическое использование каталогов и поисковых механизмов очень полезно как для разового информационного поиска, так и для постоянного слежения за новой информацией. Порталы более пригодны для профессиональной, деловой (или другой) коммуникации. По мнению специалистов в области автоматизации библиотек (Б. Маршак) «различие информационно-поисковых языков ИПС Интернета от их «библиотечных собратьев», в основном, в отсутствии у первых полноценной лингвистической базы. Функции классификационных и вербальных языков, которые обеспечивают широкотематический и узкотематический поиск в системах автоматизации библиотек, в ИПС Интернета выполняют операторы поиска по отдельным полям HTML-кода документа и инструмент сужения области поиска по региональной принадлежности искомого ресурса. В структуре поисковиков Интернета, помимо существующих каталогов и БД, отсутствуют универсальные БД классификационных систем, тезаурусы, предметные рубрики, все то, без чего не может обойтись ни одна система автоматизации библиотек» [Error: Reference source not found].
|