Вопросы ло являются, пожалуй, наиболее проблемными и трудоемкими аспектами работы с эк icon

Вопросы ло являются, пожалуй, наиболее проблемными и трудоемкими аспектами работы с эк


Смотрите также:
Пояснительная записка Одной из форм контроля самостоятельной работы студентов-заочников в...
Стадии эволюции и проблема классификации исторических типов общества...
Доклад на семинаре по проекту...
Программа Организации Объединенных Наций по окружающей среде Рабочая группа открытого состава...
План работы Введение. Понятие гражданского правоотношения и его особенности...
План работы Введение. Понятие гражданского правоотношения и его особенности...
Актуальность темы исследования...
Кафедра отечественной истории...
Семь наиболее известных шедевров древних культур названы чудесами света...
Интерактивное родительское собрание подготовила и провела...
Поиски пути. 1925. (Шредингер Э.) Источник: Вопросы философии...
Книга рассчитана на широкие круги Спецяист различных непраерений науки и техники...



Подковырина Е. Н., зав. отделом НБ УИПА


Лингвистическое обеспечение ЭК.

К проблемам коммуникабельности информационных ресурсов электронного каталога.


Презентация


Библиотеки - гардеробы, из которых умелые люди могут извлекать кое-что для украшения, многое - для любопытства и еще больше для употребления.

Дж. Дайер


Лингвистические средства по праву относятся к числу важнейших, системообразующих элементов любой информационно-библиотечной системы. Их качество определяет конечный результат работы системы в целом. Лингвистическое обеспечение (ЛО) предназначено

  • для индексирования документов и запросов;

  • проведения эффективного поиска в ЭК по тематическим запросам;

  • осуществления лингвистической совместимости ЭК различных библиотек с целью обмена данными.

Вопросы ЛО являются, пожалуй, наиболее проблемными и трудоемкими аспектами работы с ЭК.

Стремительное внедрение новых информационных технологий в практику работы библиотек в последние десятилетия не могло не повлиять на развитие ЛО, породив целый комплекс проблем, требующих своего решения. При этом наблюдается явное отставание теории лингвистического обеспечения от реальной практики развития информационно-библиотечных систем. Например, повсеместное распространение электронных каталогов не сопровождается научно-обоснованными рекомендациями по выбору соответствующих средств лингвистического обеспечения; развитие международных и отечественных корпоративных сетей требует ведения каталогизации литературы в едином формате с использованием общих словарных средств и правил описания документов, т. е. решения проблемы соотношения общесистемных и локальных лингвистических средств, а также проблемы их совместимости. Рост уровня информационного сервиса, повышение степени интеллектуальности и аналитичности предоставляемых библиотеками информационных продуктов и услуг невозможны без повышения качества индексирования и роста уровня раскрытия содержания документов.

В литературе по информатике накопилось много различных подходов к понятию ЛО и, соответственно, различных определений этого понятия (или близких понятий “информационно-поисковые языки”, “языковые средства АИС” и др.).

Наиболее известным  является классический подход,  при котором лингвистическим обеспечением называют комплекс информационно-поисковых языков (ИПЯ), прежде всего,  классификационных и вербальных (дескрипторных). В числе последних и языки библиографических данных, включающие правила библиографического описания и форматы библиографической записи.

Так как электронный каталог — это интеллектуальный продукт работы каталогизатора и объект многочисленных раздумий о совершенствовании качества создаваемых информационных ресурсов, то в рамках ЛО в настоящее время проводится работа по следующим направлениям:


  1. Разработка форматов библиографических записей (БЗ).


Полнота и эффективность поиска находятся в прямой зависимости от правильности выбора формы, содержания и структуры представления библиографической информации и, прежде всего, библиографической записи. В практике работы отдела принята тенденция к полноте научного описания всех видов изданий и максимальному отражению всех элементов библиографического описания (БО). При этом приходится учитывать особенности издательского оформления в нашей стране. Сейчас у нас существует большое

количество издательств, в том числе частных, часто не соблюдающих стандарт по оформлению издательской продукции.

Традиционно формированию заголовка уделяется большое внимание, эта работа всегда в центре внимания каталогизатора. С одной стороны, мы стремимся к расширению поисковых возможностей, с другой – считаем, что оно не может быть безграничным. В частности, необходимо решить вопрос о количестве авторов, фамилии которых отражаются в блоке Интеллектуальной ответственности. По правилам БО отражаются три автора. Мы допускаем расширение количества указываемых авторов, однако склоняемся к разумному ограничению. Исключение составляют авторы-сотрудники академии (указываются все). Кроме этого, ввод фамилий авторов-сотрудников академии осуществляется через АФ Индивидуальный автор, который является словарем информационно-поискового языка, с помощью которого осуществляется авторитетный контроль при ведении БЗ.

Отказались в работе от практики применения сокращений слов и словосочетаний при формировании таких полей/подполей элементов БЗ, которые являются поисковыми в ЭК, например, таких, как заглавие и серия/подсерия отражаемого документа, чтобы не сужать поисковые возможности ЭК.

Новые возможности поиска заставили обратить серьезное внимание на использование дополнительных, ранее не востребованных данных при составлении библиографического описания документов. Любая, даже самая современная библиотечная система способна выдать ту информацию, которая в нее заложена, и чем полнее и грамотнее введена эта информация, тем более плодотворным будет поиск пользователя. В связи с этим и было принято решение - раскрывать содержание документов.

Одной из актуальных задач в настоящее время для нас является определение целей использования классификационных индексов и создание формата для их представления. Универсальная десятичная классификация (УДК) и Библиотечно-библиографическая классификация (ББК) являются гибкими системами, обладающими богатым набором средств отражения и синтеза информации, что позволяет наиболее полно отображать содержание документа и легко создавать индексы для новых и измененных понятий. Правила построения индексов УДК и ББК строго не регламентированы, что приводит к большой свободе интерпретации. Индексы в классификационных таблицах  ББК или УДК представляют собой сложные лексические единицы, построенные по правилам образования индексов соответствующей классификации. Например:

в таблицах ББК для областных библиотек:

^ 2 – Естественные науки,

22 – Физико-математические науки,

22.1 – Математика,

22.14 – Алгебра и т. д.


Кроме этого, правила соединения в классификационных индексах ББК и УДК основного индекса и типового деления или определителя при описании конкретной книги можно считать средством формирования «фразы» на данном ИПЯ.

В настоящее время в работе отдела широко используются отраслевые рабочие таблицы классификации по УДК «Образование. Воспитание. Обучение. Досуг», разработанные отделом научной обработки и каталогизации документов Государственной научно-педагогической библиотеки Украины им. В. А. Сухомлинского. Практика показала, что трудности в работе возникли из-за отсутствия поискового аппарата к Таблицам. Поэтому мы вынуждены были начать работу по созданию АПУ, которую планируем закончить в этом году.


^ 2. Создание методики предметизации с учетом проведения поиска в автоматизированном режиме.


При создании предметных рубрик (ПР) чрезвычайно важно, чтобы соблюдалось единство подходов к формулировкам, а язык ПР был предельно формализован и типизирован. Для достижения единообразия и исключения субъективизма при формулировке ПР мы взяли за эталон терминологию алфавитно-предметных указателей к таблицам УДК и ББК, что, в свою очередь, позволяет сохранить единство с АПУ к систематическому каталогу. Опыт работы по предметизации, позволил уяснить несколько основных правил формулировки ПР.

Главное из них - ПР представляет собой выражение самого предмета. Она создается настолько конкретной, насколько конкретен предмет (тема), который она раскрывает. Иными словами, она не должна быть ни уже, ни шире содержания документа.

При необходимости детализации предмета через запятую вносим сведения, уточняющие аспект его рассмотрения. Например:

    • башенные краны, монтаж;

    • автомобили, эксплуатация;

    • детская одежда, моделирование.


Подрубрики уточняют тип документа, например: справочники, учебные пособия, альбомы, авторефераты диссертаций и т. д. В обязательном порядке эти сведения указываются во множественном числе. По возможности такой порядок формулировки следует соблюдать и при создании самих рубрик.

Если есть возможность, в формулировке предметной рубрики не нужно повторять заглавие документа. Например: книге с заглавием «Промышленная психология» присвоена рубрика «инженерная психология»; книге с названием «Риторика» - рубрика «ораторское искусство».

Предметные рубрики и подрубрики представлены, как правило, на двух языках: украинском и русском. Исключения составляют

  • термины в области информационных технологий (языки программирования, компьютерные программы) представлены на языке оригинала, а уточнения – на украинском и русском языках. Например:

- Delfi, мова программування;

- Windows XP, настройка.


  1. Определение принципов поиска в ЭК.


Библиотечная практика показывает, что пользователь чаще заинтересован в использовании информационных языков вербального типа, чем информационных языков классификационного типа. Классификационные языки обеспечивают в основном поиск по запросам отраслевого характера и обладают большей универсальностью и формализованностью, а вербальные языки – по запросам предметного характера, и именно предметные запросы чаще всего делаются пользователями. В качестве языков индексирования вербального типа могут выступать языки предметных рубрик и ключевых слов.

При этом язык предметных рубрик является менее эффективным средством тематического поиска ввиду отсутствия единой системы предметизации и универсального словаря предметных рубрик.

Среди вербальных языков наблюдается тенденция к предпочтительному использованию в качестве языка индексирования языка ключевых терминов, в наибольшей степени отвечающего потребностям пользователя в актуальной терминологии при узкотематических запросах. В системе ИРБИС словарь автоматически формируется из фамилий авторов, коллективных авторов, из основного заглавия, заглавий части/выпуска, серии, содержания документов.

Практика показывает, что при поиске с помощью ключевых терминов удается найти большее число релевантных документов, чем при поиске с помощью предметных рубрик.

Возможно применение контролируемого (на основе словаря) или свободного (неконтролируемого словарем) индексирования. В любом случае предпочтительно иметь тезаурус и использовать его для обогащения поисковых предписаний. Преимущества тезауруса по сравнению со списком ключевых слов/терминов очевидны. В списках ключевых слов/терминов не отражены смысловые связи между терминами, при этом алфавитный порядок расположения терминов усугубляет эту разобщенность: родственные понятия удалены друг от друга. Использование тезауруса в информационно-поисковых системах повышает качество анализа текста и полноту поиска информации, позволяя расширить запрос синонимическими, более общими или более частными понятиями.

Подводя итоги вышесказанному, хотелось бы еще раз обратить внимание на то, что качество системы автоматизации библиотек во многом определяются тем, какие лингвистические средства в ней используются. Качественной системой можно считать такую систему, которая использует все разнообразие лингвистических средств: словарное обеспечение, встроенные тезаурусы, авторитетные файлы, алфавитно-предметные указатели к системам классификации, классификационные системы в виде специализированных баз данных и другие. Каждый ИПЯ имеет свои достоинства и недостатки, поэтому проблему повышения эффективности поиска целесообразно решать путем использования достоинств каждого из языков индексирования. А значит, мы вновь возвращаемся к принципу интегральности информационной среды и необходимости применения при поиске нескольких ИПЯ. Очевидно, что возможности различных типов ИПЯ дополняют друг друга и будут необходимы в разных поисковых ситуациях.


Литература:


1. Антопольский А. Б. Лингвистическое обеспечение электронных библиотек [Текст] / А. Б. Антопольский. – М.: ФГУП Научно-технический центр «Информрегистр», 2003. – 302 с.

2. Генералова Е. А. Критерии качества лингвистического обеспечения электронного каталога вузовской библиотеки [Электронный ресурс] / Е. А. Генералова. – Режим доступа: http://lib.omgtu.ru/Data/Pages/349/generalova.doc

3. Зайцева Е. М. Лингвистическое обеспечение автоматизированных библиотечно-информационных систем: современные требования и направления развития [Текст] / Е. М. Зайцева // Науч. и техн. б-ки. – 2000. – № 3. – С. 54 -57

4. Скарук Г. А. Языки тематического поиска в электронном каталоге и индиивидуальное поисковое взаимодействие [Текст] / Г. А. Скарук // Библиосфера. – 2005. – № 2. – С. 45-49

5. Сукиасян Э. Р. Требования к информационно-поисковым языкам [Текст] / Э. Р. Сукиасян // Библиотека . - 2004. - № 4 . - С.73-75.




Скачать 89.73 Kb.
оставить комментарий
Дата17.10.2011
Размер89.73 Kb.
ТипПрезентация, Образовательные материалы
Добавить документ в свой блог или на сайт

Ваша оценка этого документа будет первой.
Ваша оценка:
Разместите кнопку на своём сайте или блоге:
rudocs.exdat.com

База данных защищена авторским правом ©exdat 2000-2017
При копировании материала укажите ссылку
обратиться к администрации
Анализ
Справочники
Сценарии
Рефераты
Курсовые работы
Авторефераты
Программы
Методички
Документы
Понятия

опубликовать
Документы

Рейтинг@Mail.ru
наверх