Войти



Последние материалы

Золотые партнеры:

разработка сайта, большое портфолио.

Серебряные партнеры:

шкаф купе Москва . Детские кровати. Интернет-магазин - детская кровать. Детская мебель в морском стиле.

Бронзовые партнеры:

Информационно-поисковые тезаурусы
Статьи
Автор: Лукашевич Н.В.   
10.09.2011 16:30

Информационно-поисковые тезаурусы. Хронология.

Информационно-поисковые тезаурусы появились в 60-е годы 20 века. В это время большинство информационно-поисковых систем считались не полнотекстовыми, и сохраняли очень ограниченный набор данных о доку­менте: реферат, библиографические данные. Создание списка ключевых слов, которые характеризовали основное содержание документа, существенно рас­ширяло возможности поиска документов. В 70-х годах разрабатываются международные и на­циональные стандарты создания информационно-поисковых тезаурусов.

В соответствии с определениями стандартов, информационно-поисковый тезаурус - это нормативный словарь, явно указывающий отношения между терминами и предназначенный для описания содержания документов и поис­ковых запросов.

Основными целями разработки информационно-поисковых тезаурусов являются следующие:

-   обеспечение перевода документов и запросов пользователей на один
и тот же словарь, используемый для индексирования и поиска; таким
образом, различия в лексическом составе документа и запроса поль­зователя сводятся к одним и тем же единицам тезауруса;

-   обеспечение последовательного использования единиц индексирования;

-   обеспечение отношений между терминами - отношения между еди­ницами тезауруса позволяют найти оптимальный термин для описа­ния документа или запроса;

- использование как поискового средства при поиске документов.
Информационно-поисковые тезаурусы создавались как инструмент для ручного описания документов специалистами-индексаторами. Поисковый запрос также предполагалось формулировать на основе единиц тезауруса.

 

Появление полнотекстовых поисковиков, а также возможностей поиска по всем словам из текста с помощью методов ранжиро­ванного информационного поиска значительно уменьшило зна­чимость разработки и использования таких тезаурусов, поскольку давало возможность поиска текста неподготовленному пользователю в любых предметных областях, без предварительных затрат на создание тезаурусов.

 

Многочисленные разработки по определению эффективности различ­ных методов представления документов при информационном поиске дока­зали, что эффективность пословного индексирования сравнима с эффектив­ностью информационного поиска, который использует ручное индексирование по качественному тезаурусу (Salton, 1986; Sparck Jones, 1981), для создания которого нужно бы­ло еще затратить достаточно много средств и усилий; кроме того, нужно бы­ло еще осуществлять качественное ручное индексирование документов по этому тезаурусу.

Эксперименты по автоматическому индексированию документов и запро­сов на базе информационно-поисковых тезаурусов не привели к практиче­скому использованию созданных информационно-поисковых тезаурусов в процессе автоматической обработки текстов.

В дальнейших статьях мы рассмотрим основные структурные особенности ин­формационно-поисковых тезаурусов, методы их создания и использования, а также обсудим, как эти особенности ограничивают применение информаци­онно-поисковых тезаурусов в процессе автоматической обработки текстов.