| Информационно-поисковые тезаурусы |
| Статьи | |||
| Автор: Лукашевич Н.В. | |||
| 10.09.2011 16:30 | |||
Информационно-поисковые тезаурусы. Хронология.Информационно-поисковые тезаурусы появились в 60-е годы 20 века. В это время большинство информационно-поисковых систем считались не полнотекстовыми, и сохраняли очень ограниченный набор данных о документе: реферат, библиографические данные. Создание списка ключевых слов, которые характеризовали основное содержание документа, существенно расширяло возможности поиска документов. В 70-х годах разрабатываются международные и национальные стандарты создания информационно-поисковых тезаурусов. В соответствии с определениями стандартов, информационно-поисковый тезаурус - это нормативный словарь, явно указывающий отношения между терминами и предназначенный для описания содержания документов и поисковых запросов. Основными целями разработки информационно-поисковых тезаурусов являются следующие: - обеспечение перевода документов и запросов пользователей на один - обеспечение последовательного использования единиц индексирования; - обеспечение отношений между терминами - отношения между единицами тезауруса позволяют найти оптимальный термин для описания документа или запроса; - использование как поискового средства при поиске документов.
Появление полнотекстовых поисковиков, а также возможностей поиска по всем словам из текста с помощью методов ранжированного информационного поиска значительно уменьшило значимость разработки и использования таких тезаурусов, поскольку давало возможность поиска текста неподготовленному пользователю в любых предметных областях, без предварительных затрат на создание тезаурусов.
Многочисленные разработки по определению эффективности различных методов представления документов при информационном поиске доказали, что эффективность пословного индексирования сравнима с эффективностью информационного поиска, который использует ручное индексирование по качественному тезаурусу (Salton, 1986; Sparck Jones, 1981), для создания которого нужно было еще затратить достаточно много средств и усилий; кроме того, нужно было еще осуществлять качественное ручное индексирование документов по этому тезаурусу. Эксперименты по автоматическому индексированию документов и запросов на базе информационно-поисковых тезаурусов не привели к практическому использованию созданных информационно-поисковых тезаурусов в процессе автоматической обработки текстов. В дальнейших статьях мы рассмотрим основные структурные особенности информационно-поисковых тезаурусов, методы их создания и использования, а также обсудим, как эти особенности ограничивают применение информационно-поисковых тезаурусов в процессе автоматической обработки текстов.
|