Войти



Последние материалы

Золотые партнеры:

ламинированные окна пвх

Серебряные партнеры:

Наша цель - ваша безопасность: охрана. Охранные предприятия.

Бронзовые партнеры:

Тезаурусы типа Word Net в информационном поиске
Статьи
Автор: Лукашевич Н.В.   
02.11.2011 16:20

Тезаурусы типа Word Net в информационном поиске

Сразу после появления тезауруса WordNet в сети Интернет многие исследователи начали эксперименты по его применению в приложениях информационного поиска, полагая, что появился качественный ресурс, позволяющий резко улучшить качество поиска. Эти надежды были связаны с тем, что WordNet давал возможность использовать важные для задач информационного поиска сведения, такие как сведения о синонимах, значениях слов, лексических отношениях большого количества слов английского языка.

Одной из первых таких работ была работа (Voorhees, 1994). Однако в экспериментах на конференции TREC-5 было показано снижение показателей информационного поиска при использовании WordNet. Автор утверждает, что, с одной стороны, лингвистические технологии должны быть близки к совершенству, чтобы привести к улучшению качества информационного поиска, с другой стороны, что статистические методы частично аппроксимируют лингвистические технологии своими статистическими корреляциями. Похожее утверждение было высказано М. Сандерсоном (Sanderson, 1994), который предположил, что подходы, базирующиеся на ворднетах, будут хорошо работать, когда точность разрешения лексической многозначности приблизится к 90%. Поэтому необходимость использования тезаурусов типа WordNet для информационного поиска и классификации документов в настоящее время не является общепризнанной. Однако в последнее время появились работы, в которых учет WordNet при обработке запроса приводит к значимым улучшениям поиска по сравнению с базовой моделью.

В данном разделе мы рассмотрим наиболее известные работы, в рамках которых предлагались различные подходы по интеграции тезауруса WordNet в существующие модели информационного поиска.